SQ20 TD 5 - convergences et approximations Convergences et approximations 1 Pour s’entraîner 1 On considère une suite (X n )n∈N de variables aléatoires indépendantes suivant la même loi de Bernoulli de paramètre p. On définit la suite (Yk )k∈N∗ de variables aléatoires par n 1 X ∀ k > 0, Yk = X k−1 + X k . On pose enfin Z n = Yk n k=1 4 Une machine est chargée de conditionner automatiquement des paquets de farine de 1 kg avec un écart type de 10 grammes. On modélise la masse d’un paquet, exprimée en grammes, par une variable aléatoire X d’espérance µ = 1000 et de variance σ2 = 100. La loi de X est inconnue. Pour vérifier le fonctionnement de la machine, on prélève plusieurs échantillons de 40 paquets dont on mesure la masse. Pour chaque échantillon, on note X k la variable aléatoire qui modélise la masse du kième paquet. 1. Que peut-on dire de la loi de X k ? Donner E(X k ) et V (X k ). n 1 X 2. On désigne par X n = X k la variable aléatoire modélisant la n k=1 masse moyenne d’un paquet dans un échantillon de taille n = 40. Calculer E( X n ) et V ( X n ). 1. Déterminer la loi de Yk , donner son espérance et sa variance. 2. Calculer l’espérance et la variance de Z n . Que peut-on dire de la loi de probabilité de X n ? 3. En utilisant l’inégalité de Bienaymé-Tchebychev, étudier la convergence en probabilité de la suite (Z n )n∈N∗ . Peut-on utiliser la loi faible des grands nombres ? http ://andre.turbergue.free.fr SQ20 - Printemps 2016 2 Soit X 1 , X 2 , . . . , X n des variables aléatoires mutuellement indépendantes et de même loi N (0 , 1). On pose pour tout entier naturel n 1 X n Ê 1, T n = X2 n k=1 k Étudier la convergence en probabilité de la suite (T n )n∈N∗ 3. Calculer la probabilité pour que la masse moyenne d’un échantillon de 40 paquets soit supérieure à 997 grammes ? 5 Au cours d’une épreuve, un événement a une probabilité 0, 2 de se réaliser. 1. On effectue n épreuves indépendantes. Si X est le nombre de fois où l’événement se réalise, déterminer la loi de X , son espérance, et sa variance. 2. On prend n = 100. Calculer P(15 É X É 25) à 10−3 près : 3 ? Soit (Ω, T , P) un espace probabilisé et U une variable aléatoire définie sur Ω suivant une loi normale centrée réduite N (0, 1). On notera Φ la fonction de répartition de U. 1. Montrer en utilisant l’inégalité de Bienaymé-Tchebychev, que pour tout x > 0, 1 0 < 1 − Φ(x) É 2 2x Z A +∗ 2. Soit A ∈ R . Transformer l’intégrale (1 − Φ(x)) dx à l’aide d’une intégration par parties. 0 3. En Z +∞déduire l’existence et la valeur de l’intégrale généralisée (1 − Φ(x)) dx. (a) en utilisant la loi de X , (b) en approchant la loi de X par une loi normale. 3. On prend n = 1000. Calculer P(170 É X É 230) par les méthodes de la question précédente. 6 ? On lance une pièce de monnaie équilibrée. On gagne 1e si le résultat est Face, et on perd 1e sinon. Majorer le nombre de lancers à effectuer pour que l’on ait au moins une probabilité 0,95 de perdre au plus 20e. On comparera les résultats obtenus par approximation de loi, et par l’inégalité de Bienaymé-Tchebychev. 0 page 1 UTBM SQ20 TD 5 - convergences et approximations 7 On a mélangé 5 000 roulements d’une marque A avec 10 000 roulements de la marque B. On prélève au hasard 150 roulements. Quelle est la probabilité pour que le nombre de roulements A soit compris entre 45 et 60 ? 8 Soient U1 , U2 , . . . , U400 des variables aléatoires mutuellement indépendantes, qui suivent toutes la même loi uniforme sur l’intervalle [0 , 2]. . On pose T = U1 + U2 + · · · + U400 . On cherche le nombre a tel que P([T < a]) = 5%. Que vaut approximativement a ? 9 Soit (X n )n∈N∗ une suite de v.a.r. mutuellement indépendantes et n X suivant la même loi de Poisson de paramètre 1. On pose S n = Xk k=1 11 Une entreprise compte 300 employés. Chacun d’eux téléphone en moyenne 6 minutes par heure. Quel est le nombre de lignes que l’entreprise doit installer pour que la probabilité que toutes les lignes soient utilisées au même instant, soit au plus égale à 0,025 ? On notera n le nombre de lignes installées dans l’entreprise, X la var égale au nombre d’employés qui téléphonent à un instant t fixé, et on commencera au départ par calculer la probabilité qu’un employé donné soit en train de téléphoner à un instant t. 2 12 On identifie R2 muni de sa structure euclidienne canonique au plan de la géométrie usuelle. Soit A une partie de [0, 1] × [0, 1] d’aire a. On admet que si X et Y sont deux variables aléatoires indépendantes suivant la loi uniforme sur [0, 1], la probabilité de l’événement [(X , Y ) ∈ A] est égale à a. Soit f : [0, 1] −→ [0, 1] une fonction continue. 1. Quelle est la loi de S n ? 1. Soit X et Y deux variables aléatoires indépendantes suivant la loi uniforme sur [0, 1]. Quelle est la probabilité de l’événement [Y É f (X )] ? 2. Expliciter P([S n É n]). 3. En utilisant le théorème central limite, montrer que http ://andre.turbergue.free.fr SQ20 - Printemps 2016 n nk X k=0 k! ∼ ( n→+∞) Pour approfondir en 2 10 Soit n un entier supérieur ou égal à 2. On considère n variables aléatoires indépendantes X 1 , X 2 , . . . , X n suivant toutes la même loi géométrique de paramètre p où p ∈]0; 1[. X1 + X2 + · · · + X n On pose de plus X n = . n 1. Déterminer l’espérance m et l’écart type σn de X n en fonction de p et de n. ´ ³ 2. Montrer que lim P 0 < X n − m É σn existe et exprimer sa van→+∞ Z 1 2 leur à l’aide de e− t /2 dt. 2. Soit (X n )n∈N∗ et (Yn )n∈N∗ deux suites indépendantes de variables aléatoires indépendantes suivant la loi uniforme sur [0, 1]. Pour tout n ∈ N∗ , on appelle Z n la variable de Bernoulli prenant la valeur 1 si l’événement [Yn É f (X n )] est réalisé, 0 sinon. Pour tout n ∈ N∗ , on pose S n = Z1 + Z2 + · · · + Z n . Quelle est la loi de S n ? S n − E(S n ) Quelle est la limite en loi de la variable S ∗n = p ? V (S n ) Dans la suite de l’exercice, on suppose que n est assez grand pour identifier la loi de S ∗n à cette loi limite. Sn Quelle loi assigne-t-on alors à ? n 3. Soit Φ la fonction ¯ de ¯ répartition de la loi N (0, 1). Déterminer P(¯S ∗n ¯ É 1,96). ¯ µ¯ ¶ Z 1 ¯ ¯ Sn 1 En déduire que P ¯¯ − f (t) dt¯¯ É p Ê 0,95 n n 0 0 page 2 UTBM SQ20 TD 5 - convergences et approximations → − → − 13 Une cible est centrée sur l’origine d’un repère (O, i , j ) orthonormé. Une fléchette est lancée sur cette cible, et on suppose que les coordonnées d’impact X et Y suivent des lois normales centrées réduites indépendantes. Soit Z la variable aléatoire qui mesure la distance du point d’impact au centre de la cible. ( 2 − z2 1 − e si z Ê 0 , où F est la fonction de 1. Montrer que F(z) = 0 si z < 0 répartition de Z. 3 14 Un dé régulier est lancé 3 000 fois. On cherche à déterminer la probabilité de l’événement A : «on a obtenu 6 entre 450 et 550 fois». On note X la var égale au nombre de 6 obtenus. 2. En déduire une densité f de Z, puis montrer que r E(Z) = π 2 et V (Z) = Pour travailler seul 1. Quelle est la loi exacte de X ? 2. À l’aide de l’inégalité de Bienaymé-Tchebychev, donner une minoration de la probabilité de A . 3. Par quelle loi peut-on approcher la loi de X ? 4. Calculer la probabilité demandée dans l’énoncé de deux façons : avec correction de continuité et sans correction de continuité. Commenter les résultats obtenus. 4−π 2 3. On lance 150 flèches sur la cible (les lancers sont indépendants), et on note M la distance moyenne des impacts au centre de la cible. Déterminer la loi qui approche celle de M. 4. Calculer P(1 < M < 1, 2). http ://andre.turbergue.free.fr SQ20 - Printemps 2016 Pour quel intervalle I centré sur l’espérance aura-t-on P(M ∈ I) = 0, 9 ? page 3 UTBM SQ20 TD 6 - estimation ponctuelle Estimation ponctuelle 1 ne s’écarte pas de 250 g de plus de 1 g, avec une probabilité de 95%. Pour s’entraîner 15 Le responsable d’une entreprise a accumulé depuis des années les résultats à un test d’aptitude à effectuer un certain travail. Il semble plausible de supposer que les résultats au test d’aptitude sont distribués suivant une loi normale de moyenne m = 150 et de variance σ2 = 100. On fait passer le test à 50 individus de l’entreprise. Quelle est la probabilité que la moyenne de l’échantillon soit comprise entre 146 et 154 ? 18 Soit (X 1 , X 2 , . . . , X n ) un échantillon de taille n d’une variable aléatoire X qui suit une loi de Poisson de paramètre λ. n 1X X i . Montrer que X n est un estimateur sans 1. On pose X n = n i=1 biais et convergent de λ. n X 2 2. On pose T n = i X i. n(n + 1) i=1 Montrer que T n est un estimateur sans biais et convergent de λ. 3. Comparer les deux estimateurs précédents. L’un est-il meilleur que l’autre ? 16 Un atelier produit en grande série des pièces cylindriques. On désigne par X la variable aléatoire associant à chaque pièce tirée au hasard dans la production, son diamètre x, en mm. On suppose que X suit la loi normale de moyenne 12,50 et d’écart-type 0,02. http ://andre.turbergue.free.fr SQ20 - Printemps 2016 1. Déterminer, à 10−3 près, la probabilité que le diamètre d’une pièce, prise au hasard dans la production, soit compris entre 12,45 et 12,55. 2. On note X n la variable aléatoire mesurant la moyenne des diamètres des n pièces d’un échantillon de taille n, pris au hasard et avec remise dans la production. On note p n la probabilité que cette moyenne appartienne à l’intervalle [12, 495 ; 12, 505]. Déterminer la taille minimale n de l’échantillon pour que la probabilité p n soit supérieure ou égale à 0,97. 4. Soit (8, 5, 4, 0, 1, 5, 0, 2, 2, 3) la réalisation d’un échantillon de taille n = 10 de X . Calculer les deux estimations ponctuelles de λ qui correspondent à X n et T n . Laquelle retiendra-t-on ? 19 Un contrôle portant sur un emballage automatique de café fournit les masses suivantes : masse en g 247 248 249 250 251 252 253 254 nombre de paquets 2 6 8 13 11 5 3 2 1. Donner une estimation ponctuelle de la masse moyenne d’un paquet, et une de l’écart-type. 2. En supposant la loi normale, déterminer à l’aide des estimations, les pourcentages de paquets de masse supérieure à 250 g, de masse comprise entre 249 et 251. 17 Un boulanger fabrique des baguettes. On suppose que la variable aléatoire X , qui à chaque baguette tirée au hasard associe sa masse en gramme, suit la loi normale N (250 ; 10). 1. On prélève un échantillon de 50 baguettes (au hasard et avec remise) et on note X la variable aléatoire qui mesure le poids moyen des baguettes de l’échantillon. Quelle est la loi X ? Calculer la probabilité pour que la moyenne des poids des baguettes de l’échantillon soit comprise entre 245 g et 255 g. 20 Pour un échantillon observé (x1 , x2 , · · · , x100 ) d’une variable aléatoire X , on a obtenu 2. On se propose de prélever un échantillon de taille n. Déterminer n pour que la moyenne des masses des baguettes de cet échantillon Proposer des estimations ponctuelles de l’espérance m = E(X ) et de la variance σ2 = V (X ). 100 X k=1 page 4 xk = 2000 et 100 X x2k = 41 062. k=1 UTBM SQ20 TD 6 - estimation ponctuelle 2 Soit θ un réel strictement positif. 21 2t 2 On définit la fonction f sur R par f (t) = 0θ 1. si t ∈ [0 , θ ] Pour approfondir 23 Final 2015. Soit λ un nombre réel strictement positif. sinon Partie A (a) Vérifier que f est une densité de probabilité. (b) Soit X une variable aléatoire admettant f pour densité. Calculer E(X ) et V (X ). 2. Soit (X 1 , X 2 , . . . , X n ) un échantillon de taille n de X . Déduire de la question 1. un estimateur T n sans biais et convergent de θ . 3. On pose M n = max(X 1 , X 2 , . . . , X n ). ½ On considère la fonction f définie sur R par si t Ê λ si t < λ 1. Montrer que f est une densité de probabilité. 2. Déterminer la fonction de répartition F de X . 3. On considère la variable aléatoire U = X − λ. (b) L’estimateur M n est-il sans biais ? En déduire un estimateur dn de θ . sans biais M dn est-il convergent ? (c) L’estimateur M (a) Déterminer la fonction de répartition G de U. (b) En déduire que U est une variable à densité qui suit une loi classique dont on précisera le paramètre. Préciser son espérance et sa variance. dn . Quel est le meillleur ? 4. Comparer les estimateurs T n et M http ://andre.turbergue.free.fr eλ− t 0 On note X une variable aléatoire réelle de densité f . (a) Déterminer la loi de probabilité de M n . SQ20 - Printemps 2016 f (t) = 22 On s’intéresse à la proportion p de personnes possédant un gPhone. On tire au sort un échantillon (X 1 , X 2 , · · · , X n ) de taille n dans une population très grande.½ À chaque personne interrogée, on associe la 1 possède un gPhone variable aléatoire X k = 0 sinon 1. Donner un estimateur T n = f (X 1 , X 2 , . . . , X n ) de p. Étudier ses propriétés (biais, convergence). 2. On prend maintenant deux échantillons indépendants (X 1 , X 2 , . . . , X n1 ) et (X 10 , X 20 , . . . , X n0 2 ) de taille n 1 et n 2 (n 1 < n 2 ). On note f 1 et f 2 les proportions de possesseurs de gPhone pour les deux échantillons. On note F1 et F2 les estimateurs usuels de la proportion p sur chacun des deux échantillons. Soit F = αF1 + βF2 (α > 0, β > 0) un estimateur de p. (a) Déterminer α et β pour que F soit un estimateur sans biais de p. En déterminer la variance. (c) En déduire l’espérance et la variance de X . Partie B Dans toute la suite, n désigne un entier naturel non nul et X 1 , X 2 , . . . , X n des variables aléatoires mutuellement indépendantes de même loi que X . On cherche à estimer le réel λ. Pour tout entier naturel non nul n, on pose à ! n 1 X Sn = X n − 1 = X k − 1 et Yn = min(X 1 , X 2 . . . , X n ) n k=1 (b) Déterminer α et β pour que F soit un estimateur sans biais de p, et de variance minimale. (c) Application numérique : n 1 = 500, n 2 = 1000, f 1 = 0, 3, et f 2 = 0, 23. page 5 1. (a) Montrer que S n est un estimateur sans biais de λ. (b) Justifier que S n est un estimateur convergent de λ. 2. Démontrer que la fonction de répartition F n de Yn est définie par ½ F n (x) = 1 − en (λ− x) 0 si x Ê λ si x < λ 3. On considère la variable aléatoire Z n = Yn − λ. UTBM SQ20 TD 6 - estimation ponctuelle (a) Déterminer la fonction de répartition G n de Z n . (b) En déduire que Z n suit une loi exponentielle dont on précisera le paramètre. (c) En déduire l’espérance et la variance de Yn . 25 1 4. On pose T n = Yn − . n Prouver que T n est un estimateur sans biais et convergent de λ. De S n et T n , lequel est l’estimateur le plus efficace ? 3 Pour travailler seul 24 Un événement peut se produire à tout instant X (loi uniforme) dans un intervalle I = [0, b], où b est inconnu. Pour estimer la valeur de b inconnue, on va considérer un n-échantillon ( X 1 , X 2 , · · · , X n ). Final 2013 . On cherche à évaluer le nombre N de poissons vivant dans un étang. On prélève dans cet étang en une seule fois un échantillon de r poissons que l’on bague avant de les remettre dans l’étang. On propose une méthode pour tenter d’estimer N . Soit n ∈ N∗ . On prélève des poissons dans l’étang, au hasard et avec remise. On note X n la variable aléatoire égale au nombre de poissons qu’il a été nécessaire de pêcher pour obtenir n poissons marqués. On pose D 1 = X 1 et pour tout entier i de 2 , n, D i = X i − X i−1 . On considère que les D i sont des variables aléatoires mutuellement indépendantes. 1. Rappeler la densité, l’espérance, et la variance de X en fonction de b. n 1X 2. Soit l’estimateur T1 = X = X i . Calculer E (T1 ). n i=1 T1 est-il sans biais ? http ://andre.turbergue.free.fr SQ20 - Printemps 2016 3. À l’aide de T1 , construire un estimateur sans biais T2 de b. Calculer V (T2 ). 1. (a) Soit i un entier fixé de 2 , n. Justifier que la variable D i suit une r loi géométrique de paramètre p = . N Donner l’espérance et la variance de D i en fonction de N et r . n X (b) Que peut-on dire de X n et Di ? i =1 En déduire l’espérance et la variance de X n . r (c) On pose Z n = X n . Montrer que Z n est un estimateur sans n biais et convergent de N . 4. Un autre estimateur de b est T3 = sup( X 1 , X 2 , · · · , X n ). Pour x ∈ [0, b], calculer P(T3 É x). En déduire la fonction de répartition, et la densité de T3 . 5. Calculer E (T3 ). T3 est-il un estimateur sans biais ? À l’aide de T3 , construire un estimateur sans biais T4 de b. 6. Calculer E (T4 ), V (T4 ). Parmi les 4 estimateurs T1 , T2 , T3 , T4 , lequel est le meilleur ? 7. Application. La procédure de départ d’un Grand Prix de Formule 1 est la suivante : cinq feux rouges sont allumés successivement, l’extinction simultanée de ces cinq feux donne le signal du départ. Le temps qui s’écoule entre l’allumage complet et l’extinction est une variable uniforme sur [0, b] (ce temps est choisi par le directeur de course dans les limites du règlement). Au cours des 16 G.P. d’une saison, les intervalles de temps, en secondes, ont été : 0, 3 0, 9 2, 1 2, 6 2, 7 0, 6 1, 6 0, 1 1, 2 2, 1 0, 8 0, 6 1, 1 0, 5 1, 2 2, 7 Déterminer une estimation de b. page 6 2. Pour n assez grand, par quelle loi peut-on approcher la loi de la variable aléatoire X n ? 3. On a marqué r = 200 poissons puis effectué 450 prélèvements pour obtenir n = 50 poissons marqués. On note σ l’écart-type de Z50 . Exprimer σ en fonction de N . Proposer une estimation ponctuelle de N . UTBM SQ20 TD 7 - estimation par intervalle de confiance Estimation par intervalle de confiance 1 1. Déterminer des estimations ponctuelles de µ et de σ2 . 2. Déterminer un intervalle de confiance de µ au niveau 0, 95. Pour s’entraîner http ://andre.turbergue.free.fr SQ20 - Printemps 2016 26 BTS informatique de gestion - 2011 . La direction des ressources humaines d’une entreprise de plus de 20 000 salariés a décidé de rembourser à ses salariés les frais professionnels de téléphone mobile. Pour prévoir cette dépense dans le budget, il a donc été réalisé une enquête auprès de 150 salariés leur demandant le montant de cette dépense. Cette expérience est assimilée à un tirage aléatoire avec remise. Pour cet échantillon, la moyenne est x e = 54 e et l’écart-type est s e = 10 e. On désigne par X la variable aléatoire qui, à chaque échantillon aléatoire de 150 salariés prélevé au hasard dans l’ensemble des salariés de l’entreprise, associe la moyenne des montants en euros de ces dépenses. On pourra assimiler ces prélèvements à des prélèvements aléatoires avec remise. 1. Donner une estimation ponctuelle de la moyenne m des montants des dépenses en téléphone mobile professionnel de l’ensemble des salariés de l’entreprise. 2. Proposer une estimation ponctuelle σ b de l’écart-type σ des montants des dépenses en téléphone mobile professionnel de l’ensemble des salariés de l’entreprise, arrondie au centième. 28 On souhaite estimer la masse m d’un certain objet. Pour cela, on effectue des pesées successives et on note la moyenne obtenue. On admet que la variable aléatoire renvoyant le résultat d’une pesée de l’objet étudié suit la loi normale d’espérance m et d’écart-type σ = 0, 1. 1. On effectue 10 pesées et on obtient une masse moyenne de 72,40 grammes. Donner un intervalle de confiance au niveau de confiance 90% pour la masse m. 2. Combien de pesées suffirait-il d’effectuer pour que l’amplitude de cet intervalle de confiance à 90% soit inférieure ou égale à 0,05 ? 3. Comment répondre à la question 1. si on ne suppose plus que le résultat d’une pesée suit une loi normale ? 29 L’airbag (ou coussin gonflable) est un système de sécurité de plus en plus souvent installé dans les automobiles. Son gonflement est assuré par un dispositif pyrotechnique dont les caractéristiques importantes sont la moyenne et l’écart-type du délai entre la mise à feu et l’explosion. Lors de l’étude d’un certain type de dispositif d’allumage, les résultats des mesures, effectuées sur 10 exemplaires, ont été (en millisecondes) : 28, 28, 31, 31, 33, 30, 31, 27, 32, 29. 3. Donner un intervalle de confiance de m au niveau de confiance de 99 %. Arrondir au centième les bornes de cet intervalle. 1. Calculer, au niveau de confiance de 95%, un intervalle de confiance de la moyenne du délai si on connaît l’écart-type de la population de référence et qu’il est égal à 2. 2. Calculer ce même intervalle si on ne connaît pas l’écart-type de la population de référence. 27 Soit X ,→ N (µ, σ2 ). On prélève un échantillon de variables aléatoires indépendantes E = (X 1 , X 2 , . . . , X 9 ) dont une observation e donne : 3. Calculer, au même niveau de confiance, un intervalle de confiance de la variance du délai dans le cas où on ne connaît pas l’écart-type de la population de référence. 7 8 9 10 8 5 9 7 8 page 7 UTBM SQ20 TD 7 - estimation par intervalle de confiance 30 On a observé un échantillon de taille n = 500, d’adolescents de 15 ans, dans lequel 210 présentent un surpoids. Soit p la proportion d’adolescents de 15 ans qui présentent un surpoids. Donner un intervalle de confiance pour p aux niveaux de confiance 95% et 99%. 31 Une entreprise fabrique des sacs en cuir en grande quantité. Un contrôle de fabrication portant sur un échantillon de 200 sacs a montré que 50 d’entre eux étaient de première qualité, les autres de qualité courante. Estimer au niveau 95% l’intervalle de confiance de la proportion de sacs de première qualité. 34 Une pièce métallique rectangulaire a une longueur X qui suit une loi normale d’espérance 18, 4 et de variance v1 inconnue, et une largeur Y normale d’espérance M2 , et de variance v2 inconnues. Un échantillon de 25 pièces a donné les mesures suivantes : • pour la longueur : un écart-type de 0, 7 • pour la largeur : une moyenne de 25, 4, et une estimation de l’écart-type s 2 = 0, 9. Déterminer les intervalles de confiance au niveau 95% pour les variances des deux dimensions. 2 http ://andre.turbergue.free.fr SQ20 - Printemps 2016 32 En France, 100 personnes choisies au hasard ont été interrogées afin de se prononcer pour ou contre le nouveau plan de rigueur présenté par le gouvernement. On note p la proportion inconnue de personnes qui sont favorables à ce nouveau plan. On souhaite réaliser un autre sondage avec une amplitude pour l’intervalle de confiance 0,95 d’au plus 0,02. Quel est le nombre minimal de personnes à interroger ? Pour approfondir 35 On administre des somnifères à deux groupes de malades A et B comprenant 50 et 100 individus. Le groupe A reçoit le nouveau somnifère, le groupe B reçoit l’ancien. Les patients du groupe A ont dormi 7,82 heures en moyenne, ceux du groupe B : 6,75 heures en moyenne. Les écarts-type de chaque population sont supposés connus et égaux à σ A = 0, 24h et σB = 0, 30h. 33 Quatre jours avant le premier tour de l’élection présidentielle de 2002, on effectue un sondage. 1. Dans un échantillon «représentatif» de 1000 électeurs (taille fréquemment utilisée pour les sondages politiques), 180 personnes déclarent vouloir voter pour le candidat Lionel. Donner les intervalles de confiance à 95% et 99% du pourcentage de personnes ayant l’intention de voter pour Lionel. 1. Calculer l’intervalle de confiance de la différence des moyennes d’heures de sommeil provoquées par les deux somnifères au niveau de confiance 0,99. 2. Pensez-vous que le nouveau somnifère soit plus puissant que l’ancien ? 2. On évalue le pourcentage de personnes ayant l’intention de voter pour un autre candidat, Jean-Marie, à 12,5% ? Combien faut-il interroger de personnes pour obtenir un intervalle de confiance à 95% du pourcentage de personnes ayant l’intention de voter Jean-Marie, avec une précision de 1% ? page 8 UTBM SQ20 TD 7 - estimation par intervalle de confiance 36 On a mesuré le poids de raisin produit par pied sur 10 pieds pris au hasard dans une vigne. On a obtenu les résultats suivants exprimés en kilogrammes : 2,4 - 3,4 - 3,6 - 4,1 - 4,3 - 4,7 - 5,4 - 5,9 - 6,5 - 6,9 On modélise le poids de raisin produit par une souche de cette vigne par une variable aléatoire de loi normale N (µ, σ). 1. Calculer la moyenne et la variance empiriques de l’échantillon. En déduire des estimations ponctuelles de µ et de σ2 . 2. Donner un intervalle de confiance de niveau 0,95 pour la moyenne µ. 3. Donner un intervalle de confiance de niveau 0,95 pour la variance σ2 4. On suppose désormais que l’écart-type des productions par pied est connu et égal à 1,4. Donner un intervalle de confiance de niveau 0,95 pour µ Pour travailler seul 37 Final 2014 . Une entreprise vend des bouchons de liège pour bouteilles de vin. Dans un souci de productivité, elle décide de traiter ses chênes-lièges avec des produits chimiques pour qu’ils développent leur écorce plus vite. Ces traités chimiques peuvent altérer le liège et donner par la suite un goût bouchonné aux bouteilles. Dans la suite, on notera p la proportion de bouchons présentant un tel défaut. Un groupe de vignerons goûte 215 de ces bouteilles et en compte 13 bouchonnées. 1. Proposer une estimation ponctuelle de p. 2. Construire un intervalle de confiance pour p au niveau 99%. 38 Final 2011 . On a mesuré la quantité totale d’alcool (exprimée en g/l) contenue dans un échantillon de 10 bouteilles de cidre doux du marché. On a obtenu des valeurs x1 , x2 , x3 , . . . , x10 telles que 10 X k=1 xk = 62 et 10 X x2k = 388, 4124 k=1 On modélise la quantité d’alcool contenue dans une bouteille, par une variable aléatoire X suivant une loi normale d’espérance µ et de variance σ2 , µ et σ2 étant des paramètres inconnus. 1. Proposer des estimations ponctuelles de µ et de σ2 à partir de l’échantillon observé. http ://andre.turbergue.free.fr SQ20 - Printemps 2016 5. Quel nombre de pieds au minimum devrait-on observer pour estimer µ au niveau de confiance 0,99 avec une précision de plus ou moins 500 grammes ? 3 2. Construire un intervalle de confiance pour la moyenne µ au niveau de confiance de 1 − α = 95%. 3. Déterminer un intervalle de confiance à 80% de la variance σ2 . 4. (a) Si n désigne la taille d’un grand échantillon ( n > 50), exprimer en fonction de n, l’amplitude de l’intervalle de confiance de µ au niveau de confiance de 95%. (b) On souhaite construire un intervalle de confiance de µ au niveau de confiance 95% ayant une amplitude de 0,2 gramme par litre. Quelle doit étre approximativement la taille de l’échantillon ? On prendra comme approximation de la variance la valeur estimée dans la question 1. page 9 UTBM SQ20 TD 8 - tests d’hypothèse Tests d’hypothèse 1 2. Calculer un intervalle de confiance de µ au niveau 0, 99. 3. ? Le cahier des charges impose que l’épaisseur moyenne soit 6 mm. La production est-elle conforme ? Pour s’entraîner 39 Une société reçoit régulièrement d’un fabricant des boîtes de 100 composants. Un accord fixe le niveau de qualité à 1 défectueux par boîte. Un contrôle à la livraison portant sur 1000 composants donne 15 défectueux. L’accord est-il respecté au niveau de tolérance de 95% ? 40 Baccalauréat - juin 2014 . Un ostréiculteur affirme que 60 % de ses huîtres ont une masse supérieure à 91 g. Un restaurateur souhaiterait lui acheter une grande quantité d’huîtres mais il voudrait, auparavant, vérifier l’affirmation de l’ostréiculteur. 42 Soit une variable aléatoire X ,→ P (λ) avec λ = 0, 4. Soit un échantillon (X 1 , X 2 , . . . , X n ) de variables indépendantes de même n X 1 loi que X , et les variables S n = X k et X n = S n . n k=1 1. Donner l’espérance et la variance de X . Dans le cas général (n ∈ N∗ ), rappeler la loi de S n , ainsi que ses paramètres. 2. Soit n = 25. Proposer deux entiers naturels n 1 et n 2 tels que P(n1 É S n É n2 ) ≈ 0, 95. Dans le cas où l’observation a donné une moyenne de 0, 52, peut-on considérer que λ est effectivement égal à 0, 4 ? http ://andre.turbergue.free.fr SQ20 - Printemps 2016 Le restaurateur achète auprès de cet ostréiculteur 10 douzaines d’huîtres qu’on considérera comme un échantillon de 120 huîtres tirées au hasard. Sa production est suffisamment importante pour qu’on l’assimile à un tirage avec remise. Il constate que 65 de ces huîtres ont une masse supérieure à 91 g. 3. Soit n = 500. Par quelle loi peut-on approcher X 500 ? Si on suppose que λ = 0, 4, déterminer un intervalle ]x1 , x2 [ tel que P(x1 < X 500 < x2 ) = 0, 95. Une observation d’un échantillon de 500 v.a. a donné une moyenne de 0, 52. Ce résultat est-il conforme aux hypothèses ? Que peut penser le restaurateur de l’affirmation de l’ostréiculteur ? 41 Une entreprise utilise une matière isolante dans l’assemblage de moteurs électriques. Il est important que l’épaisseur corresponde aux normes de montage, mais aussi que les variations ne soient pas trop importantes. Un échantillon aléatoire, dont l’épaisseur est normale N (µ, σ), de 20 éléments a été prélevé dans une grande production et les résultats en mm ont été les suivants : 5, 5 5, 8 6, 1 6, 5 5, 8 5, 8 5, 5 6, 1 5, 7 5, 4 5, 5 5, 9 6, 2 6, 1 5, 8 6, 1 5, 9 6, 1 6, 2 6 43 On cherche à savoir si la fréquence d’une maladie est liée au groupe sanguin. Sur 200 malades observés, on a dénombré 104 personnes du groupe O, 76 du groupe A, 18 du groupe B et 2 du groupe AB. On précise que dans la population générale, la répartition entre les groupes sanguins est : 43% de groupe O, 45% de groupe A, 9% de groupe B et 3% de groupe AB. Que peut-on conclure ? 1. Déterminer des estimations ponctuelles de µ et de σ2 . page 10 UTBM SQ20 TD 8 - tests d’hypothèse 44 Dans une entreprise de BTP, on relève sur une période de 100 jours le nombre journalier d’accidents du travail. x i : nb d’accidents dans la journée n i : nb de jours concernés 0 14 1 26 2 27 3 19 4 8 5 5 2 47 6 1 Identifier la variable étudiée et tester l’hypothèse que la distribution de cette variable est une distribution de Poisson au seuil de 1%. Pour approfondir 1. En lançant une pièce de monnaie 3 fois, on veut tester l’hypothèse H0 : P(«Pile») = 0, 5 contre H1 : P(«Pile») = 0, 75. On convient de rejeter H0 si on obtient trois fois Pile. Calculer les probabilités d’erreur de première et de seconde espèce. 2. Déterminer une région critique (un domaine de rejet de H0 ) si on lance la pièce 25 fois, et si α = 0, 05. Calculer ensuite β. 45 L’étude de 5128 familles ayant 5 enfants s’est traduite par la distribution suivante : Nb de garçons Nb de filles Nb de familles 5 0 204 4 1 841 3 2 1585 2 3 1544 1 4 810 0 5 144 On note p la proportion de garçons à la naissance, p étant inconnue. http ://andre.turbergue.free.fr SQ20 - Printemps 2016 1. Quelle est la loi de probabilité (théorique) du nombre de garçons dans une famille de 5 enfants ? 2. Comparer la distribution observée à la distribution théorique en utilisant le test du χ2 . Conclure. 46 La série statistique suivante obéit-elle à une loi normale ayant pour espérance mathématique et pour écart-type les valeurs de la moyenne et de l’écart quadratique moyen de la série (7800 et 39) ? classes effectifs classes effectifs [7700, 7720[ 2 [7800, 7820[ 10 [7720, 7740[ 1 [7820, 7840[ 9 [7740, 7760[ 4 [7840, 7860[ 4 [7760, 7780[ 8 [7860, 7880[ 2 [7780, 7800[ 9 [7880, 7900[ 1 page 11 UTBM SQ20 TD 8 - tests d’hypothèse 48 On appelle X le nombre d’accidents qui se produisent par mois à un carrefour déterminé. On suppose que X est une variable aléatoire qui suit une loi de Poisson de paramètre λ : X ,→ P (λ). Durant 5 mois, on relève le nombre d’accidents survenus à ce carrefour. On veut choisir entre les deux hypothèses : • H0 : λ = 1 , situation jugée «acceptable» par les pouvoirs publics • H1 : λ > 1 , situation jugée «alarmante» par les pouvoirs publics Si en 5 mois, le nombre d’accidents relevés dépasse une certaine valeur k, les pouvoirs publics décideront d’aménager le carrefour. 3 49 Final 2015. À l’occasion d’une commande, le service contrôle d’un laboratoire reçoit un lot de flacons. Il effectue un prélèvement aléatoire de 81 flacons et mesure leurs volumes. Les résultats sont consignés dans le tableau suivant 1. Donner l’interprétation du choix de λ = 1 comme hypothèse de base. 2. Quelle est la valeur critique k correspondant à un risque de première espèce α = 1, 4% ? 3. On a dénombré un total de 8 accidents sur 5 mois à ce carrefour. Quelle décision prendra-t-on ? http ://andre.turbergue.free.fr 4. Calculer la puissance de ce test en prenant successivement pour hypothèse alternative H1 : λ = 1, 5 puis λ = 2 et enfin λ = 4. SQ20 - Printemps 2016 Pour travailler seul Volume (en m`) Effectif 57,95 3 57,99 10 58,03 39 58,07 21 58,11 8 1. Calculer la moyenne x e et l’écart type s e de cet échantillon (on arrondira les résultats à 10−3 près). 2. Le volume des flacons est annoncé par le fabricant comme étant de 58 m`. On se propose de construire un test d’hypothèse bilatéral au seuil de signification de α = 5 % pour contrôler, au moment de la livraison, la moyenne µ de l’ensemble des volumes (en m`) des flacons. On admet que le volume d’un flacon est modélisé par une variable aléatoire X qui suit une loi normale d’espérance µ et d’écart-type σ. On note X la variable aléatoire qui, à chaque échantillon de 81 flacons prélevés au hasard dans l’ensemble de la production, associe la moyenne des volumes. On veut tester : • l’hypothèse nulle H0 : µ = 58 • contre l’hypothèse alternative H1 : µ 6= 58 (a) Quelle est la loi de probabilité de la variable aléatoire X ? (b) Choisir la variable aléatoire de test Z et préciser sa loi de probabilité en se plaçant sous l’hypothèse nulle H0 . (c) Déterminer sous l’hypothèse nulle H0 , le réel t tel que P(− t É Z É t) = 0, 95 (d) En déduire la région d’acceptation D 0 de H0 au seuil de signification de 5%. 3. En utilisant les informations recueillies sur l’échantillon de 81 flacons, le service de contrôle acceptera-t-il cette livraison ? page 12 UTBM