Statistiques Inférentielles - Feuille 2 1 Échantillonnage : Loi des moyennes Exercice 1 Une usine produit des disques en grande série. On appelle X la variable aléatoire qui à chaque disque, pris au hasard, associe son diamètre. On suppose que X suit la loi normale de moyenne µ = 50 et d’écart-type σ = 0, 5. On prélève au hasard des échantillons de 36 disques. On note Y la variable aléatoire qui pour chaque échantillon associe la moyenne des diamètres des 36 disques. 1. Quelle est la loi suivie par Y ? 2. Déterminez a pour que p(µ − a 6 Y 6 µ + a) = 0, 9. Réponse : a = 0, 1371 - Même question avec µ = 40 et σ = 0, 6, Réponse : a = 0, 1645 Correction : 1. D’après la loi des moyennes, Y suit approximativement la loi N µ; √σ36 ≈ N (50; 0, 083). 2. On pose t = Y −50 0,083 . t suit la loi normale centrée réduite. On aura alors : p(µ − a 6 Y 6 µ + a) = p(50 − a 6 Y 6 50 + a) Y − 50 50 + a − 50 50 − a − 50 6 6 =p 0, 083 0, 083 0, 083 a a =p − 6t6 0, 083 0, 083 a = 2Π 0, 083 a = 0, 9. On sait que cela sera vrai si 0,083 = 1, 645 (c’est une des valeurs a = 0,9+1 = 0, 95 et le formulaire qu’il est bon de connaître par cœur, sinon on écrit Π 0,083 2 donne le résultat) Il faut donc 2Π a 0,083 On en déduit donc : a 0,083 = 1, 645 donc a = 1, 645 × 0, 083 = 0, 1371. Exercice 2 Un traceur produit des cartouches ayant une forme de rectangle dont la longueur doit être de 10cm. Pour tester le réglage du traceur, on prélève 100 feuilles. Soit X la variable aléatoire qui pour chaque feuille associe la longueur du cartouche. On suppose que X suit la loi normale de moyenne m = 10 et d’écart-type σ = 0, 03. On note X100 la variable qui à chaque échantillon associe la moyenne des longueurs. 1. Quelle est la loi suivie par X100 ? 2. Déterminez le réel positif h tel que p m − h 6 X100 6 m + h = 0, 95. Réponse : h = 0, 0059 - Même question avec m = 20 et σ = 0, 1, Réponse : h = 0, 0196 Correction : σ 1. D’après la loi des moyennes, X1 00 suit la loi N m; √100 = N (10; 0, 003). (ce n’est pas approximatif car X suit une loin normale) Page 1/8 Statistiques Inférentielles - Feuille 2 2. On pose t = X1 00−10 0,003 . t suit la loi normale centrée réduite. On aura alors : p(m − h 6 X1 00 6 m + h) = p(10 − h 6 X1 00 6 10 + h) 10 − h − 10 X1 00 − 10 10 + h − 10 =p 6 6 0, 003 0, 003 0, 003 h h =p − 6t6 0, 003 0, 003 h = 2Π 0, 003 h 0,003 h = 0, 95. On sait que cela sera vrai si 0,003 = 1, 96 (c’est une des valeurs h = 0,95+1 = 0, 975 et le formulaire qu’il est bon de connaître par cœur, sinon on écrit Π 0,003 2 donne le résultat) Il faut donc 2Π On en déduit donc : h 0,003 = 1, 96 donc h = 1, 96 × 0, 003 ≈ 0, 0059. Exercice 3 Une machine fabrique un très grand nombre de pièces, de longueur moyenne m = 4, 2mm et d’écart-type σ = 0, 2. On prélève des échantillons de taille n avec n > 30. Soit X la variable qui à chaque échantillon de n pièces associe la moyenne de longueurs. 1. Quelle est la loi suivie par X ? Précisez les paramètres de cette loi. 2. Trouvez la taille n de l’échantillon pour que p 4, 17 < X < 4, 23 = 0, 95. 3. Trouvez la taille n de l’échantillon pour que p 4, 17 < X < 4, 23 = 0, 99. Réponses : n = 171 puis n = 296 Correction : 1. D’après la loi des moyennes, X suit approximativement la loi normale de moyenne m et d’écart 0,2 σ type √n : N 4, 2; √n . √ 2. On pose t = X−4,2 n. t suit une loi normale centrée réduite. = X−4,2 0,2 0,2 √ n 4, 17 − 4, 2 √ X − 4, 2 √ 4, 23 − 4, 2 √ n< n< n 0, 2 0, 2 0, 2 √ √ = p −0, 15 n < t < 0, 15 n √ = 2Π 0, 15 n − 1 p 4, 17 < X < 4, 23 = p Or on souhaite que cette probabilité soit égale à 0, 95. On se souvient 2Π(t) − 1 = 0, 95 pour 2 √ t = 1, 96 et donc ici 0, 15 n = 1, 96 ce qui donne : n = 1,96 ≈ 170, 7. Il faut donc n = 171. 0,15 2 √ 3. Pour que 2Π(t) − 1 = 0, 99 il faut t = 2, 58, donc 0, 15 n = 1, 96 ce qui donne : n = 2,58 ≈ 0,15 295, 8. Il faut donc n = 296. Page 2/8 Statistiques Inférentielles - Feuille 2 2 Échantillonnage : Loi des fréquences Exercice 4 Une entreprise produit une grande série de pièces pour le bâtiment. Pour analyser la qualité de la production, on prélève au hasard un échantillon de n = 64 pièces. On suppose que le pourcentage de pièces défectueuses dans la production est de 4%. Soit F la variable aléatoire qui à tout échantillon de n pièces associe la fréquence de pièces défectueuses dans cet échantillon. 1. quelle est, approximativement, la loi suivie par F ? Précisez-en les paramètres. 2. Quel est la probabilité que sur un échantillon donné, la fréquence de pièce défectueuses soit comprise entre 3% et 5% ? 3. Déterminez le réel a tel que p(0, 04 − a 6 F 6 0, 04 + a) = 0, 95. 4. Quelle valeur doit-on donner à n pour que p(0, 03 6 F 6 0, 05) = 0, 99 ? Réponses : 96, 3% ; a = 0, 0094 = 0, 94% ; n = 99 Exercice 5 Dans une population, on constate qu’il y a 28% de fumeurs. On prend un échantillon de 400 personnes. 1. Quel est la probabilité d’avoir dans cet échantillon un pourcentage de fumeurs compris entre 26% et 30% de fumeurs ? 2. Quelle est la probabilité d’avoir dans cet échantillon un pourcentage de fumeurs inférieur à 22% ? 3 Estimation par intervalle de confiance Exercice 6 Une entreprise fabrique des tiges métalliques. Leur longueur et leur diamètre sont exprimés en millimètres. On prélève au hasard un échantillon de 50 tiges dans la production d’une journée. Soit D la variable aléatoire qui, à tout de 50 tige, associe le diamètre moyen de ces tiges. échantillon σ √ On suppose que D suit la loi N µ; 50 , avec sigma = 0, 19 et µ inconnu. Sur l’échantillon, on a observé µe = 9, 99. 1. Á partir de ces informations, donnez une estimation ponctuelle de la moyenne µ des diamètres des tiges produites dans une journée. 2. Déterminez un intervalle de confiance de la moyenne µ à 95%. 3. On considère l’affirmation : « µ appartient obligatoirement à l’intervalle de la question précédente ». Cette affirmation est-elle vraie ? Exercice 7 On a contrôlé le dosage d’un produit dans un mélange à la sortie d’une chaîne de conditionnement. On a prélevé un échantillon de 100 lots de 5kg dans la production d’une journée. On a obtenu les résultats suivants, où Pi représente la masse de produit exprimée en grammes, et ni l’effectif correspondant. Pi ni 142 1 144 5 146 6 148 21 150 32 152 22 154 7 156 4 158 1 160 1 1. Calculez la moyenne et l’écart-type de des masses de produit dans l’échantillon. Page 3/8 Statistiques Inférentielles - Feuille 2 2. Á partir des résultats obtenus pour cet échantillon, donnez une estimation ponctuelle de la moyenne m et de l’écart-type σ de masse de produit dans la production de la journée. 3. Soit P la variable aléatoire qui a tout échantillon de 50 lots associe la moyenne de la masse de produit dans cet échantillon. Quel loi suit approximativement la variable P ? 4. Donnez un intervalle de confiance de la moyenne m avec le coefficient de confiance de 5%. 5. même question avec un coefficient de confiance de 90% ; de 99%. Correction : 1. Avec la calculette, on trouve la moyenne et l’écart-type de l’échantillon : xe = 150, 1 et σe ≈ 3, 05, avec un effectif total n = 100. 2. Une estimation ponctuelle de la moyenne de la population est m = xe = 150, 1. Une estimation q n ponctuelle de l’écart-type de la population est σ = n−1 σe ≈ 3, 07. 3. D’après la loi des moyennes, P suit approximativement la loi N m; √σ50 ≈ N (150, 1; 0, 43). 4. Un intervalle de confiance de m avec un coefficient de confiance de 95% est : 3, 07 3, 07 √ √ I = 150, 1 − t ; 150, 1 + t 50 50 avec 2Π(t) − 1 = 0, 95, soit t = 1, 96, donc : I = [149, 25; 150, 95] 5. On refait le calcul avec t = 1, 645 puis t = 2, 58 et on obtient : I90% = [149, 39; 150, 81] I99% = [148, 98; 151, 22] Exercice 8 La proportion P de ménages de la ville V qui possède au moins un téléviseur est inconnue. 1. On note F la variable aléatoire qui, à tout échantillon de 400 ménages de la ville V , associe le pourcentage de ménages de cet échantillon ayant au moins un téléviseur. Pour un de ces échantillons, F vaut 80%. (a) En utilisant cet échantillon, donnez une estimation ponctuelle de p. (b) Quelle loi suit approximativement la variable F ? (c) Donnez alors la probabilité que dans un échantillon F soit inférieur à 78%. (d) Donnez la probabilité que dans un échantillon, F soit compris entre 78 et 82%. (e) Donnez une estimation de p par intervalle de confiance avec le risque 5%. 2. On note Fn la variable aléatoire qui pour un échantillon de n ménages associe la proportion de ménages de cet échantillon ayant au moins q un téléviseur. On approxime la loi de Fn par la loi normale de moyenne p et d’écart-type p(1−p) n . Quelle doit être la taille minimale n0 pour estimer p à ±2% près par intervalle de confiance, avec le risque 1% ? Page 4/8 Statistiques Inférentielles - Feuille 2 Tiré du BTS 2012 : Intervalle de confiance Un producteur fourni des bottes de paille pour l’isolation. On considère les bottes produites le 22 juillet 2011. On prélève au hasard un échantillon de 50 bottes de paille dans cette production. La production est assez importante pour que l’on puisse assimiler ce prélèvement à un tirage avec remise. On constate que 37 bottes de pailles de cet échantillon sont conformes aux normes d’isolation. 1. Donnez une estimation ponctuelle de la fréquence inconnue p des bottes de paille de cette production qui sont conformes aux normes d’isolation. 2. Soit F la variable aléatoire qui, à tout échantillon de 50 bottes ainsi prélevé dans cette production, associe la fréquence des bottes de cet échantillon qui sont conformes aux normes d’isolation. On suppose que F suit la loi normale de moyenne inconnue p et d’écart type q p(1−p) 50 . (a) Déterminez un intervalle de confiance de la fréquence p au niveau de confiance de 95%. (b) On considère l’affirmation suivante : « la fréquence p est obligatoirement dans l’intervalle de confiance obtenu à la question 2 a) » Cette affirmation est-elle vraie ? Tiré du BTS 2011 On considère une grande quantité de plaques devant être livrées à une chaîne de montage de véhicules électriques. On considère un échantillon de 100 plaques prélevées au hasard dans cette livraison. La livraison est assez importante pour que l’on puisse assimiler ce tirage à un tirage avec remise. On constate que 94 plaques sont sans défaut. 1. Donnez une estimation ponctuelle de la fréquence inconnue p des plaques de cette livraison qui sont sans défaut. 2. Soit F la variable aléatoire qui, à tout échantillon de 100 plaques prélevées au hasard et avec remise dans cette livraison, associe la fréquence des plaques de cet échantillon qui sont sans défaut. q On suppose que F suit la loi normale de moyenne p et d’écart type p(1−p) 100 ,où p est la fréquence inconnue des plaques de la livraison qui sont sans défaut. Déterminez un intervalle de confiance de la fréquence p avec le coefficient de confiance 95%. Tiré du BTS 2008 Une entreprise fabrique en grande série des pièces de bois. Ces pièces sont prévues pour s’encastrer les unes dans les autres. Elle ont une cote x et une cote y. A. Loi normale Une pièce de type est conforme lorsque sa cote x, exprimée en millimètres, appartient à l’intervalle [9, 5 ; 10, 5] et lorsque sa cote y appartient à l’intervalle [10, 5 ; 11, 5]. 1. On note X la variable aléatoire qui, à chaque pièce de ce type prélevée au hasard dans la production d’une journée, associe sa cote x. On suppose que la variable aléatoire X suit la loi normale de moyenne 10 et d’écart type 0, 21. Calculez p(9, 5 6 X 6 10, 5). Page 5/8 Statistiques Inférentielles - Feuille 2 2. On note Y la variable aléatoire qui, à chaque pièce de ce type prélevée au hasard dans la production d’une journée, associe sa cote y. On admet que p(10, 5 6 Y 6 11, 5) = 0, 985. On suppose que les variables aléatoires X et Y sont indépendantes. On prélève une pièce au hasard dans la production d’une journée. Déterminez la probabilité qu’elle soit conforme. Correction : 1. On pose t = X−10 0,21 . t suit la normale centrée réduite. On aura : X − 10 10, 5 − 10 9, 5 − 10 6 6 p(9, 5 6 X 6 10, 5) = p 0, 21 0, 21 0, 21 = p(−2, 38 6 t 6 2, 38) = 2Π(2, 38) − 1 = 2 × 0, 9913 − 1 = 0, 9826 Conclusion : p(9, 5 6 X 6 10, 5) = 0, 9826. 2. Appelons A l’évènement « 9, 5 6 X 6 10, 5 » et B l’évènement « 10, 5 6 Y 6 11, 5 ». Comme X et Y sont indépendants, A et B le sont également, et alors la probabilité que la pièce soit conforme est : p(A ∩ B) = p(A) × p(B) = 0, 9826 × 0, 985 = 0, 968 B. Loi binomiale et loi de Poisson On considère un stock important de pièces. On note E l’évènement : « une pièce prélevée au hasard dans le stock est défectueuse ». On suppose que p(E) = 0, 03. On prélève au hasard 50 pièces dans le stock de pièces pour vérification. Le stock est suffisamment important pour que l’on puisse assimiler ce prélèvement à un tirage avec remise de 50 pièces. On considère la variable aléatoire Z qui, à tout prélèvement ainsi défini, associe le nombre de pièces de ce prélèvement qui sont défectueuses. 1. Justifiez que la variable aléatoire Z suit une loi binomiale dont on déterminera les paramètres. 2. Calculez p(Z = 0) et p(Z 6 2). 3. On considère que la loi de probabilité suivie par la variable aléatoire Z peut être approchée par une loi de Poisson. (a) Déterminez le paramètre λ de cette loi de Poisson. (b) On désigne par Z1 une variable aléatoire suivant la loi de Poisson de paramètre λ, où λ a la valeur obtenue précédemment. En utilisant cette loi de Poisson, calculez la probabilité que, dans un tel prélèvement de 50 pièces, au plus deux pièces soient défectueuses. Correction : On peut déjà remarqué que p(E) = 0, 03 est conforme avec p E = p(A ∩ B) ≈ 0, 97 trouvé précédemment. 1. On a l’expérience élémentaire : Choisir une pièce au hasard dans le stock. Le succès est l’évènement E. Les pièces sont identiques et le stock est assez grand pour que l’on puisse assimiler ce choix à un tirage avec remise. On a donc un schéma de Bernoulli avec p = p(E) = 0, 03 et n = 50. Z est la variable aléatoire représentant le nombre de succès de ce schéma de Bernoulli. Z suit donc la loi binomiale B(50; 0, 03). Page 6/8 Statistiques Inférentielles - Feuille 2 0 0, 030 0, 975 0 ≈ 0, 218. 2. p(Z = 0) = C50 p(Z 6 2) = p(Z = 0) + p(Z = 1) + p(Z = 2) 0 1 2 = C50 0, 030 0, 975 0 + C50 0, 031 0, 974 9 + C50 0, 032 0, 974 8 ≈ 0, 218 + 0, 337 + 0.256 ≈ 0, 811 Ce qui se confirme en faisant, par exemple avec une TI :2nd+Vars binomialFRép(50,0.03,2). On obtient : 0, 810798. 3. Pour retrouver l’approximation, il faut se rappeler que l’espérance avec une loi de poisson de paramètre λ est tout simplement λ, tandis que l’expérience avec la loi B(n; p) est np. Donc il faut prendre : λ = np. On prendra λ = np = 50 × 0, 03 = 1, 5. 4. On cherche p(Z1 6 2). p(Z1 6 2) = p(Z1 = 0) + p(Z1 = 1) + p(Z1 = 2) 1, 51 1, 52 1, 50 + e−1,5 + e−1,5 0! 1! 2! ≈ 0, 223 + 0, 335 + 0, 251 = e−1,5 ≈ 0, 809 L’approximation est de bonne qualité. En effet on trouve une valeur très proche de la précédente. C. Intervalle de confiance Dans cette partie, on considère une grande quantité de pièces devant être livrées à une chaîne d’hypermarchés. On considère un échantillon de 100 pièces prélevées au hasard dans cette livraison. La livraison est assez importante pour que l’on puisse assimiler ce tirage à un tirage avec remise. On constate que 96 pièces sont sans défaut. 1. Donner une estimation ponctuelle de la fréquence inconnue p des pièces de cette livraison qui sont sans aucun défaut. 2. Soit F la variable aléatoire qui, à tout échantillon de 100 pièces prélevées au hasard et avec remise dans cette livraison, associe la fréquence des pièces de cet échantillon qui sont sans défaut. q p(1−p) On suppose que F suit la loi normale de moyenne p et d’écart type 100 , où p est la fréquence inconnue des pièces de la livraison qui sont sans aucun défaut. Déterminez un intervalle de confiance de la fréquence p avec le coefficient de confiance de 95%. Correction : 96 1. Sur l’échantillon, on a une fréquence f = 100 = 0, 96 de pièces sans défauts. L’estimation ponctuelle de la fréquence de pièce de défaut pour l’ensemble de la population est donc p = f = 0, 96. q q p(1−p) 2. l’intervalle de confiance de p avec le coefficient de confiance de 95% est I = p − t p(1−p) ; p + t , 100 100 avec 2Π(t) − 1 = 0, 95, soit t = 1, 96. On en déduit : # " r r 0, 96 × 0, 04 0, 96 × 0, 04 I = 0, 96 − 1, 96 ; 0, 96 + 1, 96 = [0, 9216; 0, 9984] 100 100 Page 7/8 Statistiques Inférentielles - Feuille 2 Je rappelle que la proportion réelle de pièce sans défaut dans la population n’appartient pas forcément à l’intervalle I, mais on a 95% de chances que ce soit le cas. Page 8/8