Ecole Nationale Supérieure de Mécanique et des Microtechniques Service de Mathématiques 1ère Année 2006-2007 Travaux Dirigés de Statistique Descriptive et Probabilités 1 Statistique descriptive Variable discrète Exo 1.1: On propose à une population de 115 étudiants une liste de 20 questions. Le caractère étudié est le nombre de réponses exactes. Le dépouillement des résultats a donné la série statistique suivante, dans laquelle ni représente le nombre d’étudiants ayant donné xi réponses exactes. xi ni 4 2 5 0 6 3 7 5 8 7 9 11 10 14 11 18 12 16 13 15 14 10 15 7 16 3 17 1 18 2 19 1 1) (a) Représenter graphiquement cette série statistique. (b) Dresser le tableau des effectifs cumulés croissants et construire la représentation graphique de la fonction de répartition. (c) Combien y-a-t-il d’étudiants ayant répondu correctement à au plus 10 questions? A au plus 15 questions? 2) (a) Calculer la moyenne et l’écart-type de cette série statistique. (b) Calculer le pourcentage d’étudiants dont le nombre de réponses correctes se situe dans un intervalle centré sur la moyenne et d’amplitude : deux écarts-type; même question pour quatre écarts-type. Variable continue Exo 1.2: Une entreprise analyse l’ancienneté de son personnel. Le résultat est représenté par l’histogramme suivant, 5 personnes ont une ancienneté comprise entre 0 et 5 ans ... 25 5 0 5 10 15 25 35 40 ans ENSMM (1ère année) 1) 2) 3) 4) TD Proba & Stat. 2006/2007 Remplir les barres vides. Calculer la moyenne, le mode et la médiane de cette série. Que signifie concrètement chacune des trois valeurs trouvées dans la question précédente? Calculer l’écart-type de cette série. Une étude effectuée dans une autre entreprise de même secteur d’activité a montré que l’ancienneté moyenne du personnel était de 24,5 ans et l’écart-type de 5,13 ans. Que peut-on conclure de la comparaison de ces chiffres entre les deux entreprises? Séries statistiques doubles et ajustement affine Exo 1.3: Sur une période déterminée, la direction commerciale d’une société de construction automobile a étudié, en fonction des informations fournies par n = 55 succursales et agences, l’influence du montant x des ventes de voitures automobile d’une marque concurrentielle (en dizaine de milliers d’euros) sur celui z des ventes de voitures de sa marque (en dizaines de milliers d’euros). On signale que X X X x = 200; z = 240; (xi − x)2 = 90; (zi − z)2 = 128 et (zi − z)(xi − x) = −72. i i i 1) Calculer le coefficient de corrélation linéaire rzx . 2) Peut-on envisager l’existence d’une liaison linéaire entre x et z? 3) Etablir l’équation de la droite z 0 = b + ax par la méthode des moindres carrés. Exo 1.4: Le tableau suivant indique pour chacune des dix dernières années le chiffre d’affaires x (en millions d’euros) réalisé par une entreprise et la somme y (en millions d’euros) consacrée aux dépenses de publicité. Année i 1 2 3 4 5 6 7 8 9 10 xi 16 18 23 24 28 29 26 31 32 34 yi 2 2,4 2,8 2,9 3,2 3,3 3,4 3,6 4,1 4,2 Tous les résultats seront arrondis au millième le plus proche. 1) Tracer, dans un repère orthogonal, le nuage de points associé à cette série statistique. 2) (a) Déterminer, par la méthode des moindres carrés, une équation de la droite de régression de Y en X. (b) Déterminer, par la méthode des moindres carrés, une équation de la droite de régression de X en Y . (c) Tracer, dans le même repère, que celui de la question 1), ces deux droites de régression. 3) Calculer le coefficient r de corrélation linéaire entre X et Y . √ 4) Pour décider si la corrélation est significative, on utilise le nombre A = 1 − 1 − r2 , appelé coefficient d’amélioration, avec la règle suivante : • si A < 0,5 , la corrélation entre X et Y est faible; • si A ≥ 0,5, la corrélation existe entre X et Y . Que concluez-vous dans le cas présent? En utilisant la question 2), estimer le chiffre d’affaires que l’entreprise doit réaliser l’année suivante si elle compte dépenser 4,6 millions d’euros pour la publicité. 2 GSN & MS ENSMM (1ère année) TD Proba & Stat. 2006/2007 Exo 1.5: En chimie on relève à l’instant t positif les quantités x de substance A dans un milieu M , pour six valeurs de t on obtient les résultats suivants : t x 0 5,99 2 4,32 4 3,64 8 3,10 10 3,06 15 3,01 Toutes les valeurs numériques seront arrondies au centième le plus proche. 1) Le plan est rapporté à un repère orthogonal. On pose u = ln(x − 3). Représenter le nuage des six points de coordonnées (t,u). 2) Calculer le coefficient de corrélation linéaire entre t et u. En adoptant la même règle de décision qu’à l’exercice 1.4, que concluez-vous? 3) Déterminer par la méthode des moindres carrés, une équation de la droite de régression de u en t; en déduire l’expression correspondante de x en fonction de t. 2 Probabilités Probabilités élémentaires Exo 2.1: 1) Un circuit électronique particulier est formé de dix éléments identiques installés en série. Chaque élément a une probabilité égale à 0,02 de tomber en panne avant les 1000 premières heures de fonctionnement. Quelle est la probabilité p1 que le circuit tombe en panne pendant les 1000 premières heures? 2) Un autre circuit est composé de n cellules (n ≥ 1) formées de deux éléments identiques aux précédents et montés en parallèle (si bien que le circuit fonctionne dès qu’un élément de chaque cellule fonctionne). (a) Quelle est la probabilité p2 qu’une cellule tombe en panne pendant les 1000 premières heures? (b) Quelle est la probabilité p3 que le circuit tombe en panne pendant les 1000 premières heures? (c) A partir de quelle valeur de l’entier n le second circuit serait moins fiable que le premier? Exo 2.2: Il y a trois machines dans un atelier. En une journée, la première tombe en panne avec la probabilité 0,05, la seconde avec une probabilité 0,10 et la troisième avec la probabilité 0,15. Quelle est la probabilité d’avoir au cours de cette période : 1) Une machine en panne et une seule, 2) Deux machines en panne et deux seulement, 3) Aucune défaillance? Exo 2.3: On fait une enquête sur la voie publique pour connaître les réactions des hommes et des femmes à la vente éventuelle d’une sauce toute préparée. L’enquête porte sur 250 personnes, 50 hommes et 200 femmes. 30 hommes et 60 femmes sont favorables. On ré-interroge une des 250 personnes : 1) Calculer la probabilité que ce soit un homme favorable à la vente. 2) Les événements "être un homme" et "être éventuel acheteur" sont-ils indépendants? 3 GSN & MS ENSMM (1ère année) TD Proba & Stat. 2006/2007 Probabilités conditionnelles - Formule de Bayes Exo 2.4: 1) Soient A et B deux événements dans le même univers de référence. Montrer la formule suivante, dite formule de Bayes : PA (B) = PB (A)P (B) . PB (A)P (B) + PB (A)P (B) 2) Un conducteur sobre a une chance sur 1000 d’avoir un accident de voiture au cours d’une période; une conducteur ivre a une chance sur 50 d’avoir un accident au cours de la même période. On admet qu’un conducteur sur 100 conduit en état d’ivresse. (a) Quelle est la probabilité pour qu’il y ait un accident et que le conducteur soit ivre? (b) Supposons qu’il se produit un accident. Quelle est la probabilité pour que le conducteur soit ivre? Exo 2.5: D’après le nombre de vaccins distribués cette année contre la grippe, on peut estimer que 23% de la population a été vaccinée. Parmi les gens venus se faire soigner à propos de cette grippe, on a pu établir une enquête révélant qu’il y avait 20% de vaccinés. On ne connaît pas la proportion des malades dans la population, mais on sait que parmi les personnes qui n’ont pas été vaccinées, il y a eu 47% de grippés. Quelle a été la proportion de grippés parmi les vaccinés? Variables aléatoires (VA) discrètes et lois de probabilité Exo 2.6: Soit X une V.A. discrète finie munie d’une loi (xk ,pk ). Soit E(X) son espérance mathématique et V (X) sa variance. Montrer que : 1) E est une forme linéaire; 2) V (aX + α) = a2 V (X). Soit F la fonction de répartition de X. 3) Montrer que l’on P (a < X ≤ b) = F (b) − F (a) 4) Calculer P (a ≤ X ≤ b) Exo 2.7: Inégalité de Bienaymé-Tchebychev. Soit l’expérience consistant au jet d’un dé et X la variable aléatoire égale au numéro lu sur la face supérieure. 1) Trouver, en utilisant l’inégalité de Bienaymé-Tchebychev, un majorant de la probabilité de l’événement suivant : "l’écart absolu entre la variable aléatoire et son espérance mathématique est strictement supérieur à 2". 2) Calculer exactement la probabilité de l’événement précédent. Commenter le résultat. Exo 2.8: On considère deux avions, un biréacteur B et un quadriréacteur Q. On suppose que tous les réacteurs de ces avions ont la même probabilité p, de tomber en panne et qu’ils sont indépendant les uns des autres. Appelons X et Y les variables aléatoires suivantes : X : "le nombre de réacteurs de B, tombant en panne" Y "le nombre de réacteurs de Q, tombant en panne" : 1) Etablir les lois de probabilité de X et Y . 4 GSN & MS ENSMM (1ère année) TD Proba & Stat. 2006/2007 2) On estime qu’un avion ne peut achever son vol que si la moitié au moins de ses réacteurs fonctionnent normalement. Soient PB et PQ les probabilités d’un vol réussi respectivement par B et par Q. Calculer PB et PQ en fonction de p. Indiquer selon les valeur de p, celui des deux avions B ou Q qui offre la meilleure sécurité. Exo 2.9: 1) Montrer que si X suit une loi binomiale B(n,p), alors E(X) = np et V (X) = np(1−p). 2) Montrer que dans le cas d’une loi de Poisson P(λ), on a E(X) = V (X) = λ. 3) Soient X et Y deux VA indépendantes telles que X ∈ P(λ1 ) et Y ∈ P(λ2 ). Montrer que la VA X + Y ∈ P(λ1 + λ2 ). Exo 2.10: Approximation d’une loi binomiale par une loi de Poisson. Il a été constaté statistiquement que, sur une chaîne de montage donnée, sur 1000 appareils qui sortent, 5 sont défectueux. 1) En assimilant la fréquence à la probabilité, montrer que la VA donnant le nombre d’appareils défectueux, lorsqu’on prélève successivement 80 appareils dans la chaîne de montage, suit une loi binomiale que l’on précisera. 2) Justifier l’approximation de cette loi par une loi de Poisson que l’on déterminera. Utiliser cette loi de Poisson pour calculer la probabilité des événements suivants : (a) aucun appareil n’est défectueux; (b) deux appareils sont défectueux; (c) plus de deux appareils sont défectueux; (d) moins de cinq appareils sont défectueux. Variables aléatoires continues et loi normale Exo 2.11: Un arrêt de bus est desservi tous les quarts d’heures exacts (i.e. à 8h, 8h15, 8h30 etc). Un usager arrive à l’arrêt à un instant aléatoire uniformément réparti sur 8h-8h30. On modélise son instant d’arrivée par X la variable aléatoire égale au nombre de minutes écoulées depuis 8h au moment de l’arrivée de l’usager à l’arrêt de bus. 1) Avec quelle probabilité l’usager attend-t-il le bus moins de 5 minutes? Un autre usager arrive à l’arrêt Y minutes après 8h, avec Y une variable aléatoire de densité ½ a(30 − y)2 si y ∈ [0,30] g(y) = 0 sinon. 2) Déterminer a et représenter g graphiquement. 3) Quelle est la probabilité que l’usager attende le bus moins de 5 minutes? plus de 10 minutes? Exo 2.12: Loi exponentielle. Soit la fonction définie par ½ −x ae si x ≥ 0 f (x) = 0 sinon où a est une constante réelle. 1) Déterminer a pour que f soit la densité de probabilité d’une VA continue X. 2) Tracer le graphe de la fonction de répartition F de la VA X. 3) Calculer P (1 < X ≤ 2) et P (X ≥ 0). 5 GSN & MS ENSMM (1ère année) TD Proba & Stat. 2006/2007 4) Calculer E(X) et V (X). Lecture de la table de la loi normale Exo 2.13: Le poids X en grammes d’un oeuf produit par un élevage de poules suit une loi normale N (60,3). 1) Calculer P (57 < X < 61). 2) Déterminer x tel que P (X ≤ x) = b pour b = 0,8686, puis pour b = 0,87. 3) Déterminer x0 tel que P (X ≥ x0 ) = 0,6255. Exo 2.14: La différence en mm des mesures faites avec deux appareils différents suit une loi normale. On a constaté que P (X ≤ 0,5) = 0,5517 et P (X ≤ 2,6) = 0,9515. Déterminer les paramètres de cette loi. Somme de lois normales Exo 2.15: Une machine fabrique des résistances électriques dont la valeur en ohms est une VA X qui suit une loi N (100,3). Une seconde machine fabrique des résistances dont la valeur est une VA Y qui suit la loi N (200,4). 1) Quelle est la loi suivie par la résistance obtenue en montant en série deux résistances prélevées au hasard dans les productions respectives de la première et de la seconde machine? 2) Quelle est la probabilité qu’une telle résistance soit comprise entre 290 et 305 ohms? Exo 2.16: Un ascenseur peut supporter une charge de 630 kg. On suppose que les utilisateurs éventuels ont un poids suivant une loi normale de moyenne 75 kg et de variance 256 kg2 . Quel est alors le nombre maximum de personnes que l’on peut autoriser à monter dans l’ascenseur si l’on veut que le risque de surcharge ne dépasse pas 10−3 ? Approximation par une loi normale Exo 2.17: Soit une VA X ∈ B(50; 0,4). 1) Calculer (a) P (X = 20); (b) P (18 ≤ X ≤ 24). 2) Supposons que l’on puisse approcher cette loi binomiale par une loi normale. Préciser cette loi et calculer les probabilités demandées en 1). Exo 2.18: Soit une VA Y ∈ P(25). 1) Calculer P (22 < Y ≤ 29). 2) Supposons que l’on puisse approcher cette loi de Poisson par une loi normale. Préciser cette loi et calculer la probabilité demandée en 1). 6 GSN & MS