Module: Statistiques inférentielles ———————– Enoncés des exercices ———————– Université Paul Sabatier - Toulouse 3 IUT de Toulouse 3 A Département GEA PONSAN Clement Rau [email protected] 1 Variables aléatoires Exercice 1 Le tableau de la loi de probabilité d’un dé truqué à six faces est : i pi 1 0.1 2 0.2 3 0.3 4 0.2 5 0.1 6 0.1 Soit les événements A = {i, i ≤ 4}; B = {i, i ≥ 4}; C = {i, i < 4}. Calculer P[A], P[B], P[C]; P[A ∩ B]; P[A ∩ C]; P[B ∩ C]. Exercice 2 Soit X une variable aléatoire dont la loi de probabilité est donnée par x PX (x) 0 0.1 1 0.3 2 0.4 3 0.1 4 0.05 5 0.05 1. Calculer l’espérance et la variance de X. 2. Déterminer et représenter la fonction de répartition de X 3. Calculer les probabilités P [X < 4] , P [X > 2] , P [3 < X ≤ 4.5] , P [2 ≤ X < 4] , P [2 < X < 4]. 4. Soit Y = 3X − 5. Calculer E(Y ) et V ar(Y ). Exercice 3 On joue avec deux dés à quatre faces. Sur le premier dé, les faces portent les numéros 1, 2, 3 et 3. Sur le deuxième dé, les faces portent les numéros 1, 2, 2 et 2. Deux règles du jeu sont possibles : 1. La partie coûte 1 euro. On lance les deux dés. (a) Si la somme est 2, on gagne 6 euros, (b) Si la somme est 3 ou 4, on gagne 2 euros, (c) Si la somme est 5, on ne gagne rien. 2. La partie coûte 10 euros. On lance les deux dés. (a) Si la somme est 2, on gagne 60 euros, (b) Si la somme est 3 ou 4, on gagne 12 euros, (c) Si la somme est 5, on ne gagne rien. En étudiant l’espérance et l’écart-type de chacun de ces jeux, trouver lequel est le plus intéressant. Exercice 4 Une loterie comporte 20 billets dont 2 gagnants, l’un pour un lot de 100 euros et l’autre pour un lot de 60 euros. On a acheté 3 billets. 1. Calculer les probabilités suivantes en supposant tous les tirages équiprobable : A : ” gagner les 2 lots ” B : ” gagner le lot de 100 euros seulement ” C : ” gagner le lot de 60 euros seulement ” D : ” ne rien gagner ” 2 2. Déterminer la loi de probabilités de la variable aléatoire X qui à tout ensemble de trois billets associe la somme gagnée. 3. Calculer E(X) 4. Le prix de vente du billet étant fixé à E(X)/3, vérifier que la vente des 20 billets permet d’obtenir la somme mise en jeu. Exercice 5 Trois urnes U1 , U2 , U3 contiennent chacune 10 boules supposées indiscernables numérotées de 1 à 10. On tire une boule dans chacune des urnes et on suppose les tirages indépendants. 1. Quelle hypothèse peut-on faire sur les tirages grâce à l’indiscernabilité ? Donner alors la probabilité d’obtenir un 2 à chaque tirage. 2. Soit X la variable aléatoire qui compte le nombre de 5 obtenus lors de cette épreuve de 3 tirages. (a) Exprimer les événements élémentaires de X en fonction des événements Ai : ”Le tirage dans l’urne Ui donne un 5” (i = 1, 2, 3). (b) Donner la loi de X. (c) Calculer l’espérance et la variance de X (en présentant vos calculs sous forme fractionnaire) (d) Donner la fonction de répartition de X et la courbe cumulative associée. (e) Indiquez comment retrouver P[X ≤ 2], P[X = 2] puis P[1 < X ≤ 2] à l’aide de la fonction de répartition. Exercice 6 Soit X et Y deux variables aléatoires à valeurs dans {−1, 0, +1}. La loi du couple (X, Y ) est donnée par le tableau suivant : X|Y −1 0 1 −1 1/5 1/15 1/5 0 0 1/15 0 1 1/5 1/15 1/5 1. Donner les lois marginales de X et de Y . 2. Calculer la covariance du couple (X, Y ). 3. X et Y sont elles indépendantes ? Exercice 7 Dans un atelier textile, la température exprimée en Farenheit, ne s’écarte jamais de plus de 2 degrés de 62 degrés. Plus précisément, la température est une variable aléatoire F de distribution : f P(F = f ) 60 0.05 61 0.25 1. Calculer l’espérance et la variance de F. 3 62 0.4 63 0.25 64 0.05 2. On a décidé de lire la température sur l’échelle des degrés Celcius qui satisfait C = 95 (F − 32). Quelle est l’espérance et la variance de la température exprimée en degrés Celcius ? Exercice 8 On jette 2 dès et on note respectivement X1 et X2 les variables aléatoires ” numéro de la face supérieure ” du dès 1 et 2. On pose Z = max(X1 , X2 ). Déterminer la loi de Z, E(Z) et V ar(Z). 2 Les lois de probabilités discrètes Exercice 1 Une urne contient des boules blanches et des boules noires. La proportion de blanches est p. Les tirages se font avec remise ainsi la proportion de boules blanches ne changent jamais. 1. Soit Y la v.a qui vaut 1, si on tire une boule blanche et 0 sinon. Loi de Y ? E(Y ) ? 2. Soit X la v.a indiquant le nombre de boules noires tirées sur 5 tirages. Quelles sont l’espérance et la variance de cette variable ? Exercice 2 Un automobiliste rencontre sur son trajet 5 feux de circulation tricolores. Pour chacun de ces feux, le rouge dure 15 secondes, l’orange 5 secondes et le vert 40 secondes. Les 5 feux ne sont pas synchronisés et l’on suppose que les aléas de la circulation sont tels que l’état d’un feu devant lequel se présente l’automobile ne dépend pas de l’état des autres feux rencontrés. 1. L’automobile se présente devant un feu. Quelle est la probabilité que ce feu soit vert ? 2. Quelle est la probabilité que sur son trajet, l’automobile rencontre exactement 3 feux verts sur les 5 feux rencontrés ? 3. Soit X la variable aléatoire correspondant au nombre de feux verts rencontrés sur le trajet. Quelle est sa loi de probabilité et son espérance ? Exercice 3 Pour aller à son lycée à vélo, un élève rencontre 6 feux. L’état de chaque feu est indépendant des autres et la probabilité qu’un feu soit vert est 2/3. Un feu orange ou rouge, fait perdre 1 minute 30 secondes à l’élève. Le lycée est situé à 3km du domicile et l’élève roule à 15km/h entre les feux. Soit X le nombre de feux verts rencontrés sur le trajet et T le temps mis par l’élève pour rejoindre le lycée. 1. Loi de X ? 2. Exprimer T en fonction de X. En déduire E(T ). 3. L’élève part 17 minutes avant le début des cours. Est il raisonnable de penser qu’il arrivera à l’heure ? Quelle est la probabilité pour qu’il arrive en retard en cours ? Exercice 4 En 2011, un organisme de sondage indique que 65% des entreprises d’un certain département ont dégagé un bénéfice supérieur à 20000 euros. On considère 300 entreprises de ce département. 1. Quel est l’ordre de grandeur du nombre d’entreprises ayant dégagé un bénéfice supérieur à 20000 euros parmi ces 300 entreprises ? 4 2. Soit Z la v.a indiquant le nombre d’entreprises (sur les 300 choisies) ayant un bénéfice supérieur à 20000 euros. Donner la valeur littérale de P(Z = 195). Calculer E(Z). Exercice 5 On joue à pile ou face. Si on obtient pile, on gagne 1 euro. Si on obtient face, on perd 1 euro. On considère une série de 10 lancers. 1. Si la pièce est non truquée (la probabilité d’avoir pile et la probabilité d’avoir face est la même) : (a) Quelle est la probabilité de gagner 10 euros ? (b) Quelle est l’espérance de gain ? 2. Si la pièce est légérement truquée et tombe sur face dans 60% des cas (a) Quelle est la probabilité de gagner 10 euros ? (b) Quelle est l’espérance de gain ? Exercice 6 On lance 10 fois un dé. Quelle est la probabilité d’avoir 4 fois le 1 ? Exercice 7 Une urne contient 100 boules dont une rouge. 1. On effectue n tirages indépendants avec remise. Quelle est la probabilité d’obtenir au moins une fois la boule rouge ? 2. Combien de tirages indépendants (n) doit-on effectuer pour que cette probabilité soit au moins 0.95 ? 3. Comparer avec l’approximation par une loi de Poisson judicieusement choisie. Exercice 8 Dans un atelier, le nombre d’accidents au cours d’une année est une v.a qui suit une loi de Poisson de paramètre 5. Calculer la probabilité des événements suivants : 1. Il n’y a pas d’accidents au cours d’une année 2. Il y a exactement 4 accidents au cours de l’année 3. Il a plus de 6 accidents au cours de l’année Exercice 9 Dans une fabrication en série, 8% des articles présentent des défauts. Quelle est la probabilités pour que dans un contrôle portant sur 40 articles, il y ait 4 articles défectueux ? Quelle est la probabilité pour qu’il y ait 4 articles défectueux au plus ? Quelle est la probabilités pour qu’il y ait 6 articles défectueux sur un lot de 100 ? Exercice 10 Dans un texte de 1000 lignes on trouve en moyenne 25 erreurs typographiques. Quelle est la probabilité de trouver moins de 4 fautes dans un texte de 100 lignes ? Exercice 11 On considère 4 lettres et 4 enveloppes correspondantes. On met au hasard les 4 lettres dans les enveloppes et on définit une variable aléatoire X comme étant le nombre de lettres qui atteindront leur destinataire. Calculer E(X). 5 Exercice 12 On considère un ascenseur qui dessert k étages d’un immeuble, avec n personnes qui rentrent dans cet ascenseur vide au rez de chaussée. On suppose que chacune de ces personnes, indépendamment des autres, a une probabilités uniforme 1/k de sortir à l’un ou l’autre des étages et on suppose également que personne ne rentre dans l’ascenseur à un étage au dessus du rez de chaussée. 1. Soit j un étage entre 1 et k. Quelle est la probabilité que l’ascenseur s’arrête à l’étage j ? 2. Quelle est l’ espérance du nombre d’arrêts de l’ascenseur ? Exercice 13 On suppose que sur 1000 personnes voyageant par chemin de fer à un instant donné, il y a en moyenne 1 médecin. On suppose que le nombre aléatoire de médecins dans un train suit une loi de Poisson. Quelle est la probabilité de ne trouver aucun médecin ? Un médecin ? Deux médecins ? Cinq médecins ? 3 Approximation de lois Exercice 1 On suppose que le pourcentage moyen de gauchers est de 1%. Soit X la variable aléatoire prenant comme valeurs le nombre de gauchers dans un échantillon de 200 personnes choisies au hasard. Montrer que la loi de X est pratiquement une loi de Poisson dont on précisera la moyenne et la variance. Quelle est la probabilité pour qu’il y ait moins de 4 gauchers dans l’échantillon ? Exercice 2 Si une personne sur 80 est centenaire, calculer la probabilité qu’il y ait au moins un centenaire dans un groupe de 100 personnes prises au hasard ? 4 Quelques mots d’analyse : Intégration Exercice 1 si x < −1 −x − 1 Soit la fonction g définie par g(x) = 0 si − 1 ≤ x ≤ 0 x si 0 ≤ x R −1 R0 R1 R5 Calculer −3 g(x) dx, −1 g(x) dx, 0 g(x) dx et −2 g(x) dx. Vérifier vos résultats à l’aide de calculs d’aires. Exercice 2 Calculer les intégrales suivantes : Z 5 Z 2 1 I1 = x + 1 dx, I2 = (3t + 5 − 4 ) dt, t 2 1 Z 1 −1 I3 = I7 = 0 1 Z I9 = 1 Z 5 t4 e−t dt, I10 = 0 1 6 e 4 Z |x2 − 1| dx, I6 = 5 −4t Z dt, I4 = 1 2 Z |x| dx I5 = Z 1 √ dy, y 2 √ x x dx. 2 Z I8 = 5 6 4 ey dy, ey + 5 1 dt, t ln(t) Exercice 3 R1 Soit I = 0 √ 1 x2 +2 1. Soit f (x) = √ dx. Le but de l’exercice est de calculer I. x2 + 2. Calculez la dérivée de f . 2. Calculer la dérivée de g définie sur [0; 1] par g(x) = ln(x + √ x2 + 2). 3. En déduire I. Exercice 4 Partie A Soit M un réel strictement positif, (amené à être ”grand”). 1. Calculer les intégrales suivantes : Z M dx , I(M ) = x0,9 1 M Z J(M ) = 1 dx , x M Z K(M ) = 1 dx . x1,1 2. Etudier les limites de I, J et K quand M tend vers l’infini. RM 3. Pour tout α réel (α 6= 1), on pose Iα (M ) = 1 xdxα , Calculer Iα (M ) en fonction de α et de M. 4. Pour quelles valeurs de α la limite de Iα (M ) quand M tend vers l’infini est finie ? Partie B Soit un réel strictement positif, (amené à être ”petit”). 1. Calculer les intégrales suivantes : Z 1 dx U () = , 0,9 x Z V () = 1 dx , x Z W () = 1 dx . x1,1 2. Etudier les limites de U, V et W quand tend vers 0. R1 3. Pour tout α réel (α 6= 1), on pose Iα () = xdxα , Calculer Iα () en fonction de α et de . 4. Pour quelles valeurs de α la limite de Iα () quand tend vers zéro est finie ? 5 Loi à densité Exercice 1 0 On donne f (x) = a 0 si x < 0 si 0 ≤ x ≤ 1 si 1 < x 1. Calculer a pour que f soit une densité d’une variable aléatoire X à valeur dans R. 2. Déterminer la fonction de répartition de X 3. Calculer E(X) et Var(X). Exercice 2 Soit f la fonction définie par 0 1+x f (x) = 1−x 0 si x < −1 si − 1 ≤ x ≤ 0 si 0 ≤ x ≤ 1 si 1 < x 7 1. Montrer que f est une densité d’une variable X. 2. Déterminer la fonction de répartition F. 3. Calculer E(X) et Var(X). 4. Pour k > 0, montrer que P(|X| > k) ≤ 1 6k2 . Exercice 3 Inégalités de Bienaymé Tchebychev Soit X une v.a de densité f . Montrer que pour tout λ > 0, P(|X − E(X)| ≥ λ) ≤ V ar(X) . λ2 Remarque 1 Ce type d’inégalité n’est pas propre aux lois à densité. Exo : l’écrire pour une loi discréte. Exercice 4 Soit X une v.a suivant une loi uniforme sur [0; 1]. On pose Y = −2 ln(1 − X). 1. Rappeler la valeur de P(X ≤ a) suivant les valeurs de a. 2. Expliquer rapidement pourquoi Y est une v.a. Préciser les valeurs que peut prendre Y 3. Calculer alors P(Y ≤ t) en fonction de t. 4. Soit h une densité de Y . A l’aide de la question précédente, que doit vérifier h ? Calculer h. Exercice 5 Soient X et Y deux v.a independantes, qui suivent une loi uniforme sur [0; 1]. On pose U = max(X, Y ) et Y = min(X, Y ). 1. U et V sont elles des v.a. Préciser les valeurs qu’elles peuvent prendre. 2. Calculer P(U ≤ t) et P(V ≤ t) en fonction de t. 3. Soit hU [resp. hV ] une densité de U [resp. de V ]. A l’aide de la question précédente, donner une expression de hU et de hV . 4. Faire le même travail avec W = min(X, 1 − X). 6 La loi Normale Exercice 1 Sachant que X suit une loi N (0; 1) calculer à l’aide de la table : 1. P(X < 0, 82) ; P(X < 0, 5) ; P(X > 1, 42) ; P(X < −1, 32) ; P(X > −2, 24) ; P(−1 < X < 1) ; P(−1, 5 < X < 2, 35) 2. Dans chacun des cas, calculer a sachant que X suit une N (0; 1) P(X < a) = 0, 8238 ; P(X > a) = 0, 0632 ; P(X < a) = 0, 0268. Exercice 2 La variable aléatoire X suit une loi normale N (18; 2.5) . Calculer les probabilités suivantes : P(X < 17) ; P(X > 20) ; P(16 < X < 19.5). Exercice 3 X suit une loi N (68; 15). Déterminer a tel que P(X < a) = 0, 8315. 8 Exercice 4 Soit X une variable aléatoire normale N (4; 3) . Calculer les probabilités P(3 < X < 6) et P(X > 10). Exercice 5 Soit X une variable aléatoire telle que N (−1.7; 0.65). Calculer la probabilité P(X < 0) ? Pour quelle valeur de λ a t-on P(|X + 1.7| < λ) = 0.75 ? Exercice 6 Déterminer les paramètres (espérance et écart type) d’une loi normale dont une variable aléatoire X qui suit cette loi, vérifie P(X < 12) = 0, 9772 et P(X < 5) = 0, 0668. Exercice 7 Dans une population masculine, la taille X suit une variable aléatoire normale N (172 cm; 3 cm) . Dans une population féminine comparable, la taille Y suit également un loi normale N (166 cm; 6 cm) . 1. Y a t il plus d’hommes ou de femmes qui mesurent plus de 184 cm ? 2. Quelle est la probabilité qu’une femme mesure plus de 184 cm, sachant qu’elle mesure plus de 180 cm ? Exercice 8 Pour un échantillon de 300 individus sains, on a etudié la glycémie. On a constaté que 20% des glycémie sont inférieures à 0,82 g/l et que 30% des glycémies sont supérieures à 0,98 g/l. Dans ces conditions et en supposant que la glycémie suit une loi normale, déterminer la moyenne et l’écart type de cette loi. Exercice 9 Une usine fabrique des billes de diamètre théorique 8 mm. Les erreurs d’usinage provoquent une variation du diamètre qui est une variable aléatoire normale N (0 mm; 0.015 mm). Lors du contrôle de fabrication on met au rebut les billes qui passent à travers une bague de diamètre 7,98 mm ainsi que celles qui ne passent pas à travers une bague de diamètre 8,02 mm. Quelle est la proportion des billes qui seront rejetées ? Exercice 10 On tire 400 fois à pile ou face avec une pièce de monnaie non biaisée. Soit X le nombre de pile. 1. Indiquer la loi de X. 2. Calculer E(X) et Var(X). 3. On souhaite approximer la loi de X par une loi normale. Est ce légitime ? Quels paramètres doit on choisir pour déterminer cette loi normale ? 4. Calculer P(X > 220) et P(180 < X < 220). 5. Déterminer un intervalle [a; b] centrée en E(X) tel que P(a < X < b) = 0.98. Calculer P(X = 220) et P(X = 190) Exercice 11 Soit X ∼ N (0; 1) et soit Y = −X. Déterminer la loi de Y. Exercice 12 Sachant que la répartition des quotients intellectuels (QI), rapport entre l’âge mental et l’âge réel, d’une personne est une loi normale N (0, 90; 0, 40). 1. Calculer la probabilité à 0,0001 près, qu’une personne prise au hasard (a) ait un QI inférieur à 1 9 (b) ait un QI inférieur à 0,1 (c) ait un QI supérieur à 1,4 (d) ait un QI compris entre 0,8 et 1,3 2. En déduire le nombre de personnes dans un village de 1000 habitants (a) ayant un QI inférieur à 1 (b) ayant un QI inférieur à 0,1 (c) ayant un QI supérieur à 1,4 (d) ayant un QI compris entre 0,8 et 1,3 Exercice 13 On estime que le temps nécessaire à un étudiant pour terminer une épreuve d’examen est une variable normale N (90; 45). 240 candidats se présentent à cet examen 1. Combien d’étudiants termineront l’épreuve en moins de deux heures ? 2. Quelle devrait être la durée de l’épreuve si l’on souhaite que 200 étudiants puissent terminer l’épreuve ? Exercice 14 L’éclairage d’une commune est assuré par 2000 lampes dont la durée de vie moyenne est 1000 heures. Les tests réalisés pour obtenir cette ”espérance de vie” ont montré que la durée de vie des lampes suivait une loi normale d’écart-type estimé à 200 heures. Les services d’entretien de la commune ont besoin pour leur gestion de connaı̂tre 1. Le nombre de lampes hors d’usage au bout de 700 heures. 2. Le nombre de lampes à remplacer entre la 900e et la 1300e heure. 3. Le nombre d’heures qui se seront écoulées pour que 10 % des lampes soient hors d’usage ? 7 Théorème central limite Exercice 1 On lance un dè n fois et on considère la variable aléatoire N=nombre de six. A partir de quelle 1 valeur de n aura-t-on 9 chances sur 10 d’avoir | N n − 6 | < 0, 01 ? Exercice 2 Un restaurant peut servir 75 repas. La pratique montre que 20% des clients ayant réservé ne viennent pas. 1. Le restaurateur accepte 90 réservations. Quelle est la probabilité qu’il se présente plus de 50 clients ? 2. Combien le restaurateur doit-il accepter de réservations pour avoir une probabilité supérieure ou égale à 0,9 de pouvoir servir tous les clients qui se présenteront ? 10 Exercice 3 Une société de transport souhaite lutter contre la fraude et effectue pour cela des contrôles des titres de transport. Julie utilise ce transport tous les matins. Elle a une probabilité p = 0, 08 d’être contrôler. Elle effectue 600 voyages par an. On appelle C la v.a égale au nombre de contrôle effectués sur une année. 1. Quelle est la loi de C ? 2. A l’aide d’une approximation de la loi de C, calculer la probabilité que Julie soit contrôlée entre 40 et 50 fois dans l’année. 3. Sachant que le prix d’un ticket est 1, 2 euros et que le prix de l’amende est 20 euros, quelle est la probabilité que Julie soit ”perdante” en n’achetant jamais de tickets ? Exercice 4 On suppose que la durée de vie d’une ampoule électrique est une v.a qui suit une loi exponentielle de paramètre λ = 0, 2 × 10−3 h−1 . Si l’on remplace une ampoule par une ampoule semblable dès qu’elle ”claque”, quelle est la probabilité qu’au bout de 50 000 heures, l’ampoule en fonctionnement soit au moins la dixième ? Exercice 5 Un joueur lance une pièce équilibrée : lorsqu’il obtient pile, il gagne 100 Euros, lorsqu’il obtient face, il perd 100 Euros. Estimer le nombre maximal de lancers à effectuer pour que ce joueur ait plus de 95 chances sur 100 de perdre au plus 2000 Euros. Exercice 6 On lance 3600 fois un dè. Evaluer la probabilité que le nombre d’apparitions du 1 soit compris entre 540 et 660. Exercice 7 Gestion de stock Un fabricant souhaite lancer une nouvelle console de jeu pour Noël. Les études marketing montrent que parmi les 2000 joueurs de la région, 40% ont déclaré avoir l’intention d’acheter le jeu. On appelle X, la v.a égale au nombre de personnes allant effectivement achetés le jeu. 1. Quelle est la loi de X ? 2. En approximant la loi de X par une loi normale dont on précisera les caractéristiques, déterminer le stock que doit avoir le magasin pour que la probabilité de rupture de stock soit inférieure à 0, 1. 8 Estimation, intervalles de confiance Exercice 1 Avant le second tour d’une élection, opposant les candidats D et G, un institut de sondage interroge au hasard 1000 personnes dans la rue. On note p la proportion d’électeurs décidés à voter pour G dans la population totale et on suppose l’échantillon de personnes intérrogées représentatif. Dans l’échantillon sondé, cette proportion est égale à 0, 54. 1. Peut on proposer un intervalle de confiance pour p avec un risque d’erreur de 5%. (on pourra utiliser l’inégalité de Bien aymé ou le TCL) 2. Combien de personnes faut-il interroger pour donner une fourchette à 1% avec un seuil de 95% ? 11 Exercice 2 Une société s’occupe de la saisie informatique de documents. Pour chaque document, une première saisie est retournée pour vérification au client correspondant. Pour chaque document, le délai de retour de la première saisie vers le client est fixé à deux semaines. On appelle p la probabilité qu’une saisie choisie au hasard soit effectivement retournée au client dans le délai fixé. On note Xn , la v.a qui a tout échantillon de n saisies choisies au hasard, associe le nombre de saisies pour lesquelles le délai n’est pas respecté. 1. Pour estimer p, on effectue une étude statistique. Sur 1250 saisies, 1122 ont été réalisées dans le délai imparti. Proposez une estimation de p à l’aide d’un intervalle de confiance au niveau 95%. On suppose dans la suite de l’exercie que p = 0, 9 2. Quelle est la loi de Xn ? 3. Quel est le nombre moyen de saisies pour lesquelles le délai n’est pas respecté ? 4. Dans cette question uniquement n = 20, calculer P(X20 = 2). 5. Soit Y la v.a qui, à une saisie choisie au hasard, associe le nombre d’erreurs détectées dans cette saisie. On admet que Y ∼ N (30; 8). L’entreprise veut signer une charte qualité qui stipule qu’elle garantie au client qu’au moins 99% des saisies comporte moins de m fautes. Déterminer le plus petit entier m qui rende l’engagement de l’entreprise réaliste. Exercice 3 Discrimination L’ entreprise M.E.C emploie 1350 salariés, dont 560 sont des femmes. Dans une entreprise de 1350 salariés ne faisant pas de discrimination au sexe à l’embauche, donner un intervalle de la proportion de femmes au seuil de 95%. Peut-on raisonnablement dire que l’entreprise M.E.C respecte la parité ? Exercice 4 Afin de mieux gérer les demandes de crédits de clients, un directeur d’agence bancaire réalise une étude relative à la durée de traitement des dossiers, supposée suivre une loi normale. Les données sont résumées ci-dessous : Durée de traitement (min) Effectif 0-10 3 10-20 6 20-30 10 30-40 7 40-50 3 50-60 1 1. Calculer la moyenne et l’écart-type des durées de traitement des dossiers de cet échantillon. 2. Construire des estimations par intervalles de confiances de la moyenne m et l’écart-type σ des durées de traitement des dossiers, au seuil de confiance 90%. Exercice 5 La confiserie Yabon développe de nouveaux bonbons à faible teneur en sucre afin de ménager les dents de ses clients. Le taux de sucre dans les nouveaux bonbons est supposé être distribué selon une loi normale de variance σ 2 . Pour pouvoir commercialiser ses nouveaux bonbons sous le label ”SYMPADENTS”, la confiserie Yabon doit s’assurer que la variabilité du taux de sucre dans ses bonbons est comprise entre 8 et 12. Alors, son responsable contrôle qualité a prélevé un échantillon aléatoire de taille 20 dans un lot de bonbons, et a relevé une variabilité s2 = 10 du taux de sucre dans l’échantillon. 12 1. Donnez un intervalle de confiance au niveau α = 5% de la variabilité du taux de sucre à l’aide de cette mesure. 2. Selon vous, le responsable contrôle qualité peut-il afficher au niveau α = 5% le label ”SYMPADENTS” ? 3. L’échantillon est maintenant de taille 401, et on trouve une variabilité de 10, 6. Donnez un intervalle de confiance au même niveau de seuil. Exercice 6 Intervalle de confiance à l’aide d’une approximation Poissonnienne Afin de mieux satisfaire leurs clients, une grande société fournisseur d’accès internet fait des statistiques sur le nombre d’appels reçus en hotline, elle pourra ainsi évaluer le temps d’attente pour le client et le nombre d’employés à mettre au standard. Les résultats de l’enquête portent sur 200 séquences consécutives de une minute, durant lesquelles le nombre d’appels moyen a été de 3 appels par minute. Pour simplifier, on supposera qu’il y a au plus un appel par unité de temps qui est la seconde. 1. Quelle est la loi de probabilité du nombre d’appels reçus en 4 minutes ? 2. Montrer que l’on peut approcher cette loi par une loi de Poisson. 3. En déduire un intervalle de confiance pour le nombre moyen d’appels en 4 minutes (au seuil 5%). 4. Donnez un intervalle de confiance à l’aide du Théorème central limite. Comparez. 9 Tests statistiques paramétriques Exercice 1 On suppose que moins de 20% de tous les travailleurs sont prêts à moins travailler et à être moins payés pour avoir plus de loisirs personnels. Un sondage aux USA révéle que sur un échantillon de taille 596, 83 personnes étaient prêtes à travailler moins pour un salaire moins important afin d’avoir plus de loisirs personnels. Notons p la ”vraie” proportion de travailleurs prêts à moins travailler et à être moins payés pour avoir plus de loisirs personnels. 1. Testez l’hypothèse H0 :<< p = 20% >> contre H1 :<< p < 20% >> au niveau α = 0, 05. 2. Donnez un intervalle de confiance à 95% pour la vraie proportion p. Exercice 2 Un comptable pense que les problèmes de liquidité d’une entreprise sont une conséquence directe de l’encaissement lent des comptes fournisseurs. Le comptable prétend qu’au moins 70% des comptes fournisseurs datent de plus de deux mois. Un échantillon de 120 comptes fournisseurs a révélé que 88 dataient de plus de deux mois. 1. Quelle est l’estimation ponctuelle de la proportion p de comptes fournisseurs datant de plus de deux mois. 2. Testez l’affirmation du comptable au niveau α = 1%. 3. Donnez un intervalle de confiance à 99% pour la ”vraie” proportion p de comptes fournisseurs datant de plus de deux mois. Exercice 3 Dans une entreprise de conditionnement de colis, chaque employé est supposé, s’occuper de 45 colis par jours. Le chef de service soupçonne un employé Mr Slow, de travailler 13 lentement et il effectue quelques mesures à son insu. Il note, sur une période de 15 jours, le nombre de colis qu’il traite quotidiennement. Il obtient les résultats suivants : 44, 38, 45, 46, 34, 39, 43, 40, 44, 48, 46, 41, 43, 44, 39. Peut on considèrer que Mr Slow, est plus lent que ses collègues de travail (au risque 5%). (On supposera que le nombre de colis traités par un employé suit une loi normale) Exercice 4 Une machine fabrique des pièces dont la longueur suit une loi normale N (µ; σ),où µ et σ sont inconnus. Pour tester l’hypothèse H0 := ”µ = 100 cm” contre H1 := ”µ 6= 100 cm” au risque 5%, on préléve : 1. un échantillon de taille n = 10 et on obtient une moyenne m = 99 cm et un écart-type s = 2 cm. Doit on rejeter H0 ? 2. un échantillon de taille n = 50 et on obtient une moyenne m = 99 cm et un écart-type s = 2 cm. Doit on rejeter H0 ? Exercice 5 Une nouvelle machine dans un procédé de fabrication Un expert prétend qu’en introduisant un nouveau type de machine dans un procédé de fabrication, il peut considérablement diminuer le temps requis pour la production. Si le temps de production n’est pas réduit d’au moins 8%, la direction de l’usine estime qu’en raison des frais d’amortissement, elle ne pourra retenir ce procédé. Lors de six expériences, le temps de production a pu être réduit de 8, 4% en moyenne, avec un écart-type de 0, 32%. Tester au seuil 5%, l’hypothèse selon laquelle le procédé doit être retenu. Exercice 6 Filles et garçons : égaux dès la naissance ? Un échantillon de 429 440 naissances est composé de 221 023 garçons et de 208 417 filles. Tester, au seuil 5%, l’équirépartition des genres à la naissance. 10 Tests statistiques de comparaison Exercice 1 Comparaison variances et moyennes de deux échantillons Pour comparer l’influence du climat sur le nombre de retard dans une entreprise, on considère des entreprises situées dans deux régions A et B (avec un climat différent) et on note sur une année le nombre de retards de chaque entreprises dans chaque région. On obtient : Région A (9 entreprises) 100 94 119 111 113 84 102 107 99 Région B (8 entreprises) 107 115 99 111 114 127 145 140 On admet que les v.a XA et XB , désignant respectivement les nombres de retard sur une année dans la région A et B, suivent des lois normales. 1. Montrer qu’il n’y a pas lieu de penser que XA et XB aient des variances différentes (au seuil 5%). Par la suite, on notera σ 2 cette valeur commune. 14 2. Estimer σ 2 par intervalles de confiance au seuil 95% 3. Montrer que la région A est plus propice à la ponctualité. Exercice 2 Comparaison de moyennes sur échantillons appariés Une société de location de voitures met en place une expérience afin de décider si deux types de pneus sont différents ou non. Onze voitures sont conduites sur un parcours précis avec des pneus de type A. Ceux si sont alors remplacés par des pneus de type B et les voitures sont de nouveau conduites sur le même parcours. Les consommations de carburant en litres/100km des voitures, pour chacun des deux types de pneus A et B, sont des v.a notées XA et XB , et sont supposées suivre des lois normales. L’expérience donne les résultats suivants : XXX XXX Voiture 1 2 3 4 5 6 7 8 9 10 11 XXX Conso XXX XA 4,2 4,7 6,6 7 6,7 4,5 5,7 6 7,4 4,9 6,1 XB 4,1 4,9 6,2 6,9 6,8 4,4 5,7 5,8 6,9 4,9 6 Au niveau de signification 5%, quelle conclusion peut-on retenir ? Exercice 3 Une firme étudie l’influence d’une interruption de travail permettant de prendre un café, sur la productivité de ses ouvriers. Ayant choisi 5 ouvriers au hasard, on mesure leur productivité durant deux jours, le premier sans interruption, le deuxième avec interruption. Quel test faut-il utiliser pour tester l’hypothèse selon laquelle une interruption améliore en moyenne la productivité, au niveau de probabilité de 0.05, (en supposant la productivité est mesurable par un nombre qui suit une loi normale). 11 Test du χ2 Sauf indication contraire, on effectura les tests au risque 5%. Exercice 1 Un jeune homme desoeuvré se poste à la sortie d’une cinéma et observe quels types de films ont vus les garçons et les filles. Il obtient le tableau suivant : XX XXX Type de film XXX XXX Sexe X Garçon Fille Aventures Sentimental 149 51 31 19 Peut on considérer que les garçons et les filles ont la même attitude vis à vis des deux types de films ? Exercice 2 Un épidémiologiste veut montrer que le mois de naissance influe sur l’occurence d’une maladie M. Pour le ”démontrer”, il considère un échantillon de patients atteints de la maladie M et note 15 leur mois de naissance. Il obtient le tableau suivant, Mois de naissance Janvier Février Mars Avril Mai Juin Juillet Août Septembre Octobre Novembre Décembre Effectif 108 103 100 96 95 102 98 103 97 91 110 85 En négligeant les différences de durée entre les mois, que vous inspirent ces données ? Exercice 3 On cherche à comparer les distributions des groupes sanguins dans trois pays P1 , P2 et P3 . Dans ce but, on tire au sort un échantillon de 100 individus dans chaque pays et on relève sur chaque individu son groupe sanguin. On obtient : XX XXGroupe XXX sanguin XXX Pays XX P1 P2 P3 A B 0 AB 50 42 34 8 10 12 40 32 33 2 16 21 A la vue des ces données, peut on considèrer que la distribution des groupes sanguin est différente suivant le pays ? Exercice 4 On a observé pendant deux heures le nombre X de voitures arrivées par minute à un poste de péage. Le tableau suivant contient les valeurs observées xi de cette variable et le nombre d’observations correspondantes Ni . xi Ni 0 4 1 9 2 24 3 25 4 22 5 18 6 6 7 5 8 3 9 2 10 1 11 1 Tester l’adéquation de la loi X à une loi de Poisson dont on estimera le paramètre à partir des données observées. Exercice 5 Un organisme de défense des consommateurs a prélevé au hasard 200 boites de conserve de haricots verts pour tester la validité de l’étiquetage indiquant un poids net égoutté de 560 grammes. La distribution du poids égoutté X en grammes observé, figure dans le tableau suivant : X Ni [530; 540[ 14 [540; 545[ 15 [545; 550[ 29 [550; 555[ 40 16 [555; 560[ 37 [560; 565[ 27 [565; 570[ 20 [570; 580[ 18 Tester l’hypothèse X ∼ N (555; 10). Exercice 6 Le tableau ci-dessous contient les nombres Ni d’apparition des entiers xi (de 0 à 9) dans les 10 000 premières décimales du nombre π. xi Ni 0 968 1 1025 2 1021 3 974 4 1014 5 1045 Tester l’hypothèse d’une répartition uniforme de ces entiers. 17 6 1021 7 970 8 948 9 1014 12 12.1 Annexe Tables Loi Normale N (0; 1) Figure 1 – Table de la fonction de répartition 18 Figure 2 – Table de l’inverse de la fonction de réparition. Lorsque P ≤ 0.5, il faut utiliser la colonne de gauche et la ligne supérieure. (Les fractiles sont négatifs). Lorsque P ≥ 0.5, il faut utiliser la colonne de droite et la ligne inférieure. (Les fractiles sont positifs.) 19 12.2 Table loi du Chi 2 20 12.3 Tables Loi de Student 21 Figure 3 – Table de loi de Student. 22 12.4 Tables Loi de Fisher-Snedecor 23 24