2ème série Exercices sur les probabilités & distributions de probabilités Exercice 1 : Dans une large population, 35% des individus sont âgés de moins de 21 ans, 45% ont entre 21 et 65 ans, et le reste de la population est âgé de plus de 65 ans. La probabilité de contracter une certaine maladie est 2/100 pour les sujets de moins de 21 ans, de 1/21 pour les sujets entre 21 et 65 ans, et de 1/7 pour les sujets de plus de 65 ans. Si on choisit une personne au hasard dans cette population : a) Calculez la probabilité que cette personne soit âgée de 21 ans ou plus. b) Calculez la probabilité que cette personne ait moins de 21 ans et soit atteinte de la maladie. c) Calculez la probabilité que cette personne soit atteinte de la maladie. d) Les événements « avoir moins de 21 ans » et « être atteint de la maladie » sont-ils indépendants ? NB : Deux événements A et B sont dits indépendants si Pr(A/B)=Pr(A) donc Pr[A ∩ B]= Pr[A] x Pr[B] Définissons tout d’abord les événements suivants : A1= « avoir moins de 21 ans » A2= « avoir entre 21 et 65 ans » A3= « avoir plus de 65 ans » M= « être atteint de la maladie ». L’énoncé du problème nous donne les probabilités suivantes : Pr[A1]=0,35 ; Pr[A2]=0,45 ; Pr[A3]=0,20 ; Pr[M|A1]=2/100 ; Pr[M|A2]=1/21 ; Pr[M|A1]=1/7. a) La probabilité que la personne choisie soit âgée de 21 ans ou plus est égale à : Pr[A2∪ A3]= Pr[A2]+ Pr[A3]= 0,45 + 0,20 = 0,65, Car les deux événements A2 et A3 sont d’intersection vide. b) Il faut calculer la probabilité Pr[A1∩M] = Pr [M/ A1] x Pr(A1) = 2/100 x 0,35 = 0,007 c) On peut écrire Pr[M]= Pr[M /A1] x Pr[A1]+ Pr[M/ A2] x Pr[A2]+ Pr[M/ A3] x Pr[A3]. La probabilité que la personne choisie soit atteinte de la maladie est donc égale à : = 2/100 x 0,35 + 1/21 x 0,45 + 1/7 x 0,20 = 0,057. d) Pour que les deux événements A1= « avoir moins de 21 ans » et M=« être atteint de la maladie » soient indépendants il faut que : Pr[A1 ∩ M]= Pr[A1] x Pr[M] ; ce qui n’est pas le cas ici, car Pr[A1∩M]=0,007 ≠ 0,65 x 0,057. Donc les deux événements ne sont pas indépendants. Remarque On peut utiliser une autre approche pour répondre aux trois premières questions de cet exercice en considérant une population de 100000 personnes, par exemple, et en constituant le tableau suivant à partir des informations sur composition de la population. Age Malade Non malade Total Moins de 21 ans 70 3430 3500 Entre 21 et 65 ans 214 4286 4500 Plus de 56 ans 286 1714 2000 Total 570 9430 10 000 a) Probabilité que cette personne soit âgée de 21 ans ou plus : (4500+2000)/10000=0,65. b) Probabilité que cette personne ait moins de 21 ans et soit atteinte de la maladie : 70/10000=0,007. c) Probabilité que cette personne soit atteinte de la maladie : 570/10000=0,057. Exercice 2 : a- Donnez les valeurs de : - Pr(Z<1,036) : Pour cette exercice j’ai choisi d’utiliser la table bilatérale. Sur la table Bilatérale le α correspondant à Z=1,036 est 0,30. Pour l’exercice, on s’intéresse qu’à la moitié de la partie donnée par la table (α /2) Pr( Z < 1,036) = 1- Pr( Z > 1,036) =1- 0,30/2 = 1- 0,15 = 85% - Pr(Z>1,036) : Pr ( Z > 1,036)= 0,30 ÷ 2= 15% - Pr(Z>1,5) : Pr ( Z > 1,5) = 0,134 ÷ 2 = 0,067 = 6,7% - Pr(Z<3,09) : Pr(Z<3,09) = 1- Pr(Z>3,09) En se référant à la table bilatérale dont vous vous disposez, la probabilité correspondante à Z=3,09 est très faible. C'est-à-dire, Pr(Z<-3,09) + Pr(Z>3,09) = α est faible. Par suite : Pr(Z>3,09) = α /2 est aussi faible En conclusion, Pr(Z<3,09) = 1- Pr(Z>3,09) est proche de 1 donc de 100% - Pr ( -2,35 <Z < -1,09) : Par symétrie, Pr ( -2,35 <Z < -1,09) = Pr(1,09 < Z < 2,35) (Par symétrie) =Pr(Z>1,09) – Pr(Z>2,35) = 0,276/2 – 0,019/2 = 0,138 – 0,0095 = 0,1285= 12,85% b- Trouvez la valeur de Z telle que : - Pr[X > Z]=0,04 Il s’agit de déterminer la valeur Z telle P[X >Z]=α =0,04. Pour α=0,04 au niveau de la table unilatérale de la loi normale centrée réduite, on trouve la valeur Z =1,75 correspondante. Si on utilise la table bilatérale, on cherche le Z correspondant au 2α = 0,08 (à l’intérieur de la table). Donc la valeur Z cherchée est aussi égale à 1,75. - Pr[X > Z]=0,64 Comme Pr[X > Z] > 0,5 alors Z <0. Il s’agit donc de déterminer la valeur Z’ telle que P[X > Z’ ]=1-0,64 = 0,36 On en déduit donc que pour α =0,36 on détermine dans la table la valeur Z’ =0,355 correspondante. Donc la valeur de Z recherchée est égale à -0,355. - P[-Z < X < Z]=0,82 Il s’agit de déterminer la valeur α telle que : Pr[− Z < X < Z] = 1− α =0,82. On en déduit donc que α =0,18 et on détermine dans la table bilatérale la valeur Z=1,34 correspondante. Donc la valeur de Z recherchée est égale à 1,34. - Pr[ Z < X < 3,31]=0,13 Il s’agit de déterminer la valeur Z telle que Pr[ Zα1 < X < Z αα22]=0,13 = α1 − α2 = 0,13 où Z α2 =3,31 et donc α2=0,0005 (sur la table unilatérale). On en déduit que Zα1 =0,13 et donc Z= Zα1 =1,126 ( c’est entre 1,12 et 1,13) Exercice 3: On considère une variable X qui suit une loi normale de moyenne µ=3 et de variance σ²=4. Donner : Pr(X>3) ; Pr(X<4,2) et Pr(1<X<4) La variable X suit N(3,2). Mais on dispose des tables statistiques de la distribution normale centrée réduite càd N(0,1) (de moyenne 0 et d’écart-type 1)). De ce fait, pour calculer ces probabilités demandées, on doit appliquer une transformation linéaire de la variable X à la variable Z =(X-3)/2 • Pr( X > 3) = Pr(Z > (3-3)/2) = Pr(Z>0) = 50% • Pr( X < 4,2)= Pr(Z < (4,2 - 3)/2 = Pr(Z < 0,6) = 1- Pr(Z>0,6)= 1- 0,2743 = 73% • Pr(1 < X <4)= Pr(-1 < Z < 0,5) = 1- Pr( Z > 0,5) - Pr(Z > 1) = 1 – 0,3085 - 01587 = 23% Exercice 4 : Le nombre de cas de malaria chez une population par année suit une loi normale de moyenne 1340 et d’écart-type de 40. 1- Quelle est la probabilité pour une année que le nombre de cas de malaria soit inférieur à 1460. 2- Quel est le nombre maximum de cas de Malaria admissible, si on veut que la proportion de cas ne dépasse pas 25%. 3- Sachant que le nombre de cas cette année a été supérieur à 1300, quelle est la probabilité que le nombre de cas soit compris entre 1260 et 1460 Exercice 5 : a- Une variable suit une loi de Chi2 à 26 ddl, que vaut la probabilité(X<29,25). En lisant sur la table de la loi du ch2, sur la ligne 26, la valeur 29,25 est prise entre 17,3 et 35,6. Donc la probabilité cherchée est comprise entre 10% et 90%. C’est un intervalle très large. Pour cela, on va chercher à la calculer d’une manière plus précise en utilisant d’autres tables (si elles existent) ou un logiciel informatique. Par exemple, en utilisant Excel, on déduit que P(X< 29,25) = 70% b- Une variable suit une loi de Chi2 à 15 ddl, que vaut la probabilité(X>100). Sur la table de chi2 dont on dispose, on remarque que les valeurs de chi2 augmentent pour des probabilités (les valeurs de alpha) de plus en plus petits. Dans notre cas, on peut dire que la probabilité cherchée est très inférieure à 0,005. Plus précisément, en utilisant l’Excel, on trouve que P(X>100) = 1,3 * 10-14 c- Une variable suit une loi de Student à 16 ddl, que vaut la probabilité(X>1,5). En lisant la table de Student, sur la ligne 16, la valeur 1,5 est comprise entre 1,337 et 1,746. Donc P(X>1,5) est entre 0,1 et 0,05 (entre 10% et 5%). Mais d’une manière précise on peut utiliser l’Excel par exemple, on obtient P ( X > 1,5)=0,077 =7,7%. d- Une variable suit une loi de Student à 18 ddl, trouvez a tel que Pr(X>a)=0,01 et Pr(X>a)=0,80. Dans le cours, on dispose d’une table bilatérale. Donc répondre à la question revient à trouver une valeur dans la table bilatérale qui correspond à une probabilité de 0,02 (le double de 0,01) sur la ligne 18. On trouve α=2,552. Pour l’autre question, on procède de même Pr(X > -0,86) = 0,80 Remarque : l’utilisation de la table de student est identique à la loi normale (car elle est aussi symétrique). Il suffit seulement de fixer votre lecture sur la ligne relative au degré de liberté déterminé