Probabilités et Objectifs Introduire les concepts fondamentaux du calcul des probabilités Qu'est-ce qu'une variable aléatoire ? Définir quelques lois élémentaires : ✔ ✔ ✔ Variables aléatoires La théorie des probabilités Probabilités 2 Protocole d’une expérience dont le résultat est aléatoire Reproductibilité {1}–{2}–{3}–{4}–{5}–{6} Catégorie d’épreuves : Collection de tous les résultats Ex : = { 1, 2, 3, 4, 5, 6 } Conditions toujours identiques ✔ Évènement élémentaire Chacun des résultats possibles Ex : L’épreuve du lancer d’un dé a six évènements élémentaires : Épreuve : loi binomiale loi de Poisson loi de Gauss-Laplace Probabilités 1 Étude des phénomènes aléatoires et des lois du hasard La La La Ex : Lancer un dé et relever le chiffre sur la face supérieure Probabilités 3 Évènement : A, B, C, ... Collection d’évènements élémentaires Ex : « Obtenir une face paire » Évènement contraire : A ou non A Il est réalisé quand A ne l’est pas Évènement impossible Il ne peut être réalisé à la suite de l’épreuve Évènement [A et B] ⇔ restriction Si A et B sont réalisés à la fois Évènements incompatibles Ils ne peuvent être réalisés au cours de la même épreuve Évènement [A ou B] ⇔ union Si A, si B, ou si les deux sont réalisés simultanément Probabilités 4 Évènement certain Il se réalise à coup sûr Probabilités 5 Probabilités 6 Trois axiomes : 1. La probabilité d’un évènement est toujours comprise entre 0 et 1 2. Si A et B sont deux évènements incompatibles, alors la probabilité de [A ou B] est égale à la somme des probabilités de A et de B Convention : La probabilité d'un évènement A est notée : Pr(A) Comment calculer une probabilité ? Deux approches : Classique – Mathématique Expérimentale 3. La probabilité de l’évènement certain vaut 1 Probabilités 7 Probabilités 8 Approche classique « Quelle est la probabilité d’obtenir un six lors d’un lancer d’un dé parfait ? » Six évènements élémentaires Approche expérimentale « Quelle est la probabilité d’obtenir un six lors d’un lancer d’un dé parfait ? » Le six est sorti 15 fois sur 100 lancers Contexte équiprobable Une seule face réalise le 6 Pr({6}) = 15 / 100 = 15% Pr({ 6 }) = 1/6 = 16,7% Pr A= Nombre de cas favorables Nombre de cas possibles Probabilités 9 Pr A = = Nombre de réalisations Nombre d ' épreuves fréquence A Probabilités 10 Fréquence Probabilité n∞ Conditions : L’épreuve doit être répétée un grand nombre de fois Toutes les épreuves doivent être réalisées sous les mêmes conditions, suivant même protocole Probabilités 11 Probabilités 12 Les règles d’addition : Évènements compatibles : Pr([A ou B]) = Pr(A) + Pr(B) – Pr([A et B]) Évènements incompatibles : Pr( [A ou B] ) = Pr(A) + Pr(B) ✔ Ex : Lancer d’un dé ✔ ✔ ✔ ✔ A = paire Pr(A) = 1/2 B = {1} Pr(B) = 1/6 Ex : Lancer d’un dé Pr(A) ✔ Pr(B) ✔ ✔ ✔ Pr(C) ✔ =1/2+1/6 A = paire Pr(A) = 1/2 B={≥5} Pr(B) = 1/3 [A et B] = {6} Pr([A et B] )= 1/6 =1/2+1/3-1/6 Pr( [A ou B] ) = Pr( {2, 4, 5, 6} ) = 4/6 Pr( [A ou B] ) = Pr( {1, 2, 4, 6} ) = 4/6 Probabilités 13 Évènements contraires : Pr(A Pr(A ) = 1 - Pr(A) Ex : Lancer d’un dé ✔ ✔ ✔ ✔ ✔ A = paire Pr(A Pr(A) = 1/2 A = impaire Pr(A Pr(A) = 1/2 Pr(A Pr(A) = 1 – ½ = ½ Probabilités 14 Probabilités conditionnelles et évènements indépendants Les compagnies d’assurance déterminent leurs primes en fonction des risques encourus Le risque d’avoir un accident de voiture est de deux pour mille : 2‰ 2‰ =1−Pr A Pr A Pr(A) Probabilités 15 Le montant des primes n’est pas le même pour tous ... Pourquoi ? Probabilités 16 Par contre les « blondes » n’ont pas plus d’accidents que les autres conducteurs « Être blonde » n’est pas un facteur de risque : « Une conductrice blonde court un risque de 2‰ d’avoir un accident de la route » Le risque est indépendant de la couleur des cheveux Un jeune conducteur est impliqué dans dix fois plus d’accidents qu’un conducteur averti L’âge est un facteur à risque : « Le risque qu’un jeune conducteur ait un accident est de 2% » Le risque d’accident est conditionné par l’âge Le risque dépend de l’âge du conducteur Probabilités 17 Probabilités 18 Définition et notation Probabilité conditionnelle Pr(A/B) désigne la probabilité que l’évènement A se réalise sachant que l’évènement B s’est déjà produit Indépendance Règles de multiplication Aphasie Gaucher (G) Dr oitier ( G) Tot al Oui (A) 4 12 16 Non (A) 72 216 288 Tot al 76 228 304 Quelle est la probabilité qu'un enfant gaucher présente un trouble lié au langage ? Pr(A/G) = 4/76 = 0,053 (5,3%) Deux évènements A et B sont indépendants si la réalisation de l'un ne modifie pas la probabilité de l'autre Probabilités 19 Probabilités 20 Aphasie Gaucher (G) Dr oitier ( G) Tot al Aphasie Gaucher (G) Dr oitier ( G) Tot al Oui (A) 4 12 16 Oui (A) 4 12 16 Non (A) 72 216 288 Non (A) 72 216 288 Tot al 76 228 304 Tot al 76 228 304 Quelle est la probabilité qu’un enfant soit aphasique ? Pr(A) = 16/304 = 5,3% ( = Pr(A/G) ) Quelle est la probabilité qu’un enfant soit gaucher et aphasique ? Pr(A et G) = 4/304 = 1,3% = 4/76 × 76/304 ⇒ Indépendants = Pr(A/G) × Pr(G) Probabilités 21 Indépendants : Pr(A/G) = Pr(A) Probabilités 22 Lésion de l'hém isphèr e dr oit Deux évènements A et B sont indépendants si et seulement si Pr(A/B) = Pr(A) et Pr(B/A) = Pr(B) Aphasie Oui (L) Non ( L) Tot al Oui (A) 14 11 25 Non (A) 28 209 237 Tot al 42 220 262 Règle de multiplication : Pr(A et B) = Pr(A) × Pr(B) Probabilités 23 Quelle est la probabilité qu'un enfant qui présente un lésion à l'hémisphère droit développe des troubles du langage ? Pr(A/L) = 14/42 = 0,33 (33%) Probabilités 24 Lésion de l'hém isphèr e dr oit Lésion de l'hém isphèr e dr oit Aphasie Aphasie Oui (L) Non ( L) Tot al Oui (A) 14 11 25 Non (A) 28 209 237 Tot al 42 220 262 Quelle est la probabilité qu’un enfant soit aphasique ? Pr(A) = 25/262 = 9,5 % ( ≠ Pr(A/L) ) Oui (L) Non ( L) Tot al Oui (A) 14 11 25 Non (A) 28 209 237 Tot al 42 220 262 Quelle est la probabilité qu’un enfant présente une lésion et soit aphasique ? Pr(A et L) = 14/262 = 5,3% = 14/42 × 42/262 Dépendants = Pr(A/L) × Pr(L) Probabilités 25 Probabilités 26 Si deux évènements A et B sont dépendants : Les tests de dépistage, d’aptitude « Comment juger le risque d'un déficit intellectuel selon les résultats enregistrés à des tests cognitifs ? » « Quel risque encourt-on d’être porteur d’une maladie si le test de dépistage se révèle positif ? » On a pas directement accès à cette information ! Pr(A et B) = Pr(A/B) × Pr(B) ou Pr(A et B) = Pr(B/A) × Pr(A) Attention ! Indépendance ≠ incompatibilité Probabilités 27 Prévalence de la maladie : Pr(M) Nombre de cas de maladie ou de malades dans une population déterminée Elle s'exprime en nombre de cas pour 100 000 habitants Sensibilité d’un test : Pr(T/M) Probabilité que le test se révèle positif chez un sujet atteint Spécificité d’un test : Pr(T Pr(T/M) Probabilité que le test soit négatif chez un sujet sain Probabilités 29 Probabilités 28 Valeur prédictive positive : Pr(M/T) Risque d’être atteint d’une maladie si le dépistage se révèle positif Comment calculer la VPP : Pr(M/T) ? Pr M et T Pr T /M×Pr M = Pr T Pr T Pr T / M×Pr M = Pr T /M ×Pr MPr T / M×Pr M Pr M /T = Probabilités 30 Exemple : Test de dyslexie Pour différencier la dyslexie d'un simple retard de lecture Pr dys./ P = = Test dyslex ie dyslex ie Positif 56 9 Négatif 14 216 Tot al 70 225 Pr P / dys.×Pr dys. Pr P / dys.×Pr dys.Pr P /dys.×Pr dys. 0,8×0,06 0,8×0,061−0,96×1−0,06 = 0,561=56,1 % Un enfant qui échoue au test de dyslexie a un risque de 56,1% d'être réellement dyslexique Prévalence : Pr(dys.) = 6% (hypothèse) Spécificité : Pr(N/dys .) = 216/225 = 0,96 = 96% Pr(N/dys.) Sensibilité : Pr(P/dys.) = 56/70 = 0,8 = 80% Probabilités 31 Pour une autre prévalence ? Pr(dys.) = 6% VPP = 56,1% Pr(dys.) = 1% VPP = 16,8% Les variables alétoires La prévalence de la maladie joue un rôle prépondérant Même avec une très bonne spécificité et une très bonne sensibilité, le dépistage devient inutile si la maladie a une prévalence est très faible ! Probabilités 33 Probabilités 34 Variable aléatoire : X, Y, … Loi (ou distribution) de probabilité Graphique, table ou formule qui décrit la probabilité associée aux divers évènements d’une variable aléatoire Lancer d’un dé parfait Épreuve dont les évènements élémentaires sont des nombres Discrète (« numérotable ») : ✔ ✔ Lancer un dé Juger du score d'un enfant à un test de lecture 20% Continue (toute valeur d’un intervalle) : ✔ Fa ce 15% Mesurer l'acuité auditive d'un individu Probabilité Probabilités 32 10% 5% Proba . 1 1 /6 2 1 /6 3 1 /6 4 1 /6 5 1 /6 6 1 /6 0% Probabilités 35 1 2 3 4 5 6 Probabilités 36 Paramètres d’une v.a. La loi des grands nombres permet de juger la qualité d'un modèle Ex : En théorie, une face doit apparaître une fois sur 6, mais dans la pratique le hasard dicte ses règles … La comparaison entre les observations et les prévisions du modèle permet de vérifier sa validité, son bien-fondé ! Moyenne Écart type En conclusion … Variable aléatoire + Loi de probabilité = Modèle théorique – Étalon Probabilités 37 Probabilités 38 Les variables aléatoires discrètes La loi Binomiale B(n, p) Elle dépend de deux paramètres n : nombre d’épreuves (d'essais) La loi de probabilité donne l’ensemble des probabilités p1, p2, … associées à chacune des éventualités x1, x2, … pi = Pr( X = xi ) Nombre fini d’épreuves Deux issues possibles 0 ≤ pi ≤ 1 et Σ pi = 1 p : probabilité du succès conditions : Ex : Lancer d’un dé Épreuves indépendantes p constant p1 = p2 = p3 = p4 = p5 = p6 = 1/6 Probabilités 39 Probabilités 40 X ~ B(n, p) compte le nombre de succès sur le total des n épreuves Loi de probabilité : n !×pk ×q n−k Pr X =k = k !×n−k ! k est le nombre de succès q = (1 – p) est la probabilité de l’échec Ex : Fille ou Garçon ? Lors d'une naissance, on a une probabilité de 51% d'avoir un garçon Dans une famille de 4 enfants, quelle est probabilité associée a chacune des configurations fille / garçon ? n=4 p = Pr(Garçon) = 0,51 q = Pr(Fille) = 1 – 0,51 = 0,49 X ~ B(4 ; 0,51) Probabilités 41 Probabilités 42 Pr(FFFF) = Pr(X = 0) 5 configurations sont possibles : 4! ×0,510×0,494 0 !×4 ! = 0,058=5,8 % Pr X =0 = 2 filles et 2 garçons : FFGG 1 fille et 3 garçons : FGGG Quatre filles : FFFF 3 filles et 1 garçon : FFFG Quatre garçons : GGGG X compte le nombre de garçons parmi les quatre enfants Pr(FFFG) = Pr(X = 1) 4! 1 3 ×0,51 ×0,49 1!×3 ! = 0,24=24 % Pr X =1 = Probabilités 43 Pr(GGFF) = Pr(X = 2) Pr X =2= 4! 2 2 ×0,51 ×0,49 =0,375=37,5 % 2!×2 ! Pr(GGGF) = Pr(X = 3) Pr X =3= 4! 3 1 ×0,51 ×0,49 =0,26=26 % 3!×1! Pr(GGGG) = Pr(X = 4) 40% Probabilité Probabilités 44 38% 30% 26% 24% 20% 10% 0% 4! 4 0 Pr X =4= ×0,51 ×0,49 =6,8=6,8 % 4 !×0 ! 7% 6% 0 1 2 Probabilités 45 Paramètres de la B(n, p) Moyenne : μ = n × p Écart type : = (n × p × q) = 0,9998 4 Probabilités 46 Ex : Fille ou garçon Moyenne : μ = 4 × 0,51 = 2,04 Écart type : = (4 × 0,51 × 0,49) 3 Nombre de garçons La loi de Poisson P( P() Modélisation de la survenue d’évènements rares dans le temps et/ou dans l’espace Pharmacovigilance Risque d’une panne d’équipement Elle ne dépend que d’un paramètre : Nombre d’évènements rares qui se produisent en moyenne Probabilités 47 Probabilités 48 Une v.a. de Poisson compte le nombre d’évènements rares qui se produisent X ~ P( P() prend les valeurs 0, 1, …, k, … avec les probabilités Conditions : Les évènements successifs sont indépendants les uns des autres Les évènements sont rares : ✔ La probabilité que deux tels évènements se produisent est très faible Loi de probabilité − Pr X =k =e × Paramètres de P( P() k k! Moyenne : μ = Écart type : = Probabilités 49 Probabilités 50 Avec un risque de 1 par 1 000 000, on compte en moyenne = 0,01 réactions adverses (10 000 × 1/1 000 000) pour les 10 000 premières prescriptions X ~ P(=0,01) N’observer aucun incident n'est pas étonnant et est même très probable : Ex : Pharmacovigilance Aucun réaction indésirable n'est observée sur les 10 000 premières prescriptions d’un médicament Quelle risque encourt-on pour un million de prescriptions ? Il n’est pas nul ! 0 0,01 0! = e−0,01 =0,99=99 % Supposons qu’il soit de une réaction indésirable sur un million de prescriptions −0,01 Pr X=0 = e × Probabilités 51 Probabilités 52 Pour 100 réactions indésirables sur un million ( = 10 000 × 100/1 000 000 = 1) La probabilité de n’observer aucun incident reste assez forte : Pr(X=0) = e -1 = 37% Pour un risque de 1‰ les chances de n'observer aucun incident deviennent très faibles : Pr(X=0) = e -10 = 0,0045% Probabilités 53 Calcul du risque : Le risque maximal admis est celui associé à une probabilité 5% Quand la probabilité de n'observer aucun incident vaut-elle 5% : ✔ Pr(X = 0) = 5% ≈ e -3 ⇔ = 3 Conclusion : Si aucun évènement indésirable n'est enregistré sur N cas, on fixe le risque réel entre 0 et 3/N Probabilités 54 Analogie : Le tronc d’un baobab Les variables aléatoires continues Toutes les valeurs dans un intervalle sont possibles Traitement est très différent de celui des variables aléatoires discrètes ✔ ✔ Le tronc pèse 10 tonnes On le débite en tronçons infiniment fins (d’épaisseur nulle) c’est-à-dire de masse nulle ∑ tranches = tronc = 10 tonnes La loi ne peut plus associer une probabilité à chacune valeur La probabilité d’une valeur précise est toujours nulle Répartition de la masse ⇔ densité Probabilités 55 Probabilités 56 La loi de probabilité d’une v.a. continue s’exprime à partir d’une fonction de densité Les probabilités font référence à des intervalles de valeurs : ✔ ✔ « Quelle est la probabilité de subir une perte auditive entre 10 et 20dB suite à une mauvaise utilisation d'un lecteur MP3 ? » « … supérieure à 35dB ? » Calcul des probabilités : Pr(x1 < X < x2 ) = Aire délimitée par x1 et x2 sous la courbe densité de probabilités Pr(x1< X< x2 ) Probabilités 57 Probabilités 58 La loi normale N( , σ ) Synonymes : Loi de Gauss Loi de Laplace Courbe « en cloche » Elle dépend de deux paramètres : sa moyenne σ : son écart type Probabilités 59 A : = 0 et = 1 B : = 2 et = 1 C : = 0 et = 0.5 Probabilités 60 A : Valeurs trop faibles B : Valeurs normales C : Valeurs trop élevées Applications : Standardisation (tests d'aptitude) ✔ ✔ ✔ Quotient intellectuel, Test de lecture, Test de communication, … Modélisation de paramètres biométriques, biologiques, … ✔ Acuité auditive, Taux de glycémie à jeun, ... Valeurs de référence Étalonnage - Normalisation Probabilités 61 Probabilités 62 Propriétés : Symétrique par rapport à la moyenne Mode = Médiane = Moyenne Décroissance rapide de part et autre de la moyenne Pr(X> Pr(X>μμ)=0,5 )=0,5 Pr(X< Pr(X<μμ)=0,5 )=0,5 Probabilités 63 Quand rencontre-t-on une distribution gaussienne ? Nombreux facteurs de variation (explicatifs) Ex : L'acuité auditive varie en fonction ✔ ✔ ✔ de l'âge De facteurs génétiques des habitudes de vie (MP3, concerts, ...) Les fluctuations dues à ces facteurs sont : ✔ ✔ En tous sens symétrie Indépendantes Probabilités 65 Probabilités 64 La Loi normale centrée et réduite : Si X est une variable aléatoire gaussienne : X ≈ N( ; σ ) Alors la v.a. Z définie par Z = ( X - ) / σ est distribuée selon une loi normale de moyenne 0 et d’écart type 1 : Z ≈ N( 0 ; 1 ) Probabilités 66 Calcul des probabilités : On se ramène à la loi N(0, 1) Exemple : Test de Wechsler (QI) Les scores au test de Wechsler (mesure du QI) sont normalisés. La moyenne des scores est de 100 pour un écart type de 10 1. Quelle est la probabilité d’un score compris entre 100 et 112,6 ? 2. Entre 85 et 115 ? 3. Supérieur à 125 ? 4. Compris entre 75 et 85 ? Pr x 1 X x 2 = Pr x 1− X− x 2− x 1− X− x 2− = Pr = Pr z 1 Z z 2 Probabilités 67 Probabilités 68 Résolution : X ≡ V.A. score au test de Wechsler On se réfère à la table de la N (0, 1) X ≈ N (100 (100,, 10) 10) 1. Pr (100 ≤ X ≤ 112,6) = ? On passe à la V.A. Z ≈ N (0, 1) Pr 100 X112,6 100−100 X −100 112,6−100 10 10 10 = Pr 0Z 1,26 = Pr Probabilités 69 1.26 = 1.2 + 0.06 Probabilités 70 z 0 1 2 3 4 5 6 7 8 9 0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 Probabilités 71 Résolution : 2. Pr (85 ≤ X ≤ 115) = ? Pr 85 X115 85−100 X −100 115−100 = Pr 10 10 10 = Pr −1,50Z 1,50 Probabilités 72 Pr (0 < Z < 1,50) = 0,4332 Pr (-1,50 < Z < 1,50) 0 z z1 = -1.50 x1 = 85 0 z2 = 1.50 100 x2 = 115 Symétrie ⇔ A = B = Pr (-1,50 < Z < 0) + Pr (0 < Z < 1,50) 1 0,3438 1 0,3413 1,1 0,3643 0,3665 1,2 0,3849 0,3869 1,3 0,4032 0,4049 1,4 0,4192 0,4207 1,5 0,4332 0,4345 1,6 0,4452 0,4463 1,7 0,4554 0,4564 = Pr (0 < Z < 1,50) + Pr (0 < Z < 1,50) = 2 × 0,4332 = 0,8664 = 86,64% Probabilités 73 3. Pr (X ≥ 125) = Pr (Z ≥ 2,5) = 0,5 – Pr (0 < Z < 2,5) 38 49 0. 5 0. 0 z = 2.50 100 x =125 z1=-2.50 x1 = 75 Probabilités 75 Exemple : Test de Wechsler (QI) 32 = 43 0. 49 38 0. B = A+ = 6,2‰ 6,2‰ 4. Pr (75< X< X< 85) = Pr (-2,50< Z≤ Z≤ -1,5) -1,5) B = 0,4938 – 0,4332 = 0,0606 = 6,06% B = 0,5 – 0,4938 = 0,0062 A+ Probabilités 74 z Quel score doit obtenir un enfant pour être classé parmis les surdoués : seulement 5% des enfants obtiennent un score aussi élevé ? z2=-1.50 =-1.50 x2 = 85 1,4 3 0,4236 100 Probabilités 76 4 5 0,4251 0,4265 0,4382 0,4394 6 0,4279 1,5 0,4370 1,6 0,4484 1,7 0,4582 0,4591 0,4599 0,4608 1,8 0,4664 0,4671 0,4678 0,4686 0,4495 0,4505 0,4406 0,4515 Pr (0 < Z < z5%) = 0,45 z5% = 1,645 1,645 Probabilités 77 x = 100 + 10 × 1,645 = 116,45 Probabilités 78