03/10/2013 UE 4 Evaluation des méthodes d’analyse appliquées aux sciences de la vie et de la santé Statistique Variables aléatoires Frédéric Mauny - 27 septembre et 3 octobre 2013 © F. Mauny - UFR SMP – Université de Franche-Comté 1 Plan du cours 1. Variable aléatoire 1. Définition 2. Loi de probabilité et représentation 3. Fonction de répartition 4. Caractéristiques de position/dispersion 5. Opérations sur les variables aléatoires 2. Lois de probabilité usuelles © F. Mauny - UFR SMP – Université de Franche-Comté 2 1 03/10/2013 VA : définition intuitive Un couple prévoit d’avoir 3 enfants X=nombre de filles « Avoir exactement une fille » (X=1) e Pr(e) (GGG) 0,14 (GGF) 0,13 (GFG) 0,13 (GFF) 0,12 (FGG) 0,13 (FGF) 0,12 (FFG) 0,12 (FFF) 0,11 X Basé sur p(G)=0,52 x P(x) 0 0,14 1 0,39 2 0,36 3 0,11 Pr(X = 1) ou p(1) 0,13 + 0,13 + 0,13 = 0,39 Une variable aléatoire discrète prend différentes valeurs xi avec des probabilités définies par sa loi de probabilité p(x) © F. Mauny - UFR SMP – Université de Franche-Comté 3 VA : définition formelle • Soit E un ensemble d’évènements pour lesquels on a défini une distribution de probabilité (E est un ensemble probabilisé) • Une variable aléatoire X est une fonction numérique définie sur cet espace E • A chaque evt. élémentaire de E, on fait correspondre un nombre x selon une règle bien définie (une application de l’ensemble E dans l’ensemble ) • A chaque sous-ensemble de nombre, on peut attribuer la probabilité du sous-ensemble de E qui lui correspond on définit ainsi la distribution de probabilité de la VA © F. Mauny - UFR SMP – Université de Franche-Comté 4 2 03/10/2013 Caratéristiques d’une VA • Convention d’écriture : la variable aléatoire X (majuscule), et la valeur observée x (minuscule) • Typologie : – variable aléatoire discontinue (ou discrète) – variable aléatoire continue : la variable X peut prendre toutes les valeurs sur un certain intervalle fini ou infini • Si X et Y sont des VA, alors – Z=X+Y, Z= X-Y sont des VA – Z=aX est une VA, a étant une constante réelle – Z=XY, Z=X/Y sont des VA – Z=Xn est une VA © F. Mauny - UFR SMP – Université de Franche-Comté 5 Loi de probabilité, VA discrète • A chaque valeur xi, on associe une probabilité pi telle que : pi = Pr(X = xi). • Ensemble des couples (xi,pi) constitue la loi de probabilité de la variable discontinue X • Ex : X : VA « Avoir exactement une fille » définissant une application de E dans {0,1,2,3} x P(x) 0 0,14 1 0,39 2 0,36 3 0,11 © F. Mauny - UFR SMP – Université de Franche-Comté Tableau des probabilités 6 3 03/10/2013 Représentation graphique VA discrète Diagramme des probabilités – en abscisse : les différentes valeurs de la VA, classées par ordre de grandeur croissante – en ordonnée, la probabilité de chaque valeur Ex X : VA « Avoir exactement une fille » Probabilité x © F. Mauny - UFR SMP – Université de Franche-Comté 7 Représentation graphique VA continue • X peut prendre une infinité de valeurs à l'intérieur de l'intervalle de variation • Diagramme remplacé par une courbe représentant la fonction de densité de probabilité f(x), telle que f(x)dx= Pr(x<X<x+dx) • Probabilité définie non plus pour un x mais pour un intervalle et proportionnelle à la surface sous la courbe © F. Mauny - UFR SMP – Université de Franche-Comté 8 4 03/10/2013 Loi de probabilité, VA continue • La loi de probabilité est déterminée si on connaît pour tout intervalle [xa, xb], la probabilité que xi soit comprise entre xa et xb, soit Pr(xa< X <xb). • Pr(X = xi) non définissable, xi un point parmi une infinité de points • Loi de probabilité est continue, on définit la fonction +∞ f(x), telle que : f(x) ≥ 0 et ∫ f(x)dx=1 −∞ b • Pr(a< X <b)=∫a f(x)dx © F. Mauny - UFR SMP – Université de Franche-Comté 9 Fonction de répartition VA discrète • Soit X VA discrète, {x1,x2,…, xi, …xn} • Fonction de répartition de X : u→F(u)=∑ f(x1) F(x1)= f(x1) x1<u F(x2)= f(x1)+ f(x2) F(xi)= f(x1)+ f(x2)+...+ f(xi) F(xn)=1 © F. Mauny - UFR SMP – Université de Franche-Comté 10 5 03/10/2013 Fonction de répartition VA continue • Soit X VA continue • Fonction de répartition de X : u u→F(u)= ∫ f(x)dx=Pr(X ≤u) −∞ D’où, b F(b)−F(a)=∫ f(x)dx=Pr(a≤ X ≤b) a © F. Mauny - UFR SMP – Université de Franche-Comté 11 Plan du cours 1. Variable aléatoire 1. Définition 2. Loi de probabilité et représentation 3. Fonction de répartition 4. Caractéristiques de position/dispersion 5. Opérations sur les variables aléatoires 2. Lois de probabilité usuelles © F. Mauny - UFR SMP – Université de Franche-Comté 12 6 03/10/2013 On peut résumer une VA de façon plus synthétique x par : • Une caractéristique de position Espérance mathématique • Une caractéristique de dispersion Variance et écart-type © F. Mauny - UFR SMP – Université de Franche-Comté 13 Espérance mathématique d’une VA Espérance mathématique notée E(X) • Soit X une VA discrète n E(X)=x1 f(x1)+ x2 f(x2)+...+ f(xn)=∑xi f(xi) i=1 • Soit X une VA continue +∞ E(X)= ∫ xf(x)dx −∞ © F. Mauny - UFR SMP – Université de Franche-Comté 14 7 03/10/2013 Variance et écart-type d’une VA Dispersion autour de l’espérance mathématique, notée var(X) ou σ² Var ( X ) = E [( X − µ )²] • Si X une VA discrète n Var ( X ) = ∑ [xi − E ( X )]² f ( xi ) i =1 Var ( X ) = E ( X ²) − [E ( X )]² n Soit Var ( X ) = ∑ xi2 f ( xi ) − µ ² i =1 © F. Mauny - UFR SMP – Université de Franche-Comté 15 Variance et écart-type d’une VA • Si X une VA continue Var ( X ) = +∞ 2 [ ] x − E ( X ) f ( x)dx ∫ −∞ Var ( X ) = +∞ +∞ ∫ x² f ( x)dx − ∫ (xf ( x)dx ) 2 −∞ =E ( X ²) − [E ( X )] 2 −∞ © F. Mauny - UFR SMP – Université de Franche-Comté 16 8 03/10/2013 Plan du cours 1. Variable aléatoire 1. Définition 2. Loi de probabilité et représentation 3. Fonction de répartition 4. Caractéristiques de position/dispersion 5. Opérations sur les variables aléatoires 2. Lois de probabilité usuelles © F. Mauny - UFR SMP – Université de Franche-Comté x= 17 ∑x i n Transformation de variable Soit X une VA, a et b deux constantes • Y=aX +b est une VA • E(Y) = a.E(X) + b • Var(Y)=a² Var(X) Soit X VA, E(X)= µ et Var(X)=σ² • Soit Z une VA centrée réduite Z= X −µ σ © F. Mauny - UFR SMP – Université de Franche-Comté E (Z ) = 0 Var ( Z ) = 1 18 9 03/10/2013 x= ∑x i Plusieurs VA n Soit X et Y deux VA • E(X+Y)=E(X)+E(Y) • Var(X+Y)=Var(X)+Var(Y)+2cov(X,Y) • cov(X,Y)= E(XY)-E(X)E(Y) • Si X et Y sont indépendantes, alors E(XY)=E(X)E(Y) © F. Mauny - UFR SMP – Université de Franche-Comté 19 Plan du cours 1. Variable aléatoire 2. Lois (distribution) de probabilité usuelles 1. Lois discrètes 1. Binomiale 2. Poisson 2. Lois continues 1. Normale ou Laplace-Gauss © F. Mauny - UFR SMP – Université de Franche-Comté 20 10 03/10/2013 x= ∑x i Épreuve de Bernouilli n VA = expérience à 2 issues – Sexe (H/F), statut patient (M+/M-, vivant/DCD), résultat d’un test (T+/T-), enceinte/non enceinte… Soit X VA, valeurs {0,1} • p=P(X=1) et q=P(X=0)=1-p • E(X)=p, Var(X)=pq=p(1-p) Ex naissance d’une fille • p=P(X=F)=0,48 et q=P(X=G)=0,52 © F. Mauny - UFR SMP – Université de Franche-Comté x= 21 ∑x i Loi Binomiale n • Soit Sn une VA : nombre de « succès » obtenus sur n épreuves de Bernouilli indépendantes de même probabilité élémentaire • Sn : VA quantitative discrète, Sn~B(n,p) soit k le nombre de succès observés P(Sn=k)=Ckn pk(1− p)n−k 0 Cn=nn!!=1 k Cn=k!(nn−!k)! P(Sn=0)=(1− p)n • E(Sn)=np, Var(Sn)=np(1-p)=npq © F. Mauny - UFR SMP – Université de Franche-Comté 22 11 03/10/2013 x= ∑x i Loi Binomiale n Ex « Avoir une fille parmi 3 enfants » • n=3 p=0,48 q=(1-p)=0,52 1 2×1 =3 C3=1!(33−!1)!=1×3× (2×1) P(Sn=1)=3×0,481×(0,52)2=0,39 © F. Mauny - UFR SMP – Université de Franche-Comté x= 23 ∑x i n Loi Binomiale : distribution d’une fréquence • F = la fréquence des succès F : { 0 , 1 , 2 ,… n } n n n n F = Sn n ( ) E(F)=E Sn = 1 E(Sn)= 1 np= p n n n 1 pq p (1 − p ) Sn 1 Var ( F ) = Var = Var ( Sn) = npq = = n² n n n n² © F. Mauny - UFR SMP – Université de Franche-Comté 24 12 03/10/2013 x= ∑x i Approximation de la loi Binomiale n • Si n « grand », utilisation loi Normale Sn − E (Sn) Sn − np = ≈ N (0,1) Var( Sn) npq • Moins rapide pour p=0,9 ou p=0,2 que pour p=0,5 • Approximation convenable si np et nq sont au moins égaux à 5 • Si p est « très » petit… Nombre d'accidents provoqués par un vaccin, le nombre de suicides dans une grande ville, nombre de cancers de l’enfant… © F. Mauny - UFR SMP – Université de Franche-Comté x= 25 ∑x i Loi de Poisson n • • • • X = nombre d’événements rares p petit (<0,1) et n grand : 0,2 ≤ np ≤ 8 Alors Sn B(n,p) ≈ loi de Poisson P (np) X : VA quantitative discrète, X~P(λ) Valeurs entières positives ou nulles, λ ≥ 0 k −λ λ P(X =k)=e k! 0!=1 P(X =0)=e−λ • E(X)=Var(X)= λ © F. Mauny - UFR SMP – Université de Franche-Comté 26 13 03/10/2013 x= ∑x i Loi Poisson : exemple n Dans le Doubs, on observe en moyenne 2 nouveaux cas par an d’un type particulier de cancer cérébral. En 2011, 4 nouveaux cas enregistrés. Y-a-t-il plus de cas qu’habituellement ? X ~ P(λ =2) 4 −22 =0,09 P(X =4)=e 4! Une autre solution pour répondre à la question… Utilisation de la table des lois de Poisson © F. Mauny - UFR SMP – Université de Franche-Comté 27 Plan du cours 1. Variable aléatoire 2. Lois (distribution) de probabilité usuelles 1. Lois discrètes 1. Binomiale 2. Poisson 2. Lois continues 1. Normale ou Laplace-Gauss © F. Mauny - UFR SMP – Université de Franche-Comté 28 14 03/10/2013 Importance de la loi Normale • Approximation pour d'autres distributions statistiques quand les effectifs sont assez grands • Distributions statistiques réelles s'en approchent fréquemment / si la variabilité est due à des causes très nombreuses et indépendantes dont les effets s'additionnent • Souvent une transformation simple conduit à une distribution normale • La moyenne de n variables aléatoires non gaussiennes indépendantes tend à devenir gaussienne quand n devient grand. Théorème central limite énoncé par Laplace © F. Mauny - UFR SMP – Université de Franche-Comté 29 Loi Normale • VA continue fonction de densité de probabilité • X une VA quantitative continue, X~N(µ,σ²) Si Y=f(X) − 1 σ 2π e Y = f(X)= (x−µ)² 2σ² • E(X)=µ,Var(X)= σ² Courbe de densité de probabilité © F. Mauny - UFR SMP – Université de Franche-Comté 30 15 03/10/2013 • Si X et Y VA normales, a et b constantes alors X+b, aX, X+Y sont des VA normales • Autant de lois normales que de couples (µ,σ²) • Nécessité de se rapporter à une loi unique pour calculer la probabilité que X sorte d'un intervalle donné • Loi normale centrée réduite Z X −µ Z= σ E(Z)=0 et Var(Z)= 1 © F. Mauny - UFR SMP – Université de Franche-Comté -3 -2 -1 31 0 +1 +2 +3 Loi normale centrée réduite courbe de densité de probabilité © F. Mauny - UFR SMP – Université de Franche-Comté 32 16 03/10/2013 Utilisation des tables (1) Table associée à la fonction de répartition • Donne la probabilité F(u)=P(Z<u) • Pour les valeurs négatives F(-u)=1-F(u) • P(a<Z<b)=F(b)-F(a) P(-1<Z<1)=F(1)-F(-1) © F. Mauny - UFR SMP – Université de Franche-Comté 33 Utilisation des tables (2) Table de l’écart réduit • Donne la probabilité que Z n’appartienne pas [-u ; u] cad soit z <-u , soit u < z P(Z<-u) P(u<Z) Par définition P(Z<-u)=P(Z>u) • P(-u<Z<u)=1- (P(Z<-u)+P(Z>u)) P(-1<Z<1)=1-(P(Z>1)+P(-1<Z)) © F. Mauny - UFR SMP – Université de Franche-Comté 34 17 03/10/2013 x= ∑x i Loi Normale : exemple n En supposant que l’âge de la marche chez l’homme X~N (15,1,5²) 1. Quelle la probabilité qu’un enfant marche avant 18 mois ? P ( X < 18) = P ( X −µ σ < 18 − 15 ) = P ( Z < 2) 1,5 = 0,98 Lue dans table associée à la fonction de répartition = 1 − P(2 < Z ) Raisonnement à partir de la table de l’écart réduit 2. Quelle la probabilité qu’un enfant marche entre 14 et 16 mois ? X −µ 16−15 P(14< X <16)=P(14−15 < < ) 1,5 σ 1, 5 Raisonnement à partir de la table de l’écart réduit =P(−0,66<Z <0,66) = 1 − (P ( Z < −0,66) + P(0,66 < Z ) ) = 0,49 © F. Mauny - UFR SMP – Université de Franche-Comté 35 18