PACES-UE4-VA et loi de probabilites2013

publicité
03/10/2013
UE 4
Evaluation des méthodes d’analyse appliquées
aux sciences de la vie et de la santé
Statistique
Variables aléatoires
Frédéric Mauny - 27 septembre et 3 octobre 2013
© F. Mauny - UFR SMP – Université de Franche-Comté
1
Plan du cours
1. Variable aléatoire
1. Définition
2. Loi de probabilité et représentation
3. Fonction de répartition
4. Caractéristiques de position/dispersion
5. Opérations sur les variables aléatoires
2. Lois de probabilité usuelles
© F. Mauny - UFR SMP – Université de Franche-Comté
2
1
03/10/2013
VA : définition intuitive
Un couple prévoit d’avoir 3 enfants X=nombre de filles
« Avoir exactement une fille » (X=1)
e
Pr(e)
(GGG)
0,14
(GGF)
0,13
(GFG)
0,13
(GFF)
0,12
(FGG)
0,13
(FGF)
0,12
(FFG)
0,12
(FFF)
0,11
X
Basé sur p(G)=0,52
x
P(x)
0
0,14
1
0,39
2
0,36
3
0,11
Pr(X = 1) ou p(1)
0,13 + 0,13 + 0,13 = 0,39
Une variable aléatoire discrète prend
différentes valeurs xi avec des probabilités
définies par sa loi de probabilité p(x)
© F. Mauny - UFR SMP – Université de Franche-Comté
3
VA : définition formelle
• Soit E un ensemble d’évènements pour lesquels on a défini
une distribution de probabilité (E est un ensemble
probabilisé)
• Une variable aléatoire X est une fonction numérique définie
sur cet espace E
• A chaque evt. élémentaire de E, on fait correspondre un
nombre x selon une règle bien définie (une application de
l’ensemble E dans l’ensemble )
• A chaque sous-ensemble de nombre, on peut attribuer la
probabilité du sous-ensemble de E qui lui correspond
on définit ainsi la distribution de probabilité de la VA
© F. Mauny - UFR SMP – Université de Franche-Comté
4
2
03/10/2013
Caratéristiques d’une VA
• Convention d’écriture : la variable aléatoire X (majuscule),
et la valeur observée x (minuscule)
• Typologie :
– variable aléatoire discontinue (ou discrète)
– variable aléatoire continue : la variable X peut prendre
toutes les valeurs sur un certain intervalle fini ou infini
• Si X et Y sont des VA, alors
– Z=X+Y, Z= X-Y sont des VA
– Z=aX est une VA, a étant une constante réelle
– Z=XY, Z=X/Y sont des VA
– Z=Xn est une VA
© F. Mauny - UFR SMP – Université de Franche-Comté
5
Loi de probabilité, VA discrète
• A chaque valeur xi, on associe une probabilité pi
telle que : pi = Pr(X = xi).
• Ensemble des couples (xi,pi) constitue la loi de
probabilité de la variable discontinue X
• Ex : X : VA « Avoir exactement une fille »
définissant une application de E dans {0,1,2,3}
x
P(x)
0
0,14
1
0,39
2
0,36
3
0,11
© F. Mauny - UFR SMP – Université de Franche-Comté
Tableau des probabilités
6
3
03/10/2013
Représentation graphique
VA discrète
Diagramme des probabilités
– en abscisse : les différentes valeurs de la VA,
classées par ordre de grandeur croissante
– en ordonnée, la probabilité de chaque valeur
Ex X : VA « Avoir exactement une fille »
Probabilité
x
© F. Mauny - UFR SMP – Université de Franche-Comté
7
Représentation graphique
VA continue
• X peut prendre une infinité
de valeurs à l'intérieur de
l'intervalle de variation
• Diagramme remplacé par
une courbe représentant la
fonction de densité de
probabilité f(x), telle que
f(x)dx= Pr(x<X<x+dx)
• Probabilité définie non plus
pour un x mais pour un
intervalle et proportionnelle à
la surface sous la courbe
© F. Mauny - UFR SMP – Université de Franche-Comté
8
4
03/10/2013
Loi de probabilité, VA continue
• La loi de probabilité est déterminée si on connaît
pour tout intervalle [xa, xb], la probabilité que xi soit
comprise entre xa et xb, soit Pr(xa< X <xb).
• Pr(X = xi) non définissable, xi un point parmi une
infinité de points
• Loi de probabilité est continue, on définit la fonction
+∞
f(x), telle que : f(x) ≥ 0 et
∫ f(x)dx=1
−∞
b
• Pr(a< X <b)=∫a f(x)dx
© F. Mauny - UFR SMP – Université de Franche-Comté
9
Fonction de répartition
VA discrète
• Soit X VA discrète, {x1,x2,…, xi, …xn}
• Fonction de répartition de X :
u→F(u)=∑ f(x1)
F(x1)= f(x1)
x1<u
F(x2)= f(x1)+ f(x2)
F(xi)= f(x1)+ f(x2)+...+ f(xi)
F(xn)=1
© F. Mauny - UFR SMP – Université de Franche-Comté
10
5
03/10/2013
Fonction de répartition
VA continue
• Soit X VA continue
• Fonction de répartition de X :
u
u→F(u)= ∫ f(x)dx=Pr(X ≤u)
−∞
D’où,
b
F(b)−F(a)=∫ f(x)dx=Pr(a≤ X ≤b)
a
© F. Mauny - UFR SMP – Université de Franche-Comté
11
Plan du cours
1. Variable aléatoire
1. Définition
2. Loi de probabilité et représentation
3. Fonction de répartition
4. Caractéristiques de position/dispersion
5. Opérations sur les variables aléatoires
2. Lois de probabilité usuelles
© F. Mauny - UFR SMP – Université de Franche-Comté
12
6
03/10/2013
On peut résumer une VA de façon plus
synthétique x par :
• Une caractéristique de position
Espérance mathématique
• Une caractéristique de dispersion
Variance et écart-type
© F. Mauny - UFR SMP – Université de Franche-Comté
13
Espérance mathématique d’une VA
Espérance mathématique notée E(X)
• Soit X une VA discrète
n
E(X)=x1 f(x1)+ x2 f(x2)+...+ f(xn)=∑xi f(xi)
i=1
• Soit X une VA continue
+∞
E(X)= ∫ xf(x)dx
−∞
© F. Mauny - UFR SMP – Université de Franche-Comté
14
7
03/10/2013
Variance et écart-type d’une VA
Dispersion autour de l’espérance mathématique,
notée var(X) ou σ²
Var ( X ) = E [( X − µ )²]
• Si X une VA discrète
n
Var ( X ) = ∑ [xi − E ( X )]² f ( xi )
i =1
Var ( X ) = E ( X ²) − [E ( X )]²
n
Soit
Var ( X ) = ∑ xi2 f ( xi ) − µ ²
i =1
© F. Mauny - UFR SMP – Université de Franche-Comté
15
Variance et écart-type d’une VA
• Si X une VA continue
Var ( X ) =
+∞
2
[
]
x
−
E
(
X
)
f ( x)dx
∫
−∞
Var ( X ) =
+∞
+∞
∫ x² f ( x)dx − ∫ (xf ( x)dx )
2
−∞
=E ( X ²) − [E ( X )]
2
−∞
© F. Mauny - UFR SMP – Université de Franche-Comté
16
8
03/10/2013
Plan du cours
1. Variable aléatoire
1. Définition
2. Loi de probabilité et représentation
3. Fonction de répartition
4. Caractéristiques de position/dispersion
5. Opérations sur les variables aléatoires
2. Lois de probabilité usuelles
© F. Mauny - UFR SMP – Université de Franche-Comté
x=
17
∑x
i
n
Transformation de variable
Soit X une VA, a et b deux constantes
• Y=aX +b est une VA
• E(Y) = a.E(X) + b
• Var(Y)=a² Var(X)
Soit X VA, E(X)= µ et Var(X)=σ²
• Soit Z une VA centrée réduite
Z=
X −µ
σ
© F. Mauny - UFR SMP – Université de Franche-Comté
E (Z ) = 0
Var ( Z ) = 1
18
9
03/10/2013
x=
∑x
i
Plusieurs VA
n
Soit X et Y deux VA
• E(X+Y)=E(X)+E(Y)
• Var(X+Y)=Var(X)+Var(Y)+2cov(X,Y)
• cov(X,Y)= E(XY)-E(X)E(Y)
• Si X et Y sont indépendantes, alors
E(XY)=E(X)E(Y)
© F. Mauny - UFR SMP – Université de Franche-Comté
19
Plan du cours
1. Variable aléatoire
2. Lois (distribution) de probabilité usuelles
1. Lois discrètes
1.
Binomiale
2.
Poisson
2. Lois continues
1.
Normale ou Laplace-Gauss
© F. Mauny - UFR SMP – Université de Franche-Comté
20
10
03/10/2013
x=
∑x
i
Épreuve de Bernouilli
n
VA = expérience à 2 issues
– Sexe (H/F), statut patient (M+/M-, vivant/DCD),
résultat d’un test (T+/T-), enceinte/non enceinte…
Soit X VA, valeurs {0,1}
• p=P(X=1) et q=P(X=0)=1-p
• E(X)=p, Var(X)=pq=p(1-p)
Ex naissance d’une fille
• p=P(X=F)=0,48 et q=P(X=G)=0,52
© F. Mauny - UFR SMP – Université de Franche-Comté
x=
21
∑x
i
Loi Binomiale
n
• Soit Sn une VA : nombre de « succès »
obtenus sur n épreuves de Bernouilli
indépendantes de même probabilité
élémentaire
• Sn : VA quantitative discrète, Sn~B(n,p)
soit k le nombre de succès observés
P(Sn=k)=Ckn pk(1− p)n−k
0
Cn=nn!!=1
k
Cn=k!(nn−!k)!
P(Sn=0)=(1− p)n
• E(Sn)=np, Var(Sn)=np(1-p)=npq
© F. Mauny - UFR SMP – Université de Franche-Comté
22
11
03/10/2013
x=
∑x
i
Loi Binomiale
n
Ex « Avoir une fille parmi 3 enfants »
• n=3 p=0,48 q=(1-p)=0,52
1
2×1 =3
C3=1!(33−!1)!=1×3×
(2×1)
P(Sn=1)=3×0,481×(0,52)2=0,39
© F. Mauny - UFR SMP – Université de Franche-Comté
x=
23
∑x
i
n
Loi Binomiale : distribution
d’une fréquence
• F = la fréquence des succès
F : { 0 , 1 , 2 ,… n }
n n n
n
F = Sn
n
( )
E(F)=E Sn = 1 E(Sn)= 1 np= p
n n
n
1
pq p (1 − p )
 Sn  1
Var ( F ) = Var   = Var ( Sn) = npq =
=
n²
n
n
 n  n²
© F. Mauny - UFR SMP – Université de Franche-Comté
24
12
03/10/2013
x=
∑x
i
Approximation de la loi Binomiale
n
• Si n « grand », utilisation loi Normale
Sn − E (Sn) Sn − np
=
≈ N (0,1)
Var( Sn)
npq
• Moins rapide pour p=0,9 ou p=0,2 que pour
p=0,5
• Approximation convenable si np et nq sont
au moins égaux à 5
• Si p est « très » petit…
Nombre d'accidents provoqués par un vaccin, le nombre
de suicides dans une grande ville, nombre de cancers de
l’enfant…
© F. Mauny - UFR SMP – Université de Franche-Comté
x=
25
∑x
i
Loi de Poisson
n
•
•
•
•
X = nombre d’événements rares
p petit (<0,1) et n grand : 0,2 ≤ np ≤ 8
Alors Sn B(n,p) ≈ loi de Poisson P (np)
X : VA quantitative discrète, X~P(λ)
Valeurs entières positives ou nulles, λ ≥ 0
k
−λ λ
P(X =k)=e
k!
0!=1
P(X =0)=e−λ
• E(X)=Var(X)= λ
© F. Mauny - UFR SMP – Université de Franche-Comté
26
13
03/10/2013
x=
∑x
i
Loi Poisson : exemple
n
Dans le Doubs, on observe en moyenne 2
nouveaux cas par an d’un type particulier de
cancer cérébral.
En 2011, 4 nouveaux cas enregistrés.
Y-a-t-il plus de cas qu’habituellement ?
X ~ P(λ =2)
4
−22 =0,09
P(X =4)=e
4!
Une autre solution pour répondre à la question…
Utilisation de la table des lois de Poisson
© F. Mauny - UFR SMP – Université de Franche-Comté
27
Plan du cours
1. Variable aléatoire
2. Lois (distribution) de probabilité usuelles
1. Lois discrètes
1.
Binomiale
2.
Poisson
2. Lois continues
1.
Normale ou Laplace-Gauss
© F. Mauny - UFR SMP – Université de Franche-Comté
28
14
03/10/2013
Importance de la loi Normale
• Approximation pour d'autres distributions
statistiques quand les effectifs sont assez grands
• Distributions statistiques réelles s'en approchent
fréquemment / si la variabilité est due à des causes
très nombreuses et indépendantes dont les effets
s'additionnent
• Souvent une transformation simple conduit à une
distribution normale
• La moyenne de n variables aléatoires non
gaussiennes indépendantes tend à devenir
gaussienne quand n devient grand.
Théorème central limite énoncé par Laplace
© F. Mauny - UFR SMP – Université de Franche-Comté
29
Loi Normale
• VA continue fonction de densité de probabilité
• X une VA quantitative continue, X~N(µ,σ²)
Si Y=f(X)
−
1
σ 2π e
Y = f(X)=
(x−µ)²
2σ²
• E(X)=µ,Var(X)= σ²
Courbe de densité
de probabilité
© F. Mauny - UFR SMP – Université de Franche-Comté
30
15
03/10/2013
• Si X et Y VA normales, a et b constantes
alors X+b, aX, X+Y sont des VA normales
• Autant de lois normales que de couples (µ,σ²)
• Nécessité de se rapporter à une loi unique pour
calculer la probabilité que X sorte d'un intervalle
donné
• Loi normale centrée réduite Z
X −µ
Z=
σ
E(Z)=0 et Var(Z)= 1
© F. Mauny - UFR SMP – Université de Franche-Comté
-3
-2
-1
31
0
+1
+2
+3
Loi normale centrée réduite
courbe de densité de probabilité
© F. Mauny - UFR SMP – Université de Franche-Comté
32
16
03/10/2013
Utilisation des tables (1)
Table associée à la fonction de répartition
• Donne la probabilité F(u)=P(Z<u)
• Pour les valeurs négatives F(-u)=1-F(u)
• P(a<Z<b)=F(b)-F(a)
P(-1<Z<1)=F(1)-F(-1)
© F. Mauny - UFR SMP – Université de Franche-Comté
33
Utilisation des tables (2)
Table de l’écart réduit
• Donne la probabilité que Z n’appartienne pas [-u ; u]
cad soit z <-u , soit u < z
P(Z<-u)
P(u<Z)
Par définition P(Z<-u)=P(Z>u)
• P(-u<Z<u)=1- (P(Z<-u)+P(Z>u))
P(-1<Z<1)=1-(P(Z>1)+P(-1<Z))
© F. Mauny - UFR SMP – Université de Franche-Comté
34
17
03/10/2013
x=
∑x
i
Loi Normale : exemple
n
En supposant que l’âge de la marche chez l’homme X~N (15,1,5²)
1. Quelle la probabilité qu’un enfant marche avant 18 mois ?
P ( X < 18) = P (
X −µ
σ
<
18 − 15
) = P ( Z < 2)
1,5 = 0,98
Lue dans table associée à
la fonction de répartition
= 1 − P(2 < Z )
Raisonnement à partir de la table de l’écart réduit
2. Quelle la probabilité qu’un enfant marche entre 14 et 16 mois
?
X −µ 16−15
P(14< X <16)=P(14−15 <
<
)
1,5
σ
1, 5
Raisonnement à partir de
la table de l’écart réduit
=P(−0,66<Z <0,66)
= 1 − (P ( Z < −0,66) + P(0,66 < Z ) ) = 0,49
© F. Mauny - UFR SMP – Université de Franche-Comté
35
18
Téléchargement