STAT-I301 Chapitre II: Distributions de probabilités

publicité
STAT-I301
Chapitre II: Distributions de probabilités
Caroline Verhoeven
Je suis aussi
−x 2
1
e 2σ2
p
2πσ2
que tout le monde
Table des matières
1
Introduction
2
Probabilités
3
Variables aléatoires
4
Distribution de probabilité
Variables discrètes
La distribution binomiale
Variables continues
La distribution normale
eamerlogo
Caroline Verhoeven
STAT-I301
2 / 24
1. Introduction
Inférence statistique I
1
échantillonnage
population
µ =?
échantillon
x
Statistique
descriptive
2
inférence
3
Population : l’ensemble des individus qui nous intéressent
Exemple : adultes souffrant de maux de dos,
élèves du secondaire avec un certificat médicale pour le
cours de gym
Echantillon : Partie de la population qu’on étudie vraiment
Hypothèse de la biostatistique : la population est beaucoup plus grande
que l’échantillon
eamerlogo
Caroline Verhoeven
STAT-I301
3 / 24
1. Introduction
Inférence statistique II
1
échantillonnage
population
µ =?
échantillon
x
Statistique
descriptive
2
inférence
3
Inférence statistique : Processus pour généraliser les conclusions
obtenues pour l’échantillon vers la population
Il faut idéalement que l’échantillon soit aléatoire simple, c.-à-d. que tous les
individus de la population aient la même probabilité d’être choisi
eamerlogo
Caroline Verhoeven
STAT-I301
4 / 24
2. Probabilités
Expériences
Exemple 1
J’ai 1000 chanson sur mon iPod
J’appuie sur le bouton “shuffle”
La probabilité d’entendre ma chanson
préférée est de 1/1000
eamerlogo
Caroline Verhoeven
STAT-I301
5 / 24
2. Probabilités
La planche de Galton
Exemple 2
eamerlogo
Caroline Verhoeven
STAT-I301
6 / 24
2. Probabilités
L’aléatoire
Expérience aléatoire : expérience avec 2 ou plusieurs possibilités et
dont les résultat n’est pas connu à l’avance
Exemple : Appuyer sur le bouton “shuffle” de l’iPod
Tester le groupe sanguin
Evénement aleatoire : Evénement qui se réalise ou non à l’issue de
l’expérience aléatoire
Exemple : Ma chanson préférée est jouée par l’iPPod
Le groupe sanguin O
Domaine d’echantillonage : Résultats possibles de l’expérience
aléatoire
Exemple : Les 1000 chansons sur l’ iPod
Les groupes sanguins {O,A,B,AB}
eamerlogo
Caroline Verhoeven
STAT-I301
7 / 24
2. Probabilités
Probabilités : définition
La probabilité d’un événement est la proportion (idéalisée) que
l’événement se produise quand on répète l’expérience encore et
encore dans les mêmes conditions
Remarque 3
La proportion est toujours entre 0 et 1
⇒ la probabilité est entre 0 et 1
eamerlogo
Caroline Verhoeven
STAT-I301
8 / 24
3. Variables aléatoires
Variables aléatoires : Définitions et notations
Une variable aléatoire est une variable dont on ne peut pas prédire
la valeur avant l’expérience aléatoire
Notations X , Y , Z , . . .
Notation pour les valeurs de cette variable : x , y , z , . . .
2 types de variables aléatoires :
Variables aléatoires discrètes : On peut énumérer toutes les valeurs
possibles
Exemple : Le nombre de piles pour 5 lancers d’1 pièce,
le nombre de garçons dans 1 famille de 8 enfants
Variables aléatoires continues : Peut prendre n’importe quelle valeur
dans un intervalle
Exemple : La durée de vie réelle d’une ampoule,
Le taux d’acide urique dans le sang
eamerlogo
Caroline Verhoeven
STAT-I301
9 / 24
4. Distribution de probabilité
1. Variables discrètes
Fonction de probabilité
Exemple 4
Nombre de garçons parmi N = 38495 familles de 8 enfants
xj
0
1
2
3
4
5
6
7
8
nj
161
1152
3951
7603
10263
8498
4948
1635
284
nj′
0,004
0,030
0,103
0,198
0,267
0,221
0,129
0,042
0,007
Vu le nombre de familles, les
proportions nj′ sont une bonne
approximation des probabilité πj
fonction de probabilité : fonction qui
attribue à chaque valeur de la variable
la probabilité d’obtenir cette valeur à
l’issue de l’expérience
eamerlogo
Caroline Verhoeven
STAT-I301
10 / 24
4. Distribution de probabilité
2. La distribution binomiale
Un jeu malhonnête
Exemple 5
On lance une pièce de monnaie 10 fois. Quelle est la probabilité qu’elle
tombe sur pile 1 fois, 2 fois, . . ., 10 fois ?
Un des joueurs n’est pas honnête et a “faussé” la pièce telle que la
probabilité de tomber sur pile à chaque lancer est de 0.3
La probabilité de tomber x fois sur piles au bour de 10 lancers
correspond à une distribution binomiale
eamerlogo
Caroline Verhoeven
STAT-I301
11 / 24
4. Distribution de probabilité
2. La distribution binomiale
Distribution binomiale
On a une distribution biomiale quand :
Le nombre de d’essais, n, est fixe
Les essais sont indépendants l’un de l’autre
La probabilité de succes, π, est le même dans chaque essai
Probabilité d’avoir x succes, chacun avec une probabilité π, en n essais :
à !
n x
b(x;n, π) =
π (1 − π)n−x ,
x
à !
n
n!
=
x
x!(n − x)!
eamerlogo
Caroline Verhoeven
STAT-I301
12 / 24
4. Distribution de probabilité
2. La distribution binomiale
Exemples de distributions binomiales I
Exemple 6
On retourne à notre lancer de pièce monnaie malhonnête (Exemple 5) :
0.20
0.25
probabilité
On a n = 10, π = 0, 3
par exemple : Quelle est la
probabilité d’obtenir 5 piles ? (x = 5)
0.20
0.15
Ã
!
10
b(5;10, 0, 3) =
(0, 3)5 (0, 7)5
5
0.10
0.05
= 0, 103
0 1 2 3 4 5 6 7 8 9 10
nombre de piles
eamerlogo
Caroline Verhoeven
STAT-I301
13 / 24
4. Distribution de probabilité
2. La distribution binomiale
Exemples de distributions binomiales II
Exemple 7
Nombre de garçons parmi N = 38495 familles de 8 enfants
xj
0
1
2
3
4
5
6
7
8
nj
161
1152
3951
7603
10263
8498
4948
1635
284
nj′
0,004
0,030
0,103
0,198
0,267
0,221
0,129
0,042
0,007
πj
0.004
0.031
0.109
0.219
0.273
0.219
0.109
0.031
0.004
Ici : n = 8, π ≈ 0, 5
La probabilité d’avoir 3 garçons (x = 3)
b(3;8, 0, 5) =
à !
8
(0, 5)3 (0, 5)5
3
= 0, 219
eamerlogo
Caroline Verhoeven
STAT-I301
14 / 24
4. Distribution de probabilité
3. Variables continues
Tableau de fréquences
Exemple 8
Nombres aléatoires continus
nombre
184.0286
187.3946
178.3470
175.7662
179.4007
177.8262
182.3469
182.7644
185.0921
173.8282
nj
1
1
1
1
1
1
1
1
1
1
nombre
181.1581
185.6901
175.7819
178.7683
179.6735
179.6033
175.4822
178.9815
172.0980
181.4440
nj
1
1
1
1
1
1
1
1
1
1
nombre
175.0512
176.5793
182.4888
183.3151
182.4265
187.6758
180.1794
169.7284
179.6067
177.8535
nj
1
1
1
1
1
1
1
1
1
1
nombre
186.6979
173.5403
187.4425
175.7290
177.0225
176.9676
176.8623
180.6628
176.5917
180.2790
nj
1
1
1
1
1
1
1
1
1
1
nombre
181.4475
179.6354
177.2676
173.9934
179.2517
173.2632
182.6770
187.9647
174.8772
178.1606
nj
1
1
1
1
1
1
1
1
1
1
10 mesures ⇒ nj′ = 1/10
30 mesures ⇒ nj′ = 1/30
50 mesures ⇒ nj′ = 1/50
Beaucoup de mesures ⇒ nj′ → 0
eamerlogo
Caroline Verhoeven
STAT-I301
15 / 24
4. Distribution de probabilité
3. Variables continues
Probabilité d’une variable continue
La proportion de la mesure devient de plus en plus petite quand on
a de plus en plus de mesures
⇒ La proportion → 0 quand on a beaucoup de mesure
⇒ La probabilité d’obtenir une mesure spécifique est 0
eamerlogo
Caroline Verhoeven
STAT-I301
16 / 24
4. Distribution de probabilité
3. Variables continues
Histogramme
Exemple 9
100000 mesures aléatoires
yj′
yj′
yj′
0,08
0,08
0,08
0,06
0,06
0,06
0,04
0,04
0,04
0,02
0,02
0,02
150 160 170 180 190 200 210
6 classes, Ij = 10
eamerlogo
f (x) 0,08
150 160 170 180 190 200 210
30 classes, Ij = 2
150 160 170 180 190 200 210
60 classes, Ij = 1
0,06
0,04
Ij → dx
0,02
f : densité de probabilité
160 170 180 190 200 210 x
Caroline Verhoeven
STAT-I301
17 / 24
4. Distribution de probabilité
3. Variables continues
Densité de probabilité I
Approximation
′
Plus fine
Densité
′
yj
yj
0,08
0,08
0,06
0,06
0,04
0,04
0,04
0,02
0,02
0,02
150 160 170 180 190 200 210
Proportion des sujets de
mesures 178 à 192
0,08
0,06
150 160 170 180 190 200 210
Proportion de sujets de
mesures 178 à 192
160
170
180
190
200
210
P(178 ≤< X ≤ 192)
eamerlogo
Caroline Verhoeven
STAT-I301
18 / 24
4. Distribution de probabilité
3. Variables continues
Densité de probabilité II
Si X suit une loi avec densité de probabilité f :
P(X ≤ a) =
Za
P(X < ∞) =
f (x)dx
−∞
Z
∞
−∞
P(a ≤ X ≤ b) =
f (x)dx = 1
Zb
a
f (x)dx = P(X ≤ b) − P(X ≤ a)
P(a ≤ X ) = 1 − P(X ≤ a)
eamerlogo
Caroline Verhoeven
STAT-I301
19 / 24
4. Distribution de probabilité
4. La distribution normale
Distribution normale I
Une distribution continue très importante est la distribution normale. Elle
est définie par sa fonction de densité de probabilité
(x −µ)2
1
−
e 2σ2
f (x) = p
2πσ
µ correspond à la moyenne pour la population
σ correspond à la déviation standard de la population
0,08
0,06
µ = 180, σ = 5
µ = 190, σ = 5
0,04
µ = 180, σ = 10
0,02
170 180 190 200 210
eamerlogo
Caroline Verhoeven
STAT-I301
20 / 24
4. Distribution de probabilité
4. La distribution normale
Distribution normale II
Soit X une variable aléatoire continue, si X suit la distribution
normale de paramêtre µ, σ, on notera
X ∼ N(µ, σ2 )
Nous avons que
P(a ≤ X ≤ b) =
Zb
a
p
1
2πσ
e
−
(x −µ)2
2σ2
dx
En particulier :
1.0
0.8
F (x) = P(X ≤ x) =
Zx
−∞
p
1
2πσ
e
(x ′ −µ)2
−
2σ2
F (x)
0.6
dx’
0.4
0.2
160 170 180 190 200 210
x
eamerlogo
Caroline Verhoeven
STAT-I301
21 / 24
4. Distribution de probabilité
4. La distribution normale
Propriétés de la normale
La distribution normale est unimodale
La distribution normale est symétrique : médiane=mode=moyenne
La normale et la déviation standard :
P(µ − σ ≤ X ≤ µ + σ) = 0, 68
P(µ − 1, 96σ ≤ X ≤ µ + 1, 96σ) = 0, 95
P(µ − 2, 58σ ≤ X ≤ µ + 2, 58σ) = 0, 99
eamerlogo
Caroline Verhoeven
STAT-I301
22 / 24
4. Distribution de probabilité
4. La distribution normale
La distribution normale centrée réduite I
BProblème !
Il n’y a pas moyen de calculer l’intégrale
Zb
a
p
1
2πσ
e
−
(x −µ)2
2σ2
dx
On peut utiliser des logiciels ou des tables
Des tables pour chaque µ et σ.... NON
eamerlogo
Caroline Verhoeven
STAT-I301
23 / 24
4. Distribution de probabilité
4. La distribution normale
La distribution normale centrée réduite II
X a une moyenne µ ⇒ Y = aX + b a une moyenne aµ + b
X a une déviation standard σ ⇒ Y = aX + b a une déviation standard
|a|σ
X ∼ N(µ, σ2 ), alors :
Z=
X −µ
a comme moyenne 0
σ
X −µ
Z=
a comme déviation standard 1
σ
X −µ
∼ N(0, 1)
⇒ Z=
σ
La fonction de la loi normale centrée réduite a comme fonction de densité
2
1
ϕ(z) = p e−z /2
2π
et on note
Zz
Φ(z) = P(Z ≤ z) =
ϕ(z ′ )dz ′
−∞
eamerlogo
Caroline Verhoeven
STAT-I301
24 / 24
Téléchargement