I- Loi de Bernoulli Définition : On dira qu`une variable aléatoire X

publicité
PROBABILITÉS EN L. P.
COMPRENDRE UN SONDAGE
I-
Loi de Bernoulli
Définition :
On dira qu’une variable aléatoire X définie sur un espace probabilisé (  , P) suit une loi de Bernoulli de
paramètre p ∈[ 0,1 ] si :
•
P(X = 1) = p
•
P(X = 0) = 1 - p.
Propriété :
Si X suit une loi de Bernoulli de paramètre p ∈[ 0,1 ] , alors :
•
E(X) = p
•
V(X) = p (1 - p)
II-
La loi Normale (ou Loi Gaussienne)
Définition 1 :
On appelle courbe gaussienne, toute fonction définie sur ℝ de la forme :
 m ,v  x  =
2
1
 x – m
exp()
2v
 2 v
Définition 2:
La variable aléatoire X suit une loi normale (ou gaussienne) si :
a
P(X < a) =
∫  m ,v  u du
–∞
Propriété :
Si X est une variable aléatoire qui suit une loi normale, alors :
•
E(X) = m
•
V(X) = v
m∈ℝ , v > 0
 N 0 ; 1
Cas particulier de la loi normale centrée réduite :
0,50
0,45
1 , 0  x  =
2
1
x
exp()
2
2 
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
x
0,00
-3,5
-2,5
-1,5
-0,5
0,5
1,5
2,5
Si X est une variable aléatoire qui suit une loi normale centrée réduite, alors :
•
E(X) = 0
•
V(X) = 1 ; =1
1,20
x
Représentation graphique de F(x) =
1,00
∫ 1, 0 u du
–∞
0,80
0,60
x
-3
-2
-1
-0,5
0
0,5
1
2
0,40
3
0,20
F(x) 0,001 0,023 0,159 0,309 0,500 0,691 0,841 0,977 0,999
0,00
-3,5
-2,5
-1,5
-0,5
0,5
1,5
2,5
3,5
x
P( X ∈[ –  ; ] ) = P( X ∈[ – 1 ;1 ] ) = F(1) – F(-1) = 0,682
P( X ∈[ – 2 ;2 ] ) =P( X ∈[ – 2 ;2 ] ) = F(2) – F(-2) = 0,954
III-
Théorème de la limite centrée
On considère un espace de probabilité (  , P), une variable aléatoire X définie sur  et à valeurs dans
ℝ , l’espace de probabilité ( N , P .⊗N ) décrivant N répétitions indépendantes de (  , P), et X1,...,XN les
variables aléatoires correspondant à X dans chacune des réalisations successives.
De manière plus précise, les variables aléatoires Xi sont définies sur N par Xi(( 1 ,...,  N ))= X(  i ).
Nous ferons l’hypothèse que E(X) et V(X) sont définies et que V  X ≠0 , ce sans quoi les variables
aléatoires considérées sont en fait constantes, et leur étude de peu d’intérêt !
Nous utiliserons dans la suite la notation SN = X1 + ··· + XN
Le théorème de la limite centrale s’énonce alors de la manière suivante : lorsque N tend vers l'infini, la
S N − E S N 
loi de la variable aléatoire
tend vers une loi normale centrée réduite.
V S N 
IV-
Sondage
Le fait que le théorème de la limite centrale permette de préciser l’ordre de grandeur de l’erreur dans la
loi des grands nombres fait qu’il intervient de manière systématique lorsque la loi des grands nombres est
employée pour estimer une certaine quantité.
Pour prendre un exemple très simple, supposons que l’on sonde la population pour déterminer la
proportion p d’individus ayant telle caractéristique particulière. Un modèle très simple de sondage est le
suivant : on interroge N personnes, choisies aléatoirement selon la loi uniforme dans la population
étudiée.
En appelant Xi la variable aléatoire prenant la valeur 1 lors que la réponse à la question posée est «oui», et
0 lorsque celle-ci est «non», les variables X1,...,XN sont alors des variables aléatoires indépendantes,
possédant toutes la loi de Bernoulli de paramètre p.
L’estimation de p obtenue par le sondage est alors égale à
X 1· · ·X N
N
D’après la loi des grands nombres, on s’attend à ce que, typiquement :
X 1… X N
~p
N
lorsque N est grand, et le théorème de la limite centrale affirme que l’erreur d’estimation
X 1· · ·X N
- p est de la forme
N

p .1 – p
× N 0 ; 1
N
On a :
V

p .1 – p
p .1 – p
p .1 – p
×V  N  0; 1  =
×N  0; 1  =
N
N
N
L'écart type est donc égal à :  =

p .1 – p
N
en particulier 2  =

4 p . 1 – p
<
N

1
car p.(1 – p)<0,25
N
D'après les propriétés de la loi normale, on a donc 95% de chance que la variable
dans l'intervalle [ –
1
;
N
1
]
N
Exemples :
- pour N = 500, l'intervalle de confiance est égal à ±4,4 %
- pour N = 1 000, l'intervalle de confiance est égal à ±3,2 %
- pour N = 2 000, l'intervalle de confiance est égal à ±2,2 %
X 1· · ·X N
- p soit
N
Téléchargement