Échantillonnage A Loi faible des grands nombres

publicité
chapitre o3
échantillonnage
Échantillonnage
Lorsqu’on étudie un caractère sur une population et que l’effectif de celle-ci est trop grand
pour pouvoir l’étudier sur toute la population, on effectue alors une étude de ce caractère
sur un certain nombre d’échantillons de cette population.
L’échantillonnage consiste à étudier une propriété sur un ensemble d’échantillons
aléatoires (tous les éléments ont été pris au hasard dans la population totale) et de même
taille. Il s’agit de trouver, grâce aux probabilités, un modèle permettant de décrire la série
statistique au mieux à partir d’échantillons.
A Loi faible des grands nombres
Une pièce de monnaie est lancée deux fois seulement. Bien que "Pile" et "Face" aient toutes
deux la même probabilité 0,5, il ne doit pas être considéré comme très surprenant que ces
deux lancers produisent deux "Piles", ou bien alors deux "Faces", au lieu de produire
exactement une fois "Pile" et une fois "Face", comme l'égalité des probabilités de "Pile" et
de "Face" le suggérerait.
Par contre, si la pièce est lancée 1000 fois, on s'attend à ce que le nombre de "Piles" soit
très proche de 500.
Cette intuition est modélisée par la Loi Faible des Grands Nombres. Cette Loi énonce
que si une épreuve est répétée un grand nombre de fois, il devient très improbable que la
moyenne des résultats des n premières épreuves s'écarte sensiblement de l’espérance
du résultat d'une épreuve quand n augmente sans limite, c’est à dire que la moyenne se
stabilise lorsque le nombre des tirages indépendant devient très grand.
Théorème : Loi faible des grands nombres
Soit X1, X2, ...Xn, n variables aléatoires indépendantes ayant même espérance
mathématique m et même écart type σ .
X + X 2 + ...+ X n
Si Mn est une variable aléatoire définie par : M n = 1
, alors :
n
lim P(€M n − m < ε) = 1
quel que soit ε >0,
n→∞
€
Remarque
: lorsque les variables aléatoires X1, X2, ...Xn sont des variables de Bernouilli
€
€ et de même paramètre p, la loi des grands nombres s’exprime par :
indépendantes
quel que soit ε >0,
lim P( Fn − p < ε) = 1
n→∞
Par €
exemple : A est l’événement “Tirer au hasard un garçon dans une classe composée de
18 filles et de€12 garçons”. La probabilité de tomber sur un garçon lors d’un tirage est 0,4.
Imaginons une urne avec 30 boules correspondant aux 30 élèves de la classe et effectuons
200 tirages d’une boule en remettant chaque fois la boule tirée dans l’urne.
->A l’issue des 200 tirages, la fréquence d’apparition d’un garçon est à l’extérieur de
l'intervalle [0,05;0,75] avec une probabilité inférieure ou égale à 0,01.
->A l’issue de 10 000 tirages, la fréquence d’apparition d’un garçon est à l’extérieur de
l'intervalle [0,351;0,449] avec une probabilité inférieure ou égale à 0,01.
1
chapitre o3
échantillonnage
B Théorème de la limite centrée
La loi faible des grands nombres nous a donné une indication sur les paramètres (la
moyenne ou la fréquence) des variables aléatoires Mn et Fn lorsque n est grand. Nous
étudions maintenant les lois de probabilités de ces Variables Aléatoires lorsque n est
grand.
Théorème de la limite centrale : Soit X1, X2,…Xn des variables aléatoires indépendantes,
suivant toutes la même loi, admettant une moyenne m et un écart type σ (σ≠0)
Si n est suffisamment grand, la variable aléatoire X =
approximativement la loi normale N(m ;
X 1 + X 2 + ...+ X n
suit
n
σ
)
n
€
Exemple: L’usine Lavis fabrique des boulons, dont 3% sont défectueux. Je prends au
hasard 100 boulons. Quelle est la€probabilité que j’ai au moins 80 boulons corrects?
Soit (Xn )n∈N des v.a.i de Bernoulli telles que Xi = 1 si et seulement si le i-ème boulon est
n
défectueux. Le paramètre de ces lois est donc p = 0,03. La variable aléatoire Sn = ∑ X i
i=1
compte donc le nombre de boulons défectueux parmi les n premiers piochés.
S
X + X 2 + ...+ X n
La loi faible des grands nombres assure que si n est grand, n = 1
≈ E(X) ,
•
n
n
€
S100
S
≈
3
≈ 0,03
100
et donc
et donc
100
corrects si et seulement si j’ai au
• Revenons à la question posée. J’ai au moins 80 boulons
€
plus 20 boulons défectueux. Donc la probabilité que je cherche à estimer est P(S100≤20).
€
€On s’attend par le point précédent à ce que cette probabilité soit proche de 1 et pour
montrer ceci on va utiliser le théorème central limite:
S100
0,03 × (1− 0,03)
suit une loi normale de moyenne 0,03 et d’écart type
100
100


 S100

100
100
S
− 0,03 ≤ 0,17


P ( S100 ≤ 20 ) = P( 100 − 0,03 ≤ 0,17) = P

0,03(1− 0,03) 
100
 0,03(1− 0,03)  100
P ( S100 ≤ 20 )= P ( Z ≤ 9,96) ≈ 1car Z est une variable€aléatoire centrée réduite. Il suffit alors
€
€
€
de consulter une table de la loi Normale.
€
€
€
€
2
Téléchargement