Échantillonnage
Lorsqu’on étudie un caractère sur une population et que l’effectif de celle-ci est trop grand
pour pouvoir l’étudier sur toute la population, on effectue alors une étude de ce caractère
sur un certain nombre d’échantillons de cette population.
L’échantillonnage consiste à étudier une propriété sur un ensemble d’échantillons
aléatoires (tous les éléments ont été pris au hasard dans la population totale) et de même
taille. Il s’agit de trouver, grâce aux probabilités, un modèle permettant de décrire la série
statistique au mieux à partir d’échantillons.
A Loi faible des grands nombres
Une pièce de monnaie est lancée deux fois seulement. Bien que "Pile" et "Face" aient toutes
deux la même probabilité 0,5, il ne doit pas être considéré comme très surprenant que ces
deux lancers produisent deux "Piles", ou bien alors deux "Faces", au lieu de produire
exactement une fois "Pile" et une fois "Face", comme l'égalité des probabilités de "Pile" et
de "Face" le suggérerait.
Par contre, si la pièce est lancée 1000 fois, on s'attend à ce que le nombre de "Piles" soit
très proche de 500.
Cette intuition est modélisée par la Loi Faible des Grands Nombres. Cette Loi énonce
que si une épreuve est répétée un grand nombre de fois, il devient très improbable que la
moyenne des résultats des n premières épreuves s'écarte sensiblement de l’espérance
du résultat d'une épreuve quand n augmente sans limite, c’est à dire que la moyenne se
stabilise lorsque le nombre des tirages indépendant devient très grand.
Théorème : Loi faible des grands nombres
Soit X1, X2, ...Xn, n variables aléatoires indépendantes ayant même espérance
mathématique m et même écart type
σ
.
Si Mn est une variable aléatoire définie par :
Mn=X1+X2+...+Xn
n
, alors :
quel que soit
ε
>0,
lim
n→∞
P(Mnm<
ε
)=1
Remarque : lorsque les variables aléatoires X1, X2, ...Xn sont des variables de Bernouilli
indépendantes et de même paramètre p, la loi des grands nombres s’exprime par :
quel que soit
ε
>0,
lim
n→∞
P(Fnp<
ε
)=1
Par exemple : A est l’événement “Tirer au hasard un garçon dans une classe composée de
18 filles et de 12 garçons”. La probabilité de tomber sur un garçon lors d’un tirage est 0,4.
Imaginons une urne avec 30 boules correspondant aux 30 élèves de la classe et effectuons
200 tirages d’une boule en remettant chaque fois la boule tirée dans l’urne.
->A l’issue des 200 tirages, la fréquence d’apparition d’un garçon est à l’extérieur de
l'intervalle [0,05;0,75] avec une probabilité inférieure ou égale à 0,01.
->A l’issue de 10 000 tirages, la fréquence d’apparition d’un garçon est à l’extérieur de
l'intervalle [0,351;0,449] avec une probabilité inférieure ou égale à 0,01.
chapitre o3 échantillonnage
1
B Théorème de la limite centrée
La loi faible des grands nombres nous a donné une indication sur les paramètres (la
moyenne ou la fréquence) des variables aléatoires Mn et Fn lorsque n est grand. Nous
étudions maintenant les lois de probabilités de ces Variables Aléatoires lorsque n est
grand.
Théorème de la limite centrale : Soit X1, X2,…Xn des variables aléatoires indépendantes,
suivant toutes la même loi, admettant une moyenne m et un écart type σ (σ0)
Si n est suffisamment grand, la variable aléatoire
X=X1+X2+...+Xn
n
suit
approximativement la loi normale N(m ;
σ
n
)
Exemple: L’usine Lavis fabrique des boulons, dont 3% sont défectueux. Je prends au
hasard 100 boulons. Quelle est la probabilité que j’ai au moins 80 boulons corrects?
Soit (Xn )nN des v.a.i de Bernoulli telles que Xi = 1 si et seulement si le i-ème boulon est
défectueux. Le paramètre de ces lois est donc p = 0,03. La variable aléatoire
Sn=Xi
i=1
n
compte donc le nombre de boulons défectueux parmi les n premiers piochés.
La loi faible des grands nombres assure que si n est grand,
Sn
n=X1+X2+...+Xn
nE(X)
,
et donc
et donc
S100 3
Revenons à la question posée. J’ai au moins 80 boulons corrects si et seulement si j’ai au
plus 20 boulons défectueux. Donc la probabilité que je cherche à estimer est P(S10020).
On s’attend par le point précédent à ce que cette probabilité soit proche de 1 et pour
montrer ceci on va utiliser le théorème central limite:
S100
100
suit une loi normale de moyenne 0,03 et d’écart type
0,03 ×(10,03)
100
P (
S100 20
) =
P(S100
100 0,03 0,17)
=
P100
0,03(10,03)
S100
100 0,03
0,17 100
0,03(10,03)
P (
S100 20
)=
P Z 9,96
( )
1
car Z est une variable aléatoire centrée réduite. Il su!t alors
de consulter une table de la loi Normale.
chapitre o3 échantillonnage
2
1 / 2 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !