Fluctuation et estimation
I. Variable aléatoire fréquence
1) Propriété
La variable aléatoire X, qui à tout échantillon de taille n associe le nombre d’individus qui
possèdent le caractère étudié, suit la loi binomiale de paramètres n et p.
2) Définition
La variable aléatoire F qui à tout échantillon de taille n associe la fréquence f du caractère
étudié dans cet échantillon est appelé variable aléatoire fréquence et elle est définie par
.
Ex 3-4-5 … p.278
II. Intervalle de fluctuation
1) Exemple
Une urne contient des boules blanches dont la proportion est p.
On suppose p connu, par exemple, p = 0,6.
Les fréquences de boules blanches obtenues, par simulation, à partir de 20 échantillons,
chacun de taille 100 sont :
0,51 – 0,62 – 0,68 – 0,55 – 0,47 – 0,6 – 0,69 – 0,58 – 0,61 – 0,67 – 0,55 – 0,63 – 0,53 – 0,54 –
0,52 – 0,68 – 0,69 – 0,54 – 0,55 – 0,59.
On constate que sur cet exemple les fréquences observées fluctuent.
Ce phénomène est appelé fluctuation d’échantillonnage.
Plus précisément, on peut constater que, pour la plupart des échantillons, la fréquence de
sortie d’une boule blanche se trouve dans l’intervalle [0,5 ; 0,7]. On dispose ainsi d’un ordre
de grandeur du nombre d’échantillons dont la fréquence appartient à l’intervalle [0,5 ; 0,7].
Dans l’exemple, on peut vérifier qu’il y en a 19 sur 20, c’est-à-dire 95%.
2) Intervalle proposé en seconde
On a vu en seconde que pour un échantillon de taille n l’intervalle
est un
intervalle de fluctuation de la fréquence au seuil de 95%.
Il faut pour cela que n ≥ 25 et 0,2 ≤ p ≤ 0,8.
3) Intervalle proposé en première
Un échantillon de taille n correspond au tirage de n éléments dans les mêmes conditions de
manière indépendantes lorsque la population est très grande. Nous sommes donc en présence
d’une loi binomiale.
On construit le tableau P(X≤ k).
L’intervalle de fluctuation au seuil de 95% est l’intervalle
si a est le plus petit entier tel que P(X ≤ a) > 2,5%
et b est le plus petit entier tel que P(X ≤ b) ≥ 97,5%