Atelier sur les statistiques dans le nouveau programme de seconde

B. Chaput - Journée de la Régionale APMEP 19 janvier 2011 1
Utilisation de la loi binomiale pour une prise de décision à partir d'une fréquence
1°) - Le contexte de travail
On est dans le cadre de la statistique inférentielle. L'inférence statistique consiste à induire les caractéristiques
inconnues d'une population à partir d'un échantillon issu de cette population. Elle est utilisée en particulier en
théorie de l'estimation (intervalle de confiance...) et en théorie des tests (tests d'hypothèse, tests d'adéquation...).
Un exemple : on travaille sur la proportion p d'électeurs favorables à un projet dans une commune.
On peut se poser deux types de problèmes :
test d'hypothèse : on cherche à savoir si p = 25 %, par exemple ;
estimation : on cherche à connaître p.
Les tests
Comment procéder ?
On étudie toute la production (recensement), on peut espérer avoir une connaissance précise de p. Mais cela peut
s'avérer long (la valeur de p pourra avoir changé entre temps) ou coûteux, voire impossible (lorsque l'étude est
destructrice de la population (yaourts contaminés).
On raisonne à partir d'un échantillon tiré au hasard, de taille n de la production.
Le principe :
Si l'hypothèse émise est vraie, on connaît la distribution d'échantillonnage de la fréquence Fn de défectueux dans
les échantillons. On connaît alors les valeurs de Fn les plus fréquemment observées selon certains critères.
On observe la valeur f de Fn pour un échantillon : on considère que le hasard fait bien les choses
si f ne fait pas partie des valeurs les plus fréquemment observées, on rejette l'hypothèse émise.
si f fait partie des valeurs les plus fréquemment observées, on n'est pas en mesure de rejeter l'hypothèse
émise.
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,25
0
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/20
11/20
12/20
13/20
14/20
15/20
16/20
17/20
18/20
19/20
20/20
Fréquence dans lchantillon
Probabili
L'ensemble des valeurs les plus fréquemment observées constitue l'intervalle de fluctuation ; en général, on en
prend 95 %. Ce qui conduit à prendre une mauvaise décision pour 5 % des échantillons si l'hypothèse est vraie
B. Chaput - Journée de la Régionale APMEP 19 janvier 2011 2
Intervalles de fluctuation
On considère une population P contenant une sous-population A en proportion p. On tire au hasard (c'est-à-dire
avec équiprobabilité sur les individus de la population) et avec remise un échantillon de taille n dans P. un
échantillon de taille n dans P. On appelle Fn la fréquence d'échantillonnage, c'est-à-dire la variable aléatoire qui à
chaque échantillon associe la fréquence de A.
1°) - finitions du programme de seconde 2009
Un échantillon de taille n est constitué des résultats de n répétitions indépendantes de la même expérience.
2°) - Les programmes de Premières L, ES et S
2°) - Les limites de la définition de l'intervalle de fluctuation du programme de seconde
a) - Un exemple
Considérons un échantillon de taille 20, constit"au hasard" et avec remise dans une population contenant
une sous-population A en proportion p =
Error!
. On s'intéresse à la fréquence f d'éléments de A dans
l'échantillon, c'est l'observation de la variable aléatoire F20 sur l'échantillon.
B. Chaput - Journée de la Régionale APMEP 19 janvier 2011 3
20 F20 est distribué selon la loi binomiale de paramètres 20 et
Error!
.
Fréquence de A
dans l'échantillon
Probabilité
0/20
0,003
1/20
0,021
2/20
0,067
3/20
0,134
4/20
0,190
5/20
0,202
6/20
0,169
7/20
0,112
8/20
0,061
9/20
0,027
10/20
0,010
11/20
0,003
12/20
0,001
13/20
0,000
14/20
0,000
15/20
0,000
16/20
0,000
17/20
0,000
18/20
0,000
19/20
0,000
20/20
0,000
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,25
0
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/20
11/20
12/20
13/20
14/20
15/20
16/20
17/20
18/20
19/20
20/20
Fquence de A
Probabilité
La probabilité que F20 soit comprise entre
Error!
Error!
et
Error!
+
Error!
est environ 0,561. Cela
peut s'écrire aussi P
Error!
Error!
0,561 ou encore P
Error!
Error!
0,561.
On a aussi, par exemple :
P
Error!
= P
Error!
= P
Error!
et de façon générale :
P
Error!
= P
Error!
avec 0,05 a < 0,1.
;0
561;
; ;0
807; ;
; ; ;0
935; ; ;
; ; ; ;0
983; ; ; ;
; ; ; ; ;0
999; ; ; ; ;
p =
Error!
B. Chaput - Journée de la Régionale APMEP 19 janvier 2011 4
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,25
0
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/20
11/20
12/20
13/20
14/20
15/20
16/20
17/20
18/20
19/20
20/20
Fquence de A
Probabilité
La probabilité que F20 soit comprise entre
Error!
Error!
et
Error!
+
Error!
est environ 0,807.
Comme précédemment, on a : P
Error!
= P
Error!
avec 0,1 a < 0,15.
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,25
0
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/20
11/20
12/20
13/20
14/20
15/20
16/20
17/20
18/20
19/20
20/20
Fquence de A
Probabilité
La probabilité que F20 soit comprise entre
Error!
Error!
et
Error!
+
Error!
est environ 0,935.
Comme précédemment, on a : P
Error!
= P
Error!
avec 0,15 a < 0,2.
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,25
0
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/20
11/20
12/20
13/20
14/20
15/20
16/20
17/20
18/20
19/20
20/20
Fquence de A
Probabilité
La probabilité que F20 soit comprise entre
Error!
Error!
et
Error!
+
Error!
est environ 0,983.
Comme précédemment, on a : P
Error!
= P
Error!
avec 0,2 a < 0,25.
B. Chaput - Journée de la Régionale APMEP 19 janvier 2011 5
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,25
0
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/20
11/20
12/20
13/20
14/20
15/20
16/20
17/20
18/20
19/20
20/20
Fquence de A
Probabilité
La probabilité que F20 soit comprise entre
Error!
Error!
et
Error!
+
Error!
est environ 0,999.
Comme précédemment, on a : P
Error!
= P
Error!
avec 0,25 a < 0,3.
En résumé :
Pour tout réel a < 0,2, F20 appartient à l'intervalle
Error!
avec une probabilité strictement inférieure à
0,95.
Pour tout réel a 0,2, F20 appartient à l'intervalle
Error!
avec une probabilité strictement supérieure
à 0,95.
b) - Problèmes soulevés
On ne trouve aucun intervalle centré en
Error!
tel que la probabilité que F20 appartienne à cet intervalle soit
exactement 0,95. Pour cet exemple, il n'existe aucun intervalle correspondant à la définition d'intervalle de
fluctuation du programme de seconde - 2009.
Si, dans la définition :
L’intervalle de fluctuation au seuil de 95%, relatif aux échantillons de taille n, est l’intervalle centré autour
de p, proportion du caractère dans la population, où se situe, avec une probabilité égale à 0, 95, la
fréquence observée dans un échantillon de taille n.
on n'impose plus que la probabilité soit égale à 0,95 mais seulement qu'elle soit au moins égale à 0,95, on
obtient une infinité d'intervalles.
On est amené à proposer la définition suivante :
3°) - Définition
L’intervalle de fluctuation de Fn au niveau de probabilité de 95 %, est le plus petit intervalle de la forme
[p ; p + ] tel que P( )
p Fn p + 0,95
Remarque :
Pour notre exemple, l'intervalle de fluctuation de Fn au seuil de 95% est
Error!
, soit
Error!
.
1 / 10 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !