1 - Application à la prise de décision

publicité
UTILISATION DE LA LOI
BINOMIALE POUR UNE PRISE DE
DÉCISION À PARTIR D'UNE
FRÉQUENCE
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
On considère une population statistique dans
laquelle on étudie un caractère qualitatif prenant
une modalité donnée dans une proportion p.
On cherche des renseignements sur p.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
Recensement
On peut étudier toute la population et avoir une
connaissance précise de p.
Mais cela peut s'avérer :
• long (la valeur de p pourra avoir changé entre
temps)
• ou coûteux,
• voire impossible lorsque l'étude est destructrice
des individus.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
Statistique inférentielle
On peut raisonner à partir d'un échantillon tiré
au hasard dans la population.
On détermine la fréquence f de la modalité dans
l'échantillon, elle induit des résultats sur p avec
une certaine marge d'erreur cependant.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
Statistique inférentielle
Deux problèmes
inférentielle :
relèvent
de
la
statistique
• l'estimation (ponctuelle ou par intervalle de
confiance...)
• les
tests
(tests
d'hypothèse,
tests
d'adéquation...).
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
Exemple :
Supposons que l'on travaille sur la proportion p
de bonbons à la menthe délivrés par un
distributeur.
• test d'hypothèse
on cherche à savoir si p = 25 % (par exemple)
• estimation
on cherche à connaître la valeur de p.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
2 - Les programmes de Premières
Programmes de Première 2011
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
2 - Les programmes de Premières
Les programmes de premières conduisent à
travailler dans le cadre des tests d'hypothèse.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
On émet une hypothèse sur la proportion p d'un
caractère qualitatif dans une population
statistique.
On cherche des raisons de rejeter cette
hypothèse au vu d'un échantillon tiré au hasard.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
Exemple :
On travaille sur la proportion p de bonbons à la
menthe délivrés par un distributeur.
On cherche à savoir si p = 25 % : c'est l'hypothèse
que l'on cherche à vérifier.
On constitue au hasard un échantillon de 20
bonbons issus du distributeur.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
Si l'hypothèse émise est vraie, on connaît la
distribution d'échantillonnage de la fréquence Fn du
caractère étudié dans les échantillons de taille n.
On connaît alors les valeurs de Fn les plus
fréquemment observables.
On observe la valeur f de Fn pour un échantillon.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
Exemple :
On constitue au hasard et avec remise un
échantillon de 20 bonbons.
Si la proportion de bonbons à la menthe délivrés
par le distributeur est 25 %, le nombre de
bonbons à la menthe de l'échantillon se distribue
selon la loi binomiale de paramètres 20 et 0,25.
Ce résultat nous
distribution de F20.
permet
de
connaître
la
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
Exemple :
Échantillons de taille 20
0,25
0,15
0,10
0,05
20/20
19/20
18/20
17/20
16/20
15/20
14/20
13/20
12/20
11/20
10/20
9/20
8/20
7/20
6/20
5/20
4/20
3/20
2/20
1/20
0,00
0
Probabilité
0,20
Fréquence dans l'échantillon
Distribution de F20.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
On observe la valeur f de Fn pour un échantillon.
On considère que le hasard fait bien les choses et
on adopte la démarche suivante :
• si f ne fait pas partie des valeurs les plus
fréquemment
observables,
on
rejette
l'hypothèse émise.
• si f fait partie des valeurs les plus
fréquemment observables, on ne rejette pas
l'hypothèse émise.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
Cet ensemble des valeurs les plus fréquemment
observables se déterminent à l'aide d'un niveau de
probabilité, en général 95 %.
C'est un intervalle centré en p qui contient la valeur de
Fn avec une probabilité d'au moins 95 % et qui soit
d'amplitude minimale : c'est l'intervalle de fluctuation
de p au niveau de probabilité de 95 %.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
Exemple :
Travaillons au niveau de probabilité de 95 %.
On détermine l'intervalle centré en 0,25,
d'amplitude minimale, qui contient la valeur de F20
pour un échantillon tiré au hasard avec une
probabilité d'au moins 95 %.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
Exemple :
Échantillons de taille 20
0,25
Probabilité
0,20
0,15
0,10
0,05
20/20
19/20
18/20
17/20
16/20
15/20
14/20
13/20
12/20
11/20
10/20
9/20
8/20
7/20
6/20
5/20
4/20
3/20
2/20
1/20
0
0,00
Fréquence dans l'échantillon
L'intervalle [0,05 ; 0,45] contient F20 avec la probabilité
d'environ 0,98.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
Exemple :
Règle de décision :
• Si la valeur observée de F20 dans l'échantillon
n'appartient pas à [0,05 ; 0,45] alors on
rejette l'hypothèse que p = 25 %.
• Si la valeur observée de F20 dans l'échantillon
appartient à [0,05 ; 0,45] alors on ne rejette
pas l'hypothèse que p = 25 %.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
INTERVALLE DE FLUCTUATION
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Dans le programme de Seconde 2009
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Dans le programme de Seconde 2009
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Dans les programmes de Première
Programmes de Première 2011
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Considérons un échantillon de taille 20, constitué "au
hasard" et avec remise dans une population contenant
1
une sous-population A en proportion p = .
4
On s'intéresse à la fréquence f d'éléments de A dans
l'échantillon, c'est l'observation de la variable aléatoire
F20 sur l'échantillon.
20 F20 est distribuée selon la loi binomiale de paramètres
1
20 et .
4
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
0/20
1/20
2/20
3/20
4/20
5/20
6/20
Fréquence de A
14/20
15/20
16/20
17/20
18/20
19/10
20/20
7/20
8/20
9/20
10/20
11/20
12/20
13/20
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
Probabilité
0/20
0,03
1/20
0,021
2/20
0,067
3/20
0,134
4/20
0,190
5/20
0,202
6/20
0,169
7/20
0,112
8/20
0,061
9/20
0,027
10/20
0,010
11/20
0,003
12/20
13/20
0,001
Fréquence de A
Probabilité
14/20
0,000
15/20
0,000
16/20
0,000
17/20
0,000
18/20
0,000
19/10
0,000
20/20
0,000
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
0,000
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
p = 25 %
Probabilité
0/20
0,03
1/20
0,021
2/20
0,067
3/20
0,134
4/20
0,190
5/20
0,202
6/20
0,169
7/20
0,112
8/20
0,061
9/20
0,027
10/20
0,010
11/20
0,003
12/20
13/20
0,001
Fréquence de A
Probabilité
14/20
0,000
15/20
0,000
16/20
0,000
17/20
0,000
18/20
0,000
19/10
0,000
20/20
0,000
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
0,000
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
p = 25 %
Probabilité
0/20
0,03
1/20
0,021
2/20
0,067
3/20
0,134
4/20
0,190
5/20
0,202
6/20
0,169
7/20
0,112
8/20
0,061
9/20
0,027
10/20
0,010
11/20
0,003
12/20
0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Brigitte
13/20
0,000
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
p = 25 %
Probabilité
0/20
0,03
1/20
0,021
2/20
0,067
3/20
0,134
4/20
0,190
5/20
0,202
6/20
0,169
7/20
0,112
8/20
0,061
9/20
0,027
10/20
0,010
11/20
0,003
12/20
0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Brigitte
13/20
0,000
0,561
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
p = 25 %
Probabilité
0/20
0,03
1/20
0,021
2/20
0,067
3/20
0,134
4/20
0,190
5/20
0,202
6/20
0,169
7/20
0,112
8/20
0,061
9/20
0,027
10/20
0,010
11/20
0,003
12/20
0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Brigitte
13/20
0,000
0,561
0,807
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
p = 25 %
Probabilité
0/20
0,03
1/20
0,021
2/20
0,067
3/20
0,134
4/20
0,190
5/20
0,202
6/20
0,169
7/20
0,112
8/20
0,061
9/20
0,027
10/20
0,010
11/20
0,003
12/20
0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Brigitte
13/20
0,000
0,561
0,807
0,935
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
p = 25 %
Probabilité
0/20
0,03
1/20
0,021
2/20
0,067
3/20
0,134
4/20
0,190
5/20
0,202
6/20
0,169
7/20
0,112
8/20
0,061
9/20
0,027
10/20
0,010
11/20
0,003
12/20
0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Brigitte
13/20
0,000
0,561
0,807
0,935
0,983
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
p = 25 %
Probabilité
0/20
0,03
1/20
0,021
2/20
0,067
3/20
0,134
4/20
0,190
5/20
0,202
6/20
0,169
7/20
0,112
8/20
0,061
9/20
0,027
10/20
0,010
11/20
0,003
12/20
13/20
0,001
0,561
0,807
0,935
0,983
0,999
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
0,000
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,25
0,15
0,10
20/20
19/20
18/20
17/20
16/20
15/20
14/20
13/20
12/20
11/20
10/20
9/20
8/20
7/20
6/20
5/20
4/20
3/20
2/20
0,00
1/20
0,05
0
Probabilité
0,20
Fréquence de A
Brigitte
p =CHAPUT
25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,25
0,561
0,15
0,10
0,05
20/20
19/20
18/20
17/20
16/20
15/20
14/20
13/20
12/20
11/20
10/20
9/20
8/20
7/20
6/20
5/20
4/20
3/20
2/20
1/20
0,00
0
Probabilité
0,20
Fréquence de A
Brigitte
p =CHAPUT
25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,25
0,807
0,15
0,10
0,05
20/20
19/20
18/20
17/20
16/20
15/20
14/20
13/20
12/20
11/20
10/20
9/20
8/20
7/20
6/20
5/20
4/20
3/20
2/20
1/20
0,00
0
Probabilité
0,20
Fréquence de A
Brigitte
p =CHAPUT
25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,25
0,935
0,15
0,10
0,05
20/20
19/20
18/20
17/20
16/20
15/20
14/20
13/20
12/20
11/20
10/20
9/20
8/20
7/20
6/20
5/20
4/20
3/20
2/20
1/20
0,00
0
Probabilité
0,20
Fréquence de A
Brigitte
p =CHAPUT
25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,25
0,983
0,15
0,10
0,05
20/20
19/20
18/20
17/20
16/20
15/20
14/20
13/20
12/20
11/20
10/20
9/20
8/20
7/20
6/20
5/20
4/20
3/20
2/20
1/20
0,00
0
Probabilité
0,20
Fréquence de A
Brigitte
p =CHAPUT
25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,25
0,999
0,15
0,10
0,05
20/20
19/20
18/20
17/20
16/20
15/20
14/20
13/20
12/20
11/20
10/20
9/20
8/20
7/20
6/20
5/20
4/20
3/20
2/20
1/20
0,00
0
Probabilité
0,20
Fréquence de A
Brigitte
p =CHAPUT
25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
En résumé :


1


1

 
P 4  a  F20 4 + a – 





0,561
0,807
0,935
0,983
0,999
si
si
si
si
si
0,05  a < 0,1
0,1  a < 0,15
0,15  a < 0,2
0,2  a < 0,25
0,25  a < 0,3
Il n'y a pas d'intervalle centré en p =
1
4
tel que la
probabilité que Fn appartienne à cet intervalle
soit exactement 0,95.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
On adopte la définition suivante :
L’intervalle de fluctuation de Fn au niveau de
probabilité de 95 %, est le plus petit intervalle
de la forme [p   ; p + ] tel que



Pp    Fn  p +   0,95.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Pour l'exemple :


1


1

 
P 4  a  F20 4 + a – 





0,561
0,807
0,935
0,983
0,999
si
si
si
si
si
0,05  a < 0,1
0,1  a < 0,15
0,15  a < 0,2
0,2  a < 0,25
0,25  a < 0,3
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Pour l'exemple :


1


1

 
P 4  a  F20 4 + a – 





0,561
0,807
0,935
0,983
0,999
si
si
si
si
si
0,05  a < 0,1
0,1  a < 0,15
0,15  a < 0,2
0,2  a < 0,25
0,25  a < 0,3
Le plus petit intervalle de la forme
que
1
P4a
1 
 F20  4+a  0,95
1

4
1
 a ,. 4
+

a
tel
est obtenu pour a = 0,2.
L'intervalle de fluctuation de F20 au niveau de
Brigitte%
CHAPUT
de la Régionale
APMEP de Toulouse - 19 janvier 2011
probabilité de 95
est- Journée
: [0,05
; 0,45].
PRISE DE DÉCISION
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Programmes de Première 2011
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 :
En 2000, dans le village de Xicun, en Chine, il est
né 20 enfants, parmi lesquels 16 garçons.
(Source : Washington Post du 29 mai 2001.)
Peut-on considérer que cette répartition est le
fruit du seul hasard ?
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 :
On veut rejeter ou non l'hypothèse que la
distribution des sexes des enfants nés en 2000 à
Xicun est due au seul hasard.
On considère que la variable aléatoire "sexe à la
naissance" prend les deux valeurs fille et garçon
avec la même probabilité 0,5.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 :
Si la distribution des sexes des enfants nés en
2000 à Xicun est due au seul hasard, les 20
enfants sont assimilés à un échantillon d'enfants
choisis au hasard dans la population.
La distribution des sexes dans un tel échantillon
suit la loi binomiale de paramètres 20 et 0,5.
L'intervalle de fluctuation de la fréquence de
garçons dans l'échantillon au niveau de probabilité
de 95 % est [0,3 ; 0,7].
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 :
La fréquence de garçons observée à Xicun est 0,8
qui n'appartient pas à [0,3 ; 0,7].
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 :
La fréquence de garçons observée à Xicun est 0,8
qui n'appartient pas à [0,3 ; 0,7]. On considère que
la différence entre 0,8 et la valeur attendue 0,5
est significative et on rejette l'hypothèse que la
répartition des sexes des enfants est due au seul
hasard.
On a pu, par la suite, établir un lien avec l’acquisition en
1999, dans ce village d’une machine à ultra-sons bon marché,
permettant aux médecins de déterminer le sexe du fœtus.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 :
Dans la réserve indienne d’Aamjiwnaag, située au
Canada à proximité d’industries chimiques, il est
né entre 1999 et 2003, 132 enfants dont 46
garçons. (Sources : Science et Vie février 2006 –
Environmental Health Perspectives octobre 2005).
Peut-on considérer que cette répartition est le
fruit du seul hasard ?
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 :
On veut rejeter ou non l'hypothèse que la
distribution des sexes des enfants nés entre 1999
et 2003 à Aamjiwnaag est due au seul hasard.
On considère que la variable aléatoire "sexe à la
naissance" prend les deux valeurs fille et garçon
avec la même probabilité 0,5.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 :
Si la distribution des sexes des enfants nés entre
1999 et 2003 à Aamjiwnaag est due au seul hasard,
les 132 enfants sont assimilés à un échantillon
d'enfants choisis au hasard dans la population.
La distribution des sexes dans un tel échantillon
suit la loi binomiale de paramètres 132 et 0,5.
L'intervalle de fluctuation de la fréquence de
garçons dans l'échantillon au niveau de probabilité
de 95 % est approché par [0,416 ; 0,584].
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 :
La fréquence de garçons observée à Aamjiwnaag
est environ 0,348 qui n'appartient pas à
[0,416 ; 0,584].
On considère que la différence entre 0,348 et la
valeur attendue 0,5 est significative et on rejette
que la répartition des sexes des enfants est due au
seul hasard.
Ce résultat conduit à suspecter l'impact des usines
chimiques voisines utilisant des polluants chimiques sur le
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
sex-ratio.
1 - Application à la prise de décision
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 :


1
1


L'approximation p 
;p+
évoquée dans le

n
n

programme de seconde 2009 mène au calcul


0,5 

1
1 
; 0,5 +
132
132 
soit
[0,412 ; 0,588]
à
comparer avec [0,416 ; 0,584].
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Téléchargement