UTILISATION DE LA LOI BINOMIALE POUR UNE PRISE DE DÉCISION À PARTIR D'UNE FRÉQUENCE Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Contexte de travail On considère une population statistique dans laquelle on étudie un caractère qualitatif prenant une modalité donnée dans une proportion p. On cherche des renseignements sur p. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Contexte de travail Recensement On peut étudier toute la population et avoir une connaissance précise de p. Mais cela peut s'avérer : • long (la valeur de p pourra avoir changé entre temps) • ou coûteux, • voire impossible lorsque l'étude est destructrice des individus. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Contexte de travail Statistique inférentielle On peut raisonner à partir d'un échantillon tiré au hasard dans la population. On détermine la fréquence f de la modalité dans l'échantillon, elle induit des résultats sur p avec une certaine marge d'erreur cependant. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Contexte de travail Statistique inférentielle Deux problèmes inférentielle : relèvent de la statistique • l'estimation (ponctuelle ou par intervalle de confiance...) • les tests (tests d'hypothèse, tests d'adéquation...). Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Contexte de travail Exemple : Supposons que l'on travaille sur la proportion p de bonbons à la menthe délivrés par un distributeur. • test d'hypothèse on cherche à savoir si p = 25 % (par exemple) • estimation on cherche à connaître la valeur de p. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 2 - Les programmes de Premières Programmes de Première 2011 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 2 - Les programmes de Premières Les programmes de premières conduisent à travailler dans le cadre des tests d'hypothèse. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3- Démarche des tests d'hypothèse sur une proportion On émet une hypothèse sur la proportion p d'un caractère qualitatif dans une population statistique. On cherche des raisons de rejeter cette hypothèse au vu d'un échantillon tiré au hasard. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Contexte de travail Exemple : On travaille sur la proportion p de bonbons à la menthe délivrés par un distributeur. On cherche à savoir si p = 25 % : c'est l'hypothèse que l'on cherche à vérifier. On constitue au hasard un échantillon de 20 bonbons issus du distributeur. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3- Démarche des tests d'hypothèse sur une proportion Si l'hypothèse émise est vraie, on connaît la distribution d'échantillonnage de la fréquence Fn du caractère étudié dans les échantillons de taille n. On connaît alors les valeurs de Fn les plus fréquemment observables. On observe la valeur f de Fn pour un échantillon. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Contexte de travail Exemple : On constitue au hasard et avec remise un échantillon de 20 bonbons. Si la proportion de bonbons à la menthe délivrés par le distributeur est 25 %, le nombre de bonbons à la menthe de l'échantillon se distribue selon la loi binomiale de paramètres 20 et 0,25. Ce résultat nous distribution de F20. permet de connaître la Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Contexte de travail Exemple : Échantillons de taille 20 0,25 0,15 0,10 0,05 20/20 19/20 18/20 17/20 16/20 15/20 14/20 13/20 12/20 11/20 10/20 9/20 8/20 7/20 6/20 5/20 4/20 3/20 2/20 1/20 0,00 0 Probabilité 0,20 Fréquence dans l'échantillon Distribution de F20. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3- Démarche des tests d'hypothèse sur une proportion On observe la valeur f de Fn pour un échantillon. On considère que le hasard fait bien les choses et on adopte la démarche suivante : • si f ne fait pas partie des valeurs les plus fréquemment observables, on rejette l'hypothèse émise. • si f fait partie des valeurs les plus fréquemment observables, on ne rejette pas l'hypothèse émise. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3- Démarche des tests d'hypothèse sur une proportion Cet ensemble des valeurs les plus fréquemment observables se déterminent à l'aide d'un niveau de probabilité, en général 95 %. C'est un intervalle centré en p qui contient la valeur de Fn avec une probabilité d'au moins 95 % et qui soit d'amplitude minimale : c'est l'intervalle de fluctuation de p au niveau de probabilité de 95 %. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3- Démarche des tests d'hypothèse sur une proportion Exemple : Travaillons au niveau de probabilité de 95 %. On détermine l'intervalle centré en 0,25, d'amplitude minimale, qui contient la valeur de F20 pour un échantillon tiré au hasard avec une probabilité d'au moins 95 %. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3- Démarche des tests d'hypothèse sur une proportion Exemple : Échantillons de taille 20 0,25 Probabilité 0,20 0,15 0,10 0,05 20/20 19/20 18/20 17/20 16/20 15/20 14/20 13/20 12/20 11/20 10/20 9/20 8/20 7/20 6/20 5/20 4/20 3/20 2/20 1/20 0 0,00 Fréquence dans l'échantillon L'intervalle [0,05 ; 0,45] contient F20 avec la probabilité d'environ 0,98. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3- Démarche des tests d'hypothèse sur une proportion Exemple : Règle de décision : • Si la valeur observée de F20 dans l'échantillon n'appartient pas à [0,05 ; 0,45] alors on rejette l'hypothèse que p = 25 %. • Si la valeur observée de F20 dans l'échantillon appartient à [0,05 ; 0,45] alors on ne rejette pas l'hypothèse que p = 25 %. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 INTERVALLE DE FLUCTUATION Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Dans le programme de Seconde 2009 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Dans le programme de Seconde 2009 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Dans les programmes de Première Programmes de Première 2011 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Considérons un échantillon de taille 20, constitué "au hasard" et avec remise dans une population contenant 1 une sous-population A en proportion p = . 4 On s'intéresse à la fréquence f d'éléments de A dans l'échantillon, c'est l'observation de la variable aléatoire F20 sur l'échantillon. 20 F20 est distribuée selon la loi binomiale de paramètres 1 20 et . 4 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Fréquence de A 0/20 1/20 2/20 3/20 4/20 5/20 6/20 Fréquence de A 14/20 15/20 16/20 17/20 18/20 19/10 20/20 7/20 8/20 9/20 10/20 11/20 12/20 13/20 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Fréquence de A Probabilité 0/20 0,03 1/20 0,021 2/20 0,067 3/20 0,134 4/20 0,190 5/20 0,202 6/20 0,169 7/20 0,112 8/20 0,061 9/20 0,027 10/20 0,010 11/20 0,003 12/20 13/20 0,001 Fréquence de A Probabilité 14/20 0,000 15/20 0,000 16/20 0,000 17/20 0,000 18/20 0,000 19/10 0,000 20/20 0,000 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 0,000 3 - Un exemple de détermination de l'intervalle de fluctuation Fréquence de A p = 25 % Probabilité 0/20 0,03 1/20 0,021 2/20 0,067 3/20 0,134 4/20 0,190 5/20 0,202 6/20 0,169 7/20 0,112 8/20 0,061 9/20 0,027 10/20 0,010 11/20 0,003 12/20 13/20 0,001 Fréquence de A Probabilité 14/20 0,000 15/20 0,000 16/20 0,000 17/20 0,000 18/20 0,000 19/10 0,000 20/20 0,000 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 0,000 3 - Un exemple de détermination de l'intervalle de fluctuation Fréquence de A p = 25 % Probabilité 0/20 0,03 1/20 0,021 2/20 0,067 3/20 0,134 4/20 0,190 5/20 0,202 6/20 0,169 7/20 0,112 8/20 0,061 9/20 0,027 10/20 0,010 11/20 0,003 12/20 0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 Brigitte 13/20 0,000 3 - Un exemple de détermination de l'intervalle de fluctuation Fréquence de A p = 25 % Probabilité 0/20 0,03 1/20 0,021 2/20 0,067 3/20 0,134 4/20 0,190 5/20 0,202 6/20 0,169 7/20 0,112 8/20 0,061 9/20 0,027 10/20 0,010 11/20 0,003 12/20 0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 Brigitte 13/20 0,000 0,561 3 - Un exemple de détermination de l'intervalle de fluctuation Fréquence de A p = 25 % Probabilité 0/20 0,03 1/20 0,021 2/20 0,067 3/20 0,134 4/20 0,190 5/20 0,202 6/20 0,169 7/20 0,112 8/20 0,061 9/20 0,027 10/20 0,010 11/20 0,003 12/20 0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 Brigitte 13/20 0,000 0,561 0,807 3 - Un exemple de détermination de l'intervalle de fluctuation Fréquence de A p = 25 % Probabilité 0/20 0,03 1/20 0,021 2/20 0,067 3/20 0,134 4/20 0,190 5/20 0,202 6/20 0,169 7/20 0,112 8/20 0,061 9/20 0,027 10/20 0,010 11/20 0,003 12/20 0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 Brigitte 13/20 0,000 0,561 0,807 0,935 3 - Un exemple de détermination de l'intervalle de fluctuation Fréquence de A p = 25 % Probabilité 0/20 0,03 1/20 0,021 2/20 0,067 3/20 0,134 4/20 0,190 5/20 0,202 6/20 0,169 7/20 0,112 8/20 0,061 9/20 0,027 10/20 0,010 11/20 0,003 12/20 0,001CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 Brigitte 13/20 0,000 0,561 0,807 0,935 0,983 3 - Un exemple de détermination de l'intervalle de fluctuation Fréquence de A p = 25 % Probabilité 0/20 0,03 1/20 0,021 2/20 0,067 3/20 0,134 4/20 0,190 5/20 0,202 6/20 0,169 7/20 0,112 8/20 0,061 9/20 0,027 10/20 0,010 11/20 0,003 12/20 13/20 0,001 0,561 0,807 0,935 0,983 0,999 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 0,000 3 - Un exemple de détermination de l'intervalle de fluctuation Échantillons de taille 20 0,25 0,15 0,10 20/20 19/20 18/20 17/20 16/20 15/20 14/20 13/20 12/20 11/20 10/20 9/20 8/20 7/20 6/20 5/20 4/20 3/20 2/20 0,00 1/20 0,05 0 Probabilité 0,20 Fréquence de A Brigitte p =CHAPUT 25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Échantillons de taille 20 0,25 0,561 0,15 0,10 0,05 20/20 19/20 18/20 17/20 16/20 15/20 14/20 13/20 12/20 11/20 10/20 9/20 8/20 7/20 6/20 5/20 4/20 3/20 2/20 1/20 0,00 0 Probabilité 0,20 Fréquence de A Brigitte p =CHAPUT 25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Échantillons de taille 20 0,25 0,807 0,15 0,10 0,05 20/20 19/20 18/20 17/20 16/20 15/20 14/20 13/20 12/20 11/20 10/20 9/20 8/20 7/20 6/20 5/20 4/20 3/20 2/20 1/20 0,00 0 Probabilité 0,20 Fréquence de A Brigitte p =CHAPUT 25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Échantillons de taille 20 0,25 0,935 0,15 0,10 0,05 20/20 19/20 18/20 17/20 16/20 15/20 14/20 13/20 12/20 11/20 10/20 9/20 8/20 7/20 6/20 5/20 4/20 3/20 2/20 1/20 0,00 0 Probabilité 0,20 Fréquence de A Brigitte p =CHAPUT 25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Échantillons de taille 20 0,25 0,983 0,15 0,10 0,05 20/20 19/20 18/20 17/20 16/20 15/20 14/20 13/20 12/20 11/20 10/20 9/20 8/20 7/20 6/20 5/20 4/20 3/20 2/20 1/20 0,00 0 Probabilité 0,20 Fréquence de A Brigitte p =CHAPUT 25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Échantillons de taille 20 0,25 0,999 0,15 0,10 0,05 20/20 19/20 18/20 17/20 16/20 15/20 14/20 13/20 12/20 11/20 10/20 9/20 8/20 7/20 6/20 5/20 4/20 3/20 2/20 1/20 0,00 0 Probabilité 0,20 Fréquence de A Brigitte p =CHAPUT 25 % - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation En résumé : 1 1 P 4 a F20 4 + a – 0,561 0,807 0,935 0,983 0,999 si si si si si 0,05 a < 0,1 0,1 a < 0,15 0,15 a < 0,2 0,2 a < 0,25 0,25 a < 0,3 Il n'y a pas d'intervalle centré en p = 1 4 tel que la probabilité que Fn appartienne à cet intervalle soit exactement 0,95. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation On adopte la définition suivante : L’intervalle de fluctuation de Fn au niveau de probabilité de 95 %, est le plus petit intervalle de la forme [p ; p + ] tel que Pp Fn p + 0,95. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Pour l'exemple : 1 1 P 4 a F20 4 + a – 0,561 0,807 0,935 0,983 0,999 si si si si si 0,05 a < 0,1 0,1 a < 0,15 0,15 a < 0,2 0,2 a < 0,25 0,25 a < 0,3 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 3 - Un exemple de détermination de l'intervalle de fluctuation Pour l'exemple : 1 1 P 4 a F20 4 + a – 0,561 0,807 0,935 0,983 0,999 si si si si si 0,05 a < 0,1 0,1 a < 0,15 0,15 a < 0,2 0,2 a < 0,25 0,25 a < 0,3 Le plus petit intervalle de la forme que 1 P4a 1 F20 4+a 0,95 1 4 1 a ,. 4 + a tel est obtenu pour a = 0,2. L'intervalle de fluctuation de F20 au niveau de Brigitte% CHAPUT de la Régionale APMEP de Toulouse - 19 janvier 2011 probabilité de 95 est- Journée : [0,05 ; 0,45]. PRISE DE DÉCISION Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Programmes de Première 2011 Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 1 : En 2000, dans le village de Xicun, en Chine, il est né 20 enfants, parmi lesquels 16 garçons. (Source : Washington Post du 29 mai 2001.) Peut-on considérer que cette répartition est le fruit du seul hasard ? Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 1 : On veut rejeter ou non l'hypothèse que la distribution des sexes des enfants nés en 2000 à Xicun est due au seul hasard. On considère que la variable aléatoire "sexe à la naissance" prend les deux valeurs fille et garçon avec la même probabilité 0,5. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 1 : Si la distribution des sexes des enfants nés en 2000 à Xicun est due au seul hasard, les 20 enfants sont assimilés à un échantillon d'enfants choisis au hasard dans la population. La distribution des sexes dans un tel échantillon suit la loi binomiale de paramètres 20 et 0,5. L'intervalle de fluctuation de la fréquence de garçons dans l'échantillon au niveau de probabilité de 95 % est [0,3 ; 0,7]. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 1 : La fréquence de garçons observée à Xicun est 0,8 qui n'appartient pas à [0,3 ; 0,7]. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 1 : La fréquence de garçons observée à Xicun est 0,8 qui n'appartient pas à [0,3 ; 0,7]. On considère que la différence entre 0,8 et la valeur attendue 0,5 est significative et on rejette l'hypothèse que la répartition des sexes des enfants est due au seul hasard. On a pu, par la suite, établir un lien avec l’acquisition en 1999, dans ce village d’une machine à ultra-sons bon marché, permettant aux médecins de déterminer le sexe du fœtus. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 2 : Dans la réserve indienne d’Aamjiwnaag, située au Canada à proximité d’industries chimiques, il est né entre 1999 et 2003, 132 enfants dont 46 garçons. (Sources : Science et Vie février 2006 – Environmental Health Perspectives octobre 2005). Peut-on considérer que cette répartition est le fruit du seul hasard ? Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 2 : On veut rejeter ou non l'hypothèse que la distribution des sexes des enfants nés entre 1999 et 2003 à Aamjiwnaag est due au seul hasard. On considère que la variable aléatoire "sexe à la naissance" prend les deux valeurs fille et garçon avec la même probabilité 0,5. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 2 : Si la distribution des sexes des enfants nés entre 1999 et 2003 à Aamjiwnaag est due au seul hasard, les 132 enfants sont assimilés à un échantillon d'enfants choisis au hasard dans la population. La distribution des sexes dans un tel échantillon suit la loi binomiale de paramètres 132 et 0,5. L'intervalle de fluctuation de la fréquence de garçons dans l'échantillon au niveau de probabilité de 95 % est approché par [0,416 ; 0,584]. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 2 : La fréquence de garçons observée à Aamjiwnaag est environ 0,348 qui n'appartient pas à [0,416 ; 0,584]. On considère que la différence entre 0,348 et la valeur attendue 0,5 est significative et on rejette que la répartition des sexes des enfants est due au seul hasard. Ce résultat conduit à suspecter l'impact des usines chimiques voisines utilisant des polluants chimiques sur le Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 sex-ratio. 1 - Application à la prise de décision Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011 1 - Application à la prise de décision Exemple 2 : 1 1 L'approximation p ;p+ évoquée dans le n n programme de seconde 2009 mène au calcul 0,5 1 1 ; 0,5 + 132 132 soit [0,412 ; 0,588] à comparer avec [0,416 ; 0,584]. Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011