Intervalles de fluctuation Brigitte CHAPUT Groupe Statistique et probabilités - IREM de Toulouse Commission inter-IREM Statistique et probabilités Brigitte CHAPUT - APMEP - 3 octobre 2009 1. Programme de seconde (juin 2009) 2. Échantillons 3. Distribution de fréquences de la proportion d’échantillonnage 4. Intervalles de fluctuation 5. Des mathématiques 6. Estimation par intervalle de confiance Brigitte CHAPUT - APMEP - 3 octobre 2009 1 - Programme de Seconde (juin 2009) Statistique et probabilités Brigitte CHAPUT - APMEP - 3 octobre 2009 2 - Échantillons 2.1 - Définitions Quand on doit décrire une population comportant un grand nombre d'individus, on ne peut pas ou on ne veut pas, en général pour des raisons économiques, en faire une étude exhaustive. Les observations ne portent alors que sur un nombre restreint d'individus à sélectionner selon un protocole expérimental. Les individus sélectionnés et leur ordre de sélection constituent un échantillon, leur nombre est la taille de l'échantillon. Brigitte CHAPUT - APMEP - 3 octobre 2009 2 - Échantillons 2.2 - Comment prélever un échantillon ? Lors d’une prise de décision à partir d‘un échantillon, pour que les résultats de la théorie des probabilités s'appliquent, il est important que l'échantillon soit prélevé au hasard. Chaque individu de la population doit avoir la même probabilité d'être sélectionné. → échantillon aléatoire. Brigitte CHAPUT - APMEP - 3 octobre 2009 Table de chiffres au hasard Brigitte CHAPUT - APMEP - 3 octobre 2009 67288 58813 24089 94737 34481 63934 16615 97808 93634 04529 00577 83055 02927 67188 75645 32583 17218 23624 28269 49201 27122 87438 52620 05496 95610 06143 46902 43842 24325 71336 56408 31717 05154 23533 73508 03569 84089 89389 36438 29507 59566 91738 97793 60338 25576 92440 56387 07228 22189 11376 86856 73814 34012 48388 43685 92198 70110 97550 26157 42795 26360 16061 30781 60145 67351 78564 45383 79965 09529 98887 03720 24572 57006 70096 24827 96659 21379 10845 04570 11834 38516 35940 44858 71986 54454 06330 76636 07528 20483 76684 42773 02701 06412 78317 94599 05877 42297 45223 31218 49361 51110 34942 55220 99584 69283 55791 05162 14635 97886 57067 22657 08485 71403 99223 30631 56522 06749 89058 55125 46177 74822 36896 45358 11819 85172 28844 07261 40970 84641 86281 67325 99112 17146 86751 59207 58121 88623 34751 93960 43626 95604 74182 82580 41556 22669 53046 08793 90623 68128 87068 34385 39827 52426 45997 17003 56277 58921 79589 33426 50340 73955 86333 48770 21632 05332 62173 05613 22702 50483 81318 86159 97406 91711 95027 30810 87473 85233 82845 16732 04822 12968 01892 97980 25960 88560 09537 00492 73889 44949 62777 43869 45256 58087 90443 73361 27951 06472 20330 14164 64374 95050 55510 11027 20617 80588 69114 98802 09105 32353 95681 95790 69377 90906 19307 49748 73296 09933 40778 84188 42906 12433 84772 05762 93487 96445 43414 44241 77598 77370 06889 81475 75169 64892 85469 48326 84524 65659 52487 60957 82048 93677 65221 02647 23950 82249 86423 26975 41952 08947 85620 13307 05568 77517 89540 53199 37538 55883 01451 76852 73938 07241 31903 97584 61905 70464 97569 29905 05232 27674 68316 13437 54184 07467 94602 11003 10516 75852 80249 85647 52049 28453 07994 33622 27996 62150 92207 79817 12450 26406 57971 19889 37586 85007 83814 45901 33289 85775 98910 09044 07651 12070 91957 87334 86124 48652 67930 83590 63084 38984 38535 92408 94134 51303 48505 20097 04084 07007 48604 85286 62719 59028 03071 82387 01166 63761 41666 59759 92801 56052 29063 18194 66269 94349 88520 06061 96558 53985 53592 52018 52990 72478 60621 11947 52476 14295 19778 42484 66423 58249 30216 32277 48190 34748 58175 53919 67603 79578 78013 55408 09502 71939 84057 96287 30419 35902 59481 14036 89096 38395 84640 44056 67618 21100 23353 15980 19811 06006 45427 01518 46020 20481 74931 47987 15715 09921 50869 86886 35553 31708 79884 53915 85439 07439 59736 56258 62845 81649 74626 09886 99691 80835 54504 64410 49478 53262 87770 82507 42769 37895 41535 52842 70393 13567 88706 65448 35207 02251 69785 94947 98480 44993 67963 56774 88641 04155 63214 32859 85270 66616 22518 00961 55055 55360 01524 24891 87935 28024 59121 17551 14953 77067 87018 26619 21475 00183 22881 12487 89558 04384 05684 92217 41614 09579 05558 18664 52208 92745 31667 80784 49562 65967 00981 83323 86833 24275 82746 95640 89875 97797 86917 98270 65853 31766 45176 33443 55453 57527 69579 56021 13925 04085 38216 71338 04700 89361 35359 22374 20983 24898 33495 95199 30308 95946 94043 90683 02329 65565 95827 65864 93793 70330 03956 53509 27029 15448 83883 99166 59851 60570 31367 26542 21120 02330 11871 93639 77723 01525 26012 76540 09066 92456 22422 83328 86051 42811 92283 71024 70957 43374 36985 36436 78615 32992 82092 52754 96427 46672 77117 70024 77926 02102 21900 16902 90412 35838 37314 68194 58501 29767 75582 28162 71604 33516 38049 29157 19197 79394 76477 91690 42949 03607 02361 48817 36029 01742 81846 23148 55350 35208 26135 83797 32738 70598 29865 45709 90354 98627 46881 57138 99728 36813 42229 16122 33861 82816 87067 31212 31581 68698 00501 11189 58661 82851 80038 50181 62293 59172 10555 98459 43518 81797 01396 74913 58171 52810 00510 12680 27695 44754 10118 52146 64802 27914 34170 55224 12905 03400 96110 91576 36205 59840 26089 24371 89328 38552 43085 74215 51242 57622 49161 56865 65700 58413 08263 54126 78999 03751 41692 10808 31760 02645 71514 50654 96848 45311 84226 86654 11806 52279 35153 43220 14649 70980 29186 49952 13583 47176 91363 45452 42900 61964 04655 75437 62642 14254 14024 85193 89531 11023 39204 67513 11246 39957 57789 88523 71038 29459 30924 88708 60422 96478 74562 96651 70245 62801 77993 64462 35673 98653 62768 94774 70191 22542 05217 53956 69341 51559 61539 80535 90361 11945 54211 04562 19843 33947 96871 08976 46857 67987 38800 91700 30381 06303 46468 05322 08219 80824 47943 63858 70473 2 - Échantillons 2.2 - Comment prélever un échantillon ? Deux types d'échantillons : – Échantillons exhaustifs ou constitués sans remise – Échantillons non exhaustifs ou constitués avec remise Le programme de Seconde 2009 ne retient que ce type d'échantillons : "Un échantillon est constitué des résultats de n répétitions indépendantes de la même expérience". Brigitte CHAPUT - APMEP - 3 octobre 2009 2 - Échantillons 2.3 - Échantillonnage L'échantillonnage est l'étude des distributions de fréquences de variables définies sur l’ensemble des échantillons (proportion, moyenne, variance…). Brigitte CHAPUT - APMEP - 3 octobre 2009 3 - Distribution de fréquences de la proportion d’échantillonnage 3.1 - Un premier exemple On considère une population de 4 enfants : Adeline, Benjamin, Clara et David, d'âges respectifs 12, 13, 14 et 15 ans et on s'intéresse aux enfants de plus de 14 ans et demi. Il y en a une proportion p = 1/4 dans la population-mère. On constitue (avec remise) des échantillons de taille 3. On peut ainsi constituer 43=64 échantillons. Brigitte CHAPUT - APMEP - 3 octobre 2009 3 - Distribution de fréquences de la proportion d’échantillonnage 3.1 - Un premier exemple Proportion d'enfants de plus de 14 ans et demi dans les échantillons A A A 0 B A A 0 C A A 0 D A A 1/3 A A B 0 B A B 0 C A B 0 D A B 1/3 A A C 0 B A C 0 C A C 0 D A C 1/3 A A D 1/3 B A D 1/3 C A D 1/3 D A D 2/3 A B A 0 B B A 0 C B A 0 D B A 1/3 A B B 0 B B B 0 C B B 0 D B B 1/3 A B C 0 B B C 0 C B C 0 D B C 1/3 A B D 1/3 B B D 1/3 C B D 1/3 D B D 2/3 A C A 0 B C A 0 C C A 0 D C A 1/3 A C B 0 B C B 0 C C B 0 D C B 1/3 A C C 0 B C C 0 C C C 0 D C C 1/3 A C D 1/3 B C D 1/3 C C D 1/3 D C D 2/3 A D A 1/3 B D A 1/3 C D A 1/3 D D A 2/3 A D B 1/3 B D B 1/3 C D B 1/3 D D B 2/3 A D C 1/3 B D C 1/3 C D C 1/3 D D C 2/3 A D D 2/3 B D Brigitte CHAPUT - APMEP - 3 octobre 2009 D 2/3 C D D 2/3 D D D 1 3 - Distribution de fréquences de la proportion d’échantillonnage 3.1 - Un premier exemple Parmi les 64 échantillons : Proportion d'enfants de plus de 14 ans et demi dans l'échantillon Nombre d'échantillons Fréquences d'échantillons 0/3 1/3 2/3 3/3 27 27 9 1 42,2 % 42,2 % 14 % 1,6% Distribution d’effectifs et de fréquences de la proportion d’enfants de plus de 14 ans et demi dans les échantillons Brigitte CHAPUT - APMEP - 3 octobre 2009 3 - Distribution de fréquences de la proportion d’échantillonnage 3.1 - Un premier exemple échantillons de taille 3 45% 40% fréquences 35% 30% 25% 20% 15% 10% 5% 0% 0 1/3 2/3 Proportion d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 1 3 - Distribution de fréquences de la proportion d’échantillonnage 3.2 – D’autres situations similaires Tirage d’une boule dans une urne contenant 1 boule blanche et 3 rouges Tirage d’une boule dans une urne contenant 100 boules blanches et 300 rouges Lancer d’un dé tétraédrique équilibré et obtention d'une des faces Roue de loterie dont un quart est peint en rouge et le reste en bleu et obtention du rouge … Brigitte CHAPUT - APMEP - 3 octobre 2009 3 - Distribution de fréquences de la proportion d’échantillonnage 3.3 – D’autres tailles d'échantillons Échantillons de taille 10 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi : Échantillons avec une proportion de Fréquences d'échantillons Échantillons avec une proportion de Fréquences d'échantillons 0/10 5,6% 6/10 1,6% 1/10 18,8% 7/10 0,3% 2/10 28,2% 8/10 0,0% 3/10 25,0% 9/10 0,0% 4/10 14,6% 10/10 0,0% 5/10 5,8% d'enfants de plus de 14 ans et demi d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 3 - Distribution de fréquences de la proportion d’échantillonnage 3.3 – D’autres tailles d'échantillons échantillons de taille 10 30% fréquences 25% 20% 15% 10% 5% 0% 0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 Proportion d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 9/10 10/10 3 - Distribution de fréquences de la proportion d’échantillonnage 3.3 – D’autres tailles d'échantillons Échantillons de taille 30 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi : 0/30 0,0% 11/30 5,5% 21/30 0,0% 1/30 0,2% 12/30 2,9% 22/30 0,0% 2/30 0,9% 13/30 1,3% 23/30 0,0% 3/30 2,7% 14/30 0,5% 24/30 0,0% 4/30 6,0% 15/30 0,2% 25/30 0,0% 5/30 10,5% 16/30 0,1% 26/30 0,0% 6/30 14,5% 17/30 0,0% 27/30 0,0% 7/30 16,6% 18/30 0,0% 28/30 0,0% 8/30 15,9% 19/30 0,0% 29/30 0,0% 9/30 13,0% 20/30 0,0% 30/30 0,0% 10/30 9,1% Brigitte CHAPUT - APMEP - 3 octobre 2009 3 - Distribution de fréquences de la proportion d’échantillonnage 3.3 – D’autres tailles d'échantillons échantillons de taille 30 18% 16% fréquences 14% 12% 10% 8% 6% 4% Proportion d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 30/30 28/30 26/30 24/30 22/30 20/30 18/30 16/30 14/30 12/30 8/30 6/30 4/30 2/30 0 0% 10/30 2% 3 - Distribution de fréquences de la proportion d’échantillonnage 3.3 – D’autres tailles d'échantillons Échantillons de taille 100 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi : 11/100 0,0% 21/100 6,3% 31/100 3,4% 12/100 0,1% 22/100 7,5% 32/100 2,5% 13/100 0,1% 23/100 8,5% 33/100 1,7% 14/100 0,3% 24/100 9,1% 34/100 1,1% 15/100 0,6% 25/100 9,2% 35/100 0,7% 16/100 1,0% 26/100 8,8% 36/100 0,4% 17/100 1,7% 27/30 8,1% 37/100 0,2% 18/100 2,5% 28/30 7,0% 38/100 0,1% 19/100 3,7% 29/100 5,8% 39/100 0,1% 20/100 4,9% 30/100 4,6% 40/100 0,0% Brigitte CHAPUT - APMEP - 3 octobre 2009 3 - Distribution de fréquences de la proportion d’échantillonnage 3.3 – D’autres tailles d'échantillons échantillons de taille 100 10% 9% 8% fréquences 7% 6% 5% 4% 3% 2% Proportion d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 100/100 95/100 90/100 85/100 80/100 75/100 70/100 65/100 60/100 55/100 50/100 45/100 40/100 35/100 30/100 25/100 20/100 15/100 10/100 5/100 0% 0 1% 3 - Distribution de fréquences de la proportion d’échantillonnage 3.4 – Quand n augmente échantillons de taille 3 45% 40% fréquences 35% 30% 25% 20% 15% 10% 5% 0% 0 1/3 2/3 Proportion d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 1 3 - Distribution de fréquences de la proportion d’échantillonnage 3.4 – Quand n augmente échantillons de taille 10 30% fréquences 25% 20% 15% 10% 5% 0% 0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 Proportion d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 9/10 10/10 3 - Distribution de fréquences de la proportion d’échantillonnage 3.4 – Quand n augmente échantillons de taille 30 18% 16% fréquences 14% 12% 10% 8% 6% 4% Proportion d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 30/30 28/30 26/30 24/30 22/30 20/30 18/30 16/30 14/30 12/30 8/30 6/30 4/30 2/30 0 0% 10/30 2% 3 - Distribution de fréquences de la proportion d’échantillonnage 3.4 – Quand n augmente échantillons de taille 100 10% 9% 8% fréquences 7% 6% 5% 4% 3% 2% Proportion d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 100/100 95/100 90/100 85/100 80/100 75/100 70/100 65/100 60/100 55/100 50/100 45/100 40/100 35/100 30/100 25/100 20/100 15/100 10/100 5/100 0% 0 1% 3 - Distribution de fréquences de la proportion d’échantillonnage 3.4 – Quand n augmente Résultat : Les proportions observées sont de plus en plus souvent proches de la proportion du caractère dans la population-mère lorsque la taille de l'échantillon n augmente. Résultat : Lorsque n est grand la distribution de fréquence de la proportion d’échantillonnage s'approche d'une "distribution en cloche". Brigitte CHAPUT - APMEP - 3 octobre 2009 3 - Distribution de fréquences de la proportion d’échantillonnage 3.4 – Quand n augmente échantillons de taille 100 10% 9% 8% fréquences 7% 6% 5% 4% 3% 2% Proportion d'enfants de plus de 14 ans et demi Brigitte CHAPUT - APMEP - 3 octobre 2009 96/100 91/100 86/100 81/100 76/100 71/100 66/100 61/100 56/100 51/100 46/100 41/100 36/100 31/100 26/100 21/100 16/100 11/100 6/100 0% 1/100 1% 4 - Intervalles de fluctuation 4.1 - Définition L’intervalle de fluctuation d’une fréquence ou proportion à 95%, pour des échantillons de taille n, est l’intervalle : – d'amplitude minimale, – centré autour de p, proportion du caractère dans la population, – contenant la proportion observée sur un échantillon aléatoire de taille n, avec une probabilité égale à 0,95. Brigitte CHAPUT - APMEP - 3 octobre 2009 4 - Intervalles de fluctuation 4.2 - Détermination Échantillons de taille 10 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi : 5,6 % 1/10 18,8 % 2/10 28,2 % échantillons de taille 10 30% 25% fréquences p = 25 % 0/10 20% 3/10 25,0 % 4/10 14,6 % 5/10 5,8 % 5% 6/10 1,6 % 0% 7/30 0,3 % 8/10 0,0 % 9/10 0,0 % 10/10 0,0 % Brigitte CHAPUT - APMEP - 3 octobre 2009 15% 10% 0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 10/10 Proportion d'enfants de plus de 14 ans et demi Distribution des fréquences 4 - Intervalles de fluctuation 4.2 - Détermination Échantillons de taille 10 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi : 5,6 % 1/10 18,8 % 2/10 28,2 % échantillons de taille 10 30% 25% 86,6 % fréquences p = 25 % 0/10 20% 3/10 25,0 % 4/10 14,6 % 5/10 5,8 % 5% 6/10 1,6 % 0% 7/30 0,3 % 8/10 0,0 % 9/10 0,0 % 10/10 0,0 % Brigitte CHAPUT - APMEP - 3 octobre 2009 15% 10% 0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 10/10 Proportion d'enfants de plus de 14 ans et demi Distribution des fréquences 4 - Intervalles de fluctuation 4.2 - Détermination Échantillons de taille 10 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi : 5,6 % 1/10 18,8 % 2/10 28,2 % échantillons de taille 10 30% 25% 98 % fréquences p = 25 % 0/10 20% 3/10 25,0 % 4/10 14,6 % 5/10 5,8 % 5% 6/10 1,6 % 0% 7/30 0,3 % 8/10 0,0 % 9/10 0,0 % 10/10 0,0 % Brigitte CHAPUT - APMEP - 3 octobre 2009 15% 10% 0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 10/10 Proportion d'enfants de plus de 14 ans et demi Distribution des fréquences L'intervalle de fluctuation est [0 ; 0,5]. 4 - Intervalles de fluctuation 4.2 - Détermination Échantillons de taille 30 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi : p = 25 % 0/30 0,0% 11/30 5,5% 21/30 0,0% 1/30 0,2% 12/30 2,9% 22/30 0,0% 2/30 0,9% 13/30 1,3% 23/30 0,0% 3/30 2,7% 14/30 0,5% 24/30 0,0% 4/30 6,0% 15/30 0,2% 25/30 0,0% 5/30 10,5% 16/30 0,1% 26/30 0,0% 6/30 14,5% 17/30 0,0% 27/30 0,0% 7/30 16,6% 18/30 0,0% 28/30 0,0% 8/30 15,9% 19/30 0,0% 29/30 0,0% 9/30 13,0% 20/30 0,0% 30/30 0,0% 10/30 9,1% 96,7 % Brigitte CHAPUT - APMEP - 3 octobre 2009 4 - Intervalles de fluctuation 4.2 - Détermination échantillons de taille 30 18% 16% fréquences 14% 12% 10% 8% 6% 4% Proportion d'enfants de plus de 14 ans et demi L'intervalle de fluctuation est [0,1 ; 0,4]. Brigitte CHAPUT - APMEP - 3 octobre 2009 30/30 28/30 26/30 24/30 22/30 20/30 18/30 16/30 14/30 12/30 8/30 6/30 4/30 2/30 0 0% 10/30 2% 4 - Intervalles de fluctuation 4.2 - Détermination Échantillons de taille 100 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi : 95,1 % 11/100 0,0% 21/100 6,3% 31/100 3,4% 12/100 0,1% 22/100 7,5% 32/100 2,5% 13/100 0,1% 23/100 8,5% 33/100 1,7% 14/100 0,3% 24/100 9,1% 34/100 1,1% 15/100 0,6% 25 % 25/100 9,2% 35/100 0,7% 16/100 1,0% 26/100 8,8% 36/100 0,4% 17/100 1,7% 27/30 8,1% 37/100 0,2% 18/100 2,5% 28/30 7,0% 38/100 0,1% 19/100 3,7% 29/100 5,8% 39/100 0,1% 20/100 4,9% 30/100 4,6% 40/100 0,0% Brigitte CHAPUT - APMEP - 3 octobre 2009 4 - Intervalles de fluctuation 4.2 - Détermination échantillons de taille 100 10% 9% 8% fréquences 7% 6% 5% 4% 3% 2% Proportion d'enfants de plus de 14 ans et demi L'intervalle de fluctuation est [0,17 ; 0,33]. Brigitte CHAPUT - APMEP - 3 octobre 2009 100/100 95/100 90/100 85/100 80/100 75/100 70/100 65/100 60/100 55/100 50/100 45/100 40/100 35/100 30/100 25/100 20/100 15/100 10/100 5/100 0% 0 1% 5 - Des mathématiques 5.1 – Espérance et variance de la moyenne d’échantillonnage Soit X1, X2,..., Xn une suite de n variables aléatoires indépendantes de même loi de probabilité admettant pour espérance mathématique µ et pour écart-type σ. _ 1 _ On pose : X = (X1 + X2 + ... + Xn). n _ σ X a pour espérance µ et pour écart-type . n Brigitte CHAPUT - APMEP - 3 octobre 2009 5 - Des mathématiques 5.2 - Des théorèmes Loi faible des grands nombres : _ Pour tout ε > 0, P (|X - µ | ≤ ε ) tend vers 1 quand n tend vers l'infini. Théorème limite central : _ Alors pour n grand, la loi de la moyenne X peut être approchée par la loi normale de paramètres µ et σ . n Brigitte CHAPUT - APMEP - 3 octobre 2009 5 - Des mathématiques 5.3 - Application à la fréquence (ou proportion) d ’échantillonnage • Dans une population statistique, on s’intéresse à une propriété A. On tire un échantillon de taille n. Prenons pour variables Xi, les variables qui, à chaque échantillon, associent la valeur 1 si le i-ème individu possède la propriété A et 0 sinon. 1 _ • (X1 + X2 + ... + Xn) évalue la proportion de la n propriété A dans l’échantillon, notons-la F. Brigitte CHAPUT - APMEP - 3 octobre 2009 5 - Des mathématiques 5.3 - Application à la fréquence (ou proportion) d ’échantillonnage • Comme l’espérance mathématique des variables aléatoires Xi est égale à p, alors d’après la loi des grands nombres Pour tout ε > 0, P (|F - p| ≤ ε ) tend vers 1 quand n tend vers l'infini. • La probabilité que F prenne une valeur éloignée de p de moins d’un ε fixé à l’avance tend vers 1 lorsque n tend vers l’infini. Brigitte CHAPUT - APMEP - 3 octobre 2009 5 - Des mathématiques 5.3 - Application à la fréquence (ou proportion) d ’échantillonnage • Comme l’espérance mathématique et l'écart-type des variables aléatoires Xi sont respectivement p et p (1 − p) , d’après le théorème limite central : Pour n grand, la loi de F peut être approchée par la loi normale de paramètres p et Brigitte CHAPUT - APMEP - 3 octobre 2009 p (1 − p) . n 5 - Des mathématiques 5.4 - Intervalle de fluctuation d’une fréquence d’échantillonnage On cherche un réel α tel que P(p − α ≤ F ≤ p + α) = 0,95 D'après le théorème limite central, pour n assez grand (n ≥ 25), la loi de la F peut être approchée par la loi normale de paramètres p et Alors la loi de p (1 − p) . n F−p est approchée par la loi p (1 − p) n normale centrée, réduite. Brigitte CHAPUT - APMEP - 3 octobre 2009 5 - Des mathématiques 5.4 - Intervalle de fluctuation d’une fréquence d’échantillonnage L'équation P(p − α ≤ F ≤ p + α) = 0,95 devient : P −α ≤ p (1 − p) n La table de la loi normale centrée, réduite donne α p (1 − p) n = 1,96 Brigitte CHAPUT - APMEP - 3 octobre 2009 F−p ≤ p (1 − p) n α = 0,95 p (1 − p) n 95 % 5 - Des mathématiques 5.4 - Intervalle de fluctuation d’une fréquence d’échantillonnage L'intervalle de fluctuation est approché par : p − 1,96 p (1 − p) ; p + 1,96 n p (1 − p) n Or 1,96 < 2 et pour 0,2 ≤ p ≤ 0,8, on a donc 0,4 ≤ p (1 − p) ≤ 0,5 Ainsi 1,96 p (1 − p) est compris entre 0,8 et 1. Brigitte CHAPUT - APMEP - 3 octobre 2009 5 - Des mathématiques 5.4 - Intervalle de fluctuation d’une fréquence d’échantillonnage Finalement l'intervalle de fluctuation au seuil de 95%, relatif aux échantillons de taille n, est approché par l’intervalle : p − 1 n ;p+ 1 n Remarque : Cet intervalle contient l'intervalle : p − 1,96 Brigitte CHAPUT - APMEP - 3 octobre 2009 p (1 − p) ; p + 1,96 n p (1 − p) n 6 - Estimation par intervalle de confiance 6.1 - Construction d'un abaque On constitue, avec remise, des échantillons de taille 40, dans une population. On considère une modalité d’un caractère qualitatif observée pour p =37 % des individus de la population. L'intervalle de fluctuation au seuil de 95%, relatif aux échantillons de taille 40, est [0,22 ; 0,52]. Brigitte CHAPUT - APMEP - 3 octobre 2009 6 - Estimation par intervalle de confiance 6.1 - Construction d'un abaque Représentation de l'intervalle au seuil de 95%, relatif aux échantillons de taille 40 pour p =0,37. Brigitte CHAPUT - APMEP - 3 octobre 2009 6 - Estimation par intervalle de confiance 6.1 - Construction d'un abaque Représentation de l'intervalle au seuil de 95%, relatif aux échantillons de taille 40 pour p =0,37. Brigitte CHAPUT - APMEP - 3 octobre 2009 6 - Estimation par intervalle de confiance 6.1 - Construction d'un abaque Représentation de l'intervalle au seuil de 95%, relatif aux échantillons de taille 40 pour p =0,37 et p =0,40. Brigitte CHAPUT - APMEP - 3 octobre 2009 6 - Estimation par intervalle de confiance 6.1 - Construction d'un abaque Représentation de l'intervalle au seuil de 95%, relatif aux échantillons de taille 40 pour différentes valeurs de p. Brigitte CHAPUT - APMEP - 3 octobre 2009 6 - Estimation par intervalle de confiance 6.1 - Construction d'un abaque Brigitte CHAPUT - APMEP - 3 octobre 2009 6 - Estimation par intervalle de confiance 6.2 - Utilisation de l'abaque On souhaite estimer la proportion p (inconnue) d'individus présentant une propriété donnée dans une population statistique à partir d'un échantillon de taille 40 prélevé au hasard et sans remise. Supposons que la propriété est observée dans l'échantillon avec une fréquence de 60 %. On détermine ensuite les valeurs de p qui font en sorte que 0,6 appartienne à l'intervalle de fluctuation au seuil de 95 %, relatif aux échantillons de taille 40 associé à p . Brigitte CHAPUT - APMEP - 3 octobre 2009 6 - Estimation par intervalle de confiance 6.2 - Utilisation de l'abaque Brigitte CHAPUT - APMEP - 3 octobre 2009 6 - Estimation par intervalle de confiance 6.2 - Utilisation de l'abaque Intervalle de confiance de p à 95 % Brigitte CHAPUT - APMEP - 3 octobre 2009 6 - Estimation par intervalle de confiance 6.2 - Utilisation de l'abaque Intervalle de confiance de p à 95 % Brigitte CHAPUT - APMEP - 3 octobre 2009