Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Prise de décision (avec la loi binomiale) On considère une population dans laquelle on suppose que la proportion d’un certain caractère est p0 . Pour analyser cette hypothèse, on y prélève, au hasard et avec remise, un échantillon de taille n sur lequel on observe une fréquence f du caractère. On rejette l’hypothèse selon laquelle la proportion dans la population est p0 lorsque la fréquence f observée est trop éloignée de p0 , dans un sens ou dans l’autre. On choisit de fixer le seuil de décision de telle sorte que la probabilité de rejeter l’hypothèse, alors qu’elle est vraie, soit inférieure à 5 %. Lorsque la proportion dans la population vaut p0 , la variable aléatoire X correspondant au nombre de fois où le caractère est observé dans un échantillon aléatoire de taille n , suit la loi binomiale de paramètres B n; p0 . On cherche à partager l’intervalle 0; n , où X prend ses valeurs, en trois intervalles 0; a 1 , a; b et b 1; n de telle sorte que X prenne ses valeurs dans chacun des intervalles extrêmes avec une probabilité proche de 2,5%, sans dépasser cette valeur. En tabulant les probabilités cumulées croissantes p X k , pour k allant de 0 à n , il suffit de déterminer dans le tableau le plus petit entier a tel que p X a 0, 025 et le plus petit entier b tel que p X b 0,975 . La règle de prise de décision est la suivante : si la fréquence observée f appartient à l’intervalle a n ; b n , l’hypothèse selon laquelle la proportion est p0 dans la population n’est pas remise en question et on l’accepte, sinon, on rejette l’hypothèse selon laquelle cette proportion vaut p0 . Page 1 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Santé Un médecin veut savoir si, dans sa région, le pourcentage d’habitants atteints d’hypertension artérielle est égal à la valeur de 16 % récemment publiée pour des populations semblables. En notant p la proportion d’hypertendus dans la population de sa région, le médecin formule l’hypothèse p=0,16. Pour vérifier cette hypothèse, le médecin constitue un échantillon de n=100 habitants de la région, dont il détermine la fréquence f d’hypertendus (l’échantillon est prélevé au hasard et la population est suffisamment importante pour considérer qu’il s’agit de tirages avec remise). Enoncer la règle de décision permettant de rejeter ou non l’hypothèse p=0,16 selon la valeur de la fréquence f d’hypertendus observée dans l’échantillon prélevé au hasard dans la population. Politique Monsieur Z, chef du gouvernement d’un pays lointain, affirme que 52 % des électeurs lui font confiance. On interroge 100 électeurs au hasard (l’échantillon est prélevé au hasard et la population est suffisamment grande pour considérer qu’il s’agit de tirages avec remise). Sur les 100 électeurs interrogés au hasard, 43 déclarent avoir confiance en Monsieur Z. Peuton considérer l’affirmation de Monsieur Z comme exacte ? Votre raisonnement sera justifié par la détermination d’un intervalle de confiance au seuil de 5%. Discrimination En Novembre 1976 dans un comté du sud du Texas, Rodrigo Partida est condamné à huit ans de prison. Il attaque ce jugement au motif que la désignation des jurés de ce comté est, selon lui, discriminante à l’égard des Américains d’origine mexicaine. Alors que 80 % de la population du comté est d’origine mexicaine, sur les 870 personnes convoquées pour être jurés lors des années précédentes, il n’y a eu que 339 personnes d’origine mexicaine. Devant la Cour Suprême, un expert statisticien produit des arguments pour convaincre du bien fondé de la requête de l’accusé. En vous situant dans le rôle de cet expert, utilisez la loi binomiale pour montrer que la sous-représentation des américains d’origine mexicaine dans les jurys de ce comté est « significative ». Une table des probabilités cumulées croissantes de la loi B 870;0,8 est fournie ci-après. Page 2 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Sécurité Un groupe de citoyens demande à la municipalité d’une ville la modification d’un carrefour en affirmant que 40 % des automobilistes tournent en utilisant une mauvaise file. Un officier de police constate que sur 500 voitures prises au hasard, 190 prennent une mauvaise file. 1. Déterminer, en utilisant la loi binomiale sous l’hypothèse p = 0,4, l’intervalle de fluctuation à 95 %. 2. D’après l’échantillon, peut-on considérer, au seuil de 5 %, comme exacte l’affirmation du groupe de citoyens ? Sous contrôle Dans l’industrie automobile, certains véhicules, après leur passage en peinture, présentent un défaut de type « grains ponctuels ». Ce défaut est pratiquement imperceptible, mais constitue un témoin de la qualité du processus de peinture. Lorsque le processus est « sous contrôle », 20 % des capots produits ont ce type de défaut. Des modifications apportées au processus de fabrication sont susceptibles de modifier ce pourcentage, dans un sens ou dans l’autre. On contrôle la production en prélevant des échantillons de n = 50 capots. La production est suffisamment importante pour considérer qu’il s’agit de tirages au hasard avec remise. On choisit de fixer le seuil de décision de sorte que la probabilité de rejeter l’hypothèse à tort soit inférieure à 5 %. On accepte l’hypothèse selon laquelle la proportion dans la production est p = 0,2, lorsque la fréquence f observée sur l’échantillon se situe dans l’intervalle de fluctuation à plus de 95 % correspondant au complémentaire de la zone de rejet. Les « limites de contrôle » sont les bornes de l’intervalle de fluctuation à 95 %, calculées en considérant la variable aléatoire X correspondant au nombre de capots présentant le défaut sur un échantillon de taille 50. Sous l’hypothèse p = 0,2, cette variable aléatoire suit la loi binomiale de paramètres n = 50 et p = 0,2. Calculer les limites de contrôle. Le processus est sous contrôle, quelle est la probabilité de commettre une erreur de décision à partir d’un échantillon ? Gauchers Dans le monde, la proportion de gauchers est 12 %. Soit n le nombre d’élèves dans votre classe. Déterminer, à l’aide de la loi binomiale, l’intervalle de fluctuation à 95 % de la fréquence des gauchers sur un échantillon aléatoire de taille n. Votre classe est-elle « représentative » de la proportion de gauchers dans le monde ? Page 3 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Homme/femme Deux entreprises recrutent leur personnel dans un vivier comportant autant d’hommes de que de femmes. Voici la répartition entre hommes et femmes dans ces deux entreprises. Peut-on suspecter l’une des deux entreprises de ne pas respecter la parité hommes/femmes ? Hommes Femmes Total Ent A 57 43 100 Ent B 1350 1150 2500 Extrait d’écran d’une calculatrice Extrait d’écran d’un tableur Page 4 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Intervalle de fluctuation (avec la loi binomiale) Dans une certaine population la proportion d’individus présentant le caractère C est p . On analyse ce que l’on peut dire de la fréquence f du caractère C sur un échantillon de taille n prélevé de manière aléatoire dans cette population. Si on note X n la variable aléatoire associant à chaque échantillon de taille n le nombre d’individus présentant le caractère C et si on note Fn la variable aléatoire définie par Fn X n n qui correspond à la fréquence du caractère C dans l’échantillon, alors nous avons vu que : X n suit la loi binomiale B n, p . On peut donc déterminer à l’aide de la loi binomiale un intervalle de la forme a n ; b n , avec a et b deux entiers tels que p X n a 0, 025 et p X n b 0, 025 . a b Un tel intervalle vérifie p Fn ; 0,95 . n n Un tel intervalle est donc appelé intervalle de fluctuation au seuil de 95%. Rappel indispensable : le théorème de Moivre-Laplace (admis) On considère une variable aléatoire X n qui suit la loi binomiale B n; p . On note Z n X n np np 1 p la variable centrée et réduite associée à la variable X n . 2 Pour tous réels a et b tels que a b : lim p a Z n b p a Z b n b a 1 x2 e dx 2 Autre rappel indispensable Soit Z est la variable aléatoire qui suit la loi 1 e normale N 0;1 de densité f x 2 x2 2 Pour tour nombre réel tel que 0 1 il existe un unique réel positif u tel que : p u Z u 1 Rappelons que la démonstration se base sur l’utilisation du théorème des valeurs interm. Page 5 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Remarquons les équivalences suivantes : I u I u I X n np u np 1 p np 1 p X n np u np 1 p u np 1 p n I p u p 1 p n u np 1 p Xn p n n Xn p u n p 1 p n Utilisons les deux rappels pour affirmer que : Pour tout nombre réel tel que 0 1 il existe un unique réel positif u tel que : X n np lim p u u lim p p u n n np 1 p p 1 p n Fn p u p 1 p 1 n Nous pouvons en déduire que : Pour un n « assez grand » (*) et pour un nombre réel tel que 0 1 , il existe un unique réel positif u (défini au chapitre précédent) tel que l’approximation ci-dessous soit vérifiée : p p u p 1 p n Fn p u p 1 p 1 n (*) en pratique, les conditions communément admises pour pratiquer ce type d’approximation sont les suivantes : n 30 , np 5 et n 1 p 5 . Intervalle de fluctuation asymptotique L’intervalle I n p u p 1 p n ; p u p 1 p n est un intervalle de fluctuation Xn au seuil 1 , cela signifie que pour un n assez n grand, la variable Fn prend ses valeurs dans l’intervalle I n avec une probabilité proche de 1 . asymptotique de la variable aléatoire Fn Page 6 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Théorème fondamental Xn . n On considère un nombre réel tel que 0 1 et u le réel tel que p u Z u 1 On considère une variable aléatoire X n qui suit la loi binomiale B n; p et on note Fn où Z est la variable aléatoire qui suit la loi normale centrée réduite N 0;1 . Si I n p u p 1 p n ; p u p 1 p alors lim p Fn I n 1 . n n Un troisième rappel important Intervalle de fluctuation Au seuil de 95% : I n p 1,96 p 1 p Au seuil de 99% : I n p 2,58 p 1 p n n ; p 1,96 ; p 2,58 p 1 p n p 1 p n Prise de décision au seuil de 5% On cherche à savoir, au seuil de décision de 5%, si la proportion p du caractère C dans une population donnée vaut p p0 ou non. On prélève un échantillon de taille n (on fait en sorte que n 30 , np 5 et n 1 p 5 ). La prise de décision consiste en : Calcul de l’intervalle de confiance I , Calcul de la fréquence f du caractère C sur l’échantillon de taille n prélevé, Prise de décision : si f I on rejette l’hypothèse p p0 , sinon on l’accepte. Page 7 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Petits pois Selon la théorie de Mendel, certaines cosses de petits pois devraient fournir des petits pois jaunes et verts dans des proportions respectives de 75% et 25%. On souhaite tester l’hypothèse selon laquelle la proportion des pois jaunes est p=0,75 en mettant en place une expérience permettant d’obtenir 224 petits pois considérés comme un échantillon aléatoire. 1. Sous l’hypothèse p=0,75, déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire correspondant à la fréquence des pois jaunes sur un échantillon de taille 224 (arrondir les bornes de l’intervalle au centième près). 2. Enoncer la règle de décision permettant de rejeter, ou non, l’hypothèse p=0,75, au seuil de 5% sur un échantillon aléatoire de taille 224. 3. L’expérience a permis d’obtenir 176 pois jaunes et 48 pois verts, que peut-on en déduire ? Lancers de pièces On lance 100 fois une pièce de monnaie. 1. En supposant que la pièce est équilibrée, déterminer l’intervalle de fluctuation asymptotique de la fréquence de « pile » : au seuil de 95% ? au seuil de 99% ? 2. On lance une pièce 100 fois et on obtient 38 « pile » et 62 « face ». Peut-on considérer que la pièce est équilibrée : au seuil de décision de 5% ? au seuil de décision de 1% ? La pièce de Buffon Dans son essai d’arithmétique morale, Buffon relate une expérience selon laquelle un enfant ayant lancé 4040 fois une pièce de monnaie, obtient 2048 fois « pile ». On peut considérer que cette expérience constitue une observation d’un échantillon de taille n=4040 dans la population de tous les lancers possibles avec la pièce de Buffon. 1. Sous l’hypothèse p=0,5 déterminer l’intervalle de fluctuation au seuil de 95% de la variable aléatoire F correspondant à la fréquence de « pile » sur un échantillon aléatoire de taille 4040. 2. Enoncer la règle de décision permettant de rejeter, ou non, l’hypothèse p=0,5 au seuil de 5%. Quelle conclusion peut-on tirer du nombre de « pile » obtenus par l’enfant ? Groupes sanguins Les centres de transfusion sanguine ont diffusé le tableau des répartitions, en France, des principaux groupes sanguins. La proportion des groupes O+ et O- est p=0,44. Une collecte de sang a été organisée sur le campus d’une université à laquelle ont participé 356 étudiants. On souhaite tester l’hypothèse selon laquelle ces étudiants sont représentatifs, au seuil de 95%, de la proportion des groupes O. L’analyse des prélèvements montre que sur les 356 donneurs, 148 appartiennent au groupe O. Quelle conclusion peut-on en tirer ? Page 8 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation D’un intervalle de fluctuation asymptotique vers un intervalle de confiance On souhaite estimer la prévalence du surpoids dans une ville, c’est-à-dire la proportion de personnes ayant une masse trop importante par rapport à leur taille. Pour cela 460 personnes ont été sélectionnées de manière aléatoire à partir de la liste des logements connue par la municipalité, c’est-à-dire que le fait d’avoir été sélectionné pour participer à l’étude est uniquement dû au hasard. On admet que cette procédure permet d’assimiler la sélection des personnes interrogées à un schéma de Bernoulli. Un enquêteur s’est déplacé au sein de chaque logement après avoir convenu d’un rendez-vous afin de recueillir les informations nécessaires à l’enquête. L’échantillon est-il représentatif de la population ? Dans un premier temps, l’enquêteur va s’assurer que l’échantillon est représentatif de la population qu’on étudie sur des informations qu’on peut vérifier et qui sont en lien avec le critère étudié. Dans le cas présent on peut connaître par exemple la proportion d’hommes et de femmes dans la population de la ville, ainsi que la répartition selon l’âge en demandant à la municipalité qui se référera aux informations du recensement. Ainsi on sait que dans la population il y a 46% d’hommes et 20% de personnes de plus de 60. Homme Femme échantillon 200 260 Total 460 Parallèlement on peut comptabiliser le nombre d’hommes et de femmes dans l’échantillon ainsi que la répartition selon l’âge. <60ans échantillon 352 Total 460 >60ans 108 1. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire « proportion de femmes » dans un échantillon aléatoire de taille 460. 2. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire « proportion des plus de 60 ans » dans un échantillon aléatoire de taille 460. 3. Si pour chacune de ces variables aléatoires, genre et âge, l’intervalle de fluctuation asymptotique contient la valeur de l’échantillon, on considère que l’échantillon est représentatif de la population pour ces informations. Quelle conclusion peut-on tirer ici ? Page 9 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation La première étape de ce travail a donc été de sélectionner un échantillon qui soit accepté comme « représentatif » de la population. Ainsi les informations qui seront obtenues à partir de cet échantillon seront généralisables, avec un certain nombre de précautions, à l’ensemble de la population dont il est extrait. Dans le cas de l’étude présentée ici, on souhaite estimer la proportion de personnes en surpoids ; pour cela il est tout d’abord important de définir le surpoids. La définition du surpoids donnée par l’OMS (Organisation Mondiale de la Santé) est la suivante : une personne est considérée en surpoids si son IMC (Indice de masse corporelle) est supérieur à 25. L’IMC se calcule de la manière suivante : masse en kg/(taille en m)². Intervalle de confiance d’une probabilité La proportion de personnes en surpoids dans l’échantillon étudié est de 29,5%. Comme il s’agit d’un calcul réalisé à partir des données d’un échantillon on sait que cette valeur ne correspond pas exactement à la valeur de la prévalence du surpoids dans la population, car si nous avions pris un autre échantillon nous aurions obtenu une autre valeur. Pour cette raison il est nécessaire de communiquer un intervalle qui sera obtenu à partir des informations observées et pour lequel on puisse dire avec un « niveau de confiance » supérieur à 0,95 qu’il contient la vraie valeur de la prévalence du surpoids dans la ville. Déterminer graphiquement cet intervalle de confiance. Page 10 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Une majoration Montrer que pour tout p compris entre 0 et 1 la 1,96 p 1 p est majorée par 1. quantité On pourra pour cela étudier les variations de la fonction g x x 1 x sur l’intervalle 0;1 . Deux inégalités Montrer que pour tout p compris entre 0 et 1 et n entier on a p 1,96 Montrer que pour tout p compris entre 0 et 1 et n entier on a p 1,96 p 1 p n p 1 p n p 1 (1) n p 1 (2) n Une inclusion On note I n p 1,96 p 1 p n ; p 1,96 p 1 p 1 1 et J n p ;p . n n n On rappelle que I n est l’intervalle de fluctuation asymptotique au seuil de 95%. On appellera le nouvel intervalle J n défini ci-dessus « intervalle de fluctuation asymptotique simplifié ». Déduire des inégalités (1) et (2) l’inclusion de l’intervalle I n dans l’intervalle J n . Une conclusion On peut « agrandir » l’intervalle de fluctuation asymptotique au seuil de 95% en majorant la quantité 1,96 p 1 p par 1 pour 0 p 1 . Ainsi si X n est une variable aléatoire qui suit la loi binomiale B n, p et si Fn X n n alors : pour tout p tel que 0 p 1 , il existe un entier n0 tel que si n n0 on puisse affirmer : 1 1 p p Fn p 0,95 n n Page 11 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Remarquons l’équivalence suivante : p 1 1 1 1 Fn p Fn p Fn n n n n Utilisons la conclusion précédente pour affirmer que : Si X n est une variable aléatoire qui suit la loi binomiale B n, p et si Fn X n n alors pour tout 1 1 p Fn p tel que 0 p 1 , il existe un entier n0 tel que si n n0 p Fn 0,95 . n n Proposons la définition d’un intervalle de confiance à 95% : 1 1 ;f Soit f la fréquence observée sur un échantillon de taille n . L’intervalle f est n n un intervalle de confiance de la proportion inconnue p au niveau de confiance de 95%. NB : les conditions communément admises sont les suivantes : n 30 , nf 5 et n 1 f 5 . Page 12 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Surpoids Dans une certaine population, on a observé un échantillon de taille n=500 d’adolescents de 15 ans dans lequel 210 présentent un surpoids. Donner un intervalle de confiance de la proportion p d’adolescents de cette population présentant un surpoids au niveau de confiance 95%. Poissons malades On a observé 180 poissons malades sur 800 poissons pêchés dans une rivière. En considérant qu’il s’agit d’un échantillon aléatoire prélevé avec remise (il y a de nombreux poissons dans la rivière), donner un intervalle de confiance de la proportion de poissons malades dans la rivière au niveau de confiance de 95%. Pièces sans défaut On considère une grande quantité de pièces industrielles devant être livrées à une chaîne d’hypermarchés. On prélève au hasard un échantillon de 100 pièces dans cette livraison. La livraison est assez importante pour que l’on puisse assimiler ce tirage à un tirage avec remise. On constate que 96 pièces sont sans défaut. Déterminer un intervalle de confiance de la proportion de pièces de la livraison qui sont sans aucun défaut, avec un niveau de confiance de 95%. Virus On veut estimer la proportion p de personnes immunisées contre un certain virus parmi la population d’une ville. On prélève un échantillon aléatoire de 500 personnes parmi cette population. La population est suffisamment importante pour assimiler ce prélèvement à un tirage au hasard avec remise. Après analyses, on dénombre 241 personnes immunisées contre ce virus, parmi les 500 de l’échantillon. Donner un intervalle de confiance de la proportion de personnes immunisées contre ce virus parmi la population de la ville, avec un niveau de confiance de 95%. Quelle est la taille minimale de l’échantillon qui aurait permis d’obtenir un intervalle de confiance de rayon inférieur ou égal à 0,01 ? Une option à prendre Une agence de voyage propose, en option supplémentaire dans un de ses circuits, la visite d’une exposition. En consultant au hasard et avec remise 60 fiches de clients parmi les 2054 clients inscrits sur la période considérée, le directeur de l’agence observe que l’option est mentionnée seulement 9 fois. Donner un intervalle de confiance à 95% de la proportion inconnue p de personnes ayant fait le choix de cette option parmi les 2054 clients. Le directeur considère que l’information fournie par l’intervalle de confiance est trop imprécise (longueur de l’intervalle trop grande). Il procède à un nouveau prélèvement de 60 fiches parmi les 2054. Sur l’échantillon global de taille 120 prélevé, l’option apparaît 18 fois. Quel intervalle de confiance de 95% l’échantillon complété permet-il de fournir ? Page 13 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Sondage Pour décider de la construction d’un grand stade, une municipalité veut sonder la population pour estimer si plus de 50% des électeurs y sont favorables. La municipalité réalise un sondage aléatoire de taille 100 et obtient 54 avis favorables. Quelle est la fréquence d’avis favorables sur ce sondage ? La municipalité peut-elle décider de la construction du stade en prétextant que plus de 50% de la population y est favorable ? On suppose que la municipalité réalise un sondage de taille n et que la fréquence des votes favorables reste égale à 0,54. Si p est la proportion (inconnue) d’avis favorables dans la population, donner l’expression d’un intervalle de confiance de p au niveau de 95%. La municipalité ne construira ce stade que si la proportion p d’avis favorable dépasse 50%. Déterminer à partir de quelle valeur de n la municipalité pourra prendre cette décision. Statistiquement fondé ? Pour comparer les cotes de popularité de trois personnalités X, Y et Z un journal a réalisé un sondage : sur 1320 personnes interrogées, 27% ont voté pour X, 38,5% ont voté pour Y et 34,5% ont voté pour Z. Estimer par un intervalle la cote de popularité de X, de Y et de Z dans la population au niveau de confiance de 95%. Un classement peut-il être publié ? Avec ces mêmes taux, pour quelle taille du sondage un classement aurait été statistiquement fondé au niveau de confiance de 95% ? Premier tour d’une élection présidentielle Le 18 avril 2002, l’institut IPSOS effectue un sondage dans la population en âge de voter. On constitue un échantillon de 1000 personnes (inscrites sur les listes électorales) que l’on suppose choisies de manière aléatoire. Sur les 1000 personnes : 140 ont déclaré vouloir voter pour JeanMarie Le Pen, 195 personnes ont déclaré vouloir voter pour Jacques Chirac, 170 ont déclaré vouloir voter pour Lionel Jospin. Quels seront les deux candidats présents au second tour ? Pour information les résultats obtenus par ces trois candidats au premier tour de l’élection ont été les suivants : 16,9% - 19,9% - 16,2% Intervalles disjoints Un maraîcher achète un lot de semences de tomates pour produire ses plants de tomate. Il lui reste des semences de l'année passée, dont il doit contrôler le taux de germination pour pouvoir les utiliser avec les autres. En effet, des taux de germination trop différents provoquent des trous dans les plates bandes de production, ce qui génère un coût de manutention plus élevé. Il lui faut donc comparer les taux de germination des semences des deux années. Une stratégie consiste à calculer et à comparer les intervalles de confiance des taux de germination (qui sont des proportions) des plants de l'année et de l'année précédente. Si les deux intervalles ne se recoupent pas, on peut conclure à une différence de taux de germination entre les semences des deux origines. Il faudra alors les semer séparément. Pour faire cette comparaison, le maraîcher prélève, aléatoirement dans les semences de l'année, un échantillon de 200 graines qu'il met à germer. Il constate que 185 graines germent. Il prélève ensuite, aléatoirement dans les semences de l'année précédente, un échantillon de 200 graines qu'il met à germer. Il constate que 150 graines germent. Aidez le maraîcher à prendre une décision. Page 14 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Dépistage de la bronchiolite Dans le but d’évaluer la prise en charge de la bronchiolite du nourrisson dans un hôpital de la région Aquitaine, une étude rétrospective a été mise en place. Il est recommandé de coucher l’enfant de manière très inclinée (couchage en proclive) dans le cadre de la prise en charge de la bronchiolite. On évalue cette pratique à partir d’un échantillon de 134 dossiers. 106 des enfants ont été couchés en proclive. Déterminer un intervalle de confiance au niveau de confiance de 95% de la proportion d’enfants dont le couchage respecte la recommandation. Une étude plus fine permet de comparer les pratiques entre les différents services ayant admis des enfants. Le tableau ci-dessous donne la répartition des cas suivant le type de services et le respect de la recommandation de couchage en proclive. Couchage proclive Oui Non Total En service des urgences 45 29 74 En service hospitalier 52 8 60 Total 97 37 134 Déterminer un intervalle de confiance au seuil de 95% de la proportion de couchage en proclive pour chaque type de service. Peut-on conclure selon vous au seuil de 95% que la pratique de couchage n’est pas identique selon le service ? Chikungunya à Mayotte L’image proposée ci-dessous, extraite d’une revue médicale illustre la prévalence du chikungunya à Mayotte (pourcentage de personnes ayant été en contact avec la maladie). Les « barres d’erreur » figurant sur le graphique correspondent à des intervalles de confiance à 95%. Estimer la taille de l’échantillon, tous âges confondus utilisé dans cette étude. Donner une raison expliquant pourquoi les barres d’erreurs sont de longueurs différentes selon les classes d’âge. Peut-on, d’après cette étude, considérer qu’il existe une différence significative de la prévalence du chikungunya selon les classes d’âge ? Page 15 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation Intervalle de fluctuation ? ou intervalle de confiance ? Règle générale On utilise un intervalle de fluctuation lorsque la proportion p dans la population est connue ou si l’on fait une hypothèse sur sa valeur. On utilise un intervalle de confiance lorsque l’on veut estimer une proportion inconnue dans une population. Test de conformité d’une proportion On veut déterminer si la proportion observée dans un échantillon est conforme à une valeur de référence connue dans la population. Sous l’hypothèse que l’échantillon est issu d’un tirage aléatoire correspondant à un schéma de Bernoulli (tirage avec remise ou s’y apparentant), la variable fréquence Fn appartient à un intervalle de fluctuation avec une probabilité déterminée. En fonction de l’appartenance ou non de la fréquence observée à cet intervalle, on peut prendre une décision concernant la conformité de l’échantillon. Si les conditions d’utilisation sont réunies, on détermine l’intervalle de fluctuation asymptotique, sinon on a recours à un intervalle de fluctuation calculé avec la loi binomiale. Estimation d’une proportion inconnue p grâce à un échantillon aléatoire On se place dans le cas où l’échantillon comporte au moins 30 éléments afin de pouvoir utiliser l’intervalle de confiance au programme de la classe de terminale (*). Si la fréquence f observée est telle que nf 5 et n 1 f 5 , on considère qu’on peut conclure qu’un intervalle de confiance de la proportion inconnue p au niveau de confiance de 95% est f 1 (*) un intervalle de confiance de 95% plus précis est f 1,96 f 1 f n n ; f 1 ; f 1,96 n f 1 f n Un tableau pour récapituler Intervalle de fluctuation au seuil de 95% Intervalle obtenu avec la loi binomiale : Intervalle de fluctuation asymptotique : On l’utilise lorsque : a n ; b n avec a et b deux entiers tels que p X n a 0, 025 et p X n b 0, 025 p 1 p p 1 p Intervalle de confiance à 95% / f 1 n ; f 1 n p 1,96 ; p 1,96 n n la proportion p dans la population est connue on veut estimer p inconnu à ou quand on fait une hypothèse sur sa valeur. partir d’un échantillon. Page 16 Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation L‘éducation à l'aléatoire devrait avoir pour but fondamental la prise de conscience que toute décision s'accompagne d'un risque mais que ce risque peut être évalué. » Norbert Meunier. Gauchers et décision unilatérale Page 17