Douine – Terminale S – Activités – Chapitre 6 – Géométrie dans l

publicité
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Prise de décision (avec la loi binomiale)
On considère une population dans laquelle
on suppose que la proportion d’un certain
caractère est p0 . Pour analyser cette
hypothèse, on y prélève, au hasard et avec
remise, un échantillon de taille n sur lequel
on observe une fréquence f du caractère.
On rejette l’hypothèse selon laquelle la
proportion dans la population est p0 lorsque
la fréquence f observée est trop éloignée
de p0 , dans un sens ou dans l’autre.
On choisit de fixer le seuil de décision de telle sorte que la probabilité de rejeter l’hypothèse,
alors qu’elle est vraie, soit inférieure à 5 %.
Lorsque la proportion dans la population vaut p0 , la variable aléatoire X correspondant au
nombre de fois où le caractère est observé dans un échantillon aléatoire de taille n , suit la loi
binomiale de paramètres B  n; p0  . On cherche à partager l’intervalle  0; n  , où X prend ses
valeurs, en trois intervalles  0; a  1 ,  a; b  et  b  1; n  de telle sorte que X prenne ses valeurs
dans chacun des intervalles extrêmes avec une probabilité proche de 2,5%, sans dépasser
cette valeur. En tabulant les probabilités cumulées croissantes p  X  k  , pour k allant de 0
à n , il suffit de déterminer dans le tableau le plus petit entier a tel que p  X  a   0, 025 et le
plus petit entier b tel que p  X  b   0,975 . La règle de prise de décision est la suivante :

si la fréquence observée f appartient à l’intervalle  a n ; b n  , l’hypothèse selon laquelle
la proportion est p0 dans la population n’est pas remise en question et on l’accepte,

sinon, on rejette l’hypothèse selon laquelle cette proportion vaut p0 .
Page 1
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Santé
Un médecin veut savoir si, dans sa région, le
pourcentage d’habitants atteints d’hypertension
artérielle est égal à la valeur de 16 %
récemment publiée pour des populations
semblables. En notant p la proportion
d’hypertendus dans la population de sa région,
le médecin formule l’hypothèse p=0,16. Pour
vérifier cette hypothèse, le médecin constitue
un échantillon de n=100 habitants de la région,
dont il détermine la fréquence f d’hypertendus
(l’échantillon est prélevé au hasard et la
population est suffisamment importante pour
considérer qu’il s’agit de tirages avec remise).
Enoncer la règle de décision permettant de rejeter ou non l’hypothèse p=0,16 selon la valeur de
la fréquence f d’hypertendus observée dans l’échantillon prélevé au hasard dans la population.
Politique
Monsieur Z, chef du gouvernement d’un pays
lointain, affirme que 52 % des électeurs lui
font confiance.
On interroge 100 électeurs au hasard
(l’échantillon est prélevé au hasard et la
population est suffisamment grande pour
considérer qu’il s’agit de tirages avec remise).
Sur les 100 électeurs interrogés au hasard, 43
déclarent avoir confiance en Monsieur Z. Peuton considérer l’affirmation de Monsieur Z
comme exacte ? Votre raisonnement sera
justifié par la détermination d’un intervalle de
confiance au seuil de 5%.
Discrimination
En Novembre 1976 dans un comté du sud du Texas, Rodrigo Partida est condamné à huit ans
de prison. Il attaque ce jugement au motif que la désignation des jurés de ce comté est, selon
lui, discriminante à l’égard des Américains d’origine mexicaine. Alors que 80 % de la
population du comté est d’origine mexicaine, sur les 870 personnes convoquées pour être
jurés lors des années précédentes, il n’y a eu que 339 personnes d’origine mexicaine.
Devant la Cour Suprême, un expert statisticien produit des arguments pour convaincre du bien
fondé de la requête de l’accusé. En vous situant dans le rôle de cet expert, utilisez la loi
binomiale pour montrer que la sous-représentation des américains d’origine mexicaine dans
les jurys de ce comté est « significative ».
Une table des probabilités cumulées croissantes de la loi B  870;0,8  est fournie ci-après.
Page 2
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Sécurité
Un groupe de citoyens demande à la municipalité d’une ville la modification d’un carrefour en
affirmant que 40 % des automobilistes tournent en utilisant une mauvaise file. Un officier de
police constate que sur 500 voitures prises au hasard, 190 prennent une mauvaise file.
1. Déterminer, en utilisant la loi binomiale sous l’hypothèse p = 0,4, l’intervalle de
fluctuation à 95 %.
2. D’après l’échantillon, peut-on considérer, au seuil de 5 %, comme exacte l’affirmation du
groupe de citoyens ?
Sous contrôle
Dans l’industrie automobile, certains véhicules, après leur passage en peinture, présentent un
défaut de type « grains ponctuels ». Ce défaut est pratiquement imperceptible, mais constitue un
témoin de la qualité du processus de peinture. Lorsque le processus est « sous contrôle », 20 %
des capots produits ont ce type de défaut. Des modifications apportées au processus de
fabrication sont susceptibles de modifier ce pourcentage, dans un sens ou dans l’autre.
On contrôle la production en prélevant des échantillons de n = 50 capots. La production est
suffisamment importante pour considérer qu’il s’agit de tirages au hasard avec remise. On choisit
de fixer le seuil de décision de sorte que la probabilité de rejeter l’hypothèse à tort soit inférieure à
5 %. On accepte l’hypothèse selon laquelle la proportion dans la production est p = 0,2, lorsque
la fréquence f observée sur l’échantillon se situe dans l’intervalle de fluctuation à plus de 95 %
correspondant au complémentaire de la zone de rejet.
Les « limites de contrôle » sont les bornes de l’intervalle de fluctuation à 95 %, calculées en
considérant la variable aléatoire X correspondant au nombre de capots présentant le défaut sur
un échantillon de taille 50. Sous l’hypothèse p = 0,2, cette variable aléatoire suit la loi binomiale
de paramètres n = 50 et p = 0,2. Calculer les limites de contrôle. Le processus est sous contrôle,
quelle est la probabilité de commettre une erreur de décision à partir d’un échantillon ?
Gauchers
Dans le monde, la proportion de gauchers est 12 %. Soit n le nombre d’élèves dans votre classe.
Déterminer, à l’aide de la loi binomiale, l’intervalle de fluctuation à 95 % de la fréquence des
gauchers sur un échantillon aléatoire de taille n. Votre classe est-elle « représentative » de la
proportion de gauchers dans le monde ?
Page 3
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Homme/femme
Deux entreprises recrutent leur personnel dans
un vivier comportant autant d’hommes de que
de femmes. Voici la répartition entre hommes
et femmes dans ces deux entreprises. Peut-on
suspecter l’une des deux entreprises de ne pas
respecter la parité hommes/femmes ?
Hommes Femmes
Total
Ent A
57
43
100
Ent B
1350
1150
2500
Extrait d’écran d’une calculatrice
Extrait d’écran d’un tableur
Page 4
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Intervalle de fluctuation (avec la loi binomiale)
Dans une certaine population la proportion
d’individus présentant le caractère C est p .
On analyse ce que l’on peut dire de la fréquence f du
caractère C sur un échantillon de taille n prélevé de
manière aléatoire dans cette population.
Si on note X n la variable aléatoire associant à chaque échantillon de taille n le nombre
d’individus présentant le caractère C et si on note Fn la variable aléatoire définie par Fn  X n n
qui correspond à la fréquence du caractère C dans l’échantillon, alors nous avons vu que :

X n suit la loi binomiale B  n, p  .

On peut donc déterminer à l’aide de la loi binomiale un intervalle de la forme  a n ; b n  ,
avec a et b deux entiers tels que p  X n  a   0, 025 et p  X n  b   0, 025 .


a b
Un tel intervalle vérifie p  Fn   ;    0,95 .
n n


Un tel intervalle est donc appelé intervalle de fluctuation au seuil de 95%.
Rappel indispensable : le théorème de Moivre-Laplace (admis)
On considère une variable aléatoire X n qui suit la loi binomiale B  n; p  .
On note Z n 
X n  np
np 1  p 
la variable centrée et réduite associée à la variable X n .
2
Pour tous réels a et b tels que a  b : lim p  a  Z n  b   p  a  Z  b   
n 
b
a
1  x2
e dx
2
Autre rappel indispensable
Soit Z est la variable aléatoire qui suit la loi
1 
e
normale N  0;1 de densité f  x  
2
x2
2
Pour tour nombre réel  tel que 0    1 il
existe un unique réel positif u tel que :
p  u  Z  u   1  
Rappelons que la démonstration se base sur
l’utilisation du théorème des valeurs interm.
Page 5
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Remarquons les équivalences suivantes :
 I   u 
 I   u
I  
X n  np
 u
np 1  p 
np 1  p   X n  np  u np 1  p 
u np 1  p 
n
 I   p  u
p 1  p 
n
u np 1  p 
Xn
p
n
n


Xn
 p  u
n
p 1  p 
n
Utilisons les deux rappels pour affirmer que :
Pour tout nombre réel  tel que 0    1 il existe un unique réel positif u tel que :



X n  np
lim p  u 
 u   lim p  p  u
n 

 n 
np 1  p 



p 1  p 
n
 Fn  p  u
p 1  p  
  1 

n

Nous pouvons en déduire que :
Pour un n « assez grand » (*) et pour un nombre réel  tel que 0    1 , il existe un unique
réel positif u (défini au chapitre précédent) tel que l’approximation ci-dessous soit vérifiée :

p  p  u


p 1  p 
n
 Fn  p  u
p 1  p  
  1 

n

(*) en pratique, les conditions communément admises pour pratiquer ce type d’approximation
sont les suivantes : n  30 , np  5 et n 1  p   5 .
Intervalle de fluctuation asymptotique
L’intervalle

I n   p  u

p 1  p 
n
; p  u
p 1  p  

n

est un intervalle de fluctuation
Xn
au seuil 1   , cela signifie que pour un n assez
n
grand, la variable Fn prend ses valeurs dans l’intervalle I n avec une probabilité proche de 1   .
asymptotique de la variable aléatoire Fn 
Page 6
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Théorème fondamental
Xn
.
n
On considère  un nombre réel tel que 0    1 et u le réel tel que p  u  Z  u   1  
On considère une variable aléatoire X n qui suit la loi binomiale B  n; p  et on note Fn 
où Z est la variable aléatoire qui suit la loi normale centrée réduite N  0;1 .

Si I n   p  u

p 1  p 
n
; p  u
p 1  p  
 alors lim p  Fn  I n   1   .
n
n

Un troisième rappel important
Intervalle de fluctuation



Au seuil de 95% : I n   p  1,96 

p 1  p 

Au seuil de 99% : I n   p  2,58 

p 1  p 
n
n
; p  1,96 
; p  2,58 
p 1  p  

n

p 1  p  

n

Prise de décision au seuil de 5%
On cherche à savoir, au seuil de décision de
5%, si la proportion p du caractère C dans
une population donnée vaut p  p0 ou non.
On prélève un échantillon de taille n (on fait
en sorte que n  30 , np  5 et n 1  p   5 ).
La prise de décision consiste en :



Calcul de l’intervalle de confiance I ,
Calcul de la fréquence f du caractère C sur l’échantillon de taille n prélevé,
Prise de décision : si f  I on rejette l’hypothèse p  p0 , sinon on l’accepte.
Page 7
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Petits pois
Selon la théorie de Mendel, certaines cosses de petits pois devraient fournir des petits pois jaunes
et verts dans des proportions respectives de 75% et 25%. On souhaite tester l’hypothèse selon
laquelle la proportion des pois jaunes est p=0,75 en mettant en place une expérience permettant
d’obtenir 224 petits pois considérés comme un échantillon aléatoire.
1. Sous l’hypothèse p=0,75, déterminer l’intervalle de fluctuation asymptotique au seuil de
95% de la variable aléatoire correspondant à la fréquence des pois jaunes sur un
échantillon de taille 224 (arrondir les bornes de l’intervalle au centième près).
2. Enoncer la règle de décision permettant de rejeter, ou non, l’hypothèse p=0,75, au seuil
de 5% sur un échantillon aléatoire de taille 224.
3. L’expérience a permis d’obtenir 176 pois jaunes et 48 pois verts, que peut-on en déduire ?
Lancers de pièces
On lance 100 fois une pièce de monnaie.
1. En supposant que la pièce est équilibrée, déterminer l’intervalle de fluctuation
asymptotique de la fréquence de « pile » : au seuil de 95% ? au seuil de 99% ?
2. On lance une pièce 100 fois et on obtient 38 « pile » et 62 « face ». Peut-on considérer que
la pièce est équilibrée : au seuil de décision de 5% ? au seuil de décision de 1% ?
La pièce de Buffon
Dans son essai d’arithmétique morale, Buffon relate une expérience selon laquelle un enfant ayant
lancé 4040 fois une pièce de monnaie, obtient 2048 fois « pile ». On peut considérer que cette
expérience constitue une observation d’un échantillon de taille n=4040 dans la population de tous
les lancers possibles avec la pièce de Buffon.
1. Sous l’hypothèse p=0,5 déterminer l’intervalle de fluctuation au seuil de 95% de la
variable aléatoire F correspondant à la fréquence de « pile » sur un échantillon aléatoire de
taille 4040.
2. Enoncer la règle de décision permettant de rejeter, ou non, l’hypothèse p=0,5 au seuil de
5%. Quelle conclusion peut-on tirer du nombre de « pile » obtenus par l’enfant ?
Groupes sanguins
Les centres de transfusion sanguine ont diffusé le tableau des répartitions, en France, des
principaux groupes sanguins. La proportion des groupes O+ et O- est p=0,44. Une collecte de
sang a été organisée sur le campus d’une université à laquelle ont participé 356 étudiants. On
souhaite tester l’hypothèse selon laquelle ces étudiants sont représentatifs, au seuil de 95%, de la
proportion des groupes O. L’analyse des prélèvements montre que sur les 356 donneurs, 148
appartiennent au groupe O. Quelle conclusion peut-on en tirer ?
Page 8
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
D’un intervalle de fluctuation asymptotique vers un intervalle de confiance
On souhaite estimer la prévalence du surpoids dans une ville, c’est-à-dire la proportion de
personnes ayant une masse trop importante par rapport à leur taille. Pour cela 460 personnes ont
été sélectionnées de manière aléatoire à partir de la liste des logements connue par la municipalité,
c’est-à-dire que le fait d’avoir été sélectionné pour participer à l’étude est uniquement dû au
hasard. On admet que cette procédure permet d’assimiler la sélection des personnes interrogées à
un schéma de Bernoulli. Un enquêteur s’est déplacé au sein de chaque logement après avoir
convenu d’un rendez-vous afin de recueillir les informations nécessaires à l’enquête.
L’échantillon est-il représentatif de la population ?
Dans un premier temps, l’enquêteur va s’assurer que l’échantillon est représentatif de la
population qu’on étudie sur des informations qu’on peut vérifier et qui sont en lien avec le critère
étudié. Dans le cas présent on peut connaître par exemple la proportion d’hommes et de femmes
dans la population de la ville, ainsi que la répartition selon l’âge en demandant à la municipalité
qui se référera aux informations du recensement.
Ainsi on sait que dans la population il y a 46%
d’hommes et 20% de personnes de plus de 60.
Homme Femme
échantillon 200
260
Total
460
Parallèlement on peut comptabiliser le nombre
d’hommes et de femmes dans l’échantillon
ainsi que la répartition selon l’âge.
<60ans
échantillon 352
Total
460
>60ans
108
1. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable
aléatoire « proportion de femmes » dans un échantillon aléatoire de taille 460.
2. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable
aléatoire « proportion des plus de 60 ans » dans un échantillon aléatoire de taille 460.
3. Si pour chacune de ces variables aléatoires, genre et âge, l’intervalle de fluctuation
asymptotique contient la valeur de l’échantillon, on considère que l’échantillon est
représentatif de la population pour ces informations. Quelle conclusion peut-on tirer ici ?
Page 9
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
La première étape de ce travail a donc été de sélectionner un échantillon qui soit accepté comme
« représentatif » de la population. Ainsi les informations qui seront obtenues à partir de cet
échantillon seront généralisables, avec un certain nombre de précautions, à l’ensemble de la
population dont il est extrait.
Dans le cas de l’étude présentée ici, on souhaite estimer la proportion de personnes en surpoids ;
pour cela il est tout d’abord important de définir le surpoids. La définition du surpoids donnée
par l’OMS (Organisation Mondiale de la Santé) est la suivante : une personne est considérée en
surpoids si son IMC (Indice de masse corporelle) est supérieur à 25. L’IMC se calcule de la
manière suivante : masse en kg/(taille en m)².
Intervalle de confiance d’une probabilité
La proportion de personnes en surpoids dans l’échantillon étudié est de 29,5%. Comme il s’agit
d’un calcul réalisé à partir des données d’un échantillon on sait que cette valeur ne correspond pas
exactement à la valeur de la prévalence du surpoids dans la population, car si nous avions pris un
autre échantillon nous aurions obtenu une autre valeur. Pour cette raison il est nécessaire de
communiquer un intervalle qui sera obtenu à partir des informations observées et pour lequel on
puisse dire avec un « niveau de confiance » supérieur à 0,95 qu’il contient la vraie valeur de la
prévalence du surpoids dans la ville. Déterminer graphiquement cet intervalle de confiance.
Page 10
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Une majoration
Montrer que pour tout p
compris entre 0 et 1 la
1,96 p 1  p 
est majorée par 1.
quantité
On pourra pour cela
étudier les variations de la
fonction g  x   x 1  x 
sur l’intervalle  0;1 .
Deux inégalités
Montrer que pour tout p compris entre 0 et 1 et n entier on a p  1,96
Montrer que pour tout p compris entre 0 et 1 et n entier on a p  1,96
p 1  p 
n
p 1  p 
n
 p
1
(1)
n
 p
1
(2)
n
Une inclusion

On note I n   p  1,96 

p 1  p 
n
; p  1,96 
p 1  p  
1
1 

 et J n   p 
;p
.
n
n
n


On rappelle que I n est l’intervalle de fluctuation asymptotique au seuil de 95%. On appellera le
nouvel intervalle J n défini ci-dessus « intervalle de fluctuation asymptotique simplifié ».
Déduire des inégalités (1) et (2) l’inclusion de l’intervalle I n dans l’intervalle J n .
Une conclusion
On peut « agrandir » l’intervalle de fluctuation
asymptotique au seuil de 95% en majorant la
quantité 1,96 p 1  p  par 1 pour 0  p  1 .
Ainsi si X n est une variable aléatoire qui suit la
loi binomiale B  n, p  et si Fn  X n n alors :
pour tout p tel que 0  p  1 , il existe un
entier n0 tel que si n  n0 on puisse affirmer :
1
1 

p p 
 Fn  p 
  0,95
n
n

Page 11
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Remarquons l’équivalence suivante :
p
1
1
1
1
 Fn  p 
 Fn 
 p  Fn 
n
n
n
n
Utilisons la conclusion précédente pour affirmer que :
Si X n est une variable aléatoire qui suit la loi binomiale B  n, p  et si Fn  X n n alors pour tout
1
1 

 p  Fn 
p tel que 0  p  1 , il existe un entier n0 tel que si n  n0 p  Fn 
  0,95 .
n
n

Proposons la définition d’un intervalle de confiance à 95% :
1
1 

;f 
Soit f la fréquence observée sur un échantillon de taille n . L’intervalle  f 
 est
n
n

un intervalle de confiance de la proportion inconnue p au niveau de confiance de 95%.
NB : les conditions communément admises sont les suivantes : n  30 , nf  5 et n 1  f   5 .
Page 12
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Surpoids
Dans une certaine population, on a observé un échantillon de taille n=500 d’adolescents de 15
ans dans lequel 210 présentent un surpoids. Donner un intervalle de confiance de la proportion p
d’adolescents de cette population présentant un surpoids au niveau de confiance 95%.
Poissons malades
On a observé 180 poissons malades sur 800 poissons pêchés dans une rivière. En considérant
qu’il s’agit d’un échantillon aléatoire prélevé avec remise (il y a de nombreux poissons dans la
rivière), donner un intervalle de confiance de la proportion de poissons malades dans la rivière au
niveau de confiance de 95%.
Pièces sans défaut
On considère une grande quantité de pièces industrielles devant être livrées à une chaîne
d’hypermarchés. On prélève au hasard un échantillon de 100 pièces dans cette livraison. La
livraison est assez importante pour que l’on puisse assimiler ce tirage à un tirage avec remise. On
constate que 96 pièces sont sans défaut. Déterminer un intervalle de confiance de la proportion
de pièces de la livraison qui sont sans aucun défaut, avec un niveau de confiance de 95%.
Virus
On veut estimer la proportion p de personnes immunisées contre un certain virus parmi la
population d’une ville. On prélève un échantillon aléatoire de 500 personnes parmi cette
population. La population est suffisamment importante pour assimiler ce prélèvement à un tirage
au hasard avec remise.
Après analyses, on dénombre 241 personnes immunisées contre ce virus, parmi les 500 de
l’échantillon. Donner un intervalle de confiance de la proportion de personnes immunisées
contre ce virus parmi la population de la ville, avec un niveau de confiance de 95%. Quelle est la
taille minimale de l’échantillon qui aurait permis d’obtenir un intervalle de confiance de rayon
inférieur ou égal à 0,01 ?
Une option à prendre
Une agence de voyage propose, en option supplémentaire dans un de ses circuits, la visite d’une
exposition. En consultant au hasard et avec remise 60 fiches de clients parmi les 2054 clients
inscrits sur la période considérée, le directeur de l’agence observe que l’option est mentionnée
seulement 9 fois. Donner un intervalle de confiance à 95% de la proportion inconnue p de
personnes ayant fait le choix de cette option parmi les 2054 clients.
Le directeur considère que l’information fournie par l’intervalle de confiance est trop imprécise
(longueur de l’intervalle trop grande). Il procède à un nouveau prélèvement de 60 fiches parmi les
2054. Sur l’échantillon global de taille 120 prélevé, l’option apparaît 18 fois. Quel intervalle de
confiance de 95% l’échantillon complété permet-il de fournir ?
Page 13
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Sondage
Pour décider de la construction d’un grand stade, une municipalité veut sonder la population
pour estimer si plus de 50% des électeurs y sont favorables. La municipalité réalise un sondage
aléatoire de taille 100 et obtient 54 avis favorables. Quelle est la fréquence d’avis favorables sur ce
sondage ? La municipalité peut-elle décider de la construction du stade en prétextant que plus de
50% de la population y est favorable ?
On suppose que la municipalité réalise un sondage de taille n et que la fréquence des votes
favorables reste égale à 0,54. Si p est la proportion (inconnue) d’avis favorables dans la
population, donner l’expression d’un intervalle de confiance de p au niveau de 95%. La
municipalité ne construira ce stade que si la proportion p d’avis favorable dépasse 50%.
Déterminer à partir de quelle valeur de n la municipalité pourra prendre cette décision.
Statistiquement fondé ?
Pour comparer les cotes de popularité de trois personnalités X, Y et Z un journal a réalisé un
sondage : sur 1320 personnes interrogées, 27% ont voté pour X, 38,5% ont voté pour Y et 34,5%
ont voté pour Z. Estimer par un intervalle la cote de popularité de X, de Y et de Z dans la
population au niveau de confiance de 95%. Un classement peut-il être publié ? Avec ces mêmes
taux, pour quelle taille du sondage un classement aurait été statistiquement fondé au niveau de
confiance de 95% ?
Premier tour d’une élection présidentielle
Le 18 avril 2002, l’institut IPSOS effectue un sondage dans la population en âge de voter. On
constitue un échantillon de 1000 personnes (inscrites sur les listes électorales) que l’on suppose
choisies de manière aléatoire. Sur les 1000 personnes : 140 ont déclaré vouloir voter pour JeanMarie Le Pen, 195 personnes ont déclaré vouloir voter pour Jacques Chirac, 170 ont déclaré
vouloir voter pour Lionel Jospin. Quels seront les deux candidats présents au second tour ?
Pour information les résultats obtenus par ces trois candidats au premier tour de l’élection ont été les suivants : 16,9% - 19,9% - 16,2%
Intervalles disjoints
Un maraîcher achète un lot de semences de tomates pour produire ses plants de tomate. Il lui
reste des semences de l'année passée, dont il doit contrôler le taux de germination pour pouvoir
les utiliser avec les autres. En effet, des taux de germination trop différents provoquent des trous
dans les plates bandes de production, ce qui génère un coût de manutention plus élevé. Il lui faut
donc comparer les taux de germination des semences des deux années.
Une stratégie consiste à calculer et à comparer les intervalles de confiance des taux de
germination (qui sont des proportions) des plants de l'année et de l'année précédente. Si les deux
intervalles ne se recoupent pas, on peut conclure à une différence de taux de germination entre
les semences des deux origines. Il faudra alors les semer séparément. Pour faire cette
comparaison, le maraîcher prélève, aléatoirement dans les semences de l'année, un échantillon de
200 graines qu'il met à germer. Il constate que 185 graines germent. Il prélève ensuite,
aléatoirement dans les semences de l'année précédente, un échantillon de 200 graines qu'il met à
germer. Il constate que 150 graines germent. Aidez le maraîcher à prendre une décision.
Page 14
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Dépistage de la bronchiolite
Dans le but d’évaluer la prise en charge de la bronchiolite du nourrisson dans un hôpital de la
région Aquitaine, une étude rétrospective a été mise en place. Il est recommandé de coucher
l’enfant de manière très inclinée (couchage en proclive) dans le cadre de la prise en charge de la
bronchiolite. On évalue cette pratique à partir d’un échantillon de 134 dossiers. 106 des enfants
ont été couchés en proclive. Déterminer un intervalle de confiance au niveau de confiance de
95% de la proportion d’enfants dont le couchage respecte la recommandation. Une étude plus
fine permet de comparer les pratiques entre les différents services ayant admis des enfants. Le
tableau ci-dessous donne la répartition des cas suivant le type de services et le respect de la
recommandation de couchage en proclive.
Couchage proclive
Oui
Non
Total
En service des urgences
45
29
74
En service hospitalier
52
8
60
Total
97
37
134
Déterminer un intervalle de confiance au seuil de 95% de la proportion de couchage en proclive
pour chaque type de service. Peut-on conclure selon vous au seuil de 95% que la pratique de
couchage n’est pas identique selon le service ?
Chikungunya à Mayotte
L’image proposée ci-dessous, extraite d’une revue médicale illustre la prévalence du chikungunya
à Mayotte (pourcentage de personnes ayant été en contact avec la maladie). Les « barres d’erreur »
figurant sur le graphique correspondent à des intervalles de confiance à 95%. Estimer la taille de
l’échantillon, tous âges confondus utilisé dans cette étude. Donner une raison expliquant
pourquoi les barres d’erreurs sont de longueurs différentes selon les classes d’âge. Peut-on,
d’après cette étude, considérer qu’il existe une différence significative de la prévalence du
chikungunya selon les classes d’âge ?
Page 15
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
Intervalle de fluctuation ?
ou intervalle de confiance ?
Règle générale
On utilise un intervalle de fluctuation
lorsque la proportion p dans la population
est connue ou si l’on fait une hypothèse sur
sa valeur.
On utilise un intervalle de confiance lorsque
l’on veut estimer une proportion inconnue
dans une population.
Test de conformité d’une proportion
On veut déterminer si la proportion observée dans un échantillon est conforme à une valeur de
référence connue dans la population. Sous l’hypothèse que l’échantillon est issu d’un tirage
aléatoire correspondant à un schéma de Bernoulli (tirage avec remise ou s’y apparentant), la
variable fréquence Fn appartient à un intervalle de fluctuation avec une probabilité déterminée.
En fonction de l’appartenance ou non de la fréquence observée à cet intervalle, on peut prendre
une décision concernant la conformité de l’échantillon. Si les conditions d’utilisation sont réunies,
on détermine l’intervalle de fluctuation asymptotique, sinon on a recours à un intervalle de
fluctuation calculé avec la loi binomiale.
Estimation d’une proportion inconnue p grâce à un échantillon aléatoire
On se place dans le cas où l’échantillon comporte au moins 30 éléments afin de pouvoir utiliser
l’intervalle de confiance au programme de la classe de terminale (*). Si la fréquence f observée
est telle que nf  5 et n 1  f   5 , on considère qu’on peut conclure qu’un intervalle de
confiance de la proportion inconnue p au niveau de confiance de 95% est  f  1

(*) un intervalle de confiance de 95% plus précis est  f  1,96

f 1  f 
n
n ; f 1
; f  1,96
n 
f 1  f  

n

Un tableau pour récapituler
Intervalle de fluctuation au seuil de 95%
Intervalle
obtenu avec la
loi binomiale :
Intervalle de
fluctuation
asymptotique :
On l’utilise
lorsque :
 a n ; b n  avec a et b deux entiers tels que
p  X n  a   0, 025 et p  X n  b   0, 025

p 1  p 
p 1  p  


Intervalle de confiance à 95%
/
 f 1 n ; f 1 n 
p  1,96 
; p  1,96 


n
n


la proportion p dans la population est connue on veut estimer p inconnu à
ou quand on fait une hypothèse sur sa valeur.
partir d’un échantillon.
Page 16
Vdouine – Terminale S – Activités – Chapitre 9 – Fluctuation et estimation
L‘éducation à l'aléatoire devrait avoir pour but fondamental la prise de conscience que toute décision s'accompagne
d'un risque mais que ce risque peut être évalué. » Norbert Meunier.
Gauchers et décision unilatérale
Page 17
Téléchargement