Chapitre XI : Echantillonnage

publicité
Chapitre XI : Echantillonnage et intervalle de fluctuation
Extrait du programme :
I.
Présentation du problème
Dans une population, on suppose qu’un caractère est
présent dans la proportion p.
Pour juger de cette hypothèse, on prélève au hasard et avec
remise, un échantillon de taille n et on observe la fréquence
du caractère étudié f égale au nombre d’individus ayant ce
caractère divisé par n.
On cherche à savoir pour quelles valeurs de f on pourra
considérer que l’hypothèse de la proportion p peut être
validée ou inversement pour quelles valeurs de f on pourra considérer qu’elles sont suffisamment
éloignées de p pour rejeter l’hypothèse.
II.
Intervalle de fluctuation
Le tirage au hasard dans la population d’un individu qui peut présenter le caractère C étudié avec une
probabilité p est une épreuve de Bernoulli de paramètre p, où le succès S est l’issue : « avoir C ».
Le prélèvement au hasard d’un échantillon de taille n dans cette population s’assimile à un schéma de
Bernoulli de paramètre n et p et la variable aléatoire X, qui compte le nombre de succès, c’est-à-dire le
nombre d’individus présentant le caractère C, suit la loi binomiale b(n ;p).
Les valeurs prises par la variable X (entiers entre 0 et n) sont partagées en trois intervalles [0 ; a – 1] ,
[a ; b] et [b +1 ; n] de façon que X prenne ses valeurs dans chacun des deux intervalles extrêmes avec
une probabilité proche de 2,5 % sans jamais la dépasser.
Définition :
a b
L’intervalle de fluctuation au seuil de 95% de la fréquence observée est l’intervalle n;n où :
-
a est le plus petit entier tel que P(X≤ a) > 0,025
b est le plus petit entier tel que (X≤ b) > 0,975
Remarque : X prenant des valeurs entières : donc
P (a ≤ X ≤ b ) = P (X ≤ b ) − P (X ≤ a – 1 )
on déduit de la définition que :
P (X ≤ a – 1 ) ≤ 0, 025
 – P (X ≤ a – 1 ) ≥ − 0, 025
donc P (a ≤ X ≤ b ) ≥ 0,975 – 0,025
soit P (a ≤ X ≤ b ) ≥ 0,95 = 95 %
III.
Prise de décision
Si f  [ a ; b ] , alors on ne peut pas rejeter l’hypothèse selon laquelle la proportion du caractère est
n n
égale à p.
Si f  [ a ; b ] , alors on rejette cette hypothèse au risque d’erreur de 5%
n n
(ce qui veut dire que la probabilité de rejeter l’hypothèse alors qu’elle est vraie est inférieure à 5%)
Point-méthode 30 : Prendre une décision avec un intervalle de fluctuation
Un candidat à une prochaine élection pense que 54% des électeurs lui apporteront leur voix.
1. Un sondage réalisé auprès de 100 électeurs (le choix des électeurs est assimilé à un tirage au
hasard et avec remise) et on note f la fréquence, dans cet échantillon, des personnes qui
voteront pour le candidat.
On observe que, sur les 100 électeurs interrogés, 45 déclarent voter pour le candidat.
Considère-t-on alors l’affirmation du candidat exacte ou non ?
2. Un autre sondage est réalisé par son concurrent, auprès de 200 électeurs. On observe alors
que, sur les 200 électeurs interrogés, 90 déclarent voter pour le candidat. Considère-t-on alors
l’affirmation du candidat exacte ou non ?
Solution :
1.
- On identifie les différentes valeurs :
-
n = 100
f = 0,45
p 
On commence par définir une variable aléatoire, et donner les paramètres de la loi binomiale
qu’elle suit :
Soit X la variable aléatoire comptant le nombre d’électeur allant voter pour le candidat parmi les 100.
On répète alors 100 fois de façon identique et indépendante une épreuve de Bernoulli (demander son
opinion à un électeur), dont la probabilité de succès (l’électeur vote pour le candidat) est 0,54.
Alors X~b(100 ;0,54)
-
On va réaliser à la calculatrice, l’ensemble des calculs de P(X≤ k) pour k allant de 0 à 100.
Dans f ( x ) : Y1 = BinomFRep(n ,p ,X) ici Y1 = BinomFRep(100,0.54,X)
Puis on regarde le tableur à partir de 0 avec un pas de 1.
On lit dans cette table, la première valeur qui arrive au-dessus de 0,025 ainsi que la 1ère au-dessus de
0,975. On doit donner pour chaque cas, la valeur précédente pour justifier qu’il s’agit bien de la 1ère
au-dessus.
P(X≤ 43)  0,018
P(X≤ 44)  0,0285 > 0,025 donc a = 44
P(X ≤ 63) 0,972
P(X ≤ 64)  0,9831 > 0,975 donc b = 64
 44 64 
Ainsi, l’intervalle de fluctuation au seuil de 95% de f est l’intervalle 100;100 = [0,44 ;0,64].
Une fois l’intervalle de fluctuation trouvé, on regarde si f est dedans ou non :
- Si f n’est pas dedans, alors on peut rejeter l’hypothèse faite sur p
- Si f est dedans, on ne peut pas rejeter cette hypothèse.
Ici f = 0,45 donc f [0,44 ;0,64].
Ainsi, on ne peut pas rejeter l’hypothèse faite par le candidat que 54% des électeurs apporteront leur
voix.
2. Il s’agit de la même expérience, mais répétée 200 fois, donc
X~b(200 ;0,54)
n = 200
f = 0,45
p 
On change la fonction : Y1 = BinomFRep(200,0.54,X)
P(X≤ 93) 0,0199
P(X≤ 94)  0,027> 0,025 donc a = 94
P(X ≤ 121) 0,973
P(X ≤ 122)  0,9806 > 0,975 donc b = 122
 94 122
Ainsi, l’intervalle de fluctuation au seuil de 95% de f est l’intervalle 200;200 = [0,47 ; 0,61]
Or f = 0,45 [0,47 ;0,61] donc on peut rejeter l’hypothèse faite par le candidat, avec un risque d’erreur
de 5%.
Téléchargement