CHAPITRE 20
Echantillonnage
IIntroduction
On se situe ici dans deux domaines des statistiques, qui sont ceux de «l’échantillonnage »et de «l’estima-
tion ». Ces deux domaines ont des contextes d’application différents, qu’il faut savoir reconnaître.
Dans une certaine population, on étudie la proportion pd’individu présentant le caractère C.
1er cas : La proportion pd’individu présentant le
caractère C est connue ou on la suppose connue.
On sélectionne un échantillon de taille npar ti-
rage au sort dans la population et on observe la
fréquence fdu caractère C dans cet échantillon.
Cette fréquence observée appartient «en général »à
un intervalle de fluctuation de centre p.
On peut, à partir de ces intervalles de fluctuation
déterminer si l’échantillon ainsi obtenu est «repré-
sentatif »de la population.
On est ici dans le domaine de l’échantillonnage
et de l’intervalle de fluctuation.
2ème cas : On ignore la proportion pd’individu pré-
sentant le caractère C dans la population.
Pour des raisons à la fois financières et logistiques on
ne peut pas recueillir des données sur la population
toute entière. On sélectionne alors un échantillon de
taille npar tirage au sort dans la population et on ob-
serve la fréquence fdu caractère C dans cet échan-
tillon.
On estime la proportion ppar un intervalle de
confiance déterminé à partir de fet de nselon un ni-
veau de confiance.
On est ici dans le domaine de l’estimation et des in-
tervalles de confiance.
Exemple :
1. Le responsable de la maintenance des machines à sous d’un casino doit vérifier qu’un certain type de
machine est bien réglé sur une fréquence de succès de 0,06. Pour cela, il observe, dans l’historique des
jeux, la fréquence de succès de ces machines.
On est ici dans une situation ..................
2. On souhaite estimer la proportion de personnes immunisées contre un certain virus dans la population
d’une ville. Pour cela 500 personnes ont été sélectionnées de manière aléatoire. La population est suffi-
samment importante pour assimiler ce prélèvement à un tirage au hasard avec remise.
On est ici dans une situation ..................
II Échantillonnage
Dans une certaine population, la proportion d’indivi-
dus présentant le caractère C est p.
Que peut-on dire de la fréquence fdu caractère C sur
un échantillon aléatoire de taille n?
1. Cadre général
C.Vexiau - année 2013-2014 Chapitre 20 - TS - Echantillonnage - Page 1/ 6
Définition :Xest une variable aléatoire qui suit la loi binomiale de paramètres net p.
Soit α]0;1[ et aet bdeux réels.
Dire que [a;b] est un intervalle de fluctuation de Xau seuil 1αsignifie que :
Exemple :
En classe de Première, on a vu que si Xnest la variable aléatoire associant à chaque échantillon de taille
nle nombre d’individus présentant le caractère C alors :
Fn=Xn
nest lavariablealéatoirecorrespondant à..........................................
Xnsuit la loi ..........................................
On peut déterminer un intervalle ·a
n;b
n¸, avec aet bentiers tel que PµFn·a
n;b
n¸¶0,95. Cet
intervalle est appelé intervalle de fluctuation au seuil de 0,95 de Fn.
En pratique, pour trouver les entiers aet b, il suffit de rechercher, à l’aide de la loi binomiale, les
plus petits entiers aet btels que : P(Xna)>0,025 et P(Xnb)0,975.
Exercice 1 :Intervalle de fluctuation avec la loi binomiale
Exercice 2 :Notion d’intervalle de fluctuation asymptotique
2. Intervalle de fluctuation asymptotique
Théorème :
Soit Xnune variable aléatoire suivant la loi binomiale de paramètres net p.
Soit α]0;1[ et uαl’unique réel tel que P(uαZuα)=1α, où Zsuit la loi N(0 ; 1).
Soit Inl’intervalle In="puαpp(1 p)
pn;p+uαpp(1 p)
pn#.
Alors :
lim
n→+∞PµXn
nIn=1α
Pour ngrand*, la variable aléatoire fréquence Fn=Xn
nprend ses valeurs dans l’intervalle In
avec une probabilité proche de 1 α.
L’intervalle Inest un intervalle de fluctuation asymptotique au seuil 1αde la variable
aléatoire fréquence Fn=Xn
n.
* En pratique, on utilise cet intervalle de fluctuation dès que n30, np 5 et n(1 p)5.
Exemple : On a vu au chapitre 16 que u0,05 1,96 et u0,01 2,58. On rappelle que pdésigne la propor-
tion du caractère étudié dans la population et nla taille de l’échantillon.
C.Vexiau - année 2013-2014 Chapitre 20 - TS - Echantillonnage - Page 2/ 6
Ainsi,
Au seuil de 95 %, In=
Au seuil de 99 %, In=
Démonstration exigible
On pose Zn=Xnnp
pnp(1 p).
D’après le théorème de Moivre-Laplace,
lim
n→+∞P(uαZnuα)=................................................
Or, uαZnuα........................
Remarque : On peut agrandir l’intervalle de fluctuation asymptotique Inau seuil de 95 % obtenu dans le
théorème précédent en majorant 1,96pp(1 p) par 1 pour 0 <p<1.
Ceci permet de justifier la formule de l’intervalle de fluctuation utilisée en Seconde :
Théorème : Soit Xnest une variable aléatoire suivant la loi binomiale de paramètres net p, 0 <p<1 et
Fn=Xn
n.
Il existe n0Ntel que si nn0,Pµp1
pnFnp+1
pn0,95.
Exemple : Intervalles de fluctuation au seuil de 95 % avec les lois binomiales et normales
Dans une urne contenant 3 boules rouges et 7 boules bleues, on effectue 100 tirages avec remise. On désigne
par Xla variable aléatoire correspondant au nombre de boules rouges obtenues. On pose F=X
100.
1. (a) Déterminer la loi de la variable aléatoire X.
C.Vexiau - année 2013-2014 Chapitre 20 - TS - Echantillonnage - Page 3/ 6
(b) Déterminer l’intervalle de fluctuation de la variable aléatoire Fau seuil de 95 %. (On donne ci-
dessous une partie de la tabulation de la loi binomiale B(100 ; 0,3))
2. En utilisant la loi normale, déterminer l’intervalle de fluctuation asymptotique de la variable aléa-
toire Fau seuil de 95 % (arrondir les bornes à 102).
Comparer avec l’intervalle obtenu à la question 1.(b).
Prise de décision au seuil de 5%
On cherche à savoir, au seuil de décision de 5 %, si la proportion du caractère C dans la population vaut
p=p0ou non, à partir d’un échantillon de taille n.
La procédure est la suivante :
On vérifie que n30, np05 et n(1 p0)5
Calcul de In="p01,96pp0(1 p0)
pn;p0+1,96pp0(1 p0)
pn#.Ne pas oublier d’arrondir la borne infé-
rieure par défaut et la borne supérieure par excès.
Calcul de la fréquence fdu caractère C sur l’échantillon de taille nprélevé
Application de la règle de décision, au seuil de 5 % :
Si fIn, on rejette l’hypothèse p=p0;
Si fIn, on ne la rejette pas.
D’après le Théorème 1, la probabilité de rejeter à tort l’hypothèse p=p0est environ égale à 0,05. Le seuil
de décision correspond à ce risque.
Exemple :Dans un casino, il a été décidé que les machines à sous doivent être réglées sur une fréquence de
gain du joueur de 0,06. Un fréquence inférieure est supposée «faire fuir le client », et une fréquence supérieure
est susceptible de ruiner le casino. Un contrôleur vérifie trois machines en observant leur historique.
Première machine : sur 50 parties, 2 ont été gagnantes ;
Deuxième machine : sur 120 parties, 14 ont été gagnantes ;
Troisième machine : sur 400 parties, 30 ont été gagnantes.
C.Vexiau - année 2013-2014 Chapitre 20 - TS - Echantillonnage - Page 4/ 6
En utilisant des intervalles de fluctuation asymptotiques au seuil de 95 %, examiner dans chaque cas la
décision à prendre par le contrôleur, à savoir rejeter ou ne pas rejeter l’hypothèse p0=0,06.
III Intervalle de confiance - Estimation
Dans une certaine population, la fréquence d’indivi-
dus présentant le caractère C sur un échantillon donné
de taille nest f.
Que peut-on dire de la proportion pdu caractère C
dans la population ?
On suppose dans la suite que n30, np 5 et n(1 p)5.
D’après le Théorème 2 (page 3), on sait que si Xnsuivant la loi binomiale B(n;p), 0 <p<1 alors il existe
n0Ntel que si nn0,Pµp1
pnFnp+1
pn0,95 avec Fn=Xn
n. Or,
p1
pnFnp1
pn⇔−p+1
pnFnp1
pn
Fn+1
pnpFn1
pn
Fn1
pnFnFn+1
pn
On en déduit donc le théorème suivant :
Théorème : Soit Xnune variable aléatoire suivant la loi binomiale B(n;p), 0 <p<1 et Fn=Xn
n.
Il existe n0Ntel que si nn0, alors Pµp·Fn1
pn;Fn+1
pn¸¶0,95.
Définition : Soit fla fréquence du caractère C sur un échantillon de taille n.
L’intervalle ·f1
pn;f+1
pn¸est un intervalle de confiance à 95 % de la proportion inconnue pdu
caractère C dans la population.
On utilise cet intervalle dès que n30,n f 5et n(1 f)5.
Remarque
1. L’intervalle ·f1
pn;f+1
pn¸est aussi appelé intervalle de confiance de pau niveau de confiance 0,95.
2. La précision de l’intervalle de confiance, donnée par sa longueur, est 2
pn. Ainsi, plus la taille des échan-
tillons est grande et plus les intervalles de confiance obtenus sont précis.
3. Dans certains domaines d’application (lors notamment de l’estimation de très petites proportions), on
utilise l’intervalle de confiance à 95 % : "f1,96 pf(1 f)
pn;f+1,96pf(1 f)
pn#. On ne peut le justifier
dans le cadre de ce programme.
C.Vexiau - année 2013-2014 Chapitre 20 - TS - Echantillonnage - Page 5/ 6
1 / 6 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !