Échantillonnage et Estimation : Chapitre de Manuel

Telechargé par Brayane Ibaïbe
  Chapitre Quatre  
´
Echantillonnage et estimation
PARTIE A : ´
Echantillonnage
4.0.1 Introduction
L’´etude de propri´et´es caract´eristiques d’un ensemble, quand on ne dispose pas encore de
donn´ees, n´ecessite d’examiner, d’observer des ´el´ements de cet ensemble. La mani`ere de
recueillir ces donn´ees fait l’objet d’une th´eorie math´ematique appel´ee th´eorie des son-
dages ou encore th´eorie de l’´echantillonnage ( en anglais : sampling theory ), Cette
th´eorie concerne l’optimisation de la collecte des donn´ees selon divers crit`eres et r´epond
`a certaines interrogations sur la fa¸con de proc´eder `a cette collecte en rapport avec l’infor-
mation disponible et l’effort d’´echantillonnage consenti.
Face `a un ph´enom`ene al´eatoire num´erique, on cherche `a connaˆıtre autant que possible la
loi qui le r´egit et les valeurs des param`etres dont elle peut d´ependre.
Or ce ph´enom`ene n’est en g´en´eral accessible que par les r´ealisations de la variable al´eatoire
Xqui le d´ecrit. C’est donc par l’interm´ediaire de plusieurs r´ealisations de cette variable
al´eatoire que l’on cherche `a d´eterminer, ´eventuellement de mani`ere approch´ee (on dit
estimer) la loi de la variable Xet ses param`etres ´eventuels. Lorsque l’on envisage ainsi
nr´ealisations successives de la variable X, ont dit que l’on a r´ealis´e un ´echantillon de
taille n(ou un n-´echantillon) de la variable X. Il est alors d’usage de consid´erer que ces
nr´ealisations successives de la mˆeme variable al´eatoire Xconstituent une seule et mˆeme
r´ealisation du vecteur al´eatoire (X1, X2, ..., Xn), o`u les Xisont des variables al´eatoires de
mˆeme loi (et de mˆeme param`etre) que X. On dit que Xest la loi parente de l’´echantillon
envisag´e.
Il arrive souvent, et c’est le seul cas envisag´e dans ce chapitre, que la forme de la loi parente
Xsoit connue, et que l’on cherche seulement `a en d´eterminer certains param`etres. On
parle alors d’estimation param´etrique.
1
2
D´efinition 4.0.1. ´
Echantillonnage
L’´echantillonnage est le proc´ed´e utilis´e pour choisir un ´echantillon et qui est `a la base de
l’enquˆete par sondage.
D´efinition 4.0.2. ´
Echantillonnage
l’´echantillonnage est la phase qui consiste `a s´electionner les individus que l’on souhaite
interroger au sein de la population de base.
Prenons tous les ´echantillons possibles de taille ntir´es d’une population donn´ee. Pour
chaque ´echantillon, on peut calculer une statistique (moyenne, ´ecart-type, variance, etc...)
qui variera avec l’´echantillon. Pour tous les ´echantillons, on obtient alors une distribu-
tion de la statistique que l’on nomme la distribution d’´echantillonnage. Pour la validit´e
des r´esultats, il est important que les ´echantillons soient repr´esentatifs de la population
concern´ee.
D´efinition 4.0.3. Population
Ensemble que l’on observe et qui sera soumis `a une analyse statistique, chaque ´el´ement
de cet ensemble est un individu ou unit´e statistique.
D´efinition 4.0.4. Param`etre
Caract´eristique num´erique d’une population telle que la moyenne de la population µou
m, l’´ecart type de la population σet la proportion de la population p.
4.0.2 Nombre total d’´echantillons
Combien d’´echantillons de n´el´ements peuvent ˆetre isol´es d’une population de N´el´ements ?
On distingue deux cas de tirage
1. Tirage exhaustif (sans remise) : nombre d’´echantillons est CNn
2. Tirage non exhaustif (avec remise) : nombre d’´echantillons est Nn
4.0.3 M´ethodes d’´echantillonnage
L’´echantillonnage peut se faire avec ou sans remise et une population peut ˆetre consid´er´ee
comme finie ou infinie. Une population finie dans laquelle on proc`ede `a un ´echantillonnage
avec remise peut ˆetre th´eoriquement consid´er´ee comme infinie.
Dans la pratique, il en va de mˆeme pour des populations finies mais de grandes tailles.
Pour chaque distribution d’´echantillonnage, on peut calculer une moyenne, un ´ecart type,
une variance etc.
Dr. Mederic NDIMBA/FST/L1MATH/ 2024 Chapitre 4. Échantillonnage et estimation
4.1. Méthodes probabilistes (Aléatoires) 3
Figure 4.1 – Les m´ethodes d’´echantillonnage
Figure 4.2 – Les m´ethodes d’´echantillonnage
4.1 M´ethodes probabilistes (Al´eatoires)
L’´echantillonnage probabiliste repose sur un choix d’unit´es dans la population fait au
hasard, ce n’est pas l’enquˆeteur qui choisit les unit´es, c’est la m´ethode utilis´ee pour la
s´election qui le fait. Une des caract´eristiques de cette m´ethode est que chaque unit´e de la
population a une probabilit´e mesurable d’ˆetre choisie.
L’avantage de la m´ethode d’´echantillonnage probabiliste est qu’elle permet de g´en´eraliser
les r´esultats de l’´echantillon `a l’ensemble de la population en s’appuyant sur une th´eorie
statistique reconnue.
Son seul inconv´enient est qu’il faut poss´eder une liste de toutes les unit´es formant la po-
pulation avant de proc´eder `a la s´election de l’´echantillon.
Dr. Mederic NDIMBA/FST/L1MATH/ 2024 Chapitre 4. Échantillonnage et estimation
4.2. Statistiques sur un échantillon(Statistiques empiriques) 4
Il existe comme on vient de le voir, de nombreuses fa¸cons de constituer des ´echantillons.
Dans ce chapitre, nous n’envisagerons que le cas d’un ´echantillon al´eatoire simple, o`u
les variables Xisont mutuellement ind´ependantes.
4.1.1 ´
Echantillonnage al´eatoire simple
Un ´echantillon al´eatoire simple est un ´echantillon s´electionn´e de mani`ere `a ce que
chaque ´echantillon possible de taille ”n” ait la mˆeme probabilit´e d’ˆetre s´electionn´e, On
pr´el`eve dans la population des individus au hasard, tous les individus ont la mˆeme pro-
babilit´e d’ˆetre pr´elev´es, et ils le sont ind´ependamment les uns des autres. En d’autres
termes, un ´echantillon al´eatoire simple (X1, X2, ..., Xn) est constitu´e de variables al´eatoires
Ximutuellement ind´ependantes et de mˆeme loi (avec le mˆeme param`etre), on parlera
d’´echantillon iid (ind´ependant et identiquement distribu´e). La constitution d’´echantillons
plus compliqu´es, et plus sophistiqu´es, est par exemple envisag´ee dans la th´eorie des son-
dages.
Remarques 4.1.1.
La donn´ee de la suite finie (X1, X2, ..., Xn) ´equivaut naturellement `a la donn´ee du
vecteur al´eatoire (X1, X2, ..., Xn).
La variable al´eatoire Xise d´eduit donc de l’´echantillon par projection sur le i-i`eme
vecteur de la base canonique de Rn.
Pour tout possible ωde la tribu A, la r´ealisation
(X1(ω), X2(ω), ..., Xn(ω)) = (x1, x2, ..., xn)
est un ´el´ement de Rn, et c’est un ´el´ement que l’on appelle souvent ´echantillon.
Pour ´eviter les confusions, le vecteur al´eatoire est parfois appel´e ´echantillon
al´eatoire, (x1, x2, ..., xn) ´etant un ´echantillon observ´e.
4.2 Statistiques sur un ´echantillon(Statistiques em-
piriques)
D´efinition 4.2.1. Statistique
On appelle statistique sur un n-´echantillon une fonction de (X1, X2, ..., Xn).
4.2.1 Moyenne empirique
D´efinition 4.2.2. Moyenne empirique
Dr. Mederic NDIMBA/FST/L1MATH/ 2024 Chapitre 4. Échantillonnage et estimation
4.2. Statistiques sur un échantillon(Statistiques empiriques) 5
Soit En= (X1, X2, ..., Xn)un n-´echantillon d’une loi L. La statistique Xnd´efinie par
Xn=1
n
n
X
k=1
Xk
porte le nom de moyenne empirique de la loi Lassoci´ee `a l’´echantillon En.
Th´eor`eme 4.1. Soit Xnla moyenne empirique associ´ee `a un nechantillon iid d’une
loi Ld’esp´erance µet de variance σ2. Alors :
1. E(Xn) = µ
2. V(Xn) = σ2
n
Exemple 4.2.1. Le r´esultat du lancer d’un d´e suppos´e bien ´equilibr´e, est r´egit par la
loi uniforme discr`ete sur J1,6K. En lan¸cant le d´e 100 fois, on r´ealise un 100-´echantillon
E100 = (X1, X2, ..., X100) de cette loi. Si l’on cherche `a illustrer la loi des grands nombres,
on est conduit `a calculer la moyenne des r´esultats obtenus, c’est-`a-dire `a ´etudier la variable
al´eatoire Y=1
100
100
X
k=1
Xk.
Cette statistique s’appelle la moyenne empirique de l’´echantillon E100.
Comportement asymptotique de la moyenne empirique
Th´eor`eme 4.2. La moyenne empirique Xnassoci´ee `a un nechantillon iid d’une loi L
d’esp´erance mconverge en probabilit´e vers la variable certaine ´egale `a m
Xn
P
m.
Th´eor`eme 4.3. Soit Xnla moyenne empirique associ´ee `a un nechantillon iid d’une
loi Ld’esp´erance met de variance σ2. Alors la variable centr´ee r´eduite associ´ee `a Xn
converge en loi vers une variable normale centr´ee r´eduite
nXnm
σ
L
Y, avec Y → N(0,1).
4.2.2 Variance empirique
D´efinition 4.2.3. Variance empirique
Soit En= (X1, X2, ..., Xn)un n-´echantillon d’une loi L. La statistique S2
nd´efinie par
S2
n=1
n
n
X
k=1
(XkXn)2
porte le nom de variance empirique de la loi Lassoci´ee `a l’´echantillon En.
Dr. Mederic NDIMBA/FST/L1MATH/ 2024 Chapitre 4. Échantillonnage et estimation
1 / 15 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!