1
STAT. PROBABILISTES
POPULATION
STATISTIQUE
N individus possédant une modalité
yide la (ou des) variable(s) y
(1
i
N)
PARAMETRES
valeur centrale dispersion corrélation
µρ
ρρ
ρ
moyenne variance coef. corr.
SONDAGE
(ECHANTILLONNAGE)
ESTIMATION
(INDUCTION STAT.)
CARACTERISTIQUES
D'UNE SERIE
STATISTIQUE
STAT. DESCRIPTIVES
LOIS DE
DISTRIBUTIONS
DE PROBABILITES
ECHANTILLON
n individus possédant une modalité
yide la (ou des) variables(s) y
(1
i
n)
ESTIMATEURS
valeur centrale dispersion corrélation
!
!!
!r
σ
σσ
σe²
moyenne variance coef. corr.
σ
σσ
σ²
Echantillon : Collection d'individus prélevés dans la population statistique.
Sondage (tirage aléatoire) : Procédure de sélection des éléments d'une
population pour constituer un échantillon représentatif de cette population.
Estimation (inférence) : calcul d'un paramètre de la population à partir de sa
valeur prise dans l'échantillon (estimateur).
Dimension : c’est le couplage entre le nombre de paramètre (poids, taille …) et
le nombre de méthode (ou technique) utilisé
Loi de probabilités : modèle mathématique permettant de rendre compte de
phénomènes aléatoires.
2
THEORIE DE L’ECHANTILLONNAGE
Introduction : ‘Loi des grands nombres’
Quand on répète N fois une expérience aléatoire et que l'on note par f le
nombre de fois que l'événement A s'est produit (f= fréquence de A) la
probabilité p(A) est la limite, quand N tend vers l'infini, de f/N (fréquence
relative de A). De même que l'on parle de distribution de fréquences on peut
parler de distribution de probabilités.
EX. 1 : Variable qualitative : jeu de dé
DISTRIBUTION
DE
PROBABILITES
DISTRIBUTION DE
FREQUENCES
ABSOLUES
POUR n = 1000 TIRAGES
P
1 / 6 167
F
150 190 145 175 160 180
POPULATION
INFINIE
ECHANTILLON
n
FREQUENCE
RELATIVE
f = F / n
PROBABILITE
p
0
0.02
0.04
0.06
0.08
0.10
0.12
0.14
0.16
0.18
0.20
123456789101112 0
20
40
60
80
100
120
140
160
180
200
1 2 3 4 5 6 7 8 9101112
EX. 2 : Variable quantitative
P
n = 1000
F
123456 123456
3
De même pour un échantillon extrait d'une population supposée infinie : la
fréquence relative d'une classe est une réalisation de sa fréquence relative
dans la population, c'est-à-dire de la probabilité associée à cette classe.
Généralités - Objectifs
Considérons une population P composée de N individus. Supposons qu’il
existe une variable X associée à chaque individu (exp. SAU pour une
exploitation).
Nous ne connaissons pas la répartition de X dans la population considérée. La
moyenne µ et la variance σ2 (ou la proportion p) dans la population P sont
respectivement :
=
=N
1i i
x
N
1
µ
== N
1i i
(x
N
1
²
µσ
Par sondage, on prélève un échantillon aléatoire de n individus dans la
population P. Soit x1, x1, x2, , xn les valeurs de X dans l’échantillon. La
moyenne x et la variance 2
e
σ
(ou la proportion f) de X dans l’échantillon sont
respectivement :
=
=n
1i i
x
n
x1
== n
1i ie x(x
n
1
2
σ
x et 2
e
σ
constituent-elles des estimations de µ et de σ2 ? Si oui, quelle est
leur précision ?
Connaissant
x et 2
e
σ
, que peut-on dire de la moyenne µ et la variance σ2
de la population totale P ?
4
Les distributions d'échantillonnage
On prélève un échantillon de n éléments dans une population de moyenne µ et
de variance σ
σσ
σ².
On obtient une moyenne x et une variance 2
e
σ
.
Si l'on répétait cette opération un grand nombre de fois, on constaterait que les
moyennes obtenues à partir de ce grand nombre d'échantillons de n unités se
distribueraient suivant une loi normale de moyenne "
""
" = µ et de variance σ
σσ
σ²M =
σ
σσ
σ²/n. Cela se vérifie :
quelque soit la distribution de la variable étudiée si n est suffisamment grand
(n>30 en pratique)
quelque soit la taille n de l'échantillon si celui-ci est tiré d'une population
normale
D'après le Théorème Central Limite, l'ensemble de toutes les moyennes qu'on
pourrait obtenir par des échantillons de n unités est lui-même une variable
aléatoire M de distribution normale N(µ,σ
σσ
σ/
n).
La distribution de M s'appelle distribution d'échantillonnage de la moyenne.
On constate que la dispersion (σ²/n) de cette variable est beaucoup plus faible
que celle de la variable étudiée (σ²).
5
f(x)
DISTRIBUTION
(QUELCONQUE)
DE LA VARIABLE
N ELEMENTS
(POPULATION
D'ORIGINE)
K ECHANTILLONS
µ
n éléments ................
x2
x1xk
σ
K ESTIMATIONS DU PARAMETRE
µ
DISTRIBUTION
D' ECHANTILLONNAGE
DE LA MOYENNE
K ESTIMATIONS
M
σM
Paramètre de la distribution :
σ = σ /n
M
f(x)
Distribution d'échantillonnage d'un paramètre
n éléments n éléments
ON EXTRAIT INDEPENDAMMENT K ECHANTILLONS DE MEME TAILLE
σe k
σe 2
σe 1
"
" = µ
1 / 10 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !