Introduction générale

Téléchargement

Echantillonnage Module 1 – Variables et lois d’échantillonnage

EchM1.doc 1/15

La notion de base en statistique est celle de population : ensemble d’individus (ou objets ou

unités statistiques) pouvant être décrits par un ensemble de variables (ou propriétés ou

caractéristiques) communes. La variabilité d’une population signifie que les variables décrivant

les individus peuvent prendre des valeurs différentes d’un individu à l’autre. L’analyse

statistique est l’étude de cette variabilité.

Souvent, il est matériellement impossible d’étudier tous les individus d’une population. Si l’on se

limite à une partie de la population, on fait un sondage; la partie étudiée s’appelle un

échantillon. Afin d’assurer la représentativité de l’échantillon, celui-ci est la plupart du temps tiré

au hasard dans la population.

La théorie de l’échantillonnage nous permet de passer des caractéristiques de la population aux

caractéristiques d’un échantillon représentatif.

Schéma récapitulatif

Population P

N individus

X : variable aléatoire

recensement exhaustif

loi statistique caractérisée

par:

Moyenne : m

Variance : σ²

Proportion : P

Echantillonnage

estimation

Echantillon E

(représentatif de la

population)

n individus

X : variable aléatoire

iXX

∀≡

sondage

loi statistique caractérisée

par:

Moyenne :

Variance : S²

Proportion : F

Intervalles de confiance

On distingue deux cas :

•

On connaît la population c’est à dire sa loi avec ses caractéristiques (moyenne,

variance) et on cherche des renseignements sur un échantillon de n individus (loi,

moyenne, variance, avec quels intervalles de confiance?).

⇒

c’est un problème d échantillonnage : déduction.

•

On connaît l’échantillon c’est à dire sa loi avec ses caractéristiques (moyenne,

variance) et on veut estimer la population toute entière (loi, moyenne, variance, avec

quels intervalles de confiance?).

⇒

c’est un problème d’estimation : induction.

Echantillonnage Module 1 – Variables et lois d’échantillonnage

EchM1.doc 2/15

MODULE 1 : Variables et lois d’échantillonnage

Les lois d’échantillonnage et les variables d’échantillonnage définies dans ce module 1 vont

nous servir dans les modules 3 et 4 pour établir les intervalles de confiance (c’est à dire

encadrer les paramètres inconnus d’une population : moyenne, variance, proportion) et faire

des tests d’hypothèse (c’est à dire tester les paramètres d’une population à partir des données

d’échantillonnage).

M1Unité 1 : Définitions



Soit X, une variable aléatoire qui représente la population. Elle est caractérisée par la

densité de probabilité f(x), dans le cas d’une variable aléatoire continue, ou par sa probabilité

élémentaire p(x), dans le cas d’une variable aléatoire discrète.

•

On appelle échantillon de taille n issu de X, ou n-échantillon de X, le vecteur aléatoire

(

)

ni21

X,X,...X,X K

où iXX

∀≡

(

X suit la même loi que X) et

X,X indépendants

≠∀

. L’échantillon est dit IID c'est-à-dire identiquement indépendamment distribué.

On parle dans ce cas d’

échantillon théorique aléatoire probabilisé

•

L’ensemble de n valeurs images indépendantes de X est constitué de n images de l’épreuve

associée à X indépendantes

(

)

n21

x,,x,x

. Ainsi,

x est l’image obtenue à la ième

répétition de l’épreuve. Cet ensemble est l’image de la variable aléatoire

(

)

n21

X,,X,X

On parle ici d’

échantillon empirique ou observé



Convergence de la fonction de répartition d’un échantillon.

Soit

(

)

n21

X,,X,X

un échantillon théorique.

(

)

n21

x,,x,x

un échantillon empirique.

n21

xxx

<<< L

On va noter F’(x) la fonction de répartition empirique ou fonction des fréquences cumulées.

F(x)=Prob(X

≤

x) est la fonction de répartition théorique ou encore c’est la probabilité de

l’événement “X

≤

x”

F’(x)=

∑

≤xx i

F’(x) converge en probabilité vers F(x) : F’(x)

)x(F

→



Définition de la vraisemblance d’un échantillon

•

Cas discret :

X : variable aléatoire discrète caractérisée par

{

}

)x(p;

(Cf cours Math Stat1)

Soit

(

)

n21

X,,X,X

un échantillon théorique

La probabibilé conjointe est égale au produit des probabilités élémentaires (VA indépendantes)

[

]

[

]

[

]

nn11nn2211

xXPxXPxX;;xX;xXP

====== LL

[

]

[

]

)x(PxXobPrxXobPr,i

iiii

====∀

D’où

[

]

[

]

[

]

)x(P)x(PxXPxXPxXP

n1nn2211

LL ===⋅=

•

Cas continu :

X : variable aléatoire continue caractérisée par

{

}

)x(f;

Echantillonnage Module 1 – Variables et lois d’échantillonnage

EchM1.doc 3/15

[

]

[

]

[

]

)x(ddx)x(f)x(f dx)x(fdx)x(f dxxXxPdxxXxPdxxXx;;dxxXxP

n1n1

nn11

nnnn1111nnnn1111

+≤≤⋅+≤<=+<<+<<

On appelle

vraisemblance de l’échantillon

et on note

(

)

x,,xL L

le produit des probabilités

élémentaires ou des densités de probabilité :

(

)

)x(p)x(px,,xL

n1n1

X : variable aléatoire discrète

(

)

)x(f)x(fx,,xL

n1n1

X : variable aléatoire continue



Caractéristiques de l’échantillon théorique :

•

moyenne empirique notée :

X′

== ∑

•

variance empirique notée :

)XX(

Sµ=−=

∑

•

moment non centré empirique d’ordre r : ∑∑

′

XfX

•

moment centré empirique d’ordre r:

( )

∑∑

−=−=µ

XXf)XX(

• Proportion :

 Caractéristiques théoriques c’est à dire caractéristiques de la population :

• moment non centré d’ordre r :

( )

∫













=dxxfxXEm

dans le cas continu

∑

χ∈













pxxXEm dans le cas discret

•

moment non centré d’ordre 1

[

]

(

)

∫

== dxxxfXEm

(cas continu)

[

]

∑

χ∈

xpxXEm

(cas discret)

•

La variance :

[

]

(

)

∫

−=−==µ dx)x(fmx)X(EXE]X[V

(cas continu)

[

]

(

)

∑

χ∈

−=−==µ

pxmx)X(EXE]X[V

(cas discret)

•

p : proportion dans la population

Echantillonnage Module 1 – Variables et lois d’échantillonnage

EchM1.doc 4/15

Synthèse : notations :

Caractéristiques

de la population Caractéristiques

correspondantes

dans l’échantillon

théorique

La moyenne : m

La variance :

]X[V

=σ

Le moment non centré

d’ordre r

La proportion p F

M1Unité 2 : Variables d’échantillonnage

2.1 Etude de

∑

1i i

est la moyenne de l’échantillon théorique.

Les

X sont des variables aléatoires



est une variable aléatoire.

Calculons son espérance et sa variance :

•

[ ]

( )

∑∑













1i i

EXE

avec

[

]

[

]

mXEXE

moyenne théorique (puisque

≡

)

[ ]

⇒=

∑

[

]

mXE =

•

(

)

(

)

[

]

[

]

mXEXEXEXV −=−=

Echantillonnage Module 1 – Variables et lois d’échantillonnage

EchM1.doc 5/15

( )

[ ]





















−−+−=













−−+−=











−











−=











−=

∑ ∑∑

∑∑∑

∑

= = =

= ==

1j ji

1i i

)mX)(mX(E2mXE

)mX)(mX(2)mX(E

)mX(

EXV

X,X ind

(

)

(

)

[

]

[

]

[

]

0mXEmXEmXmXE

jiji

=−−=−−

( )

[ ]

mXE

=−=

∑

( )

(

)

est un indicateur de la dispersion de

autour de

[

]

XEm =.

Lorsque n augmente, n

diminue.

210

nnn >>

2.2 Etude de S²

( )

∑

−=

est la variance de l’échantillon théorique.

Les

X sont des variables aléatoires, donc

est une variable aléatoire.

(

)

1 / 15 100%

Documents connexes

TP 4 - David Haziza Website

Chap 7 Le recueil et l`analyse des informations

Variable aléatoire TS

L`essentiel des statistiques inférentielles

EX 1 : Soit p, la probabilité qu`un individu soit atteint de

Cours sur la fluctuation d`une fréquence Première - Maths

Document

IUT GB - Fiche de TD – Variables aléatoires discrètes

2ème Epreuve de Probabilités Bonne Chance

Quelles sont les étapes de la numérisation ? Le signal analogique

Solutions du chapitre I

1 Principe de l`échantillonnage 2 Échantillonnage de variables

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Introduction générale

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Introduction générale

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib