Table des matières 1 Modèles statistiques

Téléchargement

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE

U.F.R. SEGMI Année universitaire 2014 – 2015

L2 Économie Cours de B. Desgraupes

Méthodes Statistiques

Séance 02: Échantillonnage

Table des matières

1 Modèles statistiques 1

2 Caractéristiques d’un échantillon 2

2.1 Estimateurs .............................. 2

2.2 La moyenne empirique ........................ 4

2.3 La fréquence empirique ....................... 5

2.4 La variance empirique ........................ 5

3 Comportement asymptotique 7

3.1 Comportement de ¯

Xn........................ 8

3.2 Comportement de S2

n......................... 12

4 Échantillons issus d’une variable normale 12

1 Modèles statistiques

On considère dans cette séance un échantillon de taille nextrait d’une popula-

tion de taille Net on s’intéresse à un caractère Xassocié aux éléments de la

population (les “individus statistiques”).

L’échantillon d’individus résulte d’un tirage avec remise dans la population.

À cet échantillon correspond un échantillon de valeurs prises par la caractère

Le caractère Xest considéré comme une variable aléatoire et l’échantillon de

valeurs est consitué de nréalisations de cette variable. C’est sur cet échantillon

que se font les calculs.

On représente cette situation au moyen d’un modèle statistique qui comporte

en particulier une famille de lois de probabilité parmi lesquelles se trouve la loi

suivie par la variable X.

Ces lois de probabilité dépendent en général d’un ou plusieurs paramètres

notés θ. Dans ce cas, on dit qu’on a un modèle statistique paramétrique.

Par exemple :

•pour une loi normale, les paramètres sont la moyenne met l’écart-type σ

;

•pour une loi de Bernoulli ou une loi binomiale, c’est la probablilité p.

Un des problèmes les plus courants en statistique consiste à trouver la valeur

du ou des paramètres pour la population. Mais comme on ne peut pas en

général avoir l’information nécessaire, on doit ce contenter des valeurs fournies

par l’échantillon.

À partir de l’échantillon de valeurs, on essaie de résoudre divers types de

problèmes :

1. les problèmes de test : choix entre deux éventualités dont une seule est

vraie.

2. les problèmes d’estimation ponctuelle : choisir une valeur du paramètre θ.

À partir des données de l’échantillon, il faut déﬁnir une fonction (appelée

aussi une statistique) dont la valeur estime θ.

3. les problèmes d’estimation ensembliste : déterminer un sous-ensemble de

l’ensemble des paramètres représentant un ensemble d’éventualités. Cela

conduit à la détermination d’intervalles de conﬁance.

L’expérience aléatoire consiste en nexpériences élémentaires identiques et

indépendantes.

On considère que chaque Xiest une variable aléatoire et on suppose qu’elles

sont indépendantes entre elles. D’autre part, elles sont identiquement distribuées

(puisque distribuées comme Xelle-même).

En abrégé, on dit que les Xisont i.i.d. qui est l’abréviation de indépendantes

et identiquement distribuées.

On a donc :

E(Xi) = met Var(Xi) = σ2∀i= 1, . . . , n

2 Caractéristiques d’un échantillon

2.1 Estimateurs

On notera (X1, . . . , Xn)l’échantillon de valeurs. Les statistiques calculées à

partir de cet échantillon dépendent évidemment de l’échantillon qui a été tiré.

On dit qu’il s’agit de quantités empiriques puisqu’elles résultent de l’expérience

(tirage, observation, mesure, etc.).

On va voir en particulier les quantités empiriques les plus couramment util-

isées :

1. la moyenne empirique ;

2. la variance empirique ;

3. la fréquence empirique.

Si on avait tiré un autre échantillon, la statistique empirique aurait certaine-

ment une autre valeur. Il s’agit donc d’une valeur aléatoire et on s’intéressera à

son espérance et à sa variance.

Exemple

Comment estimer la taille moyenne d’un étudiant de l’université Paris-Ouest

On peut procéder en prenant 10 étudiants au hasard et en mesurant la taille

moyenne parmi ces dix étudiants. Notre estimateur serait ici la moyenne de

l’échantillon.

Deux questions viennent à l’esprit :

1. la taille de l’échantillon est-elle importante ?

Intuitivement, on sent bien que plus l’échantillon sera grand et meilleure

sera l’estimation.

2. le nombre d’échantillons tirés est-il important ?

Intuitivement encore, on se dit que si on arrive à accumuler beaucoup

de valeurs de la statistique qui sert d’estimateur (en tirant beaucoup

d’échantillons), à la ﬁn, en moyenne, on aura une “bonne” estimation de

la vraie valeur du paramètre qui nous intéresse.

On verra plus loin, à travers les propriétés asymptotiques, dans quelle mesure

la théorie vient conﬁrmer ces intuitions.

On peut construire beaucoup d’estimateurs diﬀérents pour estimer un paramètre

donné. Certains seront considérés comme meilleurs que d’autres selon diﬀérents

critères.

Une bonne manière de quantiﬁer cette propriété est de calculer l’espérance

de l’estimateur (c’est-à-dire sa valeur moyenne compte-tenu de sa distribution

probabiliste) et de voir si elle fournit la vraie valeur.

Si on appelle Tl’estimateur et θle paramètre, on se demande si :

E(T)?

=θ

Ce n’est pas nécessairement le cas.

Déﬁnition 2.1. On dit que l’estimateur Test sans biais lorsque E(T) = θ.

La quantité b(θ) = E(T)−θs’appelle le biais de l’estimateur. Si b(θ)6= 0,

on dit que l’estimateur est biaisé.

Un estimateur est donc sans biais lorsque son espérance est égale à ce qu’il

estime.

2.2 La moyenne empirique

Déﬁnition 2.2. La moyenne empirique de l’échantillon est

Xn=1

i=1

Cette moyenne empirique est utilisée comme estimateur de la moyenne véri-

table de la population.

•Espérance de ¯

E¯

Xn=E 1

i=1

Xi!

i=1

EXi

i=1

n×n m

L’espérance de la moyenne empirique est la moyenne véritable dans la pop-

ulation. On peut aussi dire que ¯

Xnest un estimateur sans biais de m.

•Variance de ¯

Les variables étant indépendantes, on sait que la variance de la somme est

égale à la somme des variances. On écrit :

Var¯

Xn= Var 1

i=1

Xi!

i=1

VarXi

i=1

σ2

n2×n σ2

=σ2

Autrement dit, plus la taille de l’échantillon est grande plus la variance de

l’estimateur ¯

Xnest faible.

Si on prend la racine carrée, on voit que l’écart-type de la moyenne empirique

est égal à σ

√n: pour diviser l’écart-type par 2, il faut multiplier la taille de

l’échantillon par 4.

2.3 La fréquence empirique

Dans le cas particulier d’une expérience de Bernoulli, c’est-à-dire d’une variable

aléatoire Xqui peut prendre seulement les valeurs 0 ou 1, la moyenne empirique

est appelée fréquence empirique. On la note Fnplutôt que ¯

Xn.

Puisque les valeurs de l’échantillon prennent la valeur 0 ou 1, leur somme

est le nombre de fois où la valeur est 1. En divisant par n, on obtient donc la

proportion des variables qui prennent la valeur 1.

Supposons que X∼ B(p). On prend la fréquence empirique comme estima-

teur du paramètre p.

Rappel

L’espérance d’une loi de Bernoulli B(p)est égale à pet la variance à p(1 −p).

On déduit donc des calculs sur la moyenne empirique que :







EFn=p

VarFn=p(1 −p)

On peut donc dire que Fnest un estimateur sans biais de la proportion p

dans la population.

2.4 La variance empirique

Déﬁnition 2.3. On appelle variance empirique d’une échantillon (X1, . . . , Xn)

la quantité

n=1

i=1

(Xi−¯

X)2

C’est la somme des carrés des écarts à la moyenne empirique (qu’on note ici

simplement ¯

Xau lieu de ¯

Xn).

La variance est une quantité au carré. Cela signiﬁe que si les valeurs Xi

sont, par exemple, mesurées en mètres, alors la variance est en mètres carrés.

La racine Sns’appelle l’écart-type empirique. Il est mesuré dans la même

unité que les Xi.

Lorsque la variance σ2de la population est inconnue, on peut utiliser S2

comme estimateur mais on va voir que c’est un estimateur biaisé.

Il existe une autre formule (dite formule développée) pour calculer la variance

d’un échantillon :

Var(x) = 1

i=1

i−¯

1 / 14 100%

Documents connexes

les notations

estimation statistique

ExamHLMA406bis Fichier

Lois de probabilité usuelles : tableau récapitulatif

Programme de Colle 29

Probabilités et Statistique Inférentielle 2

Quelques définitions

Détermination d`une statistique exhaustive Estimateurs et

Document

Une loi (8 points) 1 Variables Gaussiennes (12 points)

TD n 3 : Estimation par maximum de vraisemblance.

Solutions chapitre 3

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Table des matières 1 Modèles statistiques

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Table des matières 1 Modèles statistiques

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib