Mise à niveau Estimation et Tests statistiques Master Statistique et

Téléchargement

Mise à niveau

Estimation et Tests statistiques

Master Statistique et econométrie

V. Monbet

Master 1 - 2012

Table des matières

1Introduction 3

1.1 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Théorie de la décision : tests statistiques . . . . . . . . . . . . . . . . . . . . . . . 3

2Estimation 4

2.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.2 Estimation par la méthode des moments . . . . . . . . . . . . . . . . . . . . . . . 5

3Estimationparintervalles 6

4Testsd’hypothèses 6

4.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

4.1.1 Hypothèses de test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

4.1.2 Statistique de test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

4.1.3 Région de rejet, Niveau de signiﬁcation . . . . . . . . . . . . . . . . . . . . 7

4.1.4 Les deux espèces d’erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

5Testunilatéraloubilatéral 9

5.1 Exemple 1 : test de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

5.2 Exemple 2 : test de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

5.3 Exemple 3 : test du chi2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1Introduction

1.1 Notations

Dans la mesure du possible, nous utiliserons les notations suivantes dans ce cours :

–Variablesaléatoires:lettresmajuscules(ex:X1,···,X

–Observations:lettresminuscules(ex:x1,···,x

n))

–Paramètres:lettresgreques(ex:θ,µ,σ)

Estimation ponctuelle

Dans un premier temps, nous aborderons le problème de l’estimation ponctuelle de paramètres.

Exemple :Onsupposequel’onadeuxcandidatsAetBlorsd’uneélection.Onchercheàprédire

la proportion de votes pour A à partir d’un échantillon représentatif de taille nsélectionné par un

institut de sondage. Chaque individu de l’échantillon donne son intention de vote. On modélise

le choix A pour l’individu ipar une variable aléatoire

Xi=1si ivote A,X

i=0sinon

Les Xisuivent une loi de Bernouilli de paramètre πinconnu. On dispose de nobservations

x1,···,x

nde X1,···,X

n.Onchercheàinférerπàpartirdel’échantillonx1,···,x

n.Uneesti-

mation naturelle est

ˆπn=1

i=1

On se pose alors des questions : Cette quantité estime t’elle bien le paramètre pi ?Peut-onlui

associer une marge d’erreur ? Que se passe t’il si on dispose d’un échantillon plus grand (c’est à

dire si ngrandit) ? Existe t’il d’autres quantités qui donnerait une meilleure estimation de p?

En existe t’il une qui est optimale pour un critère bien choisi ?

1.2 Théorie de la décision : tests statistiques

Dans une seconde partie, nous introduirons le concept de test statistique.

Exemple :Ontestel’eﬃcacitéd’unmédicamentcontrelecholestérol.Ondisposepourceladen

individus pour lesquels on a eﬀectué deux mesures du taux de cholestérol, l’une avant et l’autre

après le traitement. On note

–X:letauxdecholestérolavantletraitement,

–Y:letauxdecholestérolaprèsletraitement.

On dispose donc des couples d’observations (x1,y

1),···,(xn,y

n)et on veut déterminer à l’aide

de ces observations si

D=Y−X

est positif. Etant donnés les caractères aléatoires de Det de l’expérience, on décidera de l’eﬃcacité

du traitement si la moyenne observée

dn=1

i=1

(yi−xi)

est plus grande qu’un seuil. Ce seuil est déﬁni en fonction du risque de se tromper qui est ﬁxé

par l’expérimentateur et de la taille nde l’échantillon.

2 Estimation

2.1 Généralités

Apartirdedonnéesd’échantillonsreprésentatifs,onvainduiredesrésultatssurlapopulation-

mère (i.e. population dans laquelle les échantillons ont été prélevés). Plus exactement, soit θun

paramètre inconnu intervenant dans la loi de probabilité d’une variable aléatoire Xet soient

x1,...,x

i,...,x

nles nvaleurs prises par la v.a. Xdans un échantillon de taille nprélevé dans

la population-mère. On appelle estimateur de θ,etl’onnoteTn,lafonctionquiauxvaleursxi

de l’échantillon fait correspondre la valeur du paramètre θ.Onnotelavaleurnumériquedecette

estimation par

θ=Tn(x1,...,x

Par déﬁnition, Tnest une fonction des réalisations d’une v.a., Tnest donc une v.a. dont on peut

chercher à déterminer les caractéristiques (loi, ddp, FR, moments, ...).

Exemple : On observe un phénomène de production de pièces manufacturées. Chaque pièce est

associée à une mesure (un indicateur de qualité par exemple). Comme on ne peut pas vériﬁer

chaque mesure, on procède à un échantillonnage qui nous fournit donc un échantillon. Supposons

que la connaissance de la nature de cet indicateur nous permet de faire l’hypothèse qu’il obéit

àuneloideprobabiliténormale.Leproblèmeestmaintenant,auvuedel’échantillon{xi},de

proposer une valeur pour la moyenne de cette loi normale. Il faut procéder à une estimation du

paramètre vrai µqui se traduit par la valeur ˆµ.Ilyauneinﬁnitédemanièrepossibleparmi

lesquelles on peut citer

•ˆµ=1

n"ixi

•ˆµ=médiane{xi}

•ˆµ=mode{xi}

•ˆµ=x7

Quel est le meilleur estimateur de la moyenne ? Existe-t-il ?

Sur ce simple exemple, est résumé le problème fondamental de l’estimation : quelle est la déﬁnition

mathématique de meilleur ? La réponse est simple, il n’en existe pas. Alors comment comparer

les estimateurs. Pour cela, on se sert de plusieurs critères, le plus souvent liés au bon sens :

–lebiais :Onsouhaitequel’estimationnesoitpassystématiquementdécaléeparrapport

àlavaleurvraie.

Déﬁnition 1 -Lebiais

1d’un estimateur ˆ

θest déﬁni par

bθ(ˆ

θ)=Eθ(ˆ

θ)−θ

On dit qu’un estimateur est non biaisé ou sans biais si bθ(ˆ

θ)=0.

1bias

–laprécision.Sil’onrépètel’estimationsurunautreéchantillon,onsouhaiteobtenirune

estimation cohérente, donc peu de variation d’un échantillon à l’autre. On parlera aussi

d’eﬃcacité.Lavarianced’unestimateurreprésentesaprécision.Pourtouslesestimateurs

(ayant même moyenne), il est possible de trouver celui dont la précision sera la meilleure,

i.e. dont la variance sera la plus faible. On parle alors d’estimateur à variance minimum.

Lorsque l’on compare deux estimateurs, on dira également que Tnest plus eﬃcace que T∗

si V(Tn)<V(T∗

n).

Déﬁnition 2 -L’erreurenmoyennequadratique

2(EMQ) de θest déﬁnie par

EMQ =Eθ((ˆ

θ−θ)2)

On remarque que

EMQ =Var

θ(ˆ

θ)+bθ(ˆ

θ)2

–laconvergence.Sil’onpeutestimerlavaleurduparamètresurtoutelapopulation-mère,

la valeur de l’estimation obtenue doit être la valeur vraie du paramètre.

Déﬁnition 3 - Une suite d’estimateurs {ˆ

θn}est dite consistante pour θsi {ˆ

θn}converge

en probabilité vers θ,c’estàdiresi,

lim

n→+∞

Pθ[|ˆ

θn−θ|>$]=0

pour tout $>0et pour toute valeur de θ.

–larobustesse.Danstoutcasconcrèt,ilexistedessourcesdeperturbations.Onsouhaite

que l’estimation ne soit pas sensible à la présence de valeurs abérantes (outliers en anglais).

Ces diﬀérents critères ne sont pas forcément compatibles entre eux, et l’on retrouve des

dilemmes classiques, précision vs robustesse, convergence vs complexité.

2.2 Estimation par la méthode des moments

Exemple de construction d’estimateur. Soit Xune variable aléatoire telle E[|X|r]<∞et

X1,···,X

nde même loi que X.Parlaloidesgrandsnombres,

n=1

i=1

i→E(Xs)=µssi X1,···,X

nindépendantes

Aussi, si nest assez grand, on s’attend à ce que Ms

n$µs.

On appelle estimateur de θobtenu par la méthode des moments la solution ˆ

θdu système d’équa-

tions







µ1(θ)=M1

···

µs(θ)=Ms

Exemple - loi de Poisson. λ=E(X).D’oùˆ

θ=1

n"n

i=1 Xi.

2mean square error

1 / 12 100%

Documents connexes

les notations

Une loi (8 points) 1 Variables Gaussiennes (12 points)

TP 4 - David Haziza Website

Exercices : Statistiques Paramétriques & Non Paramétriques

TD n 3 : Estimation par maximum de vraisemblance.

TD Estimation Maximum de Vraisemblance - Maths Supérieures

ExamHLMA406bis Fichier

Détermination d`une statistique exhaustive Estimateurs et

1 Estimateurs (inspirés de [1]) 2 Estimateurs du maximum de

TD n˚7 : Echantillonnage et estimation

Document

M2 GRFA-rappels Econométrie (DOC, 110 Ko)

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Mise à niveau Estimation et Tests statistiques Master Statistique et

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Mise à niveau Estimation et Tests statistiques Master Statistique et

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib