Premiers éléments de statistique I Introduction : le modèle statistique

Téléchargement

Premiers éléments de statistique

I Introduction : le modèle statistique

Jusqu’à présent, la théorie que nous avons considérée s’intéressait à la construction d’un objet abstrait, la

probabilité, censée servir à quantiﬁer la manière dont le hasard charge des événements liés à une expérience

aléatoire. Mais elle ne nous apprend pas de méthode à suivre pour choisir cette probabilité de la meilleure des

façons dans une situation concrète.

Le problème de la statistique est précisément celui du choix d’une probabilité en se fondant sur l’observation

de résultats de l’expérience aléatoire. Parmi les nombreuses situations possibles, nous nous concentrerons ici

sur l’étude de la statistique paramétrique, qui peut se décrire ainsi : on s’intéresse à une expérience aléatoire

donnée, pour laquelle on suppose que la loi de probabilité la gouvernant appartient à une famille de probabilités

dépendant d’un paramètre θélément d’un ensemble Θ(en général ce sera un sous ensemble de IR ou de IRp).

On ne connaît pas, a priori, la valeur effective du θqui convient et le but de l’opération est de déterminer cette

valeur θ0au vu de résultats de l’expérience, supposés numériques (c’est à dire à valeurs dans IR) pour simpliﬁer.

Quand on réalise l’expérience, on peut considérer que son résultat constitue une variable aléatoire sur IR de

loi Pθ.Pθest donc ici une probabilité sur IR. Systématiquement, l’espérance d’une variable aléatoire Xde

l’espace de probabilités (IR, Pθ)sera notée Eθ(X)et la variance Varθ(X).

On réalise alors nfois l’expérience, de façon indépendante, et on donne la déﬁnition suivante

Déﬁnition 1 Un n-échantillon du modèle statistique (Pθ)θ∈Θest la donnée de nvariables aléatoires indépen-

dantes X1, . . . , Xnde loi Pθ.

Le but est alors, étant donné un échantillon, de fabriquer une technique pour choisir un θ∈Θqui ait de

bonnes chances d’être la véritable valeur du paramètre inconnu.

II Estimateurs

Commençons par cette déﬁnition très générale

Déﬁnition 2 Soit (X1, . . . , Xn)un n-échantillon du modèle statistique (Pθ)θ∈Θ, et f: Θ →IR. Un estima-

teur de f(θ)est une fonction ϕ:IRn→IR.

Formellement, on dit qu’on estime f(θ)par ϕ(X1, . . . , Xn). Naturellement, cette déﬁnition d’estimateur est

extrêmement vague. Une précision est donnée comme suit

Déﬁnition 3 L’estimateur ϕde f(θ)est dit sans biais si, pour tout θ∈Θ,

Eθ(ϕ(X1, . . . , Xn)) = f(θ).

Dire qu’un estimateur est sans biais (e.s.b.) revient donc à dire que quelle que soit la valeur du paramètre, la

moyenne de l’estimateur est égale à f(θ).

Remarque : Il peut se trouver que la classe des estimateurs sans biais soit très réduite. Par exemple, si on a un

1-échantillon de la loi B(n, θ)(θ∈[0,1], inconnu), X

nest l’unique e.s.b. de θ.

Pour mesurer la façon dont un estimateur de f(θ)“s’approche” d’être sans biais, on introduit

Déﬁnition 4 Soit ϕun estimateur de f(θ). On appelle risque quadratique de ϕle réel

Rθ(ϕ) = Eθ([ϕ(X1, . . . , Xn)−f(θ)]2).

On a alors évidemment

Proposition 1 Quand ϕest un e.s.b. de f(θ), on a

Rθ(ϕ) = Varθ(ϕ(X1, . . . , Xn)).

On introduit aussi

Déﬁnition 5 Un estimateur ϕde f(θ)est dit sans biais de variance minimum (e.s.b.v.m.) s’il est sans biais

et si, pour tout e.s.b. ψde f(θ), on a

Rθ(ϕ) = Varθ(ϕ)≤Rθ(ψ) = Varθ(ψ).

III Moyenne et variance empirique

Une situation classique est la suivante. Soit µune loi de probabilités sur IR possédant une espérance met une

variance σ2. Si on suppose que met σ2sont inconnues, cela rentre dans le cadre d’un modèle de statistique

paramétrique où la loi appartient formellement à une famille de lois (pm,σ2)(m,σ2)∈IR×IR+.

Déﬁnition 6 Soit (X1, . . . , Xn)un n-échantillon de la loi µ.

(i) La moyenne empirique est l’estimateur de m

X=X1+. . . +Xn

(ii) La variance empirique est l’estimateur de σ2

S2=1

n−1

k=1

(Xk−X)2.

On a

Proposition 2 Xet S2sont des e.s.b. respectivement de met σ2.

IV Maximum de vraisemblance

Supposons que l’expérience aléatoire à laquelle on s’intéresse soit le fait de lancer une pièce biaisée, mais

qu’on ignore comment elle a été truquée. Plus exactement, on sait que la pièce est déséquilibrée de telle sorte

que l’on soit dans l’une des deux situations (mais on ignore laquelle)

(i) probabilité d’amener face = 0,9

(ii) probabilité d’amener pile = 0,9

On jette la pièce qui amène face. On va “naturellement” privilégier l’hypothèse (i). Ce qu’on a fait, c’est peser

la vraisemblance des deux hypothèses et (i) a semblé plus vraisemblable au vu du résultat.

Systématisons cette méthode dans le cadre où le modèle statistique (Pθ)θ∈Θest donné par des lois Pθsur IN .

Déﬁnition 7 La fonction de vraisemblance du modèle est

Lθ(k1, . . . , kn) =

j=1

Pθ(ki).

On a donc Lθ(k1, . . . , kn) = Pθ(X1=k1, . . . , Xn=kn)quand (X1, . . . , Xn)est un n-échantillon du modèle.

Déﬁnition 8 Un estimateur du maximum de vraisemblance de θest ˆ

θ(k1, . . . , kn)tel que pour tout (k1, . . . , kn)∈

IN n,

Lˆ

θ(k1,...,kn)(k1, . . . , kn) = sup

θ∈Θ

Lθ(k1, . . . , kn).

Pour le trouver, on procède en général comme suit : on pose

`θ(k1, . . . , kn) = ln Lθ(k1, . . . , kn) =

j=1

ln Pθ(ki).

On cherche alors les ˆ

θtels que ∂

∂θ `θ(k1, . . . , kn)=0et on vériﬁe, parmi ces valeurs, lesquelles correspondent

à des maxima. Par exemple, si X1, . . . , Xnest un échantillon de la loi de Poisson P(θ), on montre que Xest

un estimateur du maximum de vraisemblance de θ.

1 / 3 100%

Documents connexes

ExamHLMA406bis Fichier

ExamHLMA406 Fichier

Devoir3

Fiche 2 - Université de Nantes

TP 4 - David Haziza Website

UNIVERSITE DE BOURGOGNE UV8: Probabilités et Statistiques

Détermination d`une statistique exhaustive Estimateurs et

Stats

ext.ed. - UFR de Mathématiques et Informatique

1 - GEOCITIES.ws

TD no 10 : Bases de l`estimation paramétrique

Devoir2

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Premiers éléments de statistique I Introduction : le modèle statistique

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Premiers éléments de statistique I Introduction : le modèle statistique

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib