Utilisation de la lgn et du tlc en statistique 1 Loi de grands

publicité
Probabilités-Statistiques
Année 2008-2009
Utilisation de la lgn et du tlc en statistique
Dans de nombreux problèmes concrets interviennent des quantités aléatoires, dont on ne connaı̂t
a priori pas la loi. Une approche possible consiste à faire l’hypothèse que les lois en questions
appartiennent à des familles de lois connues, dépendant de paramètres, par exemple : lois de Bernoulli B(p), lois exponentielles E(λ), de Poisson P(λ), gaussiennes N (µ, σ 2 ) etc. Ayant fait cette
hypothèse, le but de la statistique paramétrique est d’estimer le ou les paramètres de la loi, dans
les exemples ci-dessus : p, λ, (µ, σ 2 ).
1
Loi de grands nombres pour fournir des estimateurs
Supposons que dans une expérience concrète intervient une quantité aléatoire dont la loi appartient
à une famille de lois (connue) dépendant d’un paramètre (inconnu), disons Θ(θ). Une méthode
possible pour estimer le paramètre θ consiste à utiliser la loi des grands nombres.
Exemple 1 : Lors d’un référendum avec deux réponses possibles (0 ou 1), on fait un sondage à
la sortie des urnes pour prédire le résultat final avant que tous les bulletins ne soient dépouillés.
À cette fin, on demande à n personnes pour qui ils ont voté lorsqu’ils sortent de l’isoloire ; on
récolte ainsi des données (x1 , . . . , xn ) ∈ {0, 1}n . Soit p la proportion (inconnue) d’électeurs ayant
voté 1 dans la population totale. Un modèle naturel pour décrire le vote consiste à supposer que
les électeurs font le choix 0 avec probabilité 1 − p et le choix 1 avec probabilité p, autrement dit
que les xi sont des réalisations de variables indépendantes Xi de loi de Bernoulli B(p). D’après la
loi (faible) des grands nombres, lorsque n tend vers l’infini, on a alors :
n
1X
P
pbn :=
Xi −→ E[X1 ] = p.
n
i=1
Lorsque n est grand, avec une probabilité proche de 1, on peut affirmer que pbn ≈ p. La loi des
grands nombres nous fournit donc un bon candidat pour estimer p.
Exemple 2 : Dans une usine fabriquant des composants électriques, on veut s’assurer que des
résistances ont une durée de vie suffisament grande pour pouvoir être commercialisées. On prélève
n résistances de la chaı̂ne de production et on mesure leur durée de vie dans un circuit test. On
récolte ainsi des données (x1 , . . . , xn ) ∈ Rn+ . La durée de vie des résistances peut être modélisée par
une variable aléatoire de loi expontentielle E(λ) où λ est un paramètre inconnu. Autrement dit, on
peut supposer que les xi sont des réalisations de variables indépendantes Xi , de loi expontentielle
E(λ). D’après la loi des grands nombres, on a alors :
n
1
1X
P
Xi −→ E[X1 ] = .
n
λ
i=1
bn := n/ Pn xi .
Un bon candidat pour estimer λ est donc λ
1
Définition : On dit qu’un estimateur θbn d’un paramètre θ, basé sur n observations (x1 , . . . , xn ),
est consistant si θbn tend en probabilité vers θ, lorsque n tend vers l’infini.
2
Théorème limite central et intervalles de confiance
Supposons que l’on dispose de n réalisations (x1 , . . . , xn ) de variables i.i.d (X1 , . . . , Xn ) de loi Θ(θ),
dont la moyenne est µθ et la variance σθ2 . Le théorème limite central permet de donner des intervalles
de confiance
P pour des quantités dépendant du paramètre θ. Par exemple, la moyenne empirique
µ
bn = n1 ni=1 Xi est un estimateur consistant de µθ et d’après le théorème limite central, lorsque n
tend vers l’infini, on a
√
n
L
(b
µn − µθ ) −
→ N (0, 1).
σθ
On peut alors déduire facilement un intervalle de confiance pour µθ .
Exemple 1 : On reprend le premier exemple du paragraphe précédent. D’après le théorème limite
central, lorsque n tend vers l’infini, on a
√
√
n
L
L
n (b
pn − p) −→ N (0, p(1 − p)) , i.e. p
× (b
pn − p) −→ N (0, 1).
p(1 − p)
Étant donné un seuil α ∈]0, 1[, par ex. α = 5%, 1% etc., il est facile d’exhiber un réel εα tel que
P(|N (0, 1)| > εα ) ≤ α.
Auquel cas, pour n assez grand, d’après le théorème limite central, on a
!
√
n
P p
× (b
pn − p) > εα ≤ α,
p(1 − p)
p
p
εα
εα
i.e. P pbn − √ × p(1 − p) ≤ p ≤ pbn + √ × p(1 − p) ≥ 1 − α,
n
n
et comme p(1 − p) ≤ 1/4, on conclut que :
εα
εα
P pbn − √ ≤ p ≤ pbn + √
≥ 1 − α.
4n
4n
Exemple 2 : On reprend le deuxième exemple du paragraphe précédent. D’après le théorème limite
central, lorsque n tend vers l’infini, on a
√
λ
L
n×
− 1 −→ N (0, 1).
b
λn
Avec α et εα comme dans l’exemple 1, on en déduit que pour n assez grand :
λ
√
P
n×
− 1 ≤ εα ≥ 1 − α,
bn
λ
c’est à dire
−1
−1 !
ε
ε
α
α
bn 1 + √
bn 1 − √
P λ
≤ λ ≤λ
≥ 1 − α.
n
n
Téléchargement