Probabilités-Statistiques Année 2008-2009 Utilisation de la lgn et du tlc en statistique Dans de nombreux problèmes concrets interviennent des quantités aléatoires, dont on ne connaı̂t a priori pas la loi. Une approche possible consiste à faire l’hypothèse que les lois en questions appartiennent à des familles de lois connues, dépendant de paramètres, par exemple : lois de Bernoulli B(p), lois exponentielles E(λ), de Poisson P(λ), gaussiennes N (µ, σ 2 ) etc. Ayant fait cette hypothèse, le but de la statistique paramétrique est d’estimer le ou les paramètres de la loi, dans les exemples ci-dessus : p, λ, (µ, σ 2 ). 1 Loi de grands nombres pour fournir des estimateurs Supposons que dans une expérience concrète intervient une quantité aléatoire dont la loi appartient à une famille de lois (connue) dépendant d’un paramètre (inconnu), disons Θ(θ). Une méthode possible pour estimer le paramètre θ consiste à utiliser la loi des grands nombres. Exemple 1 : Lors d’un référendum avec deux réponses possibles (0 ou 1), on fait un sondage à la sortie des urnes pour prédire le résultat final avant que tous les bulletins ne soient dépouillés. À cette fin, on demande à n personnes pour qui ils ont voté lorsqu’ils sortent de l’isoloire ; on récolte ainsi des données (x1 , . . . , xn ) ∈ {0, 1}n . Soit p la proportion (inconnue) d’électeurs ayant voté 1 dans la population totale. Un modèle naturel pour décrire le vote consiste à supposer que les électeurs font le choix 0 avec probabilité 1 − p et le choix 1 avec probabilité p, autrement dit que les xi sont des réalisations de variables indépendantes Xi de loi de Bernoulli B(p). D’après la loi (faible) des grands nombres, lorsque n tend vers l’infini, on a alors : n 1X P pbn := Xi −→ E[X1 ] = p. n i=1 Lorsque n est grand, avec une probabilité proche de 1, on peut affirmer que pbn ≈ p. La loi des grands nombres nous fournit donc un bon candidat pour estimer p. Exemple 2 : Dans une usine fabriquant des composants électriques, on veut s’assurer que des résistances ont une durée de vie suffisament grande pour pouvoir être commercialisées. On prélève n résistances de la chaı̂ne de production et on mesure leur durée de vie dans un circuit test. On récolte ainsi des données (x1 , . . . , xn ) ∈ Rn+ . La durée de vie des résistances peut être modélisée par une variable aléatoire de loi expontentielle E(λ) où λ est un paramètre inconnu. Autrement dit, on peut supposer que les xi sont des réalisations de variables indépendantes Xi , de loi expontentielle E(λ). D’après la loi des grands nombres, on a alors : n 1 1X P Xi −→ E[X1 ] = . n λ i=1 bn := n/ Pn xi . Un bon candidat pour estimer λ est donc λ 1 Définition : On dit qu’un estimateur θbn d’un paramètre θ, basé sur n observations (x1 , . . . , xn ), est consistant si θbn tend en probabilité vers θ, lorsque n tend vers l’infini. 2 Théorème limite central et intervalles de confiance Supposons que l’on dispose de n réalisations (x1 , . . . , xn ) de variables i.i.d (X1 , . . . , Xn ) de loi Θ(θ), dont la moyenne est µθ et la variance σθ2 . Le théorème limite central permet de donner des intervalles de confiance P pour des quantités dépendant du paramètre θ. Par exemple, la moyenne empirique µ bn = n1 ni=1 Xi est un estimateur consistant de µθ et d’après le théorème limite central, lorsque n tend vers l’infini, on a √ n L (b µn − µθ ) − → N (0, 1). σθ On peut alors déduire facilement un intervalle de confiance pour µθ . Exemple 1 : On reprend le premier exemple du paragraphe précédent. D’après le théorème limite central, lorsque n tend vers l’infini, on a √ √ n L L n (b pn − p) −→ N (0, p(1 − p)) , i.e. p × (b pn − p) −→ N (0, 1). p(1 − p) Étant donné un seuil α ∈]0, 1[, par ex. α = 5%, 1% etc., il est facile d’exhiber un réel εα tel que P(|N (0, 1)| > εα ) ≤ α. Auquel cas, pour n assez grand, d’après le théorème limite central, on a ! √ n P p × (b pn − p) > εα ≤ α, p(1 − p) p p εα εα i.e. P pbn − √ × p(1 − p) ≤ p ≤ pbn + √ × p(1 − p) ≥ 1 − α, n n et comme p(1 − p) ≤ 1/4, on conclut que : εα εα P pbn − √ ≤ p ≤ pbn + √ ≥ 1 − α. 4n 4n Exemple 2 : On reprend le deuxième exemple du paragraphe précédent. D’après le théorème limite central, lorsque n tend vers l’infini, on a √ λ L n× − 1 −→ N (0, 1). b λn Avec α et εα comme dans l’exemple 1, on en déduit que pour n assez grand : λ √ P n× − 1 ≤ εα ≥ 1 − α, bn λ c’est à dire −1 −1 ! ε ε α α bn 1 + √ bn 1 − √ P λ ≤ λ ≤λ ≥ 1 − α. n n