Estimation La théorie de l'estimation est une problématique importante en statistique théorique. Disposant d'un éhantillon x1, ..., xn de réalisations d'une v.a. X d'une loi donnée, où un ou plusieurs paramètres sont ininonnu(s) ? variable aléatoire parente. Pour onnus, quelle(s) valeur(s) peut-on proposer pour le(s) paramètre(s) Nous appelons dans la suite la v.a. X dépend la loi de X , onsidérons l'appliation : 2 θ . L'appliation θ̂n l'évaluation d'un paramètre (ou un veteur paramètre) inonnu θ dont valeur possible de θ̂n = θ̂n(X1, ..., Xn ), qui est une v.a., prenant une doit être mesurable. Inférenes Statistiques Le alul des probabilités permet, à partir d'un modèle théorique, d'assoier à un événement une probabilité qui mesure la fréquene de son apparition dans une suite d'épreuves identiques. La onstrution du modèle même est une autre investigation qui reste à faire. Les tehniques statistiques vont nous aider à reonstruire le modèle ou modèle à partir d'un bon nombre d'observations (un éhantillon) de nous autoriser à nous poser un ertain nombre de questions sur le des ritères tels que la vraisemblane des valeurs observées, l'absene réalisations de l'événement étudié. Ces inférenes sont fondées sur de biais ou la onvergene des prévisions suggérées par l'éhantillon lorsque la taille de elui-i augmente. 1 Dénition. Maximum de Vraisemblane On peut justier le hoix d'un estimateur par le fait qu'il maximise la vraisemblane de la réalisation de l'éhantillon (x1 , ..., xn ). • Si la loi est disrète, la fontion de vraisemblane est la probabilité pour que : (X1 , ..., Xn ) = (x1, ..., xn). • Si la loi admet une densité f , la fontion de vraisemblane est le produit : f (x1 )...f (xn ). Dans les deux as la fontion de vraisemblane, notée Ln (θ) dépend de n, de (x1, ..., xn ) et de θ . 4 Elle sera appelée un estimateur de θ ; i.e. pour une réalisation (x1 , ..., xn ), la valeur de θ est évaluée par : θ̂n(x1, ..., xn). Il faut noter que le nombre d'arguments d'un estimateur n'est pas xé et varie ave n, qui est la taille de l'éhantillon. Qualités Souhaitées 3 Jusqu'ii un estimateur est déni de façon arbitraire. Il est évident qu'une telle introdution ne présente auun intérêt que si on l'enrihit de ertaines qualités ou de ertaines mesures de performanes. Nous énumérons dans la suite quatre propriétés souhaitées. Elles ne sont pas néessairement ompatibles. De plus, la reherhe d'un estimateur, possédant une performane souhaitée peut ne pas être une tâhe faile. Un alul simple, passant par la dérivation du logarithme, aboutit à l'estimateur du maximum de vraisemblane : n 1 X λ̂n = xi . n i=1 la méthode du maximum de vraisemblane nous onduit à identier On en déduit que l'estimation du paramètre d'une loi de poisson par le paramètre par la moyenne arithmétique de l'éhantillon. Biais d'un Estimateur de Dénitions. Un estimateur θ̂n de θ est dit sans biais, si son espérane vaut θ pour tout n ∈ N∗ ; sinon on dit qu'il est biaisé. Si l'espérane de θ̂n onverge vers θ , il est alors appelé asymptotiquement sans biais. 6 L'estimateur θ̂n (x1 , ..., xn ) est appelé un estimateur du maximum s'il maximise la fontion de vraisemblane. vraisemblane, Exemple. On dispose d'un éhantillon (x1, ..., xn) d'une v.a. X suivant une loi de Poisson de paramètre λ inonnu. Trouver un estimateur du La fontion de vraisemblane vaut : maximum de vraisemblane de λ. Solution. λx1 +...+xn Ln(λ) = e−nλ . x1!...xn! Pour maximiser ette expression par rapport à λ, il sut de maximiser e−nλ λx1+...+xn ou de façon équivalente son logarithme. 5 Quelques Estimateurs Standard n 1 X xi . n i=1 d'une v.a. possédant une espérane inonnue µ. Son estimateur stan- Estimateur standard de l'espérane. Soit (x1, ..., xn) un éhantillon dard est la moyenne de l'éhantillon : µ̂n(x1, ..., xn) = Cet estimateur est sans biais. Il est de plus onvergent, lorsque la v.a. parente admet une variane (la loi des grands nombres). Dans la suite, pour alléger la notation, nous supprimons la référene 8 de l'estimateur à l'indie n et aux arguments x1, ..., xn , lorsqu'il n'y a pas le danger de onfusion. onvergent, Convergene d'un Estimateur Un estimateur θ̂n de θ est dit si, étant s'il tend en 1 Pn L'estimateur λ̂n = n i=1 xi est un estimateur sans biais du paramètre de la loi de Poisson. Dénition. probabilité vers θ, lorsque n → ∞. absolument eae Eaité Absolue d'un Estimateur Un estimateur θ̂n de θ est onvergent et sans biais, il possède la plus petite variane parmi tous Dénition. les estimateurs partageant les deux premières propriétés. 7 Estimateur standard de la variane. n 1 X xi et n i=1 V̂ = Soit X une v.a. admettant une n 1 X (xi − µ̂)2. n − 1 i=1 espérane µ et une variane V , toutes deux inonnues. Soit (x1, ..., xn) un éhantillon de X . L'estimateur standard joint (µ̂, V̂ ) est donné par : µ̂ = Cet estimateur de la variane est onvergent et sans biais. On notera Soit 10 n . On qu'il vaut la variane empirique multipliée par le fateur n−1 démontre en eet que l'espérane de ette dernière vaut n−1 n V et il n pour la débiaiser. faut, don, la multiplier par n−1 Estimateur standard d'une distribution de probabilité nie. i 1{α }(xj ), i = 1, ..., k. (x1, ..., xn) un éhantillon d'une v.a. X prenant une des valeurs α1, ..., αk ave les probabilités inonnues p1 , ..., pk respetivement. L'estimateur standard du veteur p = (p1 , ..., pk ) est déni par : n 1 X pˆi = n j=1 Autrement dit, l'estimateur standard de haque pi est la fréquene relative d'ourrenes de αi dans l'éhantillon. C'est un estimateur sans biais. On peut aussi démontrer que et estimateur maximise la fontion de vraisemblane. 9 Estimateurs standard de la ovariane et du oeient de orrélation. par : n X 1 (xi − µ̂)(yi − ν̂), n − 1 i=1 Étant donné un éhantillon ((x1, y1), ..., (xn , yn )) du ouple (X, Y ) de v.a. réelles admettant haune une espérane et une vad de cov(X, Y ) est donné riane inonnues. L'estimateur standard cov d = cov où µ̂ et ν̂ sont les estimateurs standard de l'espérane de X et de d cov , σ̂.τ̂ elle de Y respetivement. d de corr(X, Y ) est donné par : De même, l'estimateur standard corr d = corr où σ̂ et τ̂ sont les estimateurs standard de l'éart-type de X et de l'estimateur standard de la 12 elui de Y respetivement. Ces deux estimateurs sont sans biais. onnue, n 1 X (xi − µ)2 n i=1 Dans le as où l'espérane µ est variane devient : V̂ = V̂ , Il est donnée par : et et estimateur de la variane est onvergent et sans biais. p Estimateur standard de l'éart-type. σ̂ = où V̂ est l'estimateur standard de V , donné par l'une des deux formules de la setion préédente. 11 Solution. n 1 X xi , n i=1 L'estimateur standard de l'espérane étant déni par : µ̂n(x1, ..., xn) = 2 1 = √ e−x /2dx. 2π |x|≤δ on démontre failement que 'est une v.a. normale d'espérane µ 1 . On en déduit que la v.a. √n (µ̂ − µ) est une v.a. et de variane n n normale entrée-réduite. Nous avons alors, pour tout δ > 0 : ! Z δ P r |µ̂n − µ| ≤ √ n 14 Pour un niveau α donné, hoisissons δ de sorte que : Z 2 1 √ e−x /2dx = α. 2π |x|≤δ √ √ On peut don armer que µ appartient à l'intervalle µ̂ − δ/ n , µ̂ + δ/ n ave la probabilité α. Intervalle de Conane (J. Istas) Étant donné un estimateur θ̂n d'un paramètre inonnu θ, quelle onane peut-on lui aorder ? Prenons un intervalle entré de rayon δ autour Évidemment, sauf dans des as très partiuliers, on ne peut répondre de θ̂, et herhons à déterminer si θ appartient ou pas à et intervalle. mer, du moins en prinipe, qu'ave une ertaine probabilité α, la vraie ave ertitude à la question θ ∈ [θ̂n ± δ] ?. On peut toutefois onr- intervalle de onane de niveau α. valeur du paramètre se trouve dans et intervalle. Nous dirons alors que l'intervalle [θ̂n ± δ] est un Soit (x1 , ..., xn ) un éhantillon d'une v.a. normale réduite d'espérane µ inonnue (i.e. N (µ, 1)). Trouver un intervalle de Exemple. 13 onane de niveau α pour l'estimateur standard de l'espérane. √ Z onverge en loi vers une Nous avons don asymptoti- n(µ̂n − µ) Nous ne onnaissons pas la loi de la v.a. µ̂n. Nous savons en revanhe que, lorsque n → ∞, Solution. ! 2 1 ≍ √ e−x /2dx. 2π |x|≤δ v.a. normale entrée et de variane 1. quement : δ P r |µ̂n − µ| ≤ √ n Choisissons alors δ de sorte que : Z 2 1 √ e−x /2dx = α. 2π |x|≤δ Nous pouvons alors onrmer que la probabilité pour que le para- √ √ mètre inonnu µ se trouve dans l'intervalle µ̂ − δ/ n , µ̂ + δ/ n vaut α. Par onséquent et intervalle est un intervalle de onane asymptotique de niveau α pour l'estimateur proposé. asymptotiquement 16 Il s'agit don d'un intervalle de onane de niveau α pour l'estimateur. Intervalle de Conane Asymptotique diile, alors que le alul d'un intervalle de onane approhé, Il arrive souvent que le alul exat d'un intervalle de onane soit de onane asymptotique. Soit X une v.a. quelonque d'espérane µ inonnue et parle alors d'intervalle lorsque la taille de l'éhantillon tend vers l'inni, soit aessible. On Exemple. 15 de variane 1. Soit (x1 , ..., xn ) un éhantillon de X . On onsidère 1 Pn l'estimateur standard µ̂n = n i=1 xn de µ. Trouver un intervalle de onane asymptotique de niveau α pour µ̂n.