Chapitre 3 Intervalles de confiance Ce chapitre est consacré à la construction d’intervalles contenant le paramètre inconnu supposé réel, avec un niveau de confiance fixé. Il contient essentiellement des méthodes, sans rentrer dans un formalisme excessif. Dans la suite, (H n , {Pθ }θ ∈Θ ) est un modèle statistique paramétrique avec H ⊂ Rk et Θ ⊂ Rd . Le paramètre d’intérêt est g(θ ), avec g : Θ → R une fonction connue. 3.1 Principe général L’objectif est de construire un intervalle contenant le paramètre inconnu. Celuici est défini formellement de la fac˛on suivante : Définition. Soit α ∈]0, 1[. Un intervalle de confiance pour g(θ ) de niveau de confiance (1 − α) est une statistique I à valeurs dans les intervalles de R telle que pour chaque θ ∈ Θ : � � Pθ g(θ ) ∈ I = 1 − α. Dans cette définition, si l’observation (x1 , · · · , xn ) est une réalisation de la loi Pθ0 , la Pθ0 -probabilité que (x1 , · · · , xn ) soit dans l’ensemble � � (y1 , · · · , yn ) ∈ H n : g(θ0 ) ∈ I(y1 , · · · , yn ) 29 30 CHAPITRE 3. INTERVALLES DE CONFIANCE vaut alors (1 − α). Noter que les deux critères de qualité d’un intervalle de confiance, i.e. sa longueur et son niveau de confiance, s’opposent et qu’il est donc impératif de réaliser un compromis. En pratique, pour un niveau de confiance raisonnable (souvent 90 ou 95 %), on cherche un intervalle de confiance de plus petite longueur. L’un des ingrédients de base pour construire un intervalle de confiance est le quantile d’une loi sur R. Définition. Soit F la fonction de répartition d’une loi ν sur R. Le quantile d’ordre r ∈]0, 1[ de la loi ν est défini par � � qr = inf x ∈ R : F(x) ≥ r . Les premières propriétés des quantiles sont décrites ci-dessous : Proposition 3.1.1. Soit F la fonction de répartition d’une loi sur R et qr son quantile d’ordre r ∈]0, 1[. Si F est continue, F(qr ) = r. Si, de plus, F est strictement croissante, alors qr est l’unique solution de l’équation F(.) = r. Preuve. Il suffit de remarquer que, comme F est croissante et continue à − droite, F(q− r ) ≤ r ≤ F(qr ), si F(qr ) est la limite à gauche de F en qr . � Comme en atteste l’exemple qui suit, la recherche d’une variable aléatoire pivot, i.e. une variable aléatoire dont la loi est indépendante de θ pour chaque θ ∈ Θ , est essentielle dans la construction d’un intervalle de confiance. Exemple. L’objectif est de construire un intervalle de confiance de niveau 1 − α ∈]0, 1[ pour le paramètre du modèle statistique (Rn , {N (θ , 1)⊗n }θ ∈R ). Soient (X1 , · · · , Xn ) ∼ Pθ = N (θ , 1)⊗n , Φ la fonction de répartition√ de la loi N (0, 1) et q le quantile d’ordre (1 − α/2) de la loi N (0, 1). Comme n(X̄n − θ ) est une variable aléatoire pivot de loi N (0, 1), �√ � Pθ n |X̄n − θ | ≤ q = Φ(q) − Φ(−q) = 2Φ(q) − 1 = 1 − α, car la densité de la loi N (0, 1) est paire. Ainsi, � � �� q q Pθ θ ∈ X̄n − √ , X̄n + √ = 1 − α, n n 3.2. INTERVALLE DE CONFIANCE PAR EXCÈS 31 c’est-à-dire que √ l’intervalle √de confiance de niveau (1 − α) pour le paramètre θ est [X̄n − q/ n, X̄n + q/ n]. 3.2 Intervalle de confiance par excès La construction d’un intervalle de confiance s’appuie sur une variable aléatoire pivot. A défaut d’informations sur la loi de la variable aléatoire, ou bien si la loi ne permet pas de construire un intervalle de confiance (c’est le cas si elle est discrète), une option est de se retrancher sur une notion plus faible, en exigeant seulement une minoration du niveau de confiance. Définition. Soit α ∈]0, 1[. Un intervalle de confiance par excès pour g(θ ) de niveau de confiance (1 − α) est une statistique I à valeurs dans les intervalles de R telle que pour chaque θ ∈ Θ : � � Pθ g(θ ) ∈ I ≥ 1 − α. Dans cette définition, si l’observation (x1 , · · · , xn ) est une réalisation de la loi Pθ0 , la Pθ0 -probabilité que (x1 , · · · , xn ) soit dans l’ensemble � � (y1 , · · · , yn ) ∈ H n : g(θ0 ) ∈ I(y1 , · · · , yn ) est alors plus grande que (1 − α). Pour toute la suite de cette section, le modèle statistique se présente sous la forme Pθ = Q⊗n θ ∀θ ∈ Θ , avec Qθ une loi sur H ⊂ R de support [a, b] indépendant de θ . Supposons de plus que le paramètre d’intérêt vérifie g(θ ) = Eθ X1 = � H x Qθ (dx) ∀θ ∈ Θ . Utilisons la moyenne empirique pour estimer g(θ ) (méthode des moments, cf section 2.2). En procédant comme dans la section 1.1, on montre avec l’inégalité de Bienaymé-Tchebytchev que, si (X1 , · · · , Xn ) ∼ Q⊗n θ , alors � � b−a b−a I1 = X̄n − √ , X̄n + √ . nα nα 32 CHAPITRE 3. INTERVALLES DE CONFIANCE est un intervalle de confiance par excès pour g(θ ) de niveau (1 − α). Il peut être amélioré en basant sa construction sur une inégalité plus précise, par exemple l’inégalité de Hoeffding qui fait l’objet du prochain théorème. Théorème 3.2.1. [I NÉGALITÉ DE H OEFFDING ] Soient Z1 , · · · , Zn des variables aléatoires réelles indépendantes et identiquement distribuées, définies sur l’espace probabilisé (Ω , A , P). Si il existe a < b tels que a ≤ Z1 ≤ b P-p.s., alors pour tout t > 0 : � � �� n � � 2t 2 � � P ∑ (Zi − EZ1 ) ≥ t ≤ 2 exp − . n(b − a)2 i=1 Utilisons cette inégalité pour construire un intervalle de confiance par excès de niveau (1 − α) pour le paramètre g(θ ). Soit (X1 , · · · , Xn ) ∼ Pθ = Q⊗n θ . Puisque les variables aléatoires X1 , · · · , Xn sont indépendantes et de même loi avec Xi ∈ [a, b] Pθ -p.s. et Eθ X1 = g(θ ), l’inégalité de Hoeffding donne � � � � � 1 �� n � Pθ |X̄n − g(θ )| ≥ t = Pθ � ∑ (Xi − Eθ Xi )� ≥ t n i=1 � � 2nt 2 ≤ 2 exp − , (b − a)2 pour chaque t > 0. Avec le choix de � t = (b − a) 1 2 ln 2n α on trouve Pθ (|X̄n − g(θ )| ≥ t) ≤ α. Par suite, � � � � 1 2 1 2 I2 = X̄n − (b − a) ln , X̄n + (b − a) ln 2n α 2n α est un intervalle de confiance par excès pour g(θ ) de niveau (1 − α). Comparé à l’intervalle I1 obtenu avec l’inégalité de Bienaymé-Tchebytchev, les contri√ butions de la taille de l’échantillon, de l’ordre de 1/ n, et de la longueur du support de Qθ sont les mêmes. En revanche, l’amélioration est nette en ce qui concerne l’influence de α et des constantes. 3.2. INTERVALLE DE CONFIANCE PAR EXCÈS 33 Exemple. Reprenons l’étude statistique du jeu de pile ou face de la section 1.1 : 1000 tirages ont été réalisés indépendamment les uns des autres et, en codant xi = 1 si le i-ème tirage donne pile et 0 sinon, on a obtenu une observation (x1 , · · · , xn ) ∈ {0, 1}n , avec n = 1000, dont la moyenne x̄n vaut 0.52. Le modèle statistique est ({0, 1}n , {B(θ )⊗n }θ ∈]0,1[ ), et le paramètre d’intérêt θ est estimé par la moyenne empirique X̄n issue de l’échantillon (X1 , · · · , Xn ) ∼ B(θ )⊗n . Pour a = 0, b = 1, α = 0.05 et la réalisation x̄n de X̄n , l’intervalle de confiance I2 montre que la probabilité θ0 que la pièce donne pile appartient à [0.48, 0.56], avec un niveau de confiance au moins égal à 0.95. Cet intervalle est à comparer à l’intervalle [0.44, 0.60] au même niveau de confiance, obtenu en utilisant l’inégalité de Bienaymé-Tchebytchev : la longueur varie du simple au double. Preuve du théorème 3.2.1. Supposons pour simplifier que Z1 est centrée. Notons Sn = ∑ni=1 Zi . Pour tout r > 0, P(|Sn | ≥ t) = P(Sn ≥ t) + P(−Sn ≥ t) � � � � = P erSn ≥ ert + P e−rSn ≥ ert . On en déduit de l’inégalité de Markov que � � �� � � �n � �n � P |Sn | ≥ t ≤ e−rt EerSn + Ee−rSn ≤ e−rt EerZ1 + Ee−rZ1 , E désignant l’espérance sous la probabilité P. Majorons maintenant le terme EesZ1 , pour s = r ou s = −r. Par convexité de la fonction exponentielle et comme Z1 ∈ [a, b] P-p.s., � � Z1 − a b − Z1 Z1 − a sb b − Z1 sa sZ1 e = exp sb + sa ≤ e + e . b−a b−a b−a b−a Puisque Z1 est centrée, il vient : EesZ1 ≤ − a sb b sa e + e . b−a b−a Or, en posant p = −a/(b − a), on trouve la représentation : � � �� a sb b sa − e + e = exp −ps(b − a) + ln 1 − p + pes(b−a) . b−a b−a Par suite, si φ (x) = −px + ln(1 − p + pex ) pour tout x ≥ 0 : EesZ1 ≤ eφ (s(b−a)) . 34 CHAPITRE 3. INTERVALLES DE CONFIANCE La fonction φ est de classe C 2 et vérifie φ (0) = φ � (0) = 0 et φ �� (x) ≤ 1/4 pour tout x ≥ 0. D’après la formule de Taylor-Lagrange, il existe donc κ ∈ [0, s(b − a)] tel que φ (s(b − a)) = s2 (b − a)2 �� φ (κ), 2 2 2 d’où φ (s(b − a)) ≤ s2 (b − a)2 /8 et EesZ1 ≤ er (b−a) /8 car s2 = r2 . Il s’ensuit que pour chaque r > 0, � � � � r2 (b − a)2 P |Sn | ≥ t ≤ 2 exp −rt + n . 8 Finalement, le choix r = 4t/(n(b − a)2 ), qui minimise le terme de droite dans l’inégalité ci-dessus, nous donne l’inégalité anonc˛ée. � 3.3 Intervalle de confiance asymptotique A défaut d’informations suffisantes ou appropriées sur la loi de la variable aléatoire utilisée pour la construction de l’intervalle de confiance, une seconde alternative est de se retrancher sur une propriété asymptotique. Définition. Soit α ∈]0, 1[. Un intervalle de confiance asymptotique pour g(θ ) de niveau de confiance (1 − α) est une statistique In à valeurs dans les intervalles de R telle que pour chaque θ ∈ Θ : � � lim Pθ g(θ ) ∈ In = 1 − α. n→∞ Dans cette définition, si l’observation (x1 , · · · , xn ) est une réalisation de la loi Pθ0 , la Pθ0 -probabilité que (x1 , · · · , xn ) soit dans l’ensemble � � (y1 , · · · , yn ) ∈ H n : g(θ0 ) ∈ In (y1 , · · · , yn ) est proche de (1 − α) lorsque n est assez grand. Noter l’abus qui consiste à utiliser pour une valeur de n fixée un résultat asymptotique. En toute rigueur, l’utilisation d’un intervalle de confiance asymptotique doit être validée par une étude plus approfondie, et qui dépasse le cadre de cet ouvrage, portant 3.3. INTERVALLE DE CONFIANCE ASYMPTOTIQUE 35 sur la proximité entre Pθ (g(θ ) ∈ In ) et (1 − α). Supposons que l’on veuille construire un intervalle de confiance asymptotique de niveau (1 − α) dans le cas où l’estimateur ĝ de g(θ ) est asymptotiquement normal et de vitesse (vn )n : pour chaque θ ∈ Θ , il existe σ (θ ) > 0 tel que � � � L/Pθ � vn ĝ − g(θ ) −→ N 0, σ (θ )2 . Par suite, � L/Pθ vn � ĝ − g(θ ) −→ N (0, 1). σ (θ ) La variable aléatoire vn (ĝ − g(θ ))/σ (θ ) est dite asymptotiquement pivot, car sa loi limite est indépendante de θ . Cependant, dans cette généralité, un tel résultat ne permet pas de construire un intervalle de confiance asymptotique pour g(θ ). Si σ̂ est un estimateur consistant de σ (θ ), le lemme de Slutsky montre que pour chaque θ ∈ Θ : � L/Pθ vn � ĝ − g(θ ) −→ N (0, 1). σ̂ En désignant par q le quantile d’ordre (1 − α/2) de la loi N (0, 1), on en déduit que �v � n lim Pθ |ĝ − g(θ )| ≤ q = 1 − α. n→∞ σ̂ Ainsi, [ĝ − σ̂ q/vn , ĝ + σ̂ q/vn ] est un intervalle de confiance asymptotique de niveau (1 − α) pour g(θ ). Exemple. Dans l’étude statistique du jeu de pile ou face de la section 1.1, l’observation (x1 , · · · , xn ) ∈ {0, 1}n , avec n = 1000, a donné une moyenne x̄n de 0.52. Le modèle statistique est ({0, 1}n , {B(θ )⊗n }θ ∈]0,1[ ), et le paramètre d’intérêt θ est estimé par la moyenne empirique X̄n issue de l’échantillon (X1 , · · · , Xn ) ∼ B(θ )⊗n . D’après le théorème central limite, � � √ L/B(θ )⊗n n (X̄n − θ ) −→ N 0, θ (1 − θ ) , � � et, de plus, X̄n (1 − X̄n ) est un estimateur consistant de θ (1 − θ ) d’après la loi des grands nombres. Par suite, en notant q le quantile d’ordre (1 − α/2) 36 CHAPITRE 3. INTERVALLES DE CONFIANCE de la loi N (0, 1), � � � � q q X̄n − √ X̄n (1 − X̄n ), X̄n + √ X̄n (1 − X̄n ) n n est un intervalle de confiance asymptotique de niveau (1 − α) pour θ . Si θ0 est la probabilité que la pièce tombe sur pile, l’observation (x1 , · · · , xn ) de moyenne 0.52 montre que θ0 ∈ [0.49, 0.55] avec un niveau de confiance asymptotique de 0.95.