Chapitre 5 Introduction aux théorèmes limites et aux intervalles de confiance Objectifs du chapitre 1. Savoir approcher une loi binomiale par une loi de Poisson ou une loi normale. 2. Savoir approcher une loi en appliquant le théorème central limite. 3. Savoir calculer un intervalle de confiance dans le cadre d’un sondage. 4. Comprendre le lien entre l’approche fréquentielle des probabilités et la loi des grands nombres. Application : méthode de Monte-Carlo de calculs d’intégrales. 5.1 Approximation d’une loi binomiale Nous l’avons vu dans les chapitres précédents, les loi binomiale et hypergéométrique interviennent dans des jeux de hasard et utilisent des factorielles. L’usage de factorielles induit en général de “gros” chiffres, dont la manipulation à la main est risquée et fut naguère source d’instabilités numériques. A titre d’exemple nous vous recommandons de taper sur votre calculatrice 10!, 32!, 52! et 365! pour avoir un aperçu du problème. Dans ces conditions il est nécessaire d’avoir une approximation de ces lois là nettement plus magniable et dont on sait contrôler l’erreur. 5.1.1 Approximation d’une loi binomiale par une loi de Poisson Le théorème de Poisson donne une approximation de la loi binomiale B(n, p) lorsque n est “grand” et p “petit”. Théorème 5.1.1 (Théorème de Poisson). Soit (pn ) une suite de réels de l’intervalle ]0, 1[ telle que limn→∞ npn = λ où λ > 0. Considérons pour chaque entier une variable aléatoire Sn de loi B(n, pn ). On a donc k k Cn pn (1 − pn )n−k si 0≤k≤n P(Sn = k) = Pn (k) = . 0 sinon Alors pour tout entier k ∈ N, la suite de terme général P(Sn = k) est convergente et on a lim P(Sn = k) = e−λ n→∞ λk . k! Démonstration. Par hypothèse la suite n pn − λn notée (un ) tend vers 0 quand n → ∞. Donc pn = λn + unn . Pour tout k, n(n − 1)...(n − k + 1) P(Sn = k) = k! λ un + n n 1 k n−k λ un λk 1− + → e−λ . n n k! en particulier n(n − 1)...(n − k + 1) k! et λ un + n n k = n(n − 1)...(n − k + 1) λk k (λ +~ u ) → n nk k! k! λ un n−k (n−k) − λn − unn + vn2 n =e → e−λ . 1− − n n Vitesse de convergence Si pour tout n nous avons npn = λ avec λ > 0 on a alors l’estimation ∞ k 2λ −λ λ ∑ Pn (k) − e k! ≤ n min(2, λ). k=0 En particulier, pour tout k ∈ N, on a k Pn (k) − e−λ λ ≤ 2λ min(2, λ). k! n Intuitivement, le théorème de Poisson donne une approximation de la loi binomiale lorsque le paramètre p est petit. En particulier, on remplace la loi binomiale B(n, p) par la loi de Poisson P(np) dès que n est assez grand de l’ordre de 30 et p est petit de l’ordre de 0.1. Exemple 5.1.2. On veut déterminer numériquement la probabilité Pn (k) pour que parmis n personnes k soient nées le 1er janvier. On suppose qu’aucune personne n’est née le 29 février et de plus que tous les jours sont équiprobables. On fait l’étude pour n = 500. Le nombre de personnes nées le premier janvier suit une loi binomiale B(n, 1/365). Si n = 500 alors np ' 1, 369 : PB(500,1/365) (N = 0) = 0.2536 ; PP(λ1 (N = 0) = 0.2541 PB(500,1/365) (N = 4) = 0.0369 ; PP(λ1 (N = 0) = 0.0372 PB(500,1/365) (N = 7) = 0.0004 ; PP(λ1 (N = 0) = 0.0004 5.1.2 Approximation d’une loi binomiale par la loi de Gauss Si p n’est pas trop petit et n est grand comment approximer P(Sn = k) lorsque Sn suit une loi binomiale B(n, p) ? Théorème 5.1.3 (Moivre-Laplace). Si Sn est une variable aléatoire suivant une loi binomiale B(n, p). • Pour tout k, 2 1 − (k−E(Sn )) e 2.var(Sn ) . P(Sn = k) ' p 2.var(Sn ) • Pour tout 0 < a < b, Z b 2 Sn − E(Sn ) 1 P a< ≤b → √ e−x /2 dx. σ(Sn ) 2π a Remarque 5.1.4. On a le résultat d’uniformité plus fort : Z b 2 Sn − E(Sn ) 1 sup P a< ≤b −√ e−x /2 dx → 0 σ(Sn ) 2π a −∞<a<b≤+∞ Corollaire 5.1.5. Si Sn est une variable aléatoire suivant une loi binomiale B(n, p), alors pour tout α, β avec −∞ ≤ α < β ≤ +∞ on a 1 P(α < Sn ≤ β) ' √ 2π 2 Z β−E(Sn ) σ(Sn ) α−E(Sn ) σ(Sn ) e−x 2 /2 dx. 5.2 Le théorème de la limite centrale Le théorème suivant montre combien la loi normale est centrale ! Théorème 5.2.1 (Théorème de la limite centrée). Soit (Ω, A , P) un espace probabilisé. Soit (Xn ) une suite de variables aléatoires indépendantes, de même loi, de classe L2 , de moyenne E et d’écart-type σ. Soit ∑nj=1 X j − nE √ Sn = . nσ Pour tout couple (a, b) avec a, b ∈ [−∞, ∞] nous avons 1 P(a < Sn ≤ b) → √ n→∞ 2π Z b e−x 2 /2 dx. a Remarque 5.2.2. Ce théorème généralise le théorème de Moivre-Laplace car une variable aléatoire Sn de loi B(n, p) a même loi qu’une somme X1 + ... + Xn de n variables aléatoires de Bernouilli indépendantes de paramètre p. Plus généralement, si X = ∑nj=1 X j où les (X j ) sont indépendantes de même loi L2 alors on peut approximer X par N (E(X),Var(X)). Exemple 5.2.3. On jette un dé équilibré 12000 fois. On cherche la probabilité pour que le nombre de 6 obtenus soit compris entre 1800 et 2100. (→) Le nombre de 6 obtenus est une variable aléatoire de loi binomiale B(12000, 1/6). On a a = 1800 et b = 2100. Par le théorème de Moivre-Laplace on a 2100 − 2000 1800 − 2000 P(1800 ≤ N ≤ 2000) ' Φ( p ) − Φ( p ) ≤ 0.992. 12000.(1/6).(5/6) 12000.(1/6).(5/6) Avec 1 Φ(x) = √ 2π Z x e−t 2 /2 dt. −∞ Terminons ce paragraphe par un lemme, utile par exemple pour la construction d’un intervalle de confiance. Lemme 5.2.4. Soit X une variable aléatoire suivant une loi normale centrée réduite. Pour tout α ∈]0, 1[, il existe un unique réel positif tα tel que P(−tα ≤ X ≤ tα ) = 1 − α. Démonstration. Soit α ∈]0, 1[. Considérons la fonction f : t 7→ P(−t ≤ X ≤ t) = Z t −t 2 1 √ e−x /2 dx = 2 2π Z t 0 2 1 √ e−x /2 dx. 2π 2 Cette fonction est dérivable de dérivée f 0 (t) = √22π e−t /2 qui est strictement positive. On en déduit donc que la fonction f est continue, strictement croissante sur ]0, +∞[ avec f (0) = 0 et limt→+∞ f (t) = 1. Cette fonction est donc une bijection strictement croissante de ]0, +∞[ sur ]0, 1[. Il existe donc tα tel que f (tα ) = P(−tα ≤ X ≤ tα ) = 1 − α. Exemple 5.2.5. Déterminons t0.05 et t0.01 . On note Φ la fonction de répartition de la loi normale centrée réduite. On a P(X ∈ [−t,t]) = ϕ(t) − ϕ(−t) = 2ϕ(t) − 1. Par conséquent, on en déduit l’équivalence α P(X ∈ [−tα ,tα ]) = 1 − α ⇔ Φ(tα ) = 1 − . 2 La table de la loi normale donne Φ(1.96) = 0.975 et donc t0.05 ' 1.96. De même t0.01 ' 2.58. 3 Introduction au sondage : estimation d’une proportion Dans une population, un caractère est présent dans une proportion p. On cherche à estimer la valeur de p. Pour cela on étudie un échantillon de n éléments de cette population, et on désigne par Xn le nombre de fois où ce caractère est retrouvé dans l’échantillon. Définition 5.2.6. On fixe α ∈]0, 1[ et on note tα l’unique réel tel que Z tα 2 1 √ e−x /2 dx = 1 − α. −tα 2π h i On note f la fréquence Xnn . L’intervalle f − 2t√α n ; f + 2t√α n est appelé intervalle de confiance au niveau 1 − α de p. Nous justifions ci dessous h que pour n grand i (en pratique si n ≥ 30, np ≥ 5 et n(1 − p) ≥ 5) et f = t√ t√ α α p soit dans l’intervalle f − 2 n ; f + 2 n est supérieure ou égale à 1 − α. Xn n la probabilité que Construction d’un intervalle de confiance au niveau 1 − α 1. Pour tout n, la variable aléatoire Xn suit une loi binomiale B(n, p) comme répétition de n expériences aléatoires indépendantes avec probabilité p de succès. En particulier nous avons Xn = Y1 + ... +Yn où les Yi sont des variables aléatoires de Bernoulli indépendantes de même paramètre p et d’écart type 2. On pose Zn = √Xn −np . Par application du théorème central limite, pour tous réels a < b on a np(1−p) 1 P(Zn ∈ [−tα ,tα ]) → √ 2π Z tα e−t 2 /2 dt = 1 − α. −tα 3. Notons que Xn ∈ In ⇔ Zn ∈ [−tα ,tα ] n où " p In = p − tα p(1 − p) √ ; p + tα n p # p(1 − p) √ . n On en déduit donc que lim P(Xn /n ∈ In ) = 1 − α. n→∞ 4. La fonction p 7→ p(1 − p) admet 1 4 comme maximum on obtient donc l’encadrement tα tα In ⊂ p − √ ; p + √ . 2 n 2 n 5. On en déduit alors la définition précédente de l’intervalle de confiance au niveau 1 − α : tα tα Xn tα Xn tα Xn /n ∈ p − √ ; p + √ ⇔ p ∈ − √ ; + √ . 2 n 2 n n 2 n n 2 n 4 p p(1 − p). Exemple 5.2.7. Lors d’une élection opposant deux candidats, un sondage d’opinion réalisé sur un échantillon de 1000 personnes donne 52% des voix au candidat A et 48% au candidat B. 1. Donnons un intervalle de confiance au niveau 0.95 des intentions de vote pour A. Nous sommes dans les conditions d’application de la méthode précédente car n ≥ 30, np = 1000 × 0.52 ≥ 5, n(1 − p) ≥ 5. Un intervalle de confiance est donc donné par tα tα I = 0.52 − √ ; 0.52 + √ 2 n 2 n avec α = 0.05, tα ' 1.96. On trouve [0.489; 0.551] ⊂ I. 2. Combien de personnes suffirait-il d’interroger pour qu’il y ait moins de 5% de chances que B l’emporte si A a recueilli 52% des intentions de vote dans le sondage ? Pour répondre à cette question nous allons chercher le nombre de personnes nécessaire pour que le pourcentage obtenu par A soit compris entre 50 et 54%. Il suffit donc de résoudre l’inéquation 1.96 0.52 − √ ≥ 0.5 2 n et on obtient n ≥ 2401. 5.3 Loi des grands nombres Théorème 5.3.1 (Loi forte des grands nombres). On considère (Ω, A , P) un espace probabilisé. On considère une suite de variables aléatoire Xn indépendantes, de même loi de classe L1 et d’espérance E. Il existe un événement F ∈ A avec P(F) = 0 tel que X1 (ω) + ... + Xn (ω) ∀ω ∈ Ω \ F, → E. n Remarque 5.3.2. Si Xn = X pour tout n alors pour tout ω ∈ Ω, X1 (ω) + ... + Xn (ω) = X(ω), n il faudrait donc avoir X(ω) = E pour presque tout ω ! c’est à dire X constant presque sûrement. L’hypothèse (Xn ) est une famille de variables aléatoires indépendantes permet de ne pas considérer ce cas là. Retour sur l’approche des fréquences Considérons une expérience aléatoire et un évènement A. Répétons une infinité de fois l’expérience. On note Xn la variable aléatoire qui vaut 1 si l’évènement est réalisé à l’a n-ième expérience et 0 sinon. Notons fn (A) la variable aléatoire 1 fn (A) = (X1 + ... + Xn ). n Les expériences répétées étant toutes indépendantes, les variables aléatoires Xi le sont et ont la même loi. Donc E(Xi ) = P(Xi = 1) = P(A) , donc fn (A)(ω) → P(A) pour presque toute éventualité ω ( c’est à dire : sauf pour un ensemble de probabilité d’éventualités). Remarquons qu’ici une éventualité ω = (ωn ) est une infinité d’expériences successives et indépendantes. 5 Exemple 5.3.3 (Méthode de Monte-Carlo). Soit (Un ) une suite de variables aléatoires indépendantes toutes de loi uniforme sur l’intervalle [0, 1]. Soit f : [0, 1] → R une fonction continue. Que peut on dire de f (U1 ) + ... + f (Un ) n lorsque n tend vers l’infini ? Les variables aléatoires f (Un ) sont indépendantes, de même loi et sont toutes de classe L1 car la fonction est continue sur [0, 1] donc intégrable. Par la loi des grands nombres, en dehors d’un ensemble de probabilité nulle, pour tout ω appartenant à l’univers sous jacent Z 1 f (U1 ) + ... + f (Un ) → f (t)dt. n 0 Cette méthode est utilisée pour calculer des valeurs approchées d’intégrales et s’appelle la méthode de Monte-Carlo. 6