Introduction aux théorèmes limites et aux intervalles de confiance

Chapitre 5
Introduction aux théorèmes limites et aux
intervalles de confiance
Objectifs du chapitre
1. Savoir approcher une loi binomiale par une loi de Poisson ou une loi normale.
2. Savoir approcher une loi en appliquant le théorème central limite.
3. Savoir calculer un intervalle de confiance dans le cadre d’un sondage.
4. Comprendre le lien entre l’approche fréquentielle des probabilités et la loi des grands nombres.
Application : méthode de Monte-Carlo de calculs d’intégrales.
5.1 Approximation d’une loi binomiale
Nous l’avons vu dans les chapitres précédents, les loi binomiale et hypergéométrique interviennent dans des jeux de
hasard et utilisent des factorielles. L’usage de factorielles induit en général de “gros” chiffres, dont la manipulation à la main
est risquée et fut naguère source d’instabilités numériques. A titre d’exemple nous vous recommandons de taper sur votre
calculatrice 10!, 32!, 52! et 365! pour avoir un aperçu du problème.
Dans ces conditions il est nécessaire d’avoir une approximation de ces lois là nettement plus magniable et dont on sait
contrôler l’erreur.
5.1.1 Approximation d’une loi binomiale par une loi de Poisson
Le théorème de Poisson donne une approximation de la loi binomiale B(n,p)lorsque nest “grand” et p“petit”.
Théorème 5.1.1 (Théorème de Poisson).Soit (pn)une suite de réels de l’intervalle ]0,1[telle que limnnpn=λλ>0.
Considérons pour chaque entier une variable aléatoire Snde loi B(n,pn). On a donc
P(Sn=k) = Pn(k) = Ck
npk
n(1pn)nksi 0kn
0sinon .
Alors pour tout entier k N, la suite de terme général P(Sn=k)est convergente et on a
lim
nP(Sn=k) = eλλk
k!.
Démonstration. Par hypothèse la suite npn λ
nnotée (un)tend vers 0 quand n. Donc pn=λ
n+un
n. Pour tout k,
P(Sn=k) = n(n1)...(nk+1)
k!λ
n+un
nk1λ
n+un
nnk
eλλk
k!.
1
en particulier
n(n1)...(nk+1)
k!λ
n+un
nk
=n(n1)...(nk+1)
nkk!(λ+~un)kλk
k!
et
1λ
nun
nnk
=e(nk)λ
nun
n+vn
n2eλ.
Vitesse de convergence Si pour tout nnous avons npn=λavec λ>0 on a alors l’estimation
k=0
Pn(k)eλλk
k!2λ
nmin(2,λ).
En particulier, pour tout kN, on a
Pn(k)eλλk
k!2λ
nmin(2,λ).
Intuitivement, le théorème de Poisson donne une approximation de la loi binomiale lorsque le paramètre pest petit. En
particulier, on remplace la loi binomiale B(n,p)par la loi de Poisson P(np)dès que nest assez grand de l’ordre de 30 et p
est petit de l’ordre de 0.1.
Exemple 5.1.2. On veut déterminer numériquement la probabilité Pn(k)pour que parmis npersonnes ksoient nées le 1er
janvier. On suppose qu’aucune personne n’est née le 29 février et de plus que tous les jours sont équiprobables. On fait
l’étude pour n=500. Le nombre de personnes nées le premier janvier suit une loi binomiale B(n,1/365). Si n=500 alors
np '1,369 :
PB(500,1/365)(N=0) = 0.2536 ; PP(λ1(N=0) = 0.2541
PB(500,1/365)(N=4) = 0.0369 ; PP(λ1(N=0) = 0.0372
PB(500,1/365)(N=7) = 0.0004 ; PP(λ1(N=0) = 0.0004
5.1.2 Approximation d’une loi binomiale par la loi de Gauss
Si pn’est pas trop petit et nest grand comment approximer P(Sn=k)lorsque Snsuit une loi binomiale B(n,p)?
Théorème 5.1.3 (Moivre-Laplace).Si Snest une variable aléatoire suivant une loi binomiale B(n,p).
Pour tout k,
P(Sn=k)'1
p2.var(Sn)e(kE(Sn))2
2.var(Sn).
Pour tout 0<a<b,
Pa<SnE(Sn)
σ(Sn)b1
2πZb
a
ex2/2dx.
Remarque 5.1.4. On a le résultat d’uniformité plus fort :
sup
<a<b+
Pa<SnE(Sn)
σ(Sn)b1
2πZb
a
ex2/2dx 0
Corollaire 5.1.5. Si Snest une variable aléatoire suivant une loi binomiale B(n,p), alors pour tout α,βavec
α<β+
on a
P(α<Snβ)'1
2πZβE(Sn)
σ(Sn)
αE(Sn)
σ(Sn)
ex2/2dx.
2
5.2 Le théorème de la limite centrale
Le théorème suivant montre combien la loi normale est centrale !
Théorème 5.2.1 (Théorème de la limite centrée).Soit (,A,P)un espace probabilisé. Soit (Xn)une suite de variables
aléatoires indépendantes, de même loi, de classe L2, de moyenne E et d’écart-type σ. Soit
Sn=n
j=1XjnE
nσ.
Pour tout couple (a,b)avec a,b[,]nous avons
P(a<Snb)
n
1
2πZb
a
ex2/2dx.
Remarque 5.2.2. Ce théorème généralise le théorème de Moivre-Laplace car une variable aléatoire Snde loi B(n,p)a même
loi qu’une somme X1+... +Xnde nvariables aléatoires de Bernouilli indépendantes de paramètre p. Plus généralement, si
X=n
j=1Xjoù les (Xj)sont indépendantes de même loi L2alors on peut approximer Xpar N(E(X),Var(X)).
Exemple 5.2.3. On jette un dé équilibré 12000 fois. On cherche la probabilité pour que le nombre de 6 obtenus soit compris
entre 1800 et 2100.
()Le nombre de 6 obtenus est une variable aléatoire de loi binomiale B(12000,1/6). On a a=1800 et b=2100. Par le
théorème de Moivre-Laplace on a
P(1800 N2000)'Φ(2100 2000
p12000.(1/6).(5/6))Φ(1800 2000
p12000.(1/6).(5/6))0.992.
Avec
Φ(x) = 1
2πZx
et2/2dt.
Terminons ce paragraphe par un lemme, utile par exemple pour la construction d’un intervalle de confiance.
Lemme 5.2.4. Soit X une variable aléatoire suivant une loi normale centrée réduite. Pour tout α]0,1[, il existe un unique
réel positif tαtel que P(tαXtα) = 1α.
Démonstration. Soit α]0,1[. Considérons la fonction
f:t7→ P(tXt) = Zt
t
1
2πex2/2dx =2Zt
0
1
2πex2/2dx.
Cette fonction est dérivable de dérivée f0(t) = 2
2πet2/2qui est strictement positive. On en déduit donc que la fonction f
est continue, strictement croissante sur ]0,+[avec f(0) = 0 et limt+f(t) = 1. Cette fonction est donc une bijection
strictement croissante de ]0,+[sur ]0,1[. Il existe donc tαtel que
f(tα) = P(tαXtα) = 1α.
Exemple 5.2.5. Déterminons t0.05 et t0.01.
On note Φla fonction de répartition de la loi normale centrée réduite. On a
P(X[t,t]) = ϕ(t)ϕ(t) = 2ϕ(t)1.
Par conséquent, on en déduit l’équivalence
P(X[tα,tα]) = 1αΦ(tα) = 1α
2.
La table de la loi normale donne Φ(1.96) = 0.975 et donc t0.05 '1.96. De même t0.01 '2.58.
3
Introduction au sondage : estimation d’une proportion Dans une population, un caractère est présent dans une pro-
portion p. On cherche à estimer la valeur de p. Pour cela on étudie un échantillon de néléments de cette population, et on
désigne par Xnle nombre de fois où ce caractère est retrouvé dans l’échantillon.
Définition 5.2.6. On fixe α]0,1[et on note tαl’unique réel tel que
Ztα
tα
1
2πex2/2dx =1α.
On note fla fréquence Xn
n. L’intervalle hftα
2n;f+tα
2niest appelé intervalle de confiance au niveau 1 αde p.
Nous justifions ci dessous que pour ngrand (en pratique si n30, np 5 et n(1p)5) et f=Xn
nla probabilité que
psoit dans l’intervalle hftα
2n;f+tα
2niest supérieure ou égale à 1 α.
Construction d’un intervalle de confiance au niveau 1α
1. Pour tout n, la variable aléatoire Xnsuit une loi binomiale B(n,p)comme répétition de nexpériences aléatoires in-
dépendantes avec probabilité pde succès. En particulier nous avons
Xn=Y1+... +Yn
les Yisont des variables aléatoires de Bernoulli indépendantes de même paramètre pet d’écart type pp(1p).
2. On pose Zn=Xnnp
np(1p). Par application du théorème central limite, pour tous réels a<bon a
P(Zn[tα,tα]) 1
2πZtα
tα
et2/2dt =1α.
3. Notons que
Xn
nInZn[tα,tα]
In="ptαpp(1p)
n;p+tαpp(1p)
n#.
On en déduit donc que
lim
nP(Xn/nIn) = 1α.
4. La fonction p7→ p(1p)admet 1
4comme maximum on obtient donc l’encadrement
Inptα
2n;p+tα
2n.
5. On en déduit alors la définition précédente de l’intervalle de confiance au niveau 1 α:
Xn/nptα
2n;p+tα
2npXn
ntα
2n;Xn
n+tα
2n.
4
Exemple 5.2.7. Lors d’une élection opposant deux candidats, un sondage d’opinion réalisé sur un échantillon de 1000
personnes donne 52% des voix au candidat Aet 48% au candidat B.
1. Donnons un intervalle de confiance au niveau 0.95 des intentions de vote pour A. Nous sommes dans les conditions
d’application de la méthode précédente car
n30,np =1000 ×0.52 5,n(1p)5.
Un intervalle de confiance est donc donné par
I=0.52 tα
2n;0.52 +tα
2n
avec α=0.05, tα'1.96. On trouve
[0.489;0.551]I.
2. Combien de personnes suffirait-il d’interroger pour qu’il y ait moins de 5% de chances que Bl’emporte si Aa recueilli
52% des intentions de vote dans le sondage ? Pour répondre à cette question nous allons chercher le nombre de
personnes nécessaire pour que le pourcentage obtenu par Asoit compris entre 50 et 54%. Il suffit donc de résoudre
l’inéquation
0.52 1.96
2n0.5
et on obtient n2401.
5.3 Loi des grands nombres
Théorème 5.3.1 (Loi forte des grands nombres).On considère (,A,P)un espace probabilisé. On considère une suite
de variables aléatoire Xnindépendantes, de même loi de classe L1et d’espérance E. Il existe un événement F Aavec
P(F) = 0tel que
ω\F,X1(ω) + ... +Xn(ω)
nE.
Remarque 5.3.2. Si Xn=Xpour tout nalors pour tout ω,
X1(ω) + ... +Xn(ω)
n=X(ω),
il faudrait donc avoir X(ω) = Epour presque tout ω! c’est à dire Xconstant presque sûrement. L’hypothèse (Xn)est une
famille de variables aléatoires indépendantes permet de ne pas considérer ce cas là.
Retour sur l’approche des fréquences Considérons une expérience aléatoire et un évènement A. Répétons une infinité
de fois l’expérience. On note Xnla variable aléatoire qui vaut 1 si l’évènement est réalisé à l’a n-ième expérience et 0 sinon.
Notons fn(A)la variable aléatoire
fn(A) = 1
n(X1+... +Xn).
Les expériences répétées étant toutes indépendantes, les variables aléatoires Xile sont et ont la même loi. Donc
E(Xi) = P(Xi=1) = P(A)
, donc
fn(A)(ω)P(A)
pour presque toute éventualité ω( c’est à dire : sauf pour un ensemble de probabilité d’éventualités). Remarquons qu’ici une
éventualité ω= (ωn)est une infinité d’expériences successives et indépendantes.
5
1 / 6 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !