Mémoire - ENS Rennes

publicité
Mémoire M2
Leçon 261
Fonction caractéristique et transformée de Laplace d’une variable
aléatoire. Exemples et applications.
Paul Alphonse
Ecole Normale Supérieure de Rennes
Professeur encadrant : Jean-Christophe Breton
Décembre 2015
Table des matières
1
Fonction caractéristique et transformée de Laplace.
1.1 Transformée de Fourier d’une mesure bornée - Fonction caractéristique. . . . . . .
1.2 Transformée de Laplace d’une variable aléatoire. . . . . . . . . . . . . . . . . . . . .
1.3 Caractérisation de la loi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
Liens avec l’indépendance.
2.1 Caractérisations d’indépendance. . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Inégalité de Hoeffding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Théorème de Bernstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 Opérations sur les transformées de Laplace et les transformées de Fourier.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
5
6
6
6
7
9
11
3
Liens avec les moments.
11
4
Liens avec la convergence en loi.
4.1 Notion de convergence en loi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Le théorème central limite. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Exemples d’utilisation du théorème central limite . . . . . . . . . . . . . . . . . . .
13
14
15
17
1
2015
Mémoire M2 : Leçon 261
2016
Introduction
Le rôle des transformées de Fourier et de Laplace est bien connu en analyse et plus particulièrement dans l’étude des équations aux dérivées partielles.
Les objets analogues en théorie des probabilités possèdent une importance tout aussi grande puisqu’en particulier elle permettent de caractériser les lois des variables aléatoires. Cependant ce
n’est pas leur plus grande force (la fonction de répartition possède elle aussi cette propriété), elles
possèdent de plus des propriétés analogues à celles de leurs collègues en analyse. Par exemple,
leur comportement vis a vis de la convolution est identique ce qui permet de démontrer des résultats utiles sur l’indépendance des variables aléatoires. La transformée de Fourier des mesures
bornées possède elle aussi son théorème d’inversion.
De plus, elles possèdent des liens intrinsèques entre leur régularité et l’existence de moments
pour les variables aléatoires dont elles caractérisent la loi.
Enfin toutes deux ont leur rôle à jouer dans l’étude de la convergence en loi des variables aléatoires, les fonctions caractéristiques intervenant de manière fondamentale dans le théorème de
Lévy, qui permet lui-même de démontrer le très célèbre théorème central limite.
Le spectre d’utilisations (explicites ou implicites) de ces deux transformées est donc vaste et bien
le connaitre est fondamental.
Notations
Dans toute la leçon, on fixe un entier naturel non nul d. Toutes les variables aléatoires manipulées
seront à valeurs dans Rd . Dans le cas où d = 1, on parlera plutôt de variable aléatoire réelle.
Lorsqu’on en aura besoin, on désignera par FX la fonction de répartition de la variable aléatoire
réelle X.
Paul Alphonse
2
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
1 . Fonction caractéristique et transformée de Laplace.
1.1 - Transformée de Fourier d’une mesure bornée - Fonction caractéristique.
Définition 1.1.1 (Transformée de Fourier d’une mesure bornée).
Soit µ une mesure bornée sur Rd muni de sa mesure borélienne. On appelle transformée de Fourier de µ
b de Rd dans C définie par
l’application µ
∀t ∈ Rd : µb(t) =
Z
Rd
eih x,ti µ (dx).
Remarques
La transformée de Fourier d’une mesure bornée est bien définie étant donné que
∀ t ∈ Rd :
Z
Rd
|eihx,ti |µ (dx) ≤ µ (Rd ) < +∞.
De plus, si la mesure bornée µ admet une densité f par rapport à la mesure de Lebesgue sur Rd ,
alors
Z
f ( x) eih x,ti dx
∀t ∈ Rd : µb(t) =
Rd
b est, à constante multiplicative près, la transformée de Fourier de la fonction f .
et donc µ
On définit alors la fonction caractéristique d’une variable aléatoire à partir de la transformée de
Fourier de sa loi.
Définition 1.1.2 (Fonction caractéristique).
La fonction caractéristique d’une variable aléatoire X est la transformée de Fourier de sa loi PX . On la note
ϕX .
Remarques
La transformée de Fourier d’une mesure bornée est bien définie étant donné que
∀ t ∈ Rd :
Z
Rd
|eihx,ti |µ (dx) ≤ µ (Rd ) < +∞.
La loi d’une variable aléatoire étant par construction une mesure de probabilité, ϕ X existe pour
toute variable aléatoire X. De plus, d’après le théorème de transfert :
∀t ∈ Rd : ϕ X (t) = E eiht,X i .
Exemples
Soit X suivant une loi géométrique G( p) avec p ∈]0, 1[. Calculons sa fonction caractéristique.
∞
∀t ∈ R : ϕ X (t) =
∑ p(1 − p)k−1 eikt
=
(1 − p)eit
p
.
1 − p 1 − (1 − p)eit
=
k=1
=
p
1−p
∞
∑
(1 − p)eit
k
k=1
peit
1 − (1 − p)eit
Soit à présent X une variable aléatoire suivant une loi exponentielle E (λ ) avec λ ∈ R∗+ .
∀t ∈ R : ϕ X (t) =
Z ∞
0
eitx λ e−λx dx
"
=
Paul Alphonse
e(it−λ ) x
λ
it − λ
3
= λ
0
# x=∞
=
x=0
Z ∞
e(it−λ ) x dx
λ
λ − it
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
Les deux tableaux suivants rassemblent les fonctions caractéristiques des lois usuelles (la lettre q
désignera toujours 1 − p) :
Lois
Paramètres
Fonctions caractéristiques
b( p)
p ∈]0, 1[
q + peit
B(n, p)
n ∈ N∗ : p ∈]0, 1[
(q + peit )n
P (λ )
λ ∈ R∗+
eλ (e
G( p)
p ∈]0, 1[
peit
1 − qeit
U {1, . . . , n}
n ∈ N∗
E (λ )
λ ∈ R∗+
Γ(n, λ )
n ∈ N∗ : λ ∈ R∗+
N (m, Σ)
m∈
Rd
it −1 )
ein 1 − eint
n 1 − eit
λ
λ − it
n
λ
λ − it
1
exp i hm, ti − t∗ Σt
2
: Σ ∈ S(d, R)
C( a)
a ∈ R∗+
e− a|t|
U [ a, b]
[ a, b] ⊂ R
eitb − eita
it(b − a)
Proposition 1.1.1.
La fonction caractéristique d’une variable aléatoire X vérifie :
1. ∀t ∈ Rd : |ϕ X (t)| ≤ ϕ X (0) = 1.
2. ∀t ∈ Rd : ϕ X (−t) = ϕ X (t).
3. Si la loi de X est symétrique, alors ϕ X est à valeurs réelles.
4. ∀ A ∈ L(Rd , Rk ), ∀b ∈ Rk : ϕ AX +b : t 7→ eihb,tiϕ X ( A∗ t).
5. ϕ X est uniformément continue sur Rd .
Tout comme pour les fonctions intégrables, on a un théorème d’inversion de Fourier pour les
mesures bornées.
Proposition 1.1.2.
Soit µ une mesure bornée sur Rd telle que sa transformée de Fourier soit Lebesgue-intégrable. Alors µ est
absolument continue par rapport à la mesure de Lebesgue et sa densité est donnée λ-presque partout par la
fonction continue h définie par
∀ x ∈ Rd : h ( x ) =
1
(2π )d
Z
Rd
b(t) e−hx,ti dt.
µ
Remarques
Il résulte de la proposition précédente qu’une variable aléatoire dont la fonction caractéristique
est intégrable est une variable aléatoire à densité.
Il est possible de distinguer les fonctions caractéristiques parmi toutes les fonctions de R à valeurs
complexes. Toute fonction caractéristique est continue, vaut 1 en 0 et est de type positif. Vérifions
Paul Alphonse
4
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
le dernier point : si µ est une mesure de probabilité sur R, alors pour tous n entier naturel, t1 , . . . , tn
nombres réels et a1 , . . . , an nombres complexes :
!
Z
n n
n n Z
n n
i (t j −tk ) x
i (t j −tk ) x
e
µ (dx) a j ak =
a j ak µ (dx)
∑ ∑ µb(t j − tk )a j ak = ∑ ∑
∑ ∑e
j=1 k=1
=
!
n
Z
R
R
R
j=1 k=1
∑e
!
n
it j x
∑e
it j x
µ (dx)
j=1
j=1
=
R
Z j=1 k=1
n
∑e
j=1
it j x
!2
µ (dx)
≥ 0.
Il est remarquable que les trois propriétés précédentes caractérisent les fonctions caractéristiques.
Théorème 1.1.1 (Bochner-Herglotz).
Une fonction ϕ : R → C est une fonction caractéristique si et seulement si elle est continue, est de type
positif et vérifie ϕ(0) = 1.
1.2 - Transformée de Laplace d’une variable aléatoire.
Définition 1.2.1 (Transformée de Laplace).
Soit X une variable aléatoire. On définit
DX = {t ∈ Rd : E(eht,X i ) < +∞}
et
GX :
DX
t
→
R
7→ E(eht,X i )
.
GX est appelée la transformée de Laplace associée à X.
Remarque
GX est toujours définie en 0 mais GX ne peut être définie que sur ce seul singleton comme on va
le voir dans les exemples qui suivent.
Exemples
Le calcul des transformées de Laplace de variables aléatoires est de même nature que le calcul de
leur fonction caractéristique. Les lois présentes dans le tableau suivant montrent que l’intervalle
de définition d’une transformée de Laplace n’est dans le cas général ni ouvert, ni fermé.
f : x 7→
Loi
Transformée de Laplace
Intervalle de définition
b( p)
q + pet
R
E (λ )
λ
λ−t
] − ∞, λ [
1
1
( x)
(1 + x)2 [0,+∞[
Z ∞
0
etx
dx
(1 + x)2
C(1)
0
] − ∞, 0]
{0}
Proposition 1.2.1.
Soit X une variable aléatoire réelle. Alors :
1. GX (0) = 1.
2. DX est un intervalle de R.
3. Si X est bornée, alors GX est définie et continue sur R.
4. Si X est positive, alors GX est continue sur R− .
5. Pour a et b deux réels, GaX +b : t 7→ ebt GX ( at).
Paul Alphonse
5
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
1.3 - Caractérisation de la loi.
Le théorème suivant justifie le nom de fonction caractéristique que l’on donne à la transformée
de Fourier de la loi d’une variable aléatoire.
Théorème 1.3.1.
La transformée de Laplace caractérise la loi d’une variable aléatoire, ie si X et Y sont deux variables aléatoires telles que ϕ X = ϕY , alors PX = PY . Il en est de même pour la fonction caractéristique.
Remarque
Il est bien connu que la transformation de Fourier pour les fonctions intégrables est injective, en
ce sens que deux fonctions intégrables de même transformée de Fourier sont égales presque partout. Le théorème précédent est le résultat analogue pour les mesures de probabilité (il reste vrai
pour les mesures bornées).
On utlisera ce théorème pour démontrer le théorème de Bernstein donnant une caractérisation
des variables aléatoires gaussiennes.
2 . Liens avec l’indépendance.
Aussi bien la transformée de Laplace que la fonction caractéristique se comportent de façon remarquable vis a vis de l’indépendance des variables aléatoires dont elles caractérisent la loi. C’est
l’objet d’étude de cette nouvelle section.
2.1 - Caractérisations d’indépendance.
La proposition principale de cette partie, à savoir la proposition la proposition 2.1.2, repose essentiellement sur la proposition suivante, qui résulte d’une part du théorème de Fubini, et d’autre
part des théorèmes de transfert et de Fubini.
Proposition 2.1.1.
Soient µ et ν deux mesures bornées sur Rd . Alors :
\
b ν,
µ
⊗ ν = µ.b
b ν.
µ[
? ν = µ.b
Proposition 2.1.2.
Soient X et Y deux variables aléatoires réelles. Alors
1. X et Y sont indépendantes si et seulement si ϕ(X,Y ) = ϕ X ⊗ ϕY .
2. Si X et Y sont indépendantes, alors ϕ X +Y = ϕ X .ϕY .
Démonstration.
1. X et Y sont indépendantes si et seulement si P(X,Y ) = PX ⊗ PY , soit si et seulement si
\
\
P
( X,Y ) = PX ⊗ PY d’après le théorème 1.3.1. La proposition précédente donne alors le résultat.
2. Si X et Y sont indépendantes, la loi de X + Y est PX ? PY . Ici encore la proposition précédente donne le résultat.
Remarque et contre-exemple
La proposition précédente est également valable pour la transformée de Laplace. De plus, la réciproque du deuxième point dans la proposition précédente est fausse. En effet, soit X une variable
aléatoire réelle qui suit une loi de Cauchy C(1). Sa fonction caractéristique est comme on l’a déjà
mentionné
∀t ∈ R : ϕ X (t) = e−|t| .
Paul Alphonse
6
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
Le couple ( X, Y ), avec Y = X vérifie
2
∀t ∈ R : ϕ X +Y (t) = ϕ2X (t) = e−2|t| = e−|t| = ϕ X (t)ϕY (t),
mais X et Y ne sont pas indépendantes.
Exemple d’application
Soient ( Xi ) une suite de variables aléatoires réelles indépendantes et ( Sn ) la suite de ses sommes
partielles. On a vu précédemment que la fonction caractéristique d’une variable aléatoire caractérise sa loi. La proposition précédente permet alors d’obtenir la loi des variables aléatoires Sn
pour tout entier naturel non nul n. En effet, supposons par exemple que chaque Xi suit une loi de
Bernoulli b( p) avec p ∈]0, 1[. Alors les Xi étant indépendantes, la proposition précédente donne :
n
∀t ∈ R : ϕ Sn (t) = ϕ X1 +...+Xn (t) =
n
∏ ϕXi (t) =
i =1
∏ (q + peit ) = (q + peit )n .
i =1
Comme la fonction caractéristique caractérise la loi, on en déduit que Sn suit une loi B(n, p). Le
tableau suivant rassemble d’autres résultats de cette nature :
Loi de Xi
Paramètres
Loi de Sn
b( p)
p ∈]0, 1[
B(n, p)
P (λ )
λ ∈ R∗+
P (nλ )
B(ni , p)
ni ∈
N∗
!
n
: p ∈]0, 1[
B
∑ ni , p
i =1
E (λ )
λ ∈ R∗+
Γ(n, λ )
C( a)
a ∈ R∗+
C(na)
N (mi , σi2 )
mi ∈ R
: σi2
n
∈ R+
N
n
∑ mi , ∑
i =1
!
σi2
i =1
2.2 - Inégalité de Hoeffding
La transformée de Laplace permet de démontrer une inégalité de type grandes déviations : l’inégalité de Hoeffding.
Lemme 2.2.1.
Soit X une variable aléatoire réelle centrée bornée par 1. Alors
∀t ∈ R : GX (t) ≤ exp
t2
2
.
Démonstration.
Soient t un nombre réel et x ∈ [−1, 1]. Par convexité de l’exponentielle, il vient
1−x
1+x
1 − x −t 1 + x t
exp(tx) = exp
(−t) +
t ≤
e +
e = cosh(t) + x sinh(t).
2
2
2
2
2
De plus, en comparant les développements en série entière respectifs, cosh(t) ≤ exp( t2 ) donc on
obtient
2
t
tx
e ≤ exp
+ x sinh(t).
2
Etant donné que X est à valeurs dans [−1, 1], on peut appliquer l’inégalité précédente à X. Passant
à l’espérance, on obtient l’inégalité voulu étant donné que X est centrée.
Paul Alphonse
7
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
Théorème 2.2.1 (Inégalité de Hoeffding).
Soit ( Xn ) une suite de variables aléatoires réelles indépendantes bornées presque sûrement et centrées. On
suppose que | Xn | ≤ cn presque sûrement avec cn > 0. En posant Sn = X1 + . . . + Xn , il vient :
ε
∀ε > 0 : P (| Sn | > ε) ≤ 2 exp −
.
2 ∑in=1 ci
Démonstration.
Soit t un réel strictement positif. Commençons par remarquer que
P (| Sn | > ε) = P ( Sn > ε) + P (− Sn > ε) .
D’après l’inégalité de Markov et en utilisant l’indépendance des Xi , on obtient
n
n
P ( Sn > ε) ≤ e−tε E etSn = e−tε ∏ E etXi = e−tε ∏ GXi (t).
i =1
D’après le lemme précédent, GXi (t) ≤ exp
t2 ci2
i =1
donc il vient
2
t2σn
P ( Sn > ε) ≤ exp −tε +
.
2
Cette inégalité est vraie pour tout t > 0, on minimise donc l’argument de l’exponentielle précédente, ce qui donne
ε2
.
P ( Sn > ε) ≤ exp −
2σn
Comme les variables aléatoires − Xn vérifient les hypothèses de domination des Xn , on peut appliquer le raisonnement précédent aux − Xn , ce qui donne le résultat.
L’inégalité de Hoeffding peut être employée pour démontrer des résultats de convergence comme
l’illustre le corollaire suivant.
Corollaire 2.2.1.
Soit α > 0. On se place dans le cadre du théorème précédent en supposant de plus que
n
∀n ∈ N :
∑ c2j ≤ n2α−β ,
j=1
avec β > 0. Alors la suite de terme général
n−α S
n
converge presque sûrement vers 0.
Démonstration.
Considérons ε > 0. D’après l’inégalité de Hoeffding, on obtient avec l’hypothèse sur σn :
n2αε2
α
P (| Sn | > n ε) ≤ 2 exp −
≤ 2 exp −ε2 nβ .
2σn
Ainsi, la série de terme général P (| Sn | > nαε) converge car à partir d’un certain rang, ε2 nβ ≥
2 ln n et par le lemme de Borel-Cantelli :
P lim sup (| Sn | > nαε) = 0.
n→+∞
Or
Q∗+
est dénombrable donc il en résulte que

[
P
ε∈Q∗+

lim sup (| Sn | > nαε) = 0,
n→+∞
et en passant au complémentaire :

P

\
ε∈Q∗+
lim inf (| Sn | ≤ nαε) = 1.
n→+∞
Ceci montre, par définition de la limite inférieure, que la suite (n−α Sn ) converge presque sûrement vers 0.
Paul Alphonse
8
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
2.3 - Théorème de Bernstein
Dans ce paragraphe, on démontre une propriété caractéristique des variables aléatoires gaussiennes.
Lemme 2.3.1.
Soit φ : R → C une fonction borélienne telle que
1. φ est de module 1,
2. Pour tous s, t nombres réels, φ(s + t) = φ(s)φ(t).
Alors il existe un nombre réel c tel que
∀t ∈ R : φ(t) = eict .
Démonstration.
Considérons la fonction
R →
f :
x
C
Z x
7→
0
φ(t) dt
.
Si f était identiquement nulle, alors les fonctions <(φ) et =(φ) seraient nulles presque partout ce
qui contredirait le fait que φ est de module 1 donc il existe a un nombre réel tel que f ( a) soit non
nul. Par un changement de variable affine, il vient pour tout x réel :
f ( x + a) − f ( x) =
Z x+ a
x
φ(t) dt =
Ainsi :
∀ x ∈ R : φ( x) =
Z a
0
φ(s + t) ds = φ( x) f ( a).
f ( x + a) − f ( x)
.
f ( a)
De la continuité de f , on déduit la continuité de φ dont on déduit ensuite la dérivabilité de f puis
celle de φ. Dérivant la deuxième hypothèse sur φ par rapport à s, il vient ensuite
∀s, t ∈ R : φ0 (s + t) = φ(t)φ0 (s),
soit
∀t ∈ R : φ0 (t) = φ(0)φ(t).
Si φ(0) = 0, alors φ est une fonction constante et c = 0 d’après la seconde hypothèse sur φ. Sinon,
on pose c = −iφ0 (0) et alors
∀t ∈ R : φ(t) = eict .
Comme |φ(1)| = |eic | = 1, c est un nombre réel.
Théorème 2.3.1 (Bernstein).
Soient X et Y deux variables aléatoires réelles indépendantes. Alors X + Y et X − Y sont indépendantes si
et seulement si X et Y suivent des lois gaussiennes.
Démonstration.
Supposons dans un premier temps que X et Y suivent des lois gaussiennes. Quitte à centrer et
réduire, on suppose qu’elle sont centrées et de variance 1. Comme X et Y sont indépendantes,
X + Y et X − Y sont deux variables gaussiennes de loi N (0, 2). Alors :
∀s, t ∈ R : ϕ(X +Y,X −Y ) (s, t) = ϕ X (s + t).ϕY (s − t) = exp
= exp −2s2 − 2t2
−(s + t)2 − (s − t)2
2
= ϕ X +Y (s).ϕ X −Y (t)
D’où le sens réciproque.
Paul Alphonse
9
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
Pour toute la suite, on suppose que X + Y et X − Y sont indépendantes. Posons µ la loi de X, ν
celle de Y et γ la convolée de µ et ν.
Montrons dans un premier temps que
∀u, v ∈ R : γb(u + v)γb(u − v) = γb(u)2 |γb(v)2 |.
Soient u et v deux réels. Etant donné que X + Y et X − Y sont indépendantes, on obtient dans un
premier temps
ϕ(X +Y,X −Y ) (u, v) = ϕ X +Y (u)ϕ X −Y (v) = ϕ X (u)ϕY (u)ϕ X (v)ϕY (v).
De plus :
ϕ(X +Y,X −Y ) (u, v) = ϕ(X,Y ) (u + v, u − v) = ϕ X (u + v)ϕY (u − v),
ce qui donne
ϕ X (u + v)ϕY (u − v) = ϕ X (u)ϕY (u)ϕ X (v)ϕY (v).
(1)
L’égalité suivante provient du changement de variable v en −v :
ϕ X (u − v)ϕY (u + v) = ϕ X (u)ϕY (u)ϕ X (v)ϕY (v).
(2)
Il suffit alors de multiplier les égalités (1) et (2) membre à membre pour obtenir le résultat, sab νb = ϕ(X,Y ) = ϕ XϕY .
chant que γb = µ
On considère à présent la mesure de probabilité γ définie pour tout borélien de R par γ ( A) =
b = γb donc δb = |γb|2 et en
γ (− A). Soit également δ = γ ? γ. D’après le lemme de transfert, γ
passant au module dans l’égalité établie en point précédent, il vient
∀u, v ∈ R : δb(u + v) δb(u − v) = δb2 (u) δb2 (v).
Considérons G = {t ∈ R : δb(t) 6= 0}. L’égalité précédente montre que G est un sous-groupe de
R. De plus, δb est continue donc G est ouvert, il est dense dans R et même G = R. Ainsi δb est une
fonction strictement positive et on peut considérer
f :
R →
R
7→ − ln δb(t)
t
.
Pour tous u et v réels, f (u + v) + f (u − v) = 2( f (u) + f (v)). Comme f (0) = 0, il existe a > 0 tel
que f (u) = au2 pour tout u réel (comme usuellement, on le montre sur N, puis sur Z, Q et enfin
R par densité). Comme δb = |γb|2 , on a montré que
at2
∀t ∈ R : |γb(t)| = exp −
.
2
Pour terminer, considérons la fonction
R →
g:
t
7→
C
γb(t) ,
|γb(t)|
qui est bien définie d’après le point précédent. D’après tout ce qui précède, g vérifie
∀u, v ∈ R : g2 (u + v) = g2 (u) g2 (v).
Or g2 est borélienne de module 1 donc d’après le lemme préliminaire, il existe un réel m tel que
∀t ∈ R : g2 (t) = e2imt .
Comme g(0) = 1, g(t) = eimt pour tout t réel ce qui entraîne :
t2
∀t ∈ R : γb(t) = exp imt − a
.
2
Ainsi X + Y est une variable aléatoire gaussienne. De la même façon, X − Y est gaussienne et
comme X + Y et X − Y sont indépendantes, cela entraîne que X = (( X + Y ) + ( X − Y )) /2 et
Y = (( X + Y ) − ( X − Y )) /2 sont deux variables aléatoires gaussiennes.
Paul Alphonse
10
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
2.4 - Opérations sur les transformées de Laplace et les transformées de Fourier.
Le cas des fonctions caractéristiques.
Théorème 2.4.1.
Le produit de deux fonctions caractéristiques est une fonction caractéristique.
Démonstration.
Découle directement du deuxième point de la proposition la proposition 2.1.2.
Théorème 2.4.2.
Si ϕ est une fonction caractéristique, il en est de même de ϕ, |ϕ|2 et Re ϕ.
Démonstration.
Soit X une variable aléatoire. Raisonnons en trois points :
1. On a déjà vu que ϕ−X = ϕ X .
2. Soit X 0 une variable aléatoire indépendante de X et de même loi de X. Alors la variable
aléatoire Y = X − X 0 admet pour fonction caractéristique :
ϕY = ϕ X −X 0 = ϕ X ϕ−X = ϕ X ϕ X = |ϕ X |2 .
3. Enfin, Re ϕ = 12 (ϕ X + ϕ X ) est également une fonction caractéristique comme combinaison
convexe de fonctions caractéristiques.
Le cas des transformées de Laplace.
Théorème 2.4.3.
Le produit de deux transformées de Laplace est une transformée de Laplace.
Démonstration.
Découle ici encore immédiatement de la proposition la proposition 2.1.2.
Théorème 2.4.4.
Si G est une transformée de Laplace, il en est de même de la fonction t 7→ G (t) G (−t).
Démonstration.
Elle est analogue à ce qui a été fait pour le théorème 2.4.2.
3 . Liens avec les moments.
La régularité de la fonction caractéristique et de la transformée de Laplace est intimement liée à
l’existence de moments pour les variables aléatoires. Néanmoins, les comportements de ces deux
fonctions sont relativement différents.
Théorème 3.0.1.
Soit X une variable aléatoire réelle.
1. Si X admet un moment d’ordre n, alors ϕ X est de classe C n et
(k)
∀k ∈ J1, nK, ∀t ∈ R : ϕ X (t) = E ik X k eitX .
2. Si ϕ X est k-fois dérivable en 0, avec k ≥ 2, alors x admet des moments jusqu’à l’ordre 2
sont données par
{
s
k
(l )
∀l ∈ 1, 2
: ϕ X ( 0 ) = i l E( X l ) .
2
Paul Alphonse
11
j k
k
2
et ils
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
Contre-exemple
Comme le montre l’exemple ci-dessous, la fonction caractéristique peut être dérivable à l’origine
sans que la variable aléatoire admette une moyenne.
Soit X une variable aléatoire de loi PX = ∑k∈Z ak δk avec a0 = a1 = a−1 = 0 et
∀ k ≥ 2 : ak = a−k =
où
∞
1
c=
2
Remarquons que c existe bien car ∑
définie. De plus :
1
k2 ln k
∑
k=2
1
2
k ln k
k2
!−1
.
est une série de Bertrand convergente, X est donc bien
∞
E (| X |) = 2
c
,
ln k
∑∗ kak = 2 ∑
k ∈N
k=2
c
=∞
k ln k
en tant que somme de Bertrand divergente donc X n’est pas intégrable. Montrons cependant que
ϕ X est dérivable partout. Comme la loi de X est symétrique, ϕ X est une fonction à valeurs réelles :
∞
∀t ∈ R : ϕ X (t) = a0 + 2
∑ ak cos(kt).
k=1
Remarquons que la suite ( ak ) a été choisie de telle sorte que la suite (kak ) tende en décroissant
vers 0. De plus :
n
n
1 − ei (n+1) x 2
ikx ∗ ,
∀n ∈ N : ∑ sin(kx) ≤ ∑ e = ≤
ix
k=0
k=0
1−e
| sin 2x |
donc pour tout α ∈]0, 2π [ :
n
2
.
∀n ∈ N , ∀ x ∈ [α, 2π − α ] : ∑ sin(kx) ≤
k=0
| sin α2 |
∗
Le critère d’Abel assure donc la convergence uniforme de la série de fonctions ∑ kak sin(kt) sur
tout intervalle de la forme [α, 2π − α ]. La fonction ϕ X est donc dérivable sur ces intervalles et
aussi sur R \ 2π Z car elle est 2π-périodique. Il ne reste plus qu’à démontrer que ϕ X est dérivable
en 0. Pour tout t non nul, l’expression de ϕ X donne :
0≤
1 − ϕ X (t)
1
2c
= E (1 − cos (tX )) =
t
t
t
∞
∑
k=2
1 − cos(kt)
.
k2 ln k
Pour tout t tel que 0 < t < 1/2, éclatons cette somme en deux suivant que k est plus petit ou plus
grand que t−1 . Les fonctions x 7→ (ln x)−1 et x 7→ x−2 sont décroissantes sur R∗+ donc
0≤
1
t
∑
k≥ 1t
1 − cos(kt)
k2 ln k
≤
=
Ainsi :
1
t
∑
k≥ 1t
−2
t ln t
∑
k≥b 1t c
1
k2
−2 ∞
1
dx
t ln t b 1t c−1 x2
j k
1
t +1 1
≤ −2 j k
.
1
− 1 ln t
≤
−2
j k
1
t
t − 1 ln t
Z
t
1 − cos(kt)
−→ 0.
t→0
k2 ln k
En utilisant l’inégalité
∀ x ∈ R : 1 − cos x ≤
Paul Alphonse
12
x2
,
2
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
on obtient de même :
0
≤
1
t
∑
2≤k< 1t
1 − cos(kt)
k2 ln k
≤ t
∑
2≤k< 1t
≤
1
ln k
t
+t
ln 2
≤
Z k
∑
3≤k< 1t
1
dx
ln x
k−1
≤
t
+t
ln 2
t
+t
ln 2
∑
3≤k< 1t
1
t
Z
2
1
ln k
1
dx.
ln x
De plus, par intégration par parties :
∀ y ∈ [2, +∞[:
Mais puisque,
1
=
(ln x)2 x→+∞
o
1
ln x
Z y
2
1
y
2
dx =
−
+
ln x
ln y ln 2
Z y
1
2
(ln x)2
dx.
, on a
Z y
1
2
(ln x)2
Il en résulte que
1
y
dx
Z y
2
=
y→+∞
1
dx
ln x
o
y
Z
∼
2
y→+∞
1
dx .
ln x
1
,
ln y
puis
t
1
t
Z
2
1
dx −→ 0,
ln x
t→0
ce qui achève de démontrer que
1 − ϕ X (t)
−→ 0,
t
t→0
ie que ϕ X est dérivable en 0 de dérivée nulle.
Théorème 3.0.2.
Soit X une variable aléatoire réelle telle que D̊X contient 0. Alors pour tout entier non nul k, X admet un
moment d’ordre k et sur un voisinage de 0 :
+∞
GX ( t ) =
E( X k ) k
t .
k!
k=0
∑
(k)
en particulier, pour tout k entier naturel non nul, GX (0) = E( X k ).
Exemple
Soit X une variable aléatoire suivant une loi N (0, 1). Alors :
∀ t ∈ R : GX ( t ) = e − t
2 /2
+∞
=
∑
k=0
t2k
.
2k k!
En particulier, pour tout entier naturel k :
E( X 2k ) =
(2k)!
,
2k k!
E( X 2k+1 ) = 0.
4 . Liens avec la convergence en loi.
Cette section est consacrée à l’étude de la convergence en loi et du rôle que la fonction caractéristique et la transformée de Laplace jouent dans cette convergence.
Paul Alphonse
13
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
4.1 - Notion de convergence en loi.
Définition 4.1.1 (Convergence en loi).
Soient ( Xn ) une suite de variables aléatoires et X une variable aléatoire. On dit que ( Xn ) converge en loi
vers X si pour toute fonction continue bornée f : Rd → Rd :
E( f ( Xn ))
→
n→+∞
E( f ( X )).
L
On note Xn −→ X
n→+∞
Exemple
(δ1/n ) converge en loi vers δ0 . En effet, si h est une fonction continue bornée de R dans R, alors
Z
Z
1
h δ1/n = h
→ h(0) =
h δ0 .
n n→+∞
R
R
Théorème 4.1.1.
Soient ( Xn ) une suite de variables aléatoires réelles de X une variable aléatoire réelle. La suite ( Xn )
converge en loi vers X si et seulement si en tout point x de continuité de FX , on a FXn ( x) → FX ( x).
n→+∞
Remarque
La notion de convergence en loi concerne les lois des variables aléatoires et non pas les variables
aléatoire elles-mêmes.
Exemple
Si (σn ) est une suite réelle qui converge vers 0, alors (N (0, σn2 )) converge en loi vers δ0 . En effet,
pour tout x réel et tout entier naturel non nul n :

0 si x < 0


Z x

1
t2
1
FXn ( x) = √
exp − 2 dt → F ∗ ( x) =
si x = 0 .
n→+∞

2σn
σn 2π −∞

 2
1 si x > 0
La fonction F ∗ n’est pas la fonction de répartition d’une loi de probabilité car n’est pas continue à
droite en l’origine. Toutefois, en désignant par F la fonction de répartition de la variable aléatoire
nulle, F ∗ coïncide avec F sauf en 0, point de discontinuité de F. D’où la convergence annoncée.
Théorème 4.1.2 (Lévy).
1. Soit ( Xn ) une suite de variables aléatoires qui converge en loi vers une variable aléatoire X. Alors
la suite (ϕ Xn ) converge simplement sur R vers ϕ X .
2. Soit ( Xn ) une suite de variables aléatoires telle que (ϕ Xn ) converge simplement sur R vers une
fonction ϕ continue en 0. Alors ϕ est la fonction caractéristique d’une variable aléatoire X et ( Xn )
converge en loi vers X.
Contre-exemple
La convergence simple de la suite des fonctions caractéristiques ne suffit pas pour déduire la
convergence en loi de ( Xn ). En effet, considérons la suite de variables aléatoires ( Xn ) avec Xn
suivant la loi N (0, n). Alors
(
0 si t 6= 0
lim ϕ Xn (t) =
,
n→+∞
1 si t = 0
donc (ϕ Xn ) converge simplement vers une fonction non continue en 0. Montrons que la suite ( Xn )
ne converge pas en loi. On a
1
∀ x ∈ R : FXn ( x) = √
n 2π
Paul Alphonse
Z x
−∞
e−u
2 /(2n2 )
14
1
du = √
2π
Z x/n
−∞
e−u
2 /2
du
→
n→+∞
1
.
2
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
La suite ( FXn ) ne peut converger vers une fonction de répartition F en dehors des points de discontinuité de celle-ci, car ces points forment un ensemble dénombrable D et F ne peut être constante
à 21 en dehors de D, puisque F doit tendre vers 1 en +∞.
Théorème 4.1.3.
Soient X et ( Xn ), respectivement une variable aléatoire réelle et une suite de variables aléatoires réelles,
admettant des transformées de Laplace sur un intervalle ouvert I contenant 0. Alors
L
∀t ∈ I : GXn (t) −→ GX (t) ⇐⇒ Xn −→ X.
n→+∞
n→+∞
4.2 - Le théorème central limite.
Le théorème central limite est un théorème fondamental aussi bien en probabilité qu’en statistique. On lui consacre la sous-section qui suit.
Théorème 4.2.1 (Théorème central Limite).
Soit ( Xn ) une suite de variables aléatoires réelles indépendantes et identiquement distribuées de carrés
intégrables. Pour tout entier naturel n, on pose Sn = X1 + . . . + Xn . Soient également m = E( X1 ) et
σ 2 = Var( X1 ). Alors
Sn − nm L
√
−→ N (0, 1).
nσ 2 n→+∞
Pour démontrer ce théorème, on a besoin des deux lemmes suivants.
Lemme 4.2.1.
Soient ( an ) et (bn ) deux suites de nombres complexes de module inférieur à 1. Alors
n
n
n
∗ ∀ n ∈ N : ∏ ai − ∏ bi ≤ ∑ | ai − bi | .
i =1
i =1
i =1
Démonstration.
Soit n en entier naturel non nul. Alors
n+1
n+1
n
n+1 n+1 n
∏ ai − ∏ bi ≤ ∏ ai − a n+1 ∏ bi + a n+1 ∏ bi − ∏ bi i =1
i =1
i =1
i =1
i =1
i =1
n
n n
= | a n+1 | ∏ ai − ∏ bi + ∏ bi | a n+1 − b n+1 |
i =1
i =1
i =1
n
n
≤ ∏ ai − ∏ bi + | a n+1 − b n+1 | ,
i =1
i =1
et le résultat s’ensuit par récurrence.
Lemme 4.2.2.
Soit X une variable aléatoire réelle de carré intégrable. Alors
t2
|t| 3
2
2
2
∀t ∈ R : ϕ X (t) − 1 + itE( X ) − E( X ) ≤ t E X ∧ | X | .
2
6
Démonstration.
Soit x ∈ R. La formule de Taylor avec reste intégral appliquée à l’ordre 2 donne
eix = 1 + ix − x2
Comme
R1
0
Z 1
0
(1 − u)eiux du.
(1 − u)du = 12 , il vient
eix − (1 + ix −
Paul Alphonse
x2
) = − x2
2
15
Z 1
0
(1 − u)(eiux − 1)du
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
puis
2 ix
e − 1 + ix − x ≤ x2 .
2 De plus, d’après l’inégalité de Taylor-Lagrange,
2 3
ix
e − 1 + ix − x ≤ | x | ,
2
6
donc on en déduit l’inégalité suivante :
2 3
ix
e − 1 + ix − x ≤ x2 ∧ | x | .
2 6
Le résultat s’obtient alors en appliquant cette inégalité à tX, pour t un nombre réel, et en utilisant
l’inégalité de Jensen en passant à l’espérance.
On peut à présent s’attaquer à la démonstration du théorème central limite.
Démonstration du théorème central limite.
√
Quitte à centrer et à réduire, on peut supposer que m est nulle et σ vaut 1. Posons Yn = Sn / n.
Soit t un nombre réel. Commençons par remarquer que
n
t
∀n ∈ N∗ : ϕYn (t) = ϕ X1 √
.
n
2
t
| ≤ 1. Alors d’après les deux lemmes précédents :
Choisissons n assez grand pour que |1 − 2n
n t
t n
t2
t2 − 1−
− 1−
ϕ X1 √
≤ n ϕ X1 √
2n 2n n
n
≤
nt
|t|
E X2 ∧ √ |X3 |
n
6 n
→
n→+∞
0
d’après le théorème de convergence dominée, dont les hypothèses sont immédiatement vérifiées.
De plus,
2
n
t2
t
1−
→ exp −
,
n→+∞
2n
2
donc
t2
ϕYn (t) → exp −
n→+∞
2
et le théorème de Lévy donne le résultat escompté.
Le théorème central limite admet une réciproque donné par le théorème suivant :
Théorème 4.2.2.
Soit ( Xn ) une suite de variables aléatoires réelles indépendantes et identiquement distribuées telle que
X1 ∈ L1 (Ω) et E( X1 ) = 0 vérifiant de plus
S
L
√n −→ N (0, 1),
n
→+
∞
n
avec Sn = ∑in=1 Xi . Alors X1 est de carré intégrable et E( X12 ) = 1.
Pour démontrer ce résultat, on a de nouveau besoin de deux lemmes.
Lemme 4.2.3.
Soit X une variable aléatoire réelle. Alors dans [0, +∞] :
Z
1 − Re ϕ X (u)
=
x2 PX (dx).
lim 2
u→0
u2
R2
Paul Alphonse
16
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
Démonstration.
Pour u un réel non nul, on a
I (u) = 2
1 − Re ϕ X (u)
=2
u2
Z
R
1 − cos(ux)
PX (dx).
u2
Le terme 1 − cos(ux)/u2 est compris entre 0 et x2 /2 d’après l’inégalité de Taylor-Lagrange et
converge vers x2 /2 lorsque u tend vers 0 d’après l’inégalité de Taylor-Young. Le lemme de Fatou
donne alors :
Z
Z
x2 dPX (dx) ≤ lim inf I (u) ≤ lim sup I (u) ≤
x2 PX (dx).
u→0
R
u→0
R
D’où le résultat.
Lemme 4.2.4.
Soit ( X, Y ) un couple de variables aléatoires réelles indépendantes telle que X + Y appartient à L2 (Ω).
Alors X et Y appartiennent à L2 (Ω).
Démonstration.
Montrons que Y est de carré intégrable. On a
E(( X + Y )2 ) =
Z
E(( x + Y )2 )PX (dx),
R
donc pour PX presque tout x réel, la somme x + Y appartient à L2 (Ω).
On peut à présent démontrer la réciproque du théorème central limite.
Démonstration du théorème 4.2.2.
Soit ϕ la fonction caractéristique de X1 . Supposons dans un premier temps que la loi de X1 est
symétrique, ce qui implique que ϕ est à valeurs réelles. Par hypothèse et d’après le théorème de
Lévy,
n
1
= e−1/2 .
lim ϕ √
n→+∞
n
√
Or, pour n assez grand, ϕ(1/ n) > √
0 car ϕ(0) = 1 et ϕ est continue,
on peut donc passer au
√
logarithme, ce qui entraîne n ln ϕ(1/ n) ∼ −1/2, d’où ϕ(1/ n) − 1 ∼ −1/(2n). D’après le
lemme 4.2.3, on en déduit
√ !
Z
1
−
ϕ
1
/
n
2
x2 PX1 (dx) = lim
= 1.
E( X12 ) =
n
→+
∞
1
/
n
R
Passons maintenant au cas général. L’hypothèse entraîne que la suite ( Zn ) définie par
( X1 − X2 ) + ( X3 − X4 ) + . . . + ( X2n−1 − X2n )
√
2n
1
X1 + X3 + . . . + X2n−1
X2 + X4 + . . . + X2n
√
√
= √
−
n
n
2
Zn =
converge
part, si on pose Yn = ( X2n−1 −
√ en loi vers une variable aléatoire de loi N (0, 1). D’autre√
X2n ))/ 2, on peut écrire Zn sous la forme Zn = (Y1 + . . . + Yn )/ n où les Yn sont des variables
aléatoires indépendantes, de même loi symétrique et centrées. On peut donc leur appliquer le cas
précédent, ce qui entraine que E(Y12 ) = 1 et le lemme 4.2.4 permet d’en déduire que E( X12 ) =
1.
Paul Alphonse
17
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
4.3 - Exemples d’utilisation du théorème central limite
Intervalles de confiance
Le théorème central limite permet en statistique de déterminer des intervalles de confiance asymptotique. Par exemple, considérons X1 , . . . , Xn des variables aléatoires réelles indépendantes et
identiquement distribuées, de moyenne m ∈ R et de variance σ 2 ∈ R+ . On suppose que l’on
cherche la moyenne et que l’on ne connait pas la variance. En notant X n la moyenne empirique
des variables aléatoires Xi , il vient d’après le théorème central limite
r
L
n
X n − m −→ N (0, 1).
2
n→+∞
σ
Si S2n désigne la variance empirique des Xi , ( Sn ) converge presque surement vers σ donc d’après
le théorème de Slutsky :
√
n Xn − m
L
−→ N (0, 1).
n→+∞
Sn
Ainsi, si N est une variable aléatoire réelle de loi N (0, 1), il vient :
√
n ∀ t ∈ R+ : P
Xn − m > t
−→ 2 P ( N > t) .
n→+∞
Sn
Finalement :
Sn
Sn
∀ t ∈ R+ : P m ∈ X n − t √ , X n + t √
n
n
et
−→ 1 − 2 P ( N < t)
n→+∞
Sn
Sn
X n − tα √ , X n + tα √
n
n
est un intervalle de confiance asymptotique de probabilité de sureté 1 − α lorsque tα est le 1 − α /2
quantile de la loi N (0, 1).
Calculs de limites
Le théorème central limite permet de calculer des limites. Par exemple, montrons que
e−n
n
∑
k=0
nk
k!
→
n→+∞
1
.
2
Soit ( Xn ) une suite de variables aléatoires indépendantes et identiquement distribuées suivant
une loi de Poisson P (1). Alors comme on l’a déjà vu, la variable aléatoire Sn suit en conséquence
une loi de Poisson P (n) pour tout entier √
naturel non nul n. Alors d’après le théorème central
limite, la suite de terme général ( Sn − n)/ n converge en loi vers une variable aléatoire suivant
une loi normale N (0, 1), que l’on note Y. Alors
Sn − n
1
√
P( S n ≤ n ) = P
≤0
→ P (Y ≤ 0 ) = .
n→+∞
2
n
Or
∀ n ∈ N∗ : P( S n ≤ n ) =
n
∑
k=0
nk −n
e ,
k!
donc le résultat s’ensuit.
Formule de Stirling
Le théorème central limite permet également de démontrer la formule de Stirling.
On admet le lemme suivant qui nous sera utile par la suite :
Paul Alphonse
18
ENS Rennes
2015
Mémoire M2 : Leçon 261
2016
Lemme 4.3.1.
Soit ( Xn ) une suite de variables aléatoires réelles qui converge en loi vers une variable aléatoire X. On
suppose que supn∈N E( Xn2 ) < ∞. Alors E(| Xn |) → E(| X |).
n→+∞
Les deux égalités suivantes, valables pour tous entiers naturels m et n, s’obtiennent facilement en
intégrant par parties :
Z ∞
m
yn e− y dy = n! e−m
n
∑
k=0
Z m
0
yn e− y dy = n!
mk
,
k!
1 − e−m
n
∑
k=0
mk
k!
!
.
Soit ( Xn ) une suite de variables aléatoires indépendantes et identiquement distribuées de loi exponentielle E (1)√
. On a montré dans un paragraphe précédent qu’alors Sn suit la loi Γ(n, 1). Posons
Yn = ( Sn − n)/ n et considérons Y une variable aléatoire de loi normale N (0, 1). Alors d’après
le théorème central limite, (Yn ) converge en loi vers Y et vérifie de plus :
Sn − n
1
∗
√
∀n ∈ N : Var
= Var( Sn ) = 1,
n
n
donc supn∈N∗ E(Yn2 ) < ∞. D’après le lemme 4.3.1, il s’ensuit :
Z
R
| y| PYn (dy)
Or
Z
| y| PY (dy)
= 2
R
| y| PYn (dy) =
n→+∞
2
Z ∞
y e− y /2
√
0
R
Z
→
2π
Z ∞
| y − n|
√
0
n
Z
| y| PY (dy).
R
r
=
dy
yn−1 − y
e dy
(n − 1)!
2
,
π
1
=
2nn− 2 e−n
,
(n − 1)!
donc on en déduit la formule de Stirling
n!
∼
n→+∞
n n √
e
2πn.
Références
[Can13]
Bernard Candelpergher. Théorie des probabilités, une introduction élémentaire. Calvage
et Mounet, 2013.
[CGCDM05] Marie Cottrel, Valentine Genon-Catalot, Christian Duhamel, and Thierry Meyre.
Exercices de probabilités. Cassini, 2005.
[FF12]
Dominique Foata and Aimé Fuchs. Calcul des probabilités. Dunod, 2012.
[Let97]
Gérard Letac. Intégration et probabilités - Analyse de Fourier. Masson, 1997.
[Ouv00]
Jean-Yves Ouvrard. Probabilités 2. Cassini, 2000.
[Tou99]
Paul S. Toulouse. Thèmes de probabilité. Dunod, 1999.
Paul Alphonse
19
ENS Rennes
Téléchargement