Chaines de Markov, chapitre 3

publicité
Chapitre 3
Mesures stationnaires
et théorèmes de convergence
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.1
I. Mesures stationnaires
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.2
I. Mesures stationnaires
Définition : Une probabilité π sur E est invariante ou stationnaire pour
la chaine de Markov (Xn )n≥0 si, pour tout n ≥ 0 :
(∀ x ∈ E, P(Xn = x) = π(x)) =⇒ (∀ x ∈ E, P(Xn+1 = x) = π(x)).
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.2
I. Mesures stationnaires
Définition : Une probabilité π sur E est invariante ou stationnaire pour
la chaine de Markov (Xn )n≥0 si, pour tout n ≥ 0 :
(∀ x ∈ E, P(Xn = x) = π(x)) =⇒ (∀ x ∈ E, P(Xn+1 = x) = π(x)).
Proposition 1 : La probabilité π est stationnaire si et seulement si :
X
∀ y ∈ E,
π(x)p(x, y) = π(y).
x∈E
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.2
I. Mesures stationnaires
Définition : Une probabilité π sur E est invariante ou stationnaire pour
la chaine de Markov (Xn )n≥0 si, pour tout n ≥ 0 :
(∀ x ∈ E, P(Xn = x) = π(x)) =⇒ (∀ x ∈ E, P(Xn+1 = x) = π(x)).
Proposition 1 : La probabilité π est stationnaire si et seulement si :
X
∀ y ∈ E,
π(x)p(x, y) = π(y).
x∈E
En fait π est stationnaire si et seulement si, lorsque la loi initiale de la
chaine est π (c’est-à-dire si P(X0 = x) = π(x) pour tout x) alors, pour
tout instant n, la loi de Xn est également π (c’est-à-dire
P(Xn = x) = π(x) pour tout x).
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.2
Exemple : Dans le cas d’une chaine
pour laquelle

 E = {0, 1} et
1−a
a

,
p=
b
1−b
nous avons montré que
P(Xn = 0) =
et
b
b
+ (1 − a − b)n (µ(0) −
)
a+b
a+b
a
a
n
P(Xn = 1) =
+ (1 − a − b) (µ(1) −
)
a+b
a+b
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.3
Exemple : Dans le cas d’une chaine
pour laquelle

 E = {0, 1} et
1−a
a

,
p=
b
1−b
nous avons montré que
P(Xn = 0) =
et
b
b
+ (1 − a − b)n (µ(0) −
)
a+b
a+b
a
a
n
P(Xn = 1) =
+ (1 − a − b) (µ(1) −
)
a+b
a+b
Par conséquent la probabilité π définie par π(0) =
stationnaire et c’est la seule.
b
a+b , π(1)
=
a
a+b
est
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.3
Exemple : Dans le cas d’une chaine
pour laquelle

 E = {0, 1} et
1−a
a

,
p=
b
1−b
nous avons montré que
P(Xn = 0) =
et
b
b
+ (1 − a − b)n (µ(0) −
)
a+b
a+b
a
a
n
P(Xn = 1) =
+ (1 − a − b) (µ(1) −
)
a+b
a+b
Par conséquent la probabilité π définie par π(0) =
stationnaire et c’est la seule.
b
a+b , π(1)
=
a
a+b
est
On retrouve ce résultat en appliquant la proposition 1.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.3
Exemple : Dans le cas d’une chaine
pour laquelle

 E = {0, 1} et
1−a
a

,
p=
b
1−b
nous avons montré que
P(Xn = 0) =
b
b
+ (1 − a − b)n (µ(0) −
)
a+b
a+b
a
a
n
P(Xn = 1) =
+ (1 − a − b) (µ(1) −
)
a+b
a+b
et
Par conséquent la probabilité π définie par π(0) =
stationnaire et c’est la seule.
b
a+b , π(1)
=
a
a+b
est
On retrouve ce résultat en appliquant la proposition 1.
En outre
lim P(Xn = 0) =
n→+∞
b
= π(0),
a+b
lim P(Xn = 1) =
n→+∞
a
= π(1).
a+b
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.3
En fait, si π est stationnaire et si la loi de X0 est π , alors pour tout n,
(Xk+n )k≥0 a même loi que (Xp )p≥0 au sens où : pour tout m ≥ 0, le
vecteur (Xn , Xn+1 , . . . , Xn+m ) a même loi que le vecteur
(X0 , X1 , . . . , Xm ).
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.4
En fait, si π est stationnaire et si la loi de X0 est π , alors pour tout n,
(Xk+n )k≥0 a même loi que (Xp )p≥0 au sens où : pour tout m ≥ 0, le
vecteur (Xn , Xn+1 , . . . , Xn+m ) a même loi que le vecteur
(X0 , X1 , . . . , Xm ).
Cela signifie que la chaine de Markov regardée depuis l’instant initial a
même loi que la chaine de Markov regardée à partir de tout instant n.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.4
En fait, si π est stationnaire et si la loi de X0 est π , alors pour tout n,
(Xk+n )k≥0 a même loi que (Xp )p≥0 au sens où : pour tout m ≥ 0, le
vecteur (Xn , Xn+1 , . . . , Xn+m ) a même loi que le vecteur
(X0 , X1 , . . . , Xm ).
Cela signifie que la chaine de Markov regardée depuis l’instant initial a
même loi que la chaine de Markov regardée à partir de tout instant n.
Il est commode d’étendre la notion d’invariance aux mesures sur E et
de ne pas la réserver aux probabilités sur E .
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.4
En fait, si π est stationnaire et si la loi de X0 est π , alors pour tout n,
(Xk+n )k≥0 a même loi que (Xp )p≥0 au sens où : pour tout m ≥ 0, le
vecteur (Xn , Xn+1 , . . . , Xn+m ) a même loi que le vecteur
(X0 , X1 , . . . , Xm ).
Cela signifie que la chaine de Markov regardée depuis l’instant initial a
même loi que la chaine de Markov regardée à partir de tout instant n.
Il est commode d’étendre la notion d’invariance aux mesures sur E et
de ne pas la réserver aux probabilités sur E .
Définition : Une mesure m sur E (c’est à dire une famille (m(x))x∈E de
réels positifs ou nuls) est dite invariante (ou stationnaire) si la mesure
m n’est pas la mesure identiquement nulle et si :
X
∀y ∈ E
m(x) p(x, y) = m(y).
x∈E
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.4
Une probabilité invariante est évidemment une mesure invariante.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.5
Une probabilité invariante est évidemment une mesure invariante.
Si m est une mesure invariante et si λ > 0, alors λm est une
mesure invariante.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.5
Une probabilité invariante est évidemment une mesure invariante.
Si m est une mesure invariante et si λ > 0, alors λm est une
mesure invariante.
Si m est une mesure invariante et si m(E) < +∞, alors m/m(E) est
une probabilité invariante.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.5
Une probabilité invariante est évidemment une mesure invariante.
Si m est une mesure invariante et si λ > 0, alors λm est une
mesure invariante.
Si m est une mesure invariante et si m(E) < +∞, alors m/m(E) est
une probabilité invariante.
En pratique, on cherche des mesures stationnaires et on les
renormalise éventuellement pour avoir des probabilités stationnaires.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.5
Une probabilité invariante est évidemment une mesure invariante.
Si m est une mesure invariante et si λ > 0, alors λm est une
mesure invariante.
Si m est une mesure invariante et si m(E) < +∞, alors m/m(E) est
une probabilité invariante.
En pratique, on cherche des mesures stationnaires et on les
renormalise éventuellement pour avoir des probabilités stationnaires.
Si E est fini et comprend d éléments, m peut être représentée par un
vecteur colonne de d composantes et les équations de stationnarité
s’écrivent :
mt p = mt .
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.5
Une probabilité invariante est évidemment une mesure invariante.
Si m est une mesure invariante et si λ > 0, alors λm est une
mesure invariante.
Si m est une mesure invariante et si m(E) < +∞, alors m/m(E) est
une probabilité invariante.
En pratique, on cherche des mesures stationnaires et on les
renormalise éventuellement pour avoir des probabilités stationnaires.
Si E est fini et comprend d éléments, m peut être représentée par un
vecteur colonne de d composantes et les équations de stationnarité
s’écrivent :
mt p = mt .
Cela revient à chercher les vecteurs propres à gauche de p (c’est-à-dire
les vecteurs propres de pt associés à la valeur propre 1). On voit que 1
est valeur propre de p donc de pt , mais il n’est pas évident qu’il existe un
vecteur propre dont toutes les composantes soient positives ou nulles.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.5
Exemple : Prenons le modèle d’Ehrenfest avec d = 3. La matrice de
transition p est :


0
1
0
0
 1/3 0 2/3 0 



.
 0 2/3 0 1/3 
0
0
1
0
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.6
Exemple : Prenons le modèle d’Ehrenfest avec d = 3. La matrice de
transition p est :


0
1
0
0
 1/3 0 2/3 0 



.
 0 2/3 0 1/3 
0
0
1
0
On trouve :
1
3
3
1
π(0) = , π(1) = , π(2) = , π(3) = .
8
8
8
8
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.6
Exemple : Prenons le modèle d’Ehrenfest avec d = 3. La matrice de
transition p est :


0
1
0
0
 1/3 0 2/3 0 



.
 0 2/3 0 1/3 
0
0
1
0
On trouve :
1
3
3
1
π(0) = , π(1) = , π(2) = , π(3) = .
8
8
8
8
Pour cette chaine, nous n’avons pas limn→+∞ P(Xn = i) = π(i) car si n
est impair Px (Xn = x) = 0.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.6
Exemple : Prenons le modèle d’Ehrenfest avec d = 3. La matrice de
transition p est :


0
1
0
0
 1/3 0 2/3 0 



.
 0 2/3 0 1/3 
0
0
1
0
On trouve :
1
3
3
1
π(0) = , π(1) = , π(2) = , π(3) = .
8
8
8
8
Pour cette chaine, nous n’avons pas limn→+∞ P(Xn = i) = π(i) car si n
est impair Px (Xn = x) = 0.
Cette chaine a un comportement “périodique", nous y reviendrons à la
fin du chapitre.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.6
Il peut être lourd de chercher les mesures stationnaires à l’aide de la
définition, la notion de réversibilité est plus restrictive mais plus facile à
manipuler.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.7
Il peut être lourd de chercher les mesures stationnaires à l’aide de la
définition, la notion de réversibilité est plus restrictive mais plus facile à
manipuler.
Définition : La mesure m sur E est réversible pour la chaine de
Markov de fonction de transition p si :
m(x) p(x, y) = m(y) p(y, x), ∀ x; y ∈ E.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.7
Il peut être lourd de chercher les mesures stationnaires à l’aide de la
définition, la notion de réversibilité est plus restrictive mais plus facile à
manipuler.
Définition : La mesure m sur E est réversible pour la chaine de
Markov de fonction de transition p si :
m(x) p(x, y) = m(y) p(y, x), ∀ x; y ∈ E.
Proposition 2 : Toute mesure réversible est stationnaire.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.7
Exemple d’une chaine de naissance et mort :
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.8
Exemple d’une chaine de naissance et mort :
On suppose que qx > 0 pour tout x ≥ 1.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.8
Exemple d’une chaine de naissance et mort :
On suppose que qx > 0 pour tout x ≥ 1.
On vérifie que la mesure m est réversible si et seulement si elle s’écrit pour
x ≥ 1, x ∈ E :
p0 ....px−1
m(x) =
m(0).
q1 ......qx
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.8
Exemple d’une chaine de naissance et mort :
On suppose que qx > 0 pour tout x ≥ 1.
On vérifie que la mesure m est réversible si et seulement si elle s’écrit pour
x ≥ 1, x ∈ E :
p0 ....px−1
m(x) =
m(0).
q1 ......qx
Si E = {0, 1, ...d}, la probabilité π donnée par :
m(x)
π(x) = Pd
=
y=0 m(y)
est réversible donc stationnaire.
p0 ....px−1
q1 ......qx
Pd p0 ....py−1
y=0 q1 ......qy
pour 0 ≤ x ≤ d,
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.8
Exemple d’une chaine de naissance et mort :
On suppose que qx > 0 pour tout x ≥ 1.
On vérifie que la mesure m est réversible si et seulement si elle s’écrit pour
x ≥ 1, x ∈ E :
p0 ....px−1
m(x) =
m(0).
q1 ......qx
Si E = {0, 1, ...d}, la probabilité π donnée par :
m(x)
π(x) = Pd
=
y=0 m(y)
p0 ....px−1
q1 ......qx
Pd p0 ....py−1
y=0 q1 ......qy
est réversible donc stationnaire.
P
P
Si E = N, et si y≥0 m(y) =< +∞, c’est-à-dire si y≥0
une seule probabilité réversible π donnée par :
pour 0 ≤ x ≤ d,
p0 ....py−1
q1 ......qy
< +∞, il existe une et
p0 ....px−1
m(x)
q ......qx
P
π(x) =
= P 1 p0 ....p
y−1
m(y)
y≥0
y≥0 q1 ......qy
pour x ∈ N.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.8
Exemple d’une chaine de naissance et mort :
On suppose que qx > 0 pour tout x ≥ 1.
On vérifie que la mesure m est réversible si et seulement si elle s’écrit pour
x ≥ 1, x ∈ E :
p0 ....px−1
m(x) =
m(0).
q1 ......qx
Si E = {0, 1, ...d}, la probabilité π donnée par :
m(x)
π(x) = Pd
=
y=0 m(y)
p0 ....px−1
q1 ......qx
Pd p0 ....py−1
y=0 q1 ......qy
est réversible donc stationnaire.
P
P
Si E = N, et si y≥0 m(y) =< +∞, c’est-à-dire si y≥0
une seule probabilité réversible π donnée par :
pour 0 ≤ x ≤ d,
p0 ....py−1
q1 ......qy
< +∞, il existe une et
p0 ....px−1
m(x)
q ......qx
P
π(x) =
= P 1 p0 ....p
y−1
m(y)
y≥0
y≥0 q1 ......qy
Si E = N, et si
p0 ....py−1
y≥0 q1 ......qy
P
pour x ∈ N.
= +∞, il n’existe pas de probabilité réversible.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.8
Soit π une probabilité stationnaire. Si y est un état
transient ou récurrent nul, alors π(y) = 0.
Proposition 3 :
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.9
Proposition 3 : Soit π une probabilité stationnaire. Si y est un état
transient ou récurrent nul, alors π(y) = 0.
car si y est transient ou récurrent nul, alors pour tout x
à n
!
X
1
1{Xk =y} −−−−−→ 0.
Ex
n→+∞
n
k=1
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.9
II. Cas d’une chaine récurrente irréductible
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.10
II. Cas d’une chaine récurrente irréductible
Lemme 5 : Soit m une mesure invariante (donc non identiquement
nulle) d’une chaine de Markov irréductible. Alors, pour tout y ∈ E , on a
m(y) > 0.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.10
II. Cas d’une chaine récurrente irréductible
Lemme 5 : Soit m une mesure invariante (donc non identiquement
nulle) d’une chaine de Markov irréductible. Alors, pour tout y ∈ E , on a
m(y) > 0.
Théorème 5 : Une chaine de Markov récurrente irréductible possède
une mesure invariante m. Cette mesure stationnaire est strictement
positive en tout point et unique à une constante multiplicative près. En
outre pour tout x0 ∈ E on a :


Tx0
X
∀ y ∈ E, m(y) = c(x0 ) Ex0 
1{Xk =y}  (c(x0 ) > 0).
k=1
Par suite la chaine est récurrente positive si et seulement si ses
mesures stationaires sont de masse totale finie.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.10
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
- λx0 (x0 ) = 1,
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
- λx0 (x0 ) = 1,
P
- pour tout z ∈ E , y∈E λx0 (y) p(y, z) = λx0 (z),
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
- λx0 (x0 ) = 1,
P
- pour tout z ∈ E , y∈E λx0 (y) p(y, z) = λx0 (z),
- pour tout y0 ∈ E , λx0 (y0 ) < +∞.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
- λx0 (x0 ) = 1,
P
- pour tout z ∈ E , y∈E λx0 (y) p(y, z) = λx0 (z),
- pour tout y0 ∈ E , λx0 (y0 ) < +∞.
Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0 .
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
- λx0 (x0 ) = 1,
P
- pour tout z ∈ E , y∈E λx0 (y) p(y, z) = λx0 (z),
- pour tout y0 ∈ E , λx0 (y0 ) < +∞.
Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0 .
Soit m une mesure invariante
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
- λx0 (x0 ) = 1,
P
- pour tout z ∈ E , y∈E λx0 (y) p(y, z) = λx0 (z),
- pour tout y0 ∈ E , λx0 (y0 ) < +∞.
Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0 .
Soit m une mesure invariante
Pn
- pour tout z ∈ E , m(z) ≥ m(x0 ) k=1 Px0 (Tx0 ≥ k, Xk = z),
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
- λx0 (x0 ) = 1,
P
- pour tout z ∈ E , y∈E λx0 (y) p(y, z) = λx0 (z),
- pour tout y0 ∈ E , λx0 (y0 ) < +∞.
Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0 .
Soit m une mesure invariante
Pn
- pour tout z ∈ E , m(z) ≥ m(x0 ) k=1 Px0 (Tx0 ≥ k, Xk = z),
- pour tout z ∈ E , m(z) ≥ m(x0 ) λx0 (z),
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
- λx0 (x0 ) = 1,
P
- pour tout z ∈ E , y∈E λx0 (y) p(y, z) = λx0 (z),
- pour tout y0 ∈ E , λx0 (y0 ) < +∞.
Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0 .
Soit m une mesure invariante
Pn
- pour tout z ∈ E , m(z) ≥ m(x0 ) k=1 Px0 (Tx0 ≥ k, Xk = z),
- pour tout z ∈ E , m(z) ≥ m(x0 ) λx0 (z),
- m1 = m − m(x
P 0 ) λx0 est une mesure (positive) qui vérifie, pour tout
y ∈ E , m1 (y) = x∈E m1 (x) p(x, y).
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
On fixe x0 ∈ E et on pose


Tx0
X
X
λx0 (y) = Ex0 
1{Xk =y}  =
Px0 (Tx0 ≥ k, Xk = y) ∈ R+ .
k=1
k≥1
Etape 1 : λx0 est une mesure invariante strictement positive
- λx0 (x0 ) = 1,
P
- pour tout z ∈ E , y∈E λx0 (y) p(y, z) = λx0 (z),
- pour tout y0 ∈ E , λx0 (y0 ) < +∞.
Etape 2 : toutes les mesures invariantes sont proportionnelles à λx0 .
Soit m une mesure invariante
Pn
- pour tout z ∈ E , m(z) ≥ m(x0 ) k=1 Px0 (Tx0 ≥ k, Xk = z),
- pour tout z ∈ E , m(z) ≥ m(x0 ) λx0 (z),
- m1 = m − m(x
P 0 ) λx0 est une mesure (positive) qui vérifie, pour tout
y ∈ E , m1 (y) = x∈E m1 (x) p(x, y).
- m1 (x0 ) = 0, donc m1 = 0 (lemme 4).
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.11
Une chaine de Markov irréductible et récurrente
positive possède une et une seule probabilité stationnaire π . Cette
probabilité stationnaire π vérifie :
Théorème 6 :
PTx0
Ex0 ( k=1 1{Xk =y} )
1
∀ x0 ∈ E, ∀ y ∈ E, π(y) =
=
.
Ex0 (Tx0 )
Ey (Ty )
En outre, pour tout y ∈ E :
n
X
1
p.s.
1{Xk =y} −−−→ π(y).
n→+∞
n
k=1
Plus généralement, pour toute fonction f positive ou π -intégrable :
Z
n
X
X
1
p.s.
f (Xk ) −−−→
f (y) π(y) = f dπ.
n→+∞
n
k=1
y∈E
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.12
Remarque : :
n
n
n−1
k=1
k=0
k=0
1X
1X
1X
lim
1{Xk =y} = lim
1{Xk =y} = lim
1{Xk =y} ,
n→+∞ n
n→+∞ n
n→+∞ n
et de même :
n
n
n−1
X
X
1
1
1X
lim
f (Xk ) = lim
f (Xk ) = lim
f (Xk ).
n→+∞ n
n→+∞ n
n→+∞ n
k=1
k=0
k=0
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.13
Remarque : :
n
n
n−1
k=1
k=0
k=0
1X
1X
1X
lim
1{Xk =y} = lim
1{Xk =y} = lim
1{Xk =y} ,
n→+∞ n
n→+∞ n
n→+∞ n
et de même :
n
n
n−1
X
X
1
1
1X
lim
f (Xk ) = lim
f (Xk ) = lim
f (Xk ).
n→+∞ n
n→+∞ n
n→+∞ n
k=1
k=0
k=0
Corollaire 8 : Une chaine irréductible est récurrente positive si et
seulement si elle possède une probabilité stationnaire (et celle-ci est
alors unique).
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.13
Remarque : :
n
n
n−1
k=1
k=0
k=0
1X
1X
1X
lim
1{Xk =y} = lim
1{Xk =y} = lim
1{Xk =y} ,
n→+∞ n
n→+∞ n
n→+∞ n
et de même :
n
n
n−1
X
X
1
1
1X
lim
f (Xk ) = lim
f (Xk ) = lim
f (Xk ).
n→+∞ n
n→+∞ n
n→+∞ n
k=1
k=0
k=0
Corollaire 8 : Une chaine irréductible est récurrente positive si et
seulement si elle possède une probabilité stationnaire (et celle-ci est
alors unique).
Corollaire 8 : Une chaine irréductible sur un espace d’états fini
possède une et une seule probabilité stationnaire π et tous ses états
sont récurrents positifs.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.13
En pratique, pour trouver la probabilité invariante éventuelle d’une
chaine irréductible, on peut
commencer par chercher des mesures réversibles γ ,
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.14
En pratique, pour trouver la probabilité invariante éventuelle d’une
chaine irréductible, on peut
commencer par chercher des mesures réversibles γ ,
si on en trouve une, alors la mesure m = γ est invariante,
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.14
En pratique, pour trouver la probabilité invariante éventuelle d’une
chaine irréductible, on peut
commencer par chercher des mesures réversibles γ ,
si on en trouve une, alors la mesure m = γ est invariante,
si on n’en trouve pas, on ne peut conclure et il faut revenir à la
recherche directe de mesures invariantes,
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.14
En pratique, pour trouver la probabilité invariante éventuelle d’une
chaine irréductible, on peut
commencer par chercher des mesures réversibles γ ,
si on en trouve une, alors la mesure m = γ est invariante,
si on n’en trouve pas, on ne peut conclure et il faut revenir à la
recherche directe de mesures invariantes,
si on ne trouve pas de mesure invariante non identiquement nulle,
alors la chaine est transiente.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.14
En pratique, pour trouver la probabilité invariante éventuelle d’une
chaine irréductible, on peut
commencer par chercher des mesures réversibles γ ,
si on en trouve une, alors la mesure m = γ est invariante,
si on n’en trouve pas, on ne peut conclure et il faut revenir à la
recherche directe de mesures invariantes,
si on ne trouve pas de mesure invariante non identiquement nulle,
alors la chaine est transiente.
si on a trouvé une mesure invariante m non identiquement nulle :
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.14
En pratique, pour trouver la probabilité invariante éventuelle d’une
chaine irréductible, on peut
commencer par chercher des mesures réversibles γ ,
si on en trouve une, alors la mesure m = γ est invariante,
si on n’en trouve pas, on ne peut conclure et il faut revenir à la
recherche directe de mesures invariantes,
si on ne trouve pas de mesure invariante non identiquement nulle,
alors la chaine est transiente.
si on a trouvé une mesure invariante m non identiquement nulle :
P
- ou bien x m(x) < +∞, la chaine est
alors récurrente positive
P
et la probabilité invariante est π(x) = m(x)/ y m(y),
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.14
En pratique, pour trouver la probabilité invariante éventuelle d’une
chaine irréductible, on peut
commencer par chercher des mesures réversibles γ ,
si on en trouve une, alors la mesure m = γ est invariante,
si on n’en trouve pas, on ne peut conclure et il faut revenir à la
recherche directe de mesures invariantes,
si on ne trouve pas de mesure invariante non identiquement nulle,
alors la chaine est transiente.
si on a trouvé une mesure invariante m non identiquement nulle :
P
- ou bien x m(x) < +∞, la chaine est
alors récurrente positive
P
et la probabilité invariante est π(x) = m(x)/ y m(y),
P
- ou bien x m(x) = +∞, la chaine est alors récurrente nulle ou
transiente.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.14
III. Cas d’une chaine non irréductible
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.15
III. Cas d’une chaine non irréductible
Lemme 10 : Soit C une classe fermée et m une mesure portée par C
(c’est-à-dire telle que m(C c ) = 0). Alors m est invariante pour la chaine
de Markov initiale si et seulement si elle est invariante pour la chaine
de Markov restreinte à C .
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.15
III. Cas d’une chaine non irréductible
Lemme 10 : Soit C une classe fermée et m une mesure portée par C
(c’est-à-dire telle que m(C c ) = 0). Alors m est invariante pour la chaine
de Markov initiale si et seulement si elle est invariante pour la chaine
de Markov restreinte à C .
Théorème 10 : Soit C une classe fermée irréductible formée d’états
récurrents positifs, alors la chaine possède une et une seule probabilité
stationnaire π concentrée sur C . Elle est donnée par :
(
1
si x ∈ C,
E
x (Tx )
π(x) =
0
sinon.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.15
Théorème 11 : Soit (Ck )k∈K (K fini ou dénombrable) l’ensemble des
classes récurrentes irréductibles qui sont récurrentes positives
(c’est-à-dire formées d’états récurrents positifs). Notons πk (k ∈ K)
l’unique probabilité stationnaire concentrée sur Ck . Alors les
probabilités stationnaires de la chaine sont les mesures de la forme :
X
X
π=
ck πk , avec ck ≥ 0,
ck = 1.
k∈K
k∈K
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.16
IV. Convergence en loi vers la loi stationnaire
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.17
IV. Convergence en loi vers la loi stationnaire
Tous les résultats suivants sont admis.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.17
IV. Convergence en loi vers la loi stationnaire
Tous les résultats suivants sont admis.
Définition : Etant donné x ∈ E pour lequel Px (Tx < +∞) > 0
(c’est-à-dire il existe n ≥ 1 tel que pn (x, x) > 0), sa période dx est le
p.g.c.d. de {n : n ≥ 1, pn (x, x) > 0}.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.17
IV. Convergence en loi vers la loi stationnaire
Tous les résultats suivants sont admis.
Définition : Etant donné x ∈ E pour lequel Px (Tx < +∞) > 0
(c’est-à-dire il existe n ≥ 1 tel que pn (x, x) > 0), sa période dx est le
p.g.c.d. de {n : n ≥ 1, pn (x, x) > 0}.
Remarque :
1 ≤ dx ≤ min{n ≥ 1 : pn (x, x) > 0},
en particulier s’il existe x tel que p(x, x) > 0, alors dx = 1.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.17
IV. Convergence en loi vers la loi stationnaire
Tous les résultats suivants sont admis.
Définition : Etant donné x ∈ E pour lequel Px (Tx < +∞) > 0
(c’est-à-dire il existe n ≥ 1 tel que pn (x, x) > 0), sa période dx est le
p.g.c.d. de {n : n ≥ 1, pn (x, x) > 0}.
Remarque :
1 ≤ dx ≤ min{n ≥ 1 : pn (x, x) > 0},
en particulier s’il existe x tel que p(x, x) > 0, alors dx = 1.
Proposition 12 : Si x conduit à y alors dx = dy Par conséquent, tous les
éléments d’une chaine de Markov irréductible ont même période.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.17
IV. Convergence en loi vers la loi stationnaire
Tous les résultats suivants sont admis.
Définition : Etant donné x ∈ E pour lequel Px (Tx < +∞) > 0
(c’est-à-dire il existe n ≥ 1 tel que pn (x, x) > 0), sa période dx est le
p.g.c.d. de {n : n ≥ 1, pn (x, x) > 0}.
Remarque :
1 ≤ dx ≤ min{n ≥ 1 : pn (x, x) > 0},
en particulier s’il existe x tel que p(x, x) > 0, alors dx = 1.
Proposition 12 : Si x conduit à y alors dx = dy Par conséquent, tous les
éléments d’une chaine de Markov irréductible ont même période.
On dit que la chaine est périodique de période d si d > 1 et apériodique
si d = 1.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.17
Théorème 13 :
Soit (Xn )n∈N une chaine de Markov récurrente irréductible.
Si elle est récurrente nulle, alors :
lim pn (x, y) = lim Px (Xn = y) = 0.
n→+∞
n→+∞
Si elle est récurrente positive de loi stationnaire π :
soit elle est apériodique, et alors :
lim pn (x, y) = lim Px (Xn = y) = π(y).
n→+∞
n→+∞
soit elle est périodique de période d, et alors pour tout couple
x, y d’états de E , il existe un entier r (0 ≤ r < d) dépendant de x
et y , tel que :
Px (Xn = y) = 0 si n n′ est pas de la forme md + r avec m ∈ N
lim Px (Xmd+r = y) = d π(y).
m→+∞
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.18
Application : algorithme de Métropolis
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.19
Application : algorithme de Métropolis
But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,
mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peut
calculer car E est trop grand.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.19
Application : algorithme de Métropolis
But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,
mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peut
calculer car E est trop grand.
En fait on simule une chaine de Markov récurrente, irréductible et
apériodique (Xn )n≥0 de loi stationnaire π .
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.19
Application : algorithme de Métropolis
But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,
mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peut
calculer car E est trop grand.
En fait on simule une chaine de Markov récurrente, irréductible et
apériodique (Xn )n≥0 de loi stationnaire π .
On se donneP
une fonction de transition q symétrique
(q(x, y) ≥ 0,
y q(x, y) = 1, q(x, y) = q(y, x)) et irréductible.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.19
Application : algorithme de Métropolis
But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,
mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peut
calculer car E est trop grand.
En fait on simule une chaine de Markov récurrente, irréductible et
apériodique (Xn )n≥0 de loi stationnaire π .
On se donneP
une fonction de transition q symétrique
(q(x, y) ≥ 0,
y q(x, y) = 1, q(x, y) = q(y, x)) et irréductible.
On suppose que Xk = x,
- on tire y avec la probabilité q(x, ·)
π(y)
, 1) et Xn+1 = x avec
- on prend Xk+1 = y avec probabilité min( π(x)
π(y)
, 1).
probabilité 1 − min( π(x)
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.19
Application : algorithme de Métropolis
But : simuler une v.a. Z à valeurs dans E fini, de loi π(> 0) donnée,
mais π n’est connue qu’à un coefficient multiplicatif près qu’on ne peut
calculer car E est trop grand.
En fait on simule une chaine de Markov récurrente, irréductible et
apériodique (Xn )n≥0 de loi stationnaire π .
On se donneP
une fonction de transition q symétrique
(q(x, y) ≥ 0,
y q(x, y) = 1, q(x, y) = q(y, x)) et irréductible.
On suppose que Xk = x,
- on tire y avec la probabilité q(x, ·)
π(y)
, 1) et Xn+1 = x avec
- on prend Xk+1 = y avec probabilité min( π(x)
π(y)
, 1).
probabilité 1 − min( π(x)
Alors la probabilité π est réversible pour la chaine de Markov (Xn )n≥0 .
La chaine est irréductible, récurrente positive et apériodique. On prend
Z = Xn pour n "grand".
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.19
Application : recuit simulé
But : minimiser une fonction U définie sur un espace fini mais très
grand.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.20
Application : recuit simulé
But : minimiser une fonction U définie sur un espace fini mais très
grand.
Soit T > 0 (la température). On pose
πT (x) =
1
−
T
e U (x)
ZT
,
ZT constante de normalisation (inconnue).
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.20
Application : recuit simulé
But : minimiser une fonction U définie sur un espace fini mais très
grand.
Soit T > 0 (la température). On pose
πT (x) =
1
−
T
e U (x)
ZT
,
ZT constante de normalisation (inconnue).
Lorsque T tend vers 0, πT converge vers la loi uniforme sur l’ensemble
des points où U est minimum (minimum global).
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.20
Application : recuit simulé
But : minimiser une fonction U définie sur un espace fini mais très
grand.
Soit T > 0 (la température). On pose
πT (x) =
1
−
T
e U (x)
ZT
,
ZT constante de normalisation (inconnue).
Lorsque T tend vers 0, πT converge vers la loi uniforme sur l’ensemble
des points où U est minimum (minimum global).
On simule πT tout en faisant tendre la température vers 0 :
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.20
Application : recuit simulé
But : minimiser une fonction U définie sur un espace fini mais très
grand.
Soit T > 0 (la température). On pose
πT (x) =
1
−
T
e U (x)
ZT
,
ZT constante de normalisation (inconnue).
Lorsque T tend vers 0, πT converge vers la loi uniforme sur l’ensemble
des points où U est minimum (minimum global).
On simule πT tout en faisant tendre la température vers 0 :
on construit une chaine de Markov inhomogène en temps, telle que la
loi de Xn tende vers la loi uniforme sur l’ensemble des points où U est
minimum (minimum global).
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.20
On utilise l’algorithme de Métropolis mais en faisant varier la
température.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.21
On utilise l’algorithme de Métropolis mais en faisant varier la
température.
On suppose que Xk = x,
pour construire Xk+1 :
- on tire y avec la probabilité q(x, ·),
- si U (y) ≤ U (x) on prend Xk+1 = y ,
− T1 (U (y)−U (x))
- si U (y) > U (x) on prend Xk+1 = y avec probabilité e
− T1 (U (y)−U (x))
Xk+1 = x avec probabilité 1 − e
k
k
et
.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.21
On utilise l’algorithme de Métropolis mais en faisant varier la
température.
On suppose que Xk = x,
pour construire Xk+1 :
- on tire y avec la probabilité q(x, ·),
- si U (y) ≤ U (x) on prend Xk+1 = y ,
− T1 (U (y)−U (x))
- si U (y) > U (x) on prend Xk+1 = y avec probabilité e
− T1 (U (y)−U (x))
Xk+1 = x avec probabilité 1 − e
k
k
et
.
Le fait de se laisser la possibilité de prendre Xk+1 = y même si
U (y) > U (x) évite de rester piégé dans des points correspondant à des
minima locaux . . . mais il faut que la température Tk ne décroisse pas
trop vite vers 0.
Christiane Cocozza-Thivent, Université de Marne-la-Vallée – p.21
Téléchargement