Propriétés d`une matrice stochastique précisées par son algèbre 1

publicité
Propriétés d’une matrice stochastique précisées par
son algèbre
J. Parizet
15 janvier 2013
Une matrice stochastique est une matrice carrée réelle, à coefficients positifs
dont la somme des termes de toute ligne vaut un.
Si les coefficients d’une matrice stochastique sont strictement positifs, on dit que
la matrice est strictement stochastique.
Aprés avoir rappelé ses propriétés usuelles, vérifions que l’intervention de son algèbre conduit à d’autres propriétés.
1
1.1
Propriétés usuelles d’une matrice stochastique
Caractérisation
La matrice A d’ordre n exprime un endomorphisme f de Rn dans la base canonique. Alors
la matrice à coefficients positifs est stochastique ssi le vecteur ~u de composantes
(ui = 1) est vecteur propre pour la valeur propre un.
Il s’en suit: le produit de deux matrices stochastiques est une matrice stochastique.
Car la matrice produit a pour coefficients la somme des produits des coefficients
de l’une et de l’autre: les coefficients de la matrice produit sont positifs; de plus
f1 , f2 étant les endomorphismes de ces matrices
f1 ◦ f2 (~u) = f1 f2 (~u) = f1 (~u) = ~u.
et la somme des termes de toute ligne de la matrice produit vaut un.
1
1.2
Valeurs propres d’une matrice stochastique
Le spectre Sp(A) de A est l’ensemble de ses valeurs propres.
Le spectre d’une matrice stochastique est dans le disque unité. Car pour une
telle matrice de valeur propre λ de vecteur propre V(vi ), il vient à partir de
λ vi = ∑ j aij v j et pour |vi | = Max(|v j |)
|λ ||vi | 6 | ∑ j aij v j | 6 ∑ j aij |v j | 6 ∑ j aij |vi | = |vi |
d’où |λ | 6 1.
De |λ vi − aii vi | = | ∑ j6=i aij v j | on déduit
|λ − aii | |vi | 6 ∑ aij |vi | = (1 − aii )|vi |
j6=i
soit |λ
− aii | |vi | 6 (1 − aii )|vi |
donc |λ − aii | 6 1 − aii :
0
r
r
aij
q
1
Si aii = 0 il peut se trouver au moins un point de Sp(A) sur le cercle unité autre que
un. Distinguons le cas d’une matrice strictement stochastique du cas plus général.
1) Les valeurs propres d’une matrice strictement stochastique autres que un ont
un module strictement inférieur à un, et le sous-espace propre pour cette valeur
propre un est la droite dirigée par ~u.
Le premier point est clair car aucun des termes diagonaux de la matrice n’est nul.
Quant au second point, soit X(xi ) vecteur propre pour la valeur propre un. On peut
supposer X réel car si X est complexe, X est aussi vecteur propre pour 1, donc les
parties réelle et imaginaire de X aussi – qui sont réelles.
Soit xi le plus grand en module des |x j |; quitte à changer X en −X on peut supposer xi > 0. La relation exprimant que X est vecteur propre xi = ∑ j aij x j montre
que les x j précédents, situés dans [−xi , xi ], affectés des coefficients aij ont pour
barycentre xi . Ils sont donc confondus en ce point: ~x est proportionnel à ~u .
2) Les valeurs propres de module un d’une matrice stochastique sont racines entières de l’unité.
2
Une matrice strictement stochastique a 1 pour valeur propre (racine un-ième de
l’unité), mais n’a pas d’autres valeurs propres de module un. . .
Supposons que A ait une valeur propre λ 6= 1 de module 1, et partons de xi , i-ième
composante du vecteur propre X telle qu’elle majore en module les autres composantes du vecteur propre X: |x j | 6 |xi | pour tout j. X n’est pas nul, xi non plus:
en divisant X par xi , on peut prendre xi = 1.
a. Alors
. aii = 0 sinon λ = 1 ou |λ | < 1 selon §1.2.
. λ xi (= λ ) = ∑ j aij x j = ∑J1 aij x j en considérant l’ensemble J1 d’indices tels que
∀ j ∈ J1 : aij 6= 0 . Notons que J1 6= 0/ sinon λ = 0.
. ∑J1 aij x j est le barycentre des x j de modules au plus 1, à coefficients positifs:
puisque c’est le point λ sur le cercle unité nécessairement les x j sont confondus
en λ – sinon ce barycentre serait pour des raisons de convexité intérieur au disque
unité. Ainsi ∀ j ∈ J1 : x j = λ .
j
b. Considérons l’un des x j1 précédents valant λ ( j1 ∈ J1 ): λ x j1 (= λ 2 ) = ∑J2 a j1 x j ,
j
somme portant sur les j ∈ J2 (non vide) tels que a j1 6= 0. Par le même raisonnement (x j1 ) sur le cercle unité): ∀ j ∈ J2 , x j = λ x j1 = λ 2 ; il est clair que J1 ∩ J2
est vide car λ 6= 1. Si i ∈ J2 , xi (= 1) = λ x j1 = λ 2 : λ 2 = 1.
Excluons λ 2 = 1 (et λ = 1). Il est clair que J2 a au moins un élément.
c. Continuons en considérant x j2 ( j2 ∈ J2 ). Comme précédemment, soit J3 l’ensemj
j
ble des j tels que a j2 soit strictement positif. De λ x j2 = ∑J3 a j2 x j on déduit que
pour tout j de J3 : x j = λ x j2 = λ 3 . J2 ∩ J3 est vide car λ 2 6= 1. Si i ∈ J3 alors
λ 3 = 1.
En excluant ces cas (λ , λ 2 , λ 3 différents de un), puisque J3 a au moins un élément,
on peut poursuivre en considérant l’un de ses éléments x j3 et l’ensemble J4 des j
j
tels que a j3 > 0.
Comme ci-dessus, J3 n’a pas d’élément commun avec J2 , J3 selon les conditions
sur λ , et si i appartient à J3 , nécessairement λ 4 = 1.
En supposant λ 4 6= 1, on poursuit en construisant une suite de parties (Jk ) disjointes non vides de [1, 2, · · · , n] qui à partir d’un certain rang conduit à Jl contenant i d’où λ l = 1. Remarquons que la démarche conduit à un vecteur propre
de composantes les puissances de λ d’au plus l, avec éventuellement des zéros.
Exemple simple
 à partir d’une
 matrice de permutation
 
0
1 1/2 0 1/2
0



0
1
0
 a pour valeurs propres 1, j, j2 et le vecteur  1  est vecteur
La matrice 
0
 j
0
0
1 
0
1
0
0
j2
propre pour la valeur propre j. A partir de x2 les J2 , J3 et J4 se réduisent à un élément (3), (4), (2);
d’autre part les vecteurs ~i et ~u sont vecteurs propres pour la valeur propre 1.
3
1.3
L’ensemble des puissances entières d’une matrice stochastique est borné
L’ensemble des puissances des matrices stochastiques d’ordre n est borné dans Mn (R) muni par
exemple de la norme |A| = Max(|aij |) car toute puissance d’une matrice stochastique est une matrice stochastique dont les coefficients sont compris entre 0 et 1.
Les coefficients de la matrice stochastique A(aij ), compris entre 0 et 1, le sont plus précisément entre a1 =Min (aij ) et b1 =Max (aij ) et ceux de sa puissance p-ième entre les a p et b p correspondants.
(p)i (p)i
(p−1)i
Soient a j
les coefficients de Ak : a j = ∑akj ak
est compris entre ∑akj a p−1 et ∑akj b p−1 :
k
k
k
a p−1 6 a p 6 b p 6 b p−1 : la suite (a p ) est croissante et la suite (b p ) décroissante.
Remarquons que si b1 = 1 alors a1 = 0 mais a1 peut être nul sans que b1 vaille un.
2
Algèbre engendrée par A
On peut expliciter dans cette algèbre (en abrégé dans l’algèbre de A) toute puissance entière d’une
matrice stochastique et la limite éventuelle de la suite de ses puissances entières.
L’algèbre de A est de dimension le plus petit entier m tel que le système (I,A,A2 , · · · ,Am ) soit lié.
En exprimant Am à l’aide des autres termes du système (qui forment une base de l’algèbre) on
obtient le polynôme minimal de A, vérifiant M(A)= 0 comme le polynôme caractéristique de la
matrice (Cayley-Hamilton) qui en est un multiple.
De plus toute valeur propre de A est zéro de M: de A·X= λ X on déduit M(A)·X= M(λ )X et on
conclut puisque le vecteur propre n’est pas nul.
Le polynôme minimal de A est de la forme M=∏i (X − λi )ki où les λi sont les valeurs propres de
A, zéros d’ordre au plus ki de son polynôme caractéristique Pc .
La décomposition de la fraction rationnelle 1/M sous la forme
Pi
1
=∑
où Pi est un polynôme de degré au plus ki − 1
ki
M
i (X − λi )
donne avec Qi quotient de M par (X−λi )ki : 1 = ∑i Pi Qi d’où avec πλi = Pi Qi
1 = ∑i , en particulier πλi (λi ) = 1. Notons I= ∑i πλi (A).
Si λ est zéro simple de M, πλ = Qλ /Qλ (λ ).
Le polynôme πλi πλ j est, pour i 6= j, multiple de M: πλi (A) · πλ j (A) = 0. Et à partir de l’expression
précédente de I: πλ2i (A) = πλi (A) = 0.
A partir de cette expression dont on multiplie les deux membres par A, avec pour chaque i
A= λi I + (A − λi I)
A = ∑ λi πλi (A) + νλi (A) avec νλi (A) = πλi (A) · (A − λi I)
i
Puisque ki est l’ordre du zéro λi de M : νλki (A) = 0. Pour i et j différents, νλki (A) · νλki (A) = 0.
i
i
j
n exprimé par A, l’espace s’exprime comme somme directe
Avec l’endomorphisme f de RL
Rn = i Im πλi ( f ) : X= I · X = ∑i πλi (A) · X.
4
L
πλi ( f ) est la projection sur Im πλi ( f ) selon la direction de la somme directe j6=i Im πλ j ( f ) .
On retrouve la décomposition de Dunford de A en somme commutative d’une matrice diagonalisable et d’une matrice nilpotente:
A= ∑λi πλi (A) + ∑νλi (A).
i
i
Car en considérant les valeurs propres et vecteurs propres correspondant de A:
. Si A·X= λ X, alors Ak ·X= λ k X et πλ (A) · X = πλ (λ )X = X:
tout vecteur propre pour la valeur propre λ est vecteur de Im πλ ( f ) .
. Lorsque λ est zéro simple du polynôme minimal, tout vecteur de Im πλ ( f ) est vecteur propre
pour λ : de πλ (A) · X = X on déduit A · X = (A − λ I + λ I) · πλ (A) · X = M(A) · X + λ πλ (A) · X
soit A·X= λ X.
k
. k étant le plus grand des ordre de multiplicité des zéros λi de M, il est clair que ∑i νλi (A) est
nul.
. Notons A0 = ∑i λi πλi (A). Alors pour la valeur propre λk
A0 − λk I = ∑µik πλi (A) avec µik = λi − λk .
i
Le produit pour toutes les valeurs propres de A, compte-tenu des produits πλi (A) · πλ j (A) (1
lorsque i et j sont égaux, 0 sinon), estnul
∏(A0 − λk I) = ∑ ∏ µik πλi (A) = 0 puisque µii est nul.
k
i
k
Il s’ensuit que A0 est diagonalisable car ses valeurs propres sont zéros simples de son polynôme
minimal.
De l’expression hde A on déduit pour tout naturel p supérieur au plus grandi des (ki )
A p = ∑ λip I + C1p λ p−1 (A − λi I) + · · · + Ckpi −1 λipki +1 (A − λi I)ki −1 πλi (A)
(1)
i
3
Comportement de la suite (A p) à l’infini
Étudions pour la matrice stochastique A le comportement de (A p ) selon l’ordre de multiplicité des
zéros du polynôme minimal de A et selon leurs modules (ou valeurs absolues) en distinguant le
cas d’une matrice strictement stochastique de celui d’une matrice stochastique.
3.1
Cas d’une matrice strictement stochastique
La matrice A admet la valeur propre 1 et des valeurs propres strictement inférieures à 1 en module: dans l’expression (1) de A p on s’aperçoit que la contribution de celles-ci tend vers 0 lorsque
dans
p tend vers l’infini. Si le zéro 1 du polynôme minimal est d’ordre k > 1, la présence de Ck−1
p
la contribution de cette valeur propre dans A p montre que A p n’est pas bornée lorsque p tend vers
l’infini:
la valeur propre un d’une matrice strictement stochastique est zéro simple de son polynôme minimal.
Dans ce cas d’une matrice strictement stochastique lorsque p tend vers l’infini A p tend vers π1 (A)
qui est, en introduisant le quotient Qi du polynôme minimal par (X−1),
5
A p −−−→ L = π1 (A) =
p→∞
Q1 (A)
.
Q1 (1)
Propriétés de cette limite
• L est une matrice strictement stochastique:
− la somme des coefficients de ses lignes sont les limites des sommes des lignes correspondantes
de A p constamment égales à 1,
− les coefficients de A p compris entre a p (suite croissante) et b p (suite décroissante) ont pour
limites ceux de L, compris entre les limites des suites (a p ) et (b p ), qui sont dans l’intervalle ]0 , 1[,
• L est idempotente car L= π1 (A), idempotente: L2 =L,
• aucun coefficient de L (strictement stochastique) n’est nul: L= π1 (A) de colonnes des vecteurs
propres de A toutes proportionnelles à ~u et les lignes de L sont identiques.
Exemple 

0.8 0.1 0.1
Soit A= 0.2 0.7 0.1, de polynôme caractéristique
0.3 0.1 0.6
Pc = (λ − 1)(λ 2 − 1.1 λ + 0.3), qui est aussi son polynôme
 minimal:

0.55 0.25 0.2
2
A − 1.1 A + 0.3 I
soit 0.55 0.25 0.2
L=
0.2
0.55 0.25 0.2
Remarque. Si a1 = b1 , les coefficients de A valent 1/n: A2 =A=A p et c’est L.
3.2
Cas d’une matrice non strictement stochastique
Il convient de distinguer divers cas, selon les modules des valeurs propres de A.
1. Les valeurs propres de A sont 1 et les autres de modules strictement inférieurs à un.
Selon l’expression (1) et le raisonnement en §2.2.1, la suite (A p ) converge vers la matrice stochastique L.
− Lorsque L est strictement stochastique, les plus petit et plus grand de ses éléments al et bl sont
intérieurs à [0,1]: à partir d’un certain rang les a p , b p vérifient 0 < a p 6 al 6 bl < b p < 1 donc A p
est strictement stochastique
ainsi que

les puissances d’ordre supérieur.
0
1/2 1/2
0
1/4 de polynôme caractéristique (et minimal)
Par exemple A= 3/4
1/8 7/8
0
p
Pc =(λ − 1)(λ 2 + λ + 11/32):
(A

) a pour limite

1/3 2/5 4/15
7/16 7/16 1/8
L= 1/3 2/5 4/15 et A2 =  1/32 19/32 3/8  est strictement stochastique.
1/3 2/5 4/15
21/32 1/16 9/32
− Mais si L n’est pas strictement stochastique, alors al = 0 et aucune puissance de A n’est strictement stochastique.
2. Les valeurs propres de A sont 1, certaines racines entières de l’unité, et d’autres de modules
stictement inférieurs à un.
• Les valeurs propres de module un sont zéros simples du polynôme minimal de A.
C’est le cas de 1.Soit λ une valeur propre racine entière de l’unité, zéro d’ordre k du polynôme
minimal de A. Supposons k > 1.
6
Puisque πλ (A − λ I)k−1 = νλ (A)k−1 n’est pas nul il existe un vecteur ~x non nul appartenant à
Im(νλk−1 ( f )) et un vecteur ~y de Im (νλk−2 ( f )) (ou de Im (νλ ( f )) si k = 2) tel que ~x = νλ ( f )~y.
Alors avec X et Y colonnes des composantes de ~x et ~y, selon l’expression (1) de A p à partir de son
polynôme minimal, quelque soit le naturel p
A p · Y = [λ p I + pλ p−1 (A − λ I)]π(A) · Y = λ p Y + pλ p−1 X
car π(A) · Y =Y et π(A) · X =X puisque Im (νλ ( f ) ⊂Im (πλ ( f )
Prenons pour norme dans Rn ||V|| = Max (|vi |) alors la norme de la matrice stochastique A d’ordre
n définie par ||A|| = Max ||AV̇ ||, ||V || = 1) est 1 en considérant le vecteur ~u de norme 1.
L’inégalité triangulaire appliquée à pλ p−1 X =A p · Y − λ p Y s’écrit
p||X|| 6 ||A p · Y|| + ||Y|| 6 2||Y||
ce qui conduit à une contradiction pour p assez grand (X et Y ne sont pas nuls): nécessairement
les valeurs propres de toute matrice stochastique de module un sont zéros simples de son polynôme
minimal.
• Il s’en suit que la suite (A p ) admet des suites extraites convergentes.
Notons λα les valeurs propres de A racines de l’unité et λα 0 les autres valeurs propres. Soit q la
somme des entiers correspondant aux λα (∀α; λαq = 1); selon (1)
A pq = ∑α πλα (A)
h
+ ∑α 0 λαpq0 I + C1pq λ pq−1 (A − λα 0 I) + · · ·
i
0
k0 −1 pq−kα0 +1
(A − λα0 I)kα −1 πα0 (A)
+ C pqα λi
0
Lorsque p tend vers l’infini les termes en λ α −hChpq tendent vers zéro et
A pq −−−→ ∑α πλα (A) .
p→∞
Et pour h entier inférieur à q: A pq+h −−−→ Ah ∑α πλα (A).
p→∞
Ces q suites extraites convergent vers des matrices stochastiques.
Exemple de la matrice d’Ehrenfest
Il s’agit de la matrice


0
1
0
0
0
1/4 0 3/4 0
0 



0
1/2
0
1/2
0 
A= 

 0
0 3/4 0 1/4
0
0
0
1
0
2
2
2
de polynômes caractéristique et minimal P= X (X − 1)(X − 1/4), M= X(X2 − 1)(X2 − 1/4).
Puisque les zéros de M sont simples, en notant Qλ le quotient de M par (X − λ ) :
Q−1 (A) 2
Q1 (A) 2
= A(A + I)(A2 − 1/4) , π−1 (A) =
= A(A − I)(A2 − 1/4),
π1 (A) =
Q1 (1)
3
Q−1 (1)
3
8
8
2
2
π1/2 (A) = − A(A − I)(A + 1/2), π−1/2 (A) = − A(A − I)(A − 1/2).
3
3
Lorsque p tend vers l’infini:
I
I
A2p+1 → π1 (A) − π−1 (A) = 34 A A2 − , A2p → π1 (A) + π−1 (A) = 34 A2 A2 − .
4
4
7
3.3
La suite (A p ) converge au sens de Cesàro vers π1 (A)
u1 + u2 + · · · + u p , suite (ou moyenne) de
De la suite réelle (u p ) on déduit la suite C(u p ) =
p
Cesàro associée à la suite (u p ). Si la suite (u p ) converge, la suite (C(u p )) converge vers la même
limite, mais la réciproque est fausse: (u p = (−1) p ) est le contre exemple classique.
Lorsque la suite (C(u p )) converge on dit que (u p ) converge au sens de Cesàro.
C’est le cas d’une matrice stochastique. A étant une telle matrice, les zéros de son polynôme
minimal sont 1 (zéro simple), éventuellement des zéros simples λα de module 1 (dont peut-être
−1) et enfin sans doute des zéros µβ (qui peuvent être multiples) de modules strictement inférieurs
à 1. Exprimons A selon
h
i
A= π1 (A) + ∑λα πλα (A)+B avec B= ∑ µβ I + (A − µβ I) πµβ (A)
α
β
. La suite π1 (A) p est constante, et sa suite de Cesàro associée aussi et se réduit à π1 (A).
. La suite (B p ) tend vers zéro car pour tout β , |µβ | < 1 et la suite de Cesàro associée tend vers
zéro.
. Considérons λα , racine q−ième de l’unité: λα + λα2 + · · · λαq = 0 et avec le reste r de la division
de p par q: Cλαp = (λα + λα2 + · · · λαr )/p de module inférieur à r/p < q/p. Et C(λαp ) → 0 pour p
infini: la contribution des termes en les λα est nulle dans le passage à la limite de C(A p ).
Ainsi la limite pour p infini de C(A p ) est π1 (A): π1 (A) est stochastique puisque les moyennes de
Cesàro des A p le sont.
Ce n’est pas un vecteur propre....
8
Téléchargement