Propriétés d’une matrice stochastique précisées par son algèbre J. Parizet 15 janvier 2013 Une matrice stochastique est une matrice carrée réelle, à coefficients positifs dont la somme des termes de toute ligne vaut un. Si les coefficients d’une matrice stochastique sont strictement positifs, on dit que la matrice est strictement stochastique. Aprés avoir rappelé ses propriétés usuelles, vérifions que l’intervention de son algèbre conduit à d’autres propriétés. 1 1.1 Propriétés usuelles d’une matrice stochastique Caractérisation La matrice A d’ordre n exprime un endomorphisme f de Rn dans la base canonique. Alors la matrice à coefficients positifs est stochastique ssi le vecteur ~u de composantes (ui = 1) est vecteur propre pour la valeur propre un. Il s’en suit: le produit de deux matrices stochastiques est une matrice stochastique. Car la matrice produit a pour coefficients la somme des produits des coefficients de l’une et de l’autre: les coefficients de la matrice produit sont positifs; de plus f1 , f2 étant les endomorphismes de ces matrices f1 ◦ f2 (~u) = f1 f2 (~u) = f1 (~u) = ~u. et la somme des termes de toute ligne de la matrice produit vaut un. 1 1.2 Valeurs propres d’une matrice stochastique Le spectre Sp(A) de A est l’ensemble de ses valeurs propres. Le spectre d’une matrice stochastique est dans le disque unité. Car pour une telle matrice de valeur propre λ de vecteur propre V(vi ), il vient à partir de λ vi = ∑ j aij v j et pour |vi | = Max(|v j |) |λ ||vi | 6 | ∑ j aij v j | 6 ∑ j aij |v j | 6 ∑ j aij |vi | = |vi | d’où |λ | 6 1. De |λ vi − aii vi | = | ∑ j6=i aij v j | on déduit |λ − aii | |vi | 6 ∑ aij |vi | = (1 − aii )|vi | j6=i soit |λ − aii | |vi | 6 (1 − aii )|vi | donc |λ − aii | 6 1 − aii : 0 r r aij q 1 Si aii = 0 il peut se trouver au moins un point de Sp(A) sur le cercle unité autre que un. Distinguons le cas d’une matrice strictement stochastique du cas plus général. 1) Les valeurs propres d’une matrice strictement stochastique autres que un ont un module strictement inférieur à un, et le sous-espace propre pour cette valeur propre un est la droite dirigée par ~u. Le premier point est clair car aucun des termes diagonaux de la matrice n’est nul. Quant au second point, soit X(xi ) vecteur propre pour la valeur propre un. On peut supposer X réel car si X est complexe, X est aussi vecteur propre pour 1, donc les parties réelle et imaginaire de X aussi – qui sont réelles. Soit xi le plus grand en module des |x j |; quitte à changer X en −X on peut supposer xi > 0. La relation exprimant que X est vecteur propre xi = ∑ j aij x j montre que les x j précédents, situés dans [−xi , xi ], affectés des coefficients aij ont pour barycentre xi . Ils sont donc confondus en ce point: ~x est proportionnel à ~u . 2) Les valeurs propres de module un d’une matrice stochastique sont racines entières de l’unité. 2 Une matrice strictement stochastique a 1 pour valeur propre (racine un-ième de l’unité), mais n’a pas d’autres valeurs propres de module un. . . Supposons que A ait une valeur propre λ 6= 1 de module 1, et partons de xi , i-ième composante du vecteur propre X telle qu’elle majore en module les autres composantes du vecteur propre X: |x j | 6 |xi | pour tout j. X n’est pas nul, xi non plus: en divisant X par xi , on peut prendre xi = 1. a. Alors . aii = 0 sinon λ = 1 ou |λ | < 1 selon §1.2. . λ xi (= λ ) = ∑ j aij x j = ∑J1 aij x j en considérant l’ensemble J1 d’indices tels que ∀ j ∈ J1 : aij 6= 0 . Notons que J1 6= 0/ sinon λ = 0. . ∑J1 aij x j est le barycentre des x j de modules au plus 1, à coefficients positifs: puisque c’est le point λ sur le cercle unité nécessairement les x j sont confondus en λ – sinon ce barycentre serait pour des raisons de convexité intérieur au disque unité. Ainsi ∀ j ∈ J1 : x j = λ . j b. Considérons l’un des x j1 précédents valant λ ( j1 ∈ J1 ): λ x j1 (= λ 2 ) = ∑J2 a j1 x j , j somme portant sur les j ∈ J2 (non vide) tels que a j1 6= 0. Par le même raisonnement (x j1 ) sur le cercle unité): ∀ j ∈ J2 , x j = λ x j1 = λ 2 ; il est clair que J1 ∩ J2 est vide car λ 6= 1. Si i ∈ J2 , xi (= 1) = λ x j1 = λ 2 : λ 2 = 1. Excluons λ 2 = 1 (et λ = 1). Il est clair que J2 a au moins un élément. c. Continuons en considérant x j2 ( j2 ∈ J2 ). Comme précédemment, soit J3 l’ensemj j ble des j tels que a j2 soit strictement positif. De λ x j2 = ∑J3 a j2 x j on déduit que pour tout j de J3 : x j = λ x j2 = λ 3 . J2 ∩ J3 est vide car λ 2 6= 1. Si i ∈ J3 alors λ 3 = 1. En excluant ces cas (λ , λ 2 , λ 3 différents de un), puisque J3 a au moins un élément, on peut poursuivre en considérant l’un de ses éléments x j3 et l’ensemble J4 des j j tels que a j3 > 0. Comme ci-dessus, J3 n’a pas d’élément commun avec J2 , J3 selon les conditions sur λ , et si i appartient à J3 , nécessairement λ 4 = 1. En supposant λ 4 6= 1, on poursuit en construisant une suite de parties (Jk ) disjointes non vides de [1, 2, · · · , n] qui à partir d’un certain rang conduit à Jl contenant i d’où λ l = 1. Remarquons que la démarche conduit à un vecteur propre de composantes les puissances de λ d’au plus l, avec éventuellement des zéros. Exemple simple à partir d’une matrice de permutation 0 1 1/2 0 1/2 0 0 1 0 a pour valeurs propres 1, j, j2 et le vecteur 1 est vecteur La matrice 0 j 0 0 1 0 1 0 0 j2 propre pour la valeur propre j. A partir de x2 les J2 , J3 et J4 se réduisent à un élément (3), (4), (2); d’autre part les vecteurs ~i et ~u sont vecteurs propres pour la valeur propre 1. 3 1.3 L’ensemble des puissances entières d’une matrice stochastique est borné L’ensemble des puissances des matrices stochastiques d’ordre n est borné dans Mn (R) muni par exemple de la norme |A| = Max(|aij |) car toute puissance d’une matrice stochastique est une matrice stochastique dont les coefficients sont compris entre 0 et 1. Les coefficients de la matrice stochastique A(aij ), compris entre 0 et 1, le sont plus précisément entre a1 =Min (aij ) et b1 =Max (aij ) et ceux de sa puissance p-ième entre les a p et b p correspondants. (p)i (p)i (p−1)i Soient a j les coefficients de Ak : a j = ∑akj ak est compris entre ∑akj a p−1 et ∑akj b p−1 : k k k a p−1 6 a p 6 b p 6 b p−1 : la suite (a p ) est croissante et la suite (b p ) décroissante. Remarquons que si b1 = 1 alors a1 = 0 mais a1 peut être nul sans que b1 vaille un. 2 Algèbre engendrée par A On peut expliciter dans cette algèbre (en abrégé dans l’algèbre de A) toute puissance entière d’une matrice stochastique et la limite éventuelle de la suite de ses puissances entières. L’algèbre de A est de dimension le plus petit entier m tel que le système (I,A,A2 , · · · ,Am ) soit lié. En exprimant Am à l’aide des autres termes du système (qui forment une base de l’algèbre) on obtient le polynôme minimal de A, vérifiant M(A)= 0 comme le polynôme caractéristique de la matrice (Cayley-Hamilton) qui en est un multiple. De plus toute valeur propre de A est zéro de M: de A·X= λ X on déduit M(A)·X= M(λ )X et on conclut puisque le vecteur propre n’est pas nul. Le polynôme minimal de A est de la forme M=∏i (X − λi )ki où les λi sont les valeurs propres de A, zéros d’ordre au plus ki de son polynôme caractéristique Pc . La décomposition de la fraction rationnelle 1/M sous la forme Pi 1 =∑ où Pi est un polynôme de degré au plus ki − 1 ki M i (X − λi ) donne avec Qi quotient de M par (X−λi )ki : 1 = ∑i Pi Qi d’où avec πλi = Pi Qi 1 = ∑i , en particulier πλi (λi ) = 1. Notons I= ∑i πλi (A). Si λ est zéro simple de M, πλ = Qλ /Qλ (λ ). Le polynôme πλi πλ j est, pour i 6= j, multiple de M: πλi (A) · πλ j (A) = 0. Et à partir de l’expression précédente de I: πλ2i (A) = πλi (A) = 0. A partir de cette expression dont on multiplie les deux membres par A, avec pour chaque i A= λi I + (A − λi I) A = ∑ λi πλi (A) + νλi (A) avec νλi (A) = πλi (A) · (A − λi I) i Puisque ki est l’ordre du zéro λi de M : νλki (A) = 0. Pour i et j différents, νλki (A) · νλki (A) = 0. i i j n exprimé par A, l’espace s’exprime comme somme directe Avec l’endomorphisme f de RL Rn = i Im πλi ( f ) : X= I · X = ∑i πλi (A) · X. 4 L πλi ( f ) est la projection sur Im πλi ( f ) selon la direction de la somme directe j6=i Im πλ j ( f ) . On retrouve la décomposition de Dunford de A en somme commutative d’une matrice diagonalisable et d’une matrice nilpotente: A= ∑λi πλi (A) + ∑νλi (A). i i Car en considérant les valeurs propres et vecteurs propres correspondant de A: . Si A·X= λ X, alors Ak ·X= λ k X et πλ (A) · X = πλ (λ )X = X: tout vecteur propre pour la valeur propre λ est vecteur de Im πλ ( f ) . . Lorsque λ est zéro simple du polynôme minimal, tout vecteur de Im πλ ( f ) est vecteur propre pour λ : de πλ (A) · X = X on déduit A · X = (A − λ I + λ I) · πλ (A) · X = M(A) · X + λ πλ (A) · X soit A·X= λ X. k . k étant le plus grand des ordre de multiplicité des zéros λi de M, il est clair que ∑i νλi (A) est nul. . Notons A0 = ∑i λi πλi (A). Alors pour la valeur propre λk A0 − λk I = ∑µik πλi (A) avec µik = λi − λk . i Le produit pour toutes les valeurs propres de A, compte-tenu des produits πλi (A) · πλ j (A) (1 lorsque i et j sont égaux, 0 sinon), estnul ∏(A0 − λk I) = ∑ ∏ µik πλi (A) = 0 puisque µii est nul. k i k Il s’ensuit que A0 est diagonalisable car ses valeurs propres sont zéros simples de son polynôme minimal. De l’expression hde A on déduit pour tout naturel p supérieur au plus grandi des (ki ) A p = ∑ λip I + C1p λ p−1 (A − λi I) + · · · + Ckpi −1 λipki +1 (A − λi I)ki −1 πλi (A) (1) i 3 Comportement de la suite (A p) à l’infini Étudions pour la matrice stochastique A le comportement de (A p ) selon l’ordre de multiplicité des zéros du polynôme minimal de A et selon leurs modules (ou valeurs absolues) en distinguant le cas d’une matrice strictement stochastique de celui d’une matrice stochastique. 3.1 Cas d’une matrice strictement stochastique La matrice A admet la valeur propre 1 et des valeurs propres strictement inférieures à 1 en module: dans l’expression (1) de A p on s’aperçoit que la contribution de celles-ci tend vers 0 lorsque dans p tend vers l’infini. Si le zéro 1 du polynôme minimal est d’ordre k > 1, la présence de Ck−1 p la contribution de cette valeur propre dans A p montre que A p n’est pas bornée lorsque p tend vers l’infini: la valeur propre un d’une matrice strictement stochastique est zéro simple de son polynôme minimal. Dans ce cas d’une matrice strictement stochastique lorsque p tend vers l’infini A p tend vers π1 (A) qui est, en introduisant le quotient Qi du polynôme minimal par (X−1), 5 A p −−−→ L = π1 (A) = p→∞ Q1 (A) . Q1 (1) Propriétés de cette limite • L est une matrice strictement stochastique: − la somme des coefficients de ses lignes sont les limites des sommes des lignes correspondantes de A p constamment égales à 1, − les coefficients de A p compris entre a p (suite croissante) et b p (suite décroissante) ont pour limites ceux de L, compris entre les limites des suites (a p ) et (b p ), qui sont dans l’intervalle ]0 , 1[, • L est idempotente car L= π1 (A), idempotente: L2 =L, • aucun coefficient de L (strictement stochastique) n’est nul: L= π1 (A) de colonnes des vecteurs propres de A toutes proportionnelles à ~u et les lignes de L sont identiques. Exemple 0.8 0.1 0.1 Soit A= 0.2 0.7 0.1, de polynôme caractéristique 0.3 0.1 0.6 Pc = (λ − 1)(λ 2 − 1.1 λ + 0.3), qui est aussi son polynôme minimal: 0.55 0.25 0.2 2 A − 1.1 A + 0.3 I soit 0.55 0.25 0.2 L= 0.2 0.55 0.25 0.2 Remarque. Si a1 = b1 , les coefficients de A valent 1/n: A2 =A=A p et c’est L. 3.2 Cas d’une matrice non strictement stochastique Il convient de distinguer divers cas, selon les modules des valeurs propres de A. 1. Les valeurs propres de A sont 1 et les autres de modules strictement inférieurs à un. Selon l’expression (1) et le raisonnement en §2.2.1, la suite (A p ) converge vers la matrice stochastique L. − Lorsque L est strictement stochastique, les plus petit et plus grand de ses éléments al et bl sont intérieurs à [0,1]: à partir d’un certain rang les a p , b p vérifient 0 < a p 6 al 6 bl < b p < 1 donc A p est strictement stochastique ainsi que les puissances d’ordre supérieur. 0 1/2 1/2 0 1/4 de polynôme caractéristique (et minimal) Par exemple A= 3/4 1/8 7/8 0 p Pc =(λ − 1)(λ 2 + λ + 11/32): (A ) a pour limite 1/3 2/5 4/15 7/16 7/16 1/8 L= 1/3 2/5 4/15 et A2 = 1/32 19/32 3/8 est strictement stochastique. 1/3 2/5 4/15 21/32 1/16 9/32 − Mais si L n’est pas strictement stochastique, alors al = 0 et aucune puissance de A n’est strictement stochastique. 2. Les valeurs propres de A sont 1, certaines racines entières de l’unité, et d’autres de modules stictement inférieurs à un. • Les valeurs propres de module un sont zéros simples du polynôme minimal de A. C’est le cas de 1.Soit λ une valeur propre racine entière de l’unité, zéro d’ordre k du polynôme minimal de A. Supposons k > 1. 6 Puisque πλ (A − λ I)k−1 = νλ (A)k−1 n’est pas nul il existe un vecteur ~x non nul appartenant à Im(νλk−1 ( f )) et un vecteur ~y de Im (νλk−2 ( f )) (ou de Im (νλ ( f )) si k = 2) tel que ~x = νλ ( f )~y. Alors avec X et Y colonnes des composantes de ~x et ~y, selon l’expression (1) de A p à partir de son polynôme minimal, quelque soit le naturel p A p · Y = [λ p I + pλ p−1 (A − λ I)]π(A) · Y = λ p Y + pλ p−1 X car π(A) · Y =Y et π(A) · X =X puisque Im (νλ ( f ) ⊂Im (πλ ( f ) Prenons pour norme dans Rn ||V|| = Max (|vi |) alors la norme de la matrice stochastique A d’ordre n définie par ||A|| = Max ||AV̇ ||, ||V || = 1) est 1 en considérant le vecteur ~u de norme 1. L’inégalité triangulaire appliquée à pλ p−1 X =A p · Y − λ p Y s’écrit p||X|| 6 ||A p · Y|| + ||Y|| 6 2||Y|| ce qui conduit à une contradiction pour p assez grand (X et Y ne sont pas nuls): nécessairement les valeurs propres de toute matrice stochastique de module un sont zéros simples de son polynôme minimal. • Il s’en suit que la suite (A p ) admet des suites extraites convergentes. Notons λα les valeurs propres de A racines de l’unité et λα 0 les autres valeurs propres. Soit q la somme des entiers correspondant aux λα (∀α; λαq = 1); selon (1) A pq = ∑α πλα (A) h + ∑α 0 λαpq0 I + C1pq λ pq−1 (A − λα 0 I) + · · · i 0 k0 −1 pq−kα0 +1 (A − λα0 I)kα −1 πα0 (A) + C pqα λi 0 Lorsque p tend vers l’infini les termes en λ α −hChpq tendent vers zéro et A pq −−−→ ∑α πλα (A) . p→∞ Et pour h entier inférieur à q: A pq+h −−−→ Ah ∑α πλα (A). p→∞ Ces q suites extraites convergent vers des matrices stochastiques. Exemple de la matrice d’Ehrenfest Il s’agit de la matrice 0 1 0 0 0 1/4 0 3/4 0 0 0 1/2 0 1/2 0 A= 0 0 3/4 0 1/4 0 0 0 1 0 2 2 2 de polynômes caractéristique et minimal P= X (X − 1)(X − 1/4), M= X(X2 − 1)(X2 − 1/4). Puisque les zéros de M sont simples, en notant Qλ le quotient de M par (X − λ ) : Q−1 (A) 2 Q1 (A) 2 = A(A + I)(A2 − 1/4) , π−1 (A) = = A(A − I)(A2 − 1/4), π1 (A) = Q1 (1) 3 Q−1 (1) 3 8 8 2 2 π1/2 (A) = − A(A − I)(A + 1/2), π−1/2 (A) = − A(A − I)(A − 1/2). 3 3 Lorsque p tend vers l’infini: I I A2p+1 → π1 (A) − π−1 (A) = 34 A A2 − , A2p → π1 (A) + π−1 (A) = 34 A2 A2 − . 4 4 7 3.3 La suite (A p ) converge au sens de Cesàro vers π1 (A) u1 + u2 + · · · + u p , suite (ou moyenne) de De la suite réelle (u p ) on déduit la suite C(u p ) = p Cesàro associée à la suite (u p ). Si la suite (u p ) converge, la suite (C(u p )) converge vers la même limite, mais la réciproque est fausse: (u p = (−1) p ) est le contre exemple classique. Lorsque la suite (C(u p )) converge on dit que (u p ) converge au sens de Cesàro. C’est le cas d’une matrice stochastique. A étant une telle matrice, les zéros de son polynôme minimal sont 1 (zéro simple), éventuellement des zéros simples λα de module 1 (dont peut-être −1) et enfin sans doute des zéros µβ (qui peuvent être multiples) de modules strictement inférieurs à 1. Exprimons A selon h i A= π1 (A) + ∑λα πλα (A)+B avec B= ∑ µβ I + (A − µβ I) πµβ (A) α β . La suite π1 (A) p est constante, et sa suite de Cesàro associée aussi et se réduit à π1 (A). . La suite (B p ) tend vers zéro car pour tout β , |µβ | < 1 et la suite de Cesàro associée tend vers zéro. . Considérons λα , racine q−ième de l’unité: λα + λα2 + · · · λαq = 0 et avec le reste r de la division de p par q: Cλαp = (λα + λα2 + · · · λαr )/p de module inférieur à r/p < q/p. Et C(λαp ) → 0 pour p infini: la contribution des termes en les λα est nulle dans le passage à la limite de C(A p ). Ainsi la limite pour p infini de C(A p ) est π1 (A): π1 (A) est stochastique puisque les moyennes de Cesàro des A p le sont. Ce n’est pas un vecteur propre.... 8