Matrices échelonnées

publicité
Matrices échelonnées
Soit K un corps commutatif ; pour m, n ∈ N, soit Mm,n (K) le K -espace vectoriel des matrices
à coecients dans K à m lignes et n colonnes. Pour m, n, p ∈ N le produit des matrices dénit
une application bilinéaire :
Mm,n (K) × Mn,p (K) −→ Mm,p (K)
En particulier, Mn (K) = Mn,n (K) est un anneau dont le groupe des éléments inversibles est
GLn (K).
Le groupe GLn (K) opère à droite sur l'espace Mm,n (K) et à gauche sur l'espace Mn,m (K).
On identie l'espace K m à l'espace des matrices-colonnes Mm,1 (K) et l'espace dual (K n )? à
l'espace M1,n (K) des matrices-lignes.
Pour M ∈ Mm,n (K), on désignera par Li (M ) ∈ (K n )? (1 ≤ i ≤ m) la ième ligne de M et par
Cj (M ) ∈ K m (1 ≤ j ≤ n) la j ème colonne de M .
On étudiera ici la forme échelonnée en colonnes ; la forme échelonnée en lignes s'obtient au moyen
de la transposition :
1
Mm,n (K)
−→
M
−→
Mn,m (K)
t
M
Matrices élémentaires et matrices diagonales
1.1
Matrices élémentaires
On considère la base canonique (Ei,j )1≤,i,j≤n de Mn (K) ; on a :
Ei,j .Ek,l = δj,k Ei,l
Une matrice élémentaire est une matrice carrée de la forme :

(n)
Xi,j (s)
= Id + sEi,j






=






1 ···
..
.
0
..
.
0
..
.
...
...
...
0 ···
0 ···
..
.
...
0 ···
..
.
s
0 ···
1 ···
0 ···
0 ···
..
.
...
...
..
.
..
.

..
.
...
···
. . . ..
.
...
1 ···
..
.
0
...











.. 
. 
1
avec 1 ≤ i 6= j ≤ n. Ainsi, les coecients de la diagonale sont égaux à 1, s est situé à la position
(i, j), tous les autres coecients sont nuls.
On a alors, pour 1 ≤ i 6= j ≤ n et k 6= i :
(
(n)
Li (Xi,j (s) M ) = Li (M ) + sLj (M )
(n)
Lk (Xi,j (s) M ) =
Lk (M )
et pour 1 ≤ i 6= j ≤ n et k 6= j :
(
(n)
Cj (M Xi,j (s)) = sCi (M ) + Cj (M )
(n)
Ck (M Xi,j (s)) =
Ck (M )
(n)
Ainsi, la multiplication de M à gauche (resp. à droite) par une matrice Xi,j
(s) revient à ajouter
à une ligne de M (resp. à une colonne de M ) un multiple d'une autre ligne (resp. colonne) de
M : Li
Li + sLj (resp. Cj
Cj + sCi ).
En particulier, pour 1 ≤ i 6= j ≤ n, posons :
(n)
(n)
(n)
(n)
Pi,j = Xi,j (1).Xj,i (−1).Xi,j (1)
On a alors, pour 1 ≤ i 6= j ≤ n et k 6= i, j :

(n)

 Li (Pi,j M ) = Lj (M )
(n)
Lj (Pi,j M ) = −Li (M )


(n)
Lk (Pi,j M ) = Lk (M )
et pour 1 ≤ i 6= j ≤ n et k 6= i, j :

(n)

 Ci (M Pi,j ) = −Cj (M )
(n)
Cj (M Pi,j ) = Ci (M )


(n)
Ck (M Pi,j ) = Ck (M )
1.2
Matrices diagonales
Pour tout λ = (λ1 , · · · , λn ) ∈ (K ∗ )n on désigne par

λ1 0 · · ·
 0 λ2 · · ·
Diag(λ) = 
 ..
.. . .
.
.
.
0 0 ···

0
0


0
λn
la matrice diagonale inversible associée à λ.
On a alors pour 1 ≤ i, j ≤ n :
Li (Diag(λ)M ) = λi Li (M )
et
Cj (M Diag(λ)) = λj Cj (M )
L'application λ −→ Diag(λ) de (K ∗ )n dans GLn (K) est un homomorphisme injectif dont l'image
est le sous-groupe de GLn (K) formé des matrices diagonales.
On posera, pour tout d ∈ K ∗ :
Di (d) = Diag((dδi,j )1≤j≤n )
(n)
2
Matrices échelonnées en colonnes
On dénit la fonction hauteur ht : K m −→ [0, · · · , m] en désignant, pour tout élément
x = (a1 , · · · , am ) de K m , par ht(x) le plus petit entier h ∈ [0, · · · , m] tel que ai = 0 pour
1 ≤ i ≤ m − h (on a ainsi h = 0 si et seulement si la vecteur x est nul ; sinon on a am−h+1 6= 0).
a:
Considérons une matrice H ∈ Mm,n (K) ; la matrice H est échelonnée (en colonnes) si l'on
ht(C1 (H)) > · · · > ht(Cr (H)) > ht(Cr+1 (H)) = · · · = 0
où r ≤ n ; on a posé Cj (H) = 0 ∈ K m pour j > n.
Pour chaque colonne non nulle Cj (H) (1 ≤ j ≤ r) de H , on pose s(j) = m − ht(Cj (H)) + 1 et
on appelle le coecient Cj (H)s(j) un pivot de la matrice H .
De plus la matrice échelonnée (en colonnes) H est dite réduite si pour 1 ≤ j ≤ r on a Ls(j) (H) =
Lj (Idn ) (ie. tous les pivots de H sont égaux à 1, et les autres coecients de la ligne de chaque
pivot sont nuls).
Lemme 1 (élimination d'une n de ligne)
Soient M ∈ Mm,n (K) et deux indices (i, j) avec 1 ≤ i ≤ m et 1 ≤ j ≤ n ; alors il existe
0 =
une matrice V produit de matrices élémentaires, telle que la matrice M 0 = M V vérie Mi,s
0 pour tout s > j
O On part de la matrice M et de V matrice identité d'ordre n que l'on multiplie successivement
à droite par des matrices élémentaires jusqu'à l'obtention de la forme voulue.
Dans le cas où Mi,j = 0, si l'on a Mi,s = 0 pour s > j c'est terminé, sinon il existe s > j tel que
(n)
Mi,s 6= 0 et on multiplie à droite M et V par la matrice Pj,s .
On est donc ramené au cas Mi,j 6= 0 ; Pour tout s, j < s ≤ n, tel que Mi,s 6= 0 on multiplie à
(n)
droite M et V par la matrice élémentaire Xj,s
(−
Mi,s
)
Mi,j
Proposition 1 (réduction à la forme échelonnée réduite)
Soit M ∈ Mm,n (K), il existe une matrice échelonnée H ∈ Mm,n (K) et une matrice V ∈ GLn (K)
telle que H = M.V .
Cette forme échelonnée réduite s'obtient par opérations élémentaires sur les colonnes. Plus précisément on a l'algorithme suivant :
1. entrée : M ∈ Mm,n (K)
2. initialisations : H := M , V matrice unité d'ordre n, j := 1
3. boucle principale : pour i variant de 1 à m :
(a) recherche d'un pivot :
si : Hi,j = 0
s'il existe s ≥ j + 1 tel que Hi,s 6= 0
{
(n)
i. X = Pj,s
ii. V := V.X
iii. H := H.X
sinon passer à l'étape suivant de la boucle
}
(b) mettre le pivot à 1 :
i. X = Dj(n) (
1
)
Hi,j
ii. V := V.X
iii. H := H.X
(c) réduire et échelonner : mettre à 0 les autres coecients de la ligne du pivot :
pour s variant de 1 à j − 1 puis de j + 1 à n boucle : {
(n)
i. X := Xj,s
(−Hi,s )
ii. H := H.X
iii. V := V.X
}
(d) j := j + 1
(e) sortir quand j = n
n de boucle principale
4. sortie H échelonnée et V ∈ GLn (K) telles que H = M.V
3
Noyau et image d'une matrice
Soit M ∈ Mm,n (K) ; le noyau de M est déni par :
Ker(M ) = {λ = (λj )1≤j≤n ∈ K n /
n
X
λj Cj (M ) = 0}
j=1
et l'image par :
Im(M ) = {
n
X
λj Cj (M )/λ = (λj )1≤j≤n ∈ K n }
j=1
Lemme 2
Si M ∈ GLn (K) on a Ker(M ) = {0}
O Si M est inversible, il existe une matrice M 0 telle que M 0 M = Id de sorte que M 0 Cj (M ) = ej
pour 1 ≤ j ≤ n où ei = (δi,j )1≤i≤n .
n
n
n
P
P
P
Soit λ ∈ Ker(M ) ; on a λj Cj (M ) = 0 de sorte que λj M 0 Cj (M ) = λj ej = λ = 0. M
j=1
j=1
j=1
Lemme 3
Soit M 0 = M V avec V ∈ GLn (K) ; on a Im(M 0 ) = Im(M ).
O Pour tout λ ∈ K n on a
n
P
n P
n
P
( Vk,l λl )Ck (M ) de sorte que Im(M 0 ) ⊂ Im(M ).
λj Cj (M 0 ) =
j=1
k=1 l=1
On a l'égalité parce que V est inversible. M
Proposition 2
Soit M ∈ Mm,n (K) ; on considère une décomposition H = M.V avec H échelonnée réduite (en
colonnes) et V ∈ GLn (K) ; l'ensemble E = {Cj (H)/1 ≤ j ≤ r} des colonnes non nulles de H
est une base de l'image Im(M ) de M tandis que K = {Cj (V )/r + 1 ≤ j ≤ n} est une base du
noyau Ker(M ) de M .
O En eet H étant échelonnée, E est une partie libre de K m donc une base de l'image Im(H) de
H . Comme H = M.V et que V est inversible on a Im(M ) = Im(H).
On a Cj (H) = M Cj (V ) pour 1 ≤ j ≤ n de sorte que Cj (V ) ∈ Ker(M ) pour r + 1 ≤ j ≤ n et
comme V est inversible, les colonnes de V sont linéairement idépendantes.
Considérons alors µ ∈ Ker(M ) ; comme V est inversible on a µ = V λ de sorte que λ ∈ Ker(H).
n
r
P
P
On a donc λj Cj (H) = λj Cj (H) = 0 et comme H est échelonnée on a λj = 0 pour 1 ≤ j ≤ r
j=1
de sorte que µ =
j=1
n
P
λj Cj (V ) et ainsi K est une base de Ker(M ). M
j=r+1
Il en résulte en particulier que l'on a :
dim(Ker(A)) + dim(Im(A)) = n
Corollaire 1
Soit M ∈ Mm,n (K) ; si Ker(M ) = {0} on a n ≤ m. Si de plus n = m on a M ∈
Im(M ) = K n .
GLn(K) et
O Soit H = M.V avec H ∈ Mm,n (K) échelonnée et V ∈ GLn (K). alors H n'a pas de colonne
nulle de sorte que n ≤ m.
Si m = n alors H est triangulaire inférieure avec tous ses coecients diagonaux non nulle de
sorte que H est inversible comme on le voit par récurrence en décomposant H par blocs :


0

.. 

H0
.
H=


0
··· v ··· c
Par hypothèse de récurrence H 0 est inversible et l'on a :

0
.. 
. 

H 0 −1


H −1 = 

···
−c−1 vH 0 −1

0 
···
c−1
M
4
Action à droite de GLn
Proposition 3
Soient M, M 0 ∈
que M 0 = M.V
(K)
sur Mm,n
(K)
Mm,n(K) on a Im(M 0) = Im(M ) si et seulement s'il existe V ∈ GLn(K) tel
O On a vu précédemment que si M 0 = M V avec V ∈ GLn (K) ; on a Im(M 0 ) = Im(M ).
Réciproquement supposons que Im(M 0 ) = Im(M ). Alors Im(M 0 ) = Im(M ) est un sous-espace
vectoriel de K m et l'on a dim(Ker(M )) = dim(Ker(M 0 )). On a alors :
K n = Ker(A) ⊕ F
K n = Ker(B) ⊕ G
Alors M induit un isomorphisme de F sur Im(M ) tandis que M 0 induit un isomorphisme de F
sur Im(M 0 ) d'où un isomorphisme x → V1 x de G dans F tel que M 0 x = M.V1 x pour tout x ∈ G.
D'autre part il existe un isomorphisme y → V2 y de Ker(M 0 ) sur Ker(M ). on pose alors, pour
tout z = y + x ∈ K n = Ker(B) ⊕ G, V z = V2 y + V1 x ; on a V ∈ GLn (K) et M 0 = M V . M
Proposition 4
L'orbite d'une matrice M ∈ Mm,n (K) pour l'action à droite de
matrice échelonnée réduite (en colonnes)
GLn(K) contient une unique
O Il faut donc montrer que si H, K ∈ Mm,n (K) sont deux matrices échelonnées réduites (en
colonnes) telles qu'il existe V ∈ GLn (K) avec K = HV on a K = H . On remarque que H et K
ont le même rang r et on va montrer par récurrence sur r que l'on a :
Idr 0
V =
X Y
avec X ∈ Mn−r,r (K) et Y ∈ Mn−r,n−r (K).
Lorsque V est de cette forme, puisque H = H 0 0 où H 0 est formé des r premières colonnes
de H , on a :
Idr 0
0
= H 0 Idr 0 = H
K = HV = H 0
X
Tout d'abord le cas r =
1 1.
Y
Les matrices H et K sont de la forme :

0
 ..
.

0

1

?

 ..
.
?
0 ···
..
.
..
.
0 ···
0 ···
0 ···
..
.
..
.
0 ···

0
.. 
.

0

0

0

.. 
.
0
La première ligne non nulle de H (resp. de K étant la ligne s(1) (resp. s0 (1)). Comme l'on a
H V = K on a Li (H) V = Li (K) pour 1 ≤ i ≤ m et puisque V est inversible on a s(1) = s0 (1).
On a alors U e?1 = e?1 de sorte que :
Id1 0
V =
X
Y
avec X ∈ Mn−1,1 (K) et Y ∈ Mn−1,n−1 (K).
Supposons r ≥ 2 ; on a Ls(r) (H) = Lr (Idn ) = e?r .
Soient H et K les matrices obtenues en prenant les s(r) − 1 premières lignes de H et de K de
sorte que l'on a K = HV . Ces matrices étant échelonnées réduites de rang r − 1 on a :
Idr−1 0
V =
X0
Y0
avec X 0 ∈ Mn−r+1,r (K) et Y 0 ∈ Mn−r+1,n−r (K). de sorte que H = K .
Ensuite on a :
Ls(r) (K) = Ls(r) (H)V = Lr (Idn )V = e?r V = Lr (V )
Alors Ls(r) (K) est une ligne d'échelonnement de K ie. Ls(r) (K) = e?r et l'on a :
Lr (V ) = Lr (Idn ) = e?r
donc V =
Idr 0
X
Y
avec X ∈ Mn−r,r (K) et Y ∈ Mn−r,n−r (K) et K = H
Si ce n'était pas le cas on aurait Vr,j = Ks(r),j = 0 pour j > r d'où 2 :
Lr (V ) =
Vr,1 · · ·
Vr,r−1 0 · · ·
0
= Vr,1 e?1 + · · · + Vr,r−1 e?r−1
= Vr,1 e?1 V + · · · + Vr,r−1 e?r−1 V
= e?r V
Il en résulte que :
(Vr,1 e?1 + · · · + Vr,r−1 e?r−1 − e?r )V = 0
Comme V est inversible on a :
Vr,1 e?1 + · · · + Vr,r−1 e?r−1 − e?r = 0
ce qui n'est pas possible puisque les e?i pour 1 ≤ i ≤ n sont linéairement indépendants. M
1. Pour
r = 0 H et K sont égales à la matrice
e?i V = e?i pour 1 ≤ i ≤ r − 1
2. puisque
nulle et
V
est quelconque
Téléchargement