Affinités et transvections

publicité
AD - AFFINITES ET TRANSVECTIONS
Dans ce qui suit, E désigne un espace vectoriel de dimension n sur un corps commutatif K et E ∗ son
dual. On notera I l’application identique de E. On s’intéresse aux éléments u de L (E) laissant fixes
tous les vecteurs d’un hyperplan H, c’est-à-dire tels que
H ⊂ Ker(u − I) .
Théorème 1 Un endomorphisme u de E laisse fixes tous les vecteurs d’un hyperplan H de E si
et seulement si il existe une forme linéaire e∗ sur E et un vecteur f de E tel que, pour tout x de E,
on ait
u(x) = x + e∗ (x) f .
(1)
Alors, si u est distinct de I, on a
H = Ker(u − I) = Ker e∗
et
Im(u − I) = Kf .
Si (e∗ , f ) est un couple de E ∗ × E vérifiant la relation (1), l’ensemble des couples vérifiant (1) est
{(µe∗ , µ−1 f ) | µ ∈ K∗ } .
Pour f fixé non nul dans Im(u − I), la forme linéaire e∗ est unique, et pour e∗ fixée telle que
Ker e∗ = H
le vecteur f est unique. De plus e∗ (f ) ne dépend pas de e∗ et f mais uniquement de u, et nous
poserons
λ = 1 + e∗ (f ) .
• Soit u un endomorphisme de E ayant la forme donnée dans (1).
Si e∗ ou f est nul, alors u est l’application identique. Dans le cas contraire u n’est pas I. Alors, si H
est le noyau de e∗ , on a, pour tout x de l’hyperplan H,
u(x) = x ,
et donc u laisse fixes les vecteurs de H.
• Réciproquement, si u laisse fixes les vecteurs d’un hyperplan H, ou bien u est l’identité et il suffit de
prendre e∗ ou f nuls, ou bien u n’est pas l’identité, alors
H = Ker(u − I) .
AD 2
Dans ce cas Im(u − I) est une droite D. Désignons par f un vecteur non nul de D. Alors, pour tout x
de E, il existe e∗ (x) unique dans K tel que
u(x) − x = e∗ (x) f .
On vérifie immédiatement que e∗ est alors une forme linéaire non nulle.
• Si u n’est pas l’identité et si l’on a la relation (1), alors f n’est pas nul, et il en résulte que
u(x) = x
si et seulement si e∗ (x) est nul. Donc on a bien
H = Ker(u − I) = Ker e∗ .
Par ailleurs, f est un vecteur de la droite Im(u − I).
• Si l’on a les deux décompositions
u = I + e∗ f = I + e′∗ f ′ ,
les vecteurs f et f ′ sont deux vecteurs non nuls de la droite Im(u − I). Il existe donc µ dans K tel que
f = µf ′ .
Alors,
e′∗ = µe∗ .
• Réciproquement, si (e∗ , f ) est un couple donnant la décomposition de u, il en est de même pour tout
couple (µe∗ , µ−1 f ). Il résulte de ceci que si l’on fixe un élément du couple, l’autre est déterminé de
manière unique.
• Enfin
e∗ (f ) = µ−1 e′∗ (µf ′ ) = e′∗ (f ′ ) ,
ne dépend que de u.
Propriétés
a) La restriction de u à D est une homothétie de rapport λ (dégénérée si λ est nul), et D est incluse
dans Ker(u − λI).
b) Si µ est un nombre distinct de 1, on a
Ker(u − µI) ⊂ D .
c) On a l’inclusion
Im(u − λI) ⊂ H .
d) Les seules valeurs propres de u sont λ et 1, et u est trigonalisable.
e) Le déterminant de u vaut λ.
f) Si λ est nul, l’endomorphisme u est la projection sur H parallèlement à D.
AD 3
a) On a
u(f ) = f + e∗ (f ) f = λf .
Donc la restriction de u à D est une homothétie de rapport λ.
b) Si µ est distinct de 1, on a, pour tout x de E,
(u − µI)(x) = (1 − µ)x + e∗ (x) f .
Donc, si x est dans Ker(u − µI), on a
x = (µ − 1)−1 e∗ (x) f ,
et x est dans D.
c) En calculant e∗ ◦ (u − λI) on trouve
e∗ ◦ (u − λI) = (1 − λ)e∗ + e∗ (f ) e∗ = 0 .
Donc Im(u − λI) est inclus dans H.
d) Il résulte de la définition de u que
H ⊂ Ker(u − I) .
Donc 1 est une valeur propre de u.
D’après a)
D ⊂ Ker(u − λI) ,
et si λ est différent de 1, on a d’après b)
Ker(u − λI) ⊂ D .
On aura alors égalité. Il en résulte que u admet 1 comme valeur propre d’ordre n − 1 et λ comme valeur
propre d’ordre 1. Dans ce cas u est diagonalisable.
Si λ vaut 1, on a
(u − I)2 = e∗ (f ) e∗ = 0 .
Donc
E = Ker(u − I)2
et u est trigonalisable. Sa valeur propre unique est 1 à l’orde n.
e) Le déterminant étant le produit des valeurs propres, il résulte de d) que
det u = λ .
AD 4
f) Si λ est nul, u n’est pas inversible et on obtient alors
u2 = u ,
et u est une projection de E sur Im u parallèlement à Ker u. D’autre part, d’après a) et b)
D = Ker u .
Donc Im u est un hyperplan. Mais d’après c)
Im u ⊂ H .
Il en résulte que
Im u = H
et donc u est la projection sur H parallèlement à D.
Définition
On dira que u est une transvection d’hyperplan H et de droite D si
det u = λ = 1 ,
et que u est une affinité d’hyperplan H, de droite D et de rapport λ, si λ est différent de 1 et 0.
On peut compléter les propriétés vues plus haut en faisant le tableau suivant, dont les colonnes 1
à 3 résultent des définitions et de la propriété e). Les colonnes 4 et 5 résultent de la démonstration
faite dans d). Les colonnes 7 et 8 résultent de b) et c), et la colonne 6 est une conséquence de la colonne 1.
u
Transvection
H, D
Affinité
H, D, λ
Projection
sur H // à D
1
e (u)
2
det u = λ
3
inversible
4
val. propres
5
diagonalisable
6
7
Im(u − λI)
8
Ker(u − λI)
0
1
oui
1 d’ordre n
non
D⊂H
D
H
6= 0, −1
6= 0, 1
oui
oui
E =D⊕H
H
D
−1
0
non
1 ordre n − 1
λ ordre 1
1 ordre n − 1
0 ordre 1
oui
E =D⊕H
H
D
∗
Remarques
1) Si E est de dimension 1, le sous-espace H est réduit à {0}, et D = E. D’après 6 il n’existe pas de
transvection, et d’après a), une affinité de rapport λ est une homothétie de même rapport.
2) Si K est un corps à deux éléments, il n’y a pas d’affinité, car 0 et −1 sont les seuls éléments de K.
AD 5
Donnons l’interprétation géométrique dans R2 .
1) Transvection d’hyperplan H et de droite D
On a ici H = D. Soit f une base de D et g n’appartenant pas à D. Soit (α, β) les coordonnées de x
dans la base (f, g). On a
u(x) − x = βe∗ (g) f ,
et cette expression ne dépend que de la coordonnée de x sur g. Dans
la base (f, g), le vecteur u(x) a
∗ (g)
1
e
pour coordonnées (α + βe∗ (g), β), et u a pour matrice
.
0
1
y
u(y)
x
β
u(y) − y
z
u(x)
u(x) − x
u(z)
g
-
0
f
α
D=H
On peut construire facilement l’image d’un vecteur z quelconque par u connaissant l’image u(x) d’un
vecteur x. L’intersection y de la droite x u(x) avec 0z a pour image u(y) tel que
u(y) − y = u(x) − x ,
Alors u(z) est l’intersection de la droite 0u(y) avec la parallèle à x u(x) passant par z.
2) Affinité d’hyperplan H, de droite D et de rapport λ
Ici D et H sont des droites et
D ⊕ H = R2 .
Soit f une base de D et g une base de H. Soit (α, β) les coordonnées de x dans la base (f, g). On a
u(x) − x = αe∗ (f ) f ,
et cette expression ne dépend que de la coordonnée
de
x sur f . Dans la base (f, g), le vecteur u(x) a
λ 0
.
pour coordonnées (λα, β), et u a pour matrice
0 1
AD 6
β
x
u(x)
g
-
0
f
α
y
λα
D
u(y)
H
z
u(z)
On peut construire facilement l’image u(z) d’un vecteur z quelconque par u connaissant l’image u(x)
d’un vecteur x et la droite H. L’intersection y de la parallèle à H passant par x avec 0z a pour image
u(y) tel que
u(y) − y = u(x) − x ,
Alors u(z) est l’intersection de la droite 0u(y) avec la parallèle à x u(x) passant par z.
Revenons maintenant à l’étude générale.
Proposition 1 Soit u un endomorphisme de E autre que I, laissant fixes les vecteurs d’un
hyperplan H, et V un sous-espace de E. Alors V est stable par u si et seulement si V est inclus
dans H ou D = Im(u − I) est incluse dans V .
Si V est inclus dans H, comme u laisse fixes les vecteurs de H, il laisse fixes ceux de V qui est bien
stable par u. Si D est incluse dans V , et si x est dans V , on a
u(x) = x + e∗ (x)f
et puisque f est dans V , il en résulte que u(x) est aussi dans V .
Réciproquement, si u laisse stable V et si V n’est pas inclus dans H, soit x dans V n’appartenant pas
à H. Comme e∗ (x) n’est pas nul, on aura
f = e∗ (x)−1 (u(x) − x)
AD 7
et puisque x et u(x) sont dans V , il en sera de même de f . Donc D est incluse dans V .
Lemme 1 Soit u un endomorphisme de E et v un élément de GL(E). On pose
u′ = v ◦ u ◦ v −1
Alors
v(Im u) = Im u′
et
v(Ker u) = Ker u′ .
• Si y est dans v(Im u), il existe z dans Im u tel que
y = v(z) ,
et x dans E, tel que
z = u(x) .
Alors, si l’on pose
x = v −1 (t) ,
on a
y = v ◦ u ◦ v −1 (t) ,
ce qui montre que y appartient à Im u′ .
Réciproquement, si y est dans Im u′ , il existe t dans E tel que
y = v ◦ u ◦ v −1 (t)
alors u ◦ v −1 (t) est dans Im u, et y dans v(Im u). On a donc bien
v(Im u) = Im u′ .
• Si y est dans v(Ker u). Il existe x dans Ker u tel que
y = v(x) .
Alors
u′ (y) = v ◦ u ◦ v −1 (v(x)) = v ◦ u(x) = v(0) = 0 ,
et y appartient à Ker u′ .
Réciproquement, si y est dans Ker u′ , on a
u′ (y) = v ◦ u ◦ v −1 (y) = 0 .
Posons
z = v −1 (y) .
AD 8
Alors
0 = v ◦ u(z) = v(u(z)) .
cela montre que u(z) est dans Ker v, mais comme v est bijective, il en résulte que u(z) est nul, donc z
est dans Ker u, et y = v(z) est dans v(Ker u). On a bien
v(Ker u) = Ker u′ .
Proposition 2 Soit u un endomorphisme de E, laissant fixes les vecteurs d’un hyperplan H, et
v un élément de GL(E). Alors
u′ = v ◦ u ◦ v −1
est un endomorphisme de E qui laisse fixes les vecteurs de v(H) et de même nature que u.
De manière précise :
– si u est I, il en est de même de u′ ,
– si u est la projection sur H parallèlement à D, alors u′ est la projection sur v(H) parallèlement
à v(D),
– si u est l’affinité (H, D, λ) alors u′ est l’affinité (v(H), v(D), λ),
– si u est la transvection (H, D) alors u′ est la transvection (v(H), v(D)).
Réciproquement, si u et v sont des endomorphismes de E de même nature et de même déterminant,
laissant fixes les vecteurs d’un hyperplan, il existe v dans GL(E) tel que
u′ = v ◦ u ◦ v −1 .
Si l’on a
u′ = v ◦ u ◦ v −1 ,
l’endomorphisme u′ est égal à I si et seulement si u est égal à I. Supposons donc u et u′ distincts de I.
On a aussi
u′ − I = v ◦ (u − I) ◦ v −1 ,
et donc, d’après le lemme 1,
v(Im(u − I)) = Im(u′ − I) et v(Ker(u − I)) = Ker(u′ − I) .
Donc u′ laisse fixes les vecteurs de v(H) qui est également un hyperplan. De plus
det u = det u′ ,
ce qui montre que u et u′ sont de même nature. Alors
H ′ = v(H) et D ′ = v(D) .
Cela démontre la première partie de la proposition.
AD 9
Réciproque.
1) Si u et u′ sont égaux à I, n’importe quel élément v de GL(E) convient.
Supposons maintenant que
u = I + e∗ f
et u′ = I ′ + e′∗ f ′ ,
où f et f ′ engendrent D et D ′ respectivement, et soit H et H ′ les hyperplans dont les vecteurs sont
laissés fixes par u et u′ respectivement.
2) Les endomorphismes u et u′ sont tous deux des affinités ou tous deux des projections de déterminant
λ. On a donc
E = H ⊕ D = H ′ ⊕ D′ .
Prenons des bases (e1 , . . . , en−1 ) et (e′1 , . . . , e′n−1 ) de H et H ′ respectivement et posons
v(f ) = f ′
et ∀i ∈ {1, . . . , n − 1} , v(ei ) = e′i .
Alors v appartient à GL(E) et vérifie
v(H) = H ′
et v(D) = D ′ .
Comme e′i est dans H ′ et v −1 (e′i ) dans H, on a
u(v −1 (e′i )) = v −1 (e′i ) et u′ (e′i ) = e′i ,
et donc
v ◦ u ◦ v −1 (e′i ) = v(v −1 (e′i )) = e′i = u(e′i ) .
D’autre part
v ◦ u ◦ v −1 (f ′ ) = v ◦ u(f ) = v(λf ) = λv(f ) = λf ′ .
Il en résulte que
u′ = v ◦ u ◦ v −1 .
On a donc bien le résultat dans ce cas.
3) Les endomorphismes u et u′ sont des transvections. Soit g n’appartenant pas à H et g′ n’appartenant
pas à H ′ . Prenons des bases (e1 , . . . , en−1 ) et (e′1 , . . . , e′n−1 ) de H et H ′ respectivement, où
e1 = f
et e′1 = f ′ ,
et posons
v(g) = µg′
et ∀i ∈ {1, . . . , n − 1} v(ei ) = e′i ,
où
µ = (e′∗ (g′ ))−1 e∗ (g) .
Alors v appartient à GL(E) et vérifie
v(H) = H ′
et
v(f ) = f ′ .
AD 10
Si 1 ≤ i ≤ n − 1, on a encore
v ◦ u ◦ v −1 (e′i ) = v(v −1 (e′i )) = e′i = u(e′i ) .
D’autre part
v −1 (g′ ) = µ−1 g ,
et donc
v ◦ u ◦ v −1 (g′ ) = µ−1 v ◦ u(g)
= µ−1 v(g + e∗ (g)f )
= µ−1 (v(g) + e∗ (g)v(f ))
= g′ + µ−1 e∗ (g)f ′
= g′ + e′∗ (g′ )f ′
= u′ (g′ ) .
On a donc bien le résultat également dans ce cas.
Nous allons étudier maintenant certains ensembles d’applications laissant fixe un hyperplan, et voir la
stabilité par composition et leur structure.
Proposition 3 Si l’on a
u = I + e∗ f
et u′ = I + e′∗ f ′
alors
(2)
u ◦ u′ = I + e′∗ f ′ + e∗ f + e∗ (f ′ )e′∗ f .
Calcul immédiat.
Proposition 4 Soit u et u′ deux endomorphismes de E distincts de I laissant fixes les vecteurs des
hyperplans H et H ′ respectivement, et de droites D et D′ . Les endomorphismes u et u′ commutent
si et seulement si
a) D ⊂ H ′ et D ′ ⊂ H, lorsque u ou u′ est une transvection,
b) (D ⊂ H ′ et D ′ ⊂ H) ou (H = H ′ et D = D′ ), lorsque u et u′ ne sont pas des transvections.
En utilisant (2), on obtient que
u ◦ u′ = u′ ◦ u
équivaut à la relation
(3)
e∗ (f ′ )e′∗ f = e′∗ (f )e∗ f ′ .
AD 11
Supposons que u et u′ commutent.
Si x est dans H, on obtient
e∗ (f ′ )e′∗ (x) = 0 .
Si x est dans H ′ , on obtient
e′∗ (f )e∗ (x) = 0 .
Donc, ou bien, pour tout x de H on a
e′∗ (x) = 0 ,
et dans ce cas H et H ′ sont égaux, ou bien il existe x dans H tel que
e′∗ (x) 6= 0 ,
et alors on doit avoir
e∗ (f ′ ) = 0 .
Comme H et H ′ sont distincts, il existe x dans H ′ tel que
e∗ (x) 6= 0 ,
et alors
e′∗ (f ) = 0 .
Il en résulte que la droite D est incluse dans H ′ , et la droite D ′ est incluse dans H.
Etudions maintenant ce qui se passe si H = H ′ . On a les trois possibilités suivantes :
1) Si u et u′ ne sont pas des transvections, en appliquant (3) à f , on obtient,
e∗ (f ′ )e′∗ (f ) f = e′∗ (f )e∗ (f ) f ′ ,
et puisque aucun terme n’est nul dans cette égalité, on en déduit que f et f ′ sont colinéaires, et donc
que D = D′ .
Il en résulte que lorsque u ou u′ ne sont pas des transvections, la commutativité implique
(D ⊂ H ′ et D′ ⊂ H) ou (H = H ′ et D = D ′ ) .
2) Si u et u′ sont des transvections, comme D est inclus dans H et D′ dans H ′ , on aura encore D
inclus dans H ′ et D ′ inclus dans H.
3) Si u′ est une transvection et si u ne l’est pas, on a
D′ ⊂ H , D ′ ⊂ H ′ , D 6⊂ H D 6⊂ H ′ ,
et donc
e′∗ (f )e∗ (f )f ′ 6= 0 et e∗ (f ′ )e′∗ (f )f = 0 ,
AD 12
et (3) n’est pas vérifié, d’où une contradiction.
Il résulte de 2) et 3) que lorsque u ou u′ est une transvection, la commutativité implique que
D ⊂ H ′ et D ′ ⊂ H .
Réciproque.
1) Si D est inclus dans H ′ et D ′ et inclus dans H, on a alors
e∗ (f ′ ) = e′∗ (f ) = 0 ,
et d’après la formule (2),
u ◦ u′ = u′ ◦ u = I + e′∗ f ′ + e∗ f .
2) Si l’on a à la fois
D = D′
et H = H ′
il existe des constantes α et β telles que
e∗ = αe′∗
et f = βf ′ .
On vérifie alors que (3) a lieu et donc que u et u′ commutent.
Corollaire
Si u et u′ sont des transvections, et si D = D′ ou H = H ′ alors u et u′ commutent.
Proposition 5 Soit u un endomorphisme inversible de E laissant fixes les vecteurs d’un hyperplan.
Alors si
u = I + e∗ f et u(f ) = λf
le nombre λ est non nul et
u−1 = I − λ−1 e∗ f .
En effet
I = u−1 + e∗ u−1 (f ) ,
et comme d’autre part
u(f ) = λf ,
on a
u−1 (f ) = λ−1 f
ce qui donne le résultat.
AD 13
Proposition 6 Soit u une transvection d’hyperplan H et de droite D. Il en est de même de u−1
et
u + u−1 = 2I .
Soit u une affinité d’hyperplan H, de droite D et de rapport λ, alors u−1 est une affinité d’hyperplan
H, de droite D et de rapport λ−1 .
Cela résulte immédiatement de la proposition précédente, ou de la définition des affinités et transvections et du fait que
det(u−1 ) = (det u)−1 .
Nous adoptons maintenant les notations suivantes :
Γ′ (E, H)
Γ(E, H)
∆′ (E, D)
∆(E, D)
Θ(E, H)
Σ(E, D)
=
=
=
=
=
=
{u ∈ GL(E) | u(H) = H}
{u ∈ GL(E) | H ⊂ Ker(u − I)}
{u ∈ GL(E) | u(D) = D}
{u ∈ GL(E) | transvection ou affinité de droite D} ∪ {I}
{u ∈ GL(E) | transvection d’hyperplan H} ∪ {I}
{u ∈ GL(E) | transvection de droite D} ∪ {I}
Proposition 7
1) Γ′ (E, H) et ∆′ (E, D) sont des sous-groupes de GL(E)
2) Γ(E, H) est un sous-groupe distingué de Γ′ (E, H)
3) ∆(E, D) est un sous-groupe distingué de ∆′ (E, D)
4) Θ(E, H) est un sous-groupe distingué commutatif de Γ(E, H)
5) Σ(E, D) est un sous-groupe distingué commutatif de ∆(E, D)
6) les groupes H et Θ(E, H) sont isomorphes
7) les groupes {e∗ ∈ E ∗ | e∗ (f ) = 0} et Σ(E, D) sont isomorphes
8) les groupes Θ(E, H) et Σ(E, D) sont isomorphes
1) est évident car, si u et v laissent invariant le même sous-espace V , il en est de même de u ◦ v −1 .
2) Un élément de Γ(E, H) laisse invariant H. Donc Γ(E, H) est inclus dans Γ′ (E, H). D’autre part si
u et v sont dans Γ(E, H), il en est de même de u ◦ v −1 . Donc Γ(E, H) est un sous-groupe de Γ′ (E, H).
Enfin d’après la proposition 2 si u est dans Γ(E, H) et v dans Γ′ (E, H), alors v ◦ u ◦ v −1 est dans
Γ(E, H) qui est donc un sous-groupe distingué de Γ′ (E, H).
3) Il est clair que ∆(E, D) est un sous-ensemble de ∆′ (E, D). D’après la proposition 5, si u est dans
∆(E, D), il en est de même de u−1 . Enfin, si u et u′ sont dans ∆(E, D), en utilisant la formule (2),
on a
u ◦ u′ = I + (e′∗ + e∗ + e∗ (f )e′∗ )f ,
AD 14
ce qui montre que u ◦ u′ est dans ∆(E, D). La proposition 2 montre de nouveau que ∆(E, D) est
distingué dans ∆′ (E, D).
4) L’application qui a u associe son déterminant est un homomorphisme de groupes de Γ(E, H) sur
K∗ , et l’on a
Θ(E, H) = {u ∈ Γ(E, H) | det u = 1} .
Comme {1} est un sous-groupe distingué de K∗ , le résultat est alors évident. De plus, d’après un corollaire vu plus haut, ce sous-groupe est commutatif.
5) Même démonstration que pour 4).
6) Soit e∗ une forme linéaire de noyau H. Soit τ l’application qui à f dans H associe
τ (f ) = u = I + e∗ f .
On obtient une application bijective de H sur Θ(E, H). Alors, en utilisant la formule (2)
u ◦ u′ = I + e∗ (f + f ′ )
car e∗ (f ′ ) est nul. Donc τ est un morphisme de groupes, et l’on retrouve en particulier que Θ(E, H)
est commutatif.
7) Soit
F ∗ = {e∗ ∈ E ∗ | e∗ (f ) = 0} .
C’est un sous-espace vectoriel de E ∗ . Soit σ l’application qui à e∗ de F ∗ associe u défini par
u = σ(e∗ ) = I + e∗ f .
On obtient une application bijective de F ∗ sur Σ(E, D). D’après la formule (2)
u ◦ u′ = I + (e∗ + e′∗ )f ,
ce qui prouve que σ est un morphisme de groupes.
8) L’ensemble F ∗ est le noyau de la forme linéaire sur E ∗ qui à e∗ associe e∗ (f ). C’est donc un hyperplan de E ∗ , et par suite il est isomorphe à H. Il résulte alors de 6) et 7) que Θ(E, H) et Σ(E, D) sont
isomorphes.
On étudie maintenant certaines propriétés de Θ(E, H).
Proposition 8 Le centralisateur de Θ(E, H) est le groupe Z(E)◦Θ(E, H), où Z(E) est l’ensemble
des homothéties de rapport non nul.
AD 15
Soit C(E, H) le centralisateur de Θ(E, H), c’est-à-dire l’ensemble des éléments de GL(E) qui commutent avec tous les éléments de Θ(E, H). Il contient, bien sûr, toutes les homothéties, et comme
Θ(E, H) est commutatif, il contient Θ(E, H), donc également le produit Z(E) ◦ Θ(E, H).
Réciproquement, soit v dans C(E, H) et f dans H. Alors v commute avec la transvection u de Θ(E, H)
définie par
u = I + e∗ f .
En écrivant l’égalité de commutation, on a
e∗ ◦ v f = e∗ v(f ) .
Fixons g dans le complémentaire de H. On obtient, pour tout f de H,
v(f ) = (e∗ (g))−1 e∗ (v(g))f .
On a donc
v(f ) = λf .
Il en résulte que
λ−1 v
est un élément de GL(E) laissant fixes les vecteurs de H. Donc
λ−1 v = I + e∗ h .
D’autre part
e∗ ◦ vf = e∗ v(f ) = λe∗ f .
On a tout d’abord
e∗ (v(h))f = e∗ (h)v(f ) = e∗ (h)λf ,
d’où
e∗ (v(h)) = λe∗ (h) .
D’autre part, puisque
v = λ(I + e∗ h) ,
on a
e∗ (v(h)) = e∗ (λh + λe∗ (h)h) = λe∗ (h) + λ(e∗ (h))2 .
On en déduit que e∗ (h) est nul, ce qui prouve que λ−1 v est une transvection u′ d’hyperplan H ou est
I. Alors v = λu′ appartient bien à Z(E) ◦ Θ(E, H).
Nous allons voir maintenant quels groupes engendrent les affinités et les transvections.
Lemme 2 On suppose que dim E ≥ 2. Si x et y sont deux éléments non nuls de E, et G un
sous-espace de codimension supérieure ou égale à 2 indépendant du sous-espace F engendré par x
et y, il existe un élément U du groupe G engendré par les transvections de E tel que
U (x) = y ,
et qui laisse fixes les vecteurs de G.
En particulier G opère transitivement sur E \ {0}.
AD 16
1) Si x et y sont indépendants, alors x n’appartient pas à G + K(y − x). Sinon, on aurait
x = α(y − x) + g ,
avec α dans K et g dans G, et donc le vecteur
(1 + α)x − αy = g
serait dans F ∩ G. Comme G et F sont indépendants, on aurait
(1 + α)x − αy = 0 ,
et comme (x, y) est un système libre, on aurait
α = 1+α = 0
ce qui est impossible.
Soit alors H un hyperplan de E contenant G + K(y − x) et ne contenant pas x. Il existe une forme
linéaire e∗ sur E, de noyau H tel que
e∗ (x) = 1 .
Soit U la transvection définie par
U = I + e∗ (y − x) .
On a
U (x) = x + e∗ (x)(y − x) = y ,
et U laisse invariant les vecteurs de H donc ceux de G.
2) Si x et y sont liés, l’espace vectoriel Kx + G est de codimension au moins 1, donc il existe z
n’appartenant pas à Kx + G. Soit alors g dans l’intersection de G et du sous-espace engendré par x et
z (ou par y et z). Donc
g = αx + βz ,
avec α et β dans K. Alors si β était non nul, on en déduirait
z = β −1 (−αx + g)
et z serait dans Kx + G, ce qui n’est pas possible. Donc β est nul, et le vecteur
g = αx
est dans Kx ∩ G, donc est nul.
D’après 1) il existe des transvections u et u′ telles que
u(x) = z
et u′ (z) = y ,
AD 17
laissant fixes les vecteurs de G. Alors, si l’on pose
U = u′ ◦ u ,
on a
U (x) = y ,
et U laisse fixes les vecteurs de G.
On peut appliquer le résultat si G = {0}, ce qui montre que G opère transitivement sur E \ {0}.
Théorème 2 Soit U dans GL(E) différent de I et de déterminant λ. Il existe une affinité ou une
transvection U0 de déterminant λ, et une suite finie (U1 , . . . , Up ) de transvections, telles que
U = Up ◦ · · · ◦ U1 ◦ U0 .
Soit U dans GL(E). Notons F (U ) le noyau de U − I. On fait la démonstration par récurrence descendante sur la dimension de F (U ).
La propriété est vraie à l’ordre n − 1, car U est alors une affinité ou une transvection.
Soit i ≤ n − 1. Supposons que la propriété est vraie, pour tout élément U de GL(E) tel que
dim F (U ) ≥ i ,
et montrons qu’elle est vraie si
dim F (U ) = i − 1 .
Soit donc un tel U et G un supplémentaire de F (U ) dans E. On a
codim F (U ) = dim G ≥ 2 ,
et U est une bijection de F (U ) sur lui-même. Donc, si U (x) est dans F (U ) alors x est dans F (U ). Il
en résulte que si x0 est choisi dans G \ {0}, on a
U (x0 ) = y0 + z0
avec y0 dans F (U ) et z0 dans G. Le vecteur z0 ne peut être nul sinon x0 serait dans F (U ).
Soit H un hyperplan contenant F (U ) sans contenir U (x0 ), noyau de la forme linéaire e∗ , et T définie
par
T = I − (e∗ (U (x0 )))−1 e∗ y0 .
C’est une transvection puisque e∗ (y0 ) est nul grâce au choix de H. De plus
T (U (x0 )) = z0 .
AD 18
Cette transvection laisse fixes les vecteurs de H donc de F (U ), et donc T ◦ U laisse fixes les vecteurs
de F (U ).
D’après le lemme 2, puisque codim F (U ) est supérieure ou égale à 2, il existe un produit S de transvections tel que
S(z0 ) = x0 ,
et qui laisse fixes les vecteurs de F (U ). Le produit S ◦ T ◦ U laisse fixes les vecteurs de F (U ) d’une
part et x0 d’autre part. Alors F (S ◦ T ◦ U ) contient F (U ) ⊕ Kx0 .
On applique l’hypothèse de récurrence à S ◦ T ◦ U qui s’écrit donc sous la forme
S ◦ T ◦ U = Up ◦ · · · ◦ U1 ◦ U0 ,
où U0 est une affinité ou une transvection de déterminant λ = det U , et U1 , . . . , Up sont des transvections. On en déduit
U = T −1 ◦ S −1 ◦ Up ◦ · · · ◦ U1 ◦ U0 ,
ce qui donne bien U sous la forme voulue, car S −1 est aussi un produit de transvections.
Corollaire L’ensemble des affinités et des transvections de E engendre GL(E).
L’ensemble des transvections de E engendre SL(E)
Le premier résultat est une conséquence immédiate du théorème. Le second également en utilisant le
fait que, si det U vaut 1, alors la décomposition de U ne contient que des transvections.
Théorème 3
on a
Soit D(GL(E)) le groupe dérivé de GL(E). Alors, si dim E ≥ 2, et si card K ≥ 3,
D(GL(E)) = SL(E) .
Notons
[u, v] = u ◦ v ◦ u−1 ◦ v −1 .
Le groupe D(GL(E)) est engendré par les endomorphismes [u, v], lorsque u et v décrivent GL(E).
Comme [u, v] est de déterminant 1, le groupe D(GL(E)) est inclus dans SL(E). Pour montrer la réciproque, il suffit de montrer que D(GL(E)) contient les transvections.
• Si une transvection u appartient à D(GL(E)), il en est de même de toutes les autres. En effet, si u′
est une transvection, il existe v dans GL(E) telle que
u′ = v ◦ u ◦ v −1 ,
AD 19
ou encore
u′ = [v, u] ◦ u .
• Soit u et v deux affinités d’hyperplan H et de droites respectives distinctes D et D ′ . Alors [u, v] laisse
invariant les vecteurs de H et a pour déterminant 1. Ce n’est pas I, sinon on aurait
u◦v =v◦u
ce qui est impossible d’après la proposition 4, puisque D et D′ sont distinctes et ne sont pas incluses
dans H. Donc [u, v] est une transvection.
On peut d’ailleurs calculer explicitement ce produit. Si l’on a
u = I + e∗ g
et v = I + e∗ h ,
alors, en posant
λ = 1 + e∗ (g) et µ = 1 + e∗ (h)
on trouve
u ◦ v = I + e∗ h + µe∗ g ,
puis
u−1 = I − λ−1 e∗ g
et
v −1 = I − µ−1 e∗ h ,
ce qui donne
u−1 ◦ v −1 = I − µ−1 e∗ h − λ−1 µ−1 e∗ g .
Alors en composant et en développant, on obtient
[u, v] = I + e∗ (1 + e∗ (g))−1 (1 + e∗ (h))−1 (e∗ (h)g − e∗ (g)h) .
Proposition 9 Si u et u′ sont les transvections
u = I + e∗ f
et u′ = I + e′∗ f ′ ,
on a
u ◦ u′ ◦ u−1 = I + (e′∗ − e′∗ (f )e∗ )(f ′ + e∗ (f ′ )f ) .
(4)
On a
u ◦ u′ = I + e′∗ f ′ + e∗ f + e∗ (f ′ )e′∗ f
et u−1 = 1 − e∗ f ,
et en composant
u ◦ u′ ◦ u−1 = I + e′∗ f ′ + e∗ f + e∗ (f ′ )e′∗ f
−(e∗ f + e′∗ (f )e∗ f ′ + e∗ (f )e∗ f + e∗ (f ′ )e′∗ (f )e∗ f ,
AD 20
Et puisque
e∗ (f ) = 0 ,
il reste
u ◦ u′ ◦ u−1 = I + e′∗ f ′ + e∗ (f ′ )e′∗ f − e′∗ (f )e∗ f ′ − e∗ (f ′ )e′∗ (f )e∗ f ,
ce qui donne le résultat voulu en factorisant.
Lemme 3 Soit u′ une transvection de droite D ′ , et D ′′ une droite distincte de D ′ , il existe une
transvection u telle que u ◦ u′ ◦ u−1 soit une transvection de droite D ′′ .
Soit f ′′ une base de D ′′ et H un hyperplan contenant f ′′ − f ′ sans contenir f ′ . Il ne contient donc pas
non plus f ′′ , sinon il contiendrait f ′′ − (f ′′ − f ′ ) = f ′ . On pose
f = (e∗ (f ′ ))−1 (f ′′ − f ′ ) ,
où e∗ admet H comme noyau. On a donc
f ′′ = e∗ (f ′ )f + f ′ .
Soit alors la transvection
u = I + e∗ f .
Si
u′ = I + e′∗ f ′ ,
on pose
e′′∗ = e′∗ − e′∗ (f )e∗ .
D’après la formule (4), on en déduit la relation
u′′ = u ◦ u′ ◦ u−1 = I + e′′∗ f ′′ .
Alors
e′′∗ (f ′′ ) = (e′∗ − e′∗ (f )e∗ )(e∗ (f ′ )f + f ′ )
= e′∗ (f )e∗ (f ′ ) + e′∗ (f ′ ) − e′∗ (f )e∗ (f ′ )e∗ (f ) − e′∗ (f )e∗ (f ′ ) ,
ce qui donne
e′′∗ (f ′′ ) = 0 .
Donc u′′ est une transvection de droite D ′′ .
Lemme 4 Soit u′ une transvection de droite D ′ , et d’hyperplan H ′ et u′′ une transvection de droite
D ′ et d’hyperplan H ′′ distinct de H ′ . Il existe une transvection u telle que
u′′ = u ◦ u′ ◦ u−1 .
AD 21
Remarquons que ceci n’est possible que si la dimension de E est supérieure à 3. En effet, si E est de
dimension 2, on a
D ′ = H ′ = H ′′ .
On a
u′ = I + e′∗ f ′
et u′′ = I + e′′∗ f ′
avec
e′∗ (f ′ ) = e′′∗ (f ′ ) = 0 .
Soit f appartenant à Ker(e′∗ − e′′∗ ) et pas à H ′ . Posons
e∗ = e′∗ (f )−1 (e′∗ − e′′∗ ) .
On a alors
e′′∗ = e′∗ − e′∗ (f )e∗
et
e∗ (f ) = 0 ,
et l’on définit une transvection en posant
u = I + e∗ f .
On a aussi
e∗ (f ′ ) = 0 ,
et l’on obtient facilement avec la formule (4),
u′′ = u ◦ u′ ◦ u−1 .
On peut alors démontrer les théorèmes suivants.
Théorème 4 Si dim E ≥ 3, deux transvections sont conjuguées dans SL(E).
Les transvections u′ et u′′ étant données de droites respectives D ′ et D ′′ et d’hyperplans H ′ et H ′′ , on
a les cas suivants :
1) D ′ = D ′′ et H ′ 6= H ′′ . Alors u′ et u′′ sont conjuguées d’après le lemme 4.
2) D ′ = D′′ et H ′ = H ′′ . On choisit une transvection u1 de droite D ′ et d’hyperplan H1 distinct de
H ′ . Alors, d’après le cas précédent, les transvections u et u1 sont conjuguées, ainsi que u1 et u′′ . Il en
résulte que u′ et u′′ sont conjuguées.
3) D ′ 6= D ′′ . D’après le lemme 3 il existe une transvection u1 de droite D′′ telle que u et u1 soient
conjuguées. Alors u1 et u′′ sont conjuguées d’après 1) ou 2) et u′ et u′′ le sont aussi.
AD 22
Théorème 5 Si dim E = 2, les propriétés suivantes sont équivalentes
i) pour tout couple (u, u′ ) de transvections de E, les transvections u et u′ sont conjuguées dans
SL(E),
ii) pour tout a de K l’équation
X2 = a
a une solution dans K.
Deux transvections sont conjuguées dans GL(E). Donc si u et u′ sont deux transvections, il existe v
dans GL(E) tel que
u′ = v ◦ u ◦ v −1 .
Soit alors a′ une solution de l’équation
X 2 = det v .
Posons
w = a′−1 v .
Alors, on a encore,
u′ = w ◦ u ◦ w−1 ,
avec
det w = (a′−1 )2 det v = 1 .
Donc u et u′ sont conjugués dans SL(E).
Réciproquement, supposons que deux transvections quelconques soient conjuguées dans SL(E).
Soit a dans K∗ , et soit une transvection
u = I + e∗ f .
Prenons une base (f, g) de E telle que
e∗ (g) = 1 .
1 1
La matrice de u dans cette base est
.
0 1
Soit u′ la transvection
u′ = I + e′∗ f ′
avec
f′ = f − g
et e′∗ (f ) = e′∗ (g) = a .
On a
u′ (f ) = (1 + a)f − ag et u′ (g) = af + (1 − a)g ,
1+a
a
′
et la matrice de u dans la base (f, g) est
.
−a 1 − a
Les transvections u et u′ étant conjuguées dans SL(E), il existe v telle que
u′ = v ◦ u ◦ v −1 ,
AD 23
avec
det v = 1 .
p q
Notons
la matrice de v. On a donc
r s
det v = ps − rq = 1 .
En effectuant le calcul, la matrice de v ◦ u ◦ v −1 vaut
p q 1+a
a
s −q
1 − pr
p2
,
=
r s
−a 1 − a −r p
−r 2 1 + pr
et en identifiant
1+a
a
1 − pr
p2
,
=
−r 2 1 + pr
−a 1 − a
ce qui donne en particulier
p2 = a .
Donc, tout élément de K∗ , donc de K, possède une racine carrée.
Remarque : si K est algébriquement clos, le résultat précédent est donc vrai. Il l’est aussi dans le cas
de Z/2Z pour lequel
GL(E) = SL(E) .
Par contre, cela est faux dans R et dans Z/pZ avec p premier impair. En effet, dans ce dernier cas
(p − 1)2 = p2 − 2p + 1 = 1 .
Donc l’application qui à q associe q 2 n’est pas injective, donc pas surjective, et l’équation
X2 = a
n’a pas toujours de solution.
Téléchargement