Étude du groupe symplectique

publicité
Étude du groupe symplectique
Astrid Beau et Sandrine Henri
sous la direction de Bachir Bekka
mai 2008
Table des matières
1
Notations
1
I
Étude algébrique
1
2
Définitions et propriétés de base
1
3
Forme des matrices symplectiques
3.1 Centre de Spn (K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Stabilité de Spn (K) par transposition . . . . . . . . . . . . . . . . . . . . . . . .
3
4
4
4
Génération par les transvections symplectiques
5
5
Simplicité du groupe PSpn (K)
6
II
Étude topologique
7
6
Réduction de l’étude
8
7
Étude de K(R) et K(C)
7.1 L’algèbre à division des quaternions . . . .
7.2 Propriétés d’orthogonalité . . . . . . . . .
7.3 Une propriété de U(m) . . . . . . . . . . .
7.4 Propriétés topologiques de SU(m) et Sp(m)
8
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Connexité et groupes fondamentaux de Spn (R) et Spn (C)
Références
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
10
11
13
13
14
14
Notations
Dans tout ce document, nous utiliserons les notations suivantes :
– K est un corps,
– E est un K-espace vectoriel de dimension finie,
– n est la dimension de E,
1
–
–
–
–
–
–
–
–
–
–
lorsque n est pair, on notera m = n2 ,
GL(E) est le groupe des automorphismes de E,
Mn (K) est l’algèbre des matrices de taille n à coefficients dans K,
GLn (K) est le groupe des matrices inversibles de taille n à coefficients dans K,
SLn (K) est le sous-groupe de GLn (K) des matrices de déterminant 1,
O(n) est le groupe orthogonal réel, c’est-à-dire le groupe des matrices réelles inversibles A
de taille n telles que A−1 = tA, et SO(n) est le groupe spécial orthogonal,
U(n) est le groupe unitaire complexe, c’est-à-dire le groupe des matrices complexes inversibles A de taille n telles que A−1 = tĀ, et SU(n) est le groupe spécial unitaire,
on notera parfois Sn l’espace des matrices symétriques réelles et Hn celui des matrices
hermitiennes,
le groupe symplectique, défini dans ce document, sera noté Spn (K),
l’algèbre de Lie de Spn (K) sera notée spn (K).
Première partie
Étude algébrique
2
Définitions et propriétés de base
Soit f : E × E → K une forme bilinéaire sur E.
Définition 1 (Groupe orthogonal). L’ensemble
O(E, f ) = {g ∈ GL(E), f (g(x), g(y)) = f (x, y) ∀x, y ∈ E}
est un sous-groupe de GL(E), appelé groupe orthogonal de f .
Dans la suite, à défaut de précision, on supposera f alternée, c’est-à-dire vérifiant pour tous x, y ∈
E, f (x, y) = −f (y, x) (si la caractéristique du corps K est 2, on impose en outre f (x, x) = 0,
condition qui est impliquée par la première si la caractéristique est différente de 2). On la suppose
également non dégénérée, c’est-à-dire, si x ∈ E vérifie ∀y, f (x, y) = 0, alors x = 0.
Définition 2 (Groupe symplectique). Supposons f alternée et non dégénérée. Le groupe orthogonal associé à f , noté Sp(E, f ), est appelé groupe symplectique.
Nous allons montrer que, à isomorphisme près, le groupe symplectique ne dépend pas de la forme
bilinéaire alternée f choisie.
Lemme 3. S’il existe des formes bilinéaires alternées et non dégénérées sur E, la dimension n de
E est nécessairement paire.
Démonstration. Ce lemme découle du théorème de Sylvester (proposition 7, page 3). Mais dans
le cas où la caractéristique de K est différente de 2, nous pouvons en donner une preuve directe.
Soit f une forme bilinéaire alternée non dégénérée sur E. Notons A ∈ Mn (K) la matrice de
f dans une base quelconque. On a f (x, y) = txAy = −f (y, x) = − tyAx = − t( tx tAy),
ceci pour tous x, y ∈ E. On en déduit que A = − tA. Puis en prenant le déterminant, on a
det(A) = (−1)n det(A). Le fait que f soit non dégénérée assure que det(A) 6= 0, et donc que
(−1)n = 1 c’est-à-dire que n est pair.
Dans toute la suite, on notera m = n/2.
2
Notation. Si f est une forme bilinéaire quelconque et E1 un sous-espace vectoriel de E, on notera
⊥
E1 f (ou plus simplement E1⊥ si la forme bilinéaire est clairement sous-entendue) le sous-espace
⊥
défini par E1 f = {x ∈ E, ∀y ∈ E1 , f (x, y) = 0}.
Lemme 4. Soit E1 un sous-espace vectoriel de E, et soit f une forme bilinéaire non dégénérée
⊥
quelconque. Alors dim E1 f = n − dim E1 .
Démonstration. Soit Φ : E → E ∗ définie par Φ(x) : y 7→ f (x, y). C’est un isomorphisme.
En effet, ker Φ = {x ∈ E, ∀y ∈ E, f (x, y) = 0} = {0} car f est non dégénérée, et de plus,
dim E = dim E ∗ . Considérons
Φ̃ : E1⊥ →
(E/E1 )∗
x 7→ (y + E1 7→ f (x, y))
Cette application est bien définie, car si z ∈ E1 , pour tout x ∈ E1⊥ et y ∈ E, f (x, y + z) =
f (x, y) + f (x, z) = f (x, y). Montrons qu’il s’agit également d’un isomorphisme. On a ker Φ̃ =
{x ∈ E1⊥ , ∀y ∈ E, f (x, y) = 0} = {0} puisque f est non dégénérée. Maintenant, soit ϕ ∈
(E/E1 )∗ . Notons p : E → E/E1 la projection canonique. Alors ϕ ◦ p ∈ E ∗ . Comme Φ est
surjective, il existe x ∈ E tel que ϕ ◦ p = Φ(x), c’est-à-dire ϕ(y + E1 ) = f (x, y) pour tout
y ∈ E. En particulier, pour tout y ∈ E1 , f (x, y) = ϕ(E1 ) = 0. En en déduit que x ∈ E1⊥ . Donc
ϕ = Φ̃(x).
Ainsi, Φ̃ est un isomorphisme, ce qui entraîne que dim E1⊥ = dim(E/E1 )∗ = dim E −
dim E1 .
Définition 5 (Plan hyperbolique). Soit P un plan vectoriel de E. On dit que P est un plan hyperbolique de E muni de la forme bilinéaire alternée non dégénérée f s’il existe une base (x0 , y0 ) de
P vérifiant f (x0 , y0 ) = 1 (on a évidemment également f (x0 , x0 ) = f (y0 , y0 ) = 0). Un tel couple
sera appelée couple hyperbolique.
Remarque. Bien évidemment, l’image d’un couple hyperbolique par une transformation symplectique est un couple hyperbolique.
Lemme 6. Soit P un plan hyperbolique. Alors F = P ⊥ vérifie les propriétés suivantes :
– dim F = n − 2,
– E = P ⊕ F,
– f|F est non dégénérée.
Démonstration. Le fait que dim F = n − 2 vient du lemme 4. Pour montrer que E = P ⊕ F , il
reste simplement à montrer que P ∩ F = {0}. Soit x ∈ P ∩ F . D’une part, x s’écrit sous la forme
x = αx0 + βy0 , où (x0 , y0 ) est une base hyperbolique de P . D’autre part, 0 = f (x, x0 ) = −β et
0 = f (x, y0 ) = α. Donc x = 0.
Enfin, montrons que f|F est non dégénérée. Soit x ∈ F tel que f (x, y) = 0 pour tout y ∈ F .
Alors pour tous α, β ∈ K, f (x, y + αx0 + βy0 ) = f (x, y) + αf (x, x0 ) + βf (x, y0 ) = 0. Or, on
a montré précédemment que E = P ⊕ F . Donc f (x, z) = 0 pour tout z ∈ E. Comme f est non
dégénérée, x = 0.
Proposition 7 (Théorème de Sylvester). Soit f une forme bilinéaire alternée non dégénérée. Alors
il existe une base de E dans laquelle la matrice de f est
0
Im
J =
.
−Im 0
3
Démonstration. On raisonne par récurrence sur m. Plus précisémement, on montre que E est
somme directe de m plans hyperboliques.
Montrons tout d’abord que E contient toujours un plan hyperbolique. Soit x1 ∈ E\{0}.
Comme f est non dégénérée, il existe y ∈ E tel que λ = f (x1 , y) 6= 0. Posons y1 = λy . On
a f (x1 , y1 ) = 1, et nécessairement, y1 est non colinéaire à x1 sinon on aurait f (x1 , y1 ) = 0. Donc
P1 = Vect(x1 , y1 ) est un plan hyperbolique.
Si m = 1, E est donc lui-même un plan hyperbolique. La matrice de f dans la base (x1 , y1 )
est alors
0 1
−1 0
qui est bien la matrice J de taille 2.
Supposons maintenant m > 2. Soit P1 un plan hyperbolique de E. Posons F = P1⊥ . Le
lemme 6 assure que E = P1 ⊕ F , et que de plus, f|F est non dégénérée. L’hypothèse de récurrence
appliquée à F donne alors F = P2 ⊕ · · · ⊕ Pm . Pour i ∈ {1, . . . , m}, notons (xi , yi ) une base
hyperbolique de Pi . La matrice de f dans la base (y1 , y2 , . . . , ym , x1 , x2 , . . . xm ) est
0
Im
−Im 0
c’est-à-dire ce que l’on voulait.
Une base construite comme ci-dessus sera appelée base symplectique de E.
La proposition 7 assure que pour tout K-espace vectoriel E de dimension n et toute forme bilinéaire f alternée et non dégénérée sur E, le groupe Sp(E, f ) est isomorphe au groupe Spn (K) =
{g ∈ GLn (K), tgJ g = J }, que l’on appelera groupe symplectique d’ordre n.
3
Forme des matrices symplectiques
Si M ∈ Mn (K) (n = 2m), on écrit M sous forme d’une matrice par blocs :
U V
M=
W T
avec U, V, W, T ∈ Mm (K). Cherchons des conditions nécessaires et suffisantes sur U , V , W et
T pour que M ∈ Spn (K)).
On a M ∈ Spn (K) si et seulement si tM J M = J , ce qui s’écrit
t
U W − tW U tU T − tW V
0
Im
=
tV W − tT U
tV T − tT V
−Im 0
c’est-à-dire tU W = tW U , tV T = tT V et tU T − tW V = Im .
3.1
Centre de Spn (K)
La caractérisation donnée précédemment nous permet de voir que, en particulier, les matrices
suivantes sont des matrices symplectiques :
U
0
MU =
, U ∈ GLm (K)
0 tU −1
Im 0
Im Im
J1 =
et J2 =
0 Im
Im Im
Ces matrices nous suffiront à déterminer Z(Spn (K)).
4
Proposition 8. Le centre Z(Spn (K)) est formé uniquement de In et −In .
Démonstration. Tout d’abord, il est évident que In et −In sont des élements de Z(Spn (K)).
Réciproquement, soit Z ∈ Z(Spn (K)). On écrit Z sous la forme
A B
Z=
C D
avec A, B, C, D ∈ Mm (K). Le fait que Z commute avec J1 s’écrit
A A+B
A+C B+D
=
C C +D
C
D
ce qui donne C = 0 et A = D. De même, en exprimant que Z commute J2 , on obtient B = 0.
Puis, comme Z commute avec les matrices MU , on a
AU B tU −1
UA
UB
=
tU −1 C
tU −1 D
CU D tU −1
pour toute U ∈ GLm (K), et en particulier AU = U A, c’est-à-dire A ∈ Z(GLm (K)). Ainsi, A
est nécessairement une homothétie. Notons λ son rapport. Exprimons enfin le fait que Z est dans
le groupe symplectique. D’après la caractŕisation vue précédemment, on a tAA = Im , ce qui est
équivalent à λ2 = 1, et donc λ = ±1.
3.2
Stabilité de Spn (K) par transposition
Montrons que si A ∈ Spn (K) alors tA ∈ Spn (K). Tout d’abord, on remarque que J 2 =
−In . Donc J est inversible et J −1 = −J . En inversant l’égalité tAJ A = J , on obtient
A−1 J −1 tA−1 = J −1 , c’est-à-dire A−1 J tA−1 = J . Donc tA−1 ∈ Spn (K), et comme Spn (K)
est un groupe, tA ∈ Spn (K).
4
Génération par les transvections symplectiques
Définition 9 (Transvection). On appelle transvection de E un endomorphisme τ de la forme
τ (x) = x + ϕ(x)v
où ϕ est une forme linéaire sur E et v ∈ ker(ϕ) un vecteur fixé.
À quelle condition une transvection appartient-elle au groupe symplectique Sp(E, f ) ? C’est
ce que nous allons déterminer ici. Soit τ (x) = x+ϕ(x)v une telle transvection. On a f (τ (x), τ (y)) =
f (x, y) pour tous x, y, c’est-à-dire ϕ(y)f (x, v) = ϕ(x)f (y, v). Ceci étant vrai pour tout y, on peut
0)
choisir un y0 tel que f (y0 , v) 6= 0. On obtient alors ϕ(x) = cf (x, v) pour tout x, avec c = fϕ(y
(y0 ,v) .
On en déduit que τ est de la forme
τ (x) = x + cf (x, v)v.
Inversement, on vérifie aisément que toute transformation de cette forme est bien symplectique.
Nous avons donc la définition suivante :
Définition 10 (Transvection symplectique). Soit τ : E → E une application linéaire. Soit v ∈ E.
On dit que τ est une transvection symplectique de direction v s’il existe c ∈ K tel que pour tout
x ∈ E, τ (x) = x + cf (x, v)v.
5
Le but de ce qui suit sera de montrer que les transvections symplectiques engendrent le groupe
symplectique. Pour cela, notons G le sous-groupe de Sp(E, f ) engendré par les transvections
symplectiques. Nous allons tout d’abord, en quelques étapes, établir le résultat suivant : si (v1 , w1 )
et (v2 , w2 ) sont deux couples hyperboliques, il existe τ ∈ G tel que τ (v1 ) = v2 et τ (w1 ) = w2 .
Lemme 11. Soient w1 et w2 deux vecteurs non nuls de E. Alors il existe τ ∈ G tel que τ (w1 ) =
w2 .
Démonstration. Supposons dans un premier temps que f (w1 , w2 ) 6= 0. On pose alors
τ (x) = x +
1
f (x, w2 − w1 )(w2 − w1 ).
f (w1 , w2 )
(1)
L’application τ est une transvection symplectique, et on vérifie aisément que τ (w1 ) = w2 .
Plaçons-nous maintenant dans le cas où f (w1 , w2 ) = 0. Montrons qu’il existe w3 ∈ E tel que
f (w1 , w3 ) 6= 0 et f (w2 , w3 ) 6= 0. Si w1⊥ = w2⊥ , tout élément w3 6∈ w1⊥ convient. Maintenant,
si w1⊥ 6= w2⊥ , d’après le lemme 4, ce sont tous les deux des hyperplans, donc aucun n’est inclus
dans l’autre. Soit w20 ∈ w1⊥ \w2⊥ et soit w10 ∈ w2⊥ \w1⊥ . On pose w3 = w10 + w20 ; on a f (w1 , w3 ) =
f (w1 , w10 ) 6= 0 et f (w2 , w3 ) = f (w2 , w20 ) 6= 0. D’après le premier cas, il existe τ1 telle que
τ1 (w1 ) = w3 , puis τ2 telle que τ2 (w3 ) = w2 . Donc τ = τ2 ◦ τ1 envoie bien w1 sur w2 .
Lemme 12. Soient v, w1 , w2 des vecteurs tels que (v, w1 ) et (v, w2 ) soient des couples hyperboliques. Il existe τ ∈ G tel que τ (v) = v et τ (w1 ) = w2 .
Démonstration. Tout d’abord, si f (w1 , w2 ) 6= 0, alors la transvection (1) convient. En effet, on
sait qu’elle envoie w1 sur w2 . De plus, τ (v) = v− f (w11,w2 ) f (v, w2 −w1 )(w2 −w1 ), avec f (v, w2 −
w1 ) = 1 − 1 = 0, d’où τ (v) = v. Maintenant, si f (w1 , w2 ) = 0, on considère v + w1 . D’une
part, (v, v + w1 ) est lui aussi un couple hyperbolique. D’autre part, f (w1 , v + w1 ) = f (w1 , v) =
−1 6= 0, et d’après le premier cas, il existe τ1 telle que τ1 (v) = v et τ1 (w1 ) = v + w1 . Mais
on a également f (v + w1 , w2 ) = f (v, w2 ) = 1 6= 0. Il existe donc τ2 telle que τ2 (v) = v et
τ2 (v + w1 ) = w2 . Ainsi, τ = τ2 ◦ τ1 convient.
Lemme 13. Soient (v1 , w1 ) et (v2 , w2 ) deux couples hyperboliques. Alors il existe τ ∈ G tel que
τ (v1 ) = v2 et τ (w1 ) = w2 .
Démonstration. D’après le lemme 11, il existe τ1 ∈ G tel que τ1 (v1 ) = v2 . Soit w3 = τ1 (w1 ).
Le couple (v2 , w3 ) est encore un couple hyperbolique. Le lemme 12 assure alors l’existence de
τ2 ∈ G tel que τ2 (v2 ) = v2 et τ2 (w3 ) = w2 . Donc τ = τ2 ◦ τ1 convient.
Théorème 14. Le groupe Sp(E, f ) est engendré par les transvections symplectiques.
Démonstration. Il s’agit de montrer que G = Sp(E, f ). Soit (x1 , . . . , xm , y1 , . . . , ym ) une base
0 les images des éléments
symplectique de E. Soit σ ∈ Sp(E, f ). On note x01 , . . . , x0m , y10 , . . . , ym
0
0
0
0
de la base par σ. La famille (x1 , . . . , xm , y1 , . . . , ym ) est également une base symplectique. Montrons qu’il existe τ ∈ G tel que pour tout i, τ (xi ) = x0i et τ (yi ) = yi0 . On raisonne par récurrence.
D’après le lemme 13, il existe τ1 ∈ G tel que τ1 (x1 ) = x01 et τ1 (y1 ) = y10 . Supposons que l’on
a construit τi ∈ G tel que τi (xj ) = x0j et τi (yj ) = yj0 pour tout j 6 i. Pour j > i, on note
00 , . . . , y 00 ) est
x00j = τi (xj ) et yj00 = τi (yj ) ; la famille (x01 , . . . , x0i , x00i+1 , . . . , x00m , y10 , . . . , yi0 , yi+1
m
une base symplectique. Considérons le sous-espace vectoriel Ei engendré par x01 , . . . , x0i , y10 , . . . yi0 .
L’espace Ei⊥ contient alors les x0j , yj0 , x00j et yj00 pour j > i. De plus, Ei étant une somme directe de
plans hyperboliques, une généralisation simple du lemme 6 assure que E = Ei ⊕ Ei⊥ . Le lemme
13 appliqué à l’espace vectoriel Ei⊥ nous donne un produit τ̃ de transvections symplectiques de
00 ) = y 0 . On compléte τ̃ en τ 0 = id ⊕ τ̃ , qui est un produit
Ei⊥ tel que τ̃ (x00i+1 ) = x0i+1 et τ̃ (yi+1
Ei
i+1
6
de transvections symplectiques de E laissant fixes les éléments de Ei . On pose τi+1 = τ 0 ◦ τi , et
on a τi+1 (xj ) = x0j et τi+1 (yj ) = yj0 pour tout j 6 i + 1, ce qui conclut la récurrence.
0 ). Les
Ainsi, τ = τm envoie la base (x1 , . . . , xm , y1 , . . . , ym ) sur (x01 , . . . , x0m , y10 , . . . , ym
applications linéaires τ et σ prenant les mêmes valeurs sur une base, elles sont égales. On en
déduit que σ ∈ G, et le résultat annoncé.
5
Simplicité du groupe PSpn (K)
Définition 15 (Groupe projectif symplectique). On appelle groupe projectif symplectique le groupe
quotient Spn (K)/Z(Spn (K)), où Z(Spn (K)) désigne le centre de Spn (K).
Dans cette partie nous allons montrer que le groupe PSpn (K) est simple (sauf dans quelques
cas particuliers), c’est-à-dire qu’il ne possède pas de sous-groupe distingué autre que {0} et luimême. C’est un corollaire du théorème suivant :
Théorème 16. Soit N un sous-groupe distingué de Spn (K). Alors soit N ⊂ Z(Spn (K)), soit
N = Spn (K), excepté pour K = F2 ou F3 .
Démonstration. Nous allons commencer par traiter le cas n = 2, qui sera utile par la suite. Dans
ce cas, l’espace E est un plan hyperbolique. Soit (u, v) une base hyperbolique de ce plan. Soient
σ ∈ GLn (K) et α, β, γ, δ ∈ K tels que σ(u) = αu + βv et σ(v) = γu + δv. Alors σ est dans
Spn (K) si et seulement si f (σ(u), σ(v)) = f (u, v) = 1, ce qui équivaut à αδ − βγ = 1, c’est-àdire det σ = 1. Ceci montre que Sp2 (K) = SL2 (K). Or, le groupe SL2 (K), pour K différent de F2
et F3 , vérifie l’équivalent du théorème 16 (nous admettons ce résultat). Ceci établit notre énoncé
pour n = 2.
Pour la suite, nous aurons besoin du lemme suivant :
Lemme 17. Soit a ∈ E un vecteur non nul. Alors si N contient toutes les transvections symplectiques de direction a, elle contient toutes les transvections symplectiques.
La démonstration du résultat ci-dessus utilise le lemme 11. Ainsi, si b est un autre vecteur non
nul, il existe un produit de transvections symplectiques τ tel que τ (a) = b. Lorsque σ parcourt
les transvections de direction a, τ στ −1 parcourt les transvections de direction b. Or, si σ ∈ N ,
comme N est distingué, τ στ −1 ∈ N . Donc N contient toutes les transvections de direction b, et
par suite, toutes les transvections.
Revenons maintenant à la démonstration du théorème. On suppose désormais que N 6⊂ Z(Spn (K)),
et on cherche à montrer que N = Spn (K). D’après ce qui précède, et en utilisant le fait que
les transvections symplectiques engendrent Spn (K), il suffit de montrer qu’il existe a tel que N
contienne toutes les transvections de direction a. Nous allons partir de la remarque suivante : si
un endomorphisme σ fixe toutes les droites, alors c’est une homothétie, c’est-à dire un élément du
centre de L(E). L’hypothèse N 6⊂ Z(Spn (K)) se traduit donc par l’existence d’un σ qui déplace
au moins une droite, dont on note a un générateur. Soit b = σ(a). Montrons tout d’abord que l’on
peut se ramener au cas où f (a, b) 6= 0. En effet, supposons que f (a, b) = 0. Par hypothèse, σ
déplace la droite Vect(a) donc Vect(a) 6= Vect(b), et par suite Vect(a)⊥ 6= Vect(b)⊥ . Donc il
existe b0 tel que b0 ∈ Vect(b)⊥ et b0 6∈ Vect(a)⊥ . Alors f (b, b0 ) = 0 mais f (a, b0 ) 6= 0, et on peut
supposer f (a, b0 ) = 1. On considère alors la transvection
η(x) = x + f (b0 − a, x)(b0 − a).
On a η(a) = a + (b0 − a) = b0 et η(b) = b. L’élément σ 0 = ησ −1 η −1 σ est dans N , et vérifie
σ 0 (a) = b0 . Quitte à remplacer σ par σ 0 et b par b0 , on peut donc bien supposer f (a, b) 6= 0.
7
Maintenant, soit τ la transvection τ (x) = x + f (a, x)a, et soit ρ = τ στ −1 σ −1 . Alors ρ ∈ N
et
ρ(b) = τ στ −1 (a) = τ σ(a) = τ (b) = b + f (a, b)a.
(2)
La transvection τ laisse fixe tout vecteur orthogonal à a, et στ −1 σ −1 laisse fixe tout vecteur orthogonal à b, car si f (x, b) = 0, f (σ −1 (x), a) = 0 donc τ −1 σ −1 (x) = σ −1 (x) puis στ −1 σ −1 (x) =
x. Le produit ρ laisse donc fixe tout vecteur orthogonal au plan P = Vect(a, b). Ce plan est hyperbolique, puisque f (a, b) 6= 0, et donc E = P ⊕ P ⊥ . On peut écrire ρ sous la forme ρ = ρ1 ⊕ idP ⊥ .
L’équation (2) montre que ρ1 ne laisse pas fixe la droite Vect(b), et donc ρ1 6∈ Z(Sp2 (K)). Posons
Ñ = {ξ ∈ Sp2 (K), ξ ⊕ idP ⊥ ∈ N }.
Le sous-groupe Ñ de Sp2 (K) n’est pas inclus dans le centre, et est distingué. D’après le cas
n = 2 étudié précédemment, Ñ = Sp2 (K). En particulier, N contient toutes les transvections de
direction a. Le lemme 17 permet de conclure.
Remarque. Ce théorème est vrai également si K = F2 , sauf pour n = 2 ou n = 4, et pour K = F3 ,
sauf pour n = 2. Les cas concernés se traitent à part, nous les admettons ici. Le théorème permet de
montrer la simplicité de PSpn (K) par passage au quotient, à l’exception de PSp2 (F2 ), PSp2 (F3 )
et PSp4 (F2 ). On peut montrer que ces trois groupes ne sont pas simples.
Deuxième partie
Étude topologique
Dans toute cette partie, le corps de base K sera égal à R ou C. Le but est de déterminer les groupes
fondamentaux de Spn (R) et Spn (C).
Proposition 18. Le groupe Spn (K) est un sous-groupe topologique et une sous-variété de GLn (K).
6
Réduction de l’étude
Lemme 19. L’application exponentielle exp réalise un homéomorphisme entre l’ensemble des
matrices symétriques (resp. hermitiennes) et l’ensemble des matrices symétriques définies positives (resp. hermitiennes définies positives).
Démonstration. Tout d’abord, l’application exp est surjective. En effet, si A est symétrique (resp.
hermitienne) définie positive, elle est diagonalisable sous la forme


λ1
(0)

 −1
..
A=P
P
.
(0)
λn
où les λi sont des réels strictement positifs. Alors A = exp(B) avec


log λ1
(0)

 −1
..
B=P
P ,
.
(0)
log λn
la matrice B étant bien symétrique (resp. hermitienne).
8
Montrons maintenant l’injectivité. Si S1 et S2 sont des matrices symétriques (resp. hermitiennes) telles que exp(S1 ) = exp(S2 ), leurs valeurs propres (qui sont réelles) ont même exponentielle donc sont égales. Pour conclure que S1 = S2 , il suffit de montrer qu’elles sont simultanément diagonalisables, c’est-à-dire qu’elles commutent. Or, S1 est un polynôme en exp(S1 ) :
il suffit de considérer un polynôme de Lagrange qui envoie eλi sur λi où les λi sont les valeurs
propres de S1 . De même, S2 est un polynôme en exp(S2 ). Ainsi, S1 et S2 sont des polynômes en
la même matrice, donc commutent.
L’exponentielle est continue, il reste à montrer qu’elle est bicontinue sur les espaces qui nous
intéressent. Pour cela, on considère une suite (Ap ) tendant vers A, Ap et A étant des matrices
symétriques (resp. hermitiennes) définies positives. On considère également les matrices Bp et
B symétriques (resp. hermitiennes) telles que Ap = exp(Bp ) et A = exp(B), et on cherche à
montrer que (Bp ) converge vers B. Pour cela, on va établir que (Bp ) est bornée et que toute suite
extraite convergente converge vers B, ce qui conclura par un argument de compacité. La deuxième
affirmation est immédiate : si (Bpk ) converge vers C, alors (Apk ) converge vers exp(C) ; comme
cette suite converge également vers exp(B), on a exp(C) = exp(B) et par injectivité, B = C.
Montrons maintenant que (Bp ) est bornée. Tout d’abord, notons
χAp = X n + a(n−1)
X n−1 + · · · + a(0)
p
p ,
χA = X n + a(n−1) X n−1 + · · · + a(0)
(i)
les polynômes caractéristiques de Ap et A. La suite (χAp ) converge vers χA , c’est-à-dire (ap )p
(i)
tend vers a(i) pour i de 0 à n − 1. En particulier, les suites (ap )p sont bornées. Notons M un
majorant commun à ces n suites. Si z est une racine de Ap telle que |z| > 1, on a
(n−1)
1+
donc
ap
z
(0)
+ ··· +
ap
=0
zn
(0) a(n−1)
a
nM
p
p 1=
+ ··· + n 6
z
z |z|
et il s’ensuit que |z| 6 nM . L’ensemble des racines de χAp , qui est l’ensemble des valeurs
propres de Ap , est donc borné indépendamment de p. En appliquant le même raisonnement à
A−1
p , on obtient que l’ensemble {1/λ, ∃p, λ vp de Ap } est également borné. Finalement, l’ensemble {log λ, ∃p, λ vp de Ap } est borné. Or, cet ensemble est l’ensemble des valeurs propres
des matrices Bp . En outre, Bp étant symétrique (resp. hermitienne), elle est diagonalisable en
base orthonormée (resp. unitaire), et il est évident que l’ensemble des matrices orthogonales (resp.
unitaires) est borné dans Mn (K). On en déduit que la suite (Bp ) est bornée, comme annoncé.
Théorème 20. Soit K(C) l’intersection du groupe Spn (C) et du groupe unitaire U(n) et K(R)
celle du groupe Spn (R) et du groupe orthogonal O(n). Alors Spn (C) est homéomorphe au produit
direct K(C) × Rd et Spn (R) au produit direct K(R) × Re pour certains entiers d et e.
Démonstration. La démonstration fait appel à la propriété connue suivante, que nous ne démontrerons pas :
Lemme 21 (Décomposition polaire). Soit A ∈ GLn (R) (resp. GLn (C)). Alors il existe une unique
matrice Ω orthogonale (resp. unitaire) et une unique matrice S symétrique définie positive (resp.
hermitienne définie positive) telles que A = ΩS, ou, d’après le lemme 19, une unique matrice s
symétrique (resp. hermitienne) telle que A = Ω exp(s).
Soit A ∈ Spn (K) et soit A = Ω exp(s) la décomposition polaire de A dans GLn (K). Montrons que Ω et S = exp(s) sont également des matrices symplectiques. Tout d’abord, rappelons
9
que Spn (K) est stable par transposition. En outre, dans le cas où K = C, il est immédiat de voir
que Spn (C) est stable par conjugaison, et donc par transconjugaison. Donc tĀA = S 2 ∈ Spn (K),
et par conséquent, pour tout k ∈ Z, S 2k ∈ Spn (K). Nous allons en déduire que S ∈ Spn (K).
Tout d’abord, soit P ∈ GLn (K) une matrice telle que D = P SP −1 soit diagonale, et notons
λ1 , . . . , λn les coefficients diagonaux de D. Le fait que S 2k ∈ Spn (K) s’écrit
t
P D2k tP −1 J P −1 D2k P = J ,
ce qui se traduit par des équations de la forme
C0 +
n
X
Cj λ2k
j =0
(3)
j=1
pour tout k ∈ Z. On a le lemme suivant :
Lemme 22. Soient λ1 , . . . , λn et C0 , C1 , . . . , Cn tels que l’équation (3) soit vérifiée pour tout
k ∈ Z. Alors elle est également vérifiée pour tout k ∈ R.
Posons λ0 = 1. Pour démontrer ce lemme, on commence par se ramener au cas où les λj ,
j = 0, 1, . . . , n sont deux à deux distincts, en regroupant les Cj correspondant à un même λj .
Alors, les équations (3) pour k entre 0 et n s’écrivent à l’aide d’une matrice de Vandermonde de
paramètres λ20 , λ21 , . . . , λ2n :


  
1
1 ···
1
C0
0
 λ2 λ2 · · · λ2   C1   0 
n 
1
  
 0
 ..
..
..   ..  =  .. 
 .
.
.  .   . 
2n
2n
2n
λ 0 λ 1 · · · λn
Cn
0
Une telle matrice de Vandermonde, de paramètres tous distincts, est inversible, et on en déduit que
les Cj sont nuls. Ainsi, l’équation est bien vérifiée pour tout k ∈ R.
Ce lemme, appliqué à la situation du théorème, entraîne que ∀t ∈ R, S 2t = exp 2ts ∈ Spn (K).
En particulier, pour t = 12 , on a S ∈ Spn (K), mais de manière plus générale, on obtient s ∈
spn (K). La décomposition polaire est un homéomorphisme, ainsi que la restriction à Sn ∩ spn (R)
(resp. Hn ∩ spn (C)) de l’exponentielle (on rappelle que Sn et Hn désignent respectivement l’ensemble des matrices symétriques réelles et des matrices hermitiennes complexes). D’autre part,
Sn (resp. Hn ) et spn (K) sont des R-espaces vectoriels1 , donc l’intersection Sn ∩ spn (R) (resp.
Hn ∩ spn (C)) est un certain Rd pour un entier d. D’où l’homéomorphisme :
K(R) × Rd ' K(R) × (Sn ∩ spn (R)) → Spn (R)
(Ω, s) 7→ Ω exp(s)
et son équivalent dans le cas complexe.
Ainsi, on ramène l’étude topologique de Spn (K) à celle de K(K).
Étude de K(R) et K(C)
7
7.1
L’algèbre à division des quaternions
Définition 23 (quaternions). L’algèbre des quaternions, notée H, est l’ensemble des éléments de la
forme {a + bi + cj + dk, a, b, c, d ∈ R} où i, j, k vérifient les relations i2 = j 2 = k 2 = ijk = −1.
L’addition et la multiplication sur cet ensemble sont alors uniquement définies par les propriétés
de R-algèbre.
1
Hn est un espace vectoriel réel, mais pas complexe : si H ∈ Hn , en général tiH = −iH 6= iH
10
Propriétés.
– Il y a unicité des réels a, b, c, d dans l’écriture d’un quaternion.
– On a les relations ij = −ji = k, jk = −kj = i, ki = −ik = j.
– Tout quaternion peut s’écrire de manière unique sous la forme q = z1 + z2 j, où z1 , z2 ∈ C,
en identifiant le i des quaternions au i complexe.
Définition 24 (conjugaison). Soit q = a+bi+cj+dk ∈ H. On appelle conjugué de q le quaternion
q̄ = a − bi − cj − dk.
Propriété. On vérifie facilement que q q̄ = q̄q = a2 + b2 + c2 + d2 ∈ R∗+ . Cette propriété entraîne
que H est une algèbre à division (ou corps non commutatif) : tout q = a + bi + cj + dk ∈ H non
1
nul admet pour inverse a2 +b2 +c
2 +d2 q̄.
7.2
Propriétés d’orthogonalité
Proposition 25. Les groupes topologiques K(R) et U(m) sont isomorphes en tant que groupes
topologiques.
Démonstration. Soit M ∈ Mm (C). On écrit M = U + iV avec U, V ∈ Mm (R). Alors M ∈
U(m) si et seulement si (U + iV )( tU − i tV ) = Im et ( tU − i tV )(U + iV ) = Im . En développant,
on en déduit que M ∈ U(m) si et seulement si
t
U V = tV U
et U tV = V tU
(4)
tU U + tV V = I
et U tU + V tV = Im
m
Soit maintenant A ∈ Mn (R). On écrit
A=
U
W
V
T
où U, V, W, T ∈ Mm (R). Alors A ∈ K(R) si et seulement si A ∈ Spn (R) et A ∈ O(n) ;
A ∈ Spn (R) est équivalent aux relations déterminées en section 3, page 3, à savoir
t
t
U T − tW V = Im
t
t
t
U W = W U et V T = T V.
(5)
(6)
En exprimant les égalités A tA = In et tAA = In en fonction de U, V, W, T , on déduit que
A ∈ O(n) si et seulement si
U tU + V tV = Im
t
t
W W + T T = Im
t
t
U W = −V T
(7)
(8)
(9)
et les égalités obtenues de celles-ci en échangeant les matrices et leurs transposées. En multipliant
l’égalité (7) à droite par T , on obtient U tU T + V tV T = T , puis, en utilisant (5), on obtient
U (Im + tW V ) + V tV T = T . D’autre part, en utilisant successivement (6) et (9), il vient :
U (Im + tW V ) + V tV T
= U (Im + tW V ) + V tT V
= U (Im + tW V ) − U tW V
= U.
11
D’où T = U . En multipliant (7) à gauche par tW , on obtient de manière similaire W = −V . Les
égalités (5) à (9) sont alors équivalentes à (4). Inversement, on vérifie facilement qu’une matrice
A de la forme
U V
A=
−V U
telle que U et V vérifient (4) est dans Spn (K) et dans O(n).
Ces considérations faites, on a un isomorphisme topologique naturel
K(R) → U(m)
U V
7→ U + iV
−V U
L’algèbre H est de dimension 4 sur R ; l’écriture q = z1 + z2 j permet de la voir également
comme un C-espace vectoriel de dimension 2. Plus généralement, le H-module Hm est un Cespace vectoriel isomorphe à C2m .
0 ) sont
Définition 26 (groupe orthogonal quaternionique). Si q = (q1 , . . . , qm ) et q 0 = (q10 , . . . , qm
deux éléments de Hm , on appelle produit quaternionique de q et q 0 le quaternion
q, q
0
=
m
X
ql ql0 .
l=1
On appelle groupe orthogonal quaternionique le groupe des endomorphismes C-linéaires de Hm
qui conservent le produit quaternionique. On note ce groupe Sp(m), ce qui est justifié par le
théorème suivant.
Théorème 27. Le groupe K(C) s’identifie au groupe orthogonal quaternionique Sp(m).
Démonstration. L’isomorphisme entre Hm et C2m = Cn , qui à (z1,1 + z2,1 j, . . . , z1,m + z2,m j)
associe (z1,1 , . . . , z1,m , z2,1 , . . . , z2,m ) permet de faire correspondre à un endomorphisme σ de
Hm un endomorphisme σ 0 de Cn . Il suffit de montrer σ ∈ Sp(m) si et seulement si σ 0 ∈ K(C).
Remarquons que si q = z1 + z2 j (z1 , z2 complexes), alors q̄ = z¯1 − j z¯2 , et j z¯2 = z2 j. Notons
ql = z1,l + z2,l j, Q le vecteur (q1 , . . . , qm ) de Hm , Z le vecteur (z1,1 , . . . , z1,m , z2,1 , . . . , z2,m ) de
Cn . On a [σ(Q)]l = [σ 0 (Z)]l + [σ 0 (Z)]m+l j. On en déduit que, pour l = 1, . . . , m,
[σ(Q)]l [σ(Q0 )]l = [σ 0 (Z)]l + [σ 0 (Z)]m+l j [σ 0 (Z 0 )]l − j[σ 0 (Z 0 )]m+l .
Pour alléger les notations, on note αl = [σ 0 (Z)]l et αl0 = [σ 0 (Z 0 )]l . On a donc
0
[σ(Q)]l [σ(Q0 )]l = (αl + αm+l j)(αl0 − jαm+l
)
0
0
= αl αl0 − αl jαm+l
+ αm+l jαl0 − αm+l j 2 αm+l
0
0
= αl αl0 + αm+l αm+l
+ (−αl αm+l
+ αm+l αl0 )j.
On a σ ∈ Sp(m) si et seulement si pour tous Q, Q0 , hσ(Q), σ(Q0 )i = hQ, Q0 i. Ceci est équivalent
à
m
m
X
X
0
0
0 + z z 0 + (z z 0 − z z 0 )j
+ (αm+l αl0 − αl αm+l
)j =
z1,l z1,l
αl αl0 + αm+l αm+l
2,l 2,l
2,l 1,l
1,l 2,l
l=1
l=1
⇔
hσ 0 (Z), σ 0 (Z 0 )i
=
hZ, Z 0 i
et
m
X
αm+l αl0
−
0
αl αm+l
=
l=1
ce qui est encore équivalent au fait que
σ0
m
X
l=1
∈ O(n) et
12
σ0
∈ Spn (C).
0
0
z2,l z1,l
− z1,l z2,l
7.3
Une propriété de U(m)
Proposition 28. Le groupe unitaire U(m) est homéomorphe au produit direct SU(m) × S1 .
Démonstration. Le cercle S1 est homéomorphe à l’ensemble des complexes de module 1. Ainsi,
les applications
U(m) → SU(m) × S1 U 7→ det1 U U, det U
ωS →7 (S, ω)
définissent l’homéomorphisme que nous cherchons.
7.4
Propriétés topologiques de SU(m) et Sp(m)
Proposition 29. Pour tout entier n > 1, l’espace quotient SU(n)/ SU(n − 1) est homéomorphe
à la sphère S2n−1 .
Démonstration. On identifie le vecteur (x1 , . . . , xn , y1 , . . . , yn ) de R2n au vecteur z = (x1 +
iy1 , . . . , xn + iyn ) de Cn (notons que les normes euclidiennes de ces deux vecteurs sont égales, et
donc S2n−1 s’identifie à la sphère unité de Cn ). Considérons l’action de SU(n) sur la sphère S2n−1
définie par A · z = Az. Cette action est bien définie car un endomorphisme unitaire conserve la
norme. En outre, elle est transitive : si z1 , z2 ∈ S2n−1 , on peut les compléter en des bases B1 et B2
unitaires. La matrice A qui envoie B1 sur B2 est unitaire et envoie z1 sur z2 . Quitte à multiplier le
dernier vecteur de B1 (qui n’est pas z1 car n > 2) par un complexe de module 1, on peut rendre A
spéciale unitaire.
Soit (e1 , . . . , en ) la base canonique de Cn . Cherchons le stabilisateur de e1 . Si Ae1 = e1 , alors
la première colonne de A est e1 . On écrit


B
1
 0



A= .

.
 .
C 
0
puis on exprime le fait que A est unitaire ; cela nous donne les relations B tB̄ = 0 (c’est-à-dire
||B||2 = 0, donc B = 0) et C tC̄ = tC̄C = In−1 (c’est-à-dire C ∈ U(n − 1)), et de plus,
det C = det A = 1 donc C ∈ SU(n − 1). Inversement, une matrice de cette forme vérifiant ces
conditions sur B et C est bien dans le stabilisateur de e1 . Ainsi, le stabilisateur de e1 est isomorphe
à SU(n − 1).
Le quotient du groupe par le stabilisateur étant homéomorphe à l’orbite, on en déduit que
SU(n)/ SU(n − 1) ' S2n−1 ,
ce que l’on voulait.
Proposition 30. Pour tout entier n > 0, l’espace quotient Sp(n)/ Sp(n − 1) est homéomorphe à
la sphère S4n−1 .
Démonstration. La démonstration est similaire à celle du cas réel (proposition 29). Le cas n = 1
qui posait alors problème ne pose pas problème ici.
Nous avons maintenant besoin de trois résultats généraux de topologie algébrique :
Théorème 31 (admis). La sphère Sk est connexe pour tout k et simplement connexe si k > 1 ; le
groupe fondamental de S1 est Z.
13
Théorème 32. Soient G un groupe topologique et H un sous-groupe fermé. Supposons que G/H
et H soient connexes. Alors G est connexe.
Démonstration. Soit U une partie de G ouverte et fermée. Pour tout a ∈ G, U ∩ aH est une
partie ouverte et fermée de aH. Comme aH ' H (en tant qu’espace topologique), il est connexe.
Donc soit U est inclus dans aH, soit il n’intersecte pas aH. Cela signifie que U est de la forme
U = p−1 (V ), où p est la projection G → G/H. Par définition de la topologie quotient, V est une
partie ouverte et fermée de G/H, et donc est soit égale à G/H, soit vide. Par conséquent, U est
soit égal à G, soit vide, et donc G est connexe.
Théorème 33 (admis). Soient G un groupe localement compact connexe et H un sous-groupe
fermé et connexe. Supposons que G/H et H soient simplement connexes. Alors G est simplement
connexe.
Nous pouvons en déduire le corollaire suivant :
Corollaire 34. Le groupe spécial unitaire SU(n) est connexe et simplement connexe pour tout
n > 1. Le groupe orthogonal quaternionique Sp(n) est connexe et simplement connexe pour tout
n > 0.
Démonstration. Ceci résulte des propositions 29 et 30, et des théorèmes 31, 32 et 33, par une
récurrence immédiate. (Les groupes SU(1) et Sp(0) sont des singletons donc sont connexes et
simplement connexes.)
8
Connexité et groupes fondamentaux de Spn (R) et Spn (C)
Corollaire 35. Pour tout n > 0, Spn (R) et Spn (C) sont connexes, le groupe fondamental de
Spn (R) est Z, et Spn (C) est simplement connexe.
Démonstration. Ceci découle immédiatement du corollaire 34, de la proposition 28 et du théorème
20.
Références
[1] Emil Artin. Algèbre Géométrique. Éditions Jacques Gabay, 1996.
[2] Frédéric Testard Rached Mneimné. Introduction à la théorie des groupes de Lie classiques.
Hermann, 1986.
14
Téléchargement