Algèbre – 2ème Partie Groupes de Lie

publicité
L ICENCE DE M ATHÉMATIQUES
3ème année
Algèbre – 2ème Partie
Groupes de Lie
C.-A. PILLET
Table des matières
1
Préliminaires
7
1.1
Algèbres matricielles . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.1.1
L’algèbre de Banach Mat(d, K) . . . . . . . . . . . . . . . . .
8
1.1.2
Calcul fonctionnel analytique . . . . . . . . . . . . . . . . .
10
1.1.3
Sous-groupes à un paramètre . . . . . . . . . . . . . . . . . .
15
Groupes linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
1.2.1
Groupes orthogonaux . . . . . . . . . . . . . . . . . . . . .
20
1.2.2
Groupes unitaires . . . . . . . . . . . . . . . . . . . . . . . .
22
1.2.3
Groupes symplectiques . . . . . . . . . . . . . . . . . . . . .
23
1.2.4
Groupes d’isométries affines . . . . . . . . . . . . . . . . . .
24
Groupes Topologiques . . . . . . . . . . . . . . . . . . . . . . . . .
25
1.3.1
Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
1.3.2
Morphismes . . . . . . . . . . . . . . . . . . . . . . . . . .
28
1.3.3
Composantes connexes . . . . . . . . . . . . . . . . . . . . .
33
1.3.4
Espaces simplement connexes . . . . . . . . . . . . . . . . .
37
1.3.5
Mesure de Haar d’un groupe compact . . . . . . . . . . . . .
39
1.2
1.3
2
Groupes de Lie
41
2.1
Définition et exemples . . . . . . . . . . . . . . . . . . . . . . . . .
41
2.2
L’algèbre de Lie d’un groupe de Lie . . . . . . . . . . . . . . . . . .
44
2.3
L’application exponentielle g → G . . . . . . . . . . . . . . . . . . .
50
Algèbres de Lie abstraites . . . . . . . . . . . . . . . . . . . . . . . .
52
2.5
Morphismes locaux . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
2.6
La représentation adjointe . . . . . . . . . . . . . . . . . . . . . . .
61
2.7
La formule de Baker-Campbell-Hausdorff . . . . . . . . . . . . . . .
63
2.4
3
3
Représentations des groupes de Lie
69
3.1
La représentation d’algèbre de Lie induite . . . . . . . . . . . . . . .
69
3.2
Représentations de l’algèbre de Lie su(d) . . . . . . . . . . . . . . .
74
3.2.1
Représentations des algèbres de Lie sl(2, ) et su(2) . . . . .
75
. . . . . . . . . .
80
3.2.2
C
Représentations de l’algèbre de Lie sl(3, C)
A Groupes affines
85
A.1 Action de groupe . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
A.2 Espaces et applications affines . . . . . . . . . . . . . . . . . . . . .
86
A.3 Repères affines . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
A.4 Groupes affines . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
A.5 Espaces affines pseudo-euclidiens . . . . . . . . . . . . . . . . . . . .
90
B Les groupes de Lie des théories de la relativité
91
B.1 Mouvement relatif . . . . . . . . . . . . . . . . . . . . . . . . . . .
91
B.2 Relativité galiléenne . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
B.3 Le groupe de galilée . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
B.4 L’espace de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . .
96
B.5 Le groupe de Poincaré . . . . . . . . . . . . . . . . . . . . . . . . .
98
Bibliographie
1. R. Mneimné, F. Testard : Introduction à la théorie des groupes de Lie classiques.
Hermann, Paris, 1996.
2. G. Pichon : Groupes de Lie, représentations linéaires et applications. Hermann, Paris, 1973.
3. N. Bourbaki : Groupes et algèbres de Lie. Masson, Paris, 1981.
4. A. Baker : Matrix Groups. An Introduction to Lie Group Theory. Springer, New
York 2002.
5. B. Hall : Lie Groups, Lie Algebras, and Representations. An Elementary Introduction. Springer, New York, 2003
6
TABLE DES MATIÈRES
Chapitre 1
Préliminaires
1.1
Algèbres matricielles
R
C
Rappels et conventions. Dans tout ce cours, K = ou et les espaces vectoriels
sont toujours réels ou complexes. On rappelle que toutes les normes sur un espace
vectoriel de dimension finie V sont équivalentes, la topologie induite par la métrique
d(x, y) = |x − y| ne dépend donc pas du choix de la norme | · |. Cette topologie est
séparable (il existe un sous ensemble dénombrable dense dans V). Tous les espaces
vectoriels de dimension finie seront munis de cette topologie. Toute norme sur un
espace vectoriel de dimension finie y induit une structure d’espace de Banach séparable (un espace vectoriel normé complet et admettant un sous-ensemble dense dénombrable). Soit {e1 . . . , ed } une base quelconque de l’espace vectoriel V. On dénote
par xi ∈ K les composantes de x ∈ V relativement à cette base. Une suite x(n) ∈ V
est une suite de Cauchy (respectivement converge vers x ∈ V) si et seulement si les
(n)
suites xi sont des suites de Cauchy (respectivement convergent vers xi ).
C
Soit V un espace vectoriel complexe de dimension finie et O ⊂
un ouvert. Une
fonction f : O → V est analytique s’il existe une base {e1 , . . . , ed } de V telle que
les composantes fi : O → de f relativement à cette base soient analytiques. Si f
est analytique, alors cette propriété est vraie pour toutes les base de V. En effet, les
composantes fi0 de f relativement à une base {e10 , . . . , ed0 } sont exprimées à l’aide des
composantes fi par la formule de changement de base
C
fi0 (z) =
d
X
Sij fj (z).
j=1
f : O → V est analytique si et seulement si, pour tout z0 ∈ O elle admet un développement
∞
X
f(z) =
an (z − z0 )n ,
n=0
7
CHAPITRE 1. PRÉLIMINAIRES
8
C
absolument convergent dans tout disque Dr (z0 ) = {z ∈ | |z − z0 | < r} contenu
dans O. Les coefficient an ∈ V sont alors donnés pas la formule de Cauchy
I
f(z)
dz
an ≡
,
n+1
2πi
Γ (z − z0 )
où Γ est un contour encerclant z0 et entièrement contenu dans O.
Si V est un espace vectoriel réel, son complexifié VC est l’espace vectoriel complexe
défini par VC = V × V, la loi d’addition (u, v) + (u 0 , v 0 ) = (u + u 0 , v + v 0 ) et la loi
externe (λ + iµ)(u, v) = (λu − µv, λv + µu). On écrira alors (u, v) = u + iv et on
identifiera u ∈ V avec u + i0 ∈ VC .
R
Soit V un espace vectoriel réel et I =]a, b[⊂ un intervalle ouvert. Une fonction
f : I → V est réelle-analytique s’il existe un ouvert O ⊂ tel que I = O ∩ et une
fonction analytique f̃ : O → VC dont la restriction à I est f.
C
R
On peut définir de la même manière une fonction analytique de plusieurs variables.
Si r = (r1 , . . . , rk ), avec ri > 0, on appelle polydisque de rayon r centré en z0 =
(z01 , . . . , z0k ) le sous-ensemble ouvert
Dr (z0 ) ≡ {(z1 , . . . , zk ) ∈
Ck | |zi − z0i| < ri pour i = 1, . . . , k}.
Une fonction f : Dr (z0 ) → V est analytique s’il existe une base de V telle que
de f relativement à cette base admettent un
les composantes fi : Dr (z0 ) →
développement
C
fi (z1 , . . . , zk ) =
∞
X
n1 ,...,nk =0
n1
a(i)
· · · (zk − z0k )nk ,
n1 ···nk (z1 − z01 )
absolument convergent dans tout sous-ensemble compact de Dr (z0 ). Les coefficients
de ce développement sont donnés par la formule de Cauchy
I
fi (z1 , . . . , zk )
dz1 · · · dzk
(i)
,
an1 ···nk =
n1 +1 · · · (z − z )nk +1
(2πi)k
k
0k
Γ (z1 − z01 )
où Γ = {(z1 , . . . , zk ) | |zi − z0i | = i } et i < ri .
1.1.1
L’algèbre de Banach Mat(d, K)
L’ensemble des endomorphismes de Kd , c’est-à-dire l’ensemble des matrices d × d
sur K, est noté Mat(d, K). C’est une K-algèbre unitale (en particulier un K-espace
vectoriel) de dimension d2 . Elle est non-commutative si d > 1. Le groupe des unités
de Mat(d, K), l’ensemble de toutes les matrices d × d inversibles, est appelé groupe
linéaire général et noté GL(d, K). On remarque que
GL(d, K) = {T ∈ Mat(d, K)| det T 6= 0},
1.1. ALGÈBRES MATRICIELLES
9
et comme l’application det : Mat(d, K) → K est continue (c’est un polynôme dans
les composantes Tij de T ), GL(d, K) est ouvert dans Mat(d, K).
Comme nous l’avons remarqué ci-dessus, toutes les normes sur Mat(d, K) sont équivalentes. Cependant elle ne sont pas toutes adaptée à sa structure d’algèbre.
Une norme d’algèbre sur une algèbre unitale A est une norme satisfaisant les deux
conditions suivantes
, | Ik = 1,
kT Sk 6 kT kkSk,
pour tout T , S ∈ A. Une algèbre unitale munie d’une norme d’algèbre est dite normée. Dans une algèbre normée, le produit (T , S) → T S est une application continue.
En effet, on a
kT S − T 0 S 0 k 6 kSkkT − T 0 k + kT 0 kkS − S 0 k.
(1.1)
Il en résulte que l’application T → T n est continue pour tout n > 0. Plus précisément, du développement télescopique
T n − Sn =
n
X
T j−1 (T − S)Sn−j ,
j=1
et de l’inégalité
kT n k 6 kT kn ,
(1.2)
kT n − Sn k 6 n max(kT k, kSk)n−1 kT − Sk.
(1.3)
on déduit l’estimation
Une algèbre unitale normée complète dans la topologie induite par sa norme est une
algèbre de Banach. Mat(d, K) est une algèbre de Banach, en effet on vérifie facilement
que
X
kT k ≡ max
|Tij |,
i
j
est une norme d’algèbre. On notera en particulier que |Tij | 6 kT k.
Il existe d’autres normes d’algèbre sur Mat(d, K). En fait, à toute norme | · | sur Kd
on peut associer la norme d’algèbre
kT kop ≡
sup
x∈Kd ,|x|=1
|T x| =
|T x|
.
x∈Kd ,x6=0 |x|
sup
Dans la suite on supposera Mat(d, K) munie d’une norme d’algèbre.
(1.4)
CHAPITRE 1. PRÉLIMINAIRES
10
1.1.2
Calcul fonctionnel analytique
C
1. Soit f(z) une fonction analytique dans le disque Dr ≡ {z ∈ | |z| < r}. Dans le
cas K = on supposera en plus que f est réelle-analytique. Pour < r on a
R
Mf () ≡ sup |f(z)| < ∞,
|z|=
I
et donc
an ≡
|z|=
f(z) dz
,
zn+1 2πi
(1.5)
est borné par
|an | 6 Mf ()−n .
La série de Taylor
f(z) =
∞
X
an z n ,
n=0
est absolument convergente dans Dr . Pour tout ∈ [0, r[ on obtient
Mf () 6 Rf () ≡
∞
X
|an |n 6 Mf ((r + )/2)
n=0
r+
< ∞.
r−
Théorème 1 Pour tout T ∈ Dr ≡ {X ∈ Mat(d, K)|kXk < r}, la série
f(T ) =
∞
X
an T n ,
(1.6)
n=0
est absolument convergente dans Mat(d, K). De plus
i. L’application T 7→ f(T ) est analytique dans Dr .
ii. Pour tout T ∈ Dr , kf(T )k 6 Rf (kT k).
iii. Pour tout T ∈ Dr , la fonction z 7→ f(zT ) est analytique dans le disque Dr/kT k .
Démonstration Si T ∈ Dr alors, compte tenu de (1.2),
∞
X
n=0
|an |kT n k 6
∞
X
n=0
|an |kT kn = Rf (kT k) < ∞,
ce qui montre ii et la convergence absolue de la série (1.6). On a donc une série
absolument convergente
(f(T ))ij =
∞
X
n=0
(n)
an Pij (T11 , . . . , Tdd )
1.1. ALGÈBRES MATRICIELLES
11
(n)
où Pij est un polynôme de degré n en d2 variables
(n)
Pij (X11 , . . . , Xdd )
≡
d
X
k1 ,...,kn−1 =1
Xik1 Xk1 k2 · · · Xkn−2 kn−1 Xkn−1 j .
On peut donc conclure que (f(T ))ij est une fonction analytique des variables T11 , . . . , Tdd .
Finalement, on remarque que si kzT k = |z|kT k < r la série
f(zT ) =
∞
X
an T n z n ,
n=0
est absolument convergente.
2. Si f(z) et g(z) sont analytiques dans Dr , alors h(z) = f(z)g(z) l’est aussi et si
f(z) =
∞
X
n
an z ,
g(z) =
∞
X
b n zn ,
n=0
n=0
alors
h(z) =
∞
X
cn zn ,
n=0
avec
cn =
n
X
aj bn−j .
j=0
Théorème 2 Pour tout T ∈ Dr on a f(T )g(T ) = h(T ).
Démonstration Soient fN , gN et hN les sommes partielles des séries de Taylor de
f, g et h. Pour T ∈ Dr et kT k < < r on a
f(T )g(T ) =
=
lim fN (T )gN (T )
N→∞
lim
N→∞
N
X
n,m=0
=
lim
N→∞
=
=
lim
N→∞
an bm T n+m
N
k
X
X
k=0
N
X
aj bk−j )T + RN
j=0
ck T k + RN
k=0
lim {hN (T ) + RN } ,
N→∞
k
CHAPITRE 1. PRÉLIMINAIRES
12
où le reste RN est majoré par
kRN k 6
X
|an ||bm |
n+m
n+m>N
kT k
n+m
6
kT k
N+1
Rf ()Rg ().
On a donc limN→∞ RN = 0 et par conséquent f(T )g(T ) = h(T ).
Exemple 1 Les fonctions f(z) = (1 − z)−1 et g(z) = 1 − z sont analytiques dans le
disque unité D1 . Si T ∈ Mat(d, K) on a clairement g(T ) = I−T . Comme f(z)g(z) =
1 on en conclut que si kT k < 1 on a f(T )g(T ) = I, c’est à dire que la matrice I − T
est inversible et que
∞
X
−1
(I − T ) = f(T ) =
T n.
(1.7)
n=0
On note que ce développement implique que k(I − T )−1 k 6 (1 − kT k)−1 si T est tel
que kT k < 1.
Exemple 2 La fonction f(z) = ez est entière. La série
e
zT
=
∞
X
Tn
n=0
n!
zn ,
C
est donc convergente pour tout T ∈ Mat(d, K) et pour tout z ∈ . La fonction
z 7→ ezT est entière. C’est l’unique solution fondamentale de l’équation différentielle
d
φ(z) = T φ(z).
dz
On a
ezT e−zT = I,
ce qui montre que ezT est toujours inversible et que e−zT est son inverse. On a de
plus kezT k 6 e|z|kT k .
3. Comme dans le cas d’une fonction analytique d’une variable complexe, f(T )
peut s’exprimer à l’aide de la formule de Cauchy.
Théorème 3 zI − T est inversible et la fonction z 7→ (zI − T )−1 est analytique pour
|z| > kT k. Si f(z) est analytique dans Dr et T ∈ Dr alors, pour kT k < < r on a
I
dz
f(T ) =
f(z)(zI − T )−1
.
(1.8)
2πi
|z|=
1.1. ALGÈBRES MATRICIELLES
13
Démonstration Si kT/zk < 1, alors l’exemple (1) montre que I − T/z est inversible
et que
∞
X
Tn
−1
−1
−1
,
(zI − T ) = z (I − T/z) =
zn+1
n=0
est absolument convergente. On peut donc substituer cette série dans le membre de
droite de la formule (1.8) et intégrer terme à terme pour obtenir, compte tenu de (??)
I
I
!
∞
X
Tn
dz
f(z)
zn+1 2πi
|z|=
n=0
∞ I
X
f(z) dz
=
Tn
n+1 2πi
z
|z|=
n=0
dz
f(z)(zI − T )−1
=
2πi
|z|=
=
∞
X
an T n
n=0
= f(T ).
4. Soit f(z) analytique dans Dr et g(z) analytique dans Dr 0 telle que g(0) = 0.
Alors il existe r 00 6 r 0 tel que si < r 00 on aie Mg () 6 Rg () < r. Dans ce cas la
fonction h(z) ≡ f ◦ g(z) est analytique dans Dr 00 .
Théorème 4 Pour tout T ∈ Dr 00 on a f(g(T )) = h(T ).
Démonstration Soit kT k < < r 00 , alors kg(T )k 6 Rg () < δ < r et le théorème
3 donne
I
dz
f(g(T )) =
f(z)(zI − g(T ))−1
.
(1.9)
2πi
|z|=δ
Pour |z| = δ, la fonction j(w) ≡ (z − g(w))−1 est analytique dans D puisque g(w)
y est analytique et |g(w)| 6 Mg () 6 Rg () < δ. Comme (z − g(w))j(w) = 1, le
théorème 2 montre que j(T ) = (zI − g(T ))−1 et le théorème 3 permet d’écrire
I
(zI − g(T ))
−1
(zI − g(w))−1 (wI − T )−1
=
|w|= 0
dw
,
2πi
pour un 0 tel que kT k < 0 < . La substitution de cette formule dans le membre
de droite de l’identité (1.9) permet d’obtenir, en utilisant le théorème de Fubini et
CHAPITRE 1. PRÉLIMINAIRES
14
celui de Cauchy
I
I
dz
(zI − g(w)) (wI − T )
2πi 2πi
|w|= 0
dw
=
f(z)(zI − g(w))−1 (wI − T )−1
2πi
|w|= 0
|z|=δ
I
dw
=
h(w)(wI − T )−1
2πi
|w|= 0
= h(T ).
f(g(T )) =
−1 dw
−1
f(z)
|z|=δ
I
I
5. Si f(z) est analytique dans Dr et si f 0 (0) 6= 0, alors f est un difféomorphisme
d’un voisinage de 0 ∈ Dr dans un voisinage de a ≡ f(0) (c’est une transformation
conforme). La fonction réciproque f−1 (z) est analytique dans un disque Dr 0 (a) de
rayon r 0 > 0 centré en a et admet dans ce disque le développement
f−1 (z) =
∞
X
n=1
bn (z − a)n ≡ g(z − a).
Si T ∈ Mat(d, K) est tel que kT − aIk < r 0 , alors
−1
f (T ) ≡
∞
X
bn (T − aI)n = g(T − aI),
n=1
est absolument convergente et comme f ◦ g(z) = z + a, le théorème 4 montre que
f(f−1 (T )) = f(g(T − aI)) = T .
C
Exemple 3 La fonction f(z) = ez transforme la bande {z ∈ | | Im z| < π} de manière conforme dans le plan coupé \] − ∞, 0]. La fonction réciproque f−1 (z) =
log z est analytique dans ce domaine, et en particulier dans le disque D1 (1). Le développement
∞
X
(1 − z)n
,
log z = −
n
n=1
C
permet donc de définir
log T = −
∞
X
(I − T )n
n=1
n
,
pour T ∈ Mat(d, K) tel que kT − Ik < 1. Dans ce cas on a elog T = T .
(1.10)
1.1. ALGÈBRES MATRICIELLES
15
Réciproquement, pour X ∈ Mat(d, K) on a
X
ke − Ik 6
∞
X
kXkn
n!
n=1
= ekXk − 1,
et si kXk < log 2 on peut en conclure que
X = log eX .
1.1.3
Sous-groupes à un paramètre
Définition 1 Un sous-groupe à un paramètre de GL(d, K) est un morphisme de groupe
continu
φ:
→ GL(d, K)
t 7→
φ(t)
R
Si φ est un sous-groupe à un paramètre, son image Im φ est un sous-groupe de
GL(d, K). Comme pour tout morphisme, on a φ(0) = I et φ(t)−1 = φ(−t).
Théorème 5 φ est un sous-groupe à un paramètre de GL(d, K) si et seulement si il existe
une matrice X ∈ Mat(d, K) telle que
φ(t) = etX ,
pour tout t ∈
R.
On remarque en particulier qu’un sous-groupe à un paramètre est la restriction à
d’un morphisme holomorphe φ : → GL(d, ), en effet
C
φ(z) = e
C
zX
=
∞
X
zn
n=0
n!
R
Xn ,
est une fonction entière de z.
Démonstration Si X ∈ Mat(d, K) le théorème 2 montre qu’on a bien un morphisme continu etX esX = e(t+s)X . Supposons que φ(t) soit un sous-groupe à un
paramètre. Comme φ est continu, il existe tel que kI − φ(t)k < 1/2 pour tout
|t| < . On définit
Zt
M(t) = φ(τ)dτ.
0
De φ(t) = I − (I − φ(t)), on obtient l’estimation kM(t) − tIk 6 t/2 pour tout
|t| < et donc M(t) est inversible pour 0 < |t| < .
CHAPITRE 1. PRÉLIMINAIRES
16
La propriété de morphisme de φ implique
Zs
φ(t)M(s) =
Z t+s
φ(t + τ)dτ =
0
φ(τ)dτ = M(t + s) − M(t),
t
et pour 0 < |s| < , on peut donc écrire
φ(t) = (M(t + s) − M(t))M(s)−1 ,
et comme M(t) est différentiable, φ(t) l’est également. On pose
X≡
d
φ(t)|t=0 .
dt
La propriété de morphisme φ(t + s) = φ(s)φ(t) peut maintenant être dérivée par
rapport à s en s = 0, ce qui donne
d
φ(t) = Xφ(t).
dt
Le théorème d’unicité des solutions d’un systèmes d’équations différentielles linéaires
implique que la seule solution de cette équation satisfaisant la condition initiale
φ(0) = I est bien φ(t) = etX (c.f. exemple 2).
Remarque. Cette démonstration n’utilise pas le fait que l’application φ est définie
pour tout t ∈ . On arrive à la conclusion φ(t) = etX si pour un > 0 l’application
continue φ :] − , [→ GL(d, K) satisfait la propriété de morphisme φ(t)φ(s) =
φ(t + s) pour tout t, s ∈] − , [ tels que t + s ∈] − , [ et si φ(0) = I. Nous
utiliserons ce fait dans la preuve du théorème 22.
R
A cause du théorème 5, la fonction exponentielle joue un rôle très important dans
l’analyse des groupes de matrices. Le théorème suivant résume ses propriétés élémentaires.
Théorème 6 L’application X 7→ eX est une fonction analytique de Mat(d, K) dans
GL(d, K) c’est-à-dire que les d2 composantes de la matrice eX sont des fonctions analytiques (et par conséquent infiniment différentiables) des composantes Xij de la matrice X.
En outre, c’est un difféomorphisme analytique d’un voisinage de 0 ∈ Mat(d, K) dans un
voisinage de I ∈ GL(d, K).
De plus, pour tout X, Y ∈ Mat(d, K) on a :
i. Si XY = YX alors eX eY = eX+Y .
ii. AeX A−1 = eAXA
>
−1
pour tout A ∈ GL(d, K).
iii. eX = (eX )> et si K =
iv. det eX = etr X .
C, eX
∗
= (eX )∗ .
1.1. ALGÈBRES MATRICIELLES
17
Démonstration L’analyticité de l’exponentielle eX est une conséquence du théorème 1, la fonction z 7→ ez étant entière. L’exemple 3 montre que l’application
X 7→ eX est bijective au voisinage de X = 0 et que son inverse est l’application
Y 7→ log Y qui est analytique dans un voisinage de e0 = I. L’exponentielle est donc
bien un difféomorphisme analytique.
i. Si X et Y commutent on a
n X
n
(X + Y) =
Xk Y n−k ,
k
n
k=0
et donc
e
X+Y
∞ X
n
X
Xk Y n−k
=
k! (n − k)!
n=0 k=0
=
∞ X
∞
X
Xk Y n
k=0 n=0
X Y
k! n!
= e e ,
toutes les manipulations étant justifiées par la convergence absolue.
ii. On a AXn A−1 = (AXA−1 )n et donc
X
Ae A
−1
=
∞
X
AXn A−1
n=0
n!
=
∞
X
(AXA−1 )n
n=0
n!
iii. Se démontre de la même manière.
iv. On pose Mt = etX , alors
det Mt =
X
π∈Sd
ε(π)Mt1π(1) · · · Mtkπ(k) · · · Mtdπ(d) ,
et comme
X
d t
Mkπ(k) =
Xkj Mtjπ(k) ,
dt
j=1
d
−1
= eAXA .
CHAPITRE 1. PRÉLIMINAIRES
18
on obtient
d
det Mt =
dt
=
X
ε(π)
π∈Sd
X
ε(π)
d X
d
X
k=1 j=1
d X
d
X
d X
d
X
X
Xkj
π∈Sd
k=1 j=1
=
Mt1π(1)
k=1
π∈Sd
=
d
X
Xkj δjk
···
d t
Mkπ(k) · · · Mtdπ(d)
dt
Mt1π(1) · · · Xkj Mtjπ(k) · · · Mtdπ(d)
ε(π)Mt1π(1) · · · Mtjπ(k) · · · Mtdπ(d)
X
π∈Sd
k=1 j=1
ε(π)Mt1π(1) · · · Mtkπ(k) · · · Mtdπ(d)
t
= tr X det M ,
qui permet de conclure que det Mt = et tr X det M0 = et trX .
On remarque qu’en général eX eY 6= eX+Y si X et Y ne commutent pas. Nous verrons
plus tard que dans ce cas on a une formule du type eX eY = eZ où Z peut s’exprimer à
l’aide de commutateur répétés de X et de Y (formule de Baker-Campbell-Hausdorff).
On a cependant une version infinitésimale de la loi de groupe sous la forme suivante.
Théorème 7 (Formule du produit de Lie) Pour tout X, Y ∈ Mat(d, K) on a
eX+Y = lim (eX/N eY/N )N .
N→∞
Démonstration On a eX/N = I + X/N + R(X/N) avec
R(X/N) =
∞
X
Xn
n=2
n!
N−n ,
et donc kR(X/N)k 6 N−2 ekXk . On en conclut que
e
X/N Y/N
e
X
Y
X+Y
−2
−2
= I + + O(N )
I + + O(N ) = I +
+ O(N−2 ),
N
N
N
c’est à dire que keX/N eY/N − Ik = kX + YkN−1 + O(N−2 ) = O(N−1 ). Lorsque N
est assez grand on a donc keX/N eY/N − Ik < < 1 et par conséquent (c.f. exemple
3)
eX/N eY/N = eZN ,
avec ZN = log eX/N eY/N .
1.2. GROUPES LINÉAIRES
19
On note que si T ∈ Mat(d, K) est tel que kT k < < 1 on a
log(I + T ) = −
∞
X
(−1)n
n=1
T n,
n
d’où on obtient facilement
n
∞
X
n kT k
k log(1 + T ) − T k 6
n
n=2
| log(1 − )|
kT k2
2
6 C kT k2 .
6
Avec TN = eX/N eY/N − I = (X + Y)N−1 + O(N−2 ) on arrive à
ZN = log(I + TN ) = TN + O(kTN k2 ) =
X+Y
+ O(N−2 ),
N
d’où on conclut que
lim NZN = X + Y.
N→∞
Comme l’exponentielle est continue, on a finalement
lim (eX/N eY/N )N = lim eNZn = eX+Y .
N→∞
N→∞
1.2
Groupes linéaires
Définition 2 Un groupe linéaire est un sous-groupe d’un groupe linéaire général GL(d, K).
C
Si G est un groupe linéaire, l’application det : G → ∗ est un morphisme. Son
noyau {T ∈ G | det T = 1} est un sous-groupe distingué de G. En particulier, le
groupe linéaire formé de toutes les matrices de déterminant 1 est un sous-groupe
distingué de GL(d, K). On l’appelle groupe linéaire spécial noté SL(d, K).
R
Exemple 4 Le groupe diédral Dn ⊂ GL(2, ) est le groupes des transformations
linéaires du plan euclidien laissant invariant un polygone régulier à n sommets. C’est
un groupe fini d’ordre 2n engendré par deux éléments : la rotation ρ d’angle 2π/n
et une réflexion σ par rapport à un axe de symétrie du polygone. On vérifie que
σρ = ρ−1 σ et qu’il suit que Dn = {I, ρ, . . . , ρn−1 , σ, ρσ, . . . , ρn−1 σ}.
Le sous-groupe Rn = {T ∈ Dn | det T = 1} est engendré par ρ. C’est le groupe
cyclique d’ordre n des rotations d’angle multiple de 2π/n.
CHAPITRE 1. PRÉLIMINAIRES
20
Rappels. 1. Une forme bilinéaire φ sur un espace vectoriel réel V est symétrique si,
pour tout x, y ∈ V, on a φ(y, x) = φ(x, y). Elles est alternée, ou anti-symétrique, si
φ(y, x) = −φ(x, y).
2. Une forme hermitienne φ sur un espace vectoriel complexe V est une forme sesquilinéaire telle que φ(y, x) = φ(x, y) pour tout x, y ∈ V.
3. Une forme bilinéaire symétrique, alternée ou hermitienne sur un espace vectoriel
V est non-dégénérée si φ(x, y) = 0 pour tout x ∈ V implique que y = 0.
4. Si {e1 , . . . , ed } est une base de l’espace V, la matrice de la forme bilinéaire
ou
P
sesquilinéaire
φ relativement P
à cette base est Φij ≡ φ(ei , ej ). Pour xP= i xi ei et
P
y = i yi ei on a φ(x, y) = ij Φij xi yj si φ est bilinéaire et φ = ij Φij x̄i yj si
elle est sesquilinéaire. φ est symétrique si et seulement si sa matrice est symétrique
Φ> = Φ, elle est alternée si et seulement si Φ est anti-symétrique Φ> = −Φ, elle
est hermitienne si Φ est auto-adjointe Φ∗ = Φ. La forme φ est non-dégénérée si et
seulement si sa matrice est non-singulière, det Φ 6= 0.
1.2.1
Groupes orthogonaux
Un espace pseudo-euclidien est un espace vectoriel réel V de dimension finie d muni
d’une forme bilinéaire symétrique non-dégénérée g : V × V → . Si (V, g) est
un tel espace, il existe toujours un système générateur {e1 , . . . , ed } de V telle que
g(ei , P
ej ) = gi δij où gi = ±1. Un tel système est nécessairement libre puisque si
x = i xi ei on a xi = gi g(ei , x). On dit que c’est une base orthonormée. Pour
tout x ∈ V on a alors
d
X
x=
gi g(ei , x)ei .
R
i=1
On se souviendra de la loi d’inertie de Sylvester : le nombre p de vecteurs ei d’une
base orthonormée tels que g(ei , ei ) = +1 ne dépend que de g et pas de la base.
Le couple d’entiers (p, n) où n ≡ d − p est appelé signature de g ou, par abus de
langage, signature de V. Dans le cas particulier où n = 0, g est définie positive, c’est
donc un produit scalaire et (V, g) est un espace euclidien.
Une transformation orthogonale de l’espace (pseudo-)euclidien (V, g) est une application f : V → V qui préserve g, c’est-à-dire telle que pour tout x, y ∈ p+n on a
g(f(x), f(y)) = g(x, y). Une telle application est automatiquement linéaire et bijective. En effet, si {e1 , . . . , ed } est une base orthonormée
et fi = f(ei ) alors {f1 , . . . , fd }
P
est une base orthonormée. De plus si x = i xi ei on a
X
f(x) =
gi g(fi , f(x))fi ,
R
i
et comme g(fi , f(x)) = g(f(ei ), f(x)) = g(ei , x) = gi xi on a bien
X
f(x) =
xi f(ei ).
1.2. GROUPES LINÉAIRES
21
L’ensemble des transformations orthogonales de l’espace pseudo-euclidien (V, g) est
un groupe qu’on appelle groupe orthogonal de (V, g).
Si (V, g) est un espace pseudo-euclidien de signature (p, n) il est isomorphe à l’espace
p+n
muni de la forme
X
g(x, y) =
gi xi yi = (x1 y1 + · · · + xp yp ) − (xp+1 yp+1 + · · · + xp+n yp+n ).
R
i
R
Le groupe orthogonal de (V, g) est isomorphe au groupe orthogonal de p+n qu’on
désigne par O(p, n) ou plus simplement O(p) lorsque n = 0. Si on dénote par g la
matrice diagonale gij = gi δij , il est clair que
R
O(p, n) = {T ∈ GL(p + n, ) | T > gT = g}.
On notera en particulier que si T ∈ O(p, n) alors det T 2 = 1 et donc det T = ±1.
Le sous-groupe SO(p, n) = {T ∈ O(p, n) | det T = 1} est appelé groupe orthogonal
spécial de p+n . Les groupes O(p, n) et SO(p, n) sont des groupes linéaires.
R
On se rappellera que toute forme bilinéaire g définit un forme quadratique g[x] ≡
g(x, x) et que si g est symétrique elle peut être reconstruite à partir de cette forme
quadratique à l’aide de la formule
1
g(x, y) = (g[x] + g[y] − g[x − y]).
2
(1.11)
On peut donc caractériser le groupe O(p, n) comme le groupe des transformations
linéaires de p+n laissant invariante la forme quadratique
R
g[x] = (x21 + · · · + x2p ) − (x2p+1 + · · · + x2p+n ).
Exemple 5 En dimension 1 il n’y a qu’un seul espace (pseudo-)euclidien (à l’isomorphisme près), c’est muni de la forme g(x, y) = xy. On a bien entendu
R
O(1) = {−1, 1} et SO(1) = {1}.
Exemple 6 Il y a deux espaces pseudo-euclidiens de dimension 2 : l’espace euclidien
2
et l’espace pseudo-euclidien proprement dit 1+1 . Le groupe orthogonal du premier est O(2) = {T ∈ Mat(2, ) | T > T = I}. C’est le groupe formé des rotations et
des réflexions
cos α −σ sin α
O(2) = T =
| α ∈ et σ ∈ {−1, +1} .
sin α σ cos α
R
R
R
R
T est une rotation d’angle α si det T = σ = 1 et une réflexion par rapport à la droite
dirigée par le vecteur
cos α/2
,
sin α/2
CHAPITRE 1. PRÉLIMINAIRES
22
si det T = σ = −1.
On note que la distance de T à I est donnée par
d(T , I) = kT − Ik =
| sin α| + |1 − cos α| si σ = 1,
1 + | sin α| + | cos α| si σ = −1.
On a donc d(T , I) 6 2 si det T = +1 et d(T , I) > 2 si det T = −1. De plus, on a
limα→0 d(T , I) = 0 si det T = 1. Tout voisinage de I dans O(2) contient donc des
rotations et ne contient que des rotations si son rayon est inférieur à 2.
Comme det T = σ, le groupe orthogonal spécial se compose de toutes les rotations
cos α − sin α
SO(2) = T =
|α ∈
sin α cos α
1 0
0 −1
=
a c
b d
1 0
0 −1
a b
c d
R
.
R1+1. Une matrice T est ortho-
Considérons maintenant l’espace pseudo-euclidien
gonale si g = T > gT , c’est-à-dire si
=
a2 − c2 ab − cd
ab − cd b2 − d2
.
R
L’équation a2 − c2 = 1 permet d’écrire a = σ ch θ, c = sh θ avec θ ∈ et σ = ±1.
De manière similaire b2 − d2 = −1 implique d = τ ch ψ et b = sh ψ avec ψ ∈
et τ = ±1. Finalement l’équation ab = cd devient th ψ = στ th θ d’où on conclut
que θ = στψ. On a donc
O(1, 1) =
σ ch θ στ sh θ
sh θ
τ ch θ
|θ ∈
R
R
et σ, τ ∈ {−1, +1} .
On note que det T = στ, et donc
SO(1, 1) =
1.2.2
σ ch θ sh θ
sh θ σ ch θ
|θ ∈
R et σ ∈ {−1, +1}
.
Groupes unitaires
On définit les groupes unitaires de manière complètement similaire aux groupes orthogonaux. Sur l’espace vectoriel complexe p+n on considère la forme hermitienne
non-dégénérée
C
g(x, y) =
d
X
i=1
gi x̄i yi = (x̄1 y1 + · · · + x̄p yp ) − (x̄p+1 yp+1 + · · · + x̄p+n yp+n ).
1.2. GROUPES LINÉAIRES
23
Le groupe unitaire U(p, n) est l’ensemble des application f :
que, pour tout x, y ∈ p+n , g(f(x), f(y)) = g(x, y),
C
Cp+n → Cp+n telles
C
U(p, n) = {T ∈ Mat(p + n, ) | T ∗ gT = g}.
On remarque que si T ∈ U(p, n) on a det T ∗ det T = | det T |2 = 1. Le sous-groupe
SU(p, n) = {T ∈ U(p, n) | det T = 1} est appelé groupe unitaire spécial. Dans ce
cours nous ne considérerons que le cas particulier n = 0 c’est-à-dire les groupes
U(d) ≡ {T ∈ Mat(d, ) | T ∗ T = I} et SU(d) ≡ {T ∈ U(d) | det T = 1}.
C
Une forme hermitienne g définit une forme quadratique réelle g[x] ≡ g(x, x), la
forme g se laissant reconstruire par polarisation
1
g(x, y) = (g[x + y] − g[x − y] + ig[x − iy] − ig[x + iy]).
4
On peut donc caractériser U(p, n) comme le groupe des transformations linéaires
de p+n laissant invariante la forme quadratique réelle
C
g[x] = (|x1 |2 + · · · + |xp |2 ) − (|xp+1 |2 + · · · + |xp+n |2 ).
Exemple 7 En dimension 1 il n’y a qu’un groupe unitaire
U(1) = {z ∈
C | |z| = 1},
C
et SU(1) = {1}. On note que l’application z 7→ eiα z de dans lui-même correspond
a une rotation d’angle alpha du plan de Gauss. On a donc un isomorphisme
φ : U(1) → SO(2)
cos α − sin α
iα
e
7→
.
sin α cos α
1.2.3
Groupes symplectiques
Soit V un espace vectoriel réel. Une forme symplectique sur V est une forme bilinéaire
alternée non-dégénérée ω : V × V → . Un espace symplectique (V, ω) est un espace
vectoriel réel muni d’une forme symplectique.
R
Si (V, ω) est un espace symplectique de dimension finie d, alors la matrice Ω de la
forme symplectique ω relativement à une base quelconque de V est anti-symétrique.
On a donc det Ω = det Ω> = det(−Ω) = (−1)d det Ω et comme ω est non dégénérée, det Ω 6= 0. On en conclut que la dimension d est paire. Si d = 2n, il existe
une base de V relativement à laquelle Ω est donnée par
0 −In
Ω=
,
In 0
CHAPITRE 1. PRÉLIMINAIRES
24
où In est la matrice identité n × n. Un espace symplectique de dimension 2n est
donc isomorphe à 2n = n ⊕ n muni de la forme symplectique
R
R
R
n
X
(xi yi0 − yi xi0 ).
ω(x ⊕ y, x ⊕ y ) =
0
0
i=1
Le groupe symplectique Sp(2n) est le groupe linéaire des automorphismes de
laisse cette forme invariante. On a donc
R2n qui
R
Sp(2n) = {T ∈ GL(2n, ) | T > ΩT = Ω}.
On peut montrer que det T = 1 pour tout T ∈ Sp(2n).
Exemple 8 Le premier groupe symplectique est Sp(2). Comme
a c
0 −1
a b
0
−(ad − bc)
=
,
b d
1 0
c d
ad − bc
0
R
on conclut aisément que Sp(2) = SL(2, ).
1.2.4
Groupes d’isométries affines
R
R
En considérant p+n comme un espace affine basé sur l’espace vectoriel p+n , une
forme quadratique g[x] sur le vectoriel p+n permet de définir une pseudo-métrique
R
ρ2 (x, y) ≡ g[x − y],
R
p
sur l’espace affine p+n . Si n = 0 on a ρ2 (x, y) = |x − y|2 et ρ(x, y) = ρ2 (x, y) est
la métrique euclidienne. Si n 6= 0, ρ2 (x, y) n’est pas définie positive, c’est pourquoi
on dit que ρ est une pseudo-métrique. On appelle espace affine pseudo-euclidien un
espace affine muni d’une pseudo-métrique (voir l’annexe A pour une courte introduction aux espaces affines).
Remarque 1 Les espaces pseudo-euclidiens jouent un rôle très important en physique. Dans la théorie de la relativité restreinte l’espace-temps, appelé espace de Minkowski, est l’espace affine pseudo-euclidien M ≡ 3+1 . La métrique
R
ρ2 (x, y) = |x − y|2 − (x4 − y4 )2 ,
où x = (x, x4 ), y = (y, y4 ) ∈
l’annexe B.
R3 × R, est appelé métrique de Minkowski. Voir
Une application f d’un espace affine pseudo-euclidien dans lui-même est une isométrie si elle préserve la "distance", c’est-à-dire si pour tout x, y on a
ρ2 (f(x), f(y)) = ρ2 (x, y).
1.3. GROUPES TOPOLOGIQUES
25
Théorème 8 Soit f une isométrie de l’espace affine pseudo-euclidien
existe a ∈ p+n et T ∈ O(p, n) tels que f(x) = T x + a pour tout x ∈
R
Rp+n. Alors il
Rp+n.
Démonstration Supposons tout d’abord que f(0) = 0. Alors l’identité (1.11) permet d’écrire, pour tout x, y ∈ p+n ,
R
2g(f(x), f(y)) =
=
=
=
=
=
g[f(x)] + g[f(y)] − g[f(x) − f(y)]
ρ2 (f(x), 0) + ρ2 (f(y), 0) − ρ2 (f(x), f(y))
ρ2 (f(x), f(0)) + ρ2 (f(y), f(0)) − ρ2 (f(x), f(y))
ρ2 (x, 0) + ρ2 (y, 0) − ρ2 (x, y)
g[x] + g[y] − g[x − y]
2g(x, y).
On en conclut que f est une transformation orthogonale c’est-à-dire qu’il existe T ∈
O(p, n) tel que f(x) = T x. Si f(0) = a 6= 0, alors l’application f̃(x) = f(x) − a est
une isométrie telle que f̃(0) = 0 c’est donc une transformation orthogonale et on a
bien f(x) = f̃(x) + a = T x + a.
L’isométrie f(x) = T x + a peut se représenter comme une matrice (d + 1) × (d + 1)
T a
f=
,
0 1
la composition f ◦ g correspondant au produit des matrices correspondantes fg.
L’application réciproque f−1 (x) correspond donc à la matrice inverse
−1
T
−T −1 a
−1
f =
.
0
1
R
On peut donc considérer le groupe des isométrie de l’espace affine euclidien p+n
comme un sous-groupe A(p, n) du groupe GL(p + n + 1, ), c’est donc un groupe
linéaire.
R
Une isométrie f(x) = T x + a préserve l’orientation si et seulement si la transformation orthogonale T est de déterminant 1. Comme det f = det T , le sous-groupes
des isométrie préservant l’orientation, SA(p, n) = {f ∈ A(p, n) | det f = 1} est
distingué.
1.3
Groupes Topologiques
Rappels. Une topologie sur un ensemble X 6= ∅ est un ensemble T de sous-ensembles
de X tel que
CHAPITRE 1. PRÉLIMINAIRES
26
i. X ∈ T et ∅ ∈ T.
ii. L’intersection ∩N
i=1 Oi d’une famille finie (Oi )i∈{1,...,N} d’éléments de T est un
élément de T.
iii. La réunion ∪i∈I Oi d’une famille quelconque (Oi )i∈I d’éléments de T est un
élément de T.
Un espace topologique (X, T) est un ensemble X muni d’une topologie T. Les éléments
O ∈ T sont appelés sous-ensembles ouverts de X. F ⊂ X est fermé si son complément
X \ F est ouvert. L’adhérence (ou fermeture) d’un sous-ensemble A ⊂ X est le plus
petit sous-ensemble fermé de X contenant A
Ā =
\
F.
F⊃A,X\F∈T
Un élément x ∈ X est un point d’adhérence (ou d’accumulation) de A si x ∈ Ā. Un
sous-ensemble A ⊂ X est dense si Ā = X.
Une topologie T est séparable s’il existe un sous-ensemble de X dénombrable et dense.
Elle est Hausdorff si, pour tout x, y ∈ X, x 6= y, il existe U, V ∈ T tels que x ∈ U,
y ∈ V et U ∩ V = ∅.
Un sous-ensemble U ⊂ X est un voisinage de x ∈ X s’il existe un ouvert O ∈ T tel
que x ∈ U ⊂ O.
Si d : X × X → [0, ∞[ est une métrique sur X, on appelle -voisinage de x ∈ X le
sous-ensemble U (x) = {y ∈ X | d(x, y) < }. Un sous-ensemble O ⊂ X est ouvert
pour d si, pour tout x ∈ O il existe > 0 tel que U (x) ⊂ O. L’ensemble des sousensembles ouverts pour d est une topologie, la topologie induite par d sur X. Une
topologie T est métrisable si il existe une métrique d sur X telle que T soit induite
par d. Une topologie métrisable est Hausdorff.
Si (X, T) et (Y, S) sont des espaces topologiques une application f : X → Y est
continue si f−1 (O) ∈ T pour tout O ∈ S. f est ouverte si f(O) ∈ S pour tout
O ∈ T. Une application continue et ouverte est dite bi-continue. Une application
bijective et bi-continue est un homéomorphisme. Une application bijective f est un
homéomorphisme si et seulement si f et f−1 sont continues. Les espaces topologiques
(X, T) et (Y, S) sont dits homéomorphes s’il existe un homéomorphismes f : X → Y.
Si T et S sont deux topologies sur X, on dit que T est plus fine que S, ou que S est
plus grossière que T si S ⊂ T, c’est-à-dire si les ouverts pour S sont aussi ouverts pour
T. La topologie la plus fine sur X est l’ensemble de tous les sous-ensembles de X, on
l’appelle topologie discrète de X. La topologie la plus grossière est {∅, X}.
Si (X, T) est un espace topologique et Y ⊂ X, on appelle topologie relative sur Y la
topologie la plus grossière telle que l’injection canonique i : Y → X soit continue.
C’est la topologie TY = {i−1 (O) | O ∈ T} = {O ∩ Y | O ∈ T}.
1.3. GROUPES TOPOLOGIQUES
27
Si (Xi , Ti ) sont des espaces topologiques, la topologie produit sur le produit cartésiens
X ≡ ×i∈I Xi est la topologie la plus grossière telle que toutes les projections pk : X →
Xk , pk ((xi )i∈I ) ≡ xk soient continues. Un sous-ensemble O ⊂ ×i∈I Xi est ouvert si
et seulement si O = ∪j∈J (×i∈I Oij ) pour des ouverts Oij ⊂ Xi .
Un espace topologique (X, T)est connexe s’il n’est pas la réunion de deux sousensembles ouverts disjoints non-vides. (X, T) est connexe si et seulement si les seuls
sous-ensembles de X qui soient ouverts et fermés sont X et ∅. Un sous-ensemble Y
de l’espace topologique (X, T) est connexe si, muni de la topologie relative, c’est un
espace topologique connexe. Si (Yi )i∈I est une famille de sous-ensembles connexes
telle que ∩i∈I Yi 6= ∅, alors ∪i∈I Yi est connexe. La composante connexe de x ∈ X est
le plus grand sous-ensemble connexe de X contenant x. C’est la réunion de tous les
sous-ensembles connexe de X contenant x. C’est un ensemble fermé. La relation "x
appartient à la composante connexe de y" est une relation d’équivalence. Ses classes
d’équivalence sont les composantes connexes de X. Un espace topologique (X, T) est
dit localement connexe si, pour tout x ∈ X, tout voisinage de x contient un voisinage
connexe de x. Un espace topologique (X, T) est connexe par arc si pour tout x, y ∈ X
il existe une courbe continue γ : [0, 1] → X telle que γ(0) = x et γ(1) = y. Un
espace connexe par arc est connexe.
Un recouvrement ouvert d’un espace topologique (X, T) est une famille d’ouverts
(Ui )i∈I telle que X = ∪i∈I Ui . Un tel recouvrement est dit fini si l’ensemble I est fini.
Un espace topologique (X, T) est compact s’il est Hausdorff et si tout recouvrement
ouvert de X contient un recouvrement fini. Un sous-ensemble de X est compact si,
muni de la topologie relative, c’est un espace topologique compact. Un compact
est fermé. Un sous-ensemble fermé d’un compact est compact. L’image, par une
application continue, d’un compact est un compact. Un sous-ensemble de Kn est
compact si et seulement si il est fermé et borné (théorème de Borel-Lebesgue).
1.3.1
Définition
Définition 3 Un groupe topologique est un groupe G muni d’une topologie telle que
l’application
G×G → G
(a, b) 7→ ab−1
est continue.
Exemple 9 Un espace vectoriel normé V est un groupe topologique abélien. En effet
l’application (x, y) 7→ x − y est continue
k(x − y) − (x 0 − y 0 )k = k(x − x 0 ) − (y − y 0 )k 6 kx − x 0 k + ky − y 0 k.
Exemple 10 Soit A une algèbre unitale normée et U son groupe des unités. La topologie induite sur U est celle de la métrique d(a, b) = ka − bk. Nous avons déjà
CHAPITRE 1. PRÉLIMINAIRES
28
remarqué que l’application (a, b) 7→ ab est continue (c.f. l’inégalité (1.1)). Comme
b = a − (a − b) = a(I − a−1 (a − b)) on a
b−1 = (I − a−1 (a − b))−1 a−1 ,
et si ka − bk < ka−1 k−1 , on conclut de
b
−1
∞
X
=
[a−1 (a − b)]n a−1 ,
n=0
que limb→a b−1 = a−1 . L’application a 7→ a−1 est donc continue dans U et il en est
donc de même de (a, b) 7→ ab−1 . U est un groupe topologique.
Le résultat suivant est évident.
Proposition 1 Un sous-groupe d’un groupe topologique est un groupe topologique pour
la topologie relative.
Exemple 11 Les groupes linéaires sont des groupes topologiques.
1.3.2
Morphismes
Définition 4 Soient G et H des groupes topologiques et φ : G → H un morphisme de
groupe.
i. Si φ est continu on dit que c’est un morphisme continu.
ii. Si φ est bi-continu on dit que c’est un morphisme topologique.
iii. Si φ est un homéomorphisme on dit que c’est un isomorphisme topologique. Dans
ce cas on dit que les groupes G et H sont topologiquement isomorphes et on note
G ≈ H.
iv. Si G = H et φ est un homéomorphisme, on dit que c’est un automorphisme topologique.
R
Exemple 12 Le morphisme φ :
→]0, ∞[ donné par φ(t) = et est un isomorphisme topologique. En effet, φ est continu ainsi que le morphisme inverse
φ−1 (s) = log s. On a donc ( , +) ≈ (]0, ∞[, ·).
R
Exemple 13 Le morphisme φ :
R → SL(2, R) définit par
φ(t) ≡
1 t
0 1
,
est clairement continu. Il n’est pas ouvert. En effet φ(] − , [) contient I mais
ne contient aucune matrice de rotation distincte de I. Or tout voisinage de I dans
SL(2, ) contient une telle matrice (c.f. exemple 6).
R
1.3. GROUPES TOPOLOGIQUES
29
R
On note cependant que φ est injectif et que Im φ ⊂ SL(2, ) est un groupe topologique. La restriction φ :
→ Im φ est continue et ouverte. En effet φ est isométrique : d(φ(t), φ(s)) = kφ(t) − φ(s)k = |t − s|, c’est donc un homéomorphisme
et on a Im φ ≈ .
R
R
Exemple 14 Soit a un réel non-nul. L’application x 7→ ax est un automorphisme
topologique du groupe additif .
R
Soit H C G et π : G → G/H la surjection canonique. On muni le groupe quotient
G/H de la topologie la plus fine telle que π soit continue. Un sous-ensemble O du
quotient G/H est donc ouvert si et seulement si π−1 (O) est un ouvert de G. La
topologie ainsi définie sur G/H est appelée topologie quotient.
T
T
R
Exemple 15 Le tore d-dimensionnel d est le quotient du groupe additif d par
le sous-groupe d . Les éléments de d sont des classes d’équivalence de la forme
x + d ≡ {x + n | n ∈ d } ⊂ d et la surjection canonique π : d → d donnée
par π(x) = x + d . Un sous-ensemble O ∈ d est ouvert si et seulement si
Z
Z
R T
T
π−1 (O) = {x ∈ Rd | π(x) ∈ O},
est un ouvert de Rd . On peut identifier Td avec T d ≡ [0, 1[× · · · × [0, 1[⊂ Rd , à
l’aide de la bijection φ : Td → T d définie par φ(x + Zd ) = T d ∩ (x + Zd ). On a en
effet π ◦ φ = IdT et φ ◦ π|T = IdT . On peut visualiser la topologie quotient de Td
en dessinant l’image par φ des voisinages d’un point x + Zd ∈ Td (voir figure 1.1).
L’application ψ : Td → C∗d définie par ψ : (x1 , . . . , xd )+ Zd 7→ (e2iπx , . . . , e2iπx )
est un morphisme continu. En effet si O est ouvert dans Cd alors ψ−1 (O) est ouvert
dans Td puisque π−1 (ψ−1 (O)) = (ψ ◦ π)−1 (O) et ψ ◦ π(x) = (e2iπx , . . . , e2iπx )
Z
Z
d
R
d
d
1
d
1
d
est évidement continue.
Théorème 9 Soit G un groupe topologique et H un sous-groupe distingué.
i. Pour tout a ∈ G, les translations à gauche ga : x 7→ ax et à droite da : x 7→ xa
sont des homéomorphismes de G dans lui-même.
ii. Pour tout a ∈ G les conjugaisons ja : x 7→ axa−1 sont des automorphismes topologiques.
iii. L’application x 7→ x−1 est un (anti-)automorphisme topologique.
iv. La surjection canonique π : G → G/H est un morphisme topologique.
v. G/H est un groupe topologique.
vi. G/H est Hausdorff si et seulement si H est fermé.
Démonstration i,ii et iii. On se souviendra que dans tout groupe, les translations
−1
sont des bijections et les conjugaisons des automorphismes : g−1
a = ga−1 , da = da−1
−1
et ja = ja−1 . Dans un groupe topologique, ces applications sont évidemment continues et il en est de même que leurs inverse. Ce sont donc des homéomorphismes.
CHAPITRE 1. PRÉLIMINAIRES
30
x
z
y
Fig. 1.1 – Voisinages de trois points x, y, z ∈
T2.
L’application x 7→ x−1 étant involutive et continue, c’est évidement un homéomorphisme.
iv. π est un morphisme continu (par définition de la topologie quotient). Nous devons encore montrer que π est ouvert. Soit O un ouvert de G. π(O) est ouvert
si et seulement si π−1 (π(O)) l’est. On a π−1 (π(O)) = {b ∈ G | π(b) ∈ π(O)} et
π(b) ∈ π(O) si et seulement si il existe a ∈ O tel que b ∈ π(a) = aH. On a donc
π−1 (π(O)) =
[
a∈O
aH =
[ [
a∈O h∈H
{ah} =
[
dh (O),
h∈H
et comme dh est un homéomorphisme, dh (O) est ouvert et il en est de même de la
réunion des dh (O).
v. Soit ϕ̄ : G/H × G/H → G/H définie par
ϕ̄(π(a), π(b)) ≡ π(a)π(b)−1 = π(ab−1 ) = π ◦ ϕ(a, b),
où ϕ : G × G → G est l’application continue ϕ(a, b) ≡ ab−1 . Nous devons
montrer que ϕ̄ est continue, c’est-à-dire que ϕ̄−1 (Ō) est ouvert pour tout ouvert Ō
du quotient G/H. On a
ϕ̄−1 (Ō) = {(π(a), π(b)) | ϕ̄(π(a), π(b)) ∈ Ō}
= {(π(a), π(b)) | (a, b) ∈ ϕ−1 (π−1 (Ō))},
= (π × π)(O),
1.3. GROUPES TOPOLOGIQUES
31
où O ≡ ϕ−1 (π−1 (Ō)). π−1 (Ō) étant ouvert et ϕ continue, O est un ouvert du
produit G × G. Il existe donc des ouverts Oi , Oi0 de G tels que O = ∪i (Oi × Oi0 ).
On a donc
!
[
[
(Oi × Oi0 ) = (π(Oi ) × π(Oi0 )),
ϕ̄−1 (Ō) = (π × π)
i
i
qui est ouvert puisque π est ouvert.
vi. Si G/H est Hausdorff, l’ensemble {π(e)} est fermé dans G/H et comme π est
continue, π−1 ({π(e)}) = H est fermé dans G.
ϕ étant continu ϕ−1 (H) = {(a, b) ∈ G × G | π(a) = π(b)} est fermé si H est
fermé. Si π(a) 6= π(b), alors (a, b) appartient au complémentaire de ϕ−1 (H) qui est
ouvert. Il existe donc des ouverts Oi , Oi0 de G tels que
(a, b) ∈
[
(Oi × Oi0 ) = (G × G) \ ϕ−1 (H).
(1.12)
i
On conclut qu’il existe i avec a ∈ Oi et b ∈ Oi0 et donc π(a) ∈ π(Oi ) et π(b) ∈
π(Oi0 ) où π(Oi ) et π(Oi0 ) sont ouverts puisque π est ouvert. De plus ces ouverts sont
disjoints. En effet, si π(Oi ) ∩ π(Oi0 ) n’est pas vide il existe x ∈ Oi et y ∈ Oi0 tels que
π(x) = π(y). Alors (x, y) ∈ (Oi × Oi0 ) ∩ ϕ−1 (H), ce qui contredit l’égalité dans la
relation (1.12).
Dans un groupe topologique les translations permettent de transporter la topologie
d’un voisinage de l’élément neutre vers un voisinage d’un élément quelconque de G.
Voici une première conséquence de ce principe.
Proposition 2 Soient G et H des groupes topologiques et φ : G → H un morphisme
continu en e ∈ G. Alors φ est un morphisme continu.
Démonstration Soit O un ouvert de H et a ∈ φ−1 (O). On pose b ≡ φ(a−1 ). La
translation à gauche gb étant un homéomorphisme, gb (O) est un voisinage ouvert
de e ∈ H. φ étant continu en e ∈ G, il existe un voisinage ouvert U de e tel que
φ(U) ⊂ gb (O). La translation à gauche ga transforme U en un voisinage ouvert
ga (U) de a tel que
φ(ga (U)) = φ(aU) = φ(a)φ(U) ⊂ φ(a)gb (O) = φ(a)φ(a−1 )O = O,
et donc a ∈ ga (U) ⊂ φ−1 (O), ce qui montre que φ−1 (O) est ouvert.
On démontre de manière complètement analogue que φ est ouvert s’il est ouvert en
e, c’est-à-dire si φ(V) est un voisinage de e pour tout voisinage V de e.
CHAPITRE 1. PRÉLIMINAIRES
32
Si φ : G → H est un morphisme, on a la décomposition canonique
G
π↓
φ
−→
H
↑i
G/ Ker φ −→ Im φ
φ̄
où π est la surjection canonique, i l’injection canonique et φ̄ est un isomorphisme. Si
G et H sont topologiques, il en est de même de G/ Ker φ et de Im φ. Supposons que
φ soit continu. Un sous-ensemble O ⊂ Im φ est ouvert si O = i−1 (O 0 ) = O 0 ∩ Im φ
pour un ouvert O 0 de H. On a donc
φ̄−1 (O) = {π(a) | φ(a) ∈ O 0 } = π(φ−1 (O 0 )),
et comme φ est continu et π ouvert on peut conclure que φ̄ est continu. Si φ est
bi-continu on a de plus, pour tout ouvert Ō ⊂ G/ Ker φ,
φ̄(Ō) = {φ(a) | π(a) ∈ Ō}
= {φ(a) | a ∈ π−1 (Ō)}
= φ(π−1 (Ō)),
et comme π est continu et φ ouvert, on peut conclure que φ̄ est ouvert.
Théorème 10 Soient G, H des groupes topologiques et φ : G → H un morphisme.
i. Si φ est un morphisme continu, φ̄ : G/ Ker φ → Im φ est un isomorphisme
continu.
ii. Si φ est un morphisme topologique, φ̄ est un isomorphisme topologique et donc
G/ Ker φ ≈ Im φ.
Exemple 16 Si H est discret, tout morphisme continu φ : G → H est bi-continu
puisque tout sous-ensemble de H est ouvert.
Soit G un groupe linéaire tel que le morphisme det : G → K∗ aie une image discrète
det(G) (c’est le cas de tous les groupes linéaires réels que nous avons introduit dans
le paragraphe 1.2, puisque ces groupes sont formés de matrices de déterminant ±1).
On a alors Ker det = {T ∈ G | det T = 1} ≡ SG et le quotient G/SG ≈ det G est
discret.
1.3. GROUPES TOPOLOGIQUES
1.3.3
33
Composantes connexes
Soient G un groupe topologique et U ⊂ G un voisinage de l’élément neutre e ∈ G.
U−1 ≡ {a−1 | a ∈ U} étant l’image de U par l’homéomorphisme x 7→ x−1 , c’est un
voisinage de e. Il en est de même de U ∩ U−1 . L’ensemble
G(U) ≡ {a1 a2 · · · an | n ∈
N; a1, . . . , an ∈ U ∩ U−1},
est un sous-groupe de G. En effet, le produit de deux éléments de G(U) est évidemment un élément de G(U), l’inverse d’un élément de G(U) est encore dans G(U) et
finalement e ∈ U ∩ U−1 ⊂ G(U).
Posons V ≡ U ∩ U−1 et soit a ∈ G(U). La translation à gauche ga étant un homéomorphisme, ga (V) = aV est un voisinage de a = ga (e) et comme aV ⊂ G(U)
on en conclut que G(U) est ouvert. G(U) est également fermé. En effet, les classes à
gauche aG(U) = ga (G(U)) sont toutes ouvertes et forment une partition de G. On
a donc
[
G(U) = G \
aG(U).
a∈G\G(U)
On note en particulier que si G est connexe, alors G(U) = G. Nous avons donc
démontré le théorème suivant.
Théorème 11 Soient G un groupe topologique connexe et U un voisinage de son élément neutre. U engendre G : pour tout a ∈ G il existe n ∈ et a1 , . . . , an ∈ U tels
que
a = a1 · · · an .
N
Théorème 12 Dans un groupe topologique G, la composante connexe de l’élément neutre
est un sous-groupe distingué.
Démonstration Soient C la composante connexe de e dans G et a ∈ C. La translation à gauche ga étant un homéomorphisme, ga (C) = aC est également connexe.
C étant la composante connexe de a on a aC ⊂ C. C est donc stable. De même
a−1 C est connexe et contient e. On a donc a−1 C ⊂ C, d’où a−1 ∈ C. C est bien un
sous-groupe.
Soit b ∈ G. La conjugaison jb : x 7→ bxb−1 étant un homéomorphisme, jb (C) est
connexe et contient e. On a donc jb (C) ⊂ C ce qui montre que C est distingué dans
G.
Définition 5 Soit G un groupe topologique. On dénote par C(G) la composante connexe
de son élément neutre. Le groupe G/C(G) est appelé groupe des composantes connexes de
G.
CHAPITRE 1. PRÉLIMINAIRES
34
La translation à gauche ga étant un homéomorphisme, il est clair que ga (C(G)) est
la composante connexe de a dans G. Les éléments du groupe quotient G/C(G) sont
les classes à gauche aC(G) = ga (C(G)), ce sont bien les composantes connexes de
G.
Théorème 13 Si G est un groupe topologique localement connexe, le groupe des composantes connexes de G est discret (voir figure 1.2).
e
G
a
C(G)
b
aC(G)
c
b C(G)
π
c C(G)
G/C(G)
Fig. 1.2 – Le groupe localement connexe G est la somme topologique de ses composantes connexes.
Démonstration Si G est localement connexe, e admet un voisinage connexe V. Soit
U ⊂ V un ouvert contenant e. On a U ⊂ V ⊂ C(G) et si π : G → G/C(G) est la
surjection canonique il en résulte que π(U) ⊂ π(C(G)) = {ē}, où ē = C(G) dénote
l’élément neutre de G/C(G). U étant un ouvert non-vide et π ouvert, on en conclut
que π(U) = {ē} est ouvert. Pour tout ā ∈ G/C(G), la translation à gauche gā est un
homéomorphisme, on obtient ainsi que {ā} = gā ({ē}) est également ouvert. Tout
sous-ensemble de G/C(G) est donc ouvert, c’est-à-dire que la topologie de G/C(G)
est discrète.
R
Exemple 17 ∗ n’est pas connexe, c’est la réunion de deux ouverts disjoints
] − ∞, 0[∪]0, +∞[. Ses deux composantes connexes sont − =] − ∞, 0[ et
]0, +∞[. Le groupe des composantes connexes de ∗ est isomorphe à 2 .
R
R
Z
R∗ =
R+ =
C∗ est connexe par arc et donc connexe. Soient z = reiϕ et w = seiψ où nous
pouvons supposer, sans restreindre la généralité, que 0 < r 6 s. Alors
γ(t) ≡ (r + t(s − r))ei(ϕ+t(ψ−ϕ)) ,
1.3. GROUPES TOPOLOGIQUES
35
est une courbe continue reliant z à w et telle que |γ(t)| = r + t(s − r) > r > 0.
Exemple 18 Le groupe orthogonal O(d) n’est pas connexe. Le morphisme det :
O(d) → {−1, +1} étant continu et surjectif, on a une décomposition
O(d) = det−1 ({1}) ∪ det−1 ({−1}),
en sous-ensembles fermés disjoints. Comme det I = 1, la composante connexe de I
dans O(d) ne peut contenir que des rotation. C’est un sous-groupe de SO(d).
Le groupe SO(d) est connexe par arc. En effet, si T ∈ SO(d) il existe S ∈ O(d), et
α1 , . . . , αr ∈ tels que


R(α1 ) · · ·
0
0
 ..
..
.. 
..

.
.
. 
T = S .
(1.13)
 S−1 ,
 0
· · · R(αr )
0 
0
···
0
Id−2r
R
où Id−2r est la matrice unité de dimension d − 2r et
cos α − sin α
R(α) ≡
.
sin α cos α
(1.14)
On définit une courbe continue T (t) dans SO(2) telle que T (0) = I et T (1) = T en
remplaçant dans (1.13) les blocs R(αk ) par R(tαk ).
Si S est un autre élément de SO(d), on définit de manière analogue une courbe S(t)
dans SO(d) telle que S(0) = I et S(1) = S. La courbe composée
S(1 − 2t) si t ∈ [0, 1/2],
γ(t) ≡
T (2t − 1) si t ∈ [1/2, 1],
est continue et relie S à T .
La composante connexe de I dans O(d) est le groupe SO(d). En effet c’est d’une
part le plus grand sous-ensemble connexe de O(d) contenant I, il doit donc contenir
SO(d). D’autre part nous avons déjà remarqué que ce sous-ensemble doit être un
sous-groupe de SO(d). Le groupe des composantes connexes de O(d) est donc le
quotient
O(d)/ SO(d) = O(d)/ Ker det ≈ Im det = {−1, +1} ≈
Z2 .
Si P ∈ O(d) est un élément quelconque de déterminant −1 on a
[
O(d) = SO(d) P SO(d).
On démontre de manière très similaire que U(d) et SU(d) sont connexes par arc.
CHAPITRE 1. PRÉLIMINAIRES
36
C
C
Exemple 19 GL(d, ) est connexe par arc. Soient T ∈ GL(d, ) et
T (z) ≡ I + z(T − I).
(1.15)
Alors p(z) ≡ det T (z) est un polynôme ne s’annulant pas en z = 0 et en z = 1.
Il existe donc une courbe continue γ : [0, 1] → telle que γ(0) = 0, γ(1) = 1 et
p(γ(t)) 6= 0 pour tout t ∈ [0, 1] (voir figure 1.3). Alors Tt ≡ T ◦ γ(t) est une courbe
continue dans GL(d, ) reliant I à T . On procède ensuite comme dans l’exemple 18.
C
C
0
1
γ
Fig. 1.3 – La courbe γ évite les zéros de p(z).
C
C
SL(d, ) est connexe par arc. Soient T ∈ SL(d, ) et T (z) donné par la formule
(1.15). Le problème est ici compliqué par le fait que p(z) = det T (z) 6= 1 et donc
Q
T (z) 6∈ SL(d, ). On a la factorisation p(z) = A di=1 (z − zi ) et on muni chaque
zéro zi d’une coupure selon la figure 1.4. Il existe une courbe continue γ reliant 0 à
1 et évitant toutes les coupures. On peut donc définir
C
∆(z) = A
1/d
d
Y
(z − zi )1/d
i=1
comme une fonction analytique dans un voisinage de γ telle que ∆(z)d = p(z). On
définit finalement Tt0 = T ◦ γ(t)/∆ ◦ γ(t). C’est une courbe continue dans SL(d, )
reliant I à T et on termine comme précédemment.
C
0
γ
1
Fig. 1.4 – La courbe γ évite les coupures issues des zéros de p(z).
1.3. GROUPES TOPOLOGIQUES
37
R
Exemple 20 GL(d, ) n’est pas connexe, on a
R
R
R
où GL± (d, R) ≡ {T ∈ GL(d, R) | ± det T > 0} sont ouverts et disjoints. GL+ (d, R)
est un groupe, c’est la pré-image dans GL(d, R) du groupe ]0, ∞[ par le morphisme
GL(d, ) = GL+ (d, ) ∪ GL− (d, ),
det.
R
R
+
>
GL+ (d, ) est connexe par arc.
P Soit T ∈ GLP(d, ), alors A ≡ T T2 est une matrice
symétrique définie positive ij Aij xi xj = ijk Tki Tkl xi xj = |T x| . Il existe donc
S ∈ O(d) tel que A = S−1 DS avec Dij = δij λi et λi > 0. Soit R la racine carrée
1/2
1/2
de A, R = S−1 D1/2 S où Dij = δij λi . Alors U = T R−1 ∈ SO(d). En effet si
P
(x, y) = i xi yi dénote le produit scalaire usuel sur d on a
R
(Ux, Uy) = (T R−1 x, T R−1 y) = (x, R−1 R2 R−1 y) = (x, y),
et det U = det T/ det R = det T/ det D1/2 > 0. On a donc T = UR (c’est la décomposition polaire de T ). D’après l’exemple 18, il existe une courbe continue U(t)
dans SO(d) telle que U(0) = I et U(1) = U. On définit R(t) ≡ S−1 M(t)S avec
t/2
Mij (t) = δij λi . Alors T (t) = U(t)R(t) est continue, T (1) = UR = T et T (0) = I.
On procède ensuite comme dans l’exemple 18, en particulier on note que la composante connexe de I dans GL(d, ) est GL+ (d, ).
R
R
R
On procède de façon analogue pour montrer que SL(d, ) est connexe par arc. On
remarque en effet que si det T = 1, alors
det T (t) = det R(t) = det M(t) =
d
Y
i=1
t/2
λi
=
d
Y
!t/2
λi
= 1.
i=1
Le tableau 1.1 résume la situation pour les groupes linéaires que nous avons introduits dans le paragraphe 1.2.
1.3.4
Espaces simplement connexes
Définition 6 Un espace topologique X est simplement connexe s’il est connexe par arc
et si toute courbe fermée et continue γ dans X peut être continuement déformée en un
point : pour toute courbe continue γ : [0, 1] → X telle que γ(0) = γ(1) il existe une
application Γ : [0, 1] × [0, 1] → X telle que
i. Γ (t, 0) = γ(t) pour tout t ∈ [0, 1].
ii. Γ (t, 1) = Γ (0, 1) pour tout t ∈ [0, 1].
iii. Γ (0, s) = Γ (1, s) pour tout s ∈ [0, 1].
CHAPITRE 1. PRÉLIMINAIRES
38
Groupe
GL(d, )
SL(d, )
GL(d, )
SL(d, )
U(d)
SU(d)
O(d)
SO(d)
O(p, n)
SO(p, n)
Sp(2n)
C
C
R
R
Connexe (simplement) Groupe des composantes connexes
oui (non)
oui (oui)
non
2
oui (non)
oui (non)
oui (oui)
non
2
oui (non)
non
4
non (pn 6= 0)
2
oui (non)
Z
Z
Z
Z
Tab. 1.1 – Connexité des groupes linéaire
C
Exemple 21 ∗ n’est pas simplement connexe. Soit Γ (t, s) une déformation continue du cercle γ(t) ≡ e2iπt dans un point a ∈ ∗ . Γ étant uniformément continue,
pour tout il existe δ tel que |Γ (t, s) − a| < si (t, s) ∈ [0, 1] × [1 − δ, 1]. La courbe
déformée Γ (·, s) est donc entièrement contenue dans le disque D (a). Comme cette
courbe encercle 0 on a aussi 0 ∈ D (a). On en conclut que a = 0 ce qui est absurde.
C
ǫ
0
a
Fig. 1.5 – Les points a et 0 sont dans le même -voisinage.
C
C
Exemple 22 GL(d, ) n’est pas simplement connexe. La courbe fermée dans GL(d, )
définie par


e2πit


1


γ(t) = 
,
.
.


.
1
n’est pas continuement déformable en un point. En effet, si une telle déformation
1.3. GROUPES TOPOLOGIQUES
39
Γ (t, s) existait, alors Γ̃ (t, s) ≡ det Γ (t, s) serait une déformation continue du cercle
γ̃(t) = det γ(t) = ei2πt dans ∗ ce qui est impossible par l’exemple précédent. Cet
argument montre également que U(d) n’est pas simplement connexe.
C
1.3.5
Mesure de Haar d’un groupe compact
Dans le première partie de ce cours, la mise en oeuvre du concept de moyenne invariante sur un groupe fini a permis de développer complètement la théorie des
représentations de ces groupes. Il est clair que si une telle moyenne invariante existe
sur un groupe topologique, la théorie des représentations de ce groupe pourra être
développée en suivant les même lignes (relations d’orthogonalités, caractères, ...)
Le théorème suivant montre que la théorie des représentations des groupes topologiques compacts est très similaire à celle des groupes finis. Nous suivrons une voie
complètement différente dans cette seconde partie du cours. Nous ne démontrerons
donc pas ce résultat (voir par exemple W. Rudin : Functional Analysis. McGraw-Hill,
New York, 1973).
Théorème 14 Sur un groupe topologique compact G il existe une unique mesure de
Borel régulière µ telle que µ(G) = 1 et
Z
Z
f(gx)dµ(x) =
f(x)dµ(x),
G
G
pour tout g ∈ G et f ∈ C(G). On appelle µ mesure de Haar de G.
La mesure de Haar µ satisfait également
R
R
i. G f(xg)dµ(x) = G f(x)dµ(x) pour tout g ∈ G et f ∈ C(G).
R
R
ii. G f(x−1 )dµ(x) = G f(x)dµ(x) pour tout f ∈ C(G).
Exemple 23 Sur le groupe G ≡ SO(2), la mesure de Haar est donnée par
Z
Z 2π
dα
Mf ≡
f(g)dµ(g) =
f(g(α)) ,
2π
SO(2)
0
où g(α) représente la rotation d’angle α. La représentation régulière de G dans l’espace L2 (G, dµ) des fonctions de carré intégrable sur G est donnée par
πreg (g) : L2 (G, dµ) → L2 (G, dµ)
f(·)
7→ f(g−1 ·).
Les sous-espaces invariants par cette représentation sont les sous-espaces de dimension 1 engendrés par les fonction fn (g(α)) = einα . On a en effet
πreg (g(β))fn = e−inβ fn ≡ χn (g(β))fn ,
CHAPITRE 1. PRÉLIMINAIRES
40
ce qui montre que les caractères irréductibles de SO(2) sont les fonctions
χn (g(β)) = e−inβ ,
qui forment une base orthonormée de L2 (G, dµ).
R
Exemple 24 Sur le groupe additif , la seule mesure invariante par translation est la
mesure de Lebesgue. Comme elle n’est pas finie, il n’existe pas de moyenne invariante
sur . Ce n’est pas une spécificité du groupe . Tout groupe localement compact
admet une mesure invariante par translation. Cependant, cette mesure n’est finie que
lorsque le groupe est compact.
R
R
Chapitre 2
Groupes de Lie
2.1
Définition et exemples
Définition 7 Un groupe de Lie matriciel est un sous-groupe fermé d’un groupe linéaire
GL(d, K).
Un groupe de Lie est un groupe G muni d’une structure de variété différentiable
telle que les opérations de groupe (produit et inversion) soient différentiables. Sans
entrer dans les détails, G est une variété différentiable de dimension k si c’est un
sous-ensemble de M tel que, pour tout a ∈ G, il existe un voisinage U 3 a dans
M
et un système de coordonnées différentiables (x1 , . . . , xM ) : U → M tel que
R
R
R
G ∩ U = {b ∈ U | xk+1 (b) = · · · = xM (b) = 0}.
La notion de groupe de Lie est plus générale que celle de groupe de Lie matriciel formulée dans la définition 7. Cependant les groupes de Lie sont pratiquement tous des
groupes de Lie matriciels. Comme d’autre part le développement de la théorie générale des groupes de Lie nécessite la mise en oeuvre de tout un arsenal de géométrie
différentielle des variétés, nous nous restreindrons dans ce cours aux seuls groupes
de Lie matriciels. Par la suite nous sous-entendrons toujours cette restriction et parlerons simplement de groupe de Lie.
On notera qu’un groupe de Lie G ⊂ GL(d, K) est naturellement un groupe topologique muni de la topologie relative. Le fait que G soit fermé dans GL(d, K) peut se
traduire de la manière suivante. Pour toute suite Xn dans G telle que limn→∞ Xn = X
pour un X ∈ Mat(d, K) on a soit X ∈ G, soit X 6∈ GL(d, K).
On sera attentif au fait qu’un groupe de Lie n’est pas nécessairement un sous-ensemble
fermé de Mat(d, K). Par contre un sous-groupe de GL(d, K) fermé dans Mat(d, K)
l’est également dans GL(d, K) et est donc un groupe de Lie.
41
CHAPITRE 2. GROUPES DE LIE
42
Dans un groupe de Lie, les opérations de groupes (a, b) 7→ ab et a 7→ a−1 sont
analytiques. C’est évident pour le produit qui est une application bilinéaire dans
l’algèbre Mat(d, K). Pour l’inverse, c’est une conséquence de la formule (1.7). On a
le développement
(a + h)−1 = [a(I + a−1 h)]−1 = (I + a−1 h)−1 a−1 =
∞
X
(−1)n (a−1 h)n a−1 ,
n=0
qui est absolument convergent pour khk < ka−1 k−1 .
Théorème 15 Un groupe de Lie G ⊂ GL(d, K) est compact si et seulement si G est un
sous-ensemble fermé et borné de l’algèbre Mat(d, K).
Démonstration Comme Mat(d, K) est un K-espace vectoriel de dimension finie, il
ne s’agit ici que d’une forme déguisée du théorème de Borel-Lebesgue.
Exemple 25 GL(d, k) est le premier exemple de groupe de Lie. Il n’est ni fermé ni
borné dans Mat(d, K) puisque pour tout λ ∈ K∗ on a Tλ ≡ λI ∈ GL(d, K) et
lim Tλ = 0 6 ∈ GL −d, K),
λ→0
lim kTλ k = ∞.
λ→0
(2.1)
La fonction det étant continue, SL(d, K) = {T ∈ GL(d, K) | det T = 1} est fermé
dans GL(d, K), c’est donc un groupe de Lie. Il est compact (en fait trivial !) pour
d = 1. Pour d > 1 il n’est ni fermé ni borné dans Mat(d, K), en effet la matrice


λ 0 0 ··· 0
 0 λ−1 0 · · · 0 


 0 0 1 ··· 0 
Tλ ≡ 
,
 ..
..
.. . . .. 
 .
. . 
.
.
0 0 0 ··· 1
est un élément de SL(d, K) qui satisfait aussi (2.1).
Exemple 26 Il est aisé de se convaincre que T 7→ T ∗ est une application continue
dans Mat(d, K) (si K = , on conviendra que T ∗ = T > ). Si g ∈ GL(d, K), l’application
T 7→ T ∗ gT ,
R
est donc continue. On en conclut que le sous-ensemble
Gg ≡ {T ∈ GL(d, K) | T ∗ gT = g},
2.1. DÉFINITION ET EXEMPLES
43
es fermé dans GL(d, K). On vérifie aisément que c’est un groupe. C’est donc un
groupe de Lie. On remarque que pour tout T ∈ Mat(d, K), T ∗ gT = g implique
| det T | = 1 et en particulier T ∈ GL(d, K). On a donc
Gg = {T ∈ Mat(d, K) | T ∗ gT = g},
ce qui montre que Gg est également fermé dans Mat(d, K).
Si g est symétrique (ou hermitienne) et définie (sans restriction de la généralité
nous supposerons g définie positive), alors |||T |||2 ≡ tr(T ∗ gT ) définit une norme
sur Mat(d, K) (ce n’est pas une norme d’algèbre, mais ceci na pas d’importance pour
le présent argument). Pour tout T ∈ Gg on a alors |||T ||| = tr(g)1/2 ce qui montre
que Gg est borné. C’est donc un groupe de Lie compact.
Un choix approprié de g, montre que les groupes orthogonaux O(p, n), symplectiques Sp(2n) et unitaires U(p, n) sont des groupes de Lie fermé dans leurs algèbres
matricielles respectives. De plus O(d) et U(d) sont des groupes de Lie compacts.
On montre facilement que O(p, n) et U(p, n) ne sont pas compacts si p, n > 0. De
même Sp(2n) n’est pas compact.
Exemple 27 Les groupes d’isométries affines A(p, n) sont des groupes de Lie. En
effet si
T k ak
fk =
∈ A(p, n),
0 1
R
est une suite convergente dans Mat(p + n + 1, ) alors Tk ∈ O(p, n) est une suite
convergente dans Mat(p + n, ) et comme O(p, n) est fermé dans cette algèbre sa
limite T appartient à O(p, n). De même la suite ak ∈ p+n est convergente et sa
limite a est un élément de p+n . On a donc
T a
lim fk = f =
∈ A(p, n),
0 1
k→∞
R
R
R
R
ce qui montre que A(p, n) est fermé dans Mat(p + n + 1, ) et donc aussi dans
GL(p + n + 1, ). Par contre il n’est pas borné, même lorsque p ou n est nul
puisque kfk → ∞ lorsque |a| → ∞. A(p, n) n’est donc pas compact.
R
R
Exemple 28 Le groupe diédral Dn est un sous-groupe discret de GL(2, ), c’est
donc un groupe de Lie. Il est cependant de nature très particulière puisque la composante connexe de I dans Dn se réduit à {I}.
Définition 8 Soit G un groupe de Lie. On appelle sous-groupe de Lie de G un sousgroupe fermé de G.
Théorème 16 Un sous groupe de Lie H d’un groupe de Lie G est un groupe de Lie. Si G
est compact, H l’est également.
CHAPITRE 2. GROUPES DE LIE
44
Démonstration Il suffit de montrer qu’un sous-ensemble H fermé dans le groupe
G ⊂ GL(d, K) est aussi fermé dans GL(d, K). C’est une propriété générale de la
topologie relative.
Soit X un espace topologique et Y ⊂ X un sous-espace muni de la topologie relative.
Sur le sous-ensemble Z ⊂ Y ⊂ X les topologies relatives à Y et à X coïncident.
En effet si i1 : Y → X et i2 : Z → Y sont les injections canoniques, alors la composition i1 ◦ i2 : Z → X est l’injection canonique. La topologie de Z relative à X
−1
est donc TZ = {(i1 ◦ i2 )−1 (O) | O ouvert de X}. Or (i1 ◦ i2 )−1 (O) = i−1
2 (i1 (O))
et les sous-ensembles O 0 = i−1
1 (O) sont précisément les ouverts de Y. On a donc
−1
0
0
TZ = {i2 (O ) | O ouvert dans Y} qui est la topologie de Z relative à Y. Les deux
topologies relatives sur Z étant identiques, elle admettent les même sous-ensembles
fermés.
La seconde assertion du théorème suit du fait qu’un sous ensemble fermé d’un
compact est compact.
On notera en particulier que la composante connexe de I dans un groupe de Lie est
un sous-groupe de Lie.
Exemple 29 Si G est un groupe de Lie, alors SG ≡ {T ∈ G | det T = 1} est un
sous-groupe de Lie puisque l’application det est continue. Ainsi SO(p, n) est un
sous-groupe de Lie de O(p, n) et SU(p, n) un sous-groupe de Lie de U(p, n). De
plus SO(d) et SU(d) sont des groupes de Lie compacts.
Définition 9 Un morphisme de Lie entre deux groupes de Lie G et H est un morphisme
continu de G dans H.
Nous verrons plus tard qu’un morphisme de Lie est automatiquement analytique.
Nous connaissons déjà un exemple de ce phénomène : un morphisme continu du
groupe de Lie
dans un groupe de Lie G ⊂ Mat(d, K) est un sous-groupe à un
paramètre et est analytique d’après le Théorème 5.
R
2.2
L’algèbre de Lie d’un groupe de Lie
Définition 10 Soit G ⊂ GL(d, K) un groupe de Lie. On appelle algèbre de Lie de G
l’ensemble
g ≡ {X ∈ Mat(d, K) | etX ∈ G pour tout t ∈ }.
R
Il est important de remarquer que la condition eX ∈ G n’implique pas nécessairement que X ∈ g. Par exemple X ≡ 2πiI ∈ Mat(d, ) satisfait eX = I ∈ SU(d), alors
que etX = e2πit I 6∈ SU(d) pour td 6∈ . Cependant on peut remplacer la condition
globale etX ∈ G par une condition locale, comme le montre le lemme suivant.
Z
C
2.2. L’ALGÈBRE DE LIE D’UN GROUPE DE LIE
45
Lemme 1 Soit G ⊂ GL(d, K) un groupe de Lie et g son algèbre de Lie. Pour tout > 0
on a
g = {X ∈ Mat(d, K) | etX ∈ G pour tout t ∈] − , [}.
R
Démonstration On remarque que pour tout s ∈
il existe un entier N tel que
tX
δ = s − N/2 ∈ [0, /2[. Si e ∈ G pour |t| < on a donc
esX = e(N/2+δ)X = (eX/2 )N eδX ∈ G,
ce qui montre que X ∈ g.
X ∈ Mat(d, K) est un élément de l’algèbre de Lie de G si et seulement si le sousgroupe à un paramètre qu’il engendre, φ(t) = etX , est un sous-groupe de G. On
d
φ(t)|t=0 , c’est-à-dire que X est le vecteur tangent à la courbe φ(t)
note que X = dt
en φ(0) = I. L’algèbre de Lie d’un groupe de Lie est donc l’ensemble des vecteurs
tangents en I aux sous groupes à un paramètres de G.
I
X
φ(t)
G
Fig. 2.1 – X comme vecteur tangent en I au sous-groupe φ(t).
R∗ (respectivement C∗) est R (respectiveR est {0} alors que celle du sous-groupe
Exemple 30 L’algèbre de Lie du groupe
ment ). Celle du sous-groupe {−1, 1} ⊂
S1 = {z ∈ | |z| = 1} est i .
C
C
R
R
Exemple 31 Pour tout X ∈ Mat(d, K) et tout t ∈ on a etX ∈ GL(d, K). En effet,
d’après le théorème 6, etX est inversible et e−tX est son inverse. L’algèbre de Lie de
GL(d, K) est donc
gl(d, K) = Mat(d, K).
Toujours d’après le théorème 6, det etX = et tr X . L’algèbre de Lie de SL(d, K) est
donc
sl(d, K) = {X ∈ Mat(d, K) | tr X = 0}.
Théorème 17 L’algèbre de Lie g d’un groupe de Lie G ⊂ GL(d, K) est un espace vectoriel réel. On appelle dimension du groupe G la dimension de cet espace vectoriel.
CHAPITRE 2. GROUPES DE LIE
46
Démonstration Comme g ⊂ Mat(d, K), il suffit de montrer que g est stable pour
l’addition et la multiplication par un scalaire réel. Si X ∈ g et λ ∈ on a et(λX) =
e(tλ)X ∈ G pour tout t ∈
et donc λX ∈ g. Si X, Y ∈ g et t ∈ , il suit de la
formule de Lie (théorème 7) que
R
R
R
et(X+Y) = lim (etX/N etY/N )N .
N→∞
Comme pour tout N, etX/N et etY/N sont des éléments de G et comme G est un
groupe on a (etX/N etY/N )N ∈ G. G étant fermé dans GL(d, K) et la limite et(X+Y)
étant un élément de GL(d, K) il suit que et(X+Y) ∈ G. On a donc X + Y ∈ g.
C
Exemple 32 La dimension du groupe de Lie GL(d, ) est 2d2 , son algèbre de Lie
Mat(d, ) étant de dimension complexe d2 . La dimension de GL(d, ) est d2 .
C
R
L’application X 7→ tr X est une forme linéaire sur Mat(d, K), son noyau est donc
de codimension 1. On a par conséquent dimK sl(d, K) = d2 − 1 qui nous permet de
conclure que SL(d, ) est de dimension 2(d2 −1) alors que SL(d, ) est de dimension
d2 − 1.
C
R
R
Exemple 33 Soit X ∈ Mat(p + n, ), alors etX ∈ O(p, n) si et seulement si
(etX )> getX = g,
(2.2)
où g est la matrice diagonale gij = gi δij avec
g1 = · · · = gp = 1,
gp+1 = · · · = gp+n = −1.
En utilisant le théorème 6 on peut donc écrire (2.2) comme
>
−1
etX = ge−tX g−1 = e−tgXg .
L’application exponentielle étant injective près de 0, cette dernière égalité ne peut
être vraie pour tout t ∈ que si X> = −gXg−1 , ou encore Xg + gX> = 0. L’algèbre
de Lie du groupe O(p, n) est donc
R
R
o(p, n) = {X ∈ Mat(p + n, ) | Xg + gX> = 0}.
En utilisant une notation par blocs, on obtient que X ∈ o(p, n) si et seulement si
A B
X=
,
(2.3)
B> C
où A est une matrice p × p réelle anti-symétrique (A + A> = 0), C une matrice
d × d réelle anti-symétrique (C + C> = 0) et B une matrice réelle p × n.
2.2. L’ALGÈBRE DE LIE D’UN GROUPE DE LIE
47
L’espace vectoriel réel des matrices d × d réelles et anti-symétriques est de dimension
(d2 − d)/2. On en conclut que la dimension de O(p, n) est ne dépend que de d =
p + n,
dim O(p, n) =
p(p − 1) n(n − 1)
(p + n)(p + n − 1)
d(d − 1)
+
+ pn =
=
.
2
2
2
2
On note en particulier que l’algèbre de Lie de O(d) est l’ensemble des matrices d×d
réelles anti-symétriques,
R
o(d) = {X ∈ Mat(d, ) | X + X> = 0}.
On remarque qu’une matrice réelle anti-symétrique a une trace nulle, ses éléments
diagonaux étant tous nuls. Si X ∈ o(p, n) la représentation (36) montre que tr X =
tr A + tr C = 0 et par conséquent det etX = et tr X = 1, c’est-à-dire que etX ∈
SO(p, n). L’algèbre de Lie de SO(p, n) coïncide donc avec celle de O(p, n) et il en
est de même de leurs dimensions.
Exemple 34 Penchons nous de plus près sur le groupe SO(3) qui joue un rôle particulièrement important puisque c’est le groupe des rotations dans l’espace physique
à trois dimensions. Comme nous l’avons vu dans l’exemple précédent, son algèbre
de Lie so(3) est l’espace vectoriel réel des matrices réelles 3 × 3 anti-symétriques. Sa
dimension est 3 et coïncide donc avec la dimension de l’espace sur lequel agissent ces
matrices (d(d − 1)/2 = d si et seulement si d = 3 !). Comme espace vectoriel, so(3)
est donc isomorphe à R3 , un tel isomorphisme est donné par




ω1
0
−ω3 ω2
0
−ω1  .
ω =  ω2  7−→ Ω =  ω3
(2.4)
ω3
−ω2 ω1
0
On note que pour tout x ∈ R3 on a
Ωx = ω ∧ x,
où ∧ dénote le produit vectoriel dans R3 . Par conséquence x(t) = etΩ x satisfait
l’équation différentielle
ẋ(t) = Ωx(t) = ω ∧ x(t).
Soit P la projection orthogonale sur la droite dirigée par ω et Q la projection sur le
plan perpendiculaire à ω
Px =
(ω · x)ω
,
|ω|2
Qx = (I − P)x.
Pour z(t) = Px(t) on obtient immédiatement
ż(t) = Pẋ(t) = P(ω ∧ x(t)) = 0,
CHAPITRE 2. GROUPES DE LIE
48
et donc z(t) = z(0). En utilisant l’identité de Lagrange a∧(b∧c) = b(a·c)−c(a·b)
on note que
ẍ(t) = ω ∧ ẋ(t) = ω ∧ (ω ∧ x(t)) = (ω · x(t))ω − |ω|2 x(t) = −|ω|2 Qx(t),
et par conséquence y(t) = Qx(t) satisfait
ÿ(t) = −|ω|2 y(t).
Cette équation se résout immédiatement
y(t) = cos(|ω|t)y(0) +
sin(|ω|t)
ẏ(0).
|ω|
Comme ẏ(0) = Qẋ(0) = Q(ω∧x) = ω∧x, on obtient ainsi la formule de rotation
d’Euler
sin(|ω|t)
ω ∧ x.
etΩ x = Px + cos(|ω|t)Qx +
|ω|
On en déduit que etΩ est une rotation d’angle |ω|t autour de l’axe dirigé par ω.
Exemple 35 On détermine de façon similaire l’algèbre de Lie des groupes unitaires
U(d). Il suffit de remplacer X> par X∗ dans l’exemple précédent. On obtient l’algèbre de Lie
u(d) = {X ∈ Mat(d, ) | X + X∗ = 0}.
C
qui est l’ensemble de s matrices d × d anti-hermitiennes. La dimension du groupe
unitaire U(d) est 2(d2 − d)/2 + d = d2 .
On a etX ∈ SU(d) si et seulement si etX ∈ U(d) et det etX = et tr X = 1. L’algèbre
de Lie de SU(d) est donc
su(d) = {X ∈ u(d) | tr X = 0}.
R
La trace d’une matrice anti-hermitienne étant réelle, l’application tr : u(d) → est
une forme linéaire dont le noyau est de codimension 1. La dimension de SU(d) est
donc d2 − 1.
Exemple 36 Pour déterminer l’algèbre de Lie du groupe symplectique Sp(2n), on
procède de manière analogue aux deux exemples précédents. La différence réside
cette fois dans le fait que la matrice symétrique g est remplacée par la matrice antisymétrique Ω. On obtient facilement
R
sp(2n) = {X ∈ Mat(2n, ) | XΩ + ΩX> = 0}.
En notation par blocs, X ∈ sp(2n) si et seulement si
A
B
X=
,
C −A>
2.2. L’ALGÈBRE DE LIE D’UN GROUPE DE LIE
49
où A, B, C sont des matrices n × n réelles et B, C sont symétriques. La dimension de
l’espace vectoriel réel des matrices n×n symétriques est (n2 −n)/2+n = n(n+1)/2.
La dimension de Sp(2n) est donc
n2 + 2
Groupe
GL(d, )
SL(d, )
GL(d, )
SL(d, )
U(d)
SU(d)
O(p, n)
SO(p, n)
Sp(2n)
C
C
R
R
Dimension
2d2
2(d2 − 1)
d2
d2 − 1
d2
d2 − 1
d(d − 1)/2
d(d − 1)/2
n(2n + 1)
n(n + 1)
= n(2n + 1).
2
Algèbre de Lie
gl(d, ) = Mat(d, )
sl(d, ) = {X ∈ Mat(d, ) | tr X = 0}
gl(d, ) = Mat(d, )
sl(d, ) = {X ∈ Mat(d, ) | tr X = 0}
u(d) = {X ∈ Mat(d, ) | X∗ = −X}
su(d) = {X ∈ Mat(d, ) | X∗ = −X, tr X = 0}
o(p, n) = {X ∈ Mat(d, ) | Xg + gX> = 0}
so(p, n) = {X ∈ Mat(d, ) | Xg + gX> = 0}
sp(2n) = {X ∈ Mat(2n, ) | XΩ + ΩX> = 0}
C
C
R
R
C
R
C
R
C
C
R
R
R
Tab. 2.1 – Algèbres de Lie des groupes classiques (d ≡ p + n)
Si G est un groupe de Lie et g son algèbre de Lie, l’application exponentielle
exp : g → G
X 7→ exp X ≡ eX ,
est réelle-analytique. En particulier elle est continue et comme g est un espace vectoriel il est connexe et il en est de même de son image exp g ⊂ G. Comme d’autre part
I ∈ exp g on en conclut que exp g est contenu dans la composante connexe C(G). Il
en résulte que l’algèbre de Lie du groupe de Lie C(G) coïncide avec g.
Exemple 37 La composante connexe de I dans le groupe diédral Dn est {I} puisque
ce groupe est discret. On en conclut que l’algèbre de Lie du groupe Dn est triviale
dn = {0}. Dn est un groupe de Lie de dimension 0.
Exemple 38 Nous avons vu dans l’exemple 32 que O(p, n) et SO(p, n) ont la même
algèbre de Lie. Pour le comprendre, il suffit de remarquer que O(p, n) n’est pas
connexe et que SO(p, n) est fermé dans O(p, n). La composante connexe C de I
dans O(p, n) doit être contenue dans SO(p, n) puisque le déterminant prenant ses
valeurs dans {−1,1} sur O(p, n) doit être constant (égal à 1) sur C. Ainsi C est aussi la
composante connexe de I dans SO(p, n) et les algèbres de Lie des groupes O(p, n),
SO(p, n) et C coïncident.
CHAPITRE 2. GROUPES DE LIE
50
2.3
L’application exponentielle g → G
Théorème 18 Soit G un groupe de Lie et g son algèbre de Lie. Il existe des voisinages
0 ∈ U ⊂ g et I ∈ V ⊂ G tels que l’application exp : U → V soit un difféomorphisme.
Démonstration Nous savons que exp est un difféomorphisme analytique entre
U0 ≡ {X ∈ Mat(d, K) | kXk < log 2} et le voisinage I ∈ exp U0 ⊂ GL(d, K), son
inverse étant donné par log. Le théorème est donc démontré dans le cas particulier
G = GL(d, K).
Dans le cas général G ⊂ GL(d, K) l’algèbre de Lie g est un sous-espace vectoriel
réel de Mat(d, K) que nous pouvons considérer comme un espace vectoriel réel (de
dimension 2d2 si K = ). Il existe donc un sous-espace supplémentaire tel que
Mat(d, K) = g ⊕ h. L’application
C
F : g ⊕ h → Mat(d, K)
X ⊕ Y 7→ eX eY ,
est un difféomorphisme de tout voisinage suffisamment petit U de 0 ⊕ 0 dans son
image F(U). En effet F est différentiable et on calcule aisément l’application dérivée
de F en 0 ⊕ 0,
d
F(tX, tY)
= X + Y,
(DF0⊕0 )X ⊕ Y =
dt
t=0
c’est-à-dire que DF0⊕0 = I. Le théorème de la fonction inverse montre que F est un
difféomorphisme d’un voisinage de 0 ⊕ 0 dans g ⊕ h dans un voisinage de I dans
Mat(d, K).
Comme F(g ∩ U) ⊂ G ∩ F(U) il suffit de montrer qu’il existe un voisinage V de
I dans G tel que V ⊂ F(g ∩ U) = exp(g ∩ U). Dans ce cas en effet exp est un
difféomorphisme de log(V) dans V dont l’inverse est log |V .
F
h
U
g
F (U )
0
I
G
V
Fig. 2.2 – Le difféomorphisme F : g ⊕ h → Mat(d, K).
2.3. L’APPLICATION EXPONENTIELLE G → G
51
Supposons au contraire qu’un tel V n’existe pas. Il existe alors une suite an dans
G ∩ F(U) telle que an → I et an 6∈ F(g ∩ U). On a donc an = F(Xn ⊕ Yn ) avec
Yn 6= 0, Xn → 0, Yn → 0 et bn ≡ eYn = e−Xn an ∈ G. Comme la sphère unité
h1 ≡ {Y ∈ h | kYk = 1} est compacte on peut supposer, en passant éventuellement à
une sous-suite, que Yn /kYn k → Y ∈ h1 .
R
Pour t ∈
soit kn la suite d’entier telle que kn < t/kYn k 6 kn + 1. Comme
kYn k → 0 on a kn kYn k → t et donc bknn = ekn Yn = e(kn kYn k)(Yn /kYn k) → etY .
G étant fermé dans GL(d, K) et etY ∈ GL(d, K) on peut conclure de bknn ∈ G que
etY ∈ G pour tout t ∈ , c’est-à-dire que Y ∈ g.
R
Puisque g ∩ h = {0} implique g ∩ h1 = ∅, ceci est une contradiction.
Corollaire 1 Soit G un groupe de Lie et g son algèbre de Lie. Si U est un voisinage
suffisamment petit de 0 dans g, tout élément a de la composante connexe C(G) de I dans
G peut s’exprimer comme
a = e X1 e X 2 · · · e Xn ,
avec n ∈
N et X1, . . . , Xn ∈ U.
Démonstration Nous avons déjà remarqué que C(G) est un groupe de Lie d’algèbre
de Lie g. Par le théorème 18, si U est assez petit il existe un voisinage V 3 I dans
C(G) tel que pour tout b ∈ V on aie b = eX pour un X ∈ U. Par le théorème 11,
tout élément a ∈ C(G) s’écrit comme un produit a = b1 · · · bn avec bi ∈ V.
La démonstration du théorème 18 montre que dans un voisinage V de I dans GL(d, K)
l’application F−1 : GL(d, K) → g⊕h fourni un système de coordonnées (X(a), Y(a)) =
F−1 (a) tel que G ∩ V = {a ∈ GL(d, K) | Y(a) = 0}. Les translations à gauche de G
permettent de transporter ces coordonnées dans un voisinage d’un point quelconque
de G et de montrer que G admet la structure de variété différentiable évoquée au début du paragraphe 2.1.
Si γ :] − , [→ G est une courbe différentiable dans le groupe de Lie G telle que
γ(0) = I, le théorème 18 montre que X(t) ≡ log f(t) est une courbe différentiable
dans l’algèbre de Lie g de G définie pout t assez petit. Le vecteur tangent à cette
courbe en t = 0 est un élément de g donné par
∞
n
X
d
(I
−
γ(t))
d
X(t)
=−
= γ̇(0).
dt
dt
n
t=0
n=1
t=0
On voit donc que le vecteur tangent à la courbe γ en t = 0, c’est-à-dire lorsque γ
passe en I, est un élément de g. Comme nous avons déjà remarqué, à la suite du
lemme 1, que tout X ∈ g est le vecteur tangent à la courbe φ(t) = etX en t = 0,
nous avons le théorème suivant.
CHAPITRE 2. GROUPES DE LIE
52
Théorème 19 L’algèbre de Lie d’un groupe de Lie G est l’espace vectoriel tangent à G
en I, c’est-à-dire l’ensemble des vecteurs tangents en I à toutes les courbes différentiables
dans G passant par I.
G
X
I
Y
g
Fig. 2.3 – g comme espace tangent au groupe G.
2.4
Algèbres de Lie abstraites
Définition 11 Une K-algèbre de Lie est un K-espace vectoriel l muni d’une application
bilinéaire
l×l → l
(x, y) 7→ [x, y],
telle que
i. Pour tout x ∈ l, [x, x] = 0.
ii. Pour tout x, y, z ∈ l, [x, [y, z]] + [y, [z, x]] + [z, [y, x]] = 0.
La dimension de l est sa dimension de K-espace vectoriel.
Le produit [·, ·] dans une algèbre de Lie n’est généralement pas associatif, c’est-à-dire
que [x, [y, z]] 6= [[x, y], z]. Une K-algèbre de Lie n’est donc pas une K-algèbre. Le
produit n’est pas commutatif, au contraire la propriété i permet d’écrire
0 = [x + y, x + y] = [x, x] + [x, y] + [y, x] + [y, y] = [x, y] + [y, x],
qui implique
[y, x] = −[x, y],
pour tout x, y ∈ l. La propriété ii est appelée identité de Jacobi.
(2.5)
2.4. ALGÈBRES DE LIE ABSTRAITES
Exemple 39 L’espace vectoriel
53
R3 muni du produit vectoriel


x2 y3 − x3 y2
[x, y] ≡ x ∧ y =  x3 y1 − x1 y3  ,
x1 y2 − x2 y2
est une algèbre de Lie.
Exemple 40 Soit V un K-espace vectoriel. L’algèbre L(V) des endomorphismes de V
munie du produit
[X, Y] ≡ XY − YX,
est une K-algèbre de Lie. Le produit [X, Y] = XY − YX est appelé commutateur
de X avec Y. Il est clairement bilinéaire et satisfait trivialement la condition i de la
définition 11. L’identité de Jacobi ii se vérifie par un simple calcul
[X, [Y, Z]] = + XYZ − XZY
− YZX
+ ZYX
[Y, [Z, X]] =
+ XZY − YXZ + YZX − ZXY
[Z, [X, Y]] = − XYZ
+ YXZ
+ ZXY − ZYX
En particulier, Mat(d, K) = L(Kd ) est une K-algèbre de Lie.
C
R
Tout -espace vectoriel est un -espace vectoriel par restriction de la multiplication
par un scalaire à . Si l est une -algèbre de Lie c’est donc aussi une -algèbre de
Lie. Réciproquement, si l est une -algèbre de Lie et lC son complexifié en tant
qu’espace vectoriel, le produit [·, ·] s’étend par linéarité à lC et un calcul simple mais
un peu long montre que cette extension satisfait les propriétés i et ii de la définition
11, on dit que lC est l’algèbre de Lie complexifiée de l.
R
C
R
R
Le définition suivante regroupe les principaux concepts associés à la structure d’algèbre de Lie.
Définition 12 Soit l une K-algèbre de Lie.
1. Une sous-algèbre de Lie de l est un sous-espace vectoriel m ⊂ l tel que
[m, m] ⊂ m.
2. Un idéal de l est un sous-espace vectoriel i ⊂ l tel que
3. l est abélienne si [l, l] = {0}.
[l, i] ⊂ i.
4. z(l) ≡ {z ∈ l | [x, z] = 0 pour tout x ∈ l} est le centre de l.
5. Un morphisme d’algèbres de Lie de l dans une K-algèbre de Lie m est une application
linéaire ϕ : l → m telle que
ϕ([x, y]) = [ϕ(x), ϕ(y)],
CHAPITRE 2. GROUPES DE LIE
54
pour tout x, y ∈ l. Le noyau d’un morphisme ϕ est le noyau de l’application linéaire
ϕ, Ker ϕ = {x ∈ l | ϕ(x) = 0}. Si ϕ est bijective on dit que c’est un isomorphisme
d’algèbres de Lie et que l et m sont isomorphes, ce qu’on dénote l ' m. Un isomorphisme
d’algèbre de Lie ϕ : l → l est un automorphisme de l.
Le théorème suivant, que nous ne démontrerons pas, met en évidence le lien intime
entre la structure abstarite d’algèbre de Lie et l’exemple 40.
Théorème 20 (Ado) Toute K-algèbre de Lie (de dimension finie) est isomorphe à une
sous-algèbre de Lie de Mat(d, K) pour un entier d.
Un idéal est une sous-algèbre de Lie. A cause de l’identité (2.5), un idéal est toujours
bilatère, [i, l] = [l, i] ⊂ i.
Le centre z(l) est un idéal. En effet, si z ∈ z(l) on a
[y, [x, z]] = [y, 0] = 0,
pour tout x, y ∈ l, c’est-à-dire que [x, z] ∈ z(l) pour tout x ∈ l.
L’identité (2.5) montre que l’algèbre de Lie l est abélienne si et seulement si [x, y] =
[y, x] pour tout x, y ∈ l. l est abélienne si et seulement si z(l) = l.
Le noyau d’un morphisme d’algèbre de Lie ϕ : l → m est un idéal, si x ∈ Ker ϕ on
a ϕ(x) = 0 d’où
ϕ([y, x]) = [ϕ(y), ϕ(x)] = [ϕ(y), 0] = 0,
et donc [y, x] ∈ Ker ϕ. L’image de ϕ est une sous-algèbre de Lie de m puisque
[ϕ(x), ϕ(y)] = ϕ([x, y]) ∈ Im ϕ pour tout ϕ(x), ϕ(y) ∈ Im ϕ.
Si i ⊂ l est un idéal, on vérifie aisément que l’espace vectoriel quotient l/i est une
algèbre de Lie pour le produit
[x + i, y + i] = [x, y] + i.
La surjection canonique π : l → l/i, π(x) ≡ x + i, est un morphisme d’algèbre de
Lie.
Si ϕ : l → m est un morphisme, on a la décomposition canonique
l
π↓
ϕ
−→
ϕ̄
l/ Ker ϕ −→
m
↑ iIm ϕ
Im ϕ
où π(x) = x + Ker ϕ est la surjection canonique, iIm ϕ est l’injection canonique et
l’application linéaire ϕ̄, définie par ϕ̄(x + Ker ϕ) = ϕ(x), est bijective. ϕ̄ est un
isomorphisme d’algèbre de Lie.
2.4. ALGÈBRES DE LIE ABSTRAITES
55
Exemple 41 Considérons l’application ϕ : R3 → Mat(3, R) définie par (2.4) dans
l’exemple 34. C’est évidement une application linéaire. Un simple calcul montre que
ϕ(x)ϕ(y) − ϕ(y)ϕ(x) = ϕ(x ∧ y),
pour tout x, y ∈ R3 . ϕ est donc un morphisme entre l’algèbre de Lie R3 de l’exemple
39 et l’algèbre de Lie Mat(3, R) de l’exemple 40. On a d’une part Kerϕ = {0} et
l’exemple 34 montre que Imϕ = so(3). On peut donc conclure que so(3) est une
algèbre de Lie au sens de la définition 11 et qu’elle est isomorphe à l’algébre de Lie
R3 de l’exemple 39.
Exemple 42 K est une K-algèbre de Lie abélienne. C’est un K-espace vectoriel et le
produit [x, y] = 0 pour tout x, y ∈ K définit bien une structure d’algèbre de Lie. Il
en est de même de Kn pour tout entier n.
Exemple 43 Le centre de l’algèbre de Lie Mat(d, K) est l’ensemble des matrices Z
telles que [Z, X] = ZX − XZ = 0 pour tout X ∈ Mat(d, K). En considérant les
(kl)
matrices X(kl) telle que Xij = δik δjl , on montre facilement que ce centre est
z(Mat(d, K)) = {λI | λ ∈ K} = KI.
Exemple 44 L’ensemble i ≡ {X ∈ Mat(d, K) | tr X = 0} est un idéal de l’algèbre de
Lie Mat(d, K). C’est le noyau du morphisme X 7→ tr X de Mat(d, K) dans l’algèbre
de Lie abélienne K. On a en effet
tr[X, Y] = tr XY − tr YX = 0 = [tr X, tr Y],
pour tout X, Y ∈ Mat(d, K). Comme Im(tr) = K, on a
Mat(d, K)/i ' K.
Nous terminons ce paragraphe en montrant que l’algèbre de Lie d’un groupe de Lie
est bien une algèbre de Lie au sens de la définition 11. Si G est un groupe de Lie
et g son algèbre de Lie on a T etX T −1 ∈ G, pour tout T ∈ G, X ∈ g et t ∈ . Le
−1
théorème 6 implique que T etX T −1 = etT XT ce qui nous permet de conclure que
T XT −1 ∈ g.
R
Lemme 2 Si g est l’algèbre de Lie du groupe de Lie G alors, pour tout T ∈ G et tout
X ∈ g on a T XT −1 ∈ g.
Théorème 21 L’algèbre de Lie g d’un groupe de Lie G ⊂ GL(d, K) est une sous-algèbre
de Lie de l’algèbre de Lie réelle Mat(d, K) pour le produit
[X, Y] ≡ XY − YX.
CHAPITRE 2. GROUPES DE LIE
56
Démonstration Par le théorème 17, g est un sous-espace vectoriel réel de Mat(d, K).
Pour montrer que c’est une sous-algèbre de Lie, il suffit de montrer que [X, Y] ∈ g
pour tout X, Y ∈ g. Par le lemme 2, Yt ≡ etX Ye−tX ∈ g pour tout t ∈ . Il en
résulte que
d Yt
= [X, Y] ∈ g.
dt t=0
R
2.5
Morphismes locaux
Définition 13 Soient G et H des groupes de Lie. Un morphisme de Lie local de G dans H
est une application continue φ : U → V, d’un voisinage I ∈ U ⊂ G dans un voisinage
I ∈ V ⊂ H telle que
i. φ(ab) = φ(a)φ(b) pour tout a, b ∈ U tels que ab ∈ U.
ii. φ(I) = I.
Si φ est bijective, on dit que c’est un isomorphisme local et que G et H sont localement
isomorphes.
Si le morphisme local φ : U → V est injectif, alors {a ∈ U | φ(a) = I} = {I}.
Réciproquement, supposons que cette dernière condition soit vérifiée et que Ũ ⊂ U
soit un voisinage de I tel que a, b ∈ Ũ implique b−1 ∈ U et ab−1 ∈ U (un tel
voisinage existe puisque l’application (a, b) 7→ ab−1 est continue). Alors, pour tout
a, b ∈ Ũ tels que φ(a) = φ(b) on a
φ(ab−1 ) = φ(a)φ(b−1 ) = φ(b)φ(b−1 ) = φ(bb−1 ) = φ(I) = I,
et donc a = b. Par conséquent la restriction de φ à Ũ est morphisme local injectif.
Le critère du noyau est donc applicable au morphismes locaux.
Exemple 45
R et S1 ≡ {z ∈ C | |z| = 1} sont localement isomorphes. L’application
φ : ] − , [ → {eit | t ∈] − , [}
t
7→ eit ,
est un isomorphisme local pour 0 < < π.
Soient φ : U → V est un morphisme local de G dans H et g, h les algèbres de
Lie de G et H. A tout X ∈ g on peut associer un sous-groupe à un paramètre etX
de G. Si t et s sont assez petit, on a etX , esX , e(t+s)X ∈ U et donc φ(etX )φ(esX ) =
φ(e(t+s)X ). L’application ψ : t 7→ φ(etX ) est donc un morphisme local de dans H.
D’après la remarque suivant le théorème 5, ce dernier s’applique à un tel morphisme
R
2.5. MORPHISMES LOCAUX
57
R
ce qui implique l’existence d’une matrice Y telle que ψ(t) = etY pour tout t ∈
assez petit. Le lemme 1 permet alors de conclure que Y ∈ h. On a ainsi défini une
application
b : g → h,
φ
R
telle que φ(etX ) = etφ̂(X) pour tout X ∈ g et tout t ∈ assez petit ou, de manière
équivalente, φ(eX ) = eφ̂(X) pour tout X dans un voisinage assez petit de 0 dans g.
Pour λ ∈
on a évidement φ̂(λX) = λφ̂(X). Pour X, Y ∈ g la formule de Lie
(théorème 7) montre que et(X+Y) = limn→∞ (etX/n etY/n )n et comme φ est continu
on a
R
etφ̂(X+Y) = φ(et(X+Y) ) = lim φ((etX/n etY/n )n )
=
=
lim (φ(e
tX/n
n→∞
n→∞
tY/n
)φ(e
))n
lim (etφ̂(X)/n etφ̂(Y)/n )n = et(φ̂(X)+φ̂(Y)) ,
n→∞
qui permet de conclure que φ̂ est linéaire.
En appliquant le théorème 6 on obtient, pour tout a ∈ U tel que a−1 ∈ U
φ(a)etφ̂(X) φ(a−1 ) = φ(a)φ(etX )φ(a−1 )
= φ(aetX a−1 )
= φ(et(aXa
= etφ̂(aXa
−1 )
−1 )
)
,
qui peut être différentiée en t = 0 pour donner
φ(a)φ̂(X)φ(a−1 ) = φ̂(aXa−1 ).
En particulier, si a = etY , on obtient pour t assez petit
φ(etY )φ̂(X)φ(e−tY ) = etφ̂(Y) φ̂(X)e−tφ̂(X) = φ̂(etY Xe−tY ).
L’application φ̂ étant linéaire, on peut maintenant différentier cette relation en t = 0
pour obtenir
[φ̂(Y), φ̂(X)] = φ̂([Y, X]),
qui montre que φ̂ est un morphisme d’algèbre de Lie.
Soit U un voisinage de 0 dans g suffisamment petit pour que :
i. exp : U → Ũ ≡ exp(U) ⊂ U soit un difféomorphisme.
ii. exp : φ̂(U) → Ṽ ≡ exp(φ̂(U)) ⊂ V soit un difféomorphisme.
CHAPITRE 2. GROUPES DE LIE
58
φ̂ étant continu, ceci est toujours possible
diagramme
exp
g ⊃ U −→
φ̂ ↓
exp
h ⊃ V −→
grâce au théorème 18. Dans ce cas le
Ũ ⊂ G
↓φ
Ṽ ⊂ H
(2.6)
est commutatif, φ(eX ) = eφ̂(X) pour tout X ∈ U. Comme φ̂ est linéaire, on en
conclut que la restriction
φ = exp ◦φ̂ ◦ log : Ũ → Ṽ,
(2.7)
est analytique. De plus il est évident que cette application est injective (respectivement surjective) si et seulement si φ̂ est injectif (respectivement surjectif).
Finalement, si χ : F → G est un morphisme local on a
φ ◦ χ(eX ) = φ(eχ̂(X) ) = eφ̂(χ̂(X)) ,
c’est-à-dire (φ ◦ χ)b = φ̂ ◦ χ̂.
Le théorème suivant résume nos considérations.
Théorème 22 Soient G et H des groupes de Lie et g, h leurs algèbres de Lie. Si φ : U →
V est un morphisme de Lie local l’application
φ̂ : g → h
d
φ(etX )t=0
X 7→ dt
(2.8)
défini un morphisme d’algèbre de Lie. De plus les propriétés suivantes sont vraies.
i. Pour tout X dans un voisinage de 0 dans g on a φ(eX ) = eφ̂(X) .
ii. Pour tout a ∈ U ∩ U−1 et tout X ∈ g on a φ(a)φ̂(X)φ(a−1 ) = φ̂(aXa−1 ).
iii. φ est analytique dans un voisinage Ũ tel que I ∈ Ũ ⊂ U.
iv. φ|Ũ est injectif (surjectif) si et seulement si φ̂ est injectif (surjectif).
v. En particulier g et h sont isomorphes si et seulement si G et H sont localement
isomorphes.
vi. Si χ est un morphisme local de F dans G alors (φ ◦ χ)b = φ̂ ◦ χ̂.
Exemple 46 Soient G un groupe de Lie et g son algèbre de Lie. Si H ⊂ G est un
sous-groupe de Lie, l’injection canonique i : H → G est un morphisme de Lie. Elle
induit un morphisme injectif d’algèbre de Lie î : h → g tel que
etY = i(etY ) = etî(Y) ,
R
pour tout Y ∈ h et t ∈ assez petit. On en conclut que î(Y) = Y, c’est-à-dire que î
est l’injection canonique de h dans g et donc que h est une sous-algèbre de Lie de g.
2.5. MORPHISMES LOCAUX
59
Exemple 47 Les matrices de Pauli
0 1
0 −i
σ1 ≡
,
σ2 ≡
,
1 0
i 0
σ3 ≡
1 0
0 −1
,
C
forment un système linéairement indépendant dans Mat(2, ) considéré comme espace vectoriel réel. L’application linéaire
Σ:
R3
x
C
−→ Mat(2, )
7−→ x ≡ x1 σ1 + x2 σ2 + x3 σ3 ,
C
R
est donc injective et son image H ⊂ Mat(2, ) isomorphe à 3 . On note que
x3
x1 − ix2
3
H= x=
| x = (x1 , x2 , x3 ) ∈
,
(2.9)
x1 + ix2 −x3
R
est l’espace vectoriel réel des matrices 2 × 2 complexes, auto-adjointes et de trace
nulle.
Pour tout U ∈ SU(2) et x ∈ H, la matrice UxU∗ est auto-adjointe et de trace nulle.
L’application φ(U) définie par
φ(U)x ≡ UxU∗ ,
étant clairement bijective (φ(U)−1 = φ(U−1 )), c’est un automorphisme de H. Comme
φ(U)φ(V) = φ(UV), φ : SU(2) → GL(H) est un morphisme et il est facile de voir
qu’il est continu. On a donc R(U) = Σ−1 ◦ φ(U) ◦ Σ ∈ GL(3, ) tel que
R
φ(U)x = R(U)x,
R
et R : SU(2) → GL(3, ) est un morphisme continu. Comme det x = −|x|2 , on a
|R(U)x|2 = − det(φ(U)x) = − det(UxU∗ ) = − det x = |x|2 ,
c’est-à-dire que R(U) ∈ O(3). De plus, SU(2) étant connexe, son image par R l’est
aussi et doit être contenu dans la composante connexe de R(I) = I dans O(3). On
en conclut que R : SU(2) → SO(3).
On note qu’une matrice complexe X satisfait X∗ = −X si et seulement si la matrice
iX est auto-adjointe. L’algèbre de Lie de SU(2) (voir le tableau 2.1) n’est autre que
su(2) = iH ≡ {ix | x ∈ H}. L’application Σ étant linéaire, le morphisme d’algèbre de
Lie R̂ : su(2) → so(3) donné par le théorème 22 est donc déterminé par
d
d
d
ix̄t
−ixt
R̂(ix)y =
R(eix̄t )y
R(eix̄t )y
=
=
e ye
= i[x̄, y].
dt
dt
dt
t=0
t=0
t=0
CHAPITRE 2. GROUPES DE LIE
60
On montre aisément, à partir de la forme explicite de x (c.f. équation (2.9)), que
i[x̄, ȳ] = −2x ∧ y.
On peut donc en conclure que
R̂(ix)y = −2x ∧ y.
On vérifie que R̂(ix) est bien un élément de l’algèbre de Lie so(3), en effet c’est une
application linéaire dans 3 dont la matrice est donnée par


0
x3
−x2
x1  ,
R̂(ix) = 2  −x3 0
x2
−x1 0
R
qui est bien anti-symétrique. On note que R̂ est un isomorphisme puisque il est
injectif (R̂(ix) = 0 si et seulement si x = 0) et dim su(2) = dim so(3). Le théorème
22 permet de conclure que SU(2) et SO(3) sont localement isomorphes. Cependant
le morphisme de groupe R n’est pas globalement injectif, en effet son noyau n’est
pas trivial : R(U) = I si et seulement si R(U)x = x pour tout x ∈ 3 , c’est-à-dire
φ(U)x = x ou encore [U, x] = 0. On en déduit facilement que
R
Ker R = {−I, I}.
Finalement on montre que R est surjectif. En effet, tout élément de SO(3) est une
rotation R(α, e) d’angle α autour d’un axe e, e ∈ 3 , |e| = 1. Soit (e, f, g) une
base orthonormée directe de 3 , c’est-à-dire telle que e ∧ f = g. Dans cette base, la
matrice de R̂(iē) est


0 0
0
2 ,
M= 0 0
0 −2 0
R
R
R
et on calcule aisément R(e−iēα/2 ) = e−R̂(iē)α/2 qui est donné, dans la base (e, f, g)
par la matrice


1
0
0
e−Mα/2 =  0 cos α − sin α  .
0 sin α cos α
Cette matrice est celle d’une rotation d’angle α autour de l’axe dirigé par e, on a
donc R(α, e) = R(e−iēα/2 ), ce qui montre que R est surjectif. On en conclut que
SO(3) ' SU(2)/{−I, I}.
Soient φ : G → H un morphisme de Lie et a ∈ G. Le théorème 22 montre que
φ est analytique dans un voisinage Ũ 3 I. D’autre part les translations à gauche
2.6. LA REPRÉSENTATION ADJOINTE
61
ga−1 et gφ(a) sont analytiques (ce sont des applications linéaires dans les algèbres
matricielles correspondantes). L’identité
φ = gφ(a) ◦ φ ◦ ga−1 ,
montre que φ est analytique dans le voisinage ga (Ũ) de a dans G. Nous avons donc
montré la généralisation suivante du théorème 5.
Théorème 23 Un morphisme de Lie est analytique.
Si le groupe de Lie G est connexe, le morphisme d’algèbre de Lie induit par un
morphisme de Lie caractérise ce dernier.
Théorème 24 Soient G un groupe de Lie connexe et φ1 , φ2 des morphismes de Lie de G
c1 = φ
c2 .
dans un groupe de Lie H. Alors φ1 = φ2 si et seulement si φ
c1 = φ
c2 suit de la définition (2.8). Supposons que
Démonstration Si φ1 = φ2 alors φ
c1 = φ
c2 . Par le corollaire 1, si U est un voisinage assez petit de 0 dans l’algèbre de Lie
φ
g de G, tout élément a ∈ G peut s’écrire comme a = eX1 · · · eXn avec X1 , . . . , Xn ∈
U. Par le théorème 22, si U est assez petit on a alors
φ1 (eXk ) = eφ 1 (Xk ) = eφ̂2 (Xk ) = φ2 (eXk ),
b
et par conséquent φ1 (a) = φ2 (a).
2.6
La représentation adjointe
Soit G un groupe de Lie de dimension n et g son algèbre de Lie. On rappelle que les
applications ja : x 7→ axa−1 sont les automorphismes intérieurs de G. D’après le
théorème 22, ja induit sur g un isomorphismes d’algèbre de Lie
d
tX ja (e )
= aXa−1 .
Ada (X) ≡ ĵa (X) =
dt
t=0
Comme Adab (X) = abXb−1 a−1 = Ada (Adb (X)), l’application
Ad : G −→ GL(g)
a 7−→ Ada ,
est une représentation de G dans g. On l’appelle représentation adjointe de G.
R
g étant un espace vectoriel réel de dimension n, on peut l’identifier à n par le choix
d’une base. GL(g) peut alors être identifié avec GL(n, ). C’est donc un groupe de
R
CHAPITRE 2. GROUPES DE LIE
62
R
Lie d’algèbre de Lie L(g) = Mat(n, ). Ad est un morphisme de Lie et induit,
c
d’après le théorème 22, un morphisme d’algèbre de Lie ad ≡ Ad
ad : g −→ L(g)
X
7−→ adX ,
tel que AdetX = et adX . On a donc, pour tout X, Y ∈ g
d tX −tX d
AdetX (Y)
=
e Ye
= [X, Y],
adX Y =
dt
dt
t=0
t=0
et par itération
adn
X Y = [X, [X, · · · , [X, Y] · · · ]].
Définition 14 1. Soit l une K-algèbre de Lie. Une représentation de l dans un K-espace
vectoriel V est un morphisme d’algèbre de Lie
Π : l −→ L(V).
2. Π est fidèle si l’application x 7→ Π(x) est injective.
3. Un sous-espace W ⊂ V est Π-invariant si Π(x)W ⊂ W pour tout x ∈ l. Un sous-espace
Π-invariant W est irréductible si ses seuls sous-espaces Π-invariants sont {0} et W.
4. Π est irréductible si V est irréductible. Dans le cas contraire, Π est réductible.
5. Π est complètement réductible s’il existe des sous-espaces Π-invariants irréductibles Wk
tels que V = ⊕k Wk .
6. Deux représentations Π1 et Π2 sont équivalentes s’il existe un isomorphisme T tel que
T Π1 (x) = Π2 (x)T pour tout x ∈ l, inéquivalentes dans le cas contraire.
Le morphisme d’algèbre de Lie ad est donc une représentation de l’algèbre de Lie g
dans l’espace vectoriel g qu’on appelle représentation adjointe de g.
On muni l’algèbre L(g) de la norme d’algèbre
|||M||| =
sup
X∈g
kXk = 1
kMXk,
et on remarque que pour X, Y ∈ g on a
k adX Yk = k[X, Y]k = kXY − YXk 6 2kXkkYk,
et que par conséquent
||| adX ||| 6 2kXk,
(2.10)
2.7. LA FORMULE DE BAKER-CAMPBELL-HAUSDORFF
pour tout X ∈ g. Si f(z) =
Dr , on peut donc définir
P∞
n=0
63
an zn est une fonction analytique dans le disque
f(adX ) =
∞
X
an adn
X,
n=0
pour tout X ∈ g tel que kXk < r/2.
b : g → Mat(d, K) est un morphisme d’algèbre de Lie, on remarque que pour
Si φ
X, Y ∈ g on a
b
b
φ̂(adX Y) = φ̂([X, Y]) = [φ(X),
φ(Y)]
= adφ̂(X) φ̂(Y),
c’est-à-dire que φ̂ ◦ adX = adφ̂(X) ◦φ̂, où φ̂(X) →
7 adφ̂(X) est la représentation adb sous-algèbre de Lie de Mat(d, K). Par itération on
jointe de l’algèbre de Lie Im φ,
n
n
obtient donc φ̂ ◦ adX = adφ̂(X) ◦φ̂ et comme φ̂ est linéaire
φ̂ ◦ f(adX ) =
2.7
∞
X
n=0
an φ̂ ◦ adn
X =
∞
X
n=0
an adn
◦φ̂ = f(adφ̂(X) ) ◦ φ̂.
φ̂(X)
(2.11)
La formule de Baker-Campbell-Hausdorff
Dans ce paragraphe, nous allons montrer que la structure de l’algèbre de Lie g d’un
groupe de Lie G détermine complètement la structure du groupe lui-même dans un
voisinage de I.
Le théorème 18 montre que dans un voisinage assez petit I ∈ V ⊂ G, on peut se
servir d’un voisinage 0 ∈ U ⊂ g comme système de coordonnées c’est-à-dire que
pour tout élément a ∈ V il existe un unique X ∈ U tels que a = eX . Si V 0 ⊂ V est
un voisinage de I tel que V 0 · V 0 ⊂ V (un tel voisinage existe puisque le produit est
continu) et U 0 = log V 0 , la structure algébrique du groupe G dans le voisinage V 0
est donc complètement déterminée par les produits eX eY avec X, Y ∈ U 0 . Comme
eX eY ∈ V il existe un unique Z ∈ U tel que eX eY = eZ . Cette relation définit une
application
Z : U0 × U0 → U
(X, Y)
7→ Z(X, Y).
La formule de Baker-Campbell-Hausdorff montre que cette application ne dépend
que de la structure de l’algèbre de Lie g, c’est-à-dire qu’il est possible de calculer
Z(X, Y) en utilisant uniquement cette structure.
Théorème 25 (Formule de Baker-Campbell-Hausdorff) Soient G un groupe de Lie, g
son algèbre de Lie et ad : g → L(g) la représentation adjointe de g. Il existe un voisinage
0 ∈ U 0 ⊂ g tel que, pour tout X, Y ∈ U 0 ,
eX eY = eZ(X,Y) ,
CHAPITRE 2. GROUPES DE LIE
64
où Z(X, Y) ∈ g est donné par la formule
Z1
f(eadX et adY )Ydt,
Z(X, Y) = X +
(2.12)
0
f étant la fonction analytique dans le disque D1 (1) = {z ∈
f(z) =
C | |z − 1| < 1} définie par
log z
.
1 − z−1
Démonstration Avec 0 < ≡ 2e−π < 1 et 0 < ρ ≡ 1 − < 1 on définit
log(1 + ρ)
0
U ≡ W ∈ g | kWk <
.
2(1 + )
Alors, pour tout X, Y ∈ U’ et t ∈
kI − eX etY k 6
6
6
6
<
C tel que |t| < 1 + on a
k(eX − I)etY + (etY − I)k
keX − IkketY k + ketY − Ik
(ekXk − 1)e(1+)kYk + (e(1+)kYk − 1)
e(1+)(kXk+kYk) − 1
elog(1+ρ) − 1 = ρ < 1.
On peut donc définir Z(t) ≡ log(eX etY ) de façon que
eZ(t) = eX etY .
On remarque en outre que Z(t) est une fonction analytique dans le disque D1− , le
développement en série (1.10)
X tY
Z(t) = log(e e ) = −
∞
X
(I − eX etY )n
n=1
n
,
étant une somme absolument convergente de fonctions analytiques dans ce disque.
On a en outre la borne uniforme
kZ(t)k 6
∞
X
ρn
n=1
n
= | log(1 − ρ)| < π,
pour tout t ∈ D1+ .
La fonction T (s, t) ≡ esZ(t) est donc analytique pour (s, t) ∈
∂
T (s, t) = Z(t)T (s, t) = T (s, t)Z(t),
∂s
(2.13)
C × D1+ et on a
2.7. LA FORMULE DE BAKER-CAMPBELL-HAUSDORFF
et donc
où Ż(t) =
∂2
T (s, t) = Z(t)
∂t∂s
d
Z(t).
dt
65
∂
T (s, t) + Ż(t)T (s, t),
∂t
En posant
Q(s, t) ≡ e
−sZ(t)
∂
T (s, t) ,
∂t
on obtient
∂
Q(s, t) =
∂s
∂
−e
Z(t)
T (s, t)
∂t
∂
−sZ(t)
Z(t)
+e
T (s, t) + Ż(t)T (s, t)
∂t
−sZ(t)
= e−sZ(t) Ż(t)esZ(t)
= Ade−sZ(t) Ż(t) = e−s adZ(t) Ż(t).
Comme Q(0, t) = 0 on en conclut que
Z1
Q(1, t) = e−s adZ(t) Ż(t)ds = g(adZ(t) )Ż(t),
0
où
Z1
g(z) ≡
e
0
−sz
∞
X
(−z)n−1
1 − e−z
=−
,
ds =
z
n!
n=1
est une fonction entière. Comme on a d’autre part
∂ X tY
∂ Z(t)
−tY −X
Z(t) −1
e
=e e
e e
= Y,
Q(1, t) = e
∂t
∂t
on arrive à l’équation
g(adZ(t) )Ż(t) = Y.
La fonction
h(z) ≡
(2.14)
1
z
,
=
g(z)
1 − e−z
étant analytique dans le disque D2π , g(adZ(t) ) est inversible, d’inverse h(adZ(t) )
puisque (2.10) et (2.13) impliquent ||| adZ(t) ||| 6 2kZ(t)k < 2π. L’équation (2.14)
peut donc être résolue pour Ż(t) et on obtient
Ż(t) = h(adZ(t) )Y.
En posant f(w) ≡ h(log w), on peut récrire cette dernière égalité comme
Ż(t) = f(eadZ(t) )Y,
CHAPITRE 2. GROUPES DE LIE
66
et par intégration, comme Z(0) = X, on obtient
Z1
f(eadZ(t) )Ydt.
Z(t) = X +
0
Finalement on remarque que
eadZ(t) = AdeZ(t) = AdeX etY = AdeX AdetY = eadX et adY ,
ce qui termine la démonstration.
(2.15)
Comme première application de la formule de Baker-Campbell-Hausdorff, nous démontrons la réciproque du théorème 22, c’est-à-dire qu’un morphisme d’algèbre de
Lie induit un morphisme de Lie local.
Corollaire 2 Soient G un groupe de Lie, g son algèbre de Lie et
φ̂ : g → Mat(d, K),
un morphisme d’algèbre de Lie. Alors il existe un voisinage I ∈ V 0 ⊂ G tel que, pour
tout a ∈ V 0 , log a ∈ g et
φ(a) ≡ eφ̂(log a) ,
(2.16)
définit un morphisme local φ : V → GL(d, K).
Démonstration Par le théorème 18, il existe un voisinage I ∈ V ⊂ G et un voisinage
0 ∈ U ⊂ g tels que l’application log : V → U soit un difféomorphisme. La formule
φ(a) = eφ̂(log a) définit donc une application de U dans GL(d, K). C’est la composition de trois applications continues, elle est donc continue. De plus on a φ(I) = I.
Il reste à vérifier que φ(ab) = φ(a)φ(b) pour tout a, b dans un voisinage de I.
Par le théorème 25, il existe un voisinage 0 ∈ U 0 ⊂ g tel que eX eY = eZ(X,Y) pour
tout X, Y ∈ U 0 , où Z(X, Y) est donné par la formule de Baker-Campbell-Hausdorff.
Soient V 0 = V ∩ exp(U 0 ), a, b ∈ V 0 et X = log a, Y = log b. On a donc X, Y ∈ U 0
et
X Y
φ(ab) = eφ̂(log(e e )) = eφ̂(Z(X,Y)) ,
(2.17)
et la formule (2.12) permet d’écrire, grâce à la linéarité de φ̂,
Z1
adX t adY
b
φ(f(e
e
)Y)dt.
b
φ̂(Z(X, Y)) = φ(X)
+
0
En utilisant la covariance du morphisme ad (2.11) on obtient encore
ad
t ad
adX t adY
adX t adY
b
b
φ(f(e e
)Y) = φ ◦ (f(e e
)) (Y) = f(e φ̂(X) e φ̂(Y) )φ̂(Y),
2.7. LA FORMULE DE BAKER-CAMPBELL-HAUSDORFF
et donc
Z1
f(e
φ̂(Z(X, Y)) = φ̂(X) +
adφ̂(X) t adφ̂(Y)
e
67
)φ̂(Y)dt,
0
dont le membre de droite n’est autre que la formule de Baker-Campbell-Hausdorff
pour
log eφ̂(X) eφ̂(Y) .
En insérant l’identité ainsi obtenue dans (2.17) on obtient le résultat recherché
φ(ab) = elog(e
φ̂(X) eφ̂(Y) )
= eφ̂(X) eφ̂(Y) = φ(a)φ(b).
On vérifie bien entendu que si φ est le morphisme de Lie local induit par le morphisme d’algèbre de Lie φ̂, ce dernier coïncide avec le morphisme d’algèbre de Lie
induit par φ d’après le théorème 22. En effet (2.16) implique
φ(etX ) = eφ̂(tX) = etφ̂(X) ,
et par conséquent
d
tX φ(e ) ,
φ̂(X) =
dt
t=0
conformément à la définition (2.8).
68
CHAPITRE 2. GROUPES DE LIE
Chapitre 3
Représentations des groupes de Lie
3.1
La représentation d’algèbre de Lie induite
Toutes les représentations de groupes de Lie que nous considérerons seront continues. Se sont donc des morphismes de Lie π : G → GL(V) d’un groupe de Lie G
dans un groupe linéaire réel ou complexe. Le théorème 22 associe à un tel morphisme
b de l’algèbre de Lie g de G dans l’algèbre de
un morphisme d’algèbre de Lie Π = π
Lie L(V) de GL(V). Π est donc une représentation de l’algèbre de Lie g dans V qu’on
appelle représentation induite par π.
Exemple 48 Nous avons déjà remarqué que la représentation adjointe de G
Ad : G −→ GL(g),
induit la représentation adjointe ad : g → L(g) de g.
Exemple 49 Soit Hn l’espace vectoriel complexe des polynômes homogènes de degré n − 1 dans les variables z ≡ (z1 , . . . , zd ) ∈ d
X
nd
1
Hn = p(z) =
an1 ···nd zn
.
1 · · · zd | an1 ···nd ∈
C
C
n1 +···+nd =n−1
Pour tout U ∈ SU(d) on définit l’application πn (U) : Hn → Hn par
(πn (U)p)(z) = p(U−1 z).
Alors πn : SU(d) → GL(Hn ) est une représentation. La représentation induite Πn
se calcule aisément,
d
d
tX
−tX
(πn (e )p)(z)
=
p(e
z)
= −(Xz · ∇p)(z),
(Πn (X)p)(z) =
dt
dt
t=0
t=0
P
c’est-à-dire que Πn (X) = − jk Xjk zj ∂zk .
69
CHAPITRE 3. REPRÉSENTATIONS DES GROUPES DE LIE
70
Les propriétés d’une représentation π sont intimement liées à celle de la représentation induite Π. Par exemple, le théorème 22 montre que si la représentation π est
fidèle, il en est de même de Π. Le résultat suivant est plus intéressant car il permet
d’obtenir des propriétés importantes de π à partir de celles de Π.
Théorème 26 Soient G un groupe de Lie connexe et g son algèbre de Lie.
i. Une représentation π de G est réductible (respectivement complètement réductible)
si et seulement si la représentation induite Π de g est réductible (respectivement
complètement réductible).
ii. Deux représentations π1 , π2 de G sont équivalentes si et seulement si les représentations induites Π1 , Π2 le sont.
Démonstration Soit W un sous-espace invariant pour π. Alors pour tout X ∈ g et
tout t ∈ on a π(etX )W = etΠ(X) W ⊂ W. Comme un sous-espace est fermé, il en
découle que Π(X)W ⊂ W. Réciproquement, si Π(X)W ⊂ W on a aussi Π(X)n W ⊂
W et donc π(eX )W = eΠ(X) W ⊂ W. D’après le corollaire 1, tout élément de G
s’écrit comme un produit a = eX1 · · · eXn avec X1 , . . . , Xn ∈ g. On en déduit que
π(a)W = π(eX1 · · · eXn )W = eΠ(X1 ) · · · eΠ(Xn ) W ⊂ W. Les sous-espace invariants
pour π coïncident donc avec ceux invariants pour Π, ce qui démontre i.
R
Si π1 et π2 sont équivalentes, il existe un isomorphisme T tel que, pour tout a ∈ G
on a T π1 (a) = π2 (a)T . Alors
d
d
tX tX
= π2 (e )T = Π2 (X)T ,
T Π1 (X) = T π1 (e )
dt
dt
t=0
t=0
pour tout X ∈ g et Π1 est équivalente à Π2 . Réciproquement, si Π1 et Π2 sont des
représentations équivalentes dans des espaces vectoriels V1 et V2 , il existe un isomorphisme T : V2 → V1 tel que Π1 (X) = T Π2 (X)T −1 . Alors π(x) ≡ T π2 (x)T −1 est une
représentation de G dans V1 . π et π1 sont donc deux morphismes de G dans GL(V1 )
tels que
d
d
tX tX
−1 =
T π2 (e )T π̂(X) = π(e )
dt
dt
t=0
t=0
d
= T π2 (etX ) T −1
dt
t=0
= T Π2 (X)T −1
= Π1 (X) = π̂1 (X),
pour tout X ∈ g et le théorème 24 permet de conclure que π = π1 , c’est-à-dire que
π1 et π2 sont équivalentes.
La construction d’une représentation de l’algèbre de Lie d’un groupe G est souvent
plus aisée que celle d’une représentation du groupe G lui-même. Nous sommes donc
3.1. LA REPRÉSENTATION D’ALGÈBRE DE LIE INDUITE
71
intéressé à l’opération consistant à associer une représentation π de G à une représentation Π de son algèbre de Lie. Le théorème suivant, qui est une version globale
du corollaire 2, montre que c’est possible si G est simplement connexe.
Théorème 27 Soient G un groupe de Lie simplement connexe et Π une représentation
de son algèbre de Lie dans un espace vectoriel V. Alors il existe une et une seule représentation π de G dans V telle que Π soit la représentation induite par π.
Démonstration Sans restreindre la généralité, nous pouvons supposer V = Kd . Le
corollaire 2 nous permet de définir un morphisme local π, d’un voisinage V de I ∈ G
dans GL(V) tel que
π(a) = eΠ(log a) ,
(3.1)
pour tout a ∈ V. Soit V 0 ⊂ V un voisinage de I tel que V 0 · V 0 · V 0 ⊂ V. Alors,
pour tout a, b, c ∈ V 0 on a π(a)π(b) = π(ab) et π(a)π(b)π(c) = π(abc). En
particulier, si a, a−1 ∈ V 0 alors π(a)π(a−1 ) = π(I) = I et donc π(a−1 ) = π(a)−1 .
A une courbe continue γ : [0, 1] → G on associe la fonction
gγ : [0, 1] × [0, 1] → G
(t, s)
7→ γ(t)γ(s)−1 ,
qui jouit des propriétés suivantes :
i. gγ (t, s)gγ (s, r) = gγ (t, r).
ii. gγ (s, t) = gγ (t, s)−1 .
iii. gγ (t, t) = I.
iv. gγ est uniformément continue, [0, 1] × [0, 1] étant compact.
Une subdivision de l’intervalle [0, 1] est une famille finie de points ti ∈ [0, 1],
S = (ti )n
i=1 ,
telle que 0 = t1 < · · · < tn = 1. On note ∆S ≡ maxi |ti+1 − ti | le pas de la
subdivision S. On dit qu’une subdivision S 0 est plus fine que S si tous les points de
S sont aussi des points de S 0 . Si S et S 0 sont deux subdivisions, on note S ∪ S 0 la
subdivision obtenue en ordonnant la réunion des points de S et de S 0 .
La stratégie de la démonstration est la suivante. Si S = (ti )n
i=1 est une subdivision de
[0, 1], la propriété i montre que
gγ (1, 0) = gγ (tn , tn−1 ) · · · gγ (t2 , t1 ).
En particulier, si la courbe γ relie I à a, alors gγ (1, 0) = a et donc
a = gγ (tn , tn−1 ) · · · gγ (t2 , t1 ).
CHAPITRE 3. REPRÉSENTATIONS DES GROUPES DE LIE
72
Pour tout morphisme φ on doit avoir
φ(a) = φ(gγ (tn , tn−1 )) · · · φ(gγ (t2 , t1 )),
(3.2)
pour toute courbe γ reliant I à a et pour toute subdivision S. Si la subdivision est
assez fine, tous les gγ (ti+1 , ti ) seront proches de I, la formule 3.2 permet donc de
calculer φ(a) à partir de la restriction de φ à un petit voisinage de I. On va donc
construire la représentation π recherchée en utilisant le morphisme local (3.1) dans
le membre de droite de la formule (3.2). La preuve étant assez longue, on la divise en
plusieurs étapes.
Etape 1. Des propriétés iii et iv on déduit qu’il existe δ > 0 tel que gγ (t, s) ∈ V 0
dès que |t − s| < δ. Si S = (ti )n
i=1 est une subdivision telle que ∆S < δ on a
gγ (ti+1 , ti ) ∈ V 0 et on peut donc définir
πS (γ) ≡ π(gγ (tn , tn−1 )) · · · π(gγ (t2 , t1 )).
(3.3)
Etape 2. Si on raffine la subdivision S = (ti )n
i=1 par l’adjonction d’un seul point
u ∈]tl , tl+1 [, on obtient une subdivision S 0 telle que
πS 0 (γ) = π(gγ (tn , tn−1 )) · · · π(gγ (tl+1 , u))π(gγ (u, tl )) · · · π(gγ (t2 , t1 )),
et comme gγ (tl+1 , u) et gγ (u, tl ) appartiennent à V 0 la propriété i donne
π(gγ (tl+1 , u))π(gγ (u, tl )) = π(gγ (tl+1 , u)gγ (u, tl )) = π(gγ (tl+1 , tl )),
ce qui montre que πS 0 (γ) = πS (γ). En itérant ce procédé, on montre que pour toute
subdivision S 0 plus fine que S, on a πS 0 (γ) = πS (γ).
Si S et S 0 sont deux subdivisions, S ∪ S 0 est plus fine que S et S 0 et on a donc
πS (γ) = πS∪S 0 (γ) = πS 0 (γ). On en conclut que πS (γ) est indépendant de S, et on
dénote par π(γ) la valeur commune à tous les πS (γ).
Etape 3. Soient γ, γ 0 : [0, 1] → G deux courbes continues fermées telles que pour
tout t ∈ [0, 1] on aie
h(t) ≡ γ(t)γ 0 (t)−1 ∈ V 0 ,
h(t)−1 ∈ V 0 .
0
0
Soit encore S = (ti )n
i=1 telle que gγ (ti+1 , ti ) ∈ V et gγ 0 (ti+1 , ti ) ∈ V . Alors on a
gγ (ti+1 , ti ) = h(ti+1 )gγ 0 (ti+1 , ti )h(ti )−1 ,
et donc
π(gγ (ti+1 , ti )) = π(h(ti+1 ))π(gγ 0 (ti+1 , ti ))π(h(ti ))−1 .
Il en découle que
π(γ) = π(gγ (tn , tn−1 )) · · · π(gγ (t2 , t1 ))
= π(h(tn ))π(gγ 0 (tn , tn−1 ))π(h(tn−1 ))−1 π(h(tn−1 ))π(gγ 0 (tn−1 , tn−2 )) · · ·
· · · π(h(t2 ))−1 π(h(t2 ))π(gγ 0 (t2 , t1 ))π(h(t1 ))−1
= π(h(tn ))π(γ 0 )π(h(t1 ))−1 ,
3.1. LA REPRÉSENTATION D’ALGÈBRE DE LIE INDUITE
73
et comme γ et γ 0 sont fermées on a
h(tn ) = h(1) = γ(1)γ 0 (1)−1 = γ(0)γ 0 (0)−1 = h(0) = h(t1 ).
On en conclut que π(γ) et π(γ 0 ) sont donc conjugués dans GL(V).
Etape 4. Soit γ : [0, 1] → G une courbe continue fermée. Comme G est simplement
connexe, il existe une déformation continue Γ : [0, 1] × [0, 1] → G telle que
i. Γ (t, 0) = γ(t) pour tout t ∈ [0, 1].
ii. Γ (0, s) = Γ (1, s) pour tout s ∈ [0, 1].
iii. Γ (t, 1) = a pour un a ∈ G et tout t ∈ [0, 1].
La fonction h(t, s, s 0 ) ≡ Γ (t, s)Γ (t, s 0 )−1 étant uniformément continue et égale à I
pour s = s 0 , il existe δ > 0 tel que h(t, s, s 0 ) ∈ V 0 et h(t, s, s 0 )−1 ∈ V 0 si |s−s 0 | < δ.
Soit S = (si )n
i=1 une subdivision telle que ∆S < δ. Avec γi : t 7→ Γ (t, si ), le résultat
de l’étape 3 montre qu’il existe Ti ∈ GL(V) tels que
π(γi ) = Ti π(γi+1 )Ti−1 ,
et donc
−1
· · · T1−1 .
π(γ) = π(γ1 ) = T1 · · · Tn−1 π(γn )Tn−1
La courbe γn étant réduite à un point a, on a gγn (t, s) = I et il suit de la définition
(3.3) que π(γn ) = I. Nous avons donc montré que π(γ) = I pour toute courbe
continue fermée γ.
Etape 5. Soit a ∈ G. G étant connexe par arc, il existe une courbe continue dans G
qui relie I à a. Si γ, γ 0 : [0, 1] → G sont deux courbes de ce type, alors
γ(2t)
si t ∈ [0, 1/2],
γ̄(t) ≡
0
γ (2(1 − t)) si t ∈ [1/2, 1],
est une courbe continue fermée, γ̄(0) = γ̄(1) = I. La propriété ii montre que
π(γ̄) = π(γ 0 )−1 π(γ). Le résultat de l’étape 4 permet de conclure que π(γ 0 ) = π(γ),
c’est-à-dire que π(γ) ne dépend que du point a et pas de la courbe reliant I à a. On
peut donc définir π(a) comme étant égal à la valeur commune que prend π(γ) sur
toutes les courbes continues reliant I à a.
Etape 6. Soient a, b ∈ G et γ, γ 0 : [0, 1] → G des courbes continues reliant I à a et
b. La courbe continue
0
γ (2t)
si t ∈ [0, 1/2],
γ̄ : t 7→
γ(2t − 1)b si t ∈ [1/2, 1],
relie I à ab dans G. On remarque que
gγ 0 (2s, 2t)
si s, t ∈ [0, 1/2],
gγ̄ (s, t) =
gγ (2s − 1, 2t − 1) si s, t ∈ [1/2, 1].
CHAPITRE 3. REPRÉSENTATIONS DES GROUPES DE LIE
74
0
0 m
Soient S = (ti )n
i=1 et S = (ti )i=1 des subdivisions telles que
π(a) = π(γ) = πS (γ),
π(b) = π(γ 0 ) = πS 0 (γ 0 ).
Alors
0=
t0
t10
t0
1
1 + t1
1 + t2
1 + tn
< · · · < m−1 < m = =
<
< ··· <
= 1,
2
2
2
2
2
2
2
est une subdivision S̄ telle que
1 + t2 1
1 t0
t0
1 + tn−1
)) · · · π(gγ̄ (
, ))π(gγ̄ ( , m−1 )) · · · π(gγ̄ ( 2 , 0)),
2
2
2
2 2
2
0
0
= π(gγ (1, tn−1 )) · · · π(gγ (t2 , 0))π(gγ 0 (1, tm−1 )) · · · π(gγ 0 (t2 − 1, 0)),
= πS (γ)πS 0 (γ 0 ).
πS̄ (γ̄) = π(gγ̄ (1,
On peut en conclure que
π(ab) = π(γ̄) = πS̄ (γ̄) = πS (γ)πS 0 (γ 0 ) = π(γ)π(γ 0 ) = π(a)π(b),
c’est-à-dire que π est un morphisme.
Etape 7. Soit g l’algèbre de Lie de G. Pour tout X ∈ g, il existe > 0 tel que etX ∈ V
pour tout t ∈ tel que |t| < . La définition (3.1) permet donc de conclure que
R
π(etX ) = etΠ(X) ,
pour de tels t. Par différentiation en t = 0 on vérifie que Π est bien la représentation
induite par π.
Etape 8. Nous avons démontré l’existence de la représentation π. Son unicité est une
conséquence directe du théorème 24.
3.2
Représentations de l’algèbre de Lie su(d)
Le groupe SU(d) est simplement connexe. Par le théorème 27, ses représentations
de dimension finie sont en correspondance biunivoque avec les représentations de
dimension finie de son algèbre de Lie su(d). Il existe une théorie générale des représentations des algèbres de Lie semi-simples dont su(d) est un exemple. Pour des
raisons de temps, nous nous contenterons dans ce cours d’une illustration de cette
théorie par l’exemple de su(2) et su(3).
SU(d) est un groupe compact, il admet une mesure de Haar et la théorie générale
des représentations de groupes avec moyenne invariante s’y applique. En particulier,
toute représentation de dimension finie de SU(d) est unitaire et donc complètement
3.2. REPRÉSENTATIONS DE L’ALGÈBRE DE LIE SU(D)
75
reductible. Par le théorème 26, toute représentation de dimension finie de l’algèbre
de Lie su(d) est elle aussi complètement réductible.
C
su(d) est la sous-algèbre de Lie réelle de l’algèbre de Lie Mat(d, ) composée de
toutes les matrices anti-autoadjointes de trace nulle. Sa dimension réelle est d2 − 1.
L’algèbre de Lie complexifiée su(d)C est la sous-algèbre de Lie complexe de Mat(d, )
composée des matrices de la forme X+iY, avec X, Y ∈ su(d). Sa dimension complexe
est d2 − 1. Toute matrice Z ∈ Mat(d, ) s’écrit de manière unique comme
C
C
1
1
Z = (Z − Z∗ ) + i (Z + Z∗ ) = X + iY,
2
2i
où X et Y sont anti-autoadjointes. La trace d’une matrice anti-autoadjointe est purement imaginaire, on a tr Z = tr X + i tr Y = 0 si et seulement si X et Y sont de
trace nulle. On en conclut que su(d)C = {Z ∈ Mat(d, ) | tr Z = 0}, c’est-à-dire que
su(d)C = sl(d, ), l’algèbre de Lie du groupe SL(d, ).
C
C
C
Si Π est une représentation complexe de su(d), la formule
Π(X + iY) ≡ Π(X) + iΠ(Y),
C
définit une représentation complexe de sl(d, ). Réciproquement, la restriction aux
matrices anti-autoadjointes d’une représentation complexe de sl(d, ) définit une
représentation complexe de su(d). Les représentations complexes de su(d) et de
sl(d, ) sont donc en correspondance
C
C
Soient Π : su(d) → GL(V) une représentation complexe et W ⊂ V un sous-espace
Π-invariant. On a Π(X + iY)W = Π(X)W + iΠ(Y)W ⊂ W pour tout X, Y ∈ su(d),
c’est-à-dire que W est aussi invariant pour la représentation de sl(d, ) associée à Π.
La réciproque est évidente. Les représentations associées de su(d) et de sl(d, ) ont
donc les même sous-espaces invariants. En particulier, toute représentation complexe
de dimension finie de sl(d, ) est complètement réductible.
C
C
C
3.2.1
C
Représentations des algèbres de Lie sl(2, ) et su(2)
C
La dimension de sl(2, ) est 3, les matrices suivantes en forment une base
1 0
0 0
0 1
H≡
, X+ ≡
, X− ≡
.
0 −1
1 0
0 0
Les relations de commutation de ces matrices sont
[H, X± ] = ±2H,
C
[X+ , X− ] = H.
(3.4)
Une représentation Π de sl(2, ) dans V étant une application linéaire, elle est complètement déterminée par Π(H), Π(X+ ), Π(X− ). Construire une représentation Π de
CHAPITRE 3. REPRÉSENTATIONS DES GROUPES DE LIE
76
C
sl(2, ) dans l’espace vectoriel V revient à trouver 3 matrices Π(H), Π(X+ ), Π(X− )
satisfaisant les relations de commutation (3.4). Ce problème est considérablement
plus simple que la construction d’une représentation du groupe SL(2, ). Pour simplifier la notation, nous écrirons désormais H, X± au lieu de Π(H), Π(X± ).
C
La pemière relation dans (3.4) donne
HX± = X± (H ± 2),
et donc
HX2± = X± (H ± 2)X± = X2± (H ± 4),
et par iteration
n
HXn
± = X± (H ± 2n).
C
Supposons que Π soit une représentation complexe de dimension finie de sl(2, )
dans V. La matrice H admet au moins une valeur propre λ. Soit v 6= 0 un vecteur
propre correspondant. Alors, pour tout entier n > 0 on a
n
HXn
− v = (λ − 2n)X− v,
c’est-à-dire soit Xn
− v = 0, soit (λ − 2n) est une valeur propre de H. La matrice
H n’ayant qu’un nombre fini de valeurs propres, il existe un entier k > 0 tel que
k
Xk− v 6= 0 mais Xk+1
− v = 0. On pose ε0 ≡ λ − 2k et w0 ≡ X− v. On obtient
n
HXn
+ w = (ε0 + 2n)X+ w,
pour tout entier n > 0. Par le même argument que précédemment, il existe un entier
m+1
m > 0 tel que Xm
w = 0. Posons εn ≡ ε0 + 2n, wn ≡ Xn
+ w 6= 0 mais X+
+ w0 pour
n = 0, . . . , m, alors
Hwn
X+ wn
X− w0
= wn+1 pour n = 0, . . . , m − 1,
=
0
pour n = m,
=
0.
(3.5)
On utilise la deuxième relation dans (3.4) pour calculer
X− w1 = X− X+ w0 = X+ X− w0 − Hw0 = −ε0 w0 ,
puis
X− w2 = X− X+ w1 = X+ X− w1 − Hw1 = −(ε0 + ε1 )w1 ,
et par induction
X− wn+1 = −
n
X
j=0
εj wn = −
n
X
j=0
εj wn = −(n + 1)(ε0 + n)wn ,
(3.6)
3.2. REPRÉSENTATIONS DE L’ALGÈBRE DE LIE SU(D)
77
pour n = 0, . . . , m − 1. De la deuxième relation (??) on obtient encore
(ε0 + 2m)wm = εm wm =
=
=
=
Hwm
X+ X− wm − X− X+ wm
X+ (−m(ε0 + m − 1)wm−1 )
−m(ε0 + m − 1)wm ,
d’où on tire
(m + 1)(ε0 + m) = 0.
Comme m > 0, on doit avoir ε0 = −m et donc
εn = 2n − m.
Les relations (3.5) (3.6) montrent que le sous-espace engendré par {w0 , . . . , wm } est
Π-invariant. Si Π est irréductible, ces vecteurs forment une base de V et les matrices
de la représentation Π sont complètement déterminées. En particulier, la dimension
de Π est m + 1. Il est d’usage de paramétrer cette dimension par un demi-entier
` ∈ /2 en écrivant m = 2`. Nous avons démontré
N
N
Théorème 28 Pour tout demi-entier ` ∈ /2 il existe une et, à l’équivalence près, une
seule représentation irréductible Π` de dimension 2` + 1 de sl(2, ) et de su(2). Elle est
donnée par


−2`


−2(` − 1)




.
.
Π` (H) = 
,
.




2(` − 1)
2`
C

0
 1 0



...


1
Π` (X+ ) = 
,


.


.. 0
1 0

0 1(2`)

0
2(2` − 1)

...

0

Π` (X− ) = 
..

. (2` − 1)2


0
(2`)1
0






.



Si M est une matrice (ou un endomorphisme d’un espace vectoriel) on dénote par
σ(M) le spectre de M, c’est-à-dire l’ensemble de ses valeurs propres. On remarque
CHAPITRE 3. REPRÉSENTATIONS DES GROUPES DE LIE
78
que si deux représentations Π et Π 0 sont équivalentes σ(Π(H)) = σ(Π 0 (H)). Le
théorème 28 montre que si Π est une représentation irréductible, σ(Π(H)) = {2(k −
`) | k = 0, . . . 2`} ⊂
pour un demi-entier ` ∈ /2. Si Π est une représentation
quelconque de dimension finie de sl(2, ), elle est complètement réductible et se
décompose en une somme directe de représentations irréductibles Π = ⊕i Π`i . Le
spectre de Π(H) = ⊕i Π`i (H) est
[
σ(Π(H)) =
σ(Π`i (H)),
Z
N
C
i
Z
et en particulier σ(Π(H)) ⊂ . Il est alors très simple de déterminer les composantes irréductibles de Π. Plutot que d’énoncer un théorème, nous allons présenter
un exemple important.
Exemple 50 On dénote par π` la représentation irréductible de SU(2) de dimension
2` + 1 correspondant à Π` et on considère la représentation
π ≡ π` 1 ⊗ π` 2 .
Nous cherchons à déterminer la décomposition
M
π=
π` k ,
(3.7)
k
de π en représentations irréductibles.
La représentation induite Π est déterminée par les matrices Π(H), Π(X± ). en particulier on a
d
d
tH tH
tH =
π`1 (e ) ⊗ π`2 (e )
Π(H) = π(e )
dt
dt
t=0
t=0
d tΠ` (H)
e 1
⊗ etΠ`2 (H) =
dt
t=0
= Π`1 (H) ⊗ I + I ⊗ Π`2 (H).
(j)
Si w`i , j = 0, . . . , 2`i sont les vecteurs propres de Π`i (H),
(j)
(j)
Π`i (H)w`i = 2(j − `)w`i ,
(j )
(j )
alors les vecteurs w`1 1 ⊗ w`2 2 sont les vecteurs propres de Π(H)
(j )
(j )
Π(H)w`1 1 ⊗ w`2 2
(j )
(j )
(j )
(j )
= Π`1 (H)w`1 1 ⊗ w`2 2 + w`1 1 ⊗ Π`2 (H)wl2 2
(j )
(j )
= 2(j1 + j2 − `1 − `2 )w`1 1 ⊗ w`2 2
(j )
(j )
= εj1 j2 w`1 1 ⊗ w`2 2 .
3.2. REPRÉSENTATIONS DE L’ALGÈBRE DE LIE SU(D)
79
Le spectre de Π(H) est donné par
σ(Π(H)) = {εj1 j2 ≡ 2(j1 + j2 − `1 − `2 )|j1 = 0, . . . , 2`1 ; j2 = 0, . . . , 2`2 },
et est représenté dans la figure 3.1. Chaque point (j1 , j2 ) de ce diagramme représente
(j )
(j )
un vecteur propre w`1 1 ⊗w`2 2 de Π(H). Les lignes obliques représentent des valeurs
propres correpondantes εj1 j2 . La plus grande valeur propre, 2(`1 + `2 ) est simple. Elle
indique la présence d’une représentation π`1 +`2 dans la décomposition (3.7). Chaque
point sur la ligne grasse extérieure du diagramme correspond à une valeur propre
de Π`1 +`2 (H). Si on enlève tous ces point, la plus grande valeur propre restante est
2(`1 + `2 − 1) et indique la présence de la représentation π`1 +`2 −1 . En continuant
ainsi on trouve toutes les représentations irréductibles apparaissant dans (3.7) et on
obtient le résultat recherché
`M
1 +`2
π=
π` .
`=|`1 −`2 |
ε j1
=
=
=
+
+
ℓ1
2(
ℓ1
2(
ℓ1
2(
j2
ε j1
j2
j2
ε j1
j2
1)
2)
)
ℓ2
−
−
+
ℓ2
ℓ2
2ℓ2
σ(Πℓ1 +ℓ2 (H))
σ(Πℓ1 +ℓ2 −1 (H))
2ℓ1
j1
j2
ε j1
j2
j2
ε j1
ε j1
=
=
=
+
+
)
ℓ2
2)
−
ℓ2
+
ℓ1
1)
2(
−
−
ℓ2
ℓ1
2(
−
ℓ1
2(
−
σ(Π|ℓ1 −ℓ2 | (H))
Fig. 3.1 – Décomposition du spectre de Π(H).
CHAPITRE 3. REPRÉSENTATIONS DES GROUPES DE LIE
80
3.2.2
C
Représentations de l’algèbre de Lie sl(3, )
C
L’algèbre de Lie sl(3, ) est de
base


1 0 0
H1 ≡  0 −1 0  ,
 0 0 0
0 1 0

X1 ≡ 0 0 0  ,
 0 0 0
0 0 0

Y1 ≡ 1 0 0  ,
0 0 0
dimension 8, les matrices suivantes en forment une

0

H2 ≡ 0
0
0

X2 ≡ 0
 0
0

Y2 ≡ 0
0
0
1
0
0
0
0
0
0
1

0
0 ,
−1

0
1  , X3 ≡ 
0

0
0  , Y3 ≡ 
0
0
0
0
0
0
1
0
0
0
0
0
0

1
0 ,
0
0
0 .
0
Les relations de commutation de ces matrices sont données dans le tableau 3.4.
% H1
H2
X1
X2
X3
Y1
Y2
Y3
H1
0
0
2X1 −X2
X3
−2Y1 Y2
−Y3
H2
0
0
−X1 2X2
X3
Y1 −2Y2
−Y3
X1 −2X1 X1
0
X3
0
H1
0
−Y2
X2
X2 −2X2 −X3
0
0
0
H2
Y1
X3 −X3 −X3
0
0
0
−X2
X1 H1 + H2
Y1 2Y1
−Y1 −H1
0
X2
0
−Y3
0
Y2 −Y2
2Y2
0
−H2
−X1
Y3
0
0
Y3
Y3
Y3
Y2 −Y1 −H1 − H2
0
0
0
C
Tab. 3.1 – Relations de commutation de sl(3, ).
C
Une représentation Π de sl(3, ) dans V est complètement déterminée par 8 matrices
Π(H1 ), . . . , Π(Y3 ) satisfaisant les relations de commutation du tableau 3.1. Comme
dans le paragraphe précédent, nous supposons donnée une représentation complexe
irréductible Π dans V et, pour ne pas alourdir la notation, nous écrirons les images
des 8 matrices de base H1 , . . . , Y3 .
On note que les matrices H1 et H2 commutent [H1 , H2 ] = 0.
Lemme 3 Soient A, B deux matrices telles que [A, B] = 0. Il existe un vecteur v 6= 0 et
α, β ∈ tels que Av = αv et Bv = βv.
C
Démonstration Soit α une valeur propre de A, alors Ker(αI − A) 6= {0} et
(αI − A)B Ker(αI − A) = B(αI − A) Ker(αI − A) = {0},
3.2. REPRÉSENTATIONS DE L’ALGÈBRE DE LIE SU(D)
81
implique que B Ker(αI−A) ⊂ Ker(αI−A). Soit β une valeur propre de la restriction
de B à Ker(αI − A). Alors il existe v ∈ Ker(αI − A) tel que v 6= 0, Bv = βv et
Av = αv.
On dit que µ = (µ1 , µ2 ) ∈
C2 est un poids de Π s’il existe v ∈ V tel que v 6= 0 et
H1 v = µ1 v,
(3.8)
H2 v = µ2 v,
et on appelle vecteur de poids µ tout vecteur v ∈ V satisfaisant (3.8). L’ensemble de
tous ces vecteurs forme un sous-espace vectoriel de Vµ de V qu’on nomme espace de
poids µ. L’ensemble des poids de Π est noté M.
C
Théorème 29 Si Π est une représentation de sl(3, ) alors M ⊂
Z2.
Démonstration On remarque que les matrices H1 , X1 , Y1 satisfont les relations de
commutations de sl(2, ),
C
[H1 , X1 ] = 2X1 ,
[H1 , Y1 ] = −2Y1 ,
[X1 , Y1 ] = H1 .
La représentation Π restreinte à ces 3 matrices définit une représentation de cette
algèbre de Lie. On a donc σ(H1 ) ⊂ comme nous l’avons remarqué dans le paragraphe précédent. Le même argument s’applique aux trois matrices H2 , X2 , Y2 .
Z
Les poids de la représentation adjointe jouent un rôle particulier et sont appelés
racines de l’algèbre de Lie sl(3, ). ρ = (ρ1 , ρ2 ) ∈ × est une racine s’il existe
Zρ ∈ sl(3, ) non-nul tel que
C
C
Z Z
adHi Zρ = [Hi , Zρ ] = ρi Zρ .
C
On identifie aisément les racines de sl(3, ) sur la table 3.1 :
ρ
ρ = (2, −1)
ρ(2) = (−1, 2)
(1, 1) = ρ(1) + ρ(2)
(−2, 1) = −ρ(1)
(1, −2) = −ρ(2)
(1, 1) = ρ(1) + ρ(2)
(1)
Zρ
X1
X2
X3
Y1
Y2
Y3
les racines ρ(1) et ρ(2) ont la propriété remarquable que toute racine peut s’exprimer
comme combinaison linéaire aρ(1) +bρ(2) avec des coefficients entiers tels que a, b >
0 ou a, b 6 0. Nous pouvons utiliser ces deux racines pour définir un relation
d’ordre sur l’ensemble M des poids de Π
µ < ν ⇐⇒ µ − ν = aρ(1) + bρ(2) avec a, b > 0.
CHAPITRE 3. REPRÉSENTATIONS DES GROUPES DE LIE
82
Muni de cette relation M est un ensemble partiellement ordonné. On dit que µ est
un plus grand poids de M si µ ∈ M et si ν 4 µ pour tout ν ∈ M. Comme ρ(1) et
ρ(2) sont linéairement indépendants il est clair que si M admet un plus grand poids
ce dernier est unique.
Théorème 30
C
i. Si Π est une représentation irréductible de sl(3, ) dans V alors V = ⊕µ∈M Vµ .
C
ii. Toute représentation irréductible de sl(3, ) admet un unique plus grand poids µ̄ ∈
× et dim Vµ̄ = 1.
N N
C
iii. Deux représentations irréductibles de sl(3, ) sont équivalentes si et seulement si
leurs plus grands poids coïncident.
N N
C
iv. Pour tout µ̄ = (µ1 , µ2 ) ∈
× il existe une et, à l’équivalence près, une seule
représentation irréductible de sl(3, ) de plus grand poids µ̄. Cette représentation
est de dimension (µ1 + 1)(µ2 + 1)(µ1 + µ2 + 2)/2.
Pour démontrer ce théorème, nous avons besoin du lemme suivant
C
Lemme 4 Soit ρ = (ρ1 , ρ2 ) une racine, Zρ ∈ sl(3, ) tel que [Hi , Zρ ] = ρi Zρ et
µ ∈ M. Alors soit Zρ Vµ = {0} soit µ + ρ ∈ M et Zρ Vµ ⊂ Vµ+ρ .
Démonstration Soit v ∈ Vµ , alors
Hi Zρ v = Zρ Hi v + [Hi , Zρ ]v
= Zρ µi v + ρi Zρ v
= (µi + ρi )Zρ v,
et si Zρ v 6= 0 c’est un vecteur de poids µ + ρ.
Démonstration du théorème 30. (i) W = ⊕µ∈M Vµ est un sous-espace de V. Comme
Hi Vµ = µi Vµ on a Hi W ⊂ W. Le lemme 4 montre que Zρ W ⊂ W pour toute racine ρ. On en conclut que W est invariant et comme Π est irréductible on a bien
W = V.
(ii) Soit Π une représentation irréductible. Comme l’ensemble M des poids de cette
représentation est fini il existe un élément maximal µ ∈ M (tel que ν ∈ M et ν < µ
implique ν = µ). Si v est un vecteur de poids µ alors X1 v = X2 v = 0. En effet, si
Xi v 6= 0 alors, par le lemme 4 c’est un vecteur de poids µ + ρ(i) < µ ce qui contredit
la maximalité de µ. Soit W le sous-espace enegendré par les vecteurs
Yi1 Yi2 · · · Yin v,
où n ∈
(3.9)
N et i1, i2, . . . , in ∈ {1, 2}. Le lemme 4 montre que pour k = 1, 2
(i )
(i )
(i )
Hk Yi1 Yi2 · · · Yin v = (µk − ρk 1 − ρk 2 − · · · − ρk n )Yi1 Yi2 · · · Yin v,
(3.10)
3.2. REPRÉSENTATIONS DE L’ALGÈBRE DE LIE SU(D)
83
et par conséquent Hk W ⊂ W. D’autre part on a
Xk Yi1 Yi2 · · · Yin v = [Xk , Yi1 Yi2 · · · Yin ]v
n
X
Yi1 · · · Yij−1 [Xk , Yij ]Yij+1 · · · Yin v
=
=
=
j=1
n
X
j=1
n
X
j=1
Yi1 · · · Yij−1 (δij k Hk )Yij+1 · · · Yin v
(i
)
(i )
δij k (µk − ρk j+1 − · · · − ρk n )Yi1 · · · Yij−1 Yij+1 · · · Yin v,
et donc Xk W ⊂ W. Comme X3 = [X1 , X2 ] on a aussi X3 W ⊂ W. Finalement on
a Yk W ⊂ W pour k = 1, 2 et comme Y3 = [Y2 , Y1 ] également Y3 W ⊂ W. On en
conclut que W est invariant et comme Π est irréductible W = V. La relation (3.10)
montre que tout élément de V est combinaison linéaire de vecteurs de poids ν 4 µ.
(i) permet de conclure que ν 4 µ pour tout ν ∈ M et par conséquent µ est le
plus grand poids de M. Il suit également de (i) que le seul vecteur de la forme (3.9)
de poids µ est v et donc que Vµ = v. Nous avons déjà remarqué que H1 , X1 , Y1
définissent une représentation de sl(2, ) dans V. Comme X1 v = 0 et H1 v = µ1 v il
suit de la démonstration du théorème 28 que µ1 est un entier non négatif. De façon
analogue on montre que µ2 ∈ .
C
C
N
...
84
CHAPITRE 3. REPRÉSENTATIONS DES GROUPES DE LIE
Annexe A
Groupes affines
On rappelle ici quelques notions de base de la géométrie affine. Revoir aussi les
cours de géométrie (M41) et d’algèbre (M53) de Licence. Les démonstrations les plus
élémentaires sont laissées à vos soins. Pour en savoir plus sur le sujet de cette annexe,
voir :
M. Berger : Géométrie 1. Action de groupes, espaces affines et projectifs. CEDIC - Farnand Nathan, Paris, 1977.
A.1
Action de groupe
Définition 15 Un groupe G opère sur un ensemble X s’il existe une application
G × X −→ X
(a, x) 7−→ ax,
telle que
(i) 1x = x pour tout x ∈ X, où 1 dénote l’élément neutre de G ;
(ii) a(bx) = (ab)x pour tous a, b ∈ G, x ∈ X.
Une telle application est une opération ou une action du groupe G sur l’ensemble X. Une
action de groupe est dite transitive si, pour tous x, y ∈ X, il existe a ∈ G tel que y = ax.
Elle est simplement transitive si cet élément a est unique. Elle est fidèle si ax = x pour
tout x ∈ X implique que a = 1. Un espace G-homogène est un ensemble sur lequel G
opère transitivement.
Si G opère sur X, l’orbite d’un point x ∈ X est l’ensemble Gx = {ax | a ∈ G}. Les
orbites sont les classes d’équivalence de la relation x ' y ⇔ y = ax pour un
a ∈ G.
85
86
ANNEXE A. GROUPES AFFINES
Le stabilisateur de x est l’ensemble Gx = {a ∈ G | ax = x}. C’est un sous-groupe
de G qui n’est généralement pas distingué. L’ensemble G/Gx des classes à gauche
de Gx n’est donc généralement pas un groupe. Deux points x, y de la même orbite
ont des stabilisateurs isomorphes, en effet si y = ax alors Gy = aGx a−1 . Si Gx est
distingué (en particulier si G est abélien), tous les points de l’orbite de x ont alors le
même stabilisateur.
X est G-homogène si et seulement si c’est l’unique orbite de G.
Si X est G-homogène, l’action de G est simplement transitive si et seulement si Gx =
{1} pour un x ∈ X (et donc pour tout x ∈ X).
L’application Gx 3 ax 7→ aGx ∈ G/Gx est une bijection. Si X est G-homogène il est
donc en bijection avec G/Gx . Si en plus Gx est distingué pour un x ∈ X il l’est pour
tous les x ∈ X et dans ce cas G opère fidèlement sur X si et seulement si Gx = {1}
pour tout x ∈ X.
En particulier, si G est abélien, son action sur un espace G-homogène est simplement
transitive si et seulement si elle est fidèle.
A.2
Espaces et applications affines
Définition 16 Un espace affine sur le corps K est un ensemble V sur lequel opère transitivement et fidèlement le groupe abélien d’un K-espace vectoriel V. La dimension dim V
de l’espace affine V est celle du K-espace vectoriel V.
L’action de V sur V est généralement notée comme V × V 3 (X, x) 7→ X + x ∈ V
et interprétée comme une translation du point X par le vecteur x. V est le groupe des
translations de V. On dira aussi que V est l’espace vectoriel associé à V.
Exemple 51 Pour tout entier d > 1, Kd est un K-espace vectoriel de dimension d.
Il agit sur Kd de manière naturelle
X + x = (X1 , . . . , Xd ) + (x1 , . . . , xd ) = (X1 + x1 , . . . , Xd + xd ).
Cette action est transitive et fidèle. Kd est un espace affine de dimension d.
Définition 17 Soient V un espace affine et V son groupe de translations. Un sous-ensemble
non-vide W ⊂ V est un sous-espace affine si c’est un espace homogène pour l’action d’un
sous-espace vectoriel W ⊂ V.
L’action du sous-espace W sur W étant fidèle, W est lui-même un espace affine. Pour
tout X ∈ W on a W = X + W. On dit que W est le sous-espace directeur de W et
que W est le sous-espace affine dirigé par W passant par X.
A.2. ESPACES ET APPLICATIONS AFFINES
87
L’action du groupe abélien V sur l’espace homogène V étant fidèle, elle est simplement transitive et par conséquence on peut associer à toute paire (X, Y) ∈ V × V un
−
→
−
→
unique vecteur XY ∈ V tel que Y = X + XY.
Un espace affine de dimension finie V est muni d’une topologie canonique héritée de
la topologie de son groupe de translation V qui est un espace vectoriel de dimension
finie (voir la discussion au début du paragraphe 1.1). Un ensemble U ⊂ V est ouvert
−→
si l’ensemble {OY | Y ∈ U} est ouvert dans V pour un (et par conséquence pour tout)
O ∈ V. En particulier, une fonction R 3 t 7→ X(t) ∈ V est continue en t0 ∈ R si
−−−→
la fonction t 7→ OX(t) ∈ V est continue en t0 pour un (et donc pour tout) O ∈ V.
Elle est différentiable en t0 ∈ R si la limite
−−−−−−→
X(t)X(t0 )
Ẋ(t0 ) = lim
,
t→t0
t − t0
existe dans V. Si cette limite existe pour tout t0 ∈]a, b[ et si ]a, b[3 t → Ẋ(t) ∈ V
est continue alors
Z
t
X(t) = X(t0 ) +
Ẋ(s) ds,
t0
pour tous t0 , t ∈]a, b[. Comme tout sous-espace d’un espace vectoriel de dimension
finie est fermé, tout sous-espace affine W ⊂ V est fermé puisqu’il est de la forme
W = O+W pour tout O ∈ W et un sous-espace W ⊂ V. En particulier, si X(t) ∈ W
−−−−−−→
pour tout t dans un voisinage de t0 alors X(t)X(t0 ) ∈ W pour tout t assez proche de
t0 et si X(t) est différentiable en t0 il en résulte que Ẋ(t0 ) ∈ W.
Définition 18 Soient V et W des espaces affines et V, W les espaces vectoriels associés.
Une application f : V → W est affine (ou est un morphisme d’espaces affines) s’il existe
une application linéaire F : V → W et un point X ∈ V tels que
f(X + x) = f(X) + Fx,
pour tout x ∈ V.
Si f est affine et f(X + x) = f(X) + Fx pour tout x ∈ V alors, pour tous Y ∈ V et
x ∈ V, on a
−
→
−
→
−
→
f(Y + x) = f(X + XY + x) = f(X) + FXY + Fx = f(X + XY) + Fx = f(Y) + Fx.
L’application affine f est donc complètement déterminée par l’application linéaire F
et par l’image f(Y) d’un point quelconque Y ∈ V ce que l’on exprime également par
l’identité
−−−−−→
−
→
f(X)f(Y) = FXY,
vérifiée pour tout X, Y ∈ V.
ANNEXE A. GROUPES AFFINES
88
Si V 0 est un sous-espace affine de V dirigé par V 0 on a
f(V 0 ) = f(X + V 0 ) = f(X) + FV 0 ,
pour tout X ∈ V 0 . L’image par f de V 0 est donc un sous-espace affine de W dirigé
par l’image de V 0 par F.
On remarquera que l’application affine f est injective (resp. surjective) si et seulement
si l’application linéaire F est injective (resp. surjective). Si f est bijective (c’est alors
un isomorphisme affine) on a, pour tous X ∈ V, x ∈ V,
X + x = f−1 ◦ f(X + x) = f−1 (f(X) + Fx),
et en posant Y = f(X) et y = Fx on obtient
f−1 (Y + y) = f−1 (Y) + F−1 y,
qui montre que f−1 est affine.
A.3
Repères affines
Définition 19 Soit V un espace affine et V le vectoriel associé. Un point O ∈ V et une
base B = (e1 , . . . , ed ) de V déterminent un repère affine de V. Les coordonnées d’un
−→
point X ∈ V dans ce repère affine sont les composantes du vecteur OX dans la base B
On peut également spécifier un repère affine d’un espace affine V de dimension d en
−−→
donnant d + 1 points O, P1 , . . . , Pd de V tels que les d vecteurs e1 = OP1 , . . . , ed =
−−→
OPd forment une base du groupe de translations de V.
Soit R = (O, e1 , . . . , ed ) un repère affine de V. L’application linéaire
ΦR : (x1 , . . . , xd ) 7−→
d
X
xj ej ,
j=1
est un isomorphisme entre les espaces vectoriels Kd et V. On en déduit que l’application affine
ϕR : x 7−→ O + ΦR x,
est un isomorphisme affine entre Kd et V. Les coordonnées d’un point X ∈ V dans
le repère R sont données par l’isomorphisme inverse (x1 , . . . , xd ) = ϕ−1
R (X). Tout
espace affine de dimension finie d est donc isomorphe à l’espace affine Kd .
Soit f : V → W une application affine et R = (O, e1 , . . . , en ), S = (P, g1 , . . . , gm )
des repères affines de V et W. On peut alors écrire
!
!
n
n
m
n
X
X
X
X
f O+
xj ej = f(O) +
xj Fej = P +
ak +
Fkj xj gk ,
j=1
j=1
k=1
j=1
A.4. GROUPES AFFINES
89
−−−→
où les ak sont les composantes du vecteur Pf(O) ∈ W dans la base (g1 , . . . , gm ) et
les Fkj sont les éléments de la matrice de l’application linéaire F relativement aux
base (e1 , . . . , en ) et (g1 , . . . , gm ). L’application affine x 7→ y = ϕ−1
S ◦ f ◦ ϕR (x) de
n
m
K dans K est donnée par
y k = ak +
n
X
Fkj xj .
j=1
A.4
Groupes affines
Définition 20 Un automorphisme de l’espace affine V est un isomorphisme affine de
V dans lui-même. L’ensemble des automorphismes de V et un groupe, le groupe affine
GA(V).
Fixons un repère affine R = (O, e1 , . . . , ed ) dans V. Pour tout f ∈ GA(V) on a
f(O + x) = f(O) + Fx pour tout x ∈ V avec F ∈ GL(V). En appliquant le résultat du
d
paragraphe précédent à l’automorphisme fR = ϕ−1
R ◦ f ◦ ϕR ∈ GA(K ) on obtient
fR (x) = a + FR x,
d
où a = fR (0) = ϕ−1
R ◦ f(O) ∈ K et FR ∈ GL(d, K) est la matrice de F dans la base
(e1 , . . . , ed ). On peut écrire cette relation sous une forme matricielle
fR (x)
FR a
x
=
,
1
0 1
1
qui montre que GA(V) est isomorphe au groupe de Lie
FR a d
GA(d, K) =
a ∈ K , FR ∈ GL(d, K) ⊂ GL(d + 1, K).
0 1 Un espace affine orienté V est un espace affine réel dont le groupe de translation V est
un espace vectoriel réel orienté. Orienter un espace affine réel, c’est donc fixer une
orientation de son groupe de translation. Il en résulte qu’un automorphisme d’un
espace affine réel tel que f(X + x) = f(X) + Fx preserve l’orientation si et seulement
si F ∈ GL+ (V) = {F ∈ GL(V) | det F > 0}. Comme
FR a
det
= det FR = det F,
0 1
le sous-groupe GA+ (V) ⊂ GA(V) des automorphismes de V préservant l’orientation est isomorphe à
FR a +
+
d
GA (d, R) =
a ∈ R , FR ∈ GL (d, R) ⊂ GA(d, R).
0 1 C’est la composante connexe de l’indentité de GA(V).
90
A.5
ANNEXE A. GROUPES AFFINES
Espaces affines pseudo-euclidiens
Définition 21 Un espace affine (pseudo-) euclidien est un espace affine réel E dont le
groupe des translations E est un espace vectoriel (pseudo-) euclidien.
Soit E un espace affine pseudo-euclidien de dimension d et E son groupe de translations muni de la forme bilinéaire symétrique non-dégénérée g. La pseudo-métrique
de E est alors donnée par
−
→ −
→
ρ2 (X, Y) = g(XY, XY).
Un repère affine euclidien de E est un repère affine R = (O, e1 , . . . , ed ) tels que
la base (e1 , . . . , ed ) de E soit orthonormée, c’est-à-dire que g(ei , ej ) = gi δij avec
gi = ±1. On supposera par la suite que d = p + n et que g1 = · · · = gp = 1,
gp+1 = · · · = gp+n = −1. L’application ϕR : Rp+n → E introduite au paragraphe
A.3 est un isomorphisme de l’espace affine euclidien Rp+n du paragraphe 1.2.4 dans
E.
Une isométrie de E est une application f : E → E telle que ρ2 (f(X), f(Y)) = ρ2 (X, Y)
pour tous X, Y ∈ E. En vertu de l’isomorphisme mentionné ci-dessus et des résultats
du paragraphe 1.2.4, le groupe A(E) des isométrie de E est isomorphe au sous-groupe
FR a d
A(p, n) =
a ∈ R , FR ∈ O(p, n) ⊂ GA(p + n, R).
0 1 De même le groupe SA(E) des isométrie de E préservant son orientation est isomorphe au sous-groupe
FR a d
SA(p, n) =
a ∈ R , FR ∈ SO(p, n) ⊂ GA(p + n, R).
0 1 Annexe B
Les groupes de Lie des théories de la
relativité
Qu’est-ce que l’espace ? Qu’est-ce que le temps ? Des questions que l’on qualifierait
volontier de philosophiques. Cependant elles sont au coeur de notre compréhension
de l’univers et chaque révolution scientifique nous a forcé à modifier profondément
nos conceptions de l’espace et du temps. L’espace de la mécanique newtonienne est
un espace affine euclidien tridimensionnel. Cette conception nous est apportée par
l’expérience quotidienne de notre "espace environnant". Les physiciens contemporains ont une vision beaucoup plus élaborée de l’espace et du temps : ils peuvent se
mélanger, devenir courbe, et même, à des échelles infiniment petites, cesser d’exister !
A lire à ce sujet :
C. Rovelli : Qu’est-ce que le temps ? Qu’est-ce que l’espace ? Bernard Gilson, Bruxelles,
2008.
V. Petkov : Relativity and the nature of spacetime. Springer, Berlin, 2009.
B.1
Mouvement relatif
Soit E3 l’espace euclidien tridimensionnel de la mécanique de Newton muni d’une
orientation. Nous noterons E3 l’espace vectoriel euclidien orienté associé. La position d’un point matériel en mouvement dans cet espace est décrit par une fonction,
que nous supposerons deux fois continuement différentiable, t 7→ P(t) ∈ E3 . Sa
vitesse est la fonction t 7→ Ṗ(t) ∈ E3 et son accélération
t 7→ P̈(t) =
dṖ(t)
∈ E3 .
dt
Cette description idéalisée suppose l’existence d’un espace absolu et d’un temps absolu. Il en résulte une notion d’immobilité absolue Ṗ(t) = 0 et plus généralement de
91
92
ANNEXE B. LES GROUPES DE LIE DES THÉORIES DE LA RELATIVITÉ
vitesse absolue. Or il s’avère impossible de mesurer une telle vitesse absolue. Nous
pouvons mesurer facilement notre vitesse par rapport au sol, au centre de la terre,
au centre du soleil, plus théoriquement par rapport au centre de l’étoile Proxima
Centauri, au centre de notre galaxie, . . . mais il nous est impossible de mesurer notre
vitesse par rapport à l’espace ! (En fait Einstein réalisa que la même chose est vraie
pour l’accélération lorsqu’on prend en compte les forces de gravitation, ce qui, entre
autre, l’ammena à découvrir la relativité générale, mais nous n’aborderons pas ce
sujet ici).
Seule est donc accessible à notre expérience la vitesse du point P(t) relativement à
un autre point O(t). Autrement dit, nous pouvons observer un point se déplaçant
dans l’espace, mais il nous est impossible de quantifier son mouvement relativement
à cet espace. C’est pourquoi on introduit la notion de referentiel. Un référentiel est
un repère euclidien orienté mobile R = (O(t), e1 (t), e2 (t), e3 (t)) dans E3 . Toute
fonction vectorielle t 7→ y(t) ∈ E3 s’exprime dans ce repère comme
y(t) =
3
X
yR
j (t)ej (t),
j=1
R
R
et nous noterons par yR (t) ∈ R3 le vecteur de composantes (yR
1 (t), y2 (t), y3 (t)).
Pour un observateur utilisant le référentiel R le point O(t) est immobile et les vecteurs ej (t) sont fixes. Il calcule donc la dérivée temporelle de y(t) comme le vecteur
dont les composantes dans son référentiel sont données par ẏR (t), ce que nous pouvons écrire comme
!
3
3
R
R
R
X
X
dy
(t)e
(t)
dy
(t)
dej (t)
D y(t)
j
j
j
=
ej (t) =
− yR
.
(B.1)
j (t)
Dt
dt
dt
dt
j=1
j=1
Comme ej (t) · ek (t) = δjk , on a ėj (t) · ek (t) + ej (t) · ėk (t) = 0 et donc
R
ΩR
jk (t) = ej (t) · ėk (t) = −ėj (t) · ek (t) = −ek (t) · ėj (t) = −Ωkj (t).
En interprétant les quantités ΩR
jk (t) comme les éléments de matrice, dans la base
(e1 (t), e2 (t), e3 (t)), d’un endomorphisme ΩR (t) de E3 on obtient
ėk (t) =
3
X
j=1
ej (t) · ėk (t) ej (t) =
3
X
R
ΩR
jk (t)ej (t) = Ω (t)ek (t).
j=1
Notons que la matrice ΩR (t) est anti-symétrique, c’est donc un élément de l’algèbre
de Lie du groupe SO(E3 ). Nous pouvons reformuler (B.1) comme
DR y(t)
dy(t)
=
− ΩR (t)y(t).
Dt
dt
B.1. MOUVEMENT RELATIF
93
En particulier, la position du point P(t) mesurée dans le référentiel R est décrite le
−−−−−−→
vecteur x(t) = O(t)P(t),
P(t) = O(t) + x(t).
Sa vitesse et son accélération dans ce référentiel sont données par
v(t) =
dx(t)
DR x(t)
=
− ΩR (t)x(t),
Dt
dt
(B.2)
a(t) =
dv(t)
DR v(t)
=
− ΩR (t)v(t).
Dt
dt
(B.3)
ē3
P
x̄
ē2
O
c
ē1
x
e3
e2
O
e1
Fig. B.1 – Changement de repère dans l’espace affine E3 .
Dans un second référentiel R = (O(t), ē1 (t), ē2 (t), ē3 (t)) on a de même
−−−−−−→
P(t) = O(t) + x̄(t) = O(t) + O(t)O(t) + x̄(t) = O(t) + c(t) + x̄(t),
−−−−−−→
et donc x(t) = c(t) + x̄(t) avec c(t) = O(t)O(t) (voir figure B.1). La vitesse et
l’accélération du point P(t) dans le référentiel R sont
DR x̄(t)
dx̄(t)
v̄(t) =
=
− ΩR (t)x̄(t),
Dt
dt
DR v̄(t)
dv̄(t)
ā(t) =
=
− ΩR (t)v̄(t),
Dt
dt
alors que la vitesse et l’accélération du point O(t) dans le référentiel R sont
DR c(t)
dc(t)
vc (t) =
=
− ΩR (t)c(t),
Dt
dt
(B.4)
(B.5)
(B.6)
94
ANNEXE B. LES GROUPES DE LIE DES THÉORIES DE LA RELATIVITÉ
DR vc (t)
dvc (t)
=
− ΩR (t)vc (t).
(B.7)
Dt
dt
Pour obtenir la relation entre les vitesses v(t) et v̄(t) dans les deux référentiels il faut
éliminer les vitesses absolues dans les trois relations (B.2), (B.4), (B.6) en utilisant la
quatrième relation x(t) = c(t) + x̄(t). On obtient ainsi
ac (t) =
dx(t)
− ΩR (t)x(t)
dt
d
c(t) + x̄(t) − ΩR (t)(c(t) + x̄(t))
=
dt
dx̄(t)
= vc (t) +
− ΩR (t)x̄(t) + ΩR (t) − ΩR (t) x̄(t)
dt
= vc (t) + v̄(t) + Ω(t)x̄(t),
v(t) =
où Ω(t) = ΩR (t) − ΩR (t). En écrivant la matrice de cet endomorphisme antisymétrique dans la base (e1 (t), e2 (t), e3 (t)) comme


0
−ω3 (t) ω2 (t)
0
−ω1 (t)  ,
Ω(t) =  ω3 (t)
−ω2 (t) ω1 (t)
0
on obtient
v(t) = vc (t) + ω(t) ∧ x̄(t) + v̄(t).
Le vecteur
ω(t) =
3
X
ωj (t)ej (t),
j=1
est la vitesse angulaire du repère R relativement au repère R.
On calcule de manière analogue l’accélération
dv(t)
− ΩR (t)v(t)
dt
d
=
vc (t) + ω(t) ∧ x̄(t) + v̄(t) − ΩR (t) vc (t) + ω(t) ∧ x̄(t) + v̄(t)
dt
dv̄(t)
DR
= ac (t) +
ω(t) ∧ x̄(t) +
− ΩR (t)v̄(t) + Ω(t)v̄(t)
Dt
dt
DR ω(t)
DR x̄(t)
= ac (t) +
∧ x̄(t) + ω(t) ∧
+ ā(t) + ω(t) ∧ v̄(t),
Dt
Dt
a(t) =
et avec
DR x̄(t)
dx̄(t)
dx̄(t)
=
− ΩR (t)x̄(t) =
− ΩR (t)x̄(t) + Ω(t)x̄(t)
Dt
dt
dt
DR x̄(t)
=
+ Ω(t)x̄(t) = v̄(t) + ω(t) ∧ x̄(t)
Dt
B.2. RELATIVITÉ GALILÉENNE
95
on conclut
DR ω(t)
∧ x̄(t) + 2ω(t) ∧ v̄(t) + ā(t).
a(t) = ac (t) + ω(t) ∧ ω(t) ∧ x̄(t) +
Dt
B.2
Relativité galiléenne
Les lois de la mécanique de Newton sont valables lorsque les positions des corps
dont elle régit le mouvement sont mesurées relativement à un repère inertiel. Aujourd’hui, cette formulation du principe de relativité galiléenne est généralement
comprise comme une définition opérationelle de la notion de repère inertiel. Elle
sous entend implicitement le fait qu’en mécanique newtonienne la notion de temps
est absolue et ne dépend pas de l’état de mouvement de l’horloge. Sous cette hypothèse on peut donc formuler la définition suivante
Définition 22 Un repère est inertiel si le centre de masse de tout corps ne subissant
aucune force y est en mouvement rectiligne uniforme.
Supposons le repère (O, e1 , e2 , e3 ) inertiel. Le mouvement d’un point matériel P ne
subissant aucune force est y est donc décrit par la fonction
X(t) = B + tV,
où V est sa vitesse constante et B sa position au temps t = 0.
Supposons que le repère (O 0 , e10 , e20 e30 ) soit en mouvement relativement au repère
inertiel (O, e1 , e2 , e3 ).
V = Ȧ(t) + R(t)Ẋ 0 (t) + Ṙ(t)X 0 (t)
Remarque. Pour Newton, un repère inertiel s’il est en mouvement rectiligne uniforme par rapport à un espace absolu. Cette notion d’espace absolu
Ces derniers sont caractérisés par les fait
B.3
Le groupe de galilée
C’est le groupe de symétrie de la mécanique newtonienne. Les éléments de ce groupe
sont les transformation de l’espace-temps correspondant aux changements de repère
inertiel.
x 0 = Mx + vt + a,
t 0 = t + b,


M v a
T = 0 1 b 
0 0 1
96
B.4
ANNEXE B. LES GROUPES DE LIE DES THÉORIES DE LA RELATIVITÉ
L’espace de Minkowski
L’histoire de l’univers est écrite dans cet espace : un point de M est un événement, déterminé par sa position spatiale et l’instant de son occurence. Une courbe γ dans M
est une histoire ou ligne d’univers. Une telle courbe représente la succession d’événements constituant l’histoire d’un point matériel. Un observateur peut, quelque soit
son état de mouvement, définir un repère affine dans M à l’aide d’une règle et d’une
horloge. Il choisit un événement O ∈ M comme origine du temps t et de l’espace x.
Il forme ensuite une base orthonormée {e1 , e2 , e3 } de l’espace au temps t = 0. Après
−−→
un temps t = 1 l’origine de l’espace constitue un nouvel événement O 0 . e4 = OO 0
est le quatrième vecteur d’une base affine de M. Tout événement M ∈ M s’écrit de
manière unique comme
4
X
xi ei ,
M=O+
i=1
où (x1 , x2 , x3 , x4 ) sont les coordonnées de x dans le repère (O, {e1 , e2 , e3 , e4 }).
O′
e4
x4 = t = 1
e2
O
e1
x4 = t = 0
Fig. B.2 – Construction d’un repère affine dans l’espace de Minkowski.
Si R = (P, {e1 , e2 , e3 , e4 }) et R 0 = (Q, {f1 , f2 , f3 , f4 }) sont deux repères affines de M,
les coordonnées x = (x1 , x2 , x3 , x4 ) et y = (y1 , y2 , y3 , y4 ) d’un point M relativement
à ces deux repères sont reliées par la formule de changement de repère
y = a + T x,
0
où a = (a1 , a2 , a3 , a4 ) sont le coordonnées
P de P dans R et T est la matrice de
changement de base déterminée par ej = i Tij fi .
Un repère affine de M est dit inertiel si un point matériel ne subissant l’action d’aucune force y suit un mouvement rectiligne non-accéléré, c’est-à-dire si sa ligne d’univers est de la forme x(t) = x(0) + tu où u = (v, 1) est un vecteur constant. Le
postulat fondamental de la théorie de la relativité restreinte (Einstein, Poincaré 1905)
est que la vitesse de la lumière est une constante absolue c ne dépendant ni de l’état
B.4. L’ESPACE DE MINKOWSKI
97
de mouvement de la source de lumière, ni de celui de l’observateur. Dans un repère inertiel, la ligne d’univers d’un rayon de lumière est donc toujours de la forme
x(t) = x(0) + tu où u = (v, 1) satisfait |v|2 − c2 = 0 c’est-à-dire g[u] = 0 pour la
forme quadratique
g[u] ≡ (u21 + u22 + u23 ) − c2 u24 .
x4
u
t
x
x(t)
γ
Fig. B.3 – Une ligne d’univers γ vue dans un système de coordonnées (x, x4 ).
La pseudo-métrique correspondante
ρ2 (x, y) = |x − y|2 − c2 (x4 − y4 )2 ,
est appelée métrique de Minkowski et munit l’espace M d’une structure d’espace
pseudo-euclidien.
Pour chaque x ∈ M, l’espace de Minkowski se partitionne en 3 parties.
i. L’ensemble des y tels que ρ2 (x, y) = 0 : deux événements x 6= y ont une distance
de Minkowski nulle si et seulement si ils peuvent être reliés par un faisceau
lumineux. En effet ρ2 (x, y) = 0 et x 6= y si et seulement si
|x − y| = c|x4 − y4 |
c’est-à-dire si un mobile peut parcourir, à la vitesse constante c, l’espace séparant
x de y en un temps |x4 − y4 |. Dans ce cas on dit que l’intervalle entre x et y est
→ est de type lumière. L’ensemble C ≡ {y ∈
de type lumière, où que le vecteur −
xy
x
M | ρ2 (x, y) = 0} est un cône de sommet x. On l’appelle cône de lumière de x.
ii. L’ensemble des y tels que ρ2 (x, y) < 0 : Ailleurs. Si ρ2 (x, y) < 0, les événements
x et y peuvent être relié par un mobile se déplaçant à une vitesse inférieure à
celle de la lumière. On dit alors que l’intervalle entre x et y, ou que le vecteur
98
ANNEXE B. LES GROUPES DE LIE DES THÉORIES DE LA RELATIVITÉ
−
→ est de type espace. L’ensemble des points y tels que ρ2 (x, y) < 0 est l’ensemble
xy,
des événements pouvant influencer l’événement x où sur lesquels x peut avoir
une influence. C’est le domaine causal de x. Il se décompose en deux parties
disjointes, le passé Px = {y ∈ M | ρ(x, y) < 0, y4 < x4 } et le futur Fx = {y ∈
M | ρ(x, y) < 0, y4 > x4 }.
iii. L’ensemble des y tels que ρ2 (x, y) > 0 : Nulle part. Si ρ2 (x, y) > 0, les événements x et y ne peuvent être relié par un mobile se déplaçant à une vitesse
inférieure ou égale à celle de la lumière. On dit alors que l’intervalle entre x et y,
→ est de type temps. La relativité restreinte postule qu’aucun
ou que le vecteur −
xy,
corps ou signal ne peut se déplacer à une vitesse supérieure à celle de la lumière.
Deux événements séparés par un intervalle de type temps ne peuvent donc pas
s’influencer mutuellement. L’ensemble des points y tels que ρ2 (x, y) > 0 est
l’ensemble des événements causalement disjoints de l’événement x.
B.5
Le groupe de Poincaré
En conséquence de la constance de la vitesse de la lumière, la matrice de changement de base T entre deux repères inertiels doit satisfaire la condition suivante :
g[u] = 0
⇐⇒
g[T u] = 0.
On montre aisément qu’une telle transformation doit être de la forme
T = θS,
θ ∈ R, S ∈ O(3, 1).
Le facteur θ représentant un simple changement d’échelle, on peut choisir θ = 1.
On en déduit qu’un changement de repère inertiel est décrit par un élément du
groupe orthogonal O(3, 1). L’interprétation physique de ce groupe lui vaut le
nom de groupe de Lorentz. Ses éléments sont des transformations de Lorentz.
Téléchargement