Module I.1 : Compléments d`algèbre

publicité
Module I.1 : Compléments d’algèbre
I.1.1 Si les éléments (a, b) et (a′ , b′ ) de (Z \ {0}) × N∗ sont équivalents, c’est-à-dire si
ab′ = ba′ , alors vp (ab′ ) = vp (ba′ ) ⇒ vp (a) − vp (b) = vp (a′ ) − vp (b′ ). Ainsi, l’application
(a, b) 7→ vp (a) − vp (b) de (Z \ {0}) × N∗ dans Z est compatible avec la relation d’équivalence
a
et passe au quotient en une application 7→ vp (a) − vp (b) de Q∗ dans Z. (Si l’on prolonge
b
cette application à Q par 0 7→ ∞, on obtient encore une valuation.)
En revanche, les couples équivalents (1, 2) et (2, 4) ont pour image respective par l’applicaa2 + 1
2
5
tion (a, b) 7→ 2
les rationnels distincts et
: cette application ne passe donc pas au
b +1
5
17
a
a2 + 1
quotient, et l’on ne peut définir 7→ 2
de Q dans Q .
b
b +1
I.1.2 Nous laisserons au lecteur le soin de vérifier que la relation est bien réflexive et symétrique et
prouverons le point le plus difficile, la transitivité. Supposons donc que (f1 , J1 ) ∼ (f2 , J2 ) et
(f2 , J2 ) ∼ (f3 , J3 ), les intervalles de coïncidence étant K ⊂ J1 ∩ J2 et K ′ ⊂ J2 ∩ J3 . Alors
K ′′ := K ∩ K ′ est un intervalle ouvert contenant a et contenu dans J1 ∩ J3 et sur lequel f1
et f3 coïncident, d’où (f1 , J1 ) ∼ (f2 , J2 ) et la transitivité.
Montrons la compatibilité à gauche de cette relation et de l’addition (qui est commutative).
On suppose que (f1 , J1 ) ∼ (f1′ , J1′ ), avec intervalle de coïncidence K . Pour comparer
(f1 , J1 ) + (f2 , J2 ) à (f1′ , J1′ ) + (f2 , J2 ), il suffit de vérifier que f1 + f2 et f1′ + f2 sont
définies et égales sur L := K ∩ J2 ⊂ (J1 ∩ J2 ) ∩ (J1′ ∩ J2 ), et que L est bien un intervalle
ouvert contenant a ; c’est immédiat. Le cas de la multiplication se traite pareillement.
Il est clair que, si (f1 , J1 ) ∼ (f2 , J2 ), alors f1 (a) = f2 (a) ; l’application (f, J) 7→ f (a) est
donc compatible avec la relation d’équivalence, et passe donc au quotient. De même, si f1 et
f2 sont k fois dérivables et égales sur un intervalle ouvert contenant a, alors leurs dérivées en
a jusqu’à l’ordre k sont égales.
I.1.3 On a (par exemple) 1 6≡9 4 , mais 3 × 1 ≡9 3 × 4 , donc 3 n’est plus régulier après passage
au quotient par ≡9 . En fait, si n ∈ N∗ , dire que a ∈ N est régulier après passage au quotient
par ≡n , c’est dire que l’image de a dans Z/nZ est simplifiable, c’est-à-dire que a est premier
avec n.
I.1.4 (i) Bien sûr, selon les hypothèses du paragraphe 1.2.1 de la page 8, le groupe M doit être
commutatif. On vérifie alors que les éléments (a, 0) et (a′ , 0) de M × M sont équivalents
si, et seulement s’il existe c ∈ M tel que a + c = a′ + c, donc, M étant un groupe, si, et
seulement si, a = a′ . Le morphisme M → G est donc injectif. D’autre part, (a, b) ∈ M × M
est équivalent à (a − b, 0) ∈ M × M , donc la classe de (a, b) dans G est image d’un élément
de M et le morphisme M → G est donc surjectif.
(ii) Puisque A est intègre, x, y 6= 0 ⇒ xy 6= 0 et M est stable par multiplication ; il est alors
immédiat que c’est bien un monoïde commutatif. La relation sur M ×M qui donne par passage
au quotient son groupe des fractions est la relation : (a, b) ∼ (a′ , b′ ) si, et seulement s’il existe
c ∈ M tel que ab′ c = a′ bc, c’est-à-dire ab′ = a′ b (puisque c n’est pas diviseur de 0 ). C’est
donc la restriction de la relation sur A × M qui donne par passage au quotient le corps des
fractions de A. De plus, la définition du produit est la même dans les deux cas.
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
2
I.1.5 Nous noterons additivement les lois, mais la notation multiplicative est tout aussi justifiée
(comme dans l’indication). Notons a := i(a) la classe de (a, 0) ∈ M × M dans G. La classe
de (a, b) est donc a − b . Tout morphisme g répondant à la question vérifie donc :
g a − b = g (a) − g b = g i(a) − g i(b) = f (a) − f (b).
Il n’y a donc qu’un tel morphisme possible.
L’application ϕ : (a, b) 7→ f (a) − f (b) de M × M dans G′ passe au quotient ; en effet,
a + b′ + c = a′ + b + c entraîne f (a + b′ + c) = f (a′ + b + c), d’où ( f étant un morphisme et
f (c) ∈ G′ étant simplifiable), f (a) − f (b) = f (a′ ) − f (b′ ). Il est immédiat que l’application
g : G → G′ obtenue par passage au quotient est telle que f = g ◦ i , et le lecteur vérifiera sans
peine que c’est un morphisme de groupes.
I.1.6 On a les équivalences :
i(a) inversible ⇔ ∃(b, s) ∈ A × S : (a, 1)(b, s) ∼ (1, 1)
⇔ ∃(b, s) ∈ A × S : ∃t ∈ S : tab = ts,
ce qui implique que a divise ts ∈ S ; réciproquement, si a divise s ∈ S , il suffit de prendre
t := 1 .
Lorsque S = A∗ , on vérifie que A → S −1 A est injectif ( a est dans le noyau si sa = 0 avec
s ∈ S , donc a = 0 ) et surjectif ( a/s est l’image de as−1 ) ; on peut donc dans ce cas identifier
A à S −1 A.
Si S contenait le nilpotent s, on aurait 0 = sn ∈ S , ce que l’on a interdit. Si on l’avait permis,
on aurait (0, 1) ∼ (1, 1) et l’anneau S −1 A serait trivial.
I.1.7 (i) Notons a/s l’image de (a, s) dans S −1 A : ainsi, i(a) = a/1 et l’inverse de 1/s est s/1 .
S’il existe g comme dans l’énoncé, alors :
g(a/s) = g(a/1)g(1/s) = g(a/1)g(s/1)−1 = f (a)f (s)−1 .
Le morphisme g est donc unique. Réciproquement, l’application (a, s) 7→ f (a)f (s)−1 passe
qu quotient, car :
(a, s) ∼ (a′ , s′ ) ⇔ ∃t ∈ S : tas′ = ta′ s,
ce qui entraîne f (a)f (s)−1 = f (a′ )f (s′ )−1 (calcul facile). Le lecteur vérifiera que l’application g obtenue par passage au quotient convient.
(ii) Il suffit d’appliquer la « propriété universelle » ci-dessus au morphisme A → T −1 A car
l’image de S dans T −1 A est formée d’éléments inversibles. Notons que le morphisme obtenu
s’écrit a/s 7→ a/s, mais les deux notations a/s désignent respectivement des classes dans
S −1 A et dans T −1 A !
(iii) Puisque 0 ne divise que lui-même, 0 6∈ T . Si t1 , t2 divisent respectivement s1 , s2 ∈ S ,
alors t1 t2 divise s1 s2 ∈ S et T est une partie multiplicative, qui contient évidemment S , d’où
le morphisme S −1 A → T −1 A. Si tu = s ∈ S , alors l’élément a/t = au/tu de T −1 A est
image de au/s ∈ S −1 A, d’où la surjectivité. Si a/s a pour image 0 ∈ T −1 A, alors il existe
t ∈ T tel que ta = 0 . Prenant s′ ∈ S multiple de t (puisque t ∈ T ), on a s′ a = 0 , donc
a/s = 0 ∈ S −1 A, d’où l’injectivité.
(iv) Le morphisme S −1 A → T −1 A a ici pour but le corps des fractions, et son injectivité se
prouve comme en (iii).
c Dunod 2014
I.1 : Compléments d’algèbre
3
I.1.9 On sait déjà que ιa est un automorphisme de G. La loi de groupes sur Aut(G) est, bien
entendu, la composition et l’élément neutre est IdG . On calcule :
ιa ◦ ιb (x) = a(bxb−1 )a−1 = (ab)x(ab)−1 = ιab (x),
d’où ιa ◦ ιb = ιab , et l’on a bien un morphisme de groupes.
Un élément a du noyau est tel que ιa = IdG , c’est-à-dire x = axa−1 pour tout x : le noyau
est donc le centre de G.
Dire que H est distingué, c’est dire que aHa−1 ⊂ H pour tout a, donc que H est stable par
tous les automorphismes intérieurs.
Rappelons à ce propos que la propriété ∀a ∈ G , aHa−1 ⊂ H implique la propriété apparemment plus forte ∀a ∈ G , aHa−1 = H .
I.1.10 Puisque H ′ est distingué, on a un morphisme G′ → G′ /H ′ . Le noyau du morphisme
composé G → G′ → G′ /H ′ est f −1 (H ′ ) qui est donc bien distingué.
Si l’on prend H = G = un sous-groupe non distingué de G′ et, pour f , l’inclusion canonique,
on obtient un contre-exemple à la deuxième question.
Supposons f surjectif. Pour tout b ∈ G′ , on a b = f (a) avec a ∈ G et :
bf (H)b−1 = f (a)f (H)f (a−1 ) = f (aHa−1 ) ⊂ f (H),
et la réponse est positive : f (H) ⊳ G′ .
I.1.11 On a nZ = mpZ ⊂ mZ et le groupe mZ/nZ est bien défini. Le composé des morphismes
surjectifs x 7→ mx de Z sur mZ et y 7→ y (mod n) de mZ sur mZ/nZ est l’application de
l’énoncé, qui est donc un morphisme surjectif de Z sur mZ/nZ. Pour que a ∈ Z soit dans le
noyau, il faut, et il suffit, que ma ∈ nZ, c’est-à-dire que p divise a. Le noyau est donc pZ,
d’où un isomorphisme x (mod p) 7→ mx (mod n) de Z/pZsur mZ/nZ.
I.1.12 Rappelons que HG′ = {hg ′ | h ∈ H , g ′ ∈ G′ } . Naturellement, e = ee ∈ HG′ (élément
neutre). D’autre part, avec des notations évidentes :
−1 (h1 g1′ )(h2 g2′ ) = h1 (g1′ h2 g1′ ) (g1′ g2′ ) = hg,
−1
où h := h1 (g1′ h2 g1′ ) ∈ H (car celui-ci est distingué) et g := g1′ g2′ ∈ G′ . Ainsi, HG′ est
stable par multiplication. De plus :
(hg ′ )−1 = (g ′
−1 −1 ′
h
g )g ′
−1
−1
= h′′ g ′′ ,
−1
où h′′ := g ′ h−1 g ′ ∈ H (car celui-ci est distingué) et g ′′ := g ′
∈ G′ . Ainsi, HG′ est
stable par passage à l’inverse. C’est donc un sous-groupe de G. Enfin :
(hg ′ )h0 (hg ′ )−1 = h(g ′ h0 g ′
−1
)h−1 ∈ H,
car g ′ h0 g ′ −1 ∈ H (puisque celui-ci est distingué). On en déduit que H est distingué dans
HG′ .
L’élément hg ′ (mod H) de HG′ /H est l’image de g ′ ∈ G′ par le morphisme composé
G′ → HG′ → HG′ /H . Ce morphisme est donc surjectif. De plus, g ′ ∈ G′ est dans le
noyau si, et seulement si, g ′ ∈ H . Le noyau est donc G′ ∩ H , d’où l’isomorphisme g ′
G′
HG′
(mod G′ ∩ H) 7→ g ′ (mod H) de ′
sur
.
G ∩H
H
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
4
I.1.13 Rappelons qu’un élément de torsion d’un groupe abélien (noté additivement) est un élément d’ordre fini. L’élément a := a (mod Z) ∈ C/Z est de torsion si, et seulement
s’il existe m ∈ N∗ tel que ma = 0 , i.e. ma ∈ Z, autrement dit si, et seulement si,
a ∈ Q/Z. L’image d’un élément de torsion par un morphisme est un élément de torsion (car
ma = 0 ⇒ mf (a) = f (ma) = 0 ), et le seul élément de torsion de C est 0 , donc tout
morphisme f de C/Z dans C est trivial sur Q/Z.
Rechercher un morphisme logarithme de C∗ dans C, c’est rechercher une application log de
C∗ dans C qui soit un morphisme de groupe et telle que exp(log x) = x. Il revient au même
1
log tel que E L(x) = x, où l’on a introduit l’application
de chercher le morphisme L =
2iπ
E : z 7→ exp(2iπz). Le morphisme L serait donc nécessairement injectif. Le morphisme E
du groupe additif C sur le groupe multiplicatif C∗ induit par passage au quotient un isomorphisme ε de C/Z sur C∗ . En composant, on obtiendrait donc un morphisme injectif de C/Z
dans C, ce qui est impossible d’après ce qui a été vu plus haut.
I.1.14 Puisque n = mp, on a nZ ⊂ mZ, l’image de l’idéal nZ par le morphisme surjectif
Z → Z/mZ est nulle, et l’on obtient par passage au quotient un morphisme surjectif d’anneaux
Z/nZ → Z/mZ. Son noyau est formé des x (mod nZ) tels que x (mod mZ) = 0 , c’est-àdire tels que x ∈ mZ : ce noyau est donc l’idéal mZ/nZ de Z/nZ.
I.1.15 Il est clair que (X 2 + 1)Z[X] ⊂ Z[X] = A et que (X 2 + 1)Z[X] ⊂ (X 2 + 1)R[X] = J ,
donc que (X 2 + 1)Z[X] ⊂ A ∩ J . Soit réciproquement P ∈ A ∩ J . La division euclidienne
de P ∈ A = Z[X] par le polynôme unitaire X 2 + 1 ∈ Z[X] donne un quotient et un reste
Q, R ∈ Z[X]. Comme c’est aussi une division euclidienne dans R[X] et que P ∈ J , le reste
R est nul, et P = (X 2 + 1)Q ∈ (X 2 + 1)Z[X], d’où l’égalité A ∩ J = (X 2 + 1)Z[X].
R[X]
Le morphisme A →
= R + Ri = C a pour noyau A ∩ J et identifie donc
(X 2 + 1)R[X]
A
Z[X]
=
au sous-anneau Z + Zi de C formé des entiers de Gauß.
A∩J
(X 2 + 1)Z[X]
I.1.16 On sait déjà que la relation (congruence modulo un sous-groupe dans un groupe commutatif)
est compatible avec l’addition. Soient a, b ∈ A tels que a ≡ b (mod I), c’est-à-dire a−b ∈ I .
Alors, pour tout c ∈ A :
ca−cb = c(a−b) ∈ I ⇒ ca ≡ cb
(mod I) et ac−bc = (a−b)c ∈ I ⇒ ac ≡ bc
(mod I).
La relation est donc compatible avec la multiplication. Les mêmes méthodes que dans le
cours permettent alors de munir le groupe quotient A/I d’une (unique) structure d’anneau telle que la projection canonique A → A/I soit un morphisme d’anneaux : on pose
(a (mod I)) (b (mod I)) := (ab (mod I)) .
Soit réciproquement une relation d’équivalence compatible avec l’addition et la multiplication.
En notant I la classe de 0 , on sait déjà que I est un sous-groupe et que notre relation est la
congruence modulo I . La compatibilité avec la multiplication entraîne de plus que I est un
idéal bilatère.
c Dunod 2014
I.1 : Compléments d’algèbre
5
I.1.17 Soit M := (ai,j ) ∈ Mn (K). Alors Ei,j M Ek,l = aj,k Ei,l . Si l’on suppose que M est un
élément non nul d’un idéal bilatère I et que aj,k 6= 0 , on en déduit que I contient tous les
Ei,l et donc que I = Mn (K). (Il est clair a priori qu’un idéal bilatère est en particulier un
sous–espace vectoriel).
Soient ϕ et ψ des endomorphismes de l’espace vectoriel E de dimension infinie. On suppose
que ϕ est de rang fini. Alors ϕ ◦ ψ et ψ ◦ ϕ sont de rang fini (majoré par celu de ϕ), d’où la
stabilité de l’ensemble des endomorphismes de E de rang fini par multiplication dans LK (E).
L’endomorphisme nul est de rang fini. Si ϕ et ψ sont tous deux de rang fini, leur somme est
de rang fini (majoré par la somme des deux rangs) et −ϕ également. On a donc bien un idéal
bilatère. Il n’est pas nul, car il contient les projections sur des droites, ni égal à LK (E), car
IdE n’est pas de rang fini.
E+F
si, et seulement si, x ∈ F . Le noyau est donc
F
E
dans
bien E ∩ F , d’où, par passage au quotient, une application linéaire injective de
E∩F
E+F
E+F
. Si e ∈ E, f ∈ F , l’élément (e + f ) (mod F ) de
admet pour antécédent e
F
F
E
(mod E ∩ F ) dans
, et le morphisme est surjectif.
E∩F
Remarquons que, si tous ces espaces sont de dimension finie, on en déduit la formule :
I.1.18 L’élément x ∈ E a pour image 0 ∈
dimK E − dimK (E ∩ F ) = dimK (E + F ) − dimK F.
Sous une forme encore plus utile :
dimK (E + F ) = dimK E + dimK F − dimK (E ∩ F ).
I.1.19 On a vu dans [L1] que K[X] = <P > ⊕ Kn−1 [X], la décomposition A = P Q + R étant
obtenue par division euclidienne. Cette décomposition est d’ailleurs valable pour n = 0 , car on
a alors <P > = K[X] et Kn−1 [X] = {0} . On a donc un isomorphisme d’espaces vectoriels :
K[X]/<P > ≃ Kn−1 [X]. Comme tout idéal non nul de K[X] est de la forme <P > avec P
unitaire de degré n > 0 , la conclusion s’ensuit.
I.1.20 Écrivons H1 := Ker λ1 , . . . , Hk := Ker λk , où λ1 , . . . , λk sont des formes linéaires non
nulles sur le K -espace vectoriel E . Alors H1 ∩ . . . ∩ Hk est le noyau de l’application linéaire Λ := (λ1 , . . . , λk ) de E dans K k . D’après le théorème du rang, la codimension de
H1 ∩ . . . ∩ Hk est égale au rang de Λ . Cette codimension vaut donc k si, et seulement si, Λ
est surjective.
Par ailleurs, Λ n’est pas surjective si, et seulement si, son image est contenue dans un hyperplan
de K k , c’est-à-dire si, et seulement s’il existe une équation non triviale a1 x1 + · · · + ak xk = 0
sur K k satisfaite par tous les éléments de Im Λ , c’est-à-dire si, et seulement si, λ1 , . . . , λk
sont liées.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
6
I.1.21 Notons C := (u1 , . . . , uk ) et D := (v1 , . . . , vℓ ).
(i) On choisit des représentants vj ∈ E des vj ∈ E/F et l’on pose D := (v1 , . . . , vℓ ). Si la
famille D était liée, son image D par la projection E → E/F le serait. Elle est donc libre.
Soit G l’espace vectoriel qu’elle engendre (c’en est donc une base).
P
P
Tout élément de F ∩ G s’écrit
λj vj et a pour image
λj vj = 0 ∈ E/F ; on a donc
λ1 = · · · = λℓ = 0 et l’on en déduit que F ∩ G = {0} .
P
P
Soit x ∈ E . Alors x ∈ E/F s’écrit x = λj vj , de sorte que x− λj vj ∈ F , et x ∈ F +G
et l’on en déduit que E = F + G.
Ainsi, B = (u1 , . . . , uk , v1 , . . . , vℓ ) est bien une base de E = F ⊕ G.
(ii) Pour que F soit stable par f , il faut, et il suffit, que f (u1 ), . . . , f (uk ) ∈ F , i.e. que les k
premières colonnes de la matrice M n’aient que des coefficients nuls sur les ℓ dernières lignes.
Les coefficients des k premières lignes constituent alors la matrice A ∈ Mk (K) de fF dans
la base C , et M a la forme :
A B
M=
.
0 C
Les matrices B ∈ Mk,ℓ (K) et C ∈ Mℓ (K) ont pour coefficients les coordonnées de
f (v1 ), . . . , f (vℓ ) dans la base B , les coefficients de C correspondant aux composantes dans
D . La matrice C est donc la matrice de l’endomorphisme f de E/F obtenu par passage au
quotient relativement à la base D .
I.1.22 Puisque :
I = 2A = 2Z[X] = {2P | P ∈ Z[X]} et que J = XA = XZ[X] = {XP | P ∈ Z[X]},
on a I + J = 2A + XA = {2P + XQ | P, Q ∈ Z[X]} = <2, X>. Le polynôme
F := 2P + XQ est tel que F (0) = 2P (0) ∈ 2Z. Réciproquement, si F (0) = 2p, p ∈ Z, alors
F − F (0)
F = 2P + XQ avec P = p et Q =
éléments de Z[X].
X
Il est évident que IJ = (2A)(XA) = 2XA ⊂ I ∩ J . Mais, si F = I ∩ J , ses coefficients sont
pairs et le coefficient constant est nul, donc F est multiple de 2X (dans ( Z[X]) : on a bien
IJ = I ∩ J = 2XA.
Pour tout idéal principal K := P A = P Z[X], on a KB = P Z[X]Q[X] = P Q[X] = P B .
Ainsi IB = 2B = B (car 2 est inversible dans Q donc dans Q[X]) et JB = XB .
On calcule : A/I = Z[X]/2Z[X] ≃ (Z/2Z)[X] = F2 [X], et A/J = Z[X]/XZ[X] ≃ Z.
Dans les deux cas, on peut le vérifier en calculant les noyaux des morphismes surjectifs
A → F2 [X] et A → Z.
Le quotient A/(I + J) peut se calculer en quotientant successivement A par I , ce qui donne
F2 [X] ; et le résultat par l’image de J , i.e. XF2 [X], ce qui donne F2 . On peut aussi quotienter
d’abord par J , résultat Z ; puis par l’image 2Z de I , résultat F2 .
Enfin, (I + J)2 est l’idéal engendré par {2, X}2 = {4, 2X, 2X, X 2} = {4, 2X, X 2} , d’où
(I + J)2 = 4A + 2XA + X 2 A. Par ailleurs, I 2 = 4A, IJ = 2XA et J 2 = X 2 A, d’où
I 2 + IJ + J 2 = 4A + 2XA + X 2 A = (I + J)2 .
P
I.1.23 Il est évident que les xi yj appartiennent à IJ . Tout élément de IJ est de la forme
ik jk ,
où les ik sont dans I , donc combinaisons linéaires des xi , et où les jk sont dans J , donc
c Dunod 2014
I.1 : Compléments d’algèbre
7
combinaisons linéaires des yj . Tout élément de IJ est donc combinaison linéaire des xi yj .
Le carré de I := <a, b> est donc engendré par {a, b}{a, b} = {a2 , ab, ba, b2} = {a2 , ab, b2 } .
Prouvons par récurrence que I n est engendré par {an , an−1 b, . . . , abn−1 , bn } . Il suffit de voir
que {an+1 , an b, . . . , abn , bn+1 } = {a, b}{an, an−1 b, . . . , abn−1 , bn } , ce qui est aisé.
√
√
√
Dans le cas de l’idéal I = <1 + −5, 1 − −5> de l’anneau A = Z[ −5], on trouve :
√
√
I 2 = < − 4 + 2 −5, 6, −4 − 2 −5>.
√
√
Cet idéal contient −(−4 + 2 −5) − 6 − (−4 − 2 −5) = 2 , et ses générateurs sont multiples
de 2 , donc I 2 = <2>. Si I était principal de générateur u , ce serait en particulier un diviseur
√
√
de 1 + −5 + 1 − −5 = 2 . Écrivant 2 = uv et utilisant, comme dans le texte, la norme
algébrique, on aurait une décomposition 4 = (a2 +5b2 )(c2 +5d2 ) dans Z, ce qui n’est possible
que si l’un des facteurs vaut 1 et l’autre 4 . On voit donc que u est (à un inversible près) 1 ou
2 . le deuxième cas est impossible car 2 ne divise pas les générateurs de I . Le premier cas
signifierait que I = <1>, ce qui contredirait le calcul de I 2 .
I.1.24 (i) Voici une preuve sans calcul de la première assertion : le morphisme surjectif naturel de
A1 × A2 sur A1 /I1 × A2 /I2 a pour noyau I1 × I2 .
Soit I un idéal quelconque de A1 × A2 et soient I1 , I2 ses images par les projections sur
A1 , A2 . Comme les projections sont des morphismes surjectifs, I1 et I2 sont des idéaux.
Il est évident que I ⊂ I1 × I2 . Soient i1 ∈ I1 , i2 ∈ I2 : il existe donc a1 , a2 tels que
(i1 , a2 ), (a1 , i2 ) ∈ I . Alors (i1 , i2 ) = (1, 0)(i1 , a2 ) + (0, 1)(a1 , i2 ) ∈ I .
(ii) et (iii) De l’égalité (1, 0)(0, 1) = (0, 0), on déduit d’abord qu’un produit d’anneaux
B1 × B2 ne peut être intègre que si B1 ou B2 est trivial ; et donc que B1 × B2 est intègre
(resp. un corps) si, et seulement si, B2 est trivial et B1 intègre (resp. un corps), ou vice-versa.
Soit I = I1 × I2 un idéal de A1 × A2 et notons B1 := A1 /I1 , B2 := A2 /I2 . Il découle
de ce qui précède que I est premier (resp. maximal) si, et seulement si, I1 est premier (resp.
maximal) et I2 = A2 , ou vice-versa.
I.1.25 Soit P = P1r1 · · · Pkrk la décomposition de P en facteurs premiers. D’après le lemme
chinois :
K[X]/ < P >≃ K[X]/<P1r1 > × · · · × K[X]/<Pkrk >·
Si r1 = · · · = rk = 1 (c’est-à-dire si P est produit de facteurs premiers distincts), c’est
un produit de corps. Sinon, si ri > 2 , alors x := Pi (mod Piri ) est un élément nilpotent
non trivial de K[X]/<Piri > , et (0, . . . , x, . . . , 0) (où x est en i ème position) est un élément
nilpotent non trivial de K[X]/ < P > , qui ne peut donc être un produit de corps. (Un produit
de corps est un anneau réduit.)
I.1.26 (i) Notons x := cl(X), De l’égalité K[X] = K1 [X] ⊕ <X 2 + X + 1>, on déduit que
(1, x) est une base du F2 -espace vectoriel F2 [X]/<X 2 + X + 1> , dont les éléments sont
0, 1, x, y := 1 + x. La table d’addition est celle de (Z/2Z)2 . Pour dresser la table de multiplication, il suffit de calculer :
x2 = 1 + x = y , xy = x + x2 = 1 , y 2 = 1 + x2 = x.
On vérifie que le groupe multiplicatif de ce corps est cyclique d’ordre 3 .
(ii) Tout polynôme irréductible P de degré 3 sur F2 fournira un corps à 8 éléments
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
8
F2 [X]/<P > . Pour être irréductible, il suffit qu’un polynôme de degré 3 n’ait pas de racines.
Sur F2 , on trouve les polynômes X 3 + X 2 + 1 et X 3 + X + 1 .
De même, tout polynôme irréductible P de degré 2 sur F3 fournira un corps à 9 éléments
F3 [X]/<P > . Pour être irréductible, il suffit qu’un polynôme de degré 2 n’ait pas de racines.
Sur F3 , on trouve les polynômes X 2 + 1 , X 2 + X − 1 et X 2 − X + 1 (et leurs opposés).
I.1.27 (i) Le morphisme d’anneaux f 7→ f (x) est surjectif de A sur le corps R, son noyau Mx
est donc un idéal maximal.
(ii) On prouve la dichotomie par l’absurde, en niant l’assertion à prouver : s’il y avait une fonc
a+b
tion f ∈ I qui ne s’annule pas sur a,
et une fonction g ∈ I qui ne s’annule pas sur
2
a+b
, b la fonction f 2 + g 2 ∈ I serait strictement positive sur [a, b], donc ne s’y annulerait
2
pas, donc elle serait inversible dans A et l’on aurait I = A, contredisant l’hypothèse.
En itérant, on choisit à chaque étape un segment [an , bn ] qui est la moitié gauche ou la moitié droite de [an−1 , bn−1 ], et tel que toute fonction f ∈ I s’annule en au moins un point
xn,f ∈ [an , bn ]. L’intersection des [an , bn ] est un singleton {x} ⊂ [a, b] (segmente emboités
de longueur tendant vers 0 ) et, pour tout f ∈ I , on a :
∀n > 0 , f (xn,f ) = 0 et
lim xn,f = x,
n→+∞
d’où f (x) = 0 . On en déduit que I ⊂ Mx .
Puisque tout idéal propre de A est inclus dans l’un des Mx , ces derniers sont les seuls idéaux
maximaux de A.
(iii) Nous laissons au lecteur le soin de démontrer que I est bien un idéal de B . Il s’agit de
vérifier que, pour tout x ∈ ]a, [ b , il existe une fonction de I qui n’est pas dans Mx , c’està-dire une fonction non nulle en x et nulle en dehors d’un segment [c, d] ⊂]a, b[. Il suffit de
a+x
x+b
prendre c :=
, d :=
et pour f la fonction nulle hors de [c, d], affine de (c, 0) à
2
2
(x, 1) et encore affine de (x, 1) à (d, 0) (tente).
I.1.28 Si a est inversible, le seul idéal qui le contient est A, qui n’est pas maximal (les idéaux
maximaux sont propres par définition). Si a n’est pas inversible, l’idéal <a> est propre, donc,
d’après le théorème de Krull, contenu dans un idéal maximal M et a ∈ M.
Supposons A local, d’idéal maximal M. Les éléments de M sont non inversibles (car M est
propre) et les éléments de A \ M sont inversibles (sinon, ils seraient contenus dans M d’après
le résultat précédent). L’ensemble des éléments non inversibles est donc M, donc il est stable
pour l’addition. Réciproquement, supposons que l’ensemble des éléments non inversibles est
stable pour l’addition. Cet ensemble est également stable par multiplication externe (c’est la
contraposée de l’implication : ab inversible entraîne a inversible). L’ensemble des éléments
non inversibles est donc un idéal M. Comme tout idéal propre est formé d’éléments non inversibles, tout idéal propre est inclus dans M, qui est donc l’unique idéal maximal.
Les éléments inversibles de Z/pk Z (resp. de K[X]/<X k > ) sont les classes des éléments de Z
(resp. de K[X]) étrangers à pk , donc à p (resp. à X k , donc à X ). Les éléments non inversibles
de Z/pk Z (resp. de K[X]/<X k >) sont donc les classes des multiples de p (resp. de X ) et
forment l’idéal pZ/pk Z (resp. XK[X]/<X k >). L’anneau Z/pk Z (resp. K[X]/<X k > ) est
donc local.
c Dunod 2014
I.1 : Compléments d’algèbre
9
I.1.29 Tout d’abord, S −1 I est bien un idéal, car :
a, a′ ∈ I ⇒ a/s + a′ /s′ = (as′ + a′ s)/ss′ ∈ S −1 I
et (a/s)(b/t) = (ab)/(st) ∈ S −1 I.
Il est clair que i(I) = {a/1 | a ∈ I} ⊂ S −1 I . Enfin, l’égalité a/s = (1/s)(a/1) montre que
l’idéal engendré par i(I) contient S −1 I .
I.1.30 Puisque P ∩ S = ∅ , aucun a/s ∈ S −1 P n’est égal à 1 , et c’est un idéal propre. Si
(b/t)(c/u) ∈ S −1 P , on écrit (b/t)(c/u) = a/s avec a ∈ P , d’où s′ (bcs − atu) = 0 , d’où
s′ sbc ∈ P , d’où b ou c ∈ P , d’où b/t ou c/u ∈ S −1 P , qui est bien premier.
Remarquons de plus, pour la suite, que a/1 ∈ S −1 P entraîne s′ (at − b) = 0 , avec b ∈ P ,
d’où l’on tire a ∈ P : on a donc i−1 S −1 P = P .
Soit Q un idéal premier de S −1 A. Si P := i−1 (Q) rencontrait S , son image par i , qui est
dans Q, contiendrait des inversibles, ce qui n’est pas possible.
Avec ces notations, On a évidemment i(P) ⊂ Q, d’où S −1 P ⊂ Q. D’autre part, tout a/s ∈ Q
est tel que a ∈ P (facile et laissé au lecteur), d’où enfin S −1 P = Q.
Nous avons bien prouvé que les deux applications considérées sont réciproques l’une de l’autre.
I.1.31 Puisque x n’est pas nilpotent, l’ensemble S := {xn | n ∈ N} est multiplicatif et ne
contient pas 0 et l’anneau S −1 A n’est pas trivial. Il contient donc un idéal maximal, donc
premier, Q. D’après l’exercice I.1.30, l’image réciproque de Q dans A est un idéal premier
qui ne rencontre pas S , donc qui ne contient pas x. Ainsi, pour tout élément non nilpotent, il
existe un idéal premier qui ne le contient pas ; autrement dit, l’intersection des idéaux premiers
de A est incluse dans le radical. (L’inclusion réciproque est la partie facile du théorème.)
I.1.32 Notons x := x (mod I). Alors :
√
x ∈ I ⇔ ∃n : xn ∈ I ⇔ ∃n : xn = 0 ⇔ x ∈ rad(A/I),
où l’on a noté rad(A/I) le nilradical de cet anneau. On a ainsi prouvé que la racine de I
est l’image réciproque du nilradical (c’est-à-dire du radical) de A/I , donc l’image réciproque
de l’intersection des idéaux premiers de A/I , donc l’intersection des images réciproques des
idéaux premiers de A/I , donc l’intersection des idéaux premiers de A contenant I .
I.1.34 (i) L’élément (a1 , a2 ) ∈ A1 ×A2 est inversible si, et seulement s’il existe (b1 , b2 ) ∈ A1 ×A2
tel que (a1 , a2 )(b1 , b2 ) = (1, 1), i.e. a1 b1 = 1 et a2 b2 = 1 (noter que le premier 1 désigne le
neutre de A1 , le deuxième, le neutre de A2 ). L’égalité (A1 × A2 )∗ = A∗1 × A∗2 en découle.
(ii) Le lemme chinois assure que, si m, n ∈ N sont premiers entre eux, l’anneau Z/mnZ
est isomorphe à l’anneau (Z/mZ) × (Z/nZ) ; d’après (i), le groupe (Z/mnZ)∗ est alors
isomorphe au groupe (Z/mZ)∗ × (Z/nZ)∗ . On retrouve l’égalité ϕ(mn) = ϕ(m)ϕ(n) en
comparant les cardinaux.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
10
I.1.35 Il est clair que X 4 −1 = (X −1)(X +1)(X 2 +1) et que ces trois facteurs sont irréductibles
dans Q[X] et primitifs, donc irréductibles dans Z[X].
La seule décomposition (à facteurs constants près) de X 4 + 1 dans R[X] est
√
√
√
X 4 + 1 = (X 2 + 2X + 1)(X 2 − 2X + 1). Comme aucun C(X 2 + 2X + 1), C ∈ R∗
n’est dans Q[X], le polynôme X 4 + 1 est irréductible dans Q[X]. Comme il est primitif, il est
irréductible dans Z[X].
On a X 4 + X 2 + 1 = (X 2 + X + 1)(X 2 − X + 1), et les deux facteurs sont irréductibles dans
Q[X] (et même dans R[X]) et primitifs, donc irréductibles dans Z[X].
Le polynôme P
:= X 4 + aX 2 − 1 est primitif. Dans une décomposition
P = QR, P, Q ∈ Z[X], le produit des coefficients dominants valant 1 , on peut supposer
Q et R unitaires (sinon, prendre leurs opposés). Pour une raison similaire, Q(0) = −ε et
R(0) = ε , où ε ∈ {+1, −1} . Si par exemple Q est de degré 1 , on voit que ε est racine de P ,
i.e. que a = 0 , ce qui est exclu.
On écrit donc Q = X 2 + bX − ε et R = X 2 + cX + ε . Par identification, on obtient les équations : b + c = 0 , bc = a et ε(b − c) = 0 . De la première et la troisième, on tire b = c = 0 ,
puis, de la deuxième, a = 0 , contradiction.
I.1.36 Le noyau est formé des polynômes de A[X] dont tous les coefficients sont dans Ker f .
I.1.37 Si an = 0 , le polynôme
n−1
P
i=0
(−aX)i est inverse de 1 + aX . Si P := a0 + · · · + ad X d
est inverse de 1 + aX , on a (par identification) les équations a0 = 1 , ai a + ai+1 = 0 pour
0 6 i 6 d − 1 et ad a = 0 . On en déduit par récurrence ai = (−a)i , puis ad+1 = 0 .
Si a n’est pas nilpotent, 1 + aX n’étant pas inversible, il est contenu dans un idéal premier
Q de A[X] (en fait, un idéal maximal : théorème de Krull). L’idéal premier P de A ne peut
contenir a (sinon, on aurait a ∈ Q, donc 1 ∈ Q). On achève le raisonnement comme dans
l’exercice I.1.31 de la page 54.
a
(fraction irréductible). Le noyau contient évidemment l’idéal <bX − a> .
b
Cet idéal est engendré par un élément primitif de degré 1 , donc premier. Si P (x) = 0 , P appartient à l’idéal engendré par bX−a dans Q[X], donc un multiple N P (avec N ∈ N∗ ) appartient à <bX −a>. Comme N est premier avec bX −a (démontrez-le !), on a P ∈ <bX −a>.
Le noyau est donc <bX − a> .
I.1.38 Écrivons x =
I.1.39 Les axiomes disent que la loi d’anneau (x, y) 7→ x ⋆ y est une application bilinéaire de
V × V dans V .
I.1.40 Le noyau de ϕ est un idéal propre de K (s’il n’était pas propre, on aurait 1A = ϕ(1K ) = 0
et A serait trivial), donc, puisque K est un corps, Ker ϕ = {0} . On identifie donc K à son
image, ce qui revient à supposer que K ⊂ A. La structure de K -algèbre sur A s’obtient en
posant :
∀λ ∈ K , ∀x ∈ A , λ.x := λ ⋆ x( multiplication de A).
L’axiome ∀λ ∈ K , ∀x, y ∈ A , x ⋆ (λ.y) = λ.(x ⋆ y) dit alors que les éléments de K
commutent avec ceux de A, c’est-à-dire que K est central.
c Dunod 2014
I.1 : Compléments d’algèbre
11
I.1.41 On notera, dans chaque cas, x la classe de X . Chacune des trois K -algèbres admet, en
tant que K -espace vectoriel, la base (1, x) et sa structure de K -espace vectoriel est celle de
K ⊕ Kx ≃ K 2 . Dans la table de multiplication de 1, x, seul le carré x2 nécessite un calcul.
(i) Dans la K -algèbre K[X]/<X 2 − 1>, on a x2 = 1 . Cette algèbre n’est pas intègre, puisque
X 2 −1 est réductible. Les idéaux de K[X] contenant X 2 −1 , sont : <1>, <X−1>, <X+1>
et <X 2 − 1>. Les idéaux de K[X]/<X 2 − 1> sont donc : <1>, <x − 1> , <x + 1> et
<x2 − 1> = <0> . Les idéaux premiers sont <x − 1> et <x + 1>, et ce sont aussi les idéaux
maximaux.
Si K est de caractéristique 2 , ils sont égaux et le radical est <x − 1> : en fait, l’élément x − 1
est de carré nul dans ce cas. On peut même remarquer que l’automorphisme P (X) 7→ P (X +1)
fournit par passage au quotient (toujours dans ce cas) un isomorphisme de K[X]/<X 2 − 1>
sur K[X]/<X 2 > .
Si K est de caractéristique différente de 2 , le radical est <0> et l’algèbre est réduite. En fait,
dans ce cas, le lemme chinois fournit un isomorphisme :
K[X]/<X 2 − 1> ≃ K[X]/<X − 1> × K[X]/<X + 1>,
c’est-à-dire K[X]/<X 2 − 1> ≃ K × K .
(ii) Dans la K -algèbre K[X]/<X 2 > , on a x2 = 0 . Cette algèbre n’est pas intègre, puisque
X 2 est réductible, ni même réduite, puisque x est nilpotent d’ordre 2 . Les idéaux de K[X]
contenant X 2 , sont : <1> , <X> et <X 2 > . Les idéaux de K[X]/<X 2 > sont donc : <1>,
<x> et <x2 > = <0> . Le seul idéal premier est <x> et c’est aussi un idéal maximal. Le
radical est <x> .
(iii) Dans la K -algèbre K[X]/<X 2 + 1> , on a x2 = −1 . Il y a deux cas à considérer. Si −1
est un carré dans K , cette algèbre n’est pas intègre, puisque X 2 + 1 est réductible. Dans ce cas,
l’étude ressemble en tous points à celle de K[X]/<X 2 − 1> , y compris la discussion sur la
caractéristique de K . En fait, il y a même un isomorphisme explicite entre ces deux algèbres,
obtenu par passage au quotient à partir de l’automorphisme P (X) 7→ P (iX) de K[X], où
i ∈ K est un élément de carré −1 .
Si −1 n’est pas un carré dans K , l’idéal <X 2 + 1> de K[X] est premier non nul, donc
maximal, et K[X]/<X 2 + 1> est un corps. L’étude est alors triviale.
I.1.42 Comme dans toute algèbre, l’application λx : y 7→ xy est linéaire quel que soit x. Si
x 6= 0 , l’hypothèse d’intégrité dit que cette application est injective. Comme c’est un endomorphisme d’espace vectoriel en dimension finie, elle est bijective, ce qui est équivalent à dire que
x est inversible.
I.1.43 Si K est de caractéristique 0 , pour tout polynôme P := aX n + · · · de degré exactement
n, l’endomorphisme P (D) ∈ LK (E) envoie X n ∈ E sur un polynôme de terme constant
n!a 6= 0 , donc P (D) 6= 0 : l’élément D de la K -algèbre LK (E) n’est donc pas algébrique.
En toutes caractéristiques, l’image de X n par Dp est 0 si n < p, et p! np X n−p sinon. Si K
est de caractéristique p > 0 , on en déduit que Dp = 0 , donc D est un élément nilpotent, donc
algébrique.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
12
I.1.44 Si µx désigne le polynôme annulateur de x, on a : C[x] ≃ C[X]/<µx > et, pour appliquer
le théorème chinois, il suffit de décomposer µx en facteurs primaires (c’est-à-dire puissances
de facteurs premiers distincts).
Si x est la matrice scalaire λI2 , µx = X − λ et C[x] ≃ C[X]/<X − λ> ≃ C. En fait, dans
ce cas, C[x] = CI2 .
Si x admet deux valeurs propres λ, µ (et n’est donc évidemment pas scalaire),
µx = (X − λ)(X − µ), et l’on peut appliquer le théorème chinois :
C[x] ≃ C[X]/<(X − λ)(X − µ)> ≃ C[X]/<X − λ> × C[X]/<X − µ> ≃ C × C.
Si x n’est pas scalaire mais admet pour seule valeur propre λ, µx = (X − λ)2 et
C[x] ≃ C[X]/<(X − λ)2 > n’admet pas de description beaucoup plus simple. On peut cependant remarquer que l’automorphisme P (X) 7→ P (X + λ) de C[X] passe au quotient en
un isomorphisme C[X]/<(X − λ)2 > ≃ C[X]/<X 2 > .
I.1.45 (i) On a un morphisme d’algèbres en vertu des calculs suivants :
λax+a′ x′ (y) = (ax + a′ x′ )y = axy + a′ x′ y = aλx (y) + a′ λx′ (y) = (aλx + a′ λx′ )(y)
λxx′ (y) = xx′ y = λx λx′ (y) = (λx ◦ λx′ )(y).
et
Si x est dans le noyau, λx = 0 , d’où x = λx (1) = 0 : le morphisme est donc injectif.
L’affirmation concernant les polynômes minimaux est valable pour tout morphisme injectif
d’algèbre : si ϕ est un tel morphisme, on a P (x) = 0 ⇔ P ϕ(x) = ϕ P (x) = 0 .
(ii) Puisque ϕ : x 7→ λx est un morphisme et que le déterminant est multiplicatif, la norme
l’est également.
Remarquons que N (1) = 1 (déterminant de l’identité). Si x est inversible, alors
xx′ = 1 ⇒ N (x)N (x′ ) = N (xx′ ) = 1 , donc N (x) 6= 0 . Supposons réciproquement que
N (x) 6= 0 . Alors λx est inversible. Cependant, même pour un morphisme injectif, ϕ(x) inversible n’entraîne pas que x est inversible : penser à l’inclusion de K[X] dans K(X). Ici, on
raisonne comme suit : λx étant inversible, c’est un endomorphisme surjectif et il existe y tel
que λx (y) = 1 , i.e. xy = 1 , donc x est inversible.
(iii) Si A = K[X]/<X 2 − d> , on prend pour base 1, δ := cl(X) et la matrice de la multipli
a bd
cation par x := a + bδ dans cette base est
, d’où N (x) = a2 − db2 .
b a
√
Si K = Q et A = Q[ d] on doit distinguer deux cas. Si d est un carré dans Q , alors
A = Q = K et N (x) = x. Sinon, on est ramené au cas précédent.
Si K = R et A = C, on est encore dans le premier cas, avec d = −1 et δ = i, d’où
N (a + bi) = a2 + b2 .
Si K = R et A = H , on prend pour base 1, i, j, k. La matrice de la multiplication par


a −b −c −d
 b a −d c 
 . Avec un peu de courage, on
x := a + bi + cj + dk, dans cette base est : 
c d
a −b 
d −c b
a
2
2
2
2 2
trouve que le déterminant est (a + b + c + d ) . (On peut se simplifier la vie de la manière
suivante : notant M cette matrice, on constate que M tM = (a2 + b2 + c2 + d2 )I4 . En fait,
cela revient à mettre à profit l”egalité xx = a2 + b2 + c2 + d2 .)
c Dunod 2014
I.1 : Compléments d’algèbre
13
I.1.46 (i) Plutôt que de plagier la démonstration du [L1], en voici une autre. Supposons que
xn + a1 xn−1 + · · · + an = 0 et y p + b1 y p−1 + · · · + bp = 0 . Alors le sous–espace vectoriel de A engendré par les xi y j , 0 6 i 6 n − 1 , 0 6 j 6 p − 1 , est stable par multiplication
par x et par y (c’est ici qu’intervient l’hypothèse de commutation), d’où l’on déduit que c’est
une sous-algèbre de dimension finie, dont tous les éléments sont donc algébriques, en particulier x + y et xy .
(ii) Si x := αi + βj + γk est algébrique, alors −x2 = α2 + β 2 + γ 2 l’est également d’après
la question (i). Réciproquement, toute équation algébrique satisfaite par −x2 = α2 + β 2 + γ 2
fournit ipso facto une équation algébrique satisfaite par x.
Soient x := αi + βj + γk et x′ := α′ i + β ′ j + γ ′ k de norme 1 , c’est-à-dire tels que
2
2
2
α2 + β 2 + γ 2 = α′ + β ′ + γ ′ = 1 . Ils sont donc algébriques. Pour que x + x′ soit algébrique, il faut, et il suffit, que αα′ + ββ ′ + γγ ′ soit algébrique. Les contre-exemples abondent.
Par exemple, x := i , α′ transcendant et petit (mettons 1/π ), γ ′ := 0 et β ′ ajusté pour avoir
la norme 1 .
P
I.1.47 Si f ∈ A[[X]] est inversible, f g = 1 ⇒ f (0)g(0) = 1 et f (0) ∈ A∗ . Si f :=
an X n
P
∗
avec a0 ∈ A , le système des équations a0 b0 = 1 et, pour tout n > 1 ,
ai bj = 0 (qui
i+j=n
P
disent que f g = 1 , où g :=
bn X n ) peut être résolu par les mêmes formules que dans le
n−1
−1 P
texte : b0 := a−1
an−i bi .
0 et, pour tout n > 1 , bn := −a0
i=0
Supposons A intègre. Soient f, g ∈ A[[X]] non nuls. Ils sont donc de la forme :
P
P
P
f :=
an X n avec ap 6= 0 et g :=
bn X n avec bq 6= 0 . Alors f g =
cn X n , avec
n>p
n>q
n>r
r := p + q et cr := ap bq 6= 0 (puisque A est intègre). Donc f g 6= 0 , et A[[X]] est intègre. En
fait, si K désigne le corps des fractions de A, on peut identifier A[[X]] à un sous-anneau de
l’anneau intègre K[[X]].
I.1.48 On écrit :
√
1 i 3
1 − X3
2
2iπ/3
1+X +X =
= (1 − jX)(1 − j X), où j := e
=− +
,
1−X
2
2
2
d’où :
2 −1
(1 + X + X )
ce qui donne a =
j
j − j2
a
b
=
+
1 − jX
1 − j2X
et b =
avec
(
a + b = 1,
aj 2 + bj = 0,
j2
, d’où enfin :
−j
j2
(1 + X + X 2 )−1 =
X j n+1 − j 2n+2
X n.
j − j2
n>0
I.1.49 Puisque f ∈ Gk ⇒ f (0) = 1 , il est clair que Gk est inclus dans K[[X]]∗ ; il est tout
aussi clair que 1 ∈ Gk . Remarquons que f ∈ Gk ⇔ f − 1 ∈ <X k > . Si f, g ∈ Gk , on
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
14
écrit : f g − 1 = f (g − 1) + (f − 1) ∈ <X k > , d’où f g ∈ Gk . Enfin, si f ∈ Gk , on écrit
f −1 − 1 = −f −1 (f − 1) ∈ <X k > , d’où f −1 ∈ Gk . On a donc bien un sous-groupe. De plus,
l’inclusion Gk+1 ⊂ Gk est évidente.
Considérons l’application a 7→ (1+aX k ) (mod Gk+1 ) de K dans Gk /Gk+1 . Des relations :
(1 + aX k )(1 + bX k ) = 1 + (a + b)X k + abX 2k = 1 + (a + b)X k (1 + abX 2k + · · · )
≡ 1 + (a + b)X k
(mod Gk+1 ),
on déduit que c’est un morphisme de groupes. Pour que a appartienne au noyau, il faut, et il
suffit, que 1 + aX k ∈ Gk+1 , c’est-à-dire que a = 0 . Le morphisme est donc injectif. Enfin,
des relations :
1 + aX k + bX k+1 + · · · = (1 + aX k )(1 + bX k+1 + · · · ) ≡ 1 + aX k
(mod Gk+1 ),
on déduit que c’est un morphisme surjectif, donc un isomorphisme.
I.1.50 Ce qui suit est en fait valable sur tout corps algébriquement clos de caractéristique nulle.
Écrivons la décomposition en éléments simples de R ∈ C(X) sous la forme :
R=E+
m0
X
a0,i
i=1
Xi
+
mλ
XX
λ∈P i=1
aλ,i
,
(X − λ)i
où E ∈ C[X] est la partie entière et où P est l’ensemble des pôles non nuls de R . Par convention, si 0 n’est pas un pôle de R , on prend m0 := 0 , et le second terme est absent ; dans ce
cas, le développement en série de Laurent de R est une série entière. Si 0 est un pôle, m0 > 1
m
P0 a0,i
.
et la partie polaire du développement en série de Laurent de R est la somme
i
i=1 X
Pour la composante en degrés positifs ou nuls du développement en série de Laurent, la contriaλ,i
bution de E est explicite, et il faut calculer celle des termes
· De l’exercice 21 de la
(X − λ)i
page 37, on déduit l’égalité :
X n + i − 1
a
a(−1)i λ−i−n X n .
=
(X − λ)i
k
n>0
En prenant λ ∈ P , i ∈ [[1, mλ ]] et a := aλ,i , on obtient tous les termes voulus.
(k) 2
(k) (k)
(k+1) (k−1)
I.1.51 L’identité admise est Hn Hn+2 −Hn
Hn+2 = Hn+1 ; on en trouvera par exemple
une preuve dans le livre “Problems and Theorems in Analysis, vol. II” de G. Polya et G. Szegö,
Springer-Verlag, 1976.
(k+1)
L’hypothèse est que l’on a, pour n ∈ [[m, m + r − 1]] : Hn
= 0 , donc (d’après l’identité
(k) (k)
(k) 2
(k)
de Hadamard), Hn Hn+2 = Hn+1 . Ainsi, si Hn = 0 avec n ∈ [[m, m + r − 1]],
(k)
(k)
(k)
alors Hn+1 = 0 ; et si si Hn+2 = 0 avec n ∈ [[m, m + r − 1]], alors Hn+1 = 0 . La
première conclusion s’ensuit. La deuxième est alors conséquence immédiate de l’exercice 19
de la page 34.
I.1.52 Si une série de K[[X]] est le développement d’une fraction rationnelle de L(X), elle vérifie
le critère de l’exercice I.1.51 de la page 55. Si elle vérifie ce critère, c’est le développement
d’une fraction rationnelle de K(X).
c Dunod 2014
I.1 : Compléments d’algèbre
15
I.1.53 Si D est une dérivation de la K -algèbre K[[X]] telle que D(X) = h, on a
D(f ) = f ′ h pour tout polynôme f (calcul direct). On en déduit en particulier que
D(X N f ) = N X N −1 hf + X N D(f ) pour toute série formelle f , donc due D est continue.
L’égalité D(f ) = f ′ h reste donc vraie pour toute série formelle f .
P
I.1.54 Écrivant f =
an X n , on voit que a0 = 0 , a1 = 1 et, pour n > 2 , (n − 1)an−1 = an ,
P
d’où, par récurrence : an = (n − 1)!. On a donc en fin de compte : f =
n! X n+1 .
n>0
Cette série formelle de rayon de convergence 0 est appelée série d’Euler. Elle joue un rôle particulier dans la théorie des équations différentielles analytiques complexes dites « irrégulières » ;
voir dans [MPA] le chapitre correspondant ainsi que le chapitre sur les développements asymptotiques complexes.
I.1.55 Soit (un ) une suite d’éléments deux à deux distincts de K . Alors leurs distances deux à
deux sont toutes égales à 1 , et la suite n’admet pas de sous-suite convergente. Donc, pour que
K[[X]] soit compact, il est nécessaire que K soit un corps fini.
Supposons réciproquement que K est un corps fini. Soit (un ) une suite d’éléments de K[X].
(0)
Leurs termes constants ne prenant qu’un nombre fini de valeurs, il y a une sous suite (un ) de
(un ) dont tous les éléments ont le même terme constant a0 ∈ K . Il y a de même une sous suite
(1)
(0)
(un ) de (un ) dont tous les éléments ont le même coefficient en degré 1 , soit a1 ∈ K . En
(k)
itérant, on construit des sous-suites (un ) et des coefficients a0 , . . . , ak tels que :
k
∀n ∈ N , u(k)
(mod X k+1 ).
n ≡ a0 + · · · + ak X
P
Il est alors facile de conclure que
ak X k est un point d’accumulation de la suite (un ).
I.1.56 La convergence du produit infini découle du fait que 1−X n → 1 . Les coefficients d’indices
n 6 N sont égaux aux coefficients correspondants de :
Q
N X
Y
1
X kn =
=
n
1
−
X
n=1
n=1
N
Y
k>0
X
X k1 +2k2 +···+N kN .
k1 ,...,kN >0
P
1
Finalement,
an X n , où an est le nombre d’écritures de n sous la forme
=
n
n>1 1 − X
n>0
k1 + 2k2 + · · · , les ki ∈ N. Il y a une autre description combinatoire en termes de partitions,
que nous retrouverons en L3.
I.1.57 Rappelons que Pi,k (a1 , . . . , ak ) est le coefficient de X k dans f i , où f :=
P
an X n . On
n>0
a clairement P0,k = δ0,k , P1,k = ak , et, pour i > 2 :
i
f =
X
n1 ,...,ni >0
an1 · · · ani X
n1 +···+ni
d’où la formule :
Pi,k (a1 , . . . , ak ) =
=
X
k>0
X
X
n1 +···+ni =k
n1 +···+ni =k
an1 · · · ani
!
Xk,
an1 · · · ani .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
16
I.1.58 La substitution de g dans f est possible si, et seulement si, ω(g) > 1 , ce qui est bien le
P
P
cas si g := 0 . Si l’on note f :=
an X n , c’est la somme de la série convergente
an g n ,
n>0
n>0
laquelle n’a qu’un terme non nul si g := 0 , à savoir a0 .
I.1.59 On peut définir, sur n’importe quel corps de caractéristique nulle, les séries formelles
P (−1)p 2p
P (−1)p
X 2p+1 et sin :=
X . On vérifie sans peine que cos′ = − sin
cos :=
p>0 (2p)!
p>0 (2p + 1)!
et sin′ = cos. La dérivée de sin2 + cos2 est donc nulle. Comme le terme constant est 1 , on a
bien sin2 + cos2 = 1 .
I.1.60 On peut par exemple dériver l’égalité
√
1 − 4X = 1 − 2
la page 42). La conclusion est alors immédiate.
P 1
n>1 n
n
X (exercice 24 de
2n−2
n−1
I.1.61 On a :
VN +p − VN =
N
Y
(1 + wn )
n=0
N
Y
!
(1 + wN +p ) − 1 .
n=N +1
Le premier facteur est évidemment majoré (en module) par
N
Q
(1 + |wn |). Si l’on développe
n=0
le second facteur et que l’on prend le module, l’inégalité triangulaire fournit comme majorant
N +p
Q
le développement de
(1 + |wn |) − 1 . On a donc justifié la première majoration. La
n=N +1
seconde majoration est conséquence de l’inégalité : 1 + x 6 ex .
N
P
P
Puisque la série
wn est absolument convergente, le facteur exp
|wn | est majoré, les
n=0
restes
NP
+p
n=N +1
|wn | tendent vers 0 quand n tend vers l’infini (indépendamment de p, donc les
|VN +p − VN | également. D’après le critère de Cauchy, la suite (Vn ) admet donc une limite.
N
Q
Pour montrer que cette limite est non nulle, on peut considérer les inverses : VN′ :=
vn′ , où
n=0
vn′ := vn−1 est bien défini par hypothèse. Alors wn′ := vn′ − 1 = −vn−1 wn . Comme vn tend
P ′
P
vers 1 , la série
|wn | est de même nature que la série
|wn |, c’est-à-dire convergente, et
l’on déduit de ce qui précède que la suite (Vn′ ) admet une limite dans R. Comme VN VN′ = 1 ,
l’assertion est démontrée.
I.1.62 Lorsque l’on remplace p par p + 1 et n par n + 1 , on a les quotients :
p+1/2
p + 1/2
n+1
=
p−1/2
n+1
n
c Dunod 2014
I.1 : Compléments d’algèbre
17
et :
(−1)p+1
(−1)p
2p+2
p+1
2p
p
n+1
−1
4
p
n
n+1
−1
p+1
4
n
2(n−p)
n−p
2(n−p)
n−p
= (−1)
(2p + 2)(2p + 1) p + 1
p + 1/2
(−1/4) =
·
2
(p + 1)
n+1
n+1
Il suffit donc de prouver la formule pour p := 0 , ce qui découle du développement de
1
√
dans un exercice antérieur.
1 − 4X
De la formule de Stirling on déduit alors :
p
p − 1/2
C
(2p)! 1
−1
√ ·
∼ p+1/2 où C :=
n
4
p!
π
n
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
18
Module I.2 : Actions de groupes
I.2.1 L’élément neutre de G est l’élément neutre multiplicatif 1 de A, et l’on a bien 1n a = a pour
tout a ∈ A. Par ailleurs, soient g, h ∈ G et a ∈ A. Puisque A est commutatif, (gh)n = g n hn ,
d’où g n (hn a) = (gh)n a, ce qui démontre l’associativité mixte.
I.2.2 Si X n’a qu’un élément, il en est de même pour X 2 , et l’action ne peut être que transitive.
Supposons que X possède au moins deux éléments distincts x, y . Il n’existe alors aucun g ∈ G
appliquant (x, x) sur (x, y), c’est-à-dire tel que gx = x et gx = y . L’action de G sur X 2
n’est donc pas transitive, car (x, x) et (x, y) n’appartiennent pas à une même orbite sous G.
I.2.3 Pour la transitivité il s’agit, étant donnés deux sous-espaces vectoriels V, V ′ de dimension k
de E , de montrer qu’il existe g ∈ GL(E) tel que g(V ) = V ′ . Soient (e1 , . . . , ek ) une
base de V et (e′1 , . . . , e′k ) une base de V ′ . On peut compléter la famille libre (e1 , . . . , ek )
en une base (e1 , . . . , en ) de E , et compléter de même la famille (e′1 , . . . , e′k ) en une
base (e′1 , . . . , e′n ) de E . Il existe une unique transformation linéaire élément de GL(E) g
de E telle que g(ei ) = e′i pour i = 1, . . . , n. L’image par g de V = Vect(e1 , . . . , ek )
est Vect g(e1 ), . . . , g(ek ) = Vect(e′1 , . . . , e′k ) = V ′ . D’où g(V ) = V ′ .
Le noyau de l’action de GL(E) sur l’ensemble des sous-espaces de dimension k de E est
formé des g ∈ GL(E) tels que g(V ) = V pour tout sous-espace V de dimension k
de E . Ce noyau contient évidemment toutes les homothéties λ IdE , λ ∈ K ∗ , car une homothétie laisse stable tout sous-espace vectoriel. Inversement, soit g un élément de ce noyau.
Nous allons montrer que g est une homothétie. Pour cela, il suffit de montrer que g laisse
stable chaque droite vectorielle D (cf. le module II.3 de [L1]). La droite D peut être définie par n − 1 équations linéaires indépendantes. Autrement dit, il existe sur E des formes
linéaires f1 , . . . , fn−1 linéairement indépendantes et telles que D soit l’intersection des hyperplans Ker fi pour i = 1, . . . , n − 1 . Pour toute partie J à n − k éléments de [[1, n − 1]],
soit VJ l’intersection des Ker fi pour i ∈ J . C’est un sous-espace de dimension k de E et, par
hypothèse, VJ est stable par g . La réunion de toutes les parties à n − k éléments de [[1, n − 1]]
est évidemment égale à [[1, n − 1]]. On en déduit que l’intersection des hyperplans VJ , pour
toutes les parties à n − k éléments de [[1, n − 1]], est égale à D . Alors D est stable par g ,
comme intersection de parties stables par g .
I.2.4 Notons E la direction de X . Pour la transitivité, soient Y, Y ′ deux sous-espaces affines
de dimension k de X et F, F ′ ⊂ E leurs directions respectives. Il s’agit de trouver une
transformation affine f de X appliquant Y sur Y ′ . C’est évident si k = 0 . En effet, dans ce
−−→
cas, Y := {A} et Y ′ := {A′ } sont des points (singletons), et la translation de vecteur AA′
convient. Supposons donc k > 1 .
−−−→
−−−→ Choisissons des points A0 , . . . , Ak de Y tels que A0 , (A0 A1 , . . . , A0 Ak ) soit un repère
cartésien de Y . Considérons ensuite une base B := (e1 , . . . , en ) de E complétant la famille
−−−→
−−−→
libre (A0 A1 , . . . , A0 Ak ). De la même manière, choisissons des points A′0 , . . . , A′k de Y ′
−−−→
−−−→ tels que A′0 , (A′0 A′1 , . . . , A′0 A′k ) soit un repère cartésien de Y ′ , puis complétons la fa−−−→
−−−→
mille libre (A′0 A′1 , . . . , A′0 A′k ) en une base B ′ := (e′1 , . . . , e′n ) de E . Soit g ∈ GL(E)
c Dunod 2014
I.2 : Actions de groupes
19
l’unique transformation linéaire appliquant ei sur e′i pour i = 1, . . . , n. L’applica−−→
tion f : M 7→ A′0 + g(AM ) est une transformation affine de X , appliquant A0 sur A′0 .
−−−→
−−−→
Pour tout i ∈ [[1, k]], on a f (Ai ) = f (A0 ) + g(A0 Ai ), soit f (Ai ) = A′0 + A′0 A′i = A′i . Il en
résulte que f (Y ) = Y ′ .
Soit f un élément du noyau de l’action de GA(X) sur l’ensemble Ak des sous-espaces affines
de dimension k de X . Il s’agit de montrer que f est l’identité. C’est évident si k = 0 car,
dans ce cas, f laisse stable chaque singleton {M } , i.e. f (M ) = M . Supposons donc k > 1 .
Soit M ∈ X , montrons que f (M ) = M . L’application qui à chaque sous-espace affine Y
de X contenant M associe sa direction induit une bijection, respectant les inclusions, de l’ensemble des Y ∈ Ak contenant M sur l’ensemble des sous-espaces vectoriels de dimension k
de E . Puisque k 6 n − 1 , l’intersection de tous les sous-espaces vectoriels de dimension k
de E est nulle. En effet, soit u ∈ E un vecteur non nul. Il existe une base (u1 , . . . , un ) de E
telle que u1 = u . Alors u n’appartient pas au sous-espace vectoriel Vect(u2 , . . . , uk+1 ) de E .
Il en résulte que l’intersection des sous-espaces Y ∈ Ak contenant M est le singleton {M } .
Vu l’hypothèse faite sur f , chaque Y est stable par f , et il en est donc de même pour {M } ,
autrement dit f (M ) = M . Ceci étant vrai pour tout point M , f est l’identité.
Conclusion : le noyau de l’action de GA(X) sur Ak est trivial, ce qui signifie que cette action
est fidèle. On comparera ce cas affine avec le cas vectoriel de l’exercice précédent.
I.2.5 1. La formule donnant la partie imaginaire de g · z est évidente. Puisque a, b, c, d sont réels,
on a en effet :
!
az + b
(az + b)(cz̄ + d)
Im(g · z) = Im
= Im
2
cz + d
|cz + d|
!
2
ac |z| + bd + (ad + bc) Re z + i(ad − bc) Im z
= Im
|cz + d|2
=
(ad − bc) Im z
|cz + d|
2
=
Im z
|cz + d|2
·
La dernière égalité vient du fait que g appartienne à SL2 (R), i.e. ad − bc = 1 .
L’égalité que nous venons d’établir montre que g · z ∈ H dès que g ∈ SL2 (R) et z ∈ H , ce
qui définit une application de SL2 (R) × H dans H . Il est clair que I2 · z = z pour tout z ∈ H .
Soient maintenant g, g ′ ∈ SL2 (R) et z ∈ H . Montrons que g · (g ′ · z) = (gg ′ ) · z . Écri
′
a b
a b′
vons g :=
et g ′ :=
, puis posons Z := g · z . Alors :
c d
c′ d′
′
g · (g ′ · z) = g · Z =
′
z+b
a a′ z+d
aZ + b
′ + b
= ac′ z+b
′
cZ + d
c c′ z+d′ + d
a(a′ z + b′ ) + b(c′ z + d′ )
(aa′ + bc′ )z + (ab′ + bd′ )
=
·
′
′
′
′
c(a z + b ) + d(c z + d )
(ca′ + dc′ )z + (cb′ + dd′ )
′
a b
a b′
aa′ + bc′ ab′ + bd′
D’où la conclusion, puisque
=
. Nous
c d
c′ d′
ca′ + dc′ cb′ + dd′
avons donc bien défini une action de SL2 (R) sur H .
=
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
20
Montrons que cette action est transitive. Pour cela, il suffit de montrer que l’orbite Ω de i
sous SL2 (R) contient tout point ζ de H . C’est évident géométriquement. Posons a := Re ζ
√
et b := Im ζ . Par hypothèse b > 0 . Posons β := b . La permutation de H induite par la
β
0
matrice diagonale h :=
est z 7→ β 2 z , c’est-à-dire z 7→ bz . En identifiant un
0 β −1
point de C avec son affixe, c’est la restriction à H de l’homothétie (affine) de centre O et
de rapport b , elle applique i sur ib . Ensuite la permutation de H induite par la matrice (de
1 a
transvection) t :=
est z 7→ z + a, c’est la restriction à H de la translation de
0 1
vecteur a. Dans ces conditions, t · (h · i) = t(ib) = a + ib = ζ , donc ζ = (th) · i ∈ Ω.
a b
Soit g :=
∈ SL2 (R). L’égalité g · i s’écrit ai + b = i(ci + d), elle équivaut
c d
au système formé par les deux égalités a = d et b = −c. Supposons que ces deux égalités
soient vérifiées. Puisque det g = 1 , on en déduit que 1 = ad − bc = a2 + c2 . Il existe donc
cos θ − sin θ
un réel θ tel que a = cos θ et c = sin θ , d’où g =
∈ SO2 (R). La
sin θ
cos θ
réciproque est évidente. Ainsi, pour l’action de SL2 (R) sur H considérée, le stabilisateur de i
est SL2 (R)i = SO2 (R).
Soit maintenant z un point de H arbitraire. Puisque l’action de SL2 (R) sur H est transitive,
il existe g ∈ SL2 (R) tel que z = g · i . La proposition 11 de la page 71 montre alors que le
stabilisateur de z est le conjugué du stabilisateur de i par g :
SL2 (R)z = gSL2 (R)i g −1 ,
soit SL2 (R)z = gSO2 (R)g −1 .
2. Il suffit de poser :
g · Z = f g · f −1 (Z)
pour tout (g, Z) ∈ SL2 (R) × D.
(∗)
Cette formule a bien un sens. En effet, z := f −1 (Z) ∈ H , donc g · z a été défini dans la
question précédente, c’est un point de H , dont l’image par f appartient à D . Si g ∈ SL2 (R),
notons ψ(g) l’application Z 7→ g · Z de D dans lui-même. En fait, si ϕ : SL2 (R) → S(H)
est le morphisme associé à l’action de SL2 (R) considérée plus haut, la formule (∗) se traduit
ainsi :
ψ(g) = f ◦ ϕ(g) ◦ f −1
pour tout g ∈ SL2 (R).
(∗∗)
On en déduit d’abord que, si g ∈ SL2 (R), ψ(g) est une permutation de D , parce que f est
une bijection de H sur D et ϕ(g) est une permutation de H . Ensuite, la formule (∗∗) montre
que ψ est bien un morphisme de SL2 (R) dans S(D), ce qui veut dire que la formule (∗)
définit bien une action de SL2 (R) sur D .
Explicitons f −1 . Il suffit de résoudre l’équation (z − i)/(z + i) = Z par rapport à z :
f −1 (Z) =
Soient g :=
c Dunod 2014
α
γ
β
δ
i(1 + Z)
1−Z
pour tout Z ∈ D.
∈ SL2 (R) et s := ψ(g). Considérons un point Z ∈ D et po-
I.2 : Actions de groupes
21
sons z := f −1 (Z) ∈ H . Alors g · z = (αz + β)/(γz + δ), d’où :
(αz + β)/(γz + δ) − i
s(Z) = f (g · z) = f (αz + β)/(γz + δ) =
(αz + β)/(γz + δ) + i
(αz + β) − i(γz + δ)
(α − iγ)z + (β − iδ)
=
=
=
(αz + β) + i(γz + δ)
(α + iγ)z + (β + iδ)
(γ − β) + i(α + δ) Z + (γ + β) + i(α − δ)
=
−(γ + β) + i(α − δ) Z + (β − γ) + i(α + δ)
(α + δ) + i(β − γ) Z + (α − δ) − i(β + γ)
=
=
(α − δ) + i(β + γ) Z + (α + δ) − i(β − γ)
u :=
(α − iγ) i(1+Z)
1−Z + (β − iδ)
(α + iγ) i(1+Z)
1−Z + (β + iδ)
u(Z + a)
,
1 + Za′
en posant :
(α + δ) + i(β − γ)
(α − δ) − i(β + γ)
(α − δ) + i(β + γ)
, a :=
, a′ :=
·
(α + δ) − i(β − γ)
(α + δ) + i(β − γ)
(α + δ) − i(β − γ)
Il est clair que |u| = 1 et a′ = ā. Il reste à montrer l’inégalité |a| < 1 . Elle équivaut
2
2
à |(α − δ) − i(β + γ)| < |(α + δ) + i(β − γ)| , ce qui s’écrit :
(α + δ)2 − (α − δ)2 − (β + γ)2 − (β − γ)2 = 4(αδ − βγ) > 0,
ce qui est vrai parce que g ∈ SL2 (R). Ainsi, s := ψ(g) est de la forme annoncée.
Il reste la réciproque. Soient donc u, a ∈ C tels que |u| = 1 et |a| < 1 . Notons s la permutation Z 7→ u(Z +a)/(1+āZ) de D . Pour tout Z ∈ D , noter que 1+āZ 6= 0 puisque |āZ| < 1 .
En outre s(Z) ∈ D , à cause du calcul suivant :
2
2
2
2
2
2
|1 + āZ| − |Z + a| = 1 + |a| |Z| + 2 Re(āZ) − |Z| + |a| + 2 Re(āZ)
2
2
= (1 − |a| )(1 − |Z| ) > 0.
Ainsi, s est en tout cas une application de D dans lui-même. Pour conclure, vu les calculs
ci-dessus, il suffit de prouver qu’il existe (α, β, γ, δ) ∈ R4 vérifiant les conditions :
(α − δ) − i(β + γ)
(α + δ) + i(β − γ)
= u,
= a
(α + δ) − i(β − γ)
(α + δ) + i(β − γ)
et αδ − βγ = 1.
(∗∗∗)
Soit θ ∈ R tel que u := e2iθ . Montrons que le quadruplet (α, β, γ, δ) défini par les formules
ci-dessous convient :
Re eiθ (1 + a)
Im eiθ (1 − a)
q
q
α :=
, β :=
2
2
1 − |a|
1 − |a|
− Im eiθ (1 + a)
Re eiθ (1 − a)
q
q
γ :=
, δ :=
·
1 − |a|2
1 − |a|2
q
Soit t := 2e / 1 − |a|2 . D’abord t/t̄ = e2iθ = u . Ensuite, il vient :
iθ
2α = Re t(1 + a) , 2β = Im t(1 − a) , 2γ = − Im t(1 + a) , 2δ = Re t(1 − a) ,
(α + δ) + i(β − γ) = t
et (α − δ) − i(β + γ) = ta,
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
22
ce qui montre que les deux premières égalités (∗∗∗) sont vérifiées. La troisième aussi :
4(αδ − βγ) = Re(t(1 + a) Re t(1 − a) + Im t(1 + a) Im t(1 − a)
= Re t(1 + a) t(1 − a) = |t|2 Re(1 − |a|2 + a − ā)
2
2
= |t| (1 − |a| ) = 4.
I.2.6 Soient y un point quelconque de Y et Ω son orbite sous G. Puisque G est fini, cette orbite
est finie, car l’application g 7→ g(y) de G dans X a pour image Ω, par définition d’une
orbite. Posons N := card (Ω). Notons ω l’isobarycentre de Ω, c’est-à-dire le barycentre des
points de Ω, chacun étant affecté du coefficient 1/N . La partie Y étant stable sous G, Ω est
contenue dans Y . Par hypothèse, Y est convexe, donc ω appartient à Y (cf. la section 5.1 de
la page 444). Il suffit maintenant de montrer que ω est un point fixe sous l’action de G.
Soit donc g ∈ G. En premier lieu, g est affine, donc conserve les barycentres. Puisque ω
est le barycentre de la famille (t, 1/N )t∈Ω , son image par g est le barycentre de la fa
mille g(t), 1/N t∈Ω . Mais t 7→ g(t) est une permutation de Ω, parce que Ω est stable
sous g . Par commutativité des barycentres, il en résulte que g(ω) = ω .
I.2.7 1. Par définition, NG (H) := g ∈ G | gHg −1 = H . Comme tout stabilisateur
d’un point dans une action de groupe, c’est un sous-groupe de G. Il contient H car, pour
tout h ∈ H , hH = H et de même Hh−1 = H . La première égalité, par exemple, vient du fait
que h′ 7→ hh′ soit une bijection de H sur lui-même, la bijection réciproque étant h′ 7→ h−1 h′ .
Puisque gHg −1 = H pour tout g ∈ NG (H), H est un sous-groupe distingué de NG (H).
Inversement, soit M un sous-groupe de G contenant H , et supposons que H soit un sousgroupe distingué de M . Pour tout g ∈ M , on a donc gHg −1 = H , d’où g ∈ NG (H). Ceci
étant vrai pour tout g ∈ M , M est inclus dans NG (H).
2. D’abord HK contient 1 , parce que 1 ∈ H et 1 ∈ K . Étant donnés deux éléments x, y de HK , il s’agit de démontrer que xy et x−1 appartiennent à HK . Par définition
de HK , il existe deux couples (h, k), (h′ , k ′ ) ∈ H × K tels que x := hk et y := h′ k ′ .
Alors xy = (hk)(h′ k ′ ) = h(kh′ k −1 )(kk ′ ). Puisque k ∈ NG (H), h1 := kh′ k −1 ∈ H ,
donc hh1 ∈ H ( H est un sous-groupe de G). De plus kk ′ ∈ K ( K est un sous-groupe
de G), d’où xy = (hh1 )(kk ′ ) ∈ HK .
De même k −1 ∈ NG (H), donc h2 := k −1 h−1 k ∈ H . Enfin, on a :
x−1 = (hk)−1 = k −1 h−1 = (k −1 h−1 k)k −1 = h2 k −1 ∈ HK.
il en résulte que HK est un sous-groupe de G.
I.2.8 Soit a ∈ C∗ . Il existe un unique morphisme ϕa de l’algèbre C[X] dans elle-même appliquant X sur aX (substitution de aX à X ). Par définition, a·P = ϕa (P ) pour tout P ∈ C[X].
Soient a, b ∈ C∗ . Le composé ϕa ◦ ϕb est un morphisme de l’algèbre C[X] dans ellemême, appliquant X sur ϕa (bX) = b(aX) = (ab)X . Ce morphisme est donc égal à ϕab .
Ainsi a · (b · P ) = (ab) · P pour tout polynôme P et tous a, b ∈ C∗ . Il est clair que 1 · P = P
pour tout P , donc (a, P ) 7→ a · P est une action de C∗ sur C[X]. Le morphisme de C∗
dans S C[X] correspondant est a 7→ ϕa .
c Dunod 2014
I.2 : Actions de groupes
23
Soit donc a ∈ C∗ . Puisque ϕa est un morphisme bijectif de l’algèbre C[X] sur elle-même,
c’est un automorphisme de cette algèbre. L’ensemble A des points fixes de ϕa est alors une
sous-algèbre de C[X], i.e. c’est un sous-espace vectoriel contenant 1 et stable par multiplication. Explicitons cette sous-algèbre en fonction de a.
Bien entendu, A contient déjà C (polynômes constants), puisque c’est un sous-espace
vectoriel de C[X] contenant 1 . Considérons un polynôme P , de degré n > 1 . Il sécrit P := cn X n + · · · + c1 X + c0 , avec cn 6= 0 . Par définition, a · P = ϕa (P ) est défini
par :
a · P := P (aX) = cn (aX)n + · · · + c1 (aX) + c0 .
n
P
Ainsi a · P − P =
ck (ak − 1)X k . Un polynôme étant nul si, et seulement si, tous ses
k=0
coefficients sont nuls, P appartient à A si, et seulement si, ck (ak −1) = 0 pour tout k ∈ [[0, n]],
ou encore pour tout k ∈ [[1, n]]. Distinguons alors deux cas.
1. Supposons d’abord que a ne soit pas une racine de l’unité. Alors ak 6= 1 pour tout
entier k > 1 . Si donc P ∈ A, le calcul ci-dessus montre que tous les coefficients de P
sont nuls, sauf peut-être le coefficient constant. Il en résulte que A = C.
2. Supposons que a soit une racine de l’unité, notons p > 1 son ordre. Ainsi, a est une
racine p ème de l’unité, i.e. un élément d’ordre p du groupe (C∗ , ×). Pour tout entier k ∈ Z, il en résulte que ak = 1 si, et seulement si, k est un multiple de p. Un polynôme P écrit comme ci-dessus appartient donc à A si, et seulement si, pour tout k ∈ N
non multiple de p, le coefficient de degré k de P est nul. Cela revient à dire que P est
une somme finie de termes du type cX hp , où h ∈ N et c ∈ C, ou encore que P est un
polynôme en X p , i.e. un élément de C[X p ]. Dans ce cas, la sous-algèbre A est égale
à C[X p ].
Conclusion : la sous-algèbre A est donnée par la formule suivante :
(
C si a n’est pas racine de l’unité,
A =
C[X p ] si a est une racine pème primitive de l’unité, p > 1.
I.2.9 1. Pour simplifier, notons ici X (k) l’ensemble des k -uplets injectifs d’éléments de X .
Supposons que l’action de G sur X soit k fois transitive. Autrement dit, l’action natu
relle g, (x1 , . . . , xk ) 7→ (gx1 , . . . , gxk ) de G sur X (k) est transitive. En particulier, X (k)
n’est pas vide, i.e. card (X) > k . Considérons un point a ∈ X , et montrons que l’orbite G · a
est égale à X . Soit b ∈ X . Puisque card (X) > k , il existe deux k -uplets ξ := (x1 , . . . , xk )
et η := (y1 , . . . , yk ) appartenant à X (k) tels que x1 = a et y1 = b . Par hypothèse, il
existe g ∈ G tel que g · ξ = η , c’est-à-dire gxi = yi pour i = 1, . . . , k . En particulier, ga = gx1 = y1 = b , donc b ∈ G · a. Ainsi G · a = X , ce qui signifie que l’action
de G sur X est transitive. Le fait que l’action de Ga sur X \ {a} soit k − 1 -fois transitive est
évident. En effet, soient ξ ′ := (u2 , . . . , uk ) et η ′ := (v2 , . . . , vk ) deux (k − 1)-uplets injectifs
de X \ {a} . Alors (a, u2 , . . . , uk ) et (a, v2 , . . . , vk ) appartiennent à X (k) . Par hypothèse, il
existe g ∈ G tel que g · (a, u2 , . . . , uk ) = (a, v2 , . . . , vk ), c’est-à-dire ga = a et gui = vi
pour i = 2, . . . , k . En résumé, g ∈ Ga applique ξ ′ sur η ′ , d’où la conclusion.
Supposons inversement que l’opération de G sur X soit transitive et que l’opération de Ga
sur X \ {a} soit k − 1 fois transitive. D’abord card X \ {a} > k − 1 , donc card (X) > k .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
24
Soient ξ := (x1 , . . . , xk ) et η := (y1 , . . . , yk ) deux éléments de X (k) . Il s’agit de démontrer l’existence d’un élément g de G tel que g · ξ = η . Puisque G agit transitivement sur X , il existe γ, δ ∈ G tels que γx1 = a et δa = y1 . Considérons les
deux k -uplets injectifs γ · ξ = (a, γx2 , . . . , γxk ) et δ −1 · η = (a, δ −1 y2 , . . . , δ −1 yk ).
Puisque l’opération de Ga sur X \ {a} est k − 1 fois transitive, il existe h ∈ Ga tel
que h · (γx2 , . . . , γxk ) = (δ −1 y2 , . . . , δ −1 yk ). Posons g := δhγ ∈ G. D’abord gx1 = y1 .
En effet, gx1 = (δhγ)x1 = (δh)a = δ(ha) = δa = y1 . Soit ensuite i ∈ [[2, k]]. Cette fois, on
a gxi = δ h(γxi ) = δ(δ −1 yi ) = yi . Finalement, gxi = yi pour i = 1, . . . , k , donc g·ξ = η .
2. Notons E la direction de X . Soient (A, A′ ) et (B, B ′ ) deux couples injectifs de points
−−→ −−→
de X . Puisque les vecteurs AA′ , BB ′ ∈ E sont non nuls, il existe g ∈ GL(E) tel
−−→
−−→
−−→
que g(AA′ ) = BB ′ (en vertu de l’exercice 3 de la page 66). L’application M 7→ B + g(AM )
de X dans lui-même est affine et bijective, parce que g est linéaire et bijective. Autrement
−−→
−−→
dit, f ∈ GA(X). Ensuite, f (A) = B + g(0) = B , et f (A′ ) = B + g(AA′ ) = B + BB ′ = B ′ ,
donc f applique (A, A′ ) sur (B, B ′ , ce qui établit la double transitivité de l’action de GA(X)
sur X .
3. Notons D l’ensemble des droites vectorielles de E . Puisque n > 2 , D a au
moins deux éléments. Considérons deux couples injectifs (D1 , D2 ), (D1′ , D2′ ) d’éléments
de D . Pour i = 1, 2 , choisissons des vecteurs non nuls xi ∈ Di et x′i ∈ Di′ .
Puisque D1 6= D2 , (x1 , x2 ) est une famille libre de E , on peut la compléter en une
base (x1 , . . . , xn ) de E . De même, la famille libre (x′1 , x′2 ) peut être complétée en une
base (x′1 , . . . , x′n ) de E . Soit g ∈ GL(E) l’unique transformation linéaire telle que g(xi ) = x′i
pour i = 1, . . . , n. De g(x1 ) = x′1 , on tire g(D1 ) = g(Kx1 ) = Kg(x1 ) = Kx′1 = D1′ et de
même g(D2 ) = D2′ , ce qui établit la double transitivité de l’opération de GL(E) sur D .
Si n > 3 , nous allons montrer que l’opération de GL(E) sur D n’est pas 3 fois transitive.
Considérons trois vecteurs linéairement indépendants x, y, z . Les droites Kx, Ky, Kz sont
deux à deux distinctes, et il en est de même pour les droites Kx, Ky, K(x + y). Cependant,
il n’existe pas d’élément g ∈ GL(E) appliquant Kx, Ky, Kz sur Kx, Ky, K(x + y) respectivement. Supposons en effet qu’un tel g existe. Puisque g(Kx) = Kx, g(Ky) = Ky
et g(Kz) = K(x + y), il existe λ, µ, ν ∈ K ∗ tels que g(x) = λx, g(y) = µy
et g(z) = ν(x + y). C’est absurde, car la famille (x, y, z) est libre, alors que son
image λx, µy, ν(x+y) par l’application linéaire et bijective g est liée. L’opération de GL(E)
sur D n’est donc pas 3 fois transitive.
Supposons que n soit égal à 2 , et montrons cette fois que l’opération de GL(E) sur D
est 3 fois transitive. Considérons deux triplets injectifs (D1 , D2 , D3 ), (D1′ , D2′ , D3′ ) d’éléments de D . Pour i = 1, 2, 3 , choisissons des vecteurs non nuls xi ∈ Di et x′i ∈ Di′ .
Puisque D1 6= D2 , (x1 , x2 ) est une famille libre de E , c’est donc une base de E
car dim E = 2 . Il existe donc un unique couple (λ1 , λ2 ) ∈ K 2 tel que x3 = λ1 x1 + λ2 x2 .
De plus, λ1 et λ2 sont non nuls, car la droite D3 est distincte de D1 et D2 . De même,
il existe unique couple (λ′1 , λ′2 ) ∈ (K ∗ )2 tel que x′3 = λ′1 x′1 + λ′2 x′2 . Soit g ∈ GL(E)
′
′ −1 ′
l’unique transformation appliquant la base (x1 , x2 ) sur la base λ′1 λ−1
1 x1 , λ2 λ2 x2 . Évidemment, g(D1 ) = D1′ et g(D2 ) = D2′ . D’autre part, on a :
′
′ −1 ′
g(x3 ) = g(λ1 x1 + λ2 x2 ) = λ1 g(x1 ) + λ2 g(x2 ) = λ1 (λ′1 λ−1
1 x1 ) + λ2 (λ2 λ2 x2 )
= λ′1 x′1 + λ′2 x′2 = x′3 ,
c Dunod 2014
d’où g(D3 ) = D3′ .
I.2 : Actions de groupes
25
Ainsi, g ·(D1 , D2 , D3 ) = (D1′ , D2′ , D3′ ), d’où la triple transitivité de l’action de GL(E) sur D .
4. Soient (j1 , . . . , jn ) et (k1 , . . . , kn ) deux n-uplets injectifs de points de [[1, n]]. Par définition même, l’application s : i 7→ ji de [[1, n]] dans lui-même est injective, donc bijective.
Autrement dit, s ∈ Sn . De même, l’application t : i 7→ ki de [[1, n]] dans lui-même appartient
à Sn . Pour tout i ∈ [[1, n]], s(i) = ji et t(i) = ki . En posant g := t ◦ s−1 ∈ Sn , on a
donc g(ji ) = t s−1 s(i) = t(i) = ki , donc g · (j1 , . . . , jn ) = (k1 , . . . , kn ). L’opération
de Sn sur [[1, n]] est donc n fois transitive.
Supposons n > 3 , et soient (j1 , . . . , jn−2 ) et (k1 , . . . , kn−2 ) deux (n − 2)-uplets injectifs de points de [[1, n]]. Notons jn−1 , jn les deux éléments (pris dans un ordre arbitraire) de [[1, n]] distincts de j1 , . . . , jn−2 et kn−1 , kn les deux éléments de [[1, n]] distincts de k1 , . . . , kn−2 . D’après le point précédent, il existe une permutation s ∈ Sn telle
que s(ji ) = ki pour i = 1, . . . , n. En particulier, s · (j1 , . . . , jn−2 ) = (k1 , . . . , kn−2 ).
Si s ∈ An , on a gagné. Sinon, considérons la transposition t := (jn−1 jn ). On observe qu’elle
laisse fixe (j1 , . . . , jn−2 ). Alors g := s ◦ t ∈ An (parce que t est une permutation impaire),
et g ·(j1 , . . . , jn−2 ) = (k1 , . . . , kn−2 ). Dans les deux cas, nous avons trouvé un élément de An
appliquant (j1 , . . . , jn−2 ) sur (k1 , . . . , kn−2 ), ce qui établit la (n − 2)-transitivité de l’action
de An sur [[1, n]].
I.2.10 1. Implication a) =⇒ b).
Soit Y une partie non vide de X satisfaisant la condition énoncée en b). Supposons que Y ne
soit pas un singleton, et montrons que Y = X . Choisissons un point y de Y . Dans un premier
temps, montrons que H ′ := h′ ∈ G | h′ y ∈ Y est un sous-groupe de G. Il est clair que H ′
contient Gy , en particulier 1 ∈ H ′ . Soient h′1 , h′2 ∈ H ′ . L’élément g := h′2 (h′1 )−1 ∈ G
applique h′1 y sur h′2 y . Par définition de H ′ , h′1 y et h′2 y appartiennent à Y . On en déduit
que h′2 y ∈ Y ∩ gY . Vu l’hypothèse faite sur Y , gY = Y . En particulier, gy ∈ Y , c’està-dire g ∈ H ′ . Nous avons ainsi montré que h′2 (h′1 )−1 appartient à H ′ , et donc H ′ est un
sous-groupe de G contenant Gy . De plus, H ′ 6= Gy . En effet, Y contient par hypothèse un
point y ′ 6= y . Puisque l’action de G sur X est transitive, il existe h′ ∈ G tel que y ′ = h′ y .
Alors h′ ∈ H ′ parce que h′ y = y ′ ∈ Y , mais h′ ∈
/ Gy parce que h′ y = y ′ 6= y .
Puisque l’action de G sur X est transitive, il existe γ ∈ G tel que y = γa. La proposition 11 de la page 71 montre alors que Gy = γGa γ −1 . En conjuguant par γ −1 , on voit
donc que H := γ −1 H ′ γ est un sous-groupe de G contenant Ga strictement. D’après l’hypothèse, H = G, d’où H ′ = γHγ −1 = G. Soit alors x un élément arbitraire de X . Il
existe g ∈ G tel que x = gy . Alors g ∈ G = H ′ , donc x = gy ∈ Y , par définition de H ′ .
D’où Y = X .
Implication b) =⇒ a).
Soit donc H un sous-groupe de G contenant Ga . Supposons H 6= Ga , et montrons
que H = G. Montrons que la partie Y := H · a possède la propriété énoncée en b).
Soit g ∈ G tel que Y ∩ g · Y ne soit pas vide, et soit z un point de cette intersection. Il
existe donc h, h′ ∈ H tels que h′ a = z = g(ha). Alors h′−1 gh ∈ Ga ⊂ H , donc g ∈ H .
Mais alors, gY = g · (H · a) = (gH) · a = H · a = Y , comme désiré.
La partie Y contient a. Ce n’est pas le singleton {a} , car sinon H · a = {a} , d’où ha = a
pour tout h ∈ H , c’est-à-dire H ⊂ Ga , ce qui contredit l’hypothèse. La condition b) étant
vérifiée, Y = X , c’est-à-dire H · a = X . Soit alors γ un élément quelconque de G.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
26
Puisque γa ∈ X = H · a, il existe h ∈ H tel que γa = ha. Alors h−1 γ ∈ Ga ⊂ H ,
donc γ = h(h−1 γ) ∈ H . D’où H = G, comme désiré.
2. Posons donc Y := K ·a. Montrons que Y possède la propriété énoncée en b). Soit g ∈ G tel
que Y ∩ g · Y ne soit pas vide, et soit z un point de cette intersection. Il existe donc k, k ′ ∈ K
tels que k ′ a = z = g(ka). Alors γ := k ′−1 gk ∈ Ga . Puisque K est un sous-groupe distingué
de G, k1 := gkg −1 ∈ K , et γ = k ′−1 k1 g , d’où g = k2 γ , avec k2 := k1−1 k ′ ∈ K . Dans ces
conditions, il vient :
g · Y = g · (K · a) = (gK) · a = (Kg) · a = K · (ga) = K · (k2 γ)a
= K · (k2 a) = (Kk2 ) · a = K · a = Y.
Ainsi, Y possède la propriété énoncée en b), de sorte que K · a est par hypothèse égal à X ou
à {a} . Dans le premier cas, l’opération de K sur X est transitive. Supposons au contraire que
cette opération ne soit pas transitive. Alors K · a = {a} , i.e. le point a est fixe sous l’action
de K . L’idée est maintenant de remarquer que le fait que l’action de G sur X soit primitive ne
dépend pas du choix du point a ∈ X (la condition b) ne dépend pas de a). Dans ces conditions,
tout point x ∈ X est un point fixe de K , ce qui signifie que K opère trivialement sur X .
3. Supposons donc que l’action de G sur X soit deux fois transitive. D’après l’exercice I.2.9
de la page 90, l’action de G sur X est en particulier transitive. Soit a ∈ X . Pour prouver que
l’action de G sur X est primitive, il suffit de montrer que tout sous-groupe de G contenant Ga
strictement est égal à G. Soit H un tel sous-groupe. Puisque H 6⊂ Ga , il existe h ∈ H tel
que ha soit distinct de a. Soit alors g un élément quelconque de G, montrons que g ∈ H .
C’est clair si g ∈ Ga . Supposons donc ga 6= a. L’action de G sur X étant deux fois transitive,
il existe γ ∈ Ga tel que γ(ha) = ga. Alors γ et h appartiennent à H , ainsi que (γh)−1 g ,
donc g ∈ H . En conclusion, tout élément g de G appartient à H , donc H = G.
I.2.11 Tout élément g de G conserve les distances (d’où le nom d’isométrie) :
si A, B ∈ R2 , d g(A), g(B) = d(A, B). En effet, puisque ~g ∈ O(R2 ), on a :
−−−−−−→
−−→
−−→
d g(A), g(B) = kg(A)g(B)k = k~g(AB)k = kABk = d(A, B).
a) Précisons ensuite quelques notations. L’ensemble des droites affines de R2 est noté D . Pour
tout vecteur ~u de R2 , on désigne par tu~ la translation de vecteur ~u , c’est un élément de G.
Pour toute droite D ∈ D , on note SD la symétrie orthogonale par rapport à D (ou réflexion
d’axe D ). À tout point M ∈ R2 , SD associe le point M ′ caractérisé par les deux propriétés
−−−→
→
−
suivantes : M M ′ est orthogonal à D et le milieu de M M ′ appartient à D . La partie linéaire
→
−
de SD est la symétrie (vectorielle) orthogonale par rapport à D , de sorte que SD ∈ G.
b) L’action de SO(R2 ) sur l’ensemble des droites vectorielles de R2 est transitive. Cela résulte si l’on veut de l’exercice 5 de la page 67, puisque chaque droite vectorielle contient
exactement deux vecteurs unitaires (opposés). Montrons alors que l’action de G sur D est
transitive. Ce qui précède montre que toutes les droites passant par l’origine appartiennent à
une même orbite de G sur D , notons-la Ω. Soit D ∈ D . Étant donné un point A de D , la
−→
−
→.
droite D′ := D + AO passe par l’origine, et D est l’image de D′ par la translation t−
OA
′
−
→ ∈ G et D ∈ Ω, on en déduit que D ∈ Ω, d’où Ω = D , comme désiré.
Puisque t−
OA
c) Cherchons ensuite à décrire les orbites de G sur l’ensemble P des paires de droites affines
de R2 . Cet ensemble est réunion disjointe de l’ensemble P ′ des paires de droites parallèles et
c Dunod 2014
I.2 : Actions de groupes
27
de son complémentaire P ′′ . L’ensemble P ′ est stable sous l’action de G et même du groupe
affine GA(R2 ). En effet, les images par une application affine de deux droites parallèles sont
deux droites parallèles. L’ensemble P ′′ est donc lui aussi stable sous l’action de G.
→
−
Soit {D, D′ } ∈ P ′ : D et D′ sont parallèles et distinctes, elles ont même direction D .
→
−
Il existe un unique vecteur ~u orthogonal à D tel que D′ = D + ~u . De plus, pour tout
point A de D , la distance d(D, D′ ) (distance de D à D′ ), est égale à k~uk , ou encore
à AA′ = d(A, A′ ), en posant A′ := A + ~u ∈ D′ . Soit alors {D1 , D1′ } un autre élément
de P ′ . Montrons que {D, D′ } et {D1 , D1′ } appartiennent à une même orbite sous G si, et
seulement si, d(D, D′ ) = d(D1 , D1′ ). La nécessité est évidente : s’il existe un élément g
de G appliquant {D, D′ } sur {D1 , D1′ } , on a par exemple g(D) = D1 et g(D′ ) = D1′ ,
quitte à échanger D et D′ , ce qui ne modifie pas d(D, D′ ). Puisque g conserve les dis
tances, d(D1 , D1′ ) = d g(D), g(D′ ) = d(D, D′ ).
Supposons inversement que d(D, D′ ) = d(D1 , D1′ ). Il existe d’abord h ∈ G tel
que h(D) = D1 , vu la transitivité de l’action de G sur D . Posons D2′ := h(D′ ). Alors D2′
est parallèle à D1 , et d(D1 , D2′ ) = d h(D), h(D′ ) = d(D, D′ ) = d(D1 , D1′ ). On en
→, −
→
déduit que D2′ est égale soit à D1′ , soit à SD1 (D1′ ). Soient en effet −
u
1 u2 les vecteurs
−→⊥
→ et D′ = D + −
→ . Les vecteurs −
→, −
→
de D1 tels que D1′ = D1 + −
u
u
u
1
1
2
1 u2 ont même norme,
2
−
→
égale à d(D1 , D1′ ), et ils appartiennent à la droite vectorielle D1 ⊥ . Ces deux vecteurs sont
donc égaux ou opposés, d’où notre assertion. Si D2′ = D1′ , h · {D, D′ } = {D1 , D1′ } . Sinon, (SD1 ◦ h) · {D, D′ } = {D1 , D1′ } . Dans les deux cas, {D, D′ } et {D1 , D1′ } sont dans
une même orbite sous G.
d) Il reste à décrire les orbites de P ′′ sous G. C’est ici la notion d’angle (de deux droites) qui va
remplacer celle de distance, utilisée ci-dessus. Précisons de quoi il s’agit. Soient D, D′ deux
droites affines distinctes se coupant en un point A. Considérons un point M de D distinct
de A et un point M ′ de D′ distinct de A. Posons :
−−→ −−→ ( AM | AM ′ )
·
θ := arccos
AM · AM ′
Ce réel est évidemment indépendant du choix des points M, M ′ (à cause de la valeur absolue),
et il appartient à ]0, π/2] ; c’est l’angle (non orienté) de D et D′ , notons-le ici [D, D′ ]. On
observera que [D′ , D] = [D, D′ ].
Montrons que deux éléments {D, D′ } et {∆, ∆′ } de P ′′ appartiennent à une même orbite
sous G si, et seulement si, les angles θ := [D, D′ ] et η := [∆, ∆′ ] sont égaux. Notons A
le point d’intersection de D et D′ . Choisissons un point M ∈ D tel que AM = 1 et un
−−→ −−→
point M ′ ∈ D′ tel que AM ′ = 1 . Alors ( AM | AM ′ ) = ± cos θ . Quitte à remplacer M ′
−−→ −−→
par son symétrique par rapport à A, on peut supposer que ( AM | AM ′ ) = cos θ . De même,
en notant B le point d’intersection de ∆ et ∆′ , il existe des points N ∈ ∆ et N ′ ∈ ∆′ tels
−−→ −−→
que BN = BN ′ = 1 et ( BN | BN ′ ) = cos η .
Supposons d’abord qu’il existe une isométrie g ∈ G telle que g · {D, D′ } = {∆, ∆′ } .
Quitte à échanger D, D′ , nous pouvons supposer que g(D) = ∆ et g(D′ ) = ∆′ , de sorte
que g(A) = B . Posons P := g(M ) et P ′ := g(M ′ ). Puisque ~g ∈ O(R2 ), les produits
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
28
−−→ −−→
−−→ −−→
scalaires ( AM | AM ′ ) et ( BP | BP ′ ) sont égaux, de même BP = 1 = BP ′ , d’où :
−−→ −−→ −−→ −−→ ( AM | AM ′ )
( BP | BP ′ )
θ = arccos
= arccos
= η.
AM · AM ′
BP · BP ′
Supposons inversement que θ = η . Soit γ ∈ GL(R2 ) l’unique transformation linéaire ap−−→ −−→
−−→ −−→
pliquant la base (AM , AM ′ ) sur la base (BN , BN ′ ). C’est une transformation orthogonale,
−−→ −−→
−−→ −−→
car AM = BN = 1 , AM ′ = BN ′ = 1 et ( AM | AM ′ ) = cos θ = ( BN | BN ′ ) . L’appli−→
cation g : P 7→ B + γ(AP ) est alors une isométrie de R2 , appliquant A, M, M ′ sur B, N, N ′
respectivement. Ainsi, g(D) = ∆ et g(D′ ) = ∆′ , d’où g · {D, D′ } = {∆, ∆′ } .
Conclusion : considérons deux paires de droites {D, D′ } et {∆, ∆′ } . Ces deux paires appartiennent à une même orbite sous G si, et seulement si,
- ou bien D, D′ sont parallèles, ∆, ∆′ sont parallèles, et les distances d(D, D′ ), d(∆, ∆′ )
sont égales,
- ou bien D, D′ sont concourantes, ∆, ∆′ sont concourantes, et les angles [D, D′ ], [∆, ∆′ ]
sont égaux.
On en déduit une paramétrisation des orbites de P sous G. Ces orbites sont les suivantes :
- pour tout réel δ > 0 , l’ensemble des paires de droites parallèles à distance δ l’une de
l’autre ;
- pour tout réel θ ∈ ]0, π/2], l’ensemble des paires de droites concourantes formant entre
elles un angle égal à θ .
I.2.12 1. Implication a) =⇒ c).
−−−→
−−−→
Soit F le sous-espace vectoriel de E engendré par les vecteurs A0 A1 . . . , A0 An .
Alors Y := A0 + F est un sous-espace affine de X , de direction F , et les points A0 , . . . , An
appartiennent à Y . Vu l’hypothèse, Y = X , donc F = E . Puisque E est de dimen−−−→
−−−→
sion n, (A0 A1 . . . , A0 An ) est une base de E .
Implication c) =⇒ b).
Considérons un point M de X . Il existe un unique n-uplet (λ1 , . . . , λn ) ∈ K n tel
n
n
P
P
−−−→
−−−→
que A0 M =
λi A0 Ai . Si l’on pose λ0 := 1 −
λi , le point M est barycentre
i=1
i=1
de (A0 , λ0 ), . . . , (An , λn ) . Inversement, soient µ0 , . . . , µn des scalaires de somme 1 tels
n
P
−−−→
−−−→
que le point M soit barycentre de (A0 , µ0 ), . . . , (An , µn ) . Alors A0 M =
µi A0 Ai ,
i=1
donc (µ1 , . . . , µn ) = (λ1 , . . . , λn ). On en déduit évidemment que µ0 = λ0 , ce qui établit la
propriété d’unicité annoncée.
Implication b) =⇒ a).
Soit Y un sous-espace affine de X contenant A0 , . . . , An . Considérons un point M ∈ X .
Par hypothèse, il existe des scalaires λ0 , . . . , λn de somme 1 tels que M soit barycentre de la
famille (A0 , λ0 ), . . . , (An , λn ) . Comme chaque Ai appartient à Y , le point M appartient
à Y , car tout sous-espace affine est « stable par barycentre ». Conclusion : Y = X .
2. L’ensemble B des bases affines de X est stable par l’action naturelle du groupe GA(X)
sur X n+1 , d’où une action de GA(X) sur B . Soient en effet β := (A0 , . . . , An ) une base affine de X et g une transformation affine de X . Si Y est un sous-espace affine de X contenant
c Dunod 2014
I.2 : Actions de groupes
29
tous les points g(Ai ), g −1 (Y ) est un sous-espace affine de X contenant tous les Ai . Par défini
tion d’une base affine, g −1 (Y ) = X , d’où ( g étant surjective) Y = g g −1 (Y ) = g(X) = X .
Ainsi, g(β) est une base affine de X .
Montrons que l’action de GA(X) sur B est simplement transitive. Considérons deux bases
affines de X : β := (A0 , . . . , An ) et β ′ := (A′0 , . . . , A′n ). Il s’agit de prouver qu’il existe
une unique transformation affine g de X telle que g(Ai ) = A′i pour i = 0, . . . , n. Ces n + 1
−−−→
−−−→
égalités sont équivalentes aux suivantes : g(A0 ) = A′0 et ~g (A0 Ai ) = A′0 A′i pour i = 1, . . . , n.
−−−→
−−−→
−−−→
−−−→
Puisque (A0 A1 , . . . , A0 An ) et (A′0 A′1 , . . . , A′0 A′n ) sont deux bases de E , il existe une unique
−−−→
−−−→
transformation linéaire γ de E telle que γ(A0 Ai ) = A′0 A′i pour i = 1, . . . , n. Il est alors
clair qu’il y a une seule transformation affine g de X vérifiant les égalités ci-dessus, à savoir
−−−→
l’application M 7→ A′0 + γ(A0 M ).
Soit β := (A0 , . . . , An ) une base affine de X et S := {A0 , . . . , An } . Notons Γ le stabilisateur de S pour l’action naturelle de GA(X) sur l’ensemble des parties de X . Autrement dit, Γ
est formé des g ∈ GA(X) tels que g(S) = S . Définissons une application π de Γ dans S(S)
comme suit. Soit g ∈ Γ. Puisque g est une permutation de X et g(S) = S , la restriction de g
à S est une permutation de S , nous la notons π(g).
Il est clair que π est un morphisme car, pour tous g, h ∈ Γ, (g ◦ h)|S = (g|S ) ◦ (h|S ). Ce
morphisme est injectif. Soit en effet g ∈ Ker π . Par définition, g(Ai ) = Ai pour i = 0, . . . , n,
autrement dit g · β = β . D’où g = IdX , puisque l’action de G sur B est simplement transitive. Pour la même raison, π est surjectif. Soit en effet s ∈ S(S). Évidemment, β ′ := (s(A0 ), . . . , s(An )) est encore une base affine de X (cf. la condition a)). Il
existe donc un unique élément g de G tel que g · β = β ′ , c’est-à-dire g(Ai ) = s(Ai )
pour i = 0, . . . , n. La restriction de g à S est ainsi égale à s, i.e. π(g) = s.
Conclusion : π est un isomorphisme de Γ sur S(S). Enfin, la bijection i 7→ Ai−1 de [[1, n+1]]
sur S induit un isomorphisme θ de Sn+1 sur S(S), et θ−1 ◦ π est un isomorphisme de Γ
sur Sn+1 .
I.2.13 Notons E la direction de X et T (X) le groupe des translations de X . Avec les notations
standard, ~u 7→ tu~ est un isomorphisme du groupe additif de E sur T (X). L’idée fondamentale
est d’utiliser la formule de conjugaison (formule (6) de la page 64), que nous rappelons par
commodité :
f ◦ tu~ ◦ f −1 = tf~(~u) .
(∗)
Cette formule est valable pour tout vecteur ~u ∈ E et toute transformation affine f de X .
Soit alors g un élément du centre de GA(X), autrement dit, g commute avec tout élément
de GA(X). En particulier, g commute avec toute translation de X . En d’autres termes, pour
tout ~u ∈ E , les translations de vecteurs ~u et ~g (~u) sont égales, i.e. ~g(~u) = ~u . Il en résulte que ~g = IdE . Cette propriété caractérise les translations, donc g est une translation :
il existe ~v ∈ E tel que g := t~v .
Il reste à montrer que ~v = 0 , sauf peut-être dans le cas particulier signalé dans l’énoncé. La
formule (∗), dans laquelle ~u est remplacé par ~v , montre que f~(~v ) = ~v pour toute transformation affine f de X . L’application f 7→ f~ est un morphisme surjectif de GA(X) sur GL(E)
(cf. la section 1.2). Il en résulte que γ(~v ) = γ(~v ) pour toute transformation linéaire γ de E .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
30
Autrement dit, ~v est un point fixe pour l’action naturelle de GL(E) sur E . Or, d’après l’exercice 3 de la page 66, il y a deux orbites pour cette action, à savoir {0} et E \ {0} . Ainsi, 0
est le seul point fixe de cette action, et par conséquent ~v = 0 , sauf dans le cas où E \ {0} est
un singleton. Puisque E est en bijection avec K n , ce cas particulier se produit si, et seulement
si, card E = 2 , c’est-à-dire si, et seulement si, n = 1 et card K = 2 .
I.2.14 Le cardinal de K 2 est 4 . En numérotant les points de K 2 de 1 à 4 , on définit un isomorphisme θ de S(K 2 ) sur S4 . Nous allons montrer que le groupe GA(K 2 ) est d’ordre
(ou cardinal) 24 . Si c’est vrai, on aura GA(K 2 ) = S(K 2 ), autrement dit toute permutation
de K 2 sera une transformation affine du plan K 2 , c’est là une propriété très particulier au
cas K := Z/2Z.
L’application ϕ : f 7→ f~ est un morphisme surjectif de GA(K 2 ) sur GL(K 2 ), de
noyau T (K 2 ), groupe des translations (cf. la section 1.2). Le groupe T (K 2 ) est isomorphe
au groupe additif de K 2 = (Z/2Z)2 , il est donc d’ordre 4 . Par ailleurs, le groupe GL(K 2 ),
isomorphe à GL2 (K), est d’ordre 6 , comme le montre la proposition 12 de la page 85
(prendre n := 2 et q := 2 dans cette formule). Cela étant, le théorème d’isomorphisme
montre que le morphisme ϕ induit un isomorphisme de GA(K 2 )/ Ker ϕ = GA(K 2 )/T (K 2 )
sur GL(K 2 ). D’après la proposition 13 de la page 72, on en déduit les égalités :
card GA(K 2 ) = card T (K 2 ) × card GL(K 2 ) = 4 × 6 = 24,
comme annoncé.
Nous disposons maintenant d’un isomorphisme ϕ de GA(K 2 ) sur S4 . Nous savons
que T (K 2 ) est un sous-groupe de GA(K 2 ), isomorphe à (Z/2Z)2 . C’est un sous-groupe
distingué de GA(K 2 ) (cf. la section 1.2). Par transport de structure, l’image de T (K 2 ) par θ
est un sous-groupe distingué de S4 , isomorphe à (Z/2Z)2 .
I.2.15 Soit donc G un groupe fini, de cardinal m. D’après le théorème de Cayley (cf. la section
1.1), G est isomorphe à un sous-groupe de Sm . Pour conclure, il suffit donc de montrer,
par exemple, que Sm est isomorphe à un sous-groupe de Am+2 . Identifions Sm au sousgroupe de Sm+2 formé des permutations de [[1, m + 2]] laissant fixes m + 1 et m + 2 .
Notons t ∈ Sm+2 la transposition (m + 1 m + 2), échangeant m + 1 et m + 2 . Définissons
ensuite une application f : Sm → Sm+2 en posant, pour toute permutation s ∈ Sm :
(
s
si ε(s) = 1
f (s) =
s ◦ t si ε(s) = −1 .
Dans cette formule, ε : Sm+2 → {−1, 1} est le morphisme de signature. Montrons d’abord
que f est un morphisme. Soient s, s′ ∈ Sm . Il s’agit de montrer que f (s ◦ s′ ) = f (s) ◦ f (s′ ).
Notons que les permutations s′ et t de [[1, m + 2]] commutent, parce que leurs supports sont
disjoints. Séparons les différents cas possibles, suivant les valeurs de ε(s) et ε(s′ ). Rappelons
que ε(s ◦ s′ ) = ε(s)ε(s′ ).
- Si ε(s) = ε(s′ ) = 1 , on a f (s) = s, f (s′ ) = s′ et f (s ◦ s′ ) = s ◦ s′ ,
d’où f (s ◦ s′ ) = f (s) ◦ f (s′ ).
- Si ε(s) = 1 et ε(s′ ) = −1 , on a f (s) = s, f (s′ ) = s′ ◦ t et f (s ◦ s′ ) = (s ◦ s′ ) ◦ t,
d’où f (s ◦ s′ ) = f (s) ◦ f (s′ ).
c Dunod 2014
I.2 : Actions de groupes
31
Si ε(s) = −1 et ε(s′ ) = 1 , on a f (s) = s ◦ t, f (s′ ) = s′ et f (s ◦ s′ ) = (s ◦ s′ ) ◦ t,
d’où f (s ◦ s′ ) = s ◦ (s′ ◦ t) = s ◦ (t ◦ s′ ) = f (s) ◦ f (s′ ).
- Si ε(s) = ε(s′ ) = −1 , on a f (s) = s ◦ t, f (s′ ) = s′ ◦ t et f (s ◦ s′ ) = s ◦ s′ ,
d’où f (s ◦ s′ ) = (s ◦ t) ◦ (s′ ◦ t) = (s ◦ t) ◦ (t ◦ s′ ) = s ◦ s′ = f (s) ◦ f (s′ ).
Ainsi, f est un morphisme de Sm dans Sm+2 . Ce morphisme est injectif. Soit en effet s ∈ Ker f . Si ε(s) = 1 , s = f (s) = 1 . Si ε(s) = −1 , 1 = f (s) = s ◦ t, soit s = t−1 = t,
ce qui est absurde, car t n’appartient pas à Sm , i.e. ne fixe pas m + 1 et m + 2 . D’où l’injec
tivité de f . La formule définissant f (s) montre que ε f (s) = 1 pour tout s ∈ Sm . Ainsi, f
est en fait un morphisme injectif de Sm dans Am+2 , c’est donc un isomorphisme de Sm sur
un sous-groupe de Am+2 . D’où la conclusion.
-
I.2.16 Rappelons que l’action de G par translations à gauche sur G/H , ensemble des classes à
gauche de G modulo H , est définie par (g, C) 7→ gC lorsque g ∈ G et C est une classe
à gauche de G modulo H . Soit C ∈ G/H . Déterminons le stabilisateur GC de C dans
cette action de G sur G/H . Par définition, GC := g ∈ G | gC = C . Soit a ∈ C ,
de sorte que C = aH , classe à gauche de a modulo H . Notons que, si x est un élément
de G, xH = H si, et seulement si, x ∈ H . Pour tout g ∈ G, on a donc les équivalences :
(gC = C) ⇐⇒ (gaH = aH) ⇐⇒ (a−1 gaH = H) ⇐⇒ (a−1 ga ∈ H) ⇐⇒ (g ∈ aHa−1 ).
d’où la formule suivante :
GaH = aHa−1
pour tout a ∈ G.
(25)
Le noyau K de l’action de G sur G/H est formé des g ∈ G tels que gC = C pour toute
classe C ∈ G/H , c’est l’intersection des stabilisateurs GaH lorsque a parcourt G. D’où :
\
aHa−1 .
K =
a∈G
Les conjugués de H dans G étant par définition les sous-groupes aHa−1 , où a ∈ G, K est
bien l’intersection de ces conjugués. Le sous-groupe K est aussi le noyau du morphisme de G
dans S(G/H) associé à l’action considérée. En tant que noyau, c’est un sous-groupe distingué
de G. Il est inclus dans H (prendre a = 1 ). Soit inversement K ′ un sous-groupe distingué
de G inclus dans H . Pour tout a ∈ G, K ′ = aK ′ a−1 ⊂ aHa−1 . Ainsi, K ′ est inclus
dans tout conjugué de H dans G, il est donc contenu dans l’intersection de ces conjugués, à
savoir K .
I.2.17 a) Soit S une partie génératrice finie de G, card S := k . Fixons un entier n ∈ N∗ ,
et soit Gn l’ensemble des sous-groupes d’indice n de G. Considérons un tel sousgroupe H , et soit K l’intersection des conjugués de H dans G. Appliquons l’exercice précédent. D’abord, K est un sous-groupe distingué de G. Ensuite, K est le noyau du morphisme ϕ : G → S(G/H) donnant l’action de G par translations à gauche sur G/H , ensemble des classes à gauche de G modulo H . D’après le théorème d’isomorphisme, G/K est
isomorphe à Im ϕ. Comme l’ensemble G/H est de cardinal fini n, le groupe S(G/H) est
d’ordre fini n!. D’après le théorème de Lagrange, G/K est d’ordre fini divisant n!. Autrement
dit, l’indice d := (G : K) de K dans G est fini et divise n!. Choisissons une bijection ψ
de G/K sur Γd := [[1, d]] . Par transport de structure, nous déduisons de la loi de groupe
de G/K une loi de groupe ∗ sur l’ensemble Γd (cette loi dépend non seulement de d, mais
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
32
aussi de H ), et ψ devient un isomorphisme de G/K sur (Γd , ∗). Soit π : G → G/K la projection canonique. Le composé θ := ψ ◦ π est alors un morphisme de G dans (Γd , ∗), ayant
pour noyau K , c’est là le point essentiel.
b) Soient en général d ∈ N∗ et Γ un groupe d’ordre d. Notons Hom(G, Γ) l’ensemble des
morphismes de G dans Γ. À un tel morphisme f , associons sa restriction f|S à la partie
génératrice donnée de G. L’application f 7→ f|S de Hom(G, Γ) dans F (S, Γ), ensemble
de toutes les applications de S dans Γ est injective. En effet, si f, f ′ : G → Γ sont deux
morphismes coïncidant sur S , ils sont égaux, puisque g ∈ G | f (g) = f ′ (g) est un sousgroupe de G contenant la partie génératrice S . L’ensemble F (S, Γ) étant de cardinal fini dk ,
il en résulte que l’ensemble Hom(G, Γ) est fini, de cardinal au plus égal à dk .
c) Soient H et K comme dans l’alinéa a). Nous avons montré qu’il existe :
- un entier d > 1 divisant n! ;
- une loi de groupe (∗) sur l’ensemble [[1, d]] ;
- un morphisme θ de G dans le groupe [[1, d]], ∗
tels que le noyau de θ soit égal à K . Il n’y a qu’un nombre fini de possibilités pour l’entier d.
Lorsque d est fixé, il n’y a qu’un nombre fini de possibilités pour la loi ∗ , qui n’est qu’une
application de [[1, d]] × [[1, d]] dans [[1, d]] (possédant certaines propriétés). Enfin, si d et la
loi ∗ sont fixés, l’alinéa précédent montre qu’il n’y a qu’un nombre fini de possibilités pour le
morphisme θ , donc pour son noyau K . Au total, il n’y a qu’un nombre fini de sous-groupes
distingués de G tels que K .
Supposons maintenant que K soit fixé. Quelles sont les possibilités pour H ? Il faut au
moins que H soit un sous-groupe de G contenant K . D’après la première section du module I.1, H 7→ H/K est une bijection de l’ensemble des sous-groupes de G contenant K sur
l’ensemble des sous-groupes de G/K . Puisque G/K est fini, il n’y a qu’un nombre fini de
sous-groupes H de G contenant K . Ainsi, lorsque K est fixé, il n’y a qu’un nombre fini de
possibilités pour H . En conclusion, il n’y a qu’un nombre fini de sous-groupes H d’indice n
de G.
I.2.18 Écartons le cas trivial s = 1 := IdX (l’ordre de s est alors 1 ). Soient S1 , . . . , Sr les
orbites non ponctuelles de X sous hsi (ainsi r > 1 ). La décomposition canonique de s s’écrit
(en supprimant le symbole de composition ◦ ) s = c1 c2 · · · cr où, pour tout i , ci est un cycle
ayant pour support Si , de sorte que ci est de longueur mi := card Si . Nous allons établir la
formule suivante :
ordre(s) = card hsi = ppcm(m1 , . . . , mr ) := m.
(∗)
Soit en général c := (a1 a2 · · · ak ) un cycle de longueur k > 2 . Rappelons que l’ordre de c
est égal à k (que l’ensemble X soit fini ou non, d’ailleurs). En effet, pour tout entier j ∈ [[1, k]],
on a aj = cj−1 (a1 ). Ainsi, ck (a1 ) = c ck−1 (a1 = c(ak ) = a1 . Pour tout j ∈ [[2, k]], on en
déduit que ck (aj ) = ck+j−1 (a1 ) = cj−1 ck (a1 ) = cj−1 (a1 ) = aj . Par ailleurs, c laisse fixe
tout élément de X distinct des aj , il en est donc de même pour ck , ce qui montre que ck = 1 .
En revanche, si j ∈ [[1, k − 1]], cj 6= 1 puisque cj (a1 ) = aj+1 6= a1 . L’ordre de c est donc
bien égal à k .
i
Revenons aux ci et à s. Pour tout i , cm
= 1 , d’où cm
= 1 , puisque m est multiple
i
i
m
m
de mi . Puisque les ci commutent deux à deux, sm = (c1 c2 · · · cr )m = cm
1 c2 · · · cr = 1 .
L’ordre d de s divise donc m. Montrons inversement que d est multiple de m, i.e. que d
c Dunod 2014
I.2 : Actions de groupes
33
est multiple de chaque mi . Soit i ∈ [[1, r]] , notons ri le reste de la division de d par mi , et
soit a ∈ Si . Puisque ci est d’ordre mi , cdi (a) = cri i (a). Mais ci est la restriction de s à Si ,
donc cd (a) = sd (a) = a. D’où cri i (a) = a. Comme ri ∈ [[0, mi − 1]], cela n’est possible que
si ri = 0 , par définition d’un cycle de longueur mi . Ainsi, d est un multiple de mi , ce qui
achève la démonstration de la formule (∗).
I.2.19 Soit donc s une permutation de [[1, n]], n > 2 . D’après le théorème 19 de la page 80, s peut
se décomposer sous la forme s = c1 ◦ c2 ◦ · · · ◦ cr , où les cj sont des cycles à supports deux à
deux disjoints, et une telle décomposition est unique, à l’ordre des facteurs près. Le programme
ci-dessous détermine les cycles c1 , . . . , cr .
Nous représenterons s par la liste s := s(1), . . . , s(n) . Le programme calcule et renvoie la liste [c1 , . . . , cr ]. Si le cycle cj est égal à (aj,1 aj,2 · · · aj,hj ), il est représenté
sous forme de liste : [aj,1 , aj,2 , · · · , aj,hj ]. Pour avoir unicité, on impose deux conditions :
d’une part aj,1 < aj,i pour tous i, j tels que 1 6 j 6 r et 2 6 i 6 hj , et d’autre
part a1,1 < a2,1 < · · · < ar,1 .
Rappelons que le support de s, noté Supp(s), est le complémentaire de l’ensemble des points
fixes de s : Supp(s) := k ∈ [[1, n]] | s(k) 6= k . Les éléments de Supp(s) sont exactement
les aj,i . Le programme détermine successivement les aj,1 . Pour chaque j , il calcule le plus
petit entier hj > 1 tel que shj (aj,1 ) = aj,1 , cj étant alors donné par la formule :
cj := aj,1 , s(aj,1 ), s2 (aj,1 ), . . . , shj −1 (aj,1 ) .
Quelques précisions concernant les listes :
- les listes intervenant ici sont formées d’éléments deux à deux distincts ;
- la liste vide est notée [ ] ;
- la fonction taille(L) rend le nombre d’éléments de la liste L ;
- la concaténation de deux listes L et L′ est notée conc(L,L’) ;
- la procédure k dans L renvoie vrai si k appartient à la liste L et faux sinon.
Decompositionencycles(s)
n := taille(s);
support := [ ];
decomposition := [ ];
pour k de 1 à n-1 faire
si k dans support alors rien sinon
si s[k] = k alors rien sinon
j := k; cycle := [k]; (*début d’un nouveau cycle*)
tant que s[j] <> k faire
cycle := conc(cycle,[j]);
support := conc(support,cycle);;
decomposition := conc(decomposition,[cycle]);;
rendre(decomposition)
Par exemple, si n := 10 et si l’on rentre s := [10, 9, 8, 7, 2, 6, 1, 3, 5, 4], le programme renvoie : [[1, 10, 4, 7], [2, 9, 5], [3, 8]]. Autrement dit, la décomposition canonique de s
est s = (1 10 4 7) ◦ (2 9 5) ◦ (3 8). Le seul point fixe de s est 6 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
34
I.2.20 Considérons les 3 -cycles a := (1 2 3), b := (4 5 6), c := (7 8 9), et notons H le
sous-groupe de S9 engendré par S := {a, b, c} . Nous allons d’abord montrer que H est
d’ordre 27 . Considérons l’application f : (i, j, k) 7→ ai bj ck de Z3 dans S9 . Son image est
contenue dans H . Ensuite, f est un morphisme, parce que a, b, c commutent deux à deux. Il en
résulte que Im f est un sous-groupe de H . Comme il contient a = f (1, 0, 0), b = f (0, 1, 0)
et c = f (0, 0, 1), il est égal à H : H = Im f .
Soit (i, j, k) ∈ Z3 . Notons i′ , j ′ , k ′ les restes des divisions de i, j, k respectivement par 3 .
′
′
′
Comme a3 = b3 = c3 = 1 , on a ai = ai , bj = bj et ck = ck , d’où f (i, j, k) = f (i′ , j ′ , k ′ ).
Il en résulte que H = f (T ), où T := {0, 1, 2}3 . Autrement dit, la restriction de f à T
induit une surjection ϕ de T sur H . Cette restriction est aussi injective, ce qui revient à dire
que T ∩ Ker f = {(0, 0, 0)} . Soit en effet (i, j, k) ∈ T tel que la permutation s := ai bj ck soit
égale à 1 . La restriction de s à {1, 2, 3} est (1 2 3)i , ce qui montre que i est multiple de 3 ,
puisque le 3 -cycle (1 2 3) ∈ S {1, 2, 3} est d’ordre 3 . Ainsi, i = 0 , et de même j = k = 0 .
En conclusion, ϕ est une bijection de T sur H , d’où card H = card T = 27 . En d’autres
termes, nous avons montré que tput élément h de H s’écrit de manière unique sous la forme :
h = ai b j ck ,
où (i, j, k) ∈ {0, 1, 2}3.
(∗)
Puisque a, b, c commutent deux à deux, cette formule montre aussi que H est commutatif.
Considérons maintenant la permutation d := (1 4 7)(2 5 8)(3 6 9). Elle est d’ordre 3 (cf. l’exercice I.2.18 de la page 91). Le sous-groupe K de S9 engendré par d est donc d’ordre 3 . Rappelons ici une formule de conjugaison établie dans le module II.2 (section 2.3) de [L1]. Soient X
un ensemble (fini ou non), (a1 a2 · · · ak ) un cycle de longueur k > 2 et s une permutation
quelconque de X . Alors :
s ◦ (a1 a2 · · · ak ) ◦ s−1 = s(a1 ) s(a2 ) · · · s(ak ) .
(∗∗)
Dans la situation présente, il vient :
dad−1 = d(1) d(2) d(3) = (4 5 6) = b,
dbd−1 = d(4) d(5) d(6) = (7 8 9) = c,
dcd−1 = d(7) d(8) d(9) = (1 2 3) = a.
Considérons l’automorphisme α : s 7→ dsd−1 de S9 (conjugaison par d). L’image de H
par α est un sous-groupe de S9 . Puisque H est engendré par S = {a, b, c} , α(H)
est engendré par {α(a), α(b), α(c)} = {b, c, a} = S , donc α(H) = H . En d’autres
termes, dHd−1 = H . Appliquons l’exercice I.2.7 de la page 90, dont nous reprenons les
notations, en posant ici G := S9 . L’égalité dHd−1 = H signifie que d ∈ NG (H),
d’où K = hdi ⊂ NG (H). L’exercice en question montre que HK := {hk | (h, k) ∈ H × K}
est un sous-groupe de G. Nous allons montrer que HK est d’ordre 81 .
Il est clair que HK contient H : h = h1 ∈ HK pour tout h ∈ H , de même HK contient K .
Nous savons aussi que H est un sous-groupe distingué de HK , et il alors clair que le groupe
quotient HK/H est engendré par la classe de d modulo H . Or, d3 = 1 , mais d ∈
/ H , par
exemple parce que H est commutatif, alors que dad−1 = b 6= a, i.e. d ne commute pas avec a.
Il en résulte que la classe de d modulo H est d’ordre 3 , et par suite card (HK/H) = 3 ,
i.e. (HK : H) = 3 . Enfin, card H = 27 , et la proposition 13 de la page 72 montre que HK
est d’ordre 3 × 27 = 81 .
c Dunod 2014
I.2 : Actions de groupes
35
I.2.21 1. Puisque l’ordre de G, à savoir 2n, est multiple de 2 , le théorème de Cauchy (cf. la section 2.3 de la page 71) montre que G possède effectivement un élément c d’ordre 2 . Soit a
un élément quelconque de G. Puisque c2 = 1 mais c 6= 1 , les éléments a, ca sont distincts, et c(ca) = a. Dans l’action de G sur lui-même par translations à gauche, l’orbite de a
sous hci = {1, c} est donc {a, ca} . Cette orbite est aussi l’orbite de a sous hϕ(c)i, dans
l’action naturelle de S(G) sur G. Ainsi, toute orbite de hϕ(c)i est de cardinal 2 . Comme G
est de cardinal 2n, il y a n orbites de G sous hϕ(c)i. D’après la preuve du théorème 19 de
la page 80, cela montre que la permutation ϕ(c) de G est la composée de n transpositions à
supports deux à deux disjoints.
2. Puisque ϕ(c) est un produit de n transpositions, on a ε ϕ(c)
= (−1)n .
Ainsi, (ε ◦ ϕ)(c) = −1 , parce que n est impair. Cela montre que le morphisme ε ◦ ϕ : G → {−1, 1} est surjectif. D’après le théorème d’isomorphisme, ε ◦ ϕ induit
donc un isomorphisme du quotient G/ Ker(ε ◦ ϕ) sur {−1, 1} , en particulier G/ Ker(ε ◦ ϕ)
est d’ordre 2 , autrement dit Ker(ε ◦ ϕ) est un sous-groupe d’indice 2 de G. Ce sous-groupe
est distingué dans G, pour deux raisons (une suffit !) : d’une part c’est le noyau d’un morphisme partant de G, et d’autre part tout sous-groupe d’indice 2 d’un groupe est distingué,
nous l’avons vu dans la section 3.4 de la page 83.
I.2.22 1. Soient A et B deux éléments de E . Alors A et B ont même cardinal k , donc X \ A
et X \B ont même cardinal N −k . Il existe donc une bijection σ de A sur B et une bijection τ
de X \A sur X \B . Supposons que σ et τ aient été choisies. L’application s : X → X définie
par s(x) := σ(x) lorsque x ∈ A et s(x) := τ (x) lorsque x ∈
/ A est surjective, puisque s(X)
contient σ(A) = B ainsi que τ (X \ A) = X \ B . Ainsi, s est une permutation de X ,
et s(A) = σ(A) = B . Puisque A et B étaient quelconques, l’action de S(X) sur E est
transitive.
Montrons que cette action est fidèle. Étant donnée une permutation s de X distincte de
l’identité, il s’agit de trouver un élément A de E tel que s(A) 6= A. Soit x ∈ X tel
que y := s(x) 6= x. Puisque N − 2 > k − 1 , nous pouvons choisir une partie T à k − 1
éléments de X \ {x, y} . Posons A := T ∪ {x} . C’est une partie à k éléments de X , i.e. un
élément de E , et x ∈ A mais y ∈
/ A. Dans ces conditions, y = s(x) ∈ s(A), d’où s(A) 6= A.
Soit A ∈ E . Toute permutation s de X telle que s(A) = A induit (par restriction) une permutation sA de A et une permutation sX\A de X \ A. L’application s 7→ (sA , sX\A ) de S(X)A ,
stabilisateur de A dans S(X), dans S(A) × S(X \ A) est évidemment un morphisme. Il est
injectif, car, si s est un élément de son noyau, s(x) = x pour tout x ∈ A et tout x ∈ X \ A,
donc s = IdX . Ce morphisme est aussi surjectif. En effet, si σ ∈ S(A) et τ ∈ S(X \ A),
le premier alinéa prouve l’existence d’une permutation s de X prolongeant σ et τ , i.e. telle
que sA = σ et sX\A = τ (prendre B := A). Ledit morphisme est donc un isomorphisme
de S(X)A sur S(A) × S(X \ A).
2. Soit {A, B} une paire d’éléments de E ( A 6= B ). Pour toute permutation s de X , on
a card s(A) ∩ s(B) = card s(A ∩ B) = card (A ∩ B). Si donc {A′ , B ′ } est une paire
d’éléments de E appartenant à l’orbite de {A, B} , on a card (A′ ∩ B ′ ) = card (A ∩ B).
Cette condition est aussi suffisante. Soient en effet {A, B} et {A′ , B ′ } deux paires d’éléments de E telles que card (A′ ∩ B ′ ) = card (A ∩ B) := h. Les parties de X suivantes : A ∩ B, A \ B, B \ A et X \ (A ∪ B) forment une partition de X , et les cardinaux de
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
36
ces parties sont, dans l’ordre : h, k − h, k − h, N − 2k + h. Il en est de même pour les parties A′ ∩ B ′ , A′ \ B ′ , B ′ \ A′ et X \ (A′ ∪ B ′ ). Un raisonnement analogue à celui du début de
la question 1, avec quatre parties au lieu de deux, montre qu’il existe une permutation s de X
appliquant A ∩ B, A \ B, B \ A et X \ (A ∪ B) respectivement sur A′ ∩ B ′ , A′ \ B ′ , B ′ \ A′
et X \ (A′ ∪ B ′ ). Alors s · {A, B} = s(A), s(B) = {A′ , B ′ } , donc {A′ , B ′ } et {A, B}
appartiennent à une même orbite sous S(X).
Soient {A, B} une paire d’éléments de E et h := card (A ∩ B). Alors :
card (A ∪ B) = card A + card B − card (A ∩ B) = 2k − h 6 N = card X,
d’où max(0, 2k − N ) 6 h 6 k . Inversement, si h est un entier vérifiant ces inégalités, il est
facile de construire une paire {A, B} d’éléments de E telle que card (A ∩ B) = h. D’où
une bijection de [[max(0, 2k − N ), k]] sur l’ensemble des orbites de S(X) sur l’ensemble des
paires d’éléments de E .
3. Considérons une transposition t := (x y) de X . Calculons la signature de la permutation ϕ(t) de E correspondante. Puisque ϕ(t)2 = ϕ(t2 ) = IdE , nous savons que ϕ(t) est la
composée d’un certain nombre r de transpositions de E à supports deux à deux disjoints, et
l’on a ε ϕ(t) = (−1)r . La réunion des supports en question est le complémentaire de l’en
semble des points fixes de s dans E , c’est-à-dire le complémentaire de A ∈ E | t(A) = A .
Comptons donc les parties A à k éléments de X telles que t(A) = A. Puisque t échange x, y
et laisse fixes les autres éléments de X , les parties A en question sont :
- d’une part les parties A à k éléments de X ne contenant ni x ni y , i.e. les parties
N −2
à k éléments de X \ {x, y} . Ces parties A sont au nombre de
(qui vaut 0
k
si k := N − 1 ) ;
- d’autre part, les parties A à k éléments de X contenant x et y , i.e. de la
forme A := P ∪ {x, y} , où P est une partie à k − 2 éléments de X \ {x, y} . Ces
N −2
parties A sont au nombre de
.
k−2
N −2
N −2
Le nombre de points fixes de t sur E est donc
+
. Par ailleurs, on a :
k
k−2
N
N −1
N −1
card E =
=
+
k
k
k−1
N −2
N −2
N −2
N −2
=
+
+
+
, d’où :
k
k−1
k−1
k−2
N −1
N −2
N −2
N −2
N
N −2
= 2
.
−
−
−
=
2r = card (E) −
k−1
k−2
k
k
k−2
k
N −2
Ainsi r =
ne dépend pas de t (i.e. de x et y ), et la signature de ϕ(t) est donc :
k−1
ε ϕ(t) = (−1)r .
Puisque les transpositions engendrent S(X), l’image de ϕ est contenue dans le groupe alterné A(E) si, et seulement si, ϕ(t) ∈ A(E) pour toute transposition t de X , c’est-à-dire si,
et seulement si, (−1)r = 1 .
c Dunod 2014
I.2 : Actions de groupes
37
Conclusion : l’image de ϕ est contenue dans le groupe alterné A(E) si, et seulement
N −2
si,
est pair.
k−1
I.2.23 Soient s un élément non trivial de Sn et s := c1 c2 · · · cr sa décomposition canonique
comme produit de cycles à supports deux à deux disjoints. D’après l’exercice I.2.18 de la
page 91, l’ordre de s est le ppcm des longueurs des cycles ci . Il en résulte que la permutation s est d’ordre 2 si, et seulement si, c’est un produit d’un certain nombre (évidemment
inférieur ou égal à n/2 ) de transpositions à supports deux à deux disjoints.
Pour tout entier r ∈ [[1, E(n/2)]], notons Cr l’ensemble des permutations de [[1, n]] qui sont
produit de r transpositions à supports deux à deux disjoints. Comme nous l’avons vu dans la
section 3.3, chaque Cr est une classe de conjugaison de Sn . Ce sont donc là exactement les
classes de conjugaison de Sn formées d’éléments d’ordre 2 .
L’entier n étant fixé, calculons, pour tout entier r ∈ [[1, E(n/2)]], le cardinal Nr de Cr . Le
cas r := 1 est évident. En effet, une transposition t := (i j) est parfaitement déterminée par
son support {x, y} , qui est une partie à deux éléments de [[1, n]]. Le nombre de transpositions
n
dans Sn est donc N1 =
. Supposons maintenant qu’on ait r > 2 , d’où n > 4 . No2
tons Ar l’ensemble des arrangements de 1, . . . , n pris 2r à 2r . Un élément de Ar est donc
un 2r -uplet injectif α := (j1 , . . . , j2r ) d’entiers compris entre 1 et n. Dans le module II.1
de [L1], nous avons vu que le cardinal de Ar est n!/(n − 2r)!.
À tout arrangement α := (j1 , . . . , j2r ) ∈ Ar , associons la permutation de [[1, n]] suivante : s := (j1 j2 )(j3 j4 ) · · · (j2r−1 j2r ). Nous définissons ainsi une application f
de Ar dans Cr . Le théorème 19 de la page 80 montre que f est surjective. Mieux :
si s ∈ Cr est donnée, l’écriture de s comme produit de r transpositions à supports deux
à deux disjoints est unique, à l’ordre des facteurs près. Plus précisément, une écriture telle
que s := (j1 j2 )(j3 j4 ) · · · (j2r−1 j2r ) de s est unique, à l’ordre des facteurs près, et à
l’échange près, pour chaque facteur (j2i−1 j2i ), de j2i−1 et j2i . On en déduit aussitôt que s
possède exactement 2r r! antécédents par f . La formule de Fubini (cf. la section 2.1 du module
II.1 de [L1]) donne donc :
Cr =
card Ar
n!
= r
·
r
2 r!
2 r!(n − 2r)!
(∗)
Soit α un automorphisme de Sn . L’image par α d’une classe de conjugaison de Sn est aussi
une classe de conjugaison de Sn . Par ailleurs, α conserve l’ordre des éléments de Sn . il
existe donc un entier r ∈ [[1, E(n/2)]] tel que α(C1 ) = Cr , d’où Nr = N1 . Il s’agit d’en
déduire que r := 1 , sauf peut-être si n := 6 . Supposons donc que r soit supérieur ou égal à 2
(ainsi, n > 4 ).
Rappelons que la signature ε est le seul morphisme non trivial de Sn dans {−1, 1} . Comme
le morphisme ε ◦ α est non trivial, ε ◦ α = ε , autrement dit α conserve la parité. Puisque les
transpositions sont des permutations impaires, nécessairement r est impair. Ainsi r > 3 , et
donc n > 6 . Cela étant , l’égalité (∗) donne :
d’où, puisque n > 2r :
n(n − 1)
n!
= N1 = Nr = r
,
2
2 r!(n − 2r)!
2r−1 r! = (n − 2)(n − 3) · · · (n − 2r + 1) > (2r − 2)(2r − 3) · · · 1 = (2r − 2)!.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
38
En divisant par tous les entiers pairs entre 2 et 2r − 2 , il reste :
r > 1 × 3 × 5 × · · · × (2r − 3).
En particulier r > 2r − 3 , c’est-à-dire r 6 3 , et donc r = 3 . Nous avons maintenant :
24 = 2r−1 r! = (n − 2)(n − 3) · · · (n − 5),
égalité qui est vraie lorsque n = 6 mais fausse si n > 6 , puisque le second membre croît strictement avec n. En conclusion, si r est l’entier tel que α(C1 ) = Cr , on a r = 1 , sauf peut-être
si n := 6 et r := 3 . Lorsque n := 6 , la formule (∗) montre effectivement que N3 = N1 = 15 .
Par ailleurs, on peut montrer (mais nous ne le ferons pas ici) qu’il existe vraiment un automorphisme de S6 appliquant C1 sur C3 .
I.2.24 1. Observons d’abord que f est injective, puisque f 2 est la translation y 7→ y + n de N,
translation qui est injective. Pour tout x ∈ N, on a ensuite :
f (x + n) = f f 2 (x) = f 3 (x) = f 2 f (x) = f (x) + n.
D’où l’égalité annoncée :
f (x + n) = f (x) + n
pour tout x ∈ N.
(∗)
En appliquant cette égalité plusieurs fois, on en déduit ceci (par récurrence sur k ) :
f (x + kn) = f (x) + kn
pour tous x, k ∈ N.
(∗∗)
Ainsi, dès que x, y ∈ N sont congrus modulo n, f (x) et f (y) sont congrus modulo n.
Pour définir l’application s, il est plus simple de considérer l’intervalle E := [[0, n − 1]]. Définissons donc une application s de E dans lui-même ainsi : pour tout a ∈ E , s(a) est le reste
de la division de f (a) par n. Montrons que s est injective (donc bijective). Soient a, b ∈ E tels
que s(a) = s(b). Ainsi, f (a) et f (b) sont congrus modulo n. Si (par exemple) f (b) > f (a), il
existe k ∈ N tel que f (b) = f (a) + kn, d’où f (b) = f (a + kn), en vertu de la formule (∗∗).
D’où b = a + kn, puisque f est injective. Mais a et b appartiennent à E , donc k = 0 ,
soit a = b .
Pour tout x ∈ E , la définition même de s fait que f (x) ≡ s(x) mod n. Montrons
que s2 = Id. Soit a ∈ E . Puisque f (a) est congru à s(a) modulo n, on obtient :
s s(a) ≡ f s(a) ≡ f f (a) = a + n ≡ a mod n.
Comme a et s2 (a) appartiennent à E , il en résulte que s2 (a) = a, d’où l’égalité s2 = Id .
2. Soient f et s comme dans la question 1. Montrons d’abord que s ∈ S(E) n’a pas de point
fixe. Supposons au contraire que s possède un point fixe x, de sorte que f (x) ≡ x mod n.
Puisque x ∈ E et f (x) ∈ N, il existe k ∈ N tel que f (x) = x + kn. Alors :
x + n = f 2 (x) = f (x + kn) = f (x) + kn = x + 2kn,
d’où 2kn = n, ce qui est absurde. Ainsi, la permutation s de E est d’ordre 2 et n’a pas de point
fixe. Il en résulte que s est produit d’un certain nombre m de transpositions à supports deux à
deux disjoints, la réunion de ces supports étant E . On en déduit que n := card E = 2m.
Ce qui précède montre que, si F n’est pas vide, n est nécessairement pair. Supposons désormais que ce soit le cas, et posons m := n/2 . Soit S l’ensemble des permutations de E produits
de m transpositions à supports deux à deux disjoints. Dans l’exercice précédent, nous avons
montré que S est une classe de conjugaison, de cardinal :
card S =
c Dunod 2014
(2m)!
·
2m m!
I.2 : Actions de groupes
39
Le fait que l’ensemble [[1, n]] ait ici été remplacé par E = [[0, n − 1]] n’a évidemment pas
d’importance. En associant à toute fonction f ∈ F la permutation s ∈ S comme dans la
question 1, nous définissons une application ϕ : F → S . Pour calculer le cardinal de F ,
nous allons calculer le cardinal de chaque fibre ϕ−1 (s), s ∈ S . Lorsque s décrit S , ces fibres
forment une partition de F , d’où :
X
card F =
card ϕ−1 (s).
s∈S
Soit donc s ∈ S . Déterminons les f ∈ F tels que ϕ(f ) = s. Considérons une telle fonction f . Soit (a b) l’une des transpositions constituant s, de sorte que s échange a et b . Par
définition, f (a) ≡ b mod n. Il existe donc λ ∈ N tel que f (a) = b + λn. De même f (b) ≡ a
mod n, donc il existe µ ∈ N tel que f (b) = a + µn. D’où :
a + n = f 2 (a) = f (b + λn) = f (b) + λn = a + (λ + µ)n,
ce qui montre que λ + µ = 1 , donc (λ, µ) = (1, 0) ou (λ, µ) = (0, 1).
Écrivons s = t1 t2 . . . , tm , les ti étant des transpositions à supports deux à deux disjoints. En
opérant comme ci-dessus pour chaque ti , on définit une application θ de [[1, m]] dans {0, 1} ,
possédant les deux propriétés suivantes
:
a) Pour tout a ∈ E , θ(a) + θ s(a) = 1 . Autrement dit, θ + θ ◦ s = 1 .
b) Pour tout a ∈ E , f (a) = s(a) + θ(a)n.
Soit alors x ∈ N un entier quelconque. Soient q et r respectivement le quotient et le reste de
la division de x par n. Puisque f (x) = f (r) + qn, nous obtenons la formule :
f (x) = s(r) + q + θ(r) n.
(∗∗∗)
Inversement, soit θ : [[1, m]] → {0, 1} une fonction vérifiant la condition a). Définissons une application f : N → N en définissant f (x) par la formule (∗∗∗), ceci pour
tout x ∈ N. Cette fonction f vérifie évidemment la condition b). Elle vérifie aussi la
condition f (x + kn) = f (x) + kn pour tous x, k ∈ N. Soient a ∈ E et b := s(a),
de sorte que θ(a) + θ(b) = 1 , en vertu de la condition a). Appliquons deux fois la formule (∗∗∗) : f (a) = s(a) + θ(a)n = b + θ(a)n, puis :
f 2 (a) = f b + θ(a)n = s(b) + θ(a) + θ(b) n = a + n.
On en déduit aussitôt que f 2 (x) = x + n pour tout x ∈ N, autrement dit f ∈ F . Enfin, pour
tout a ∈ E , la formule (∗∗∗) montre que f (a) est congru à s(a) modulo n, ce qui signifie
que ϕ(f ) = s. Il est alors immédiat que la fibre ϕ−1 (s) est en bijection avec l’ensemble des
fonctions θ : [[1, m]] → {0, 1} vérifiant la condition a). Le nombre de telles fonctions θ est 2m ,
car il y a deux choix possibles pour la restriction de θ à chacun des supports des si . D’où :
(2m)!
·
m!
En conclusion, l’ensemble F est vide si n est impair et il est de cardinal (2m)!/m! si n := 2m
est pair.
card F = 2m card S =
I.2.25 Supposons d’abord que n soit premier. Considérons, dans le groupe symétrique S(X),
un cycle c de longueur n et une transposition s := (a b). Puisque a appartient
au support de c (ce support est X ), la définiton d’un n-cycle montre que les éléments aj := cj−1 (a), j = 1, . . . , n, sont distincts et que c = a1 a2 · · · an ). Par ailleurs,
puisque b 6= a, il existe un unique k ∈ [[2, n]] tel que b = ak .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
40
Si k = 2 , considérons la bijection f : j 7→ aj de [[1, n]] sur X . Elle induit un isomorphisme ϕ : σ 7→ f ◦ σ ◦ f −1 de Sn sur S(X). On vérifie sans peine que c et s sont les
images respectives par ϕ du n-cycle (1 2 · · · n) et de la transposition (1 2). Il est classique
que (1 2 · · · n) et (1 2) engendrent Sn (cf. le module II.2 de [L1]). Via l’isomorphisme ϕ,
on en déduit que c et s engendrent S(X).
Si k > 3 , nous allons remplacer c par c′ := ck−1 . Montrons que, lorsque i décrit [[0, n − 1]],
les éléments c′ i (a1 ) sont distincts. Soient en effet i, j ∈ [[0, n − 1]] tels que c′ i (a1 ) = c′j (a1 )
et, par exemple, i 6 j . Alors c′j−i = c(j−i)(k−1) laisse fixe a1 . Soit r le reste de la division
de (j − i)(k − 1) par n, de sorte que c(j−i)(k−1) = cr et donc cr (a1 ) = a1 . Il en résulte
que r = 0 , i.e. n divise (j − i)(k − 1). Puisque 1 < k − 1 < n, n ne divise pas k − 1 .
Mais n est premier et divise (j − i)(k − 1). D’après le lemme d’Euclide, n divise j − i . Enfin, 0 6 j−i < n, donc j = i . Les c′ i (a1 ) sont donc bien distincts, et il en résulte que c′ est lui
aussi un n-cycle : c′ = a1 c′ (a1 ) · · · c′n−1 (a1 ) . Cette fois, b = ak = ck−1 (a1 ) = c′ (a1 ).
D’après le cas traité ci-dessus ( cas k = 2 ), le groupe S(X) est engendré par c′ et s,
ce que nous notons hc′ , si = S(X). Puisque c′ est une puissance de c, on a hc′ i ⊂ hci,
d’où S(X) = hc′ , si ⊂ hc, si, et par conséquent hc, si = S(X).
Pour terminer, supposons que n ne soit pas premier. Il s’écrit donc n := pq , où p et q sont deux
entiers strictement supérieurs à 1 . Dans le groupe Sn , considérons le n-cycle c := (1 2 · · · n)
et la transposition s = (1 p + 1). Montrons que hc, si 6= S(X). L’idée est d’observer que cp
est produit de p cycles de longueur q à supports deux à deux disjoints. Plus précisément, il est
immédiat de vérifier l’égalité suivante : cp = c1 c2 · · · cp où, pour chaque k ∈ [[1, p]], ck est
le q− cycle :
ck = k (p + k) (2p + k) · · · q − 1)p + k .
Noter que les supports Sk des cycles ck ( k = 1, . . . , p) forment une partition de [[1, n]], et
que 1, p + 1 ∈ S1 . Par ailleurs, la formule de conjugaison d’un cycle, cf. la formule (∗∗) de la
page 34, donne les égalités suivantes :
cc1 c−1 = c2 , cc2 c−1 = c3 , . . . , ccp−1 c−1 = cp , ccp c−1 = c1 .
Il en résulte que c permute circulairement les parties S1 , S2 , . . . , Sp . Cela étant, le groupe Sn
agit naturellement sur l’ensemble P des parties de [[1, n]], donc aussi sur l’ensemble des parties
de P . Pour cette action, la partie T := {S1 , S2 , . . . , Sp } est stable par c, nous venons de le
voir, mais aussi par s, car s(Sk ) = Sk pour k = 1, . . . , p. Cependant, si τ est la transposition
échangeant un élément (fixé) de S1 avec un élément (fixé) de S2 , il est clair que τ (T ) 6= T
car τ (S1 ) ∈
/ T.
Nous pouvons conclure : le stabilisateur de T dans l’action de Sn sur l’ensemble des parties
de P est un sous-groupe distinct de Sn contenant c et s. Cela montre que le sous-groupe hc, si
est distinct de Sn : c et s n’engendrent pas Sn .
I.2.26 Le but de l’exercice est de prouver l’inégalité r > n − 1 . Raisonnons par l’absurde, en
supposant r 6 n − 2 , d’où n > 2 . Puisque la partie S engendre Sn , elle n’est pas vide.
Ainsi, r > 1 , donc n > 3 . En fait, r > 2 , donc n > 4 , car, si r était égal à 1 , le groupe Sn
serait d’ordre 2 , alors qu’il est d’ordre n! > 6 .
Nous allons construire par récurrence une suite (s1 , . . . , sr ) d’éléments de S , deux à deux
distincts, vérifiant pour tout k ∈ [[1, r]] la propriété suivante, que nous noterons (P k ) : le composé tk := s1 ◦ s2 ◦ · · · ◦ sk a un support Tk de cardinal k + 1 , et Tk contient le support
c Dunod 2014
I.2 : Actions de groupes
41
de chacune des transpositions s1 , . . . , sk . Pour k := 1 , il suffit de prendre pour s1 un élément quelconque de S . Supposons que, pour un certain entier k ∈ [[1, r − 1]] , nous ayons
construit des éléments de S distincts s1 , . . . , sk , de sorte que la propriété (P h ) soit vérifiée
pour h = 1, . . . , k .
Pour tout h ∈ [[1, k]], le support de la transposition sh est par hypothèse inclus dans Tk ,
donc sh (Tk ) = Tk . Soit H := σ ∈ Sn | σ(Tk ) = Tk le stabilisateur de Tk pour
l’action de Sn sur l’ensemble des parties de [[1, n]]. Ainsi, s1 , . . . , sk appartiennent à H .
Puisque Tk est de cardinal k + 1 6 r < n, Tk n’est ni vide ni égale à [[1, n]]. Soient
donc a ∈ Tk et b ∈ [[1, n]] \ Tk . La transposition (a b) échange a et b , donc elle ne laisse
pas Tk stable : (a b) ∈
/ H . Le sous-groupe H est ainsi distinct de Sn . Comme la partie S
engendre Sn , elle n’est pas incluse dans H . Il existe donc une transposition sk+1 ∈ S telle
que sk+1 (Tk ) 6= Tk . Cela signifie que sk+1 s’écrit sk+1 := (c d), où c ∈ Tk et d ∈ [[1, n]]\Tk .
En tout cas, sk+1 ∈
/ H , donc sk+1 est distincte de s1 , . . . , sk .
Posons donc tk+1 := s1 ◦ s2 ◦ · · · ◦ sk+1 = tk ◦ sk+1 , et soit Tk+1 le support
de tk+1 . Ce support est contenu dans la réunion des supports de tk et sk+1 , c’est-à-dire
dans Tk ∪ {c, d} = Tk ∪ {d} . Montrons que Tk+1 = Tk ∪ {d} . Si x ∈ Tk est distinct
de c, sk+1 (x) = x, donc tk+1 (x) = tk (x) 6= x, puisque x ∈ Supp(tk ) = Tk . Ensuite, d ∈
/ Supp(tk ), donc tk+1 (c) = tk (d) = d 6= c, ce qui montre que c ∈ Tk+1 . Enfin, tk+1 (d) = tk (c) ∈ Tk , donc tk+1 (d) 6= d, i.e. d ∈ Tk+1 . D’où l’égalité Tk+1 = Tk ∪{d} .
Il en résulte que card Tk+1 = 1 + card Tk = k + 2 , et, par ailleurs, le support de sk+1 , à
savoir {c, d} , est inclus dans Tk+1 . La propriété (P k+1 ) est donc vérifiée, et cela achève la
construction de la suite (s1 , . . . , sr ).
Puisque s1 , . . . , sr ∈ S sont distinctes deux à deux et card S = r , on a S = {s1 , . . . , sr } .
Pour tout k ∈ [[1, r]] , le support de sk est inclus dans Tr , donc sk (Tr ) = Tr . Le stabilisateur H ′ de Tr dans Sn est un sous-groupe de Sn contenant la partie génératrice S ,
donc H ′ = Sn . Mais Tr est de cardinal r + 1 6 n − 1 . Comme ci-dessus, considérons
alors un élément x de Tr et un élément y de [[1, n]] \ Tr . La transposition (x y) échange x
et y , elle ne laisse donc pas Tr stable : (x y) ∈
/ H ′ . C’est absurde, puisque H ′ = Sn . Cette
contradiction prouve l’inégalité r > n − 1 .
I.2.27 Notons A la somme des Φ(s) lorsque le couple (g, s) décrit F . On peut calculer A de
deux manières, en sommant d’abord soit par rapport à g soit par rapport à s (avec des notations
évidentes) :


X
X
X

A=
Φ(s) :=
Bg
g∈G
=
X
s∈G
g∈G
s∈G , (g,s)∈F

Φ(s) 
X
g∈G , (g,s)∈F

1 :=
X
Φ(s)Cs .
s∈G
Remarquons ensuite que, pour un élément (g, s) de G2 , la condition (g, s) ∈ F équivaut
à s ∈ g −1 Hg = g −1 Ga g = Gg−1 a , elle signifie donc que g −1 a est un point fixe de s (cf. la
proposition 11 de la page 71).
Fixons d’abord s ∈ G. La somme Cs à calculer est le nombre de g ∈ G tels que g −1 a
soit un point fixe de s. Soit x l’un de ces points fixes. Combien y a-t-il d’éléments g de G
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
42
tels que g −1 a = x, c’est-à-dire a = gx ? Il y en a, puisque l’action de G sur X est
transitive. Soit g0 l’un de ces éléments. Il est clair que γ 7→ g0 γ est une bijection de Gx
sur {g ∈ G | gx = a = g0 x} . Le nombre de g ∈ G tels que gx = a est donc card Gx , c’està-dire N/ card X , en vertu du théorème 14 de la page 72. Comme il y a Φ(s) points fixes
de s, le nombre de g ∈ G tels que g −1 a soit un point fixe de s est Cs = N Φ(s)/ card X ,
d’où :
X
X
N
A =
Φ(s)Cs =
Φ(s)2 .
card X
s∈G
s∈G
Fixons maintenant g ∈ G, et posons b := g −1 a. La somme Bg à évaluer est la somme
des Φ(s) pour tous les s ∈ G laissant fixe b , c’est-à-dire pour tous les s appartenant à Gb .
Appliquons alors le théorème de Frobenius (théorème 25 de la page 87) à l’action de Gb sur X .
Le nombre µ′ d’orbites de X sous Gb vaut :
X
1
card X X
Φ(s) =
Φ(s).
µ′ =
card Gb
N
s ∈ Gb
s ∈ Gb
′
En fait, µ = µ, i.e. le nombre µ ne dépend pas du choix du point a. En effet, on vérifie
aisément que les orbites de X sous Gb sont les images des orbites de X sous Ga par la
permutation y 7→ g −1 y de X , à cause de la formule suivante, valable pour tout x ∈ X :
Gb x = (g −1 Ga g)x = g −1 Ga (gx) .
Il en résulte que Bg = N µ/ card X , d’où :
A =
X
Bg =
g∈G
X
g∈G
Nµ
N 2µ
=
·
card X
card X
En comparant avec la formule précédemment obtenue pour A, il vient :
X
N
1 X
N 2µ
=
Φ(s)2 , d’où µ =
Φ(s)2 .
card X
card X
N
s∈G
s∈S
I.2.28 Les points de K étant deux à deux symétriques par rapport à l’origine, l’isobarycentre de K
est évidemment O . Cet isobarycentre est fixé par tout élément de G, car toute application affine conserve les barycentres. Ainsi, tout élément de G laisse fixe O , de sorte que G est, en
fait, un sous-groupe de GL(Rn ). Notons B := (e1 , . . . , en ) la base canonique de Rn . Posons Di := Rei pour i = 1, . . . , n, et soit D := {D1 , . . . , Dn } . Enfin, convenons d’identifier
toute transformation linéaire de Rn avec sa matrice dans la base B .
a) Montrons que D est stable sous G. Pour cela, partons d’une remarque simple.
Soient M = (ε1 , . . . , εn ) et M ′ = (ε′1 , . . . , ε′n ) deux points de K et I = (α1 , . . . , αn )
le milieu de M M ′ . Soit i ∈ [[1, n]]. Alors αi = 0 lorsque εi 6= ε′i , et sinon αi = εi = ε′i .
Chaque coordonnée de I appartient donc à {−1, 0, 1} .
Soit inversement I = (α1 , . . . , αn ) ∈ {−1, 0, 1}n . Dénombrons d’abord les
points M = (ε1 , . . . , εn ) ∈ K tels que le symétrique M ′ de M par rapport à I appartienne à K . Écrivons M ′ = (ε′1 , . . . , ε′n ), de sorte que εi + ε′i = 2αi pour i = 1, . . . , n.
Soit i ∈ [[1, n]]. Si αi = ±1 , nécessairement εi = αi (= ε′i ). Si αi = 0 , εi ∈ {−1, 1}
peut être choisi arbitrairement, et alors ε′i = −εi . Si donc p ∈ [[0, n]] est le nombre d’indices i ∈ [[1, n]] tels que αi = 0 , il y a 2p points M ∈ K tels que le symétrique de M par
rapport à I appartienne à K .
c Dunod 2014
I.2 : Actions de groupes
43
Soit T l’ensemble des points de Rn ayant toutes leurs coordonnées nulles, sauf une qui
vaut ±1 . Ce qui précède montre qu’un point I ∈ Rn appartient à T si et seulement s’il
y a exactement 2n−1 points M ∈ K tels que le symétrique de M par rapport à I appartienne à K . Compte tenu de cette caractérisation de T , il est clair que G laisse stable T . Pour
−−→
−−→
tout i ∈ [[1, n]], soient Ai , A′i ∈ Rn les points définis par les égalités OAi = ei et OA′i = −ei .
Ainsi Di est la droite Ai A′i . Par ailleurs, on a :
T = A1 , A′1 , . . . , An , A′n .
Puisque chaque élément de G laisse stable T et fixe le point O , il applique chaque
paire {Ai , A′i } sur une paire analogue, et par suite G laisse stable D .
Puisque G laisse stable D , nous obtenons une action naturelle de G sur D , correspondant à
un morphisme ψ : G → S(D) ≡ Sn . Nous allons étudier ce morphisme, en particulier nous
en déterminerons le noyau et l’image.
b) Le groupe G possède deux sous-groupes évidents. Le premier est le sous-groupe ∆
de GLn (R) formé des matrices diagonales dont chaque terme diagonal vaut ±1 :
∆ = Diag(ε1 , . . . , εn ) (ε1 , . . . , εn ) ∈ {−1, 1}n .
Il est clair que ∆ est isomorphe à {−1, 1}n, × , ou encore à (Z/2Z)n , + . En particulier, ∆ est d’ordre 2n . Il est également clair que ∆ est un sous-groupe de G :
si g = Diag(ε1 , . . . , εn ) ∈ ∆ et si M = (x1 , . . . , xn ) ∈ K , g(M ) = (ε1 x1 , . . . , εn xn ) ∈ K
puisque, pour tout i , εi et xi appartiennent à {−1, 1} .
Si g = Diag(ε1 , . . . , εn ) ∈ ∆ et si i ∈ [[1, n]], on a g(ei ) = εi ei = ±ei , donc g(Di ) = Di .
En d’autres termes, g agit trivialement sur D , ce qui prouve l’inclusion ∆ ⊂ Ker ψ . En
fait, ∆ = Ker ψ . Soit en effet g ∈ Ker ψ : pour tout i , g(Di ) = Di . Cela signifie que g est
une matrice diagonale : g := Diag(a1 , . . . , an ). Le point M := (1, 1, . . . , 1) appartient à K ,
donc g(M ) ∈ K . Les coordonnées de g(M ) étant les ai , il en résulte que ai ∈ {−1, 1} pour
tout i , d’où g ∈ ∆.
c) Le deuxième sous-groupe évident de G est formé des matrices de permutations Pσ , σ
parcourant Sn . Si σ ∈ Sn , Pσ est l’automorphisme de Rn appliquant chaque ei
sur eσ(i) , i ∈ [[1, n]]. L’application σ 7→ Pσ est un morphisme injectif de Sn dans GLn (R),
c’est donc un isomorphisme de Sn sur le sous-groupe S = Pσ σ ∈ Sn de GLn (R).
Le groupe S est donc d’ordre n!. Là encore, il est clair que S est un sous-groupe de G : le
fait que toutes les coordonnées d’un point soient égales à ±1 est invariant par permutation des
coordonnées.
Pour toute permutation σ ∈ Sn , on a Pσ (ei ) = eσ(i) et donc Pσ (Di ) = Dσ(i) pour tout i .
Cela montre que ψ(Pσ ) = σ pour toute permutation σ . Il en résulte que la restriction de ψ
à S est un isomorphisme de S sur Sn , ce qui montre en particulier que ψ est surjectif.
d) Appliquons le théorème d’isomorphisme. Le morphisme ψ est surjectif, et son noyau est ∆.
Il induit donc un isomorphisme du quotient G/∆ sur S(D). La proposition 13 de la page 72
donne alors, au niveau des ordres, les égalités :
card G = card ∆ × card (G/∆) = card ∆ × card S(D) = 2n n!.
L’ordre de G est bien celui qui est que nous voulions.
e) Nous allons enfin préciser la structure du groupe G. Considérons l’application f du produit {−1, 1}n × Sn dans G définie par la formule :
f (ε1 , . . . , εn ), σ := Diag(ε1 , . . . , εn )Pσ .
(∗)
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
44
Cette application est surjective. Soit en effet g ∈ G, posons σ := ψ(g). Alors g et Pσ ont
même image par ψ , donc gPσ−1 ∈ Ker ψ = ∆. Il existe donc (ε1 , . . . , εn ) ∈ {−1, 1}n tel
que gPσ−1 = Diag(ε1 , . . . , εn ), d’où g = f (ε1 , . . . , εn ), σ .
L’application f est injective. Soient en effet (ε1 , . . . , εn ), (ε′1 , . . . , ε′n ) ∈ {−1, 1}n
et σ, σ ′ ∈ Sn tels que Diag(ε1 , . . . , εn )Pσ = Diag(ε′1 , . . . , ε′n )Pσ′ . En prenant les images
des deux membres de cette égalité par ψ , on obtient σ = σ ′ . On en déduit évidemment
que (ε1 , . . . , εn ) = (ε′1 , . . . , ε′n ).
f) Attention, f est une bijection, mais ce n’est pas un isomorphisme de groupes. Précisons
ce point. Considérons deux éléments g, g ′ de G. Soient (ε, σ) et (ε′ , σ ′ ) les images respectives de g et g ′ par f −1 , avec ε := (ε1 , . . . , εn ) et ε′ := (ε′1 , . . . , ε′n ). Nous voulons expliciter l’image de gg ′ par f −1 . D’abord, ψ étant un morphisme, ψ(gg ′ ) = σ ◦ σ ′ .
D’après l’alinéa précédent, il en résulte qu’il existe η := (η1 , . . . , ηn ) ∈ {−1, 1}n tel
que gg ′ = Diag(η1 , . . . , ηn )Pσ ◦ σ′ . Il reste à expliciter les ηi . Pour cela, partons de l’égalité :
Diag(ε1 , . . . , εn )Pσ Diag(ε′1 , . . . , ε′n )Pσ′ = Diag(η1 , . . . , ηn )Pσ ◦ σ′ .
En simplifiant à droite par Pσ′ , cette égalité équivaut à la suivante :
Diag(η1 , . . . , ηn ) = Diag(ε1 , . . . , εn ) Pσ Diag(ε′1 , . . . , ε′n )Pσ−1 .
{z
}
|
=γ
En termes d’endomorphismes de Rn on a, pour tout j ∈ [[1, n]] :
γ(ej ) = Pσ Diag(ε′1 , . . . , ε′n ) (eσ−1 (j) ) = Pσ (ε′σ−1 (j) eσ−1 (j) ) = ε′σ−1 (j) ej ,
ce qui montre que ηj = εj ε′σ−1 (j) . D’où :
Diag(ε1 , . . . , εn )Pσ Diag(ε′1 , . . . , ε′n )Pσ′ = Diag(ε1 ε′σ−1 (1) , . . . , εn ε′σ−1 (n) )Pσ ◦ σ′ .
Ainsi, f −1 (gg ′ ) = (ε1 ε′σ−1 (1) , . . . , εn ε′σ−1 (n) ), σ ◦ σ ′ n’est le produit de f −1 (g) et f −1 (g ′ )
dans le groupe produit {−1, 1}n × Sn que si ε′σ−1 (j) = ε′j pour tout j . Ce n’est pas vrai, par
exemple, si σ est la transposition (1 2) et ε′ := (−1, 1, 1, . . . , 1). En conclusion, f n’est pas
un isomorphisme de groupes.
I.2.29 Soit B la base canonique de K 2 . L’application ϕ associant à tout u ∈ GL(K 2 ) sa
matrice dans la base B est un isomorphisme de GL(K 2 ) sur GL2 (K). Par ailleurs, posons X := K 2 \ {0} . L’action naturelle de GL(K 2 ) sur K 2 laisse stable 0 , elle laisse donc
stable X . D’où une action de GL(K 2 ) sur X , se traduisant par un morphisme ψ de GL(K 2 )
dans S(X). L’action de GL(K 2 ) sur X est évidemment fidèle, donc ψ est injectif. Or, d’après
la proposition 12 de la page 85, l’ordre de GL(K 2 ), c’est-à-dire l’ordre de GL2 (K), est 6 = 3!
(prendre n := 2 et q := 2 dans la proposition). Il en résulte que ψ est bijectif, c’est donc un
isomorphisme.
Le choix d’une numérotation des trois éléments de X définit de manière évidente un isomorphisme θ de S(X) sur S3 . Alors, α := θ ◦ ψ ◦ ϕ−1 est un isomorphisme de GL2 (K)
sur S3 . En posant par exemple x1 := (1, 0), x2 := (0, 1) et x3 := (1, 1), l’image
0 1
1 1
de
∈ GL2 (K) par α est le 3 -cycle (1 2 3), et l’image de
est la
1 1
0 1
transposition (2 3).
c Dunod 2014
I.2 : Actions de groupes
45
I.2.30 Le groupe Aut(G) des automorphismes de G est un sous-groupe de S(G), il laisse
stable X := G \ {1} . L’action de Aut(G) sur X est évidemment fidèle, elle se traduit par un
morphisme injectif ϕ : Aut(G) → S(X). En particulier, ϕ(σ) est une permutation d’ordre p
de X . Puisque p est premier, il en résulte, par exemple en vertu de l’exercice I.2.18 de la
page 91, que ϕ(σ) est le produit d’un certain nombre de p-cycles à supports deux à deux disjoints. Mais X est de cardinal p, donc ϕ(σ) est en fait un p-cycle. Ainsi, le sous-groupe hσi
de Aut(G) agit transitivement sur X .
L’idée est maintenant d’observer que tous les éléments de X ont même ordre. Soient en effet x, y ∈ X . Il existe un entier k ∈ [[0, p − 1]] tel que y = σ k (x). Puisque σ k est un
automorphisme de G, y = σ k (x) et x ont le même ordre, car σ k induit un isomorphisme
de hxi sur hyi. Ainsi, tous les éléments de G distincts de 1 ont un même ordre d. Puisque
l’ordre p + 1 de G est pair, le théorème de Cauchy (cf. la section 2.3 de la page 71) montre
que G possède un élément d’ordre 2 , ce qui montre que d = 2 .
Puisque tout élément de G distinct de 1 est d’ordre 2 , on a x2 = 1 pour tout x ∈ G. Un exercice classique (cf. le module II.2 de [L1]) montre alors que G est abélien (i.e. commutatif). Rappelons pourquoi. Soient x, y ∈ G. L’égalité x2 = 1 équivaut à x−1 = x, de même y −1 = y
et (xy)−1 = xy . Mais on a toujours (xy)−1 = y −1 x−1 , donc xy = (xy)−1 = y −1 x−1 = yx.
Ainsi xy = yx pour tous x, y ∈ G, ce qui établit la commutativité de G.
À ce stade, il sera plus commode d’utiliser pour G la notation additive. Nous avons donc
maintenant 2x = 0 pour tout x ∈ G. Considérons alors le corps K := Z/2Z, dont les deux
éléments seront notés 0̄ et 1̄ . Définissons une loi externe K × G → G par 0̄ · x = 0 et 1̄ · x
pour tout x ∈ G. Cette loi externe et l’addition de G font de G un K -espace vectoriel. La
seule propriété non évidente a priori est la distributivité à gauche : (α + β) · x = α · x + β · x
pour tout x ∈ G et tous α, β ∈ K . Dans le seul cas non trivial α = β = 1̄ , cette propriété
s’écrit 0̄ · x = 1̄ · x + 1̄ · x, soit 0 = x + x, ou encore 2x = 0 . En conclusion, c’est le fait
que 2x soit nul pour tout x ∈ G qui nous a permis d’obtenir sur G cette structure de K -espace
vectoriel. Insistons sur un point : (G, +, ·) est un K -espace vectoriel, dont le groupe additif
est simplement le groupe G de départ, écrit additivement.
Puisque G est fini en tant qu’ensemble, c’est un K -espace vectoriel de dimension finie ( G
est une partie génératrice finie de cet espace vectoriel), notons n sa dimension. Alors G est
isomorphe à K n = (Z/2Z)n comme espace vectoriel, a fortiori comme groupe (additif). En
particulier, p + 1 = card G = 2n , soit p := 2n − 1 . Par hypothèse, p est un nombre premier,
ce qui entraîne que n est lui-même un nombre premier. En effet, si n n’était pas premier, on
pourrait l’écrire n := ab , où a, b sont deux entiers strictement supérieurs à 1 , et alors 2a − 1
serait un diviseur de p = 2n − 1 distinct de 1 et p, ce qui contredirait le fait que p soit premier.
Conclusion : il existe un nombre premier n tel que p := 2n − 1 , autrement dit, p est un nombre
premier de Mersenne, cf. le module II.1 de [L1].
Réciproquement, soit n un nombre premier tel que le nombre de Mersenne p := 2n − 1 soit
lui aussi premier. On peut ainsi prendre n := 5 et p := 31 ou n := 7 et p := 127 , mais
pas n := 11 , car 211 − 1 = 2047 = 23 × 89 n’est pas premier. Posons G := (Z/2Z)n ,
c’est un espace vectoriel de dimension n sur le corps K := Z/2Z. Il est facile de voir que le
groupe Aut(G) des automorphismes du groupe additif G est en fait égal à GL(K n ), groupe
des automorphismes linéaires de K n (le fait qu’un automorphisme du groupe additif G respecte la loi externe est évident). Le groupe GL(K n ) est isomorphe à GLn (K). D’après la
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
46
proposition 24 de la page 85 (prendre q := 2 ), on a donc :
card Aut(G) = 2n(n−1)/2 (2n − 1)(2n−1 − 1) · · · (22 − 1)(2 − 1).
En particulier, l’ordre de Aut(G) est divisible par le nombre premier p = 2n − 1 . D’après le
théorème de Cauchy, le groupe Aut(G) possède donc un élément σ d’ordre p. Au total, p est
premier, G est un groupe d’ordre p + 1 = 2n possédant un automorphisme d’ordre p, ce qui
constitue la réciproque cherchée.
I.2.31 D’abord, G est un sous-groupe de GL3 (Z/pZ), car nous savons en général que, si K est
un corps et n ∈ N∗ , les matrices triangulaires supérieures dont les termes diagonaux valent


1 a b
tous 1 forment un sous-groupe de GLn (K). L’application (a, b, c) 7→  0 1 c  est par
0 0 1
3
définition une bijection de (Z/pZ) sur G, ce n’est pas un isomorphisme de groupes, comme
la suite le montrera. En tout cas, l’ordre (cardinal) de G est p3 . Le fait que G ne soit pas
commutatif résulte du calcul suivant :





1 1 0
1 0 0
1 1 1
 0 1 0  0 1 1  =  0 1 1 ,
0 0 1
0 0 1
0 0 1
alors que :

1 0
 0 1
0 0

0
1
1  0
1
0


1 0
1 1
1 0  =  0 1
0 1
0 0

0
1 .
1
I.2.32 Le nombre N (q) de coloriages cherché ne dépend évidemment que de q , et non du cube
particulier considéré (pourquoi ?). Reprenons donc les notations de l’exemple 2 de la page 76,
en particulier K désigne le cube {A, B, C, D, A′ , B ′ , C ′ , D′ } . Rappelons que G ⊂ O(R3 )
est le groupe des symétries de K et que G+ ⊂ SO(R3 ) est le groupe des rotations de K .
Nous avons vu que l’action naturelle de G sur l’ensemble A := {α, β, γ, δ} des diagonales du
cube induit un isomorphisme ϕ de G+ sur S(A).
Chacune des six faces du cube est entièrement déterminée par son centre, par exemple le
carré ABCD , qui est l’une de ces faces, a pour centre (0, 0, 1). De cette manière, nous identifions l’ensemble des faces de K à l’ensemble :
T := (±1, 0, 0), (0, ±1, 0), (0, 0, ±1) .
Nous avons montré que T est stable sous G, d’où une action naturelle de G sur T . Numérotons ensuite les couleurs de 1 à q . Un coloriage (des faces) de K est simplement
une application f de T dans [[1, q]], i.e. un élément de F T, [[1, q]] , ensemble des applications de T dans [[1, q]]. Le groupe G agit naturellement sur T , faisons-le agir trivialement
sur [[1, q]]. D’après l’exemple 10 de la page 61, ces deux actions induisent une action de G
sur F T, [[1, q]] , via la formule suivante, dans laquelle f ∈ F T, [[1, q]] , g ∈ G et t ∈ T
sont arbitraires :
(g · f )(t) := f g −1 t .
Deux coloriages f, f ′ du cube se déduisent l’un de l’autre par une rotation du cube si, et seule
ment si, f et f ′ appartiennent à une même orbite de F T, [[1, q]] sous G+ . Il en résulte que
c Dunod 2014
I.2 : Actions de groupes
47
le nombre N (q) cherché est simplement le nombre d’orbites de F T, [[1, q]] sous G+ . Le
théorème de Frobenius (théorème 25 de la page 87) donne donc :
1 X
N (q) =
Φ(g).
24
+
g∈G
Dans cette formule, pour tout g ∈ G+ , rappelons que Φ(g) est le nombre de points fixes de g
dans F T, [[1, q]] . Soient g ∈ G+ et f ∈ F T, [[1, q]] . Pour que f soit un point fixe de g ,
c’est-à-dire g · f = f ou encore f g −1 t = f (t) pour tout t ∈ T , il faut et il suffit que la
fonction f soit constante sur chaque orbite de T sous hgi. Si l’on note ω(g) le nombre d’orbites de T sous hgi, il y a évidemment q ω(g) fonctions f possédant cette propriété : on choisit
arbitrairement une couleur pour chacune des orbites de T sous hgi. Ainsi, Φ(g) = q ω(g) .
D’où :
1 X ω(g)
N (q) =
q
.
(∗)
24
+
g∈G
+
Il reste à calculer les entiers ω(g), g ∈ G . Observons d’abord que ω(ghg −1 ) = ω(h) pour
tous g, h ∈ G+ . En effet, si Y1 , . . . , Yr sont les orbites de hhi sur T , on vérifie aisément
que les orbites de hghg −1 i sur T sont gT1 , . . . , gTr . Cela étant, nous savons que ϕ est un
isomorphisme de G+ sur S(A). Par ailleurs, les classes de conjugaison du groupe S(A), qui
est isomorphe à S4 , sont connues (cf. la section 3.3 de la page 78). Il y a dans G+ cinq classes
de conjugaison, que nous allons détailler.
- Le singleton réduit à l’identité est l’une de ces classes, évidemment ω(Id) = 6 .
- Il y a dans S(A) six transpositions. L’une d’elles est (γ δ). Géométriquement, c’est
l’image par ϕ de la rotation g d’angle π et d’axe la droite joignant les milieux


−1 0 0
de CD et C ′ D′ . Matriciellement, g =  0 0 1  . Sur T , g échange (1, 0, 0)
0 1 0
et (−1, 0, 0), (0, 1, 0) et (0, 0, 1), ainsi que (0, −1, 0) et (0, 0, −1), donc ω(g) = 3 .
- Il y a dans S(A) trois produits de deux transpositions à supports disjoints. L’un
de ces produits est (α γ)(β δ). Géométriquement, c’est l’image par ϕ de la rota

−1
0 0
tion g d’angle π et d’axe Re3 . Matriciellement, g =  0 −1 0  . Sur T , g
0
0 1
échange (1, 0, 0) et (−1, 0, 0), (0, 1, 0) et (0, −1, 0), mais laisse fixes (0, 0, 1)
et (0, 0, −1), donc ω(g) = 4 .
- Il y a dans S(A) six 4 -cycles. L’un de ces cycles est (α β γ δ). Géométriquement, c’est l’image par ϕ de la rotation g d’angle π/2 et d’axe Re3 . Matricielle

0 −1 0
ment, g =  1
0 0  . Sur T , g laisse fixes (0, 0, 1) et (0, 0, −1), et permute
0
0 1
circulairement (1, 0, 0), (0, 1, 0), (−1, 0, 0) et (0, −1, 0), donc ω(g) = 3 .
- Il y a dans S(A) huit 3 -cycles. L’un de ces cycles est (β δ γ). Géométriquement,
nous avons vu dans l’exemple 2 de la page 76 que c’est l’image par ϕ de la rotation g


0
0 −1
−−′→
0
0  . Sur T , g
d’angle 2π/3 et d’axe dirigé par A A . Matriciellement, g =  1
0 −1
0
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
48
permute circulairement (1, 0, 0), (0, 1, 0) et (0, 0, −1), ainsi que (−1, 0, 0), (0, −1, 0)
et (0, 0, 1), donc ω(g) = 2 .
En vertu de la formule (∗), nous obtenons ainsi :
N (q) =
1
q 6 + 3q 4 + 12q 3 + 8q 2
1 × q6 + 6 × q3 + 3 × q4 + 6 × q3 + 8 × q2 =
·
24
24
I.2.33 1. L’action naturelle de S(S) sur S induit une action de S(S) sur P(S), ensemble des
parties de S , puis sur l’ensemble des parties de P(S). L’ensemble A des arêtes de Γ est
une partie de P(S), et G n’est autre que le stabilisateur de A dans cette action de S(S)
sur P P(S) , c’est donc un sous-groupe de S(S).
2. Appelons degré d’un sommet le nombre de sommets reliés à ce sommet. Parmi les sommets
de Γ, trois sont de degré 4 , notons-les a, b, c. Hormis b et c, il y a deux autres sommets reliés
à a, notons-les a1 , a−1 . Définissons de même b1 , b−1 et c1 , c−1 . Le groupe G laisse stable la
partie T := {a, b, c} . En effet, si x ∈ S et g ∈ G, l’application {x, y} 7→ g(x), g(y) est
une bijection de l’ensemble des arêtes contenant x sur l’ensemble des arêtes contenant g(x).
Il en résulte que g conserve les degrés des sommets, d’où g(T ) = T .
Puisque T est stable pour G, il en résulte une action de G sur T , se traduisant par un morphisme χ : G → S(T ). Ce morphisme est surjectif. Soit en effet σ ∈ S(T ). Avec des notations évidentes, définissons une application gσ : S → S comme suit. Pour tout x ∈ T , nous
posons gσ (x) := σ(x), gσ (x1 ) := σ(x)1 et gσ (x−1 ) = σ(x)−1 . Il est clair que gσ est une
permutation de S . Les neuf arêtes de Γ sont {a, b} , {a, c} , {b, c} et les {x, xi } pour x ∈ T
et i ∈ {−1, 1} . Il en résulte aussitôt que gσ conserve les arêtes, autrement dit, gσ ∈ G.
Puisque gσ coïncide avec σ sur T , on a χ(gσ ) = σ , d’où la surjectivité de χ.
Il est facile de déterminer le noyau de χ. Un élément g de ce noyau fixe a, b, c. Il doit
fixer ou échanger a1 et a−1 , seuls sommets autres que b, c reliés à a. Ainsi g laisse
stable {a1 , a−1 } , et de même {b1 , b−1 } et {c1 , c−1 } . Il existe donc α, β, γ ∈ {−1, 1} tels
que, pour tout j ∈ {−1, 1} , on ait :
g(aj ) = ajα , g(bj ) = bjα , g(cj ) = cjα
et g(a) = a , g(b) = b , g(c) = c.
Inversement étant donnés α, β, γ ∈ {−1, 1} , définissons g : S → S par ces formules. Il est
évident que g ∈ G, plus précisément g ∈ Ker χ. On voit aussitôt que (α, β, γ) 7→ g est un
isomorphisme d du groupe (multiplicatif) produit {−1, 1}3 sur Ker χ. En particulier, Ker χ
est d’ordre 8 .
D’après le théorème d’isomorphisme, S(T ) = Im χ est isomorphe au quotient G/ Ker χ.
Puisque S(T ) est d’ordre 3! = 6 et Ker χ est d’ordre 8 , on en déduit que G est
d’ordre 6 × 8 = 48 (cf. la proposition 13 de la page 72).
La structure de G peut être précisée. Montrons que l’application θ : {−1, 1}3 × S(T ) → G
définie par la formule ci-dessous est bijective :
θ (α, β, γ), σ := d(α, β, γ) ◦ gσ .
Soit g ∈ G, posons σ := χ(g). Alors χ(g) = σ = χ(gσ ), donc g ◦ gσ−1 ∈ Ker χ.
Il existe donc un unique triplet (α, β, γ) ∈ {−1, 1}3 tel que g ◦ gσ−1 = d(α, β, γ),
d’où g = d(α, β, γ) ◦ gσ = θ (α, β, γ), σ . Inversement, soient (α′ , β ′ , γ ′ ) ∈ {−1, 1}3
et σ ′ ∈ S(T ), supposons que g = d(α′ , β ′ , γ ′ ) ◦ gσ′ . Alors, σ = χ(g) = χ(gσ′ ) = σ ′ .
c Dunod 2014
I.2 : Actions de groupes
49
Dans ces conditions, d(α, β, γ) = d(α′ , β ′ , γ ′ ), d’où (α, β, γ) = (α′ , β ′ , γ ′ ). En conclusion, g
possède un unique antécédent par θ , ce qui prouve que θ est bijective.
Attention, θ n’est pas un isomorphisme (de groupes) du groupe produit {−1, 1}3 × S(T )
sur G, cf. la fin de l’exercice I.2.28 de la page 92.
3. Reprenons les notations de l’exemple 2 de la page 76, concernant le cube K . En particulier, D := {D1 , D2 , D3 } . Notons F l’ensemble des six faces du cube. Explicitement, en
identifiant une face, qui est un carré, avec l’ensemble de ses quatre sommets, on a :
F := ABCD, A′ B ′ C ′ D′ , ABC ′ D′ , A′ B ′ CD, ADB ′ C ′ , A′ D′ BC .
b = (S,
b A)
b de la façon suivante. L’ensemble des somDéfinissons un graphe Γ
b est la réunion Sb := D ∪ F . Les arêtes de Γ
b sont d’une part les
mets de Γ
paires {D1 , D2 } , {D1 , D3 } , {D2 , D3 } , et d’autre part les paires (Di , F ), où i ∈ {1, 2, 3}
et la face F
∈ F est orthogonale à Di . Ainsi, les arêtes contenant D3
sont {D1 , D3 } , {D2 , D3 } , {D3 , ABCD} et {D3 , A′ B ′ C ′ D′ } .
Soit λ la bijection de S sur Sb définie ainsi :
λ(a) := D1 , λ(b) := D2 , λ(c) := D3 ,
λ(a1 ) := A′ D′ BC , λ(b1 ) := A′ B ′ CD , λ(c1 ) := ABCD ,
λ(a−1 ) := ADB ′ C ′ , λ(b−1 ) := ABC ′ D′ , λ(c−1 ) := A′ B ′ C ′ D′ .
b . Il en résulte que g 7→ λ ◦ g ◦ λ−1 est un isomorOn constate que λ applique A sur A
b Par ailleurs, le groupe des symétries du cube, notons-le
phisme du groupe Aut(Γ) sur Aut(Γ).
ici Sym(K) et non pas G, agit naturellement sur chacun des ensembles D et F , d’où une action évidente sur Sb . Cette action conserve les arêtes parce que Sym(K) est un sous-groupe du
groupe orthogonal O(R3 ), de sorte que chaque élément de Sym(K) conserve l’orthogonalité
entre droites et plans.
b
Cette action de Sym(K) sur Sb définit donc un morphisme ζ de Sym(K) dans Aut(Γ).
Montrons que ζ est injectif, autrement dit que Sym(K) agit fidèlement sur Sb . Soit g un
élément du noyau de ζ . D’abord, g agit trivialement sur D , donc g est une matrice diagonale : g := Diag(ε1 , ε2 , ε3 ), avec (ε1 , ε2 , ε3 ) ∈ {−1, 1}3 . Ensuite, g laisse fixe la
face ABCD , i.e. g laisse stable {A, B, C, D} , et l’on en déduit que ε3 = 1 . De même, g
laisse stable {A, B, C ′ , D′ } , d’où ε2 = 1 , et g laisse stable {A, D, B ′ , C ′ } , d’où ε1 = 1 .
b est donc injectif. Or, Sym(K) est d’ordre 48 , et le
Le morphisme ζ : Sym(K) → Aut(Γ)
b aussi, car il est isomorphe à Aut(Γ). Il en résulte que ζ est un isomorphisme,
groupe Aut(Γ)
et par conséquent le groupe Aut(Γ) est isomorphe à Sym(K), ou encore à S4 × (Z/2Z).
I.2.34 Posons X := [[1, 5]], et soit donc E l’ensemble des parties à deux éléments de X . La
partie {1, 2} ∈ E , par exemple, peut être identifiée au sommet 12 du graphe Γ donné. Avec
cette identification, l’ensemble des sommets de Γ est E . Sur la figure de l’énoncé, on observe
que deux sommets hi et jk sont reliés par une arête de Γ si, et seulement si, les parties {h, i}
et {j, k} de X sont disjointes.
L’exercice I.2.22 de la page 92 montre que l’action naturelle de S5 sur E est transitive et fidèle.
Le morphisme ϕ : S5 → S(E) correspondant à cette action est donc injectif. L’image de ϕ
est contenue dans le groupe Aut(Γ) des automorphismes du graphe Γ. En effet, soit s ∈ S5 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
50
Si α et β sont deux parties de X disjointes et chacune de cardinal 2 , il en est de même
pour s(α) et s(β), puisque s est une bijection de X sur X . Supposons alors que nous ayons
établi la majoration card Aut(Γ) 6 120 . Puisque card S5 = 5! = 120 , il en résultera que ϕ
est un isomorphisme de S5 sur Aut(Γ), ce qui terminera l’exercice. Il nous faut donc majorer
l’ordre de Aut(Γ).
Observons que le graphe Γ est de degré 3 , en ce sens que chaque sommet appartient à trois
arêtes exactement. Considérons l’ensemble W des couples de la forme α, (a, b, c) , où α ∈ E
et où a, b, c sont les trois arêtes de Γ contenant α . Le graphe Γ comporte 10 sommets, donc le
cardinal de W est 10 · 3! = 60 . Le groupe Aut(Γ) agit naturellement sur W , puisque chaque
élément de ce groupe est une permutation de E conservant les arêtes.
Montrons que l’action de S5 sur W est transitive. Considérons deux élé
ments de W ,
α, (a, b, c) et α′ , (a′ , b′ , c′ ) . On peut écrire α := {i, j}
et a := {i, j}, {h, k} , b := {i, j}, {h, m} , c := {i, j}, {k, m} , où i, j, h, k, m
sont des éléments de X deux à deux distincts. De même, on peut écrire α′ := {i′ , j ′ }
et a′ := {i′ , j ′ }, {h′ , k ′ } , b′ := {i′ , j ′ }, {h′ , m′ } , c′ := {i′ , j ′ }, {k ′ , m′ } ,
où i′ , j ′ , h′ , k ′ , m′ sont des éléments de X deux à deux distincts. Soit s ∈ S5 la
permutation appliquant dans l’ordre i, j, h, k, m sur i′ , j ′ , h′ , k ′ , m′ . Il est alors clair
que s · α, (a, b, c) = α′ , (a′ , b′ , c′ ) , ce qui établit la transitivité de S5 sur W .
Soit w := α, (a, b, c) , où :
α := {1, 2}, a := {1, 2}, {3, 4} , b := {1, 2}, {3, 5} , c := {1, 2}, {4, 5} .
Considérons le stabilisateur Aut(Γ)w de w dans Aut(Γ). Puisque l’action de Aut(Γ)
sur W est transitive (car celle de son sous-groupe Im ϕ l’est déjà), l’égalité
(8) de la page 72 donne : card Aut(Γ) = card W × card Aut(Γ)w , c’est-àdire card Aut(Γ) = 60 card Aut(Γ)w . Le stabilisateur Aut(Γ)w contient déjà la permuta
tion ω := ϕ (1 2) de E . Pour conclure, il suffit détablir l’égalité Aut(Γ)w = {1, ω} .
Soit donc g une permutation de E laissant fixe chacun des sommets 12 , 34 , 35 et 45 . Les
deux sommets reliés à 45 et distincts de 12 sont 13 et 23 , ils sont donc soit échangés par g
soit tous les deux fixés par g . Quitte à remplacer g par g ◦ ω , nous pouvons supposer que g
fixe 13 et 23 . Il s’agit alors de montrer que g = IdE . Le seul sommet relié à 34 et 13 est 25 .
Comme 34 et 13 sont fixés par g , 25 l’est aussi. De même :
- le seul sommet relié à 35 et 23 est 14 , qui est donc fixé par g ;
- le seul sommet relié à 34 et 23 est 15 , qui est donc fixé par g ;
- le seul sommet relié à 35 et 13 est 24 , qui est donc fixé par g .
Finalement, g laisse fixes tous les sommets (points de E ), donc g = IdE .
I.2.35 Soit D(E) l’ensemble des drapeaux de E . Rappelons (cf. l’exercice I.2.0 de la page 88)
qu’un drapeau de E est une suite δ := (V0 , . . . , Vn ) de sous-espaces vectoriels de E , croissante pour l’inclusion, telle que dim(Vi ) = i pour i = 0, . . . , n. Il s’agit de calculer le cardinal
de D(E). Ce cardinal ne dépend évidemment que de n ( q étant fixé), notons-le Dn . Le ré
sultat est évident si n := 1 : il y a dans ce cas un seul drapeau, à savoir {0}, E . Dans le
cas n > 2 , notons H l’ensemble des hyperplans de E . Fabriquer un drapeau (V0 , . . . , Vn )
de E revient à se donner un hyperplan Vn−1 de E et un drapeau (V0 , . . . , Vn−1 ) de Vn−1 .
D’où aussitôt Dn = Dn−1 × card H .
c Dunod 2014
I.2 : Actions de groupes
51
À toute forme linéaire non nulle sur E , associons son noyau. On définit ainsi une application ψ de E ∗ \ {0} dans H . Cette application est surjective, et chacune de ses fibres est de
cardinal q − 1 , car deux formes linéaires non nulles définissent le même hyperplan si, et seulement si, elles sont proportionnelles. Les fibres de ψ formant une partition de E ∗ \ {0} , on en
déduit ceci :
qn − 1
q n − 1 = card E ∗ \ {0} = (q − 1) card H , d’où card H =
·
q−1
Nous obtenons ainsi la formule récurrente suivante :
Dn =
qn − 1
· Dn−1
q−1
pour tout n > 2.
Par récurrence sur n, on en déduit la valeur de Dn pour tout n :
card D(E) := Dn =
n
n
Y
Y
qk − 1
qk − 1
=
·
q−1
q−1
k=2
k=1
Notons B l’ensemble des bases de E . Considérons une base β := (e1 , . . . , en ) de E . Pour
tout k ∈ [[0, n]], posons Vk := Vect(e1 , . . . , ek ), de sorte que V0 := {0} . Il est clair
que δ := (V0 , . . . , Vn ) est un drapeau de E . D’où une application θ : β 7→ δ de B dans D(E).
Calculons les cardinaux des fibres de θ . Soit donc δ := (V0 , . . . , Vn ) un drapeau de E . Il est
clair que la fibre θ−1 (δ) est simplement le produit cartésien :
θ−1 (δ) = (V1 \ V0 ) × (V2 \ V1 ) × · · · × (Vn \ Vn−1 ).
Puisque chaque Vk est de cardinal q k , le cardinal de θ−1 (δ) est le produit des q k − q k−1 , k
variant de 1 à n. Puisque les fibres de θ forment une partition de B et ont toutes le même
cardinal, il vient :
card B = card D(E) ×
n
Y
(q k − q k−1 ) =
k=1
n
Y
(q k − q k−1 )(q k − 1)
,
q−1
k=1
c’est-à-dire :
card B =
n
Y
k=1
q k−1 (q k − 1) = q n(n−1)/2
n
Y
k=1
(q k − 1).
Soit β une base de E fixée. L’action de GL(E) sur B est simplement transitive, donc l’application g 7→ g · β est une bijection de GL(E) sur B . L’ordre de GL(E), qui est aussi l’ordre
du groupe GLn (K), est donc égal au cardinal de B . Nous avons ainsi retrouvé le résultat de la
proposition 24 de la page 85.
I.2.36 Soit E la direction de X . Notons θ : GA(X) → GL(E) le morphisme f 7→ f~ . C’est
un morphisme surjectif, dont le noyau est le groupe des translations T (X) (cf. la section 1.2).
Puisque ~u 7→ tu~ est un isomorphisme du groupe additif de E sur T (X), le groupe T (X) est
d’ordre card E = q n , car E est isomorphe à K n comme K -espace vectoriel. Par ailleurs,
l’ordre du groupe GL(E), isomorphe à GLn (K), est donné par la proposition 24 de la page 85.
Puisque θ est surjectif et de noyau T (X), le théorème d’isomorphisme montre que GL(E)
est isomorphe au groupe quotient GA(X)/T (X). D’où, en vertu de la proposition 13 de la
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
52
page 72 :
card GA(X) = card T (X) × card GL(E) = card T (X) × card GLn (K)
n
n
Y
n(n−1)/2 Y
k
n(n+1)/2
= q q
(q − 1) = q
(q k − 1)
n
k=1
k=1
= q n (q n − 1)(q n − q)(q n − q 2 ) · · · (q n − q n−1 ).
Voici une autre manière de calculer l’ordre de GA(X). Soit B l’ensemble des bases affines
de X . D’après l’exercice I.2.12 de la page 91, l’action naturelle du groupe GA(X) sur B est
simplement transitive. Autrement dit, si β ∈ B est une base affine fixée, g 7→ g · β est une
bijection de GA(X) sur B . Il en résulte que l’ordre de GA(X) est égal au cardinal de B . Il
reste à prouver la formule suivante :
card B = q n
n−1
Y
k=0
(q n − q h ).
(∗)
Nous laissons au lecteur le soin de rendre tout à fait rigoureux ce qui suit, à l’aide de
raisonnements ensemblistes en bonne et due forme. Comment « fabriquer » une base affine β := (A0 , . . . , An ) de X ? Pour tout k ∈ [[0, n]], notons Xk le sous-espace affine de X
−−−→
−−−→
engendré par A0 , . . . , Ak . Sa direction est Ek := Vect A0 A1 , . . . , A0 Ak , et Xk est de dimension k .
Le point A0 peut être arbitrairement choisi. Soit k ∈ [[0, n − 1]]. Si les points A0 , . . . , Ak
−−−−−→
sont déjà connus, la seule contrainte sur Ak+1 est que A0 Ak+1 ne doit pas appartenir à Ek ,
autrement dit, Ak+1 ne doit pas appartenir à Xk . Le nombre de « choix possibles » pour Ak+1 ,
une fois les points A0 , . . . , Ak choisis, est donc card X \ Xk = q n − q k . D’où :
card B = q n × (q n − 1) × (q n − q) × (q n − q 2 ) × · · · × (q n − q n−1 ),
et nous retrouvons ainsi le résultat obtenu précédemment.
I.2.37 Écartons le cas évident où G est trivial. Posons X := G \ {1} et N := card G
(ainsi, N > 2 ). Supposons que l’action de G sur X soit transitive. Étant donnés deux éléments quelconques x, y de X , il existe donc un automorphisme α de G tel que y = α(x).
Comme dans l’exercice I.2.30 de la page 93, nous en déduisons que x et y ont même ordre.
Tous les éléments de G distincts de 1 ont donc un même ordre p > 2 . Puisque N > 2 , N
possède un facteur premier q , et le théorème de Cauchy montre que G possède un élément
d’ordre q . Il en résulte que p = q est un nombre premier. Le théorème de Cauchy montre de
plus que G est un p-groupe, i.e. il existe un entier n > 1 tel que N := pn .
Soit Z(G) le centre de G. D’après la proposition 22 de la page 83, Z(G) n’est pas trivial. Soit donc a ∈ Z(G), a 6= 1 . Soit maintenant x ∈ X . Il existe un automorphisme β de G appliquant a sur x. Mais β laisse évidemment Z(G) stable. En effet,
si z ∈ Z(G) et t ∈ G, zβ −1 (t) = β −1 (t)z , d’où, en appliquant β , β(z)t = tβ(z).
Ainsi, x = β(a) ∈ Z(G). Nous avons donc démontré que Z(G) = G, ce qui veut dire
que G est commutatif. Notons désormais additivement le groupe G.
Puisque tout élément de X := G \ {0} est d’ordre p, le groupe G possède la propriété suivante : px = 0 pour tout x ∈ G. Considérons alors le corps K := Z/pZ. Comme dans
l’exercice cité, la propriété précédente fait qu’il existe une unique loi externe · : K × G → G
c Dunod 2014
I.2 : Actions de groupes
53
telle que (G, +, ·) soit un espace vectoriel. Explicitement, pour tout k ∈ Z et tout x ∈ G, on
pose k̄ · x := kx, en notant k̄ la classe de k modulo p. Puisque le cardinal de G est pn , G
est de dimension n sur K . Ainsi, G est isomorphe à K n = (Z/pZ)n , en tant que K -espace
vectoriel, et a fortiori en tant que groupe.
Soient inversement p un nombre premier et n ∈ N∗ . Soit toujours K le corps Z/pZ,
et notons G le groupe additif de K n . Le groupe des automorphismes de G contient le
groupe GL(K n ) (en fait, il y a égalité, mais peu importe). D’après l’exercice 3 de la page 66,
le groupe GL(K n ) agit transitivement sur K n \ {0} , a fortiori l’action de Aut(G) sur G \ {0}
est transitive.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
54
Module I.3 : Algèbre bilinéaire
I.3.1 Nous supposerons n > 3 . Pour tous i, j, 1 6 i 6 n, 1 6 j 6 n, les applications li , cj
n
n
T
T
sont des formes linéaires sur Mn (R), M0 =
Ker li ∩
Ker cj est donc un sous espace
i=1
j=1
de Mn (R).
On remarque aussi que
n
X
li (A) =
i=1
X
aij =
(i) La matrice A est dans M0 ,
avec 1 6 i 6 n − 1, 1 6 j 6 n − 1 on a :
ain = −
k=1
aik , anj = −
cj (A).
j=1
16i6n
16j6n
n−1
X
n
X
n−1
X
h=1
si,
ahj
et
seulement
et ann =
si,
n−1
X n−1
X
pour
tous
i, j ,
ahj .
j=1 h=1
On en déduit que les matrices (Eij + Enn − Ein − Enj ) 16i6n−1 ( i 6= j ) forment une base
16j6n−1
de M0 . La dimension de M0 est donc égale à (n − 1)2 .
(ii) Soit J la matrice de Mn (R) dont tous les coefficients sont égaux à un, pour toute matrice A
de M1 , A − lJ , si l = li (A), appartient à M0 . On en déduit que M1 est un sous espace
de Mn (R) de dimension égale à (n − 1)2 + 1 .
(iii) Les formes linéaires Tr et d restreintes à M0 , sont libres, donc M2 est un sous espace
de Mn (R) de dimension égale à (n − 1)2 − 2 .
(iv) De même qu’en (ii), on en déduit que M3 est un sous espace de Mn (R) de dimension
égale à n(n − 2).
I.3.2 Soit H un hyperplan de Mn (K) ; il est le noyau d’une forme linéaire non nulle sur Mn (K).
Il existe donc une matrice A non nulle de Mn (K) telle que :
H = {M ∈ Mn (K) | Tr(AM ) = 0}.
Soit r ∈ [[1, n]], le rang de A, A est équivalente à la matrice Jr de Mn (K) égale
à Diag(1, 1 . . . , 1, 0, 0, . . . , 0), il existe donc un couple P, Q de matrices de GLn (K) tel
| {z }
r
que A = P Jr Q , donc Tr(AM ) = Tr(P Jr QM ) = Tr(Jr QM P ). On est ainsi ramené à
déterminer une matrice M ′ = QM P telle que Tr(Jr M ′ ) = 0, M ′ étant inversible.
Toute matrice de Mn (R), inversible et de diagonale nulle convient, la matrice M ′ dont tous
les éléments sont nuls sauf m′n1 , m′12 , m′23 , . . . , m′n−1n , lesquels sont tous égaux à 1 est une
solution ; elle est inversible puisqu’elle est une matrice de permutation.
Remarque : Une autre solution possible
Recherchons une solution parmi les matrices inversibles de Mn (K) bien connues, à savoir les
matrices de transvection, soit (i, j), 1 6 i 6 n, 1 6 j 6 n, i 6= j et Tij = In + λEij , on
A
a Tr ATij = Tr A + λaji , si aji 6= 0 , on peut choisir λ = − Tr
aji et la matrice Tij est élément
de H ; ceci permet de déterminer une matrice solution si A n’est pas une matrice diagonale.
Si A est diagonale, la matrice M ′ déterminée ci-dessus convient.
c Dunod 2014
I.3 : Algèbre bilinéaire
55
I.3.3 a) Soit (i, j), 1 6 i 6 n, 1 6 j 6 n, i 6= j , g(Ei1 E1j ) = g(Eij ) et g(E1j Ei1 ) = 0 et pour
tout i ∈ [[2, n]], g(Ei1 E1i ) = g(E1i Ei1 ) = g(E11 ), on en déduit donc que g = g(E11 ) Tr .
b) On sait queTr(BC − CB) = 0 . Réciproquement , soit A ∈ Mn (K) de trace nulle, soit V le
sous espace de Mn (K) engendré par les matrices de Mn (K) de la forme BC − CB , d’après
le résultat obtenu ci-dessus V ⊥ est la droite engendrée par la forme Trace. En utilisant le
théorème 11, on en déduit que A est dans V .
I.3.4 a) Soit f ∈ Im tv , il existe g ∈ G∗ telle que f = g ◦ v , pour tout x ∈ Ker v , on
a < f, x >= g ◦ v(x) = 0 , les sous espaces Ker v et Im tv sont donc orthogonaux.
b) Déterminons l’orthogonal de Im tv , x ∈ (Im tv)◦ si, et seulement si, pour
tout g ∈ G∗ , tv(g)(x) = 0 , soit g ◦ v(x) = 0 . On sait que (G∗ )◦ = {0} (proposition 4 de la page 98), donc x ∈ (Im tv)◦ si et seulement si v(x) = 0 , soit x ∈ Ker v ,
ainsi (Im tv)◦ = Ker v , F étant de dimension finie on a aussi Im tv = (Ker v)⊥ (théorème 11
de la page 102).
Soit n = dim F , on a rang tv = dim(Im tv) = dim(Ker v)⊥ = n − dim Ker v , on en déduit
donc : rang v = rang tv .
t
c) Supposons maintenant v ◦ u = 0 , on en déduit (v ◦ u) = 0 donc tu ◦ tv = 0 , ainsi
que Im u ⊂ Ker v et Im tv ⊂ Ker tu , et ces quatre sous espaces sont de dimension finie.
On sait (proposition 28 de la page 114) que dim H = dim Ker v − dim Im u
et dim H ′ = dim Ker tu − dim Im tv . De même qu’au b), on démontre que (Im u)⊥ = Ker tu ,
donc dim H ′ = n − dim Im u − (n − dim Ker v) = dim H.
Soit x ∈ E, y ∈ Ker v, g ∈ G∗ , f ∈ Ker tu , on a :
< y+u(x), f +tv(g) >=< y, f > + < u(x), f > + < y, g◦v > + < u(x), g◦v >=< y, f >,
on en déduit que l’on peut définir l’application ϕ : (ȳ, f¯) 7→< y, f > .
La forme bilinéaire ϕ ainsi définie sur H × H ′ est non dégénérée car l’égalité < y, f >= 0, ∀f ∈ Ker tu , implique y ∈ Im u , donc ȳ = 0 .
Les espaces H ′ et H ∗ sont isomorphes.
I.3.5 a) Montrons que les formes linéaires fk , 0 6 k 6 n forment un système libre de E ∗ . Soient
n
n
P
P
λk tk ,
des scalaires λk , 0 6 k 6 n, tels que pour tout P ∈ E,
λk fk (P ) = 0 . Si P :=
on a
Z
0
k=0
1
k=0
P 2 (t) dt = 0 , l’application t 7→ P 2 (t) étant une fonction continue et positive
sur [0, 1], on peut affirmer que P = 0 donc que λk = 0 pour tout k ∈ [[0, n]].
n
P
b) Pour tout k ∈ [[0, n]] et pour tout P =
a j tj ,
j=0
fk (P ) =
Z
n
1X
0 j=0
aj tk+j dt =
n
X
j=0
aj
·
k+j+1
La matrice de passage de la base duale de B à la base (fk ) est donc :
1
M=
·
j + k + 1 06j6n
06k6n
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
56
I.3.6 a) Les polynômes Pn , pour n ∈ N, sont de degrés échelonnés, il forment une base de R[X].
On vérifie que, pour tout n ∈ N∗ , ∆(Pn ) = nPn−1 , donc pour tout P ∈ K[X] de degré n > 0 , on a deg ∆(P ) = deg ∆(Pn ) = deg Pn−1 = n − 1 = deg P − 1 ; en particulier ∆(P ) 6= 0 . Par ailleurs, si P est constant ∆(P ) = 0 . Par suite le noyau de ∆ est
l’ensemble des polynômes constants et pour tout n > 0, ∆( Pn!n ) =
Pn−1
(n−1)! ·
b) Pour tout k ∈ [[0, n]], on a ∆k (Pn /n!) = Pn−k /(n − k)!, donc pour tout k ∈ [[0, p]] :
∆k (P ) =
p
X
n=k
an
Pn−k
,
(n − k)!
on en déduit ak = ∆k (P )(0)· pour tout k ∈ [[0, p]].
c) D’après le résultat obtenu ci-dessus, pour tout polynôme P ∈ Kp [X], on a P =
La base duale de la base
Pn
n! 06n6p
p
P
n=0
est donc la base P 7→ ∆n (P )(0) 06n6p .
∆n (P )(0) Pn!n ·
I.3.7 Soient B := (e1 , . . . , en ) une base de E et (x1 , . . . , xp ) une famille de p vecteurs de E .
n
P
Pour tout i ∈ [[1, p]], on a xi =
ξiji eji .
ji =1
Soit u une forme p-linéaire alternée sur E , on a :
X
u(x1 , x2 , . . . , xp ) =
ξ1j1 ξ2j2 . . . ξpjp u(ej1 , ej2 , . . . , ejp ),
(ji )
la somme du second membre étant étendue à tous les p-uples (j1 , . . . , jp ) tels que 1 6 ji 6 n.
Puisque p > n, il existe au moins deux vecteurs égaux parmi chaque liste de vecteurs (ej1 , ej2 , . . . , ejp ) écrite ci-dessus, donc tous les u(ej1 , ej2 , . . . , ejp ) sont nuls et u = 0 .
I.3.8 L’espace R3 étant muni de sa base canonique, la matrice associée à Φa est


a −1 1
A =  −1
a 1 .
1
1 a
a) On a det A = (a + 1)2 (a − 2), Φa est donc dégénérée si et seulement si a = −1 ou a = 2 .
Si a = −1, A est de rang 1 et Φ−1 (x) = −(x1 + x2 − x3 )2 , si a = 2, A est de rang 2, et son
noyau est la droite dirigée par le vecteur (1, 1, −1).
b) Les vecteurs v1 = (1, 0, 1), v2 = (1, −2, −1) forment une base Φa -conjuguée du plan
d’équation :x1 + x2 − x3 = 0 , et le vecteur v3 = (1, 1, −1) est Φa -conjugué de v1 et v2 .
Une base de R3 formée de vecteurs Φa conjugués, pour tout a, est la base (v1 , v2 , v3 ).
I.3.9
•
P
P
P
P
P
P
On peut écrire Φ1 (x) = ixi xj + (j − 1)xi xj = i xi xj + (j − 1)xj xi .
i,j
i,j
i
j
j
i
P
P
On en déduit : Φ1 (x) = (2i − 1)xi xj , et Φ1 est le produit de deux formes linéaires
i
j
indépendantes, elle est donc de signature égale à (1, −1).
c Dunod 2014
I.3 : Algèbre bilinéaire
•
Φ2 (x) =
P
57
inf(i, j)xi xj .
i,j
Si Rn est muni de sa base canonique, la matrice associée à la forme Φ2 est


1 1 1 ... 1 1 1
1 2 2 . . . 2 2 2 


 .. .. ..
..
..
..
.. 
. . .

.
.
.
.

A=
1 2 3 . . . k k k 


. . .
..
.. . .
.. 
 .. .. ..
. .
.
.
1 2 3 ... k ... n
On peut appliquer la méthode de Gauß à la forme Φ2 :
Φ2 (x) = x21 + 2x1
n
X
xi +
i=2
X
inf(i, j)xi xj
26i6n
26j6n
Φ2 (x) = (x1 + x2 + · · · + xn )2 +
X
16i6n−1
16j6n−1
inf(i, j)xi+1 xj+1 ·
Ainsi, par récurrence sur n, on obtient :
•
•
Φ2 (x) = (x1 + x2 + · · · + xn )2 + (x2 + x3 + · · · + xn )2 + · · · + (xn−1 + xn )2 + x2n ·
P
Φ3 (x) =
(xi − xj )2 .
i<j
On note que la forme Φ3 est positive ; son noyau est donc égal à son cône isotrope.
Or Φ3 (x) = 0 si, et seulement si, x1 = x2 = · · · = xn , le noyau de Φ3 est donc une
droite et la signature de Φ3 est (n − 1, 0).
P
Φ4 (x) = cosh((i + j)α)xi xj .
i,j
On sait que cosh(i + j)α = cosh iα cosh jα + sinh iα sinh jα , donc :
X
X
Φ4 (x) = ( (cosh αi)xi )2 + (
sinh(αi)xi )2 .
i
•
i
Si α 6= 0 , Φ4 est de signature (2, 0), si α = 0 , Φ4 est un carré.
P
Φ5 (x) = sin(θi + θj )xi xj .
i,j
On écrit sin(θi + θj ) = sin θi cos θj + cos θi sin θj et l’on en déduit :
X
X
Φ5 (x) = 2
sin θi xi
cos θj xj .
i
j
Ainsi Φ5 est le produit de deux formes linéaires, ces formes sont liées si, et seulement
si, pour tous i, j, 1 6 i 6 n, 1 6 j 6 n, sin θi cos θj − cos θi sin θj = 0 , c’est à dire
sin(θi − θj ) = 0 , soit θi − θj = 0 (π).
Si les formes ne sont pas liées, la signature de Φ5 est (1,1). Si les formes sont liées, pour
tout i, 1 6 i 6 n, θi = θ1 (π), donc sin θi = εi sin θ1 , cos θi = εi cos θ1 , εi = ±1 ,
P
donc Φ5 (x) = sin θ1 cos θ1 ( εi xi )2 , ou bien Φ5 est nulle ou bien de signature (1,0) ou
i
(0,1) suivant le signe de sin θ1 cos θ1 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
58
•
n
P
Φ6 (x) =
i=1
x2i − (
n
P
αi xi )2 . Nous supposerons que les scalaires αi ne sont pas tous
i=1
nuls. Soit H l’hyperplan d’équation
n
P
αi xi = 0 , pour tout x dans H , Φ6 (x) =
i=1
n
P
i=1
x2i ,
la restriction de Φ6 à cet hyperplan est donc définie positive, on en déduit que la signature
de Φ6 est ou bien (n, 0), ou bien (n − 1, 0), ou bien (n − 1, 1).
n
n
P
P
P
Si ϕ est la forme polaire associée à Φ6 , on a ϕ(x, y) =
xi xj − ( αi xi )( αi yi ).
ij
i=1
i=1
Soit D la droite dirigée par v := (α1 , α2 , . . . , αn ), pour tous x ∈ D, y ∈ H, ϕ(x, y) = 0 ,
ainsi il nous suffit d’étudier les restrictions de Φ6 à H et à D .
n
P
Soit s :=
α2i . Φ6 (v) = s(1 − s). Si s < 1 , Φ6 est définie positive, si s = 1 , la
i=1
signature de Φ6 est (n − 1, 0), si s > 1 , la signature de Φ6 est (n − 1, 1).
I.3.10 Soit Φ(x) =
n
P
(i2 + i − 1)x2i + 2
i=1
Gauß. On a Φ(x) =
puis :
P
2 inf(i, j) − 1 xi xj ; appliquons la méthode de
16i<j6n
n
P
P
(x1 + x2 + · · ·+ xn )2 + (i2 + i − 2)x2i + 2
i=2
26i<j6n
2 inf(i, j)− 2 xi xj ,
Φ(x) = (x1 + x2 + · · · + xn )2 + (2x2 + x3 + · · · + xn )2
+
n
X
i=3
(i2 + i − 3)x2i + 2
X
36i<j6n
Soit k, 1 6 k 6 n − 2 , supposons que :
2 inf(i, j) − 3 xi xj .
Φ(x) = (x1 + x2 + · · · + xn )2 + · · · + (kxk + xk+1 + · · · + xn )2
+
n
X
i=k+1
i2 + i − (k + 1) x2i + 2
X
k+16i<j6n
2 inf(i, j) − (k + 1) xi xj .
En appliquant une fois de plus le procédé de Gauß , on obtient :
Φ(x) = (x1 + x2 + · · · + xn )2 + · · · + (k + 1)xk+1 + xk+2 + · · · + xn
+
n
X
i=k+2
i2 + i − (k + 2) x2i + 2
On en déduit donc : Φ(x) =
n
P
k=1
X
k+26i<j6n
2
2 inf(i, j) − (k + 2) xi xj .
(kxk + xk+1 + · · · + xn )2 , la forme Φ est définie positive.
I.3.11 a) Soit P ∈ R[X], P 6= 0 , de degré k , il existe un réel C > 0 tel que |P (n)| 6 Cnk
et |P (−n)| 6 Cnk , donc |P (n)P (−n) exp(−n)| 6 C 2 n2k exp(−n), on sait que
n2k exp(−n) = O+∞ (1/n2 ), la série est donc absolument convergente.
b) Considérons l’application ϕ qui au couple (P, Q) de R[X] × R[X] associe
+∞
X
1
Φ(P
+
Q)
−
Φ(P
)
−
Φ(Q)
,
on
a
ϕ(P,
Q)
=
P (n)Q(−n) + P (−n)Q(n) exp(−n),
2
n=0
c Dunod 2014
I.3 : Algèbre bilinéaire
59
l’application ϕ est bilinéaire et symétrique, de plus pour tous α ∈ R, P ∈ R[X], on
a Φ(αP ) = α2 Φ(P ). On peut donc affirmer que Φ est une forme quadratique sur R[X].
Pour tout polynôme P pair, Φ(P ) =
+∞
X
P 2 (n) exp(−n) et pour tout polynôme P im-
n=0
pair, Φ(P ) = −
+∞
X
P 2 (n) exp(−n), dans les deux cas Φ(P ) = 0 si, et seulement
n=0
si, P (n) = 0 pour tout n, c’est à dire P = 0 ; la restriction de Φ au sous espace des polynômes pairs (respectivement impairs) est définie positive (respectivement définie négative).
La signature de la forme quadratique restriction de Φ à l’espace Rp [X] est donc :
E(p/2) + 1, p − E(p/2) .
I.3.12 La forme bilinéaire associée à Φ est la forme ϕ qui, au couple (x, y) ∈ E × E associe ϕ(x, y) = f (x)f (y), on peut donc consulter l’exercice 8 de la page 113.
On peut préciser le résultat obtenu dans l’étude de la réciproque : il existe λ ∈ K tel
que ϕ(x, y) = λf (x)f (y). Si K = C, λ est un carré et ϕ est le carré d’une forme linéaire,
si K = R, ϕ est égal à plus ou moins le carré d’une forme linéaire.
I.3.13 Pour tous i, j , on sait que :
Z +∞
1
e−(ai +aj )t dt =
,
a
+
aj
i
0
Φ(x) =
donc
i,j
0
+∞
e−(ai +aj )t dt xi xj =
Z
+∞
0
=
Z
+∞


X
i,j
n
X
0
+∞
0
i,j
On a aussi :
X Z
X Z
e−(ai +aj )t dt xi xj .

e−ai t xi e−aj t xj  dt
e
−ai t
i=1
xi
!2
dt.
La forme Φ est donc positive, de plus Φ(x) = 0 si, et seulement si,
n
P
e−ai t xi = 0
i=1
pour tout t ∈ [0, +∞[, les réels (ai , 1 6 i 6 n) étant deux à deux distincts les applican
P
tions t ∈ [0, +∞[ 7→ e−ai t sont indépendantes, ainsi
e−ai t xi = 0 pour tout t ∈ [0, +∞[,
i=1
si, et seulement si, xi = 0 pour tout i ∈ [[1, n]] , la forme Φ est donc définie positive.
1
Remarques : On appelle matrice de Cauchy, toute matrice M = ai +b
16i6n , les ai et les bj
j
16j6n
étant des éléments d’un corps K tels que, pour tout (i, j), ai + bj 6= 0 .
On peut en calculer le déterminant, par récurrence sur n, et l’on obtient :
Y
Y
(ai − aj ) (bi − bj )
Det M =
i<j
i<j
Y
(ai + bj )
·
i,j
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
60
Dans le cas où, pour tout i ∈ [[1, n]], ai = bi , les scalaires ai étant des réels strictement positifs
deux à deux distincts, les mineurs principaux de M sont tous strictement positifs, la matrice M
est donc définie positive.
1
On appelle matrice de Hilbert de taille n la matrice H = i+j−1
16i6n , en appliquant le ré16j6n
sultat ci-dessus on peut affirmer que la matrice H est définie positive. On peut aussi remarquer,
en anticipant le paragraphe 1.3 du module I.4, qu’elle est la matrice de Gram des applications t 7→ ti−1 , 1 6 i 6 n, si l’on a muni l’espace des applications continues sur [0, 1] du
Z 1
produit scalaire ( f | g ) =
fg.
0
I.3.14 a) Soit k ∈ [[2, n]] et :

b1
 a2

0

Ak =  .
 ..

0
0
c1
b2
a3
..
.
0
c2
b3
..
.
0
0
c3
..
.
...
...
...
..
.
...
...
0
0
ak−1
0
bk−1
ak
0
0
0





.


ck−1 
bk
On calcule Dk = det(Ak ) grâce au développement de ce déterminant par rapport à la dernière ligne, et l’on obtient : Dk = bk Dk−1 − ak ck−1 Dk−2 , on vérifie de plus que D2 = d2
et D1 = d1 , ce qui permet d’affirmer que Dk = dk , ∀k ∈ [[1, n]].
b) On vérifie que pour tout k ∈ [[1, n − 1]], (LU )k,k+1 = ck , de plus (LU )11 = b1 ,
et ∀k ∈ [[2, n − 2]] , (LU )kk =
ak ck−1 dk−2 +dk
dk−1
= bk , (LU )k k−1 = ak et (LU )kl = 0
dans tous les autres cas. Donc A = LU .
c) Pour résoudre le système AX = V , on détermine d’abord Y solution de l’ équation L∆Y = V , puis l’on résout l’équation ∆−1 U X = Y . Soit Z = ∆−1 U , on a :


1 z1
0 ... ...
0
0 1 z2 . . . . . .
0 


0 0
1
z
.
.
.
0 
3


Z = .
.
..
 .. . . . . . . . . .

.


0 . . . . . . 0
1 zn−1 
0 ... ...
0
1
d
ck
Les scalaires (zk ), 1 6 k 6 n − 1 sont tels que zk = ck k−1
dk = bk −ak zk−1 , d’autre part on
a:
 d1

0
0
...
0
0
d0
 a2 d 2 0
...
0
0 
d1


d3
0 a
...
0
0 
3


d2
.
L∆ = 
.. . .
..
 ..

.
.
.
0
0 
 .


0
0 . . . an−1 ddn−1
0 
n−2
dn
0
0 ... ...
an
dn−1
On en déduit : y1 =
yk =
c Dunod 2014
v1
b1
, et, pour tout k ∈ [[2, n]], ak yk−1 +
dk
dk−1 yk
= vk , soit
dk−1
zk
(vk − ak yk−1 )
(vk − ak yk−1 ) = (vk − ak yk−1 ) =
·
dk
ck
(bk − ak zk−1 )
I.3 : Algèbre bilinéaire
61
Il reste donc à déterminer X tel que ZX = Y , on a xn = yn , et pour
tout k ∈ [[1, n − 1]], xk = yk − zk xk+1 .
Pour une telle résolution, on effectue 3(n − 1) additions , 3(n − 1) multiplications et 2n
divisions, soit 8n − 6 opérations.
I.3.15 La propriété énoncée est certainement vraie pour une matrice de taille 1 !
Utilisons un raisonnement par récurrence, supposons que toute matrice symétrique de taille n
dont tous les mineurs principaux sont strictement positifs est définie positive.
Soit A une matrice de Sn+1 (R), de mineurs principaux strictement positifs,




a11 a12 . . . a1 n
a1 n+1
 a2 n+1 
 a21 a22 . . . a2 n 
A
V




A= t1
, avec A1 :=  .
et V :=  .  .

.
.
.
..
..
.. 
V an+1 n+1
 .. 
 ..
an 1
an 2
. . . an n
an n+1
D’après l’hypothèse, la matrice symétrique A1 , de taille n, a tous ses mineurs principaux
strictement positifs, elle est donc définie positive et congruente à la matriceIn , il existe donc
une matrice P de GLn (R) telle que A1 = tP −1 P −1 , on peut donc écrire :
t
t
A1
V
P 0
In−1
PV
P 0
= t
t
0 1
0 1
V an+1 n+1
V P an+1 n+1
et l’on se ramène au cas d’une matrice de la forme :

1
0 0 ... 0
 0
1 0 ... 0

 ..
..
M = .
.

 0
0 0 ... 1
m1 m2
. . . mn
On a det M = mn+1 −
t
n
P
i=1
m2i et, pour tout x dans Rn+1 :
XM X =
n
X
x2i + 2
i=1
On en déduit :
t

m1
m2 


.

mn 
mn+1
XM X =
n
X
n
X
mi xi xn+1 + m2n+1 x2n+1 .
i=1
(xi + mi xn+1 )2 + det M x2n+1 .
i=1
D’après l’hypothèse, on sait que le déterminant de M est strictement positif, d’où le résultat.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
62
Module I.4 : Espaces préhilbertiens
I.4.1 Montrons : (i) =⇒ (ii).
Les projecteurs orthogonaux p et q de l’espace vectoriel euclidien E sont diagonalisables, de
plus ils commutent. Il existe donc une base de E formée de vecteurs propres communs à p
et q .
Montrons : (ii) =⇒ (iii).
Soit B une base de vecteurs propres communs à p et q . On a :
P := MatB (p) = Diag(p1 , . . . , pk , . . . , pn ),
Q := MatB (q) = Diag(q1 , . . . , qk , . . . , qn ).
On en déduit : P Q = MatB (pq)=Diag(p1 q1 , . . . , pk qk , . . . , pn qn ). Pour tout k ∈ [[1, n]], les
réels pk et qk valent 1 ou 0 , il en est de même de pk qk ; pq est donc un projecteur.
Montrons :(iii) =⇒ (i) .
Nous allons montrer que pq est orthogonal, dans ce cas, il est symétrique donc pq = qp.
Remarquons tout d’abord que, pour tout vecteur v de E , kpq(v)k 6 kq(v)k 6 kvk (un
projecteur orthogonal « diminue » les normes).
Pour tout (x, y) ∈ Im(pq) × Ker(pq), et pour tout t ∈ R, pq(x + ty) = x ; on a donc :
kxk2 6 kx + tyk2 , soit t2 kyk2 + 2t(x|y) > 0 , ce qui implique (x|y) = 0 ; Im pq et Ker pq
sont donc orthogonaux, pq est bien un projecteur orthogonal.
I.4.2 Si
(e1 , e2 , . . . , en )
est
la
base
canonique
de
Rn ,
les
vecteurs
(e1 − en , e2 − en , . . . , en−1 − en ) forment une base de l’hyperplan, on peut alors appliquer l’orthogonalisation de Gram-Schmidt à cette famille, désignons par (v1 , v2 , . . . , vn−1 )
le système obtenu.
Par récurrence sur k , on vérifie que : vk = ek − k1 (e1 + e2 + · · · + ek−1 + en ) pour
tout k ∈ [[1, n − 1]]. Une base orthonormée de l’hyperplan est donc :
r k
1
B :=
ek − (e1 + e2 + · · · + ek−1 + en ) , k ∈ [[1, n − 1]] ·
k+1
k
I.4.3 Soit u une application de E dans E conservant le produit scalaire, elle appartient à O(E)
si, et seulement si, elle est linéaire, ce que nous allons montrer. Soit (e1 , e2 , . . . , en ) une base
orthonormée de E , u(e1 ), u(e2 ), . . . , u(en ) est une base orthonormée de E car u conserve
le produit scalaire. Pour tout x dans E , on a :
x=
n
X
i=1
D’où le résultat.
(x|ei )ei
et u(x) =
n
X
i=1
n
X
u(x) u(ei ) u(ei ) =
(x|ei )u(ei ).
i=1
I.4.4 Exemples de groupes de Coxeter.
a) Soit E un espace vectoriel euclidien de dimension n > 1 , soient s une symétrie orthogonale
hyperplane et g ∈ O(E), on définit σ := g ◦ s ◦ g −1 .
On vérifie que σ est une symétrie orthogonale, en effet σ 2 = g ◦ s2 ◦ g −1 = Id
c Dunod 2014
I.4 : Espaces préhilbertiens
63
et σ = g ◦ s ◦ g ∗ = σ ∗ . Cherchons maintenant l’axe de σ . On a σ(x) = x si, et seulement si, g ◦ s ◦ g −1 (x) = x, soit s ◦ g −1 (x) = g −1 (x), c’est à dire g −1 (x) ∈ H , l’axe de σ
est donc l’hyperplan g(H).
b) Simple conséquence de la définition de deux hyperplans perpendiculaires.
c) Soient s1 (resp. s2 ), deux symétries hyperplanes d’axe H1 (resp. H2 ), soient v1 (resp. v2 )
un vecteur unitaire orthogonal à H1 (resp. H2 ), et p1 (resp. p2 ) le projecteur orthogonal
1
2
sur Rv1 (resp. Rv2 ). On sait que p1 = Id −s
, de même p2 = Id −s
, donc s1 et s2
2
2
commutent si, et seulement si, p1 et p2 commutent. Pour tout x ∈ E, p1 (x) = (x|v1 )v1
et p2 (x) = (x|v2 )v2 , donc :
p1 ◦ p2 (x) = (x|v2 )(v1 |v2 )v1 ,
p2 ◦ p1 (x) = (x|v1 )(v1 |v2 )v2 .
Ainsi p1 et p2 commutent si, et seulement si, ou bien (v1 |v2 ) = 0 , c’est à dire H1 et H2 sont
perpendiculaires, ou bien si v1 et v2 sont colinéaires, c’est à dire s1 = s2 .
d) Si n = 3 , un tel sous groupe est engendré par 1 , 2 ou 3 symétries orthogonales hyperplanes.
On obtient les cas suivants :
1) G1 = {s, Id}, s étant une symétrie orthogonale hyperplane.
2) G2 = {s, t, s ◦ t, Id}, s, t étant deux symétries orthogonales hyperplanes d’axes perpendiculaires. Dans ce cas, si l’on choisit les axes de s et t comme plans de coordonnées, les
matrices S et T associées à s et t sont :




1
0
0
1
0
0
1
0  et T =  0 −1
0 .
S= 0
0
0 −1
0
0
1
3) G3 = {s, t, u, s ◦ t, s ◦ u, t ◦ u, Id}, s, t, u étant trois symétries orthogonales hyperplanes
d’axes deux à deux perpendiculaires. Dans ce cas, si l’on choisit les axes de s, t et u comme
plans de coordonnées, les matrices S, T et U associées à s, t et u sont :






1
0
0
1
0
0
−1
0
0
1
0  T =  0 −1
0  U = 0
1
0 .
S= 0
0
0 −1
0
0
1
0
0
1
I.4.5 a) Soit x =
p
P
xi vi , on a :
i=1
2
kxk =
p X
p
X
i=1 j=1
On en déduit :
xi xj (vi |vj )
p X
p
X
i=1 j=1
et
p
2
p X
p
X
X
|xi |vi =
|xi ||xj |(vi |vj ).
i=1
i=1 j=1
(|xi ||xj | − xi xj )(vi |vj ) 6 0.
En effet |xi ||xj | − xi xj > 0 et (vi |vj ) < 0 .
p
p
p
X
X
X
b) D’après a), si
λi vi = 0 , alors
|λi |vi = 0 , et
|λi |(vi |a) = 0 , ce qui entraîne,
i=1
i=1
i=1
puisque (vi |a) > 0 , que tous les λi sont nuls, la famille (v) est donc libre.
c) Supposons que l’un des λi soit nul, à une permutation près, on peut supposer λ1 = 0 , pour
tout i ∈ [[2, p]], (−v1 |vi ) est strictement positif et la famille (v2 . . . vp ) est liée, ce qui, d’après
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
64
b) est contradictoire.
Supposons que les λi ne soient pas tous de même signe, soit :
On a
p
X
I = {i ∈ [[1, p]]| λi > 0}
p
X
λi vi = 0 et
i=1
i=1
on en déduirait donc
X
i∈I
|λi |vi = 0 , soit
et
X
J = {j ∈ [[1, p]]| λj < 0}.
λi vi +
i∈I
X
λj vj = 0 et
j∈J
X
i∈I
λi vi −
X
λj vj = 0 ,
j∈J
λi vi = 0 , ce qui est impossible (I 6= ∅). Montrons maintenant que
le rang de (v) est égal à p − 1 ; supposons qu’il existe une autre relation de liaison de la
p
p
X
X
forme
µi vi = 0 , on en déduirait
(λ1 µi − λi µ1 )vi = 0 , donc(λ1 µi − λi µ1 ) = 0 pour
i=1
i=2
tout i ∈ [[2, p]], et µi = µλ11 λi , les deux relations de dépendance sont donc proportionnelles,
d’où le résultat.
On peut donc affirmer que (p − 1) 6 n soit p 6 n + 1.
d) Le système (v) étant lié, il existe des réels, non tous nuls, λ1 , . . . , λn+1 tels
n+1
P
que
λi vi = 0 .
i=1
Pour tout k ∈ [[1, n + 1]],
Définissons s :=
n+1
P
i=1
n+1
P
i=1
λi (vi |vk ) = 0 , soit λk − α
n+1
P
λi = 0 .
i6=k
λi . Pour tout k ∈ [[1, n + 1]], −αs + (1 + α)λk = 0 soit λk =
ainsi pour tout k ∈ [[1, n + 1]], λk =
On a alors
P
(n+1)α
α+1 λk
et α =
αs
α+1
,
1
n·
vi = 0 .
i=1
I.4.6 Il existe une base orthonormée de E , soit B , formée de vecteurs propres de a. Les valeurs propres de l’endomorphisme a, défini positif, sont des réels strictement positifs. On
a : D := MatB (a)=Diag(d21 , . . . , d2k , . . . , d2n ).
Si B := MatB (b), C := MatB (c), on a ac + ca = b si et seulement si d2i ci,j + ci,j d2j = bi,j ,
soit ci,j =
bi,j
d2i +d2j
(avec les notations usuelles).
La matrice C existe donc, elle est unique et symétrique, il en va de même de l’endomorphisme c.
Montrons maintenant que toutes les valeurs propres de c sont positives.
Considérons un vecteur propre X de C , associé à une valeur propre λ : C(X)=λX . On
a DCX + CDX = BX et t XDCX + t XCDX = t XBX ; or t XDCX = t XCDX , on
en déduit : 2λt XDX = t XBX .
On sait que t XDX est strictement positif et que t XBX est positif, λ est donc positif, il en
est de même de la matrice C et de l’endomorphisme c. D’après le corollaire de la proposition
55, page 183, on peut affirmer que C ∈ Sn+ (R) et que l’endomorphisme c est positif.
I.4.7 Soient C1 , C2 , C3 , les vecteurs colonnes de la matrice
c Dunod 2014

1 −1
2
A :=  −1
0 −1

0
−1  ,
1
I.4 : Espaces préhilbertiens
65
et (e1 , e2 , e3 ) la base canonique de R3 , on voit de suite que C1 + C2 + C3 = 0 et


1
que C1 − C3 =  0  .On en déduit donc que e1 + e2 + e3 est vecteur propre de A
−1
associé à la valeur propre 0 et que e1 − e3 est vecteur propre de A associée à 1 . La trace
de A étant égale à 4 , on sait que 3 est valeur propre de A, un vecteur propre associé à 3
étant e1 − 2e2 + e3 = (e1 − e3 ) ∧ (e1 + e2 + e3 ) puisque l’on sait que les vecteurs propres
de A sont deux à deux orthogonaux.
Le couple des matrices :
 1



√
√1
√1
1 0 0
2
6
3

−2
√1 
D := 0 3 0 P :=  0 √
6
3 
−1
√
√1
√1
0 0 0
2
est donc une solution.
6
3


2 −2
1
4 −4  , contrairement au cas précédent,
On suppose maintenant que A :=  −2
1 −4 −2
il n’apparaît pas de « combinaisons linéaires » simples des colonnes de A, on calcule
donc det(λI − A) = (λ − 1)(λ + 4)(λ − 7) et l’on recherche les vecteurs propres associés respectivement à (1, −4, 7).
On détermine alors le couple de matrices :

 5


√
√1
0
1
0
0
30
6

−2 
0  P :=  √230 √15 √
D :=  0 −4
6
−1
√
√2
√1
0
0
7
30
tel que A = P DP
−1
5
6
.
I.4.8 Calcul de la distance d’un point à un sous espace de dimension finie d’un espace euclidien :
un « bon classique ».
Considérons l’espace E des applications continues sur ]0, 1], à valeurs dans R, de carré intéZ 1
grable. On peut munir E du produit scalaire : (f1 |f2 ) =
f1 (t)f2 (t) dt.
0
L’application g : t 7→ ln(t) est dans E (ln(t))2 6 ( √1t ) ; l’application f admet donc un
minimum égal au carré de la distance de g à Rn [T ].
n
P
Soit p le projecteur orthogonal sur Rn [T ] : p(g) =
ak tk , (a0 . . . an ) étant solution du
k=0
système linéaire non homogène (S) de n équations :
n
X
k=0
ak (tk |th ) = (g|th ),
∀h ∈ [[0, n]],
qui équivaut au système :
n
X
k=0
ak
1
=−
,
k+h+1
(h + 1)2
∀h ∈ [[0, n]].
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
66
Considérons la fraction rationnelle F (t) :=
n
X
k=0
ak
1
+
; (a0 , . . . an ) est solution
k + t + 1 (t + 1)2
Pn (t)
(t+1)2 (t+2)...(t+n+1)
1
coefficient de (t+1)
2 dans la
de (S) si, et seulement si, F (0) = · · · = F (n) = 0 . On a F (t) =
avec deg Pn 6 n + 1 , d’où Pn (t) = Cn t(t − 1) . . . (t − n). Le
décomposition en éléments simples de F est 1 , donc :
1=
Pn (−1)
(−1)n+1 Cn (n + 1)!
=
n!
n!
Cn =
et
On sait que d2 (g, Rn [T ]) = kgk2 − p(g) g . On a kgk2 =
n
P
intégration par parties), et p(g) g = −
k=0
On remarque : F ′ (t) =
−2
(t+1)3
n
−
n
P
k=0
′
ak
(k+1+t)2
Z
1
(−1)n+1
·
n+1
(ln(t))2 dt = 2 (faire une
0
ak
(k+1)2 ·
, donc d2 (g, Rn [T ]) = −F ′ (0). Au voisinage
Cn
1
de zéro, F (t) ∼ t (−1)
(n+1) donc F (0) = − (n+1)2 , et inf(f ) =
1
(n+1)2 ·
Z
1
I.4.9 a) Soit g ∈ E , on vérifie sans difficulté que l’application de E dans R : f 7→
(f g + f ′ g ′ )
0
Z 1
est linéaire, on a aussi (f |g) = (g|f ). De plus (f |f ) =
f 2 + f ′2 > 0 et (f |f ) = 0 si
0
et seulement si l’application f 2 + f ′2 , continue et positive sur [0, 1], est nulle, ce qui entraîne f 2 = 0 . L’application (f, g) 7→ (f |g) est donc bien un produit scalaire sur E .
b) Soient ϕ0 et ϕ1 ) les applications respectivement définies par : f ∈ E 7→ f (0)
et f ∈ E 7→ f (1)), ce sont des formes linéaires sur E et V = Ker ϕ0 ∩ Ker ϕ1 . Soit u
l’application : f ∈ E 7→ f − f ′′ , u est une application linéaire de E dans C 0 ([0, 1], R)
et W = Ker u ; ainsi V et W sont des sous espaces vectoriels de E .
Pour tous g dans V et h dans W , on a (gh + g ′ h′ ) = gh′′ + g ′ h′ = (gh′ )′ ,
d’où : (g|h) = g(1)h′ (1) − g(0)h′ (0) = 0 ; V et W sont donc orthogonaux.
Soit
hα,β
l’application
:
t
7→
β sinh(t)−α sinh(t−1)
sinh(1)
,
elle
est
dans
W,
et hα,β (0) = α , hα,β (1) = β . Pour tout f de E , si α = f (0) et β = f (1), l’application g := f − hα,β est dans V ; V et W sont donc supplémentaires orthogonaux.
c) D’après b), pour tout f ∈ F, f = hα,β + g , avec g ∈ V , donc F = hα,β + V , on en déduit :
Z 1
(α2 + β 2 ) cosh(1) − 2αβ
inf =
(f 2 (t) + f ′2 (t)) dt = khα,β k2 =
·
f∈ F
sinh(1)
0
I.4.10 Applications des propriétés de u∗ u , de Ker u∗ u et de Im u∗ u
Montrons tout d’abord la propriété suivante : pour tout endomorphisme u d’un espace vectoriel
euclidien :
Ker u = Ker u∗ u.
En effet Ker u ⊂ Ker u∗ u , et pour tout x ∈ Ker u∗ u, 0 = (x|u∗ u(x)) = ku(x)k2 ,
donc Ker u∗ u ⊂ Ker u ; ainsi Ker u = Ker u∗ u .
c Dunod 2014
I.4 : Espaces préhilbertiens
67
a) Soit u dans E , tel que u = uu∗ u , alors u∗ u = u∗ uu∗ u , ainsi u∗ u est un projecteur
symétrique, il est donc orthogonal.
Réciproquement supposons que u∗ u soit un projecteur orthogonal. Pour tout x dans Ker u∗ u ,
on a u(x) = 0 = uu∗ u(x), et pour tout x dans Im u∗ u , on a u∗ u(x) = x et uu∗ u(x) = u(x).
Les applications u et uu∗ u sont égales sur deux sous espaces supplémentaires, elles sont donc
égales.
b) Supposons u dans A. On sait que u∗ u est un projecteur orthogonal, donc :
(Ker u)⊥ = (Ker u∗ u)⊥ = Im u∗ u;
ainsi, pour tout x dans (Ker u)⊥ , u∗ u(x) = x, et ( x | x ) = x u∗ u(x) = ku(x)k2 .
Réciproquement, nous allons montrer que u∗ u est un projecteur en montrant que ses valeurs
propres sont dans {0,1}. Soit λ une valeur propre non nulle de u∗ u et x un vecteur propre
associé, x ∈ Im u∗ u , et kxk2 = ku(x)k2 = x u∗ u(x) = λkxk2 , donc λ = 1 .
c) D’après les résultats obtenus au b), nous savons que (Ker u)⊥ ⊂ {x ∈ E | kxk = ku(x)k} .
Réciproquement, si x ∈ E et si kxk = ku(x)k , on a :
kxk2 = ku(x)k2 = x u∗ u(x) 6 kxk2 ;
d’après l’inégalité de Cauchy-Schwarz : u∗ u(x) = x .
I.4.11 a) Pour tout P ∈ E , u(P )(x) =
Z
seulement si, pour tout k ∈ [[0, n]],
1
n X
n
k=0
k
xn−k
Z
1
tk P (t) dt ; donc u(P ) = 0 si, et
0
tk P (t) dt = 0 ; un tel polynôme P orthogonal à tout
0
l’espace est nul.
Pour tous P, Q , dans E , grâce à la formule de Fubini (calcul d’intégrales doubles) on a :
Z 1 Z 1
u(P ) Q =
(x + t)n P (t) dt Q(x) dx
0
=
0
Z 1 Z
0
0
1
(x + t)n Q(x) dx P (t) dt = u(Q) P .
L’application u est donc un automorphisme autoadjoint de E .
b) Pour tout y ∈ R, (x+y)n est un polynôme élément de E , appelons le Qn ; (P0 , P1 . . . , Pn )
n
P
étant une base orthonormée deE , on sait que Qn =
Qn Pk Pk .
Or Qn Pk =
Z
k=0
1
(t + y)n Pk (t) dt = λk Pk (y), d’où le résultat.
0
On peut donc écrire :
Z 1
Z 1
n
n
X
X
2n
(x + t) dt =
(x + t)n
λk Pk (x)Pk (t) dt =
λ2k Pk2 (x).
0
0
k=0
k=0
c) Par définition
Tr(u) =
n
X
k=0
u(Pk ) Pk =
Z
n
1X
λk (Pk (t))2 dt;
0 k=0
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
68
d’après b), nous savons que :
n
P
λk Pk (t)2 = (2t)n , donc Tr u = 2n /(n + 1).
k=0
De même :
Tr(u2 ) =
n
X
k=0
Z
u2 (Pk ) Pk =
0 k=0
22n+1 −1
(n+1)(2n+1) ·
2
et l’on obtient Tr(u ) =
I.4.12 1) Si Q0 existe, pour tout n ∈ N, on a 2n =
Z 1
déduirait : 2n 6
|Q0 |, ce qui n’est pas.
Z
n
1X
1
0
λ2k Pk2 (t) dt,
tn Q0 , or |
Z
1
0
tn Q 0 | 6
Z
1
|Q0 |, on en
0
0
2.a) Pour tout P ∈ E et tout t ∈ [0, 1], |P (t)| 6 kP k∞ , si kP k∞ = sup |P (t)| ; l’applicat∈[0,1]
tion : t ∈]0, 1] 7→
S’il existe Q1 =
P (t)
√
est
t
p
X
k=0
tout n ∈ N,
2
2n+1
=
continue et dominée par
kP k∞
√
t
, elle est donc intégrable.
αk tk tel que pour tout P ∈ E : f (P ) = ( Q1 | P ) , alors pour
p
P
k=0
αk
n+k+1 ·
Par conséquent, pour tout x ∈ R,
2
2x+1
=
p
P
k=0
αk
x+k+1
; les
fractions écrites dans chaque membre de l’égalité n’ont pas les mêmes pôles, elles ne peuvent
être égales, d’où la contradiction.
2.b) Si w admet un adjoint w∗ , pour tous P, Q ∈ E : w(P ) Q = P w∗ (Q) ; en
Z 1
particulier si Q = 1 , pour tout P ∈ E , on a
P = P w∗ (Q) , d’après le résultat vu en
0
a), ceci est impossible.
I.4.13 Cet exercice ne fait appel qu’à des connaissances très simples, mais il demande un peu
d’habileté dans les majorations.
Soient B := (e1 , . . . , en ) la base canonique de Rn et a l’endomorphisme de Rn tel
que A = MatB (a). Soit (v1 , v2 , . . . , vn ) une base orthonormée de vecteurs propres de a.
Pour tout i ∈ [[1, n]] :
n
X
aii = a(ei ) ei =
λh (ei |vh )2
et aii 6
h=1
n
P
On sait d’autre part que
k
X
h=1
λh (ei |vh )2 + λk
n
X
(ei |vh )2 .
h=k+1
(ei |vh )2 = k ei k2 = 1 .
h=1
On en déduit : aii 6
k
P
(λh − λk )(ei |vh )2 + λk .
h=1
En sommant ces inégalités, on obtient :
k
X
aii 6
i=1
k X
k
X
(λh − λk )(ei |vh )2 + kλk =
i=1 h=1
6
k X
k
X
(λh − λk ) + kλk =
i=1 h=1
c Dunod 2014
k
X
h=1
λh ·
k
X
(λh − λk )
h=1
k
X
i=1
(ei |vh )2 + kλk
I.4 : Espaces préhilbertiens
69
I.4.14 a) Considérons le produit scalaire sur Rn : (x, z) 7→ tXAZ , et appliquons la formule
de Cauchy-Schwarz. On sait que pour tous x, z dans Rn , (tXAZ)2 6 (tXAX)(tZAZ) ;
si Z := A−1 Y , on a donc (tXY )2 6 (tXAX)(tY A−1 Y ).
b) La matrice A étant définie positive, Ai l’est aussi, donc det Ai > 0 , de plus det Ai
Ai
ème terme de la diagonale de A−1 .
est le cofacteur d’indice (i, i) de A, et det
det A est le i
Soit (v1 , v2 , . . . , vn ) la base canonique de Rn , tVi A−1 Vi =
tout x ∈ Rn :
(tXVi )2 6 (tXAX)(tVi A−1 Vi ),
det Ai
det A
; d’après a), pour
t
Ai
2
soit (tXAX) det
det A > xi . On en déduit, si xi = 1 , l’inégalité : XAX >
Pour X :=
det A −1
Vi ,
det Ai A
on a xi = 1 et tXAX =
det A
det Ai
, d’où le résultat.
det A
det Ai ·
I.4.15 Soit B := (e1 , . . . , en ) la base canonique de Rn , soit Φ (resp.Ψ ), la forme quadratique
sur Rn telle que A = Mat(Φ; B) (resp.B = Mat(Ψ; B)).
i) Soit A ∈ Sn+ (R), si rang(A) = 1 , on sait que (voir l’exercice 12 de la
page 129) Φ est le carré d’une forme linéaire, donc pour tout (i, j) ∈ [[1, n]] × [[1, n]] on
a ai,j = αi αj , (α1 , α2 , . . . , αn ) ∈ Rn . Ainsi :
Ψ(x) =
n
n X
n
X
X
1
xi xj
=(
xi )2 .
α
α
α
i
j
i
i=1 j=1
i=1
Ce qui montre que B est dans Sn+ (R).
ii) Réciproquement, examinons d’abord le cas où n = 2 , A ∈ S2+ (R), donc a11 > 0
et a11 a22 − a212 > 0 , de même B ∈ S2+ (R) donc ( a111a22 − a12 ) > 0 .
12
Ainsi a11 a22 − a212 = 0 , A est donc de rang un ( a11 6= 0 ).
Étudions maintenant le cas général ; pour tout (i, j) ∈ [[1, n]] × [[1, n]], i 6= j , les restrictions de Ψ et de Φ au plan engendré par (ei , ej ) sont positives, on a donc aii ajj − a2ij = 0 ,
√
on en déduit aij = εij αi αj , si αi =
aii , 1 6 i 6 n, et εij = ±1 , pour
tout (i, j) ∈ [[1, n]] × [[1, n]], i 6= j .
n
P
Ainsi Φ(x) = (α1 x1 +
ε1i αi xi )2 + Ξ(x2 , . . . , xn ), avec :
i=2
Ξ(x2 , . . . , xn ) =
X
26i<j6n
(αi αj εij − εi1 εj1 αi αj )xi xj .
La matrice C associée à Ξ dans la base (e2 , . . . , en ) est une matrice de diagonale nulle ;
si C n’est pas nulle, elle possède des valeurs propres de signe distinct, et Φ n’est pas positive.
n
P
Ainsi Ξ = 0 , Φ(x) = (α1 x1 +
ε1i αi xi )2 , la matrice A est donc de rang un.
i=2
I.4.16 Soit A ∈ An (R), tA = −A, donc A2 = −tAA. Soient λ une valeur propre de A,
considérée comme matrice de Mn (C), et V un vecteur propre de A associé ; on sait
que : λ2 V = A2 (V ) = −tAA(V ), les valeurs propres de tAA étant des réels positifs, on
a donc λ2 6 0 , soit λ ∈ iR.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
70
I.4.17 (i) Pour tous x, y ∈ E , u(x) y = ( a | x )( b | y ) , on en déduit que u∗ est l’application
x 7→ ( x | b )a.
(ii) Pour tout x ∈ E , f (x) = ( a | x )b+( b | x )a, les vecteurs a, b étant indépendants, on peut
dire que Im(f ) = Vect(a, b) et que Ker(f ) = a⊥ ∩ b⊥ . Pour rechercher les valeurs propres
non nulles de f , on étudie alors la restriction-corestriction de f au plan engendré par a, b ; sa
matrice associée dans la base (a, b) est :
( a | b ) kbk2
M :=
.
kak2 ( a | b )
2
Le polynôme caractéristique de M est : λ − ( a | b ) − kbk2 kak2 . On en déduit que la droite
dirigée par kbka+ kakb est la droite propre associée à la valeur propre ( a | b )+ kbkkak , et que
la droite dirigée par kbka−kakb est la droite propre associée à la valeur propre ( a | b )−kbkkak
.
I.4.18 Nous souhaitons indiquer ici une solution ne faisant pas appel aux résultats concernant les
endomorphismes normaux d’un espace vectoriel hermitien.
Soit S une matrice non nulle de Sn (R). On suppose que ses valeurs propres sont ou nulles
ou strictement négatives d’ordre de multiplicité pair. Il existe P ∈ On (R) et des réels non
nuls a1 , a2 . . . , ak , 1 6 k 6 n, tels que S = tP DP avec :
D = Diag(0, · · · 0, −a21 , −a21 , −a22 , −a22 , . . . , −a2k , −a2k ),
alors S = A2 avec A = tP RP où

0

..

.



R=




 (O)
et pour tout i ∈ [[1, n]], Ri =
0 −ai
ai
0

(O)
0
R1
R2
..
.
Rk











.
Réciproquement, soit A une matrice antisymétrique réelle, et S := A2 = −tAA, S est symétrique, négative, elle est diagonalisable et Ker A2 = Ker tAA = Ker A, donc (voir l’exercice I.5.11 de la page 257) A considérée comme matrice de Mn (C) est diagonalisable, ses
valeurs propres non nulles peuvent être regroupées par paires imaginaires pures conjuguées ;
les valeurs propres non nulles de S sont donc de multiplicité paire.
I.4.19 Soit n > 3 . Soient (C1 , C2 , . . . , Cn ) les vecteurs colonnes de M . Soit V = (1, 1, . . . , 1)
dans Rn .
c Dunod 2014
I.4 : Espaces préhilbertiens
71
Pour tout k ∈ [[1, n]], Ck = C1 + (k − 1)V , M est donc de rang 2, M étant diagonalisable,
on sait que zéro est valeur propre de M de multiplicité (n − 2), et l’espace propre associé est
défini par les deux équations :
x1 + x2 + · · · + xn = 0 et x1 + 2x2 + · · · + kxk · · · + nxn = 0.
On recherche alors les valeurs propres non nulles de M en remarquant que les vecteurs propres
associés sont dans le plan engendré par C1 et V .
n
X
n(n − 1)
Calculons les images de C1 et de V , on a M V =
C1 + (k − 1)V = nC1 +
V
2
k=1
et M C1 =
n
X
k=1
n(n + 1)
n(n2 − 1)
k(C1 + (k − 1)V ) =
C1 +
V.
2
3
Les valeurs propres non nulles de M sont celles de la matrice :


n(n + 1)/2
n

M′ = 
2
n(n − 1)/3 n(n − 1)/2
1 2 2
dont le polynôme caractéristique est : λ2 − n2 λ − 12
n (n − 1).
q
4n2 −1
n
), sont associés les vecteurs propres :
Aux valeurs propres λ = 2 (n ±
3
r
4n2 − 1
−2C1 + (1 ±
)V.
3
I.4.20 On applique la méthode exposée dans le paragraphe Réduction simultanée de deux formes
quadratiques (remarque pratique de la page 185).
On vérifie facilement que Ψ(x) = (x1 − x2 )2 + (x2 − x3 )2 + (x3 − x4 )2 + x24 , ce qui permet
de voir que Ψ est une forme quadratique définie positive. On recherche ensuite les scalaires λ
et les vecteurs non nuls V ∈ R4 tels que : B(V ) = λA(V ), si




1 −1
0
0
1 −1
0
0
 −1

3 −2
0 
2 −1
0 
 et A :=  −1
.
B := 
 0 −2


1
1
0 −1
2 −1 
0
0
1 −1
0
0 −1
2
Pour tout λ ∈ R, on a : det(B − λA) = λ(2 − λ)(1 − λ)(1 + λ), et :
 
 
 
1
1
1
0
1
1

 
 
(B − A) 
0 = 0; (B − 2A) 0 = 0; (B + A) 1 = 0;
0
0
0
On détermine ainsi la base B de R4 formée des vecteurs :
 
 
 
1
1
1
0 
1
1

 
 
V1 = 
0 , V2 = 0 , V3 = 1 ,
0
0
0
 
1
1

B
1 = 0.
1
 
1
1

V4 = 
1 .
1
Ces quatre vecteurs sont d’autre part Ψ orthonormés, la matrice associée à Φ dans cette base
est Diag(1, 2, −1, 0).
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
72
I.4.21 Nous utilisons ici la réduction simultanée de deux matrices symétriques réelles positives
(voir page 185).
a) Nous supposerons λi > 0, ∀i ∈ [[1, n]], sinon l’inégalité est évidente . Soit f l’applicaexp t
tion t 7→ ln(1 + exp t), f est de classe C ∞ sur R, et ∀t ∈ R, f ′′ (t) = (1+exp
t)2 > 0 , f est
n
n
P
P
convexe. Donc, ∀n ∈ N ∗ , ∀(t1 , . . . , tn ) ∈ Rn , f ( n1
ti ) 6 n1
f (ti ). Si l’on définit, pour
i=1
i=1
tout i ∈ [[1, n]], ti := ln λi , on obtient l’inégalité :
n
n
Y
n1 1X
ln(1 + λi ).
ln 1 +
λi
6
n i=1
i=1
b) Si A et B ne sont pas inversibles, l’inégalité est évidente. Supposons A inversible, nous
savons qu’il existe un couple (D, P ) formé d’une matrice diagonale D et d’une matrice
inversible P tel que A = tP P, B = tP DP , les éléments diagonaux de D étant positifs
puisque B est positive. On peut écrire : (A + B) = A(I + A−1 B) = AP −1 (I + D)P
et det(A + B) = det(A) det(I + D), det(B) = det(A) det(D). Pour démontrer l’inégalité
demandée, il suffit donc de vérifier que :
1
1
1 + (det D) n 6 det(I + D) n .
Si D = Diag(λ1 , . . . , λn ), cette inégalité s’écrit :
1+
n
Y
i=1
λi
n1
6
n n1
Y
1 + λi .
i=1
Elle a été prouvée ci-dessus.
I.4.22 La matrice A est antisymétrique et son polynôme caractéristique est :λ(λ2 + 9). La recherche des vecteurs propres de A conduit au résultat suivant :



  2
 2
4+3i
4−3i
1
−2
√
√
0 −2 −1
0 0
0
3
3
3
3
3 10
3 10
5 

 4+3i 2−6i
2−6i
2+6i
 2
√
√   0 3i
0
2  =  13
0   3√10 3√10 3√10  .
3 10
3 10 
4−3i
2+6i
−2
√
√
√5
√5
√5
1 −2
0
0 0 −3i
3
3 10
3 10
3 10
3 10
3 10
I.4.23 a) Si ϕ existe, les identités de polarisation montrent qu’elle est égale à l’application :
(x, y) ∈ E × E 7→
1
(kx + yk2 − kx − yk2 ).
4
Soit f l’application : (x, y) ∈ E × E 7→ kx + yk2 − kx − yk2 .
On vérifie :
(i) Pour tous x, y dans E , f (x, 2y) = 2f (x, y).
En effet :
kx + 2yk2 = kx + y + yk2 = 2kx + yk2 + 2kyk2 − kxk2
kx − 2yk2 = kx − y − yk2 = 2kx − yk2 + 2kyk2 − kxk2 .
Ainsi f (x, 2y) = kx + 2yk2 − kx − 2yk2 = 2(kx + yk2 − kx − yk2 ) = 2f (x, y).
c Dunod 2014
I.4 : Espaces préhilbertiens
73
(ii) Montrons maintenant, pour tous x1 , x2 , y dans E , la relation :
f (x1 + x2 , y) = f (x1 , y) + f (x2 , y).
On a :
f (x1 , y) + f (x2 , y) = kx1 + yk2 − kx1 − yk2 + kx2 + yk2 − kx2 − yk2
= kx1 + yk2 + kx2 + yk2 − kx1 − yk2 + kx2 − yk2 .
Soit :
1
kx1 + x2 + 2yk2 − kx1 + x2 − 2yk2
2
1
= f (x1 + x2 , 2y) = f (x1 + x2 , y).
2
f (x1 , y) + f (x2 , y) =
b) On vérifie aisément, par récurrence sur n ∈ N, que :
∀n ∈ N , f (n + 1)x, y = (n + 1)f (x, y).
On note que f (x, y) = −f (−x, y), donc ∀n ∈ Z, f (n + 1)x, y = (n + 1)f (x, y).
Enfin, pour tous p, q dans Z avec q 6= 0 , on peut écrire :
p
pf (x, y) = f (px, y) = qf ( x, y),
q
p
p
soit f ( x, y) = f (x, y),
q
q
c’est à dire f (rx, y) = rf (x, y) pour tout r ∈ Q .
L’application : α ∈ R 7→ f (αx, y) est continue et Q est dense dans R,
donc f (αx, y) = αf (x, y) pour tout (α, x, y) ∈ R × E × E . On peut affirmer que f , donc ϕ
est une forme bilinéaire sur E , de plus ϕ(x, x) = kxk2 , la norme considérée est donc euclidienne.
c) Considérons, comme ci-dessus, l’application f et définissons l’application g telle que pour
tous x, y dans E , 4g(x, y) = f (x, y) − if (x, iy). On vérifie que pour tous x, y dans E , on a
les égalités suivantes :
(i) g(x, x) = kxk2
(ii) g(x, y) = g(y, x)
(iii) g(ix, y) = −ig(x, y).
En utilisant les résultats de a) on obtient aussi que pour tous x1 , x2 , y
dans E , g(x1 + x2 , y) = g(x1 , y) + g(x2 , y) et pour tous α, (x, y) dans R
et E × E , g(αx, y) = αg(x, y).
Soient maintenant λ ∈ C et (x, y) dans E × E , on a λ = α + iβ , (α, β) ∈ R × R,
et g(λx, y) = αg(x, y) + βg(ix, y) = (α − iβ)g(x, y), l’application g est donc une forme
sesquilinéaire hermitienne, et la norme proposée est une norme hermitienne.
I.4.24 a) Soient k ∈ [[1, n]] et Ek := Vect(εk , . . . , εn ), pour tout V ∈ Vk :
dim(V ∩ Ek ) + dim(V + Ek ) = dim V + dim Ek = n + 1,
on a donc dim(V ∩ Ek ) 6= 0 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
74
Soit y ∈ V ∩ Ek , y 6= 0 , Y ∗ AY > λk Y ∗ Y , donc sup
X∈V
X6=0
si V := Vect(ε1 . . . , εk ), on a sup
X∈V
X6=0
X ∗ AX
> λk . De plus,
X ∗X
X ∗ AX
= λk , on peut donc affirmer que :
X ∗X
inf
V ∈Vk
sup
X∈V
X6=0
X ∗ AX
X ∗X
= λk .
b) Soient p ∈ [[1, n]] et Ep′ := Vect(ε1 , . . . , εp ), on sait que :
dim(F ∩ Ep′ ) + dim(F + Ep′ ) = dim F + dim Ep′ > n + 1,
on a donc dim(F ∩ Ep′ ) 6= 0 .
Soit y ′ ∈ F ∩ Ep′ , y ′ 6= 0 , Y ′∗ AY ′ 6 λp Y ′∗ Y ′ , donc inf
X∈F
X6=0
si F := Ep′ , on a inf
X∈F
X6=0
X ∗ AX
6 λp . De plus,
X ∗X
X ∗ AX
> λp , on peut donc affirmer que :
X ∗X
sup
F ∈Fp
X ∗ AX
inf
X∈F X ∗ X
X6=0
= λp .
c) Tout sous espace vectoriel V ′ de G de dimension p est un sous espace vectoriel de E de
dimension p ; en utilisant le résultat vu en a), on sait que λp est inférieur ou égal à µp .
Soit F ′ un sous espace de G de codimension strictement inférieure à p, on
a : dim F ′ > n − (p + r), F ′ est donc un sous espace de E de codimension strictement
inférieure à p + r , d’après b) on a λp+r > µp .
Soient q ∈ [[1, n]] et G := Eq′ , pour tout k ∈ [[1, q]], λk 6 µk , donc
λ1 + · · · + λq 6 µ1 + · · · + µq = a11 + · · · + aqq .
I.4.25 a) Les valeurs propres de A étant imaginaires, la matrice A + I est inversible,
donc B = 2(I + A)−1 − I , on peut écrire : I = (I + A)−1 (I + A), on en déduit B = (I + A)−1 (I − A), et tBB = (I + A)(I − A)−1 (I + A)−1 (I − A) = I , car
toutes les matrices écrites dans ce produit commutent. De plus I + B est inversible, −1 n’est
donc pas valeur propre de B .
b) Nécessairement :
A = (I + B)−1 (I − B),
t
A = (I − B −1 )(I + B −1 )−1 = (I − B −1 )BB −1 (I + B −1 )−1 .
−1
On a donc tA = (B − I) (I + B −1 )B
= (B − I)(I + B)−1 = −A.
et
I.4.26 a) Les valeurs propres de la matrice hermitienne A sont réelles, pour tout λ ∈ C \ R, la
matrice A − λ I est donc inversible. De plus il existe un couple (D, U ) ∈ Dn (R) × Un (C) tel
que A = U DU −1 , ainsi B(λ) = U (D + λ I)(D − λ I)−1 U −1 , et B(λ) est unitaire si, et
seulement si, (D + λ I)(D − λ I)−1 l’est.
c Dunod 2014
I.4 : Espaces préhilbertiens
75
dn +λ
Si D = Diag(d1 , . . . , dh , . . . , dn ), (D + λ I)(D − λ I)−1 = Diag( dd11 +λ
−λ , . . . , dn −λ ).
+λ
| = 1 si, et seulement si, αdh = 0 ; A n’étant pas
Supposons λ = α+iβ avec α, β ∈ R, | ddhh −λ
nulle, il existe h ∈ [[1, n]] tel que dh 6= 0 . Donc B(λ) est unitaire si, et seulement si, α = 0 ,
c’est à dire λ ∈ Ri .
+λ
Pour tout h ∈ [[1, n]], ddhh −λ
6= 1 car λ 6= 0 .
b) La matrice B étant unitaire, il existe un couple (D′ , U ′ ) ∈ Dn (C) × Un (C) tel
que B = U ′ D′ U ′−1 , avec D′ = Diag(eiθ1 , . . . , eiθh , . . . , eiθn ), (θ1 , . . . , θh , . . . , θn ) ∈ Rn \{0} .
Si A existe, nécessairement (A − λI)B = A + λI , soit :
A = λ(I + B)(B − I)−1 = λU ′ (D′ + I)(D′ − I)−1 U ′−1 .
On a (D′ + I)(D′ − I)−1 = −i Diag(cot θ21 , . . . , cot θ2h , . . . , cot θ2n ), et λ = iα
avec α ∈ R \ 0 , on a donc A = αU ′ Diag(cot θ21 , . . . , cot θ2h , . . . , cot θ2n )U ′−1 , ce qui montre
que A est hermitienne.
I.4.27 Supposons qu’il existe P ∈ C[X] tel que u∗ = P (u), on a bien uP (u) = P (u)u ,
donc u est normal. Réciproquement, si u est normal, il est diagonalisable, de valeurs
k
P
propres λ1 , . . . , λk . On peut alors écrire la décomposition spectrale de u : u =
λh ph ,
h=1
M
ph désignant le projecteur sur Eλh (u) parallèlement à
Eλi (u) ; on sait de plus que
16 i6k
i6=h
pour tout h ∈ [[1, k]], ph est un polynôme en u , d’où le résultat.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
76
Module I.5 : Réduction des matrices
I.5.1 Remarquons que AB ∈ Mp (K), alors que BA ∈ Mq (K). En notant systématiquement Mi,j les coefficients d’une matrice M , la définition de la trace donne :




p
p
q
p
q
X
X
X
X
X


Tr(AB) =
(AB)i,i =
Ai,j Bj,i  =
Bj,i Ai,j 
i=1
=
q
X
j=1
i=1
p
X
i=1
Bj,i Ai,j
!
j=1
=
q
X
i=1
j=1
(BA)j,j = Tr(BA).
j=1
I.5.2 1. Montrons par récurrence sur n que toute matrice carrée d’ordre n à coefficients dans K
et de trace nulle est semblable à une matrice à diagonale nulle. Le cas n = 1 est évident :
seule la matrice nulle est de trace nulle. Considérons un entier n > 2 tel que la propriété
soit vraie au rang n − 1 . Soit M ∈ Mn (K) une matrice de trace nulle. Notons u l’endomorphisme de K n canoniquement associé à M : M est la matrice de u dans la base canonique B de K n . Si M est une matrice scalaire, i.e. si M := λIn pour un certain λ ∈ K ,
on a 0 = Tr(λIn ) = λ Tr(In ) = nλ. Comme le corps K est de caractéristique 0 , λ = 0 ,
donc M = 0 , et la conclusion est claire. Supposons que M ne soit pas une matrice scalaire.
Autrement dit, u n’est pas une homothétie.
Rappelons une caractérisation classique des homothéties (vectorielles) : un endomorphisme
d’un espace vectoriel est une homothétie si, et seulement si, l’image d’un vecteur quelconque est colinéaire à ce vceteur (cf. le module II.3 de [L1]). Puisque u n’est pas une
homothétie, il existe un vecteur x ∈ K n tel que la famille x, u(x) soit libre. D’après
le théorème de la base incomplète, il existe une base C := (e1 , . . . , en ) de K n telle
que e1 = x et e2 = f (x). Soit M ′ la matrice de u relativement à C . On sait que M ′
est semblable à M , en particulier Tr(M ′ ) = 0 . En outre, la première colonne de M ′
est, par construction, le vecteur colonne t (0, 1, 0, . . . , 0). On peut donc écrire M ′ par
0 tV
blocs : M ′ =
, où V, W ∈ K n−1 sont des vecteurs colonnes et N ∈ Mn−1 (K).
W N
Il est clair que Tr(N ) = Tr(M ′ ) = 0 . D’après l’hypothèse de récurrence, il existe donc
une matrice Q ∈ GLn−1 (K) telle que la diagonale de QN Q−1 soit nulle. La matrice par
1 0
1
0
blocs P :=
∈ Mn (K) est inversible, son inverse étant
. La multi0 Q
0 Q−1
plication des matrices par blocs donne alors :
1 0
0 tV
1
0
′ −1
PM P =
0 Q
W N
0 Q−1
t
t
0
V
1
0
0
V Q−1
=
=
.
QW QN
0 Q−1
QW QN Q−1
La matrice M est semblable à M ′ , donc à P M ′ P −1 . De plus, la diagonale de P M ′ P −1 est
nulle, puisque la diagonale de QN Q−1 l’est. Notre assertion est donc vraie au rang n.
2. Notons L l’endomorphisme A 7→ DA − AD de Mn (K). Le noyau de L contient le
sous-espace ∆ formé des matrices diagonales, car deux matrices diagonales quelconques commutent. Il est clair que dim ∆ = n : (t1 , . . . , tn ) 7→ Diag(t1 , . . . , tn ) est un isomorphisme
de K n sur ∆.
c Dunod 2014
I.5 : Réduction des matrices
77
Montrons que Ker L = ∆. Soit A := (ai,j ) ∈ Ker L , de sorte que DA = AD . La ma-
trice DA se déduit de A en multipliant la i ème ligne de A par i , ceci pour tout i (revoir à
ce sujet les opérations élémentaires sur les matrices, dans le module II.4 de [L1]). De même, la
matrice AD se déduit de A en multipliant la j ème colonne de A par j , ceci pour tout j . Pour
tous indices i, j ∈ [[1, n]], on a donc iai,j = jai,j . On en déduit que ai,j = 0 dès que i 6= j ,
ce qui montre que A est diagonale.
Soit S le sous-espace vectoriel de Mn (K) formé des matrices dont la diagonale est nulle.
C’est le noyau de l’application linéaire (ai,j ) 7→ (a1,1 , . . . , an,n ) de Mn (K) dans K n . Cette
application est évidemment surjective, donc dim S = n2 − n, en vertu du théorème du rang.
Soit A := (ai,j ) ∈ Mn (K). Comme nous l’avons vu précédemment, le terme général de la
matrice L(A) = DA − AD est (i − j)ai,j . La diagonale de L(A) est donc nulle, ce qui
prouve l’inclusion Im L ⊂ S . En fait, il y a égalité, pour une raison de dimensions. En effet, le
théorème du rang donne :
dim(Im L) = dim Mn (K) − dim Ker L = dim Mn (K) − dim ∆ = n2 − n = dim S.
Conclusion : Ker L = ∆ et Im L = S .
3. Soit M ∈ Mn (K) une matrice de trace nulle. D’après la question 1, M est semblable à
une matrice M ′ ∈ S . Il existe une matrice P ∈ GLn (K) telle que M = P M ′ P −1 . Par
ailleurs, puisque S est l’image de L , il existe une matrice C ∈ Mn (K) telle que M ′ = L(C),
soit M ′ = DC − CD . Rappelons que l’application N 7→ P N P −1 est un automorphisme de
la K -algèbre Mn (K), en particulier elle respecte la multiplication, l’addition et la soustraction. Alors :
M = P M ′ P −1 = P (DC − CD)P −1 = P (DC)P −1 − P (CD)P −1 = AB − BA,
en posant A := P DP −1 et B := P CP −1 . D’où la conclusion.
I.5.3 Le programme ci-dessous se déduit immédiatement de la proposition 33 de la page 241. Pour
simplifier, il fait appel à deux procédures. La procédure identité(n) rend la matrice In , et
la procédure trace(A) rend la trace d’une matrice carrée A.
Faddeev(M)
n := taille(M); (* nombre de lignes et de colonnes de M *)
I := identité(n); A:=M;
t := trace(M); P := X^n-t*X^(n-1);
pour k de 2 à n faire
A := A*M-t*M;
t := trace(A)/k;
P := P-t*X^(n-k);
rendre(P)
Ce programme nécessite n − 1 multiplications de matrices de taille n, plus des opérations de
moindre coût.
I.5.4 Observons d’abord que le cas p = q = 1 est évident. De quoi s’agit-il alors ? Étant donnée
a b
une matrice M :=
∈ M2 (K) telle que a 6= 0 , on veut montrer que M est de
c d
rang 1 si, et seulement si, d = ca−1 b , ce qui équivaut ( K est commutatif !) à ad − bc = 0 ,
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
78
c’est-à-dire à det M = 0 . Cela résulte des propriétés élémentaires du rang d’une matrice (revoir
à ce sujet le module II.7 de [L1]).
Notons ai,j , 1 6 i, j 6 p, les coefficients de A et de même pour les matrices B, C, D .
La matrice A est une matrice carrée inversible extraite de M . On sait alors que M est de
rang p si, et seulement si, A ne possède aucune matrice bordante inversible (cf. le module II.7
de [L1]). Il y a q 2 matrices bordantes de A, obtenues comme suit. On choisit arbitrairement
deux indices j, k ∈ [[1, q]], la matrice bordante correspondante étant :


a1,1 . . . a1,p b1,k
 ..
..
.. 

.
. 
Wj,k :=  .
.
 ap,1 . . . ap,p bp,k 
cj,1 . . . cj,p dj,k
Les colonnes de A étant linéairement indépendantes, les p premières colonnes de Wj,k
sont linéairement indépendantes. Ainsi Wj,k est non inversible si, et seulement
s’il existe (t1 , . . . , tp ) ∈ K p tel que les égalités suivantes soient vérifiées :


a1,1 x1 + a1,2 x2 + · · · + a1,p xp = b1,k





a2,1 x1 + a2,2 x2 + · · · + a2,p xp = b2,k
...................................



a

p,1 x1 + ap,2 x2 + · · · + ap,p xp = bp,k


c x + c x + · · · + c x = d .
j,1 1
j,2 2
j,p p
j,k
En notant X le vecteur colonne t (x1 , . . . , xp ) et Bk la k ème colonne de B , les p premières
égalités ci-dessus signifient que AX = Bk , soit X = A−1 Bk . En notant Cj la j ème ligne
de C , la dernière égalité ci-dessus signifie que dj,k = Cj X , soit dj,k = Cj A−1 Bk . Par
définition de la multiplication matricielle (ligne par colonne), A−1 Bk est la k ème colonne
de A−1 B et donc Cj (A−1 Bk ) est le coefficient d’indices (j, k) de la matrice CA−1 B .
2
Conclusion : M est de rang p si, et seulement si, pour tout couple (j, k) ∈ [[1, q]] , les matrices D et CA−1 B ont le même coefficient d’indices (j, k), ce qui équivaut évidemment à
l’égalité matricielle D = CA−1 B .
I.5.5 Notons P (resp. Q ) le polynôme minimal de la matrice A considérée comme élément
de Mn (K) resp. de Mn (L) . Puisque P appartient a fortiori à L[X] et annule A,
c’est un multiple de Q , par définition du polynôme minimal Q de A (sur L ). En particulier, deg P > deg Q . Puisque P et Q sont unitaires, il suffit, pour établir l’égalité P = Q , de
prouver l’inégalité deg P 6 deg Q .
Notons d le degré de Q , et écrivons Q := X d + td−1 X d−1 + · · · + t1 X + t0 , les tj étant
des éléments de L (c’est important pour la suite). Puisque Q est le polynôme minimal de A
(sur L ), on a :
Ad + td−1 Ad−1 + · · · + t1 A + t0 In = Q(A) = 0.
Pour tout entier k ∈ N, notons ai,j;k les coefficients de la matrice Ak , 1 6 i, j 6 n. L’égalité
matricielle ci-dessus est équivalente aux n2 égalités suivantes :
td−1 ai,j;d−1 + · · · + t1 ai,j;1 + t0 ai,j;0 = −ai,j;d (i, = 1, . . . , n ; j = 1, . . . , n).
c Dunod 2014
(∗)
I.5 : Réduction des matrices
79
On peut considérer ces égalités comme un système linéaire (S) de n2 équations à d inconnues.
Ce qui est essentiel, c’est que les coefficients de ce système appartiennent à K (parce que la
matrice A est à coefficients dans K et ses puissances aussi), et de même le second membre
est à coefficients dans K . Les égalités (∗) signifient que le système (S) possède une solution
sur L , à savoir (td−1 , . . . , t0 ). D’après l’exercice évoqué dans l’énoncé, le système (S) possède
alors au moins une solution (ud−1 , . . . , u0 ) ∈ K d .
Considérons le polynôme R := X d + ud−1 X d−1 + · · · + u1 X + u0 ∈ K[X]. Le fait
que (ud−1 , . . . , u0 ) soit solution du système (S) signifie que R(A) = 0 (se rappeler d’où
vient ce système). Par définition de P comme polynôme minimal de A sur K , R est donc un
multiple de P , et par suite deg P 6 deg R = d = deg Q , comme désiré.
I.5.6 Nous allons montrer que A est diagonalisable. À partir de là, les idées seront exactement
les mêmes que dans l’exercice 8 de la page 236. En fait, A est une matrice réelle symétrique,
elle est donc déjà diagonalisable sur R (cf. la section 1.7 du module I.4). On peut encore
remarquer que les deux dernières colonnes de A sont opposées, donc 0 est valeur propre de A.
Plus précisément, en notant B := (e1 , e2 , e3 ) la base canonique de C3 et u l’endomorphisme
de C3 canoniquement associé à A, ε1 := e2 + e3 est un vecteur propre de f associé à la valeur
propre 0 .
Le calcul donne : χA = X 3 − 17X 2 + 16X = X(X − 1)(X − 16). Ainsi A a trois valeurs
propres, à savoir 0, 1 et 16 . Puisque A possède trois valeurs propres distinctes, nous retrouvons
le fait qu’elle soit diagonalisable, déjà sur Q car ses valeurs propres sont rationnelles. On vérifie
que ε2 := e1 + e2 − e3 et ε3 := 2e1 − e2 + e3 sont des vecteurs propres de f , associés aux
valeurs propres 1 et 16 respectivement. Soit C := (ε1 , ε2 , ε3 ). C’est une base de C3 (on
vérifie en fait que c’est une base orthogonale de l’espace euclidien R3 usuel, comme il se doit).


0
1
2
1 −1  . Nous savons
Soit P la matrice de passage de B à C , c’est-à-dire P :=  1
1 −1
1
−1
déjà que P AP = D , où D := Diag(0, 1, 16).
L’équation N 2 = D a exactement quatre solutions dans M3 (C), à savoir ± Diag(0, 1, 4)
et ± Diag(0, 1, −4). Pour le voir, on peut raisonner comme dans l’exercice 8 de la page 236. On
peut aussi dire que, si N est l’une des solutions de cette équation, alors N commute avec D ,
donc N est diagonale parce que les termes diagonaux de D sont distincts (cf. les calculs de
l’exercice I.5.2 de la page 256). Comme dans l’exercice 8 de la page 236, N 7→ P N P −1
est une bijection de l’ensemble des solutions N de l’équation N 2 = D sur l’ensemble des
solutions M de l’équation M 2 = A. On calcule alors P −1 (par exemple en exprimant les ej
en fonction des εi :


0
3
3
1
2 −2  .
P −1 =  2
6
2 −1
1
On en déduit que l’équation M 2 = A possède exactement quatre solutions, à savoir :


3 −1
1
1 −1  et
±P Diag(0, 1, 4)P −1 = ±  −1
1 −1
1
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
80
±P Diag(0, 1, −4)P −1

−7
1
= ±  5
3
−5

5 −5
−1
1 .
1 −1
Parmi ces solutions, une seule est une matrice symétrique réelle positive (c’est la « racine car

3 −1
1
rée » de A, cf. la section 1.7 du module I.4), à savoir  −1
1 −1  .
1 −1
1
I.5.7 Si λ ∈ sp u et si Vλ est un sous-espace vectoriel quelconque de Eλ (u), Vλ est stable par u ,
car la restriction de u à Eλ (u) est l’homothétie vectorielle de rapport λ. Comme toute somme
P
de sous-espaces stables par u est stable par u , on en déduit que toute somme
Vλ où,
λ∈sp(u)
pour tout λ ∈ sp(u), Vλ est un sous-espace vectoriel arbitraire de Eλ (u), est un sous-espace
vectoriel de E stable par u .
La réciproque est plus subtile. Soit donc V un sous-espace vectoriel de E stable par u . Pour
toute valeur propre λ de u , posons Vλ := V ∩ Eλ (u). La somme des Vλ est directe parce
P
que la somme des Eλ (u) l’est . Par ailleurs, le sous-espace V ′ :=
Vλ est évidemment
λ∈sp(u)
inclus dans V . Il s’agit d’établir que V ′ = V . Voici un moyen d’y parvenir.
Soit v := uV l’endomorphisme de V induit par u . Considérons d’autre part le polyQ
(X − λ). En fait, P est le polynôme minimal de u (en vertu, par
nôme P :=
λ∈sp(u)
exemple, de la proposition 18 de la page 227). En particulier, P annule u , donc P annule
aussi v , par restriction. D’après le lemme des noyaux, V = Ker P (v) est la somme directe,
lorsque λ décrit sp u , des sous-espaces Ker(v − λ IdV ). La conclusion est alors claire : pour
toute λ ∈ sp u , Ker(v − λ IdV ) est l’intersection de V avec Ker(u − λ IdE ) = Eλ (u),
P
c’est-à-dire Ker(v − λ IdV ) = Vλ . D’où V =
Vλ = V ′ .
λ∈sp(u)
I.5.8 Pour tout polynôme P ∈ K[X], nous savons que P (A) = Diag P (A1 ), . . . , P (Am ) .
En particulier, P annule A si, et seulement s’il annule chacune des matrices Ai . Notons Q
le polynôme minimal de A et Qi le polynôme minimal de Ai . L’argument ci-dessus montre
que Q est le ppcm des Qi (cf. la proposition 19 de la page 227).
Si A est diagonalisable, Q est scindé à racines simples. Pour tout i , Qi a la même propriété
puisqu’il divise Q , et il en résulte que Ai est diagonalisable (corollaire 27 de la page 235).
Supposons inversement que chaque Ai soit diagonalisable. Pour tout i , Qi est donc scindé à
racines simples. C’est alors un exercice simple d’arithmétique des polynômes de montrer que
le ppcm d’une famille finie de polynômes scindés à racines simples est un polynôme scindé
à racines simples : il suffit de se rappeler comment l’on calcule ce ppcm à partir des facteurs
irréductibles des polynômes considérés. En conclusion, Q est donc scindé à racines simples, et
par suite A est diagonalisable, toujours d’après le corollaire 27 de la page 235.
Autre solution, plus directe, pour le dernier point. Supposons que, pour tout i , Ti soit une
matrice inversible (de même taille que Ai ) telle que Di := Ti Ai Ti−1 soit diagonale. La matrice
par blocs T := Diag(T1 , . . . , Tm ) est alors inversible, et T AT −1 = Diag(D1 , . . . , Dm ) est
diagonale.
c Dunod 2014
I.5 : Réduction des matrices
81
I.5.9 La multiplication Mn (K) × Mn (K) → Mn (K) est une application K -bilinéaire donc,
la matrice A étant fixée, l’application M 7→ AM de Mn (K) dans Mn (K) est linéaire,
autrement dit u est un endomorphisme de l’espace vectoriel Mn (K).
L’idée essentielle est la suivante : soit P := am X m +· · ·+a1 X +a0 un polynôme à coefficients
dans K . Alors, pour toute matrice M ∈ Mn (K), on a :
P (u)(M ) = P (A)M.
(∗)
Dans le premier membre, on applique à M ∈ Mn (K) l’endomorphisme P (u) de Mn (K)
alors que, dans le second membre, on multiplie simplement les matrices P (A) et M . Pour
démontrer l’égalité (∗), les deux membres dépendant linéairement de P , il suffit d’examiner
le cas où P := X k , k ∈ N (ces monômes forment une base de K[X] sur K ). Dans ce cas, on
raisonne par récurrence sur k . La conclusion est évidente si k := 0 ou k := 1 . Si la conclusion
est vraie pour un certain k , on a, pour toute matrice M ∈ Mn (K) :
uk+1 (M ) = (uk ◦ u)(M ) = uk u(M ) = uk (AM ) = Ak (AM ) = Ak+1 M,
d’où la conclusion au rang k + 1 . L’égalité (∗) est donc vraie pour tout polynôme P .
On en déduit d’abord qu’un polynôme P annule u si, et seulement s’il annule A. La suffisance est évidente : si P (A) = 0 , l’égalité (∗) montre que P (u)(M ) = 0 pour toute
matrice M , donc P (u) = 0 . Supposons inversement que P (u) = 0 . Alors, en particulier, 0 = P (u)(In ) = P (A)In = P (A), donc P (A) = 0 . Il en résulte que le polynôme
minimal µu de u est égal au polynôme minimal µA de A. Ensuite, A est nilpotente si, et
seulement s’il existe un entier k > 0 tel que X k annule A, i.e. tel que X k annule u . Il en
résulte que A est nilpotente si, et seulement si, u est nilpotent.
D’après le théorème 25 de la page 235, u est diagonalisable si, et seulement si, µu est scindé
et à racines simples, i.e. si, et seulement si, µA est scindé et à racines simples. En vertu du
corollaire 27 de la page 235, cela revient à dire que A est diagonalisable.
I.5.10 Supposons que u soit diagonalisable, et soit V un sous-espace vectoriel de E stable par u .
P
D’après l’exercice I.5.7 de la page 257, V s’écrit V =
Vλ où, pour tout λ ∈ sp(u), Vλ
λ∈sp(u)
est un sous-espace vectoriel de Eλ (u). Choisissons pour chaque λ ∈ sp u un supplémentaire
P
quelconque Wλ de Vλ dans Eλ (u), puis posons W :=
Wλ . Il est clair que W est un
λ∈sp(u)
supplémentaire de V dans E ( E = V ⊕ W ), et l’exercice cité montre que W est stable par u .
La réciproque est moins triviale. Supposons donc que chaque sous-espace vectoriel de E stable
par u possède un supplémentaire (dans E ) lui aussi stable par u . Soit V la somme (nécessairement directe) des sous-espaces propres Eλ (u), λ décrivant sp u . Il s’agit de montrer
que V = E (théorème 24 de la page 232). Raisonnons par l’absurde, en supposant V 6= E .
Puisque V est stable par u (car chaque sous-espace propre l’est), il possède par hypothèse
un supplémentaire W lui aussi stable par u , et W 6= {0} . Soit w = uW l’endomorphisme
de W induit par u . Alors w est un endomorphisme de W , espace vectoriel de dimension finie au moins égale à 1 sur C. Puisque C est algébriquement clos, w possède au moins une
valeur propre λ. Soit x ∈ W un vecteur propre de w associé à λ. On a u(x) = w(x) = λx,
donc λ ∈ sp u et x ∈ Eλ (u). Mais Eλ (u) ⊂ V , donc x ∈ V ∩ W = {0} . Cela contredit le
fait que x soit un vecteur propre de w (un vecteur propre est toujours non nul, par définition).
En conclusion, V = E , donc u est diagonalisable.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
82
Dans R2 , soit r la rotation d’angle π/2 . Les seuls sous-espaces vectoriels de R2 stables par r
sont R2 et {0} , car, si D est une droite vectorielle, D n’est pas propre pour u , i.e. n’est pas
stable par u . Ainsi tout sous-espace vectoriel de R2 stable par r possède un supplémentaire
stable par r . Cependant, r n’est pas diagonalisable : son polynôme caractéristique X 2 + 1
n’est pas scindé sur R. L’exercice devient donc faux si l’on remplace C par R.
I.5.11 Posons S := sp(up ) et, pour tout λ ∈ S , Eλ := Eλ (up ). Puisque up est diagonalisable, E
est somme directe des Eλ , λ décrivant S . Par ailleurs (c’est la première idée importante), u
commute avec up , donc laisse stable chaque Eλ . Pour chaque λ ∈ S , notons uλ l’endomorphisme de Eλ induit par u . Puisque E est somme directe des Eλ , u est diagonalisable si, et
seulement si, chaque uλ l’est : la suffisance est évidente, et la nécessité résulte du corollaire 26
de la page 235.
Soit λ ∈ S , supposons d’abord λ 6= 0 . Puisque upλ est l’homothétie vectorielle de Eλ de
rapport λ, uλ est annulé par le polynôme X p − λ ∈ C[X]. Ce polynôme est scindé (comme
tout polynôme sur C) et à racines simples : ses racines sont les p racines p èmes de λ. Ainsi,
dans ce cas, uλ est diagonalisable. Il en résulte déjà que u est diagonalisable si, et seulement
si, ou bien 0 ∈
/ S ou bien 0 ∈ S et u0 est diagonalisable.
Notons que 0 appartient à S si, et seulement si, up n’est pas injectif, ce qui revient à dire que u
n’est pas injectif. Si u est injectif, Ker u = Ker up = {0} , et nous avons vu que u est diagonalisable. Supposons désormais que 0 ∈ S . D’abord Ker up est l’espace propre de up relatif à la
valeur propre 0 , i.e. Ker up = E0 . Ensuite, Ker u est évidemment inclus dans Ker up = E0 .
De plus, Ker u = Ker up si, et seulement si, u0 = 0 . D’un autre côté, u0 est nilpotent,
puisque up0 = 0 : la restriction de up à E0 = Ker up est nulle. Il en résulte que u0 est diagonalisable si, et seulement s’il est nul. Autrement dit, u est diagonalisable si, et seulement
si, Ker u = Ker up .
I.5.12 Identifions M avec l’endomorphisme de C2n qui lui est canoniquement associé, et de
même pour A. Puisque M est donnée par blocs, il est logique de rechercher les vecteurs
X
propres Z de M sous la forme Z :=
, où X, Y ∈ Cn sont des vecteurs colonnes.
Y
0 A
X
AY
Si Z est de cette forme, M Z =
=
. D’où, pour tout λ ∈ C,
In 0
Y
X
les équivalences :
(M Z = λZ) ⇐⇒ (AY = λX) et (X = λY ) ⇐⇒ (AY = λ2 Y ) et (X = λY ) .
Soit λ ∈ C. Les équivalences ci-dessus montrent que λ est valeur propre de M si, et seulement
λY
2
si, λ est valeur propre de A. Si c’est le cas, on voit de plus que Y 7→
est un
Y
isomorphisme de Ker(A − λ2 In ) sur Ker(M − λI2n ), en particulier :
dim Ker(M − λI2n ) = dim Ker(A − λ2 In ).
(∗)
Cette égalité est en fait vraie pour tout λ ∈ C. Par ailleurs, la somme des espaces propres de M
étant directe, on a toujours :
X
α :=
dim Ker(M − λI2n ) 6 2n,
λ ∈ sp M
c Dunod 2014
I.5 : Réduction des matrices
83
avec égalité si, et seulement si, M est diagonalisable (en vertu du théorème 24 de la page 232).
De même :
X
dim Ker(A − µIn ) 6 n,
β :=
µ ∈ sp A
avec égalité si, et seulement si, A est diagonalisable.
Soient µ1 , . . . , µr les valeurs propres non nulles de A. Pour tout j , notons λj une racine
carrée de µj et posons mj = dim Ker(A − µj In ). Les égalités (∗) montrent que les valeurs
propres non nulles de M sont exactement les ±λj , j = 1, . . . , r . Les égalités (∗) impliquent
aussi les suivantes :
α = dim Ker(A) + 2
r
X
j=1
r
X
mj = 2 dim Ker(A) +
mj − dim Ker(A),
j=1
soit α = 2β − dim Ker(A). Si A est inversible et diagonalisable, β = n et dim Ker(A) = 0 ,
donc α = 2n, ce qui montre que M est diagonalisable. Supposons inversement que M soit
diagonalisable, ce qui revient à dire que α = 2n, soit 2β − dim Ker(A) = 2n. Puisque β 6 n,
l’égalité 2β − dim Ker(A) = 2n n’est possible que si β = n et dim Ker(A) = 0 , ce qui
montre que A est inversible et diagonalisable.
I.5.13 La suffisance étant triviale, supposons que M soit diagonalisable. Il s’agit de montrer que A
est nulle. Il est possible de raisonner sur les vecteurs propres de M et de A, comme dans
l’exercice précédent. Nous laissons le lecteur détailler une telle solution.
Voici une méthode plus rapide, utilisant les polynômes. D’après le corollaire 27 de la page 235,
il existe un polynôme non nul P ∈ C[X], scindé (c’est automatique), à racines simples, et
annulant M . Calculons P (M ) en fonction de A. Commençons par les puissances de M :
2
A A
A A
A 2A2
2
M =
=
.
0 A
0 A
0
A2
k
A kAk
k
Par récurrence sur k , on montre ensuite aisément que M =
pour tout k ∈ N.
0
Ak
Par linéarité par rapport à Q , on en déduit la formule suivante :
Q(A) AQ′ (A)
Q(M ) =
pour tout Q ∈ C[X].
0
Q(A)
Puisque P (M ) = 0 , l’égalité précdente, appliquée à P , montre que P (A) = 0 = AP ′ (A).
En d’autres termes, chacun des polynômes P et XP ′ annule A. Mais P est à racines simples,
donc P ∧ P ′ = 1 . D’après le théorème de Bézout, il existe deux polynômes U, V ∈ C[X]
tels que U P + V P ′ = 1 . Substituons A à X dans cette égalité. Nous obtenons l’égalité U (A)P (A) + V (A)P ′ (A) = In , soit V (A)P ′ (A) = In , car P (A) = 0 . Multiplions
enfin par A : A = AIn = AV (A)P ′ (A) = V (A) AP ′ (A) = 0 .
I.5.14 Notons aussi A ∗ B la matrice M , produit de Kronecker de A et B . Commençons par une
remarque. Soient A′ := (a′i,j ) ∈ Mp (C), B ′ ∈ Mn (C) et M ′ := A′ ∗ B ′ le produit de Kronecker de A′ et B ′ . Notons ci,j le terme général de la matrice AA′ . La règle de multiplication
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
84
de deux matrices par blocs donne :

a1,1 B a1,2 B . . .
 a2,1 B a2,2 B . . .

MM′ = 
..
..
..

.
.
.
ap,1 B ap,2 B ′ . . .

c1,1 BB ′ c1,2 BB ′
 c2,1 BB ′ c2,2 BB ′

= 
..
..

.
.
cp,1 BB ′
cp,2 BB ′
a1,p B
a2,p B
..
.
ap,p B
...
...
..
.

a′1,1 B ′
a′2,1 B ′
..
.
a′1,2 B ′
a′2,2 B ′
..
.
...
...
..
.
a′p,1 B ′

′
a′p,2 B ′
. . . a′p,p B ′




c1,p BB
c2,p BB ′
..
.
. . . cp,p BB ′
a′1,p B ′
a′2,p B ′
..
.







,

autrement dit M M ′ est le produit de Kronecker de AA′ et BB ′ :
(A ∗ B)(A′ ∗ B ′ ) = (AA′ ∗ BB ′ ).
(∗)
On en déduit que, si P ∈ GLp (C), la matrice P ∗ In ∈ Mpn (C) est inversible, son inverse
étant P −1 ∗ In . Cela étant, puisque A est diagonalisable, il existe une matrice P ∈ GLp (C)
telle que la matrice D := P −1 AP soit diagonale : D = Diag(λ1 , . . . , λp ). Comme nous
l’avons dit, la matrice Q = P ∗ In ∈ Mpn (C) est inversible et son inverse est P −1 ∗ In . La
règle de calcul (∗) donne alors :
Q−1 M Q = (P −1 ∗ In )(A ∗ B)(P ∗ In ) = D ∗ B = Diag(λ1 B, . . . , λp B).
Maintenant, la matrice B étant elle aussi diagonalisable, il existe R ∈ GLn (C) telle que la
matrice ∆ := R−1 BR soit diagonale. Considérons la matrice diagonale par blocs (il y a p
blocs, chacun de taille n) : S := Diag(R, R, . . . , R). Cette matrice est inversible, et son
inverse est S −1 := Diag(R−1 , R−1 , . . . , R−1 ). Dans ces conditions, il vient :
(QS)−1 M (QS) = S −1 Q−1 M Q)S
= Diag(R−1 , . . . , R−1 ) Diag(λ1 B, . . . , λp B) Diag(R, . . . , R)
= Diag(λ1 R−1 BR, . . . , λp R−1 BR) = Diag(λ1 ∆, . . . , λp ∆).
Puisque la matrice ∆ est diagonale, la matrice Diag(λ1 ∆, . . . , λp ∆) l’est aussi. Cette matrice
est semblable à M , puisqu’elle est égale à (QS)−1 M (QS). Il en résulte que M est diagonalisable.
Terminons par deux remarques. Avec les notations précédentes, le polynôme caractéristique
p
Q
de A est χA :=
(X − λi ). Par ailleurs, le polynôme caractéristique de ∆ est le même
i=1
que celui de B . Factorisons-le : χB :=
n
Q
(X − µj ). Pour tout i , le polynôme caractéristique
j=1
de λi ∆ est évidemment
n
Q
j=1
ceci :
(X − λi µj ). D’après la proposition 19 de la page 227, on en déduit
χA∗B =
p
Y
i=1


n
Y

(X − λi µj ) .
j=1
Par ailleurs, lorsque A et B sont non nulles, on peut montrer que A ∗ B est diagonalisable si,
et seulement si, chacune des matrices A et B est diagonalisable. Nous venons de prouver la
suffisance de cette condition, mais la nécessité est un peu plus délicate.
c Dunod 2014
I.5 : Réduction des matrices
85
I.5.15 Commençons par deux cas évidents. Si n := 1 , A est diagonale. Nous supposerons
donc n > 2 . Si t := 1 , A est diagonalisable. En effet, une première raison est que A est alors
symétrique réelle, elle est donc déjà diagonalisable sur R. Autre raison : puisque tous les termes
de A valent 1 , on a A2 = nA. Ainsi A est annulée par le polynôme X 2 − nX = X(X − n).
Ce polynôme est scindé et à racines simples, donc A est diagonalisable. Supposons donc désormais t 6= 1 .
Notons B := (e1 , . . . , en ) la base canonique de Cn et u ∈ L(Cn ) l’endomorphisme canoniquement associé à A. Soit e la somme des ej . On a donc u(ej ) = e pour tout j ∈ [[1, n]]
distinct de q , et u(eq ) = e + (t − 1)ep . Il en résulte, puisque t 6= 1 , que l’image de u est
le plan P engendré par e et ep . En particulier, le rang de u est 2 . D’après le théorème du
rang, dim Ker u = n − 2 .
En fait, le noyau de u est visible. Soit x une combinaison linéaire des ej
P
P
pour j 6= q : x :=
xj ej . Alors u(x) =
xj e . Notons alors H le sous-espace vectoriel
j6=q
j6=q
P
P
de Cn formé des combinaisons linéaires
xj ej pour lesquelles
xj = 0 . La dimension
j6=q
j6=q
de H est évidemment n − 2 . Puisque H est inclus dans Ker u , on a Ker u = H , à cause des
dimensions.
Montrons que Cn est somme directe de H et de P . Puisque dim H = n − 2 et dim P = 2 , il
suffit de vérifier que H ∩P = {0} . Soit x ∈ H ∩P . Il existe λ, µ ∈ C tels que x := λe + µep .
Puisque x ∈ H , la q ème coordonnée de x doit être nulle. Si p 6= q , cette coordonnée est λ,
d’où λ = 0 , puis µ = 0 et donc x = 0 . Si p = q , ladite coordonnée est λ + µ, donc µ = −λ
P
et par suite x = λ
ej . La somme des coordonnées de x vaut alors (n − 1)λ, d’où là
j6=q
encore λ = 0 (parce que x appartient à H ) et donc x = 0 . En conclusion, Cn = H ⊕ P .
Puisque H et P sont respectivement le noyau et l’image de u , chacun d’eux est stable
par u . Il en résulte que A est diagonalisable, autrement dit u est diagonalisable, si, et seulement si, l’endomorphisme induit par u sur chacun de ces deux sous-espaces est diagonalisable. Pour H , c’est vrai, car la restriction de u à H est nulle. Pour P , soit M la matrice de uP dans la base (e, ep ). Alors A est diagonalisable si, et seulement si, M l’est :
nous nous sommes ramenés à une matrice 2 × 2 ! Il reste à calculer M . Notons d’abord
que u(e) = (n − 1)e + u(eq ) = ne + (t − 1)ep . Pour u(ep ), on doit distinguer deux cas.
n
1
Supposons d’abord p distinct de q . Dans ce cas, u(ep ) = e , donc M =
. Le
t−1 0
polynôme caractéristique de M est χM = X 2 −nX+(t−1), son discriminant est n2 −4(t−1).
Si donc t 6= 1 − n2 /4 , la matrice M a deux valeurs propres distinctes et par conséquent elle
est diagonalisable. Si t := 1 − n2 /4 , χM a une racine double, à savoir n/2 , et M ne peut être
diagonalisable que si son polynôme minimal est X − n/2 , ou encore si, et seulement si, M est
une matrice scalaire. Ce n’est pas le cas (regarder les termes diagonaux de M ).
Supposons que p = q . Dans ce cas, u(ep ) = u(eq ) = e + (t − 1)eq , et par
n
1
suite M =
. Ici, χM = X 2 −(n+t−1)X +(t−1)(n−1), son discriminant
t−1 t−1
est ∆ := (n + t − 1)2 − 4(t − 1)(n − 1) = t2 − 2(n − 1)t + (n2 + 2n − 3). Pour les mêmes
raisons que ci-dessus, M est diagonalisable si, et seulement si, ∆ 6= 0 . Résumons :
Cas p 6= q : A est diagonalisable si, et seulement si, t 6= 1 − n2 /4 .
Cas p = q : A est diagonalisable si, et seulement si, t2 − 2(n − 1)t + (n2 + 2n − 3) 6= 0 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
86
Ces conclusions restent valables lorsque t := 1 et n > 2 .
I.5.16 Le calcul donne : χA = X 3 + 6X 2 + 12X + 8 = (X + 2)3 . Ainsi A a une valeur propre triple, à savoir −2 . On peut déjà conclure que A n’est pas diagonalisable. Si
elle l’était, son polynôme minimal serait nécessairement X + 2 , et l’on aurait A = −2I3 ,
ce qui est faux. Notons B := (e1 , e2 , e3 ) la base canonique de C3 et u l’endomorphisme
de C3 canoniquement associé à A. On vérifie que l’espace propre de u associé à −2 est
la droite Cε1 , où ε1 := e1 − e2 − e3 . On remarque ensuite que u(e3 ) = −2e3 + 2ε1 .
En posant ε2 := e3 , on a donc u(ε2 ) = 2ε1 − 2ε2 . Posons enfin, par exemple, ε3 := e2 ,
d’où u(ε3 ) = −3ε1 + ε2 − 2ε3 . Alors C := (ε1 , ε2 , ε3 ) est une base de C3 , et la matrice


−2
2 −3
1  . La matrice de passage de B à C
de u dans cette base est : A′ :=  0 −2
0
0 −2




1 0 0
1 0 0
est P :=  −1 0 1  , et P −1 =  1 0 1  .
−1 1 0
1 1 0
A. On peut d’abord calculer les puissances de A′ puis

2 −3
0
1  . Alors A′ = −2I3 + N ′ , et N ′ est nilpo0
0


0 0 2
tente, plus précisément N ′ 3 = 0 . De plus, N ′ 2 =  0 0 0  . Il suffit alors d’appliquer
0 0 0
la formule du binôme. Pour tout entier k > 0 , on a :
Venons-en au calcul des puissances de

0
conjuguer par P . Posons N ′ :=  0
0
A′ k = (−2I3 + N ′ )k = (−2)k I3 + (−2)k−1 kN ′ − (−2)k−3 k(k − 1)N ′ 2
 




1 0 0
0 2 −3
0

1  + k(k − 1)  0
= (−2)k−2 4  0 1 0  − 2k  0 0

0 0 1
0 0
0
0


2
4 −4k k + 5k
4
−2k  .
= (−2)k−2  0
0
0
4

0 1 
0 0 

0 0
Conjuguons par P . En partant de A = P A′ P −1 , on obtient, pour tout k ∈ N,
Ak = P A′ k P −1 , soit après calculs :
 2

k +k+4
k 2 + 5k
−4k
4k  .
Ak = (−2)k−2  −(k 2 + k) −(k 2 + 5k − 4)
−(k 2 + 3k)
−(k 2 + 7k)
4k + 4
À dire vrai, trigonaliser A pour calculer ses puissances n’est pas ici la méthode la plus simple.
La raison est que, A ayant une seule valeur propre (triple), sa décomposition de Dunford (cf. la
section 3.3 de la page 249) s’obtient immédiatement. Plus précisément, la matrice N := A+2I3
est nilpotente, en fait N 3 = 0 (Cayley-Hamilton). On peut alors appliquer directement la formule du binôme, en partant de l’égalité A = −2I3 + N . Les seules puissances utiles de N




−1 −3
2
2
2 0
3 −2  et N 2 . On trouve N 2 =  −2 −2 0  . Pour tout ensont N =  1
2
4 −2
−2 −2 0
c Dunod 2014
I.5 : Réduction des matrices
87
tier k > 0 , il vient alors :
Ak = (−2I3 + N )k = (−2)k I3 + (−2)k−1 kN − (−2)k−3 k(k − 1)N 2
 




1 0 0
−1 −3
2
1
1

3 −2  + k(k − 1)  −1 −1
(−2)k−2 4  0 1 0  − 2k  1

0 0 1
2
4 −2
−1 −1
 2

2
k +k+4
k + 5k
−4k
4k  .
= (−2)k−2  −(k 2 + k) −(k 2 + 5k − 4)
−(k 2 + 3k)
−(k 2 + 7k)
4k + 4

0 
0 

0
Nous avons retrouvé (plus rapidement) le résultat précédent.
I.5.17 Le calcul de χA est immédiat :
X −1 0
0 X −1 = (X−1)(X 2 −1) = (X−1)2 (X+1).
χA = −1
X −1 = (X−1) −1
X
0
−1 X Il y a deux valeurs propres : 1 , qui est double, et −1 , qui est simple. La matrice A n’est
pas diagonalisable : si elle l’était, son polynôme minimal serait X 2 − 1 (il divise χA , a les
mêmes racines que lui, et il est à racines simples), ce qui impliquerait A2 = I3 . Ce n’est pas le


1 0 0
cas : A2 =  1 1 0  .
1 0 1
Pour calculer les puissances de A, le plus rapide est sans doute d’observer que le calcul des
puissances de A2 est immédiat. En notant (Ei,j ) la base canonique de M3 (Q), on a en effet A2 = I2 + E2,1 + E3,1 , autrement dit la multiplication à gauche par A2 : M 7→ A2 M
consiste à ajouter la première ligne de M à chacune des deux autres. Avec cette interprétation
en termes d’opérations sur les matrices, il est clair que, pour tout k ∈ N, la multiplication à
gauche par A2k : M 7→ A2k M consiste à ajouter k fois la première ligne de M à chacune des


1 0 0
deux autres. D’où (sans calcul) A2k =  k 1 0  . On en déduit, en prenant k := 894 :
k 0 1





1 0 0
1 0 0
1 0 0
A1789 = A(A2 )894 =  1 0 1   894 1 0  =  895 0 1  .
0 1 0
894 0 1
894 1 0
Une deuxième méthode, plus agréable pour un ordinateur que pour un humain, consiste à
écrire 1789 en base 2 : 1789 = 110111111012 , ce qui traduit les égalités :
1789 = 1024 + 512 + 128 + 64 + 32 + 16 + 8 + 4 + 1
= 210 + 29 + 27 + 26 + 25 + 24 + 23 + 22 + 20 .
j
Il faut dix multiplications (élévations au carré) pour calculer les A2 , j = 1, . . . , 10 , puis huit
autres pour les multiplier entre elles. Au total, dix-huit multiplications suffisent pour calculer A1789 . Nous ne détaillerons pas cette solution !
Indiquons une autre méthode, plus générale que la première, pour calculer les puissances de A.
Cette méthode est basée sur les suites définies par une relation de récurrence linéaire. Le polynôme minimal de A est égal à P := χA = (X − 1)2 (X + 1) = X 3 − X 2 − X + 1 , car
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
88
sinon il serait égal à X 2 − 1 , ce que nous avons écarté. On en déduit que (I3 , A, A2 ) est une
base de C[A]. En effet, le morphisme d’algèbres Q 7→ Q(A) de C[X] dans M3 (C) a pour
image C[A] et pour noyau l’idéal (P ). L’espace C2 [X] des polynômes de degré au plus égal
à 2 est un supplémentaire de (P ) dans C[X] (division euclidienne). L’image par ce morphisme
de la base (1, X, X 2 ) de C2 [X] est (I3 , A, A2 ), d’où notre assertion.
Pour tout k ∈ N, Ak appartient à C[X], donc il existe un unique triplet (ak , bk , ck ) ∈ C3 tel
que Ak = ak A2 + bk A + ck I3 . Multiplions l’égalité A3 = A2 + A − I3 (Cayley-Hamilton)
par Ak : Ak+3 = Ak+2 +Ak+1 −Ak . Par identification des coordonnées sur la base (I3 , A, A2 )
de C[A], on en déduit que chacune des suites (ak ), (bk ), (ck ) vérifie la relation de récurrence
linéaire suivante :
uk+3 = uk+2 + uk+1 − uk
pour tout k ∈ N.
(∗)
La forme générale des suites satisfaisant cette relation de récurrence est connue (cf. la section 3.1 de la page 242. Le polynôme P ayant comme racines 1 , qui est double, et −1 , qui est
simple, cette forme générale est : uk := (λk + µ) · 1k + ν(−1)k , où λ, µ, ν sont des constantes
arbitraires.
Les conditions initiales (a0 , a1 , a2 ) = (0, 0, 1) permettent de déterminer la suite (ak ) par
résolution d’un système linéaire. On trouve : ak = 2k − 1 + (−1)k /4 pour tout k . On
obtient de même :
bk =
1 − (−1)k
2
et ck =
−2k + 3 + (−1)k
4
pour tout k ∈ N.
En reportant ces valeurs dans l’égalité Ak = ak A2 + bk A + ck I3 , il vient pour tout k :


4
0
0
1
Ak =  2k + 1 − (−1)k 2 + 2(−1)k 2 − 2(−1)k  .
4
2k − 1 + (−1)k 2 − 2(−1)k 2 + 2(−1)k
En prenant k = 1789 , on retrouve la valeur calculée précédemment.
I.5.18 C’est une simple application de la trigonalisation. Donnons-nous un polynôme P ∈ C[X].
La matrice A est trigonalisable : il existe M ∈ GLn (C) telle que la matrice T := M −1 AM
soit triangulaire supérieure. L’application B 7→ M −1 BM étant un automorphisme de l’algèbre B , on a M −1 P (A)M = P (T ), donc P (A) est semblable à P (T ). Ainsi A, T ont
même polynôme caractéristique, et les matrices P (A), P (T ) également. Quitte à remplacer A
par T , nous pouvons désormais supposer que A est triangulaire supérieure.
n
Q
Écrivons A = (ai,j) . Puisque A est triangulaire, χA =
(X − ai,i ). À l’ordre près, on
i=1
peut donc supposer que λi := ai,i pour tout i . L’idée est alors simple. Nous savons que, pour
tout k ∈ N, Ak est triangulaire avec pour termes diagonaux les λki (les autres termes ne se
calculent pas simplement, en général). Pour tout polynôme Q , on en déduit, par linéarité en Q ,
que Q(A) est triangulaire, avec pour termes diagonaux les Q(λi ). Le polynôme caractéristique
n
Q
de Q(A) est donc
X − Q(λi ) . C’est vrai, en particulier, pour le polynôme P .
i=1
I.5.19 Écrivons P := X n + an−1 X n−1 + · · · + a1 X + a0 . Soit π : K[X] → A la
projection canonique, associant à tout polynôme Q sa classe modulo P . Cette projection
c Dunod 2014
I.5 : Réduction des matrices
89
est un morphisme d’algèbres surjectif, de noyau (P ). Le sous-espace Kn−1 [X] de K[X]
formé des polynômes de degré au plus n − 1 est un supplémentaire de (P ) (division euclidienne par P ). Puisque (1, X, . . . , X n−1 ) est une base de Kn−1 [X], son image par π
est une base de A. Mais π est un morphisme d’algèbres, et π(X) = x par définition,
donc π(Q) = Q(x) pour tout polynôme Q . En particulier, π(X k ) = xk pour tout k . Tout
cela montre que B := (1, x, . . . , xn−1 ) est une base de A.
Déterminons la matrice M = (ti,j ) de u dans la base B . Soit k ∈ [[1, n − 1]]. Les coeffi-
cients de la k ème colonne sont les coordonnées (dans la base B ) de l’image par u du k ème
vecteur de B , à savoir xk−1 . Cette image est bien sûr xk . Comme k + 1 6 n, xk est
le (k + 1) ème vecteur de B . Tous les coefficients ti,k sont donc nuls, sauf tk+1,k , qui vaut 1 .
Prenons maintenant k := n. Le n ème vecteur de B est xn−1 , son image par u est toujours xn , qui n’est plus un vecteur de B . Calculons donc les coordonnées de xn . Par définition
de π , π(P ) = 0 , c’est-à-dire P (x) = 0 , soit xn + an−1 xn−1 + · · · + a1 x + a0 = 0 .
Ainsi xn = −(a0 + a1 x + · · · + an−1 xn−1 ). On a donc ti,n = −ai−1 pour i = 1, . . . , n.
D’où la matrice M :


0 0 ... 0
−a0
 1 0 ... 0
−a1 




..
.
.
0
1
0
−a
M = 
2



 .. .. . .
.
.
.
.

 . .
.
.
.
0 0 . . . 1 −an−1
Cette matrice est bien la matrice compagnon CP du polynôme P , définie par la formule (10)
de la page 228.
Puisque CP est la matrice de u dans la base B , son polynôme minimal est égal à celui
de u . Montrons que ce polynôme est P . Rappelons d’abord que u est la multiplication
par x : y 7→ xy dans A. Pour tout k ∈ N, on en déduit que uk est la multiplication
par xk : y 7→ xk y (récurrence immédiate sur k ). Ensuite, pour tout polynôme Q , on voit
(par linéarité en Q ) que Q(u) est la multiplication par Q(x) : y 7→ Q(x)y .
Soit Q ∈ K[X]. Supposons que Q annule u . Alors Q(u)(y) = Q(x)y = 0 pour
tout y ∈ A. En prenant y := 1 , on obtient Q(x) = 0 , autrement dit π(Q) = 0 .
D’où Q ∈ Ker π = (P ) : Q est un multiple de P . Inversement, il est clair que P annule u .
En effet, P (x) = π(P ) = 0 , donc P (u)(y) = P (x)y = 0 pour tout y ∈ A. En conclusion,
les polynômes annulant u sont exactement les multiples de P . Puisque P est unitaire, cette
propriété caractérise le polynôme minimal µu de u . D’où µu = P .
Conclusion : le polynôme minimal de la matrice compagnon CP de P est P lui-même. Nous
avons ainsi obtenu une autre preuve de ce résultat (cf. la proposition 21 de la page 228).
I.5.20 Rappelons d’abord qu’un endomorphisme ou une matrice carrée est trigonalisable si, et
seulement si, son polynôme caractéristique est scindé (sur le corps de base K ), cf. le théorème 29 de la page 238.
Si l’on considère les matrices des ui dans une même base (arbitraire) de E , on obtient l’énoncé
matriciel suivant, équivalent à ce que nous voulons démontrer. Soient n ∈ N∗ et (Ai )i∈I
une famille de matrices, appartenant à Mn (K) et commutant deux à deux. On suppose que
chaque Ai est trigonalisable. Alors les Ai sont simultanément trigonalisables, i.e. il existe
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
90
une matrice P ∈ GLn (K) telle que, pour tout i ∈ I , la matrice P −1 Ai P soit triangulaire
supérieure. Dans la suite, nous omettrons l’adjectif « supérieure », il sera sous-entendu.
Commençons par nous ramener au cas où l’ensemble I est fini. Soit W le sous-espace vectoriel
de L(E) engendré par les ui . Puisque E est de dimension finie, L(E) et W sont de dimension
finie. Il existe donc une partie finie J de I telle que la famille (ui )i∈J soit une base de W . Supposons donc qu’il existe une base B de E telle que, pour tout j ∈ J , la matrice MatB (uj ) soit
triangulaire. Pour tout i ∈ I , ui est une combinaison linéaire des uj , j ∈ J , donc MatB (ui )
est une combinaison linéaire des MatB (uj ), j ∈ J . Il en résulte que MatB (ui ) est triangulaire, car les matrices triangulaires forment un sous-espace vectoriel (et même une sousalgèbre) de Mn (K). Nous pouvons donc désormais supposer que l’ensemble I est fini, et
même que I := [[1, p]], où p ∈ N.
Raisonnons maintenant par récurrence sur l’entier n + p. Le cas où n + p := 2 est évident.
En fait, la conclusion est évidente lorsque p := 1 . Supposons donc n + p > 2 et p > 2 ,
l’assertion à établir (sous forme « géométrique » ou matricielle) étant vraie à l’ordre k pour
tout k ∈ [[2, n + p − 1]]. Il s’agit donc d’une récurrence forte. Soient alors u1 , . . . , up comme
dans l’énoncé. Si up est une homothétie, la conclusion est claire. En effet, d’après l’hypothèse
de récurrence, il existe une base de E dans laquelle les matrices de u1 , . . . , up−1 sont triangulaires. La matrice de up dans cette base est elle aussi triangulaire, et même mieux : elle est
diagonale. Nous supposons désormais que up n’est pas une homothétie.
Soit V un sous-espace propre de up . Un tel sous-espace existe, puisque le polynôme
caractéristique de up est scindé. Puisque up n’est pas une homothétie, V 6= E ,
donc n′ := dim V ∈ [[1, n − 1]] . Pour tout j ∈ [[1, p]], uj commute avec up , par hypothèse,
donc uj laisse V stable (proposition 11 de la page 224). Notons alors vj ∈ L(V ) l’endomorphisme de V induit par uj . Les endomorphismes v1 , . . . , vp de V commutent deux à deux. De
plus, chaque vj est trigonalisable, car son polynôme caractéristique divise celui de uj (proposition 16 de la page 226), donc est scindé. Vu l’hypothèse de récurrence, n + p étant remplacé
par n′ + p, il existe une base de V dans laquelle la matrice de chaque vj soit triangulaire.
Complétons cette base en une base B := (e1 , . . . , en ) de E .
Le point important est le suivant. Pour tout j , la matrice de vj dans la base (e1 , . . . , en′ )
de V est triangulaire, en particulier, e1 est un vecteur propre de vj , c’est-à-dire de uj .
λj Wj
La matrice Aj de uj dans la base B s’écrit donc par blocs : Aj :=
,
0 Mj
avec λj ∈ K , Mj ∈ Mn−1 (K) et Wj ∈ K n−1 (c’est un vecteur ligne). Le calcul matriciel
par blocs montre que les Mj commutent deux à deux, car c’est le cas pour les Aj . Chaque Mj
est trigonalisable. En effet, le théorème 5 de la page 219 montre que χMj divise χAj = χuj , et
ce dernier polynôme est scindé par hypothèse.
Nous pouvons ainsi appliquer l’hypothèse de récurrence (sous forme matricielle) aux matrices M1 , . . . , Mp . Ici, n + p est remplacé par n − 1 + p. Il existe donc une matrice Q ∈ GLn−1 (K) telle que, pour j = 1, . . . , p, la matrice Tj := Q−1 Mj Q soit trian
1 0
gulaire. Posons alors P :=
∈ Mn (K). Cette matrice est inversible, son inverse
0 Q
c Dunod 2014
I.5 : Réduction des matrices
est
1
0
0 Q−1
91
. Soit enfin j ∈ [[1, p]]. La règle de multiplicationpar blocs donne :
P −1 Aj P =
=
=
1
0
0
Q−1
1
0
0
Q−1
λj
0
λj
0
Wj
Mj
1 0
0 Q
λj Wj Q
0 Mj Q
Wj Q
λj Wj Q
=
.
Q−1 Mj Q
0
Tj
Puisque la matrice Tj est triangulaire,la matrice P −1 Aj P l’est aussi. Ainsi, les matrices A1 , . . . , Ap sont simultanément trigonalisables, i.e. les endomorphismes u1 , . . . , up sont
simultanément trigonalisables. Nous avons donc établi notre assertion à l’ordre n + p.
I.5.21 Voici une solution rapide, utilisant l’exercice précédent. Puisque le corps de base est C, u
et v sont trigonalisables. Comme ils commutent, ils sont simultanément trigonalisables. Soit B
une base de E telle que A := MatB (u) et B := MatB (v) soient triangulaires supérieures.
Notons λ1 , . . . , λn les termes diagonaux de A et µ1 , . . . , µn ceux de B . Puisque B est nilpotente, les µi sont tous nuls car, pour tout k ∈ N, B k est triangulaire avec comme termes
diagonaux les µki . La matrice A + B est donc triangulaire, avec comme termes diagonaux
les λi . D’où :
Y
det(u + v) = det(A + B) =
λi = det(A) = det(u).
i
Indiquons une autre solution, le corps C étant remplacé par un corps de base K quelconque.
Distinguons deux cas, suivant que u soit injectif ou non. Supposons d’abord que u ne soit
pas injectif, de sorte que det u = 0 . Alors Ker u est un sous-espace vectoriel non nul de E ,
il est stable par v puisque u et v commutent (proposition 11 de la page 224). L’endomorphisme v ′ de Ker u induit par v est nilpotent puisque v l’est, en particulier v ′ n’est pas
injectif. Soit donc x ∈ Ker u un vecteur non nul tel que v ′ (x) = 0 , c’est-à-dire v(x) = 0 .
Alors (u+v)(x) = 0 , ce qui montre que u+v n’est pas injectif. D’où det(u+v) = 0 = det u .
Supposons maintenant que u soit injectif, donc bijectif. Posons w := u−1 ◦ v . Les endomorphismes u−1 et v commutent, et v est nilpotent, donc w est nilpotent. Par ailleurs,
on a det(u + v) = det u ◦ (IdE +w) = det(u) det(IdE +w). Il suffit donc de montrer
que det(IdE +w) = 1 , ceci dès que w est nilpotent. L’idée est maintenant d’observer que w
est de toutes façons trigonalisable, parce que son polynôme caractéristique est X n (cf. la proposition 38 de la page 247). Dans une base de E convenable, la matrice de w est triangulaire,
et ses termes diagonaux sont nuls (comme ci-dessus). La matrice de IdE +w dans ladite base
est alors triangulaire, et ses termes diagonaux valent tous 1 , donc det(IdE +w) = 1 .
I.5.22 Supposons que AB − BA = In . En prenant les traces, on en déduit, à cause de la linéarité
de la trace et de la propriété Tr(AB) = Tr(BA), que Tr(In ) = 0 , soit n = 0 , ce qui est
absurde.
Supposons désormais que AB − BA = B . Alors B 2 = B(AB − BA) = BAB − B 2 A, et
aussi B 2 = (AB − BA)B = AB 2 − BAB d’où, en additionnant, AB 2 − B 2 A = 2B 2 .
Plus généralement, montrons que AB k − B k A = kB k pour tout k ∈ N. C’est vrai
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
92
pour k = 0, 1, 2 . Supposons cette formule vraie pour un certain k . Comme ci-dessus, on en déduit kB k+1 = B(AB k −B k A) = BAB k −B k+1 A. D’un autre côté, l’égalité AB −BA = B
implique B k+1 = BB k = (AB − BA)B k = AB k+1 − BAB k . En additionnant, on obtient (k + 1)B k+1 = AB k+1 − B k+1 A, d’où la formule au rang k + 1 . On a donc bien :
AB k − B k A = kB k
pour tout k ∈ N.
(∗)
∗
Dans ces égalités, prenons les traces des deux membres. Pour tout k ∈ N , nous savons
que Tr(AB k ) = Tr(B k A), donc Tr(kB k ) = k Tr(B k ) = 0 , d’où Tr(B k ) = 0 . L’exercice 11
de la page 247 montre alors que B est nilpotente. Si l’on ne veut pas utiliser cet exercice, on
peut raisonner comme suit. Soient λ1 , . . . , λr les valeurs propres non nulles (deux à deux distinctes) de B , et notons mi la multiplicité de chaque λi . Pour tout k ∈ N∗ , la trace de B k
r
r
P
P
vaut
mi λki . Supposons alors r > 1 . Les égalités
mi λki = 0 , pour k = 1, . . . , r , constii=1
i=1
tuent un système linéaire homogène de
ce système est :
λ1 λ2 . . .
2
λ1 λ22 . . .
..
..
.
.
λr λr . . .
1
2
r équations à r inconnues (les mi ). Le déterminant de
λ1 λ2 · · · λr V (λ1 , . . . , λr ),
r λr
λr
λ2r
..
.
où V (λ1 , . . . , λr ) est le déterminant de Vandermonde de λ1 , . . . , λr . Ce déterminant
Q
vaut
(λj − λi ), cf. [L1], module II.7, il n’est donc pas nul puisque les λi sont dis16i<j6n
tincts. Comme les λi sont non nuls, le système ci-dessus ne possède que la solution triviale.
Ainsi, tous les mi sont nuls, ce qui est absurde.
La contradiction à laquelle nous arrivons montre que l’hypothèse r > 1 est absurde. Cela
signifie que la seule valeur propre de B est 0 . Dans ces conditions, χB = X n , d’où B n = 0
en vertu du théorème de Cayley-Hamilton.
I.5.23 Posons d’abord E := Cn . Le fait que B soit la base canonique de Cn ne jouera pas de rôle
particulier. Ce qui suit est encore vrai pour une base B de E , quelconque mais fixée, ce qui
permet de définir les us comme dans l’énoncé.
1. Montrons que s 7→ us est un morphisme de groupes de Sn dans GL(E).
Soient s, t ∈ Sn . Pour tout j ∈ [[1, n]], on a :
= us (et(j) ) = us ut (ej ) = (us ◦ ut )(ej ).
us ◦ t (ej ) = e(s◦t)(j) = e
s t(j)
Puisque c’est vrai pour tout j , us ◦ t = us ◦ut . Par ailleurs, il est clair que us est l’identité
de E lorsque s est la permutation identité. On en déduit que us ◦ us−1 = Id pour toute
permutation s. Tout cela montre d’abord que us ∈ GL(E) pour toute permutation s,
et ensuite que s 7→ us est un morphisme de groupes de Sn dans GL(E). Au niveau
matriciel, il en résulte que s 7→ Ps est un morphisme de groupes de Sn dans GLn (C).
Cela étant, soit s ∈ Sn . D’après le théorème de Lagrange (cf. le module II.2 de [L1]),
l’ordre de s divise l’ordre (ou cardinal) du groupe Sn , c’est-à-dire n!. D’où sn! = Id,
et par conséquent Psn! = In , d’après l’alinéa précédent. La matrice Ps est donc annulée
par le polynôme X n! − 1 . Ce polynôme est (scindé et) à racines simples, ses racines étant
les n! racines n! èmes de l’unité. La matrice Ps est donc diagonalisable (corollaire 27 de
la page 235).
c Dunod 2014
I.5 : Réduction des matrices
93
2. Notons d’abord que us (ej ) = ej+1 pour tout j ∈ [[1, n − 1]] et us (en ) = e1 . Posons ensuite z := exp(2iπ/n). C’est une racine n ème primitive de l’unité. Pour tout j ∈ [[1, n]],
considérons le vecteur suivant :
n
X
εj := e1 + z −j e2 + · · · + z −(n−1)j en =
z −(h−1)j eh .
(∗)
h=1
Alors εj est un vecteur propre de us associé à la valeur propre z j . En effet :
us (εj ) =
n
X
z −(h−1)j u(eh ) =
h=1
= z
j
"n−1
X
n−1
X
h=1
z
−hj
eh+1 + z
h=1
−n
e1
z −(h−1)j eh+1 + z −(n−1)j e1
#
= z
j
n
X
z −(k−1)j ek = z j εj .
k=1
Ce calcul montre que us a n valeurs propres distinctes, à savoir les n racines n èmes
de l’unité z j ( j = 1, . . . , n) et que, pour tout j , εj est vecteur propre de us associé
à la valeur propre z j . Il en résulte que C := (ε1 , . . . , εn ) est une base de E formée
de vecteurs propres de us . Plus précisément, MatC (us ) = Diag(z, z 2 , . . . , z n ). Bien
entendu, si Q est la matrice de passage de B à C , on a Q−1 Ps Q = Diag(z, z 2 , . . . , z n ).
Nous avons ainsi diagonalisé Ps , dans ce cas particulier. Noter que le polynôme minimal
et le polynôme caractéristique de us sont tous les deux égaux à X n − 1 .
3. Soit (I1 , . . . , Ir ) la partition de [[1, n]] formée des orbites sous l’action du sousgroupe hsi de Sn engendré par s. Si h ∈ [[1, r]], choisissons un indice ih ∈ Ih et
posons dh := card Ih . Considérons le cycle ch (de longueur dh ) suivant :
ch = ih s(ih ) · · · sdh −1 (ih ) ∈ Sn .
Alors s = c1 ◦ c2 ◦ · · · ◦ cr est la décomposition (canonique) de s en produit de cycles à
supports deux à deux disjoints (si besoin est, revoir à ce sujet le module II.2 de [L1]).
Pour tout h, soit Eh le sous-espace vectoriel de E engendré par les vecteurs ei , i
parcourant Ih . Puisque les Ih forment une partition de [[1, n]], E est somme directe
des Eh , h = 1, . . . , r .
Soit h ∈ [[1, r]] . Le sous-espace Eh est stable par us . En effet, si i ∈ Ih , s(i) ∈ Ih parce
que Ih est stable par s (définition d’une orbite), donc us (ei ) = es(i) ∈ Eh . Notons
alors vh l’endomorphisme de Eh induit par us . La question précédente montre que vh
est diagonalisable et permet de le diagonaliser. Précisons ce point. Soit sh la permutation
de Ih induite par s. En fait sh = ih s(ih ) · · · sdh −1 (ih ) est un cycle de longueur dh .
À partir de sh ∈ S(Ih ) et de la base de Eh formée des ei pour i ∈ Ih , on peut définir
l’endomorphisme ush de Eh comme dans l’énoncé, en remplaçant E par Eh . Il est
alors clair que l’endomorphisme vh de Eh induit par us n’est autre que ush .
Posons maintenant zh := exp(2iπ/dh ). D’après la question précédente, vh a dh valeurs
propres distinctes : zh , zh2 , . . . , zhdh . De plus nous disposons d’une base Ch de Eh , à
savoir Ch := εh,1 , . . . , εh,dh , avec :
εh,j =
dh
X
k=1
−(k−1)j
zh
esk−1 (ih )
pour tout j ∈ [[1, dh ]].
Chaque εh,j est vecteur propre de vh , donc de us , associé à la valeur propre zh .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
94
Il ne reste plus qu’à considérer la base C de E obtenue par juxtaposition des
bases C1 , . . . , Cr . Cette base de E est formée de vecteurs propres de us , et nous avons
donc ainsi diagonalisé us . Remarquons que la proposition 18 de la page 227 nous permet
également de déterminer le polynôme minimal et le polynôme caractéristique de us , en
fonction des cardinaux dh des orbites de [[1, n]] sous hsi, i.e. des longueurs des cycles ch
constituant s :
r
Y
χus =
(X dh − 1) et µus = ppcm X d1 − 1, . . . , X dr − 1 .
h=1
I.5.24 L’idée essentielle est que xq = x pour tout x ∈ K . Rappelons pourquoi. C’est clair
si x = 0 . Sinon, x est un élément du groupe multiplicatif K ∗ , dont l’ordre est (fini et) égal
à q − 1 . D’après le théorème de Lagrange, xq−1 = 1 , d’où xq = x, en multipliant par x.
Supposons que u soit diagonalisable. Son polynôme minimal µu est alors scindé et à racines
r
Q
simples, il s’écrit donc µu :=
(X − λi ), où les λi sont des éléments de K deux à deux
i=1
distincts. Pour tout i , λqi = λi , donc X−λi divise X q −X dans K[X]. Le ppcm de ces X−λi
étant µu , il divise X q − X , ce qui équivaut à dire que uq = u .
Supposons inversement que uq = u . Le polynôme P := X q − X ∈ K[X] annule donc u .
Pour montrer que u est diagonalisable, il suffit donc (théorème 25 de la page 235) de montrer
que P est scindé et à racines simples. En fait, puisque xq = x pour tout x ∈ K , P est un
Q
multiple du polynôme
(X − x). Ce polynôme est, comme P , unitaire et de degré q . On
x∈K
en déduit que ces deux polynômes sont égaux :
P := X q − X =
Y
x∈K
(X − x).
Le polynôme figurant dans le membre de droite étant scindé et à racines simples, P a la même
propriété, donc u est diagonalisable.
I.5.25 Observons que, pour tout r ∈ Z, z r = 1 si, et seulement si, r est multiple de n. Nous utiliserons constamment cette observation. Considérons par exemple la somme définissant G(n).
2
L’application f : k 7→ e2iπk /n de Z dans C est n-périodique. Pour toute application de ce
type et tout a ∈ Z, la somme des f (k) de k := a à k := a + n − 1 , ne dépend pas du choix
P
de a, on notera cette somme
f (k). Justifions ensuite l’égalité G(n) = Tr(A). La trace
k mod n
2
de la matrice A est la somme des termes diagonaux de A, c’est donc la somme des z (j−1)
pour j = 1, . . . , n. Le changement d’indice j := k + 1 montre que Tr(A) est la somme
2
des z k pour k = 0, . . . , n − 1 , d’où Tr(A) = G(n). Remarquons enfin que la matrice A est
symétrique.
1. La somme à calculer est la somme des termes de la progression géométrique à n termes,
de raison z r et de premier terme z r . Si z r = 1 , i.e. si r est multiple de n, cette somme
vaut évidemment n. Dans le cas contraire, elle vaut z r (z rn − 1)/(z r − 1), c’est-à-dire 0
puisque z n = 1 . Conclusion : pour tout entier r ∈ Z, on a :
(
n
X
X
n si r est multiple de n
z kr =
z kr =
0 si r n’est pas multiple de n.
k=1
k mod n
c Dunod 2014
I.5 : Réduction des matrices
95
2. Soient j, k ∈ [[1, n]]. Le coefficient d’indices (j, k) de la matrice A2 est :
2
(A )j,k =
n
X
Aj,h Ah,k =
h=1
n
X
z
(j−1)(h−1) (h−1)(k−1)
z
h=1
=
n
X
z (h−1)(j+k−2)
h=1
D’après la question précédente, ce coefficient vaut n si j + k − 2 est multiple de n et 0
sinon. Puisque j et k appartiennent à [[1, n]], j + k − 2 n’est multiple de n que dans les cas
suivants : j = k = 1 , ou bien j ∈ [[2, n]] et k = n+2−j . Dans ce dernier cas, noter que j 6= k ,
parce que n est impair. Ainsi le seul coefficient diagonal non nul de A2 est (A2 )1,1 = n :


n 0 ...
0 0
 0 0 ...
0 n 



.
.
. . ... 
A2 =  .. ..
.
.


 0 0 ...
0 0 
0 n ...
0 0
On en déduit la trace de A2 :
Tr(A2 ) = n.
Passons à A4 . Soient j, k ∈ [[1, n]]. On a (A4 )j,k =
(26)
n
P
(A2 )j,h (A2 )h,k . pour tout h, le
h=1
produit (A2 )j,h (A2 )h,k est non nul si, et seulement si, j + h − 2 et h + k − 2 sont tous
deux multiples de n. Cela exige que j et k soient congrus modulo n, donc égaux, puisqu’ils
appartiennent à [[1, n]]. Cela prouve déjà que A4 est diagonale. Pour tout j ∈ [[1, n]], nous
n 2
P
obtenons la formule (A4 )j,j =
(A2 )j,h . Chaque ligne de A2 comporte un seul terme
h=1
non nul, qui vaut n. On en déduit que (A4 )j,j = n2 pour tout j , d’où :
A4 = n2 In .
(27)
4
2
La matrice A est donc annulée par le polynôme X − n . Ce polynôme ayant quatre ra√
√
cines simples, à savoir ± n et ±i n, la matrice A4 est diagonalisable (corollaire 27 de la
page 235).
3. C’est évident. Puisque X 4 − n2 annule A, il est multiple du polynôme minimal µA . On en
√
√
√
√ déduit que sp A ⊂
n, − n, i n, −i n := S . Pour tout λ ∈ C, notons mλ l’exposant
de X − λ dans χA , il est non nul si, et seulement si, λ est une valeur propre de A. On peut
donc en tout cas écrire :
Y
Y
χA =
(X − λ)mλ =
(X − λ)mλ .
λ ∈ sp A
λ∈S
En posant a := m√n , b := m−√n , c := mi√n et d := m−i√n , on obtient l’égalité :
√
√
√
√
χA = (X − n)a (X + n)b (X − i n)c (X + i n)d .
(28)
4. Il faut remarquer que A est une matrice de Vandermonde. Pour tout j ∈ [[1, n]], la j ème
ligne de A est en effet 1, z j−1 , z 2(j−1) , . . . , z (n−1)(j−1) , elle est donc formée des puissances successives de z j−1 . En d’autres termes, A est la matrice de Vandermonde des scalaires 1, z, z 2, . . . , z n−1 . Le déterminant de A est donné par la formule classique suivante
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
96
(cf. module II.7 de [L1]) :
Y
det A = V (1, z, . . . , z n−1 ) =
(z k−1 − z j−1 ) =
16j <k6n
Y
=
e
2kiπ/n
16j <k6n
=
Y
16j <k6n
−e
2jiπ/n
Y
=
e
Y
(z k − z j )
0 6 j < k 6 n−1
(k+j)iπ/n
16j <k6n
e(k−j)iπ/n − e−(k−j)iπ/n
2ie(k+j)iπ/n sin (k − j)π/n .
Il y a n(n − 1)/2 couples d’entiers (j, k) tels que 1 6 j < k 6 n. Pour chacun
d’eux, (k − j)π/n ∈ ]0, π[, donc tous les sinus intervenant ci-dessus sont strictement positifs. Par ailleurs, les termes e(k+j)iπ/n dans le dernier produit s’éliminent, plus exactement
leur produit vaut 1 . En effet, un calcul immédiat (laissé au lecteur) montre que la somme
P
σ :=
(k + j) vaut n(n2 − 1)/2 . Puisque n est impair, cette somme est un entier
16j <k6n
multiple de 4n (parce que n2 est congru à 1 modulo 8 ), donc eσiπ/n = 1 . On obtient une
formule du type désiré :
Y
sin (k − j)π/n ∈ ]0, +∞[ .
det A = in(n−1)/2 t, où t := 2n(n−1)/2
16j <k6n
5. Calculons donc le carré du module de G(n). D’abord, z = z −1 , d’où :
!
!
!
X
X
X
X
2
2
2
k
−h
k2
G(n)G(n) =
z
zh
=
z
k mod n
=
n
X
h=1
=
n−1
X
j=0
h mod n
h+n−1
X
zk
2
−h2
k=h
zj
2
n
X
z 2jh
h=1
| {z }
!
!
=
n
X
h=1


h mod n
n−1
X
z (j+h)
j=0
k mod n
2

−h2 
=
n
X
h=1

n−1
X

j=0
zj
2

+2jh 
.
= sj
Lorsque j décrit [[0, n − 1]], la question 1 montre que la somme sj vaut n si 2j est multiple
de n et 0 sinon. Puisque n est impair et 0 6 j 6 n − 1 , le premier cas se présente si, et
2
seulement si, j := 0 . Ainsi |G(n)| = z 0 s0 = n, ce qui donne la formule annoncée :
2
|G(n)| = n.
(29)
Déterminons alors (a, b, c, d). D’abord, la factorisation (28) donne, en considérant les degrés :
a + b + c + d = n.
(30)
Ensuite, la trace de A étant la somme des racines du polynôme caractéristique, comptées avec
leurs multiplicités, la factorisation (28) donne aussi :
√ G(n) = Tr(A) = n (a − b) + i(c − d) ,
(31)
ce qui explique l’intérêt du calcul de (a, b, c, d) ! Exploitons maintenant l’égalité (26). La matrice A est semblable à une matrice diagonale D . Parmi les coefficients diagonaux de D , a
√
√
√
√
valent n, b valent − n, c valent i n et d valent −i n, à cause de l’égalité (28).
c Dunod 2014
I.5 : Réduction des matrices
97
Puisque A2 est semblable à D2 , on en déduit le polynôme caractéristique de A2 :
χA2 = (X − n)a (X − n)b (X + n)c (X + n)d = (X − n)a+b (X + n)c+d .
On en déduit la trace de A2 . En comparant avec l’égalité (26), on obtient :
(a + b) − (c + d) = 1.
Compte tenu de l’égalité (29), il vient :
n+1
n−1
et c + d =
·
(32)
2
2
Il nous faudrait encore deux relations entre a, b, c, d. L’une d’elles résulte immédiatement des
égalités (31) et (29) :
(a − b)2 + (c − d)2 = 1.
(33)
Cette égalité est très forte, car a, b, c, d sont des entiers. Ainsi, des deux entiers a − b et c − d,
nécessairement l’un est nul et l’autre vaut ±1 . Bien entendu, une fois a − b et c − d connus, les
égalités (32) donneront a, b, c, d, et par conséquent G(n). Si c = d, la deuxième égalité (32)
donne n − 1 = 4c, donc n ≡ 1 mod 4 . Si a = b , la première égalité (32) donne n + 1 = 4a,
donc n ≡ 3 mod 4 .
Il reste un signe à déterminer. Pour cela, considérons det A. C’est le produit des racines du
polynôme caractéristique, comptées avec leurs multiplicités. La factorisation (28) donne donc,
compte tenu de l’égalité (30) :
√
det A = ( n)a+b+c+d (−1)b+d i c+d = (−1)b+d nn/2 ic+d ,
a+b =
et l’on en tire :
det A
= (−1)b+d i c+d .
|det A|
À la question 4, nous avons montré que det A = in(n−1)/2 t, où t est un nombre réel strictement positif. Vu l’égalité précédente, on en déduit que in(n−1)/2 = (−1)b+d i c+d , c’est-àdire in(n−1)/2 = i2b+c+3d . Comme i est une racine quatrième primitive de l’unité, l’égalité
précédente équivaut à la congruence suivante :
2b + c + 3d ≡ n(n − 1)/2 mod 4,
soit 2b + c − d ≡ n(n − 1)/2 mod 4.
(34)
C’est le renseignement précieux qui va nous permettre de terminer le calcul ! Distinguons deux
cas, suivant le reste de la division de n par 4 .
Supposons d’abord que n soit congru à 1 modulo 4 . Nous avons vu qu’alors nécessairement c = d et a − b = ε , avec ε = ±1 . Vu les égalités (32), on en tire :
n + 1 + 2ε
n + 1 − 2ε
n−1
, b =
et c = d =
·
4
4
4
Maintenant, la congruence (34) s’écrit (n + 1 − 2ε)/2 ≡ n(n − 1)/2 mod 4 , ce qui équivaut
à n+1−2ε ≡ n(n−1) mod 8 , ou encore à (n−1)2 ≡ 2(1−ε) mod 8 . Or n−1 est multiple
de 4 , donc (n − 1)2 est multiple de 16 . D’où 2(1 − ε) ≡ 0 mod 8 , ce qui impose ε = 1 .
√
√
√
L’égalité (31) s’écrit alors G(n) = n(a − b) = ε n, d’où G(n) = n.
Supposons enfin que n soit congru à 3 modulo 4 . Nous avons vu qu’alors nécessairement a = b et c − d = ε , avec ε = ±1 . Vu les égalités (32), on en tire :
a =
n+1
n − 1 + 2ε
n − 1 − 2ε
, c =
et d =
·
4
4
4
Maintenant, la congruence (34) s’écrit (n + 1 + 2ε)/2 ≡ n(n − 1)/2 mod 4 , ce qui équivaut
à n+1+2ε ≡ n(n−1) mod 8 , ou encore à (n−1)2 ≡ 2(1+ε) mod 8 . Cette fois, n−1 est
a = b =
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
98
multiple de 2 mais pas de 4 , donc son carré est multiple de 4 mais pas de 8 . D’où 2(1+ε) 6≡ 0
√
√
mod 8 , ce qui impose encore ε = 1 . L’égalité (31) s’écrit alors G(n) = i n(c − d) = εi n,
√
d’où G(n) = i n.
Nous avons obtenu le résultat escompté. Si n est impair, on a :
(√
n si n ≡ 1 mod 4
G(n) =
√
i n si n ≡ 3 mod 4.
Signalons que l’on peut aussi calculer la somme de Gauss G(n) lorsque n est pair, mais par
√
d’autres méthodes. On trouve G(n) = n(1 + i) lorsque n ≡ 0 mod 4 et G(n) = 0
lorsque n ≡ 2 mod 4 .
I.5.26 Le programme ci-après se déduit de la proposition 45 de la page 251 et de sa preuve. Il fait
appel aux procédures auxiliaires suivantes :
- dérive(P), qui rend la dérivée du polynôme P ;
- subst(P,M), qui rend le résultat de la substitution de la matrice carrée M à X dans le
polynôme P ;
- pgcd(P,Q), qui rend le pgcd unitaire des deux polynômes non nuls P, Q ;
- bézout(P,Q), qui rend le vecteur [U, V ], où U, V sont les polynômes vérifiant U P + V Q = pgcd(P, Q), deg U < deg Q et deg V < deg P , P et Q étant
des polynômes non nuls ;
- Faddeev(M), qui rend le polynôme caractéristique de la matrice carrée M (cf. l’exercice I.5.3 de la page 256) ;
- ceil(x), qui rend le plus petit entier supérieur ou égal au nombre réel x.
Dunford(M)
n := taille(M); (*nombre de lignes et de colonnes de M*)
m := ceil(ln(n)/ln(2));(*plus petit entier tel que 2^m >= n*)
P := Faddeev(M); (*polynôme caractéristique de M*)
T := P/pgcd(P,dérive(P)); T’ := dérive(T);
b := bézout(T,T’);
U := b[1]; V := b[2]; (*coefficients de Bézout de T et T’*)
A := M;
pour k de 1 à m
A := A-subst(T,A)*inverse(subst(T’,A));
D:= A; N := M-D;
rendre(D,N)
I.5.27 Soit A := D + N la décomposition de Dunford de A. Montrons d’abord que D est
inversible. C’est en fait une conséquence immédiate de l’exercice I.5.21 de la page 258, qui
dit que det(D) = det(A). Raisonnons directement, en utilisant la partie facile de l’exercice
en question. Identifions A à l’endomorphisme de K n qui lui est canoniquement associé, et
de même pour D et N . Raisonnons par l’absurde, en supposant Ker D non nul. Puisque D
et N commutent, N laisse stable Ker D . La restriction de N à Ker D est nilpotente, donc
non injective. Le noyau de cette restriction n’est donc pas nul. C’est absurde, car ce noyau est
inclus dans Ker A = {0} .
Puisque D est inversible, A s’écrit A = D(In + D−1 N ). Posons N1 = D−1 N . C’est une
matrice nilpotente, parce que N est nilpotente et commute avec D , donc aussi avec D−1 . Les
c Dunod 2014
I.5 : Réduction des matrices
99
matrices D et N1 commutent, et A = D(In + N1 ). Le couple (D, In + N1 ) répond donc à
la question.
Pour l’unicité, soient D′ , N1′ deux matrices qui commutent, supposons que D′ soit diagonalisable, que N1′ soit nilpotente et que A = D′ (In + N1′ ). Puisque D′ et N1′ commutent, D′ N1′
est nilpotente et commute avec D′ . Ainsi les matrices D′ et D′ N1′ ont les propriétés suivantes :
elles commutent, la première est diagonalisable, la deuxième est nilpotente, etleur somme
est A. En vertu de l’unicité du couple (D, N ) (cf. le théorème 44 de la page 250), D′ = D
et D′ N1′ = N = DN1 , d’où N1′ = N1 .
I.5.28 Nous savons déjà que, si A et B sont semblables, elles ont même polynôme caractéristique et même polynôme minimal. Il s’agit d’établir la réciproque. Autrement dit, nous devons
démontrer que la classe de similitude C de A est entièrement déterminée par χA et µA . Il
faut remarquer que c’est vrai lorsque n 6 3 , mais faux dès que n > 4 , comme l’exemple de
la page 249 le montre (si n > 5 , on « complète »avec des 0 ). D’après le théorème 47 de la
page 254, nous pouvons supposer que A est un tableau diagonal de blocs de Jordan, comme
dans le théorème :
A := Diag Jr1 (λ1 ), . . . , Jrm (λm ) .
(35)
Rappelons que les ri sont des entiers strictement positifs, dont la somme doit être égale à n,
et que les λi sont des éléments de K , non nécessairement distincts. L’idée est de calculer χA
et µA à partir d’une telle écriture de A. Ce calcul est facile, à cause des deux points suivants.
a) Le polynôme caractéristique et le polynôme minimal d’un bloc de Jordan Jr (λ) sont tous
les deux égaux à (X − λ)r , comme nous l’avons démontré au début de la section 3.4 de la
page 253.
b) Compte tenu du point a), la proposition 19 de la page 227 donne ceci :
b1) le polynôme caractéristique de A est le produit des (X − λi )ri ;
b2) le polynôme minimal de A est le ppcm des (X − λi )ri .
Voici ce que nous devons démontrer : si n vaut 1, 2 ou 3 , la suite (r1 , λ1 ), . . . , (rm , λm ) est
entièrement déterminée, à l’ordre près, par les deux polynômes :
χ :=
m
Y
i=1
(X − λi )ri
et µ := ppcm (X − λ1 )r1 , . . . , (X − λm )rm .
(36)
Il suffit alors d’examiner les différents cas pour la suite ξ := (r1 , λ1 ), . . . , (rm , λm ) .
Cas n = 1 .
Il n’y a guère le choix : ξ := (1, λ1 ) , A := (λ1 ) et χA = µA = X − λ1 . La classe C est
réduite à {A} , elle est caractérisée par λ1 . D’où la conclusion lorsque n := 1 .
Cas n = 2 , ξ := (2, λ1 ) .
Ici, χA = µA = (X − λ1 )2 .
Cas n = 2 , ξ := (1, λ1 ), (1, λ1 ) .
Alors A := λ1 I2 , χA = (X − λ1 )2 et µA = X − λ1 .
Cas n = 2 , ξ := (1, λ1 ), (1, λ2 ) , avec λ1 6= λ2 .
Ici, χA = µA = (X − λ1 )(X − λ2 ) a deux racines distinctes.
Lorsque n = 2 , les trois cas obtenus montrent que le couple (χA , µA ) détermine la suite ξ .
Cas n = 3 , ξ := (3, λ1 ) .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
100
Ici, χA = µA = (X − λ1 )3 .
Cas n = 3 , ξ := (2, λ1 ), (1, λ1 ) .
Alors χA = (X − λ1 )3 et µA = (X − λ1 )2 .
Cas n = 3 , ξ := (1, λ1 ), (1, λ1 ), (1, λ1 ) .
Alors A := λ1 I3 , χA = (X − λ1 )3 et µA = X − λ1 .
Cas n = 3 , ξ := (1, λ1 ), (1, λ2 ), (1, λ3 ) , où λ1 , λ2 , λ3 sont distincts.
Ici, χA = µA = (X − λ1 )(X − λ2 )(X − λ3 ) a trois racines distinctes.
Cas n = 3 , ξ := (2, λ1 ), (1, λ2 ) , avec λ1 6= λ2 .
Ici, χA = µA = (X − λ1 )2 (X − λ2 ) a une racine double et une racine simple.
Cas n = 3 , ξ := (1, λ1 ), (1, λ1 ), (1, λ2 ) , avec λ1 6= λ2 .
Alors χA = (X − λ1 )2 (X − λ2 ), mais µA = (X − λ1 )(X − λ2 ).
Lorsque n = 3 , les six cas obtenus montrent encore que le couple (χA , µA ) détermine la
suite ξ .
I.5.29 Le calcul donne χA = X 4 − 2X 2 + 1 = (X 2 − 1)2 = (X − 1)2 (X + 1)2 . Pour le
vérifier, soit on calcule effectivement un déterminant d’ordre 4 , soit on applique la méthode
de Faddeev-Le Verrier (cf. la proposition 33 de la page 241). Il y a donc deux valeurs propres
doubles : λ1 := 1 et λ2 := −1 . À ce stade, on ne sait pas si A est diagonalisable ou non.
Notons B := (e1 , e2 , e3 , e4 ) la base canonique de E := C4 et u l’endomorphisme de C4
canoniquement associé à A. Déterminons les projecteurs spectraux π1 , π2 et les matrices spectrales Π1 , Π2 associées à λ1 , λ2 respectivement. Pour cela, appliquons la proposition 35 de la
page 243 (comme dans l’exercice 10 de la page 244). On décompose χA en éléments simples.
Le calcul donne :
1
1
1
1
1
1
=
−
+
+
(X − 1)2 (X + 1)2
4 (X − 1)2
X − 1 (X + 1)2
X +1
1 −X + 2
X +2
=
+
·
4 (X − 1)2
(X + 1)2
Avec les notations de la proposition citée, B1 := (−X + 2)/4 , T1 := (X + 1)2 ,
puis B2 := (X + 2)/4 , T2 := (X − 1)2 . D’où :


3 −2
2 −2
 −2
1
5 −4
3 
 et
Π1 = (A + I4 )2 (2I4 − A) = 
 1
3 −2
1 
4
6 −4
4 −4


−2
2 −2
2
 2 −4
1
4 −3 
.
Π2 = (A − I4 )2 (2I4 + A) = 

−1
−3
3 −1 
4
−6
4 −4
5
Arrivés à ce point, la décomposition A = D + N de Dunford de A nous tend les bras. Compte
tenu de la preuve du théorème 43 de la page 249, comme dans l’exercice 13 de la page 250, on
c Dunod 2014
I.5 : Réduction des matrices
a D = λ1 Π1 + λ2 Π2 = Π1 − Π2 = 2Π1 − I4 (car Π1 + Π2 = I4 ), soit :



3 −2
2 −2
5 −4
4 −4
 −2

 −4
5
−4
3
9
−8
6
 − I4 = 
D = 2
 1
 2
3 −2
1 
6 −5
2
6 −4
4 −4
12 −8
8 −9


−4 −1 0
1
 8
2 0 −2 
.
N = A−D = 
 4
1 0 −1 
−8 −2 0
2
101


,

puis
Puisque N 6= 0 , A n’est pas diagonalisable. Notons d et ν les endomorphismes de E canoniquement associés à D et N respectivement, de sorte que la décomposition de Dunford
de u est donnée par u = d + ν . Il est visible sur la matrice N (dont les quatre colonnes sont
proportionnelles) que l’image de ν est la droite Cε2 , où ε2 := e1 − 2e2 − e3 + 2e4 . Cette
droite est stable par u , parce que u et ν commutent, c’est donc une droite propre de u . On
vérifie que u(ε2 ) = ε2 . Que pouvons-nous en déduire ?
Notons E1 et E 1 respectivement le sous-espace propre et le sous-espace caractéristique de u
associés à la valeur propre 1 , de même pour E−1 et E −1 . Puisque E 1 et E −1 sont stables
par ν , l’image de ν est somme directe des images des endomorphismes induits (par ν ) sur
ces deux espaces. Comme Im ν ⊂ E1 ⊂ E 1 , nécessairement ν induit sur E −1 l’endomorphisme nul. Cela signifie que u et d coïncident sur E −1 , c’est-à-dire que E −1 = E−1 . Pour
les mêmes raisons, E 1 6= E1 , donc E1 = Cε2 . Nous avons déterminé les espaces propres
de u : ce sont Cε2 et E −1 . Une base de E −1 est (ε3 , ε4 ), en posant ε3 := e2 + 2e3 + e4
et ε4 := 2e1 −4e2 −3e3 +4e4 . Pour E 1 , il doit exister un vecteur ε1 ∈ E 1 tel que ν(ε1 ) = ε2 ,
soit u(ε1 ) = ε1 + ε2 . On peut prendre ε1 := −(e2 + e3 ). Alors (ε1 , ε2 ) est une base de E 1 ,
et C := (ε1 , ε2 , ε3 , ε4 ) est une base de E .
Nous connaissons maintenant la matrice de u dans la base C . En effet, u(ε1 ) = ε1 + ε2 , u(ε2 ) = ε2 , u(ε3 ) = −ε3 et u(ε4 ) = −ε4 , d’où :


1 0
0
0
 1 1
0
0 
 := M.
MatC (u) = 
 0 0 −1
0 
0 0
0 −1
Cette matrice est une réduite de Jordan de A, en fait M = J2 (1), J1 (−1), J1 (−1) . La
matrice A est semblable à M , plus précisément, A = P M P −1 , où P est la matrice de
passage de la base B à la base C . On a :




−4 −1
0
1
0
1 0
2
 3 −2
 −1 −2 1 −4 
2 −2 
−1

.
= 
P = 
 −2
 −1 −1 2 −3  et P
0
0
1 
0
2 1
4
−1
1 −1
1
I.5.30 Le polynôme caractéristique et le polynôme minimal de A ont déjà été déterminés dans
l’exercice I.5.28 de la page 259. Plus précisément, considérons une réduite de Jordan M de A :
M := Diag Jr1 (λ1 ), . . . , Jrm (λm ) .
(37)
Rappelons que les ri sont des entiers strictement positifs, dont la somme doit être égale à n, et
que les λi sont des éléments de C, non nécessairement distincts. Le polynôme caractéristique χ
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
102
et le polynôme minimal µ de A (ou de M , qui lui est semblable) sont donnés par les formules
(36) de la page 99.
Déterminons donc les dimensions des espaces propres de A. Notons u l’endomorphisme
de E := Cn canoniquement associé à M . Le fait que M soit diagonale par blocs correspond à une décomposition de E en somme directe de sous-espaces vectoriels stables
par u : E = E1 ⊕ E2 ⊕ · · · ⊕ Em . Ainsi, E1 est le sous-espace de E engendré par les r1
premiers vecteurs de la base canonique B de E , E2 est engendré par les r2 vecteurs suivants,
et ainsi de suite. Pour chaque i , l’endomorphisme ui de Ei induit par u a pour matrice Jri (λi )
dans la base Bi correspondante ( B est obtenue par juxtaposition des Bi ).
Soit maintenant t ∈ C. La décomposition en somme directe ci-dessus donne évidemment :
Ker(u − t IdE ) =
m
M
i=1
Ker(ui − t IdEi ).
Au niveau des dimensions, on en déduit la formule suivante :
dim Ker(u − t IdE ) =
m
X
i=1
dim Ker(ui − t IdEi ).
Il nous suffit donc, étant donnés un entier r > 1 et deux nombres complexes λ, t, de calculer
la dimension d du noyau de Jr (λ) − tIr . Notons ici (e1 , . . . , er ) la base canonique de Cr et v
l’endomorphisme de Cr canoniquement associé à Jr (λ). Si t 6= λ, t n’est pas valeur propre
de v , car λ est la seule valeur propre de Jr (λ). Dans ce cas, d = 0 .
Supposons que t := λ. Alors Jr (λ) − λIr est, par définition, la matrice Jr définie par
la formule (27) de la page 248. Soit w := v − λ IdCr . Par définition, w(ej ) = ej+1
si j = 1, . . . , r − 1 et w(er ) = 0 . En fait, la forme même de la matrice Jr montre que
son rang est r − 1 , donc le noyau de w est une droite vectorielle (théorème du rang), c’est-àdire Ker w = Cer . Dans ce cas, d = 1 . Compte tenu de la formule ci-dessus portant sur les
dimensions, on obtient ceci :
dim Ker(A − t In ) = card i ∈ [[1, m]] | λi = t .
Autrement dit, pour toute valeur propre λ de A, la dimension de l’espace propre associé est le
nombre de blocs correspondant à λ, i.e. le nombre d’indices i tels que λi = λ.
I.5.31 Si A est semblable à la matrice compagnon CP d’un polynôme unitaire P de degré n > 1 , χA = χCP et µA = µCP . Or, la proposition 21 de la page 228 montre
que χCP = P = µCP , donc χA = µA .
Supposons inversement que χA = µA . Reprenons les notations de l’exercice précédent.
Compte tenu des formules (36) de la page 99, l’égalité χA = µA se traduit ainsi :
m
Y
i=1
(X − λi )ri = ppcm (X − λ1 )r1 , . . . , (X − λm )rm .
Soit λ ∈ C. L’exposant de X − λ dans le premier membre de cette égalité est la somme
des mi , pour tous les indices i tels que λi = λ. D’un autre côté, le calcul d’un ppcm montre
que l’exposant de X − λ dans le deuxième membre est le maximum des mi , pour tous les
indices i tels que λi = λ. L’égalité de ces deux entiers n’est possible, puisque les mi sont
des réels (et même des entiers) strictement positifs, que s’il n’existe qu’un seul indice i tel
que λi = λ. Cela revient évidemment à dire que les λi sont deux à deux distincts.
c Dunod 2014
I.5 : Réduction des matrices
Posons maintenant P := χA =
103
r
Q
(X − λi )mi . Dans l’exercice 16 de la page 255, nous avons
i=1
montré que la matrice M définie par l’égalité (37) de la page 101 est précisément une réduite
de Jordan de CP Le théorème 47 de la page 254 montre alors que A est semblable à CP .
I.5.32 Considérons le polynôme P := X k − (ak−1 X k−1 + · · · + a1 X + a0 ) associé à la relation de récurrence linéaire (R) donnée. Soit E le sous-espace vectoriel de CN formé des
suites complexes satisfaisant la relation (R). Nous savons que E est de dimension k . Plus précisément, rappelons les résultats obtenus dans la section 3.1 de la page 242. Commençons par
factoriser P :
P = (X − α1 )k1 (X − α2 )k2 · · · (X − αm )km ,
où α1 , . . . , αm ∈ C sont distincts et les ki appartiennent à N∗ . Une base de E est alors
formée des suites (nj αni )n>0 , pour tous les couples (i, j) vérifiant les conditions 1 6 i 6 m
et 0 6 j 6 mi − 1 . Pour un tel couple (i, j), la suite correspondante est bornée si, et seulement
si, ou bien |αi | < 1 (auquel cas la suite converge vers 0 ), ou bien |αi | := 1 et j := 0 . Les
suites en question formant une base de E , on obtient la conclusion ci-dessous.
Conclusion : pour que toute suite satisfaisant la relation de récurrence (R) soit bornée, il faut,
et il suffit, que :
1. toute racine du polynôme P soit de module au plus égal à 1 ;
2. toute racine de module 1 de P soit simple.
I.5.33 Nous allons en fait montrer que les conditions suivantes (portant sur u ) sont équivalentes :
1. Il n’y a qu’un nombre fini de sous-espaces vectoriels de E stables par u .
2. Pour chaque valeur propre λ de u , l’espace propre Eλ (u) est de dimension 1 .
3. Si l’on applique le théorème de Jordan (théorème 46 de la page 253) à u , il n’y a qu’un
seul bloc correspondant à une valeur propre donnée.
4. Dans une base convenable, la matrice de u est la matrice compagnon d’un polynôme
unitaire non constant.
5. Il existe un vecteur x de E tel que la famille x, u(x), u2 (x), . . . , un−1 (x) soit une
base de E .
6. Le polynôme caractéristique et le polynôme minimal de u sont égaux.
Commençons par une remarque simple : tout sous-espace vectoriel d’un espace propre
de u est stable par u . En effet, si λ ∈ sp u et si V est un sous-espace vectoriel
de Eλ (u), u(x) = λx ∈ V pour tout x ∈ V , donc u(V ) ⊂ V . Il en découle que, si l’un
des sous-espaces propres Eλ (u) de u est de dimension au moins égale à 2 , il y a une infinité
de sous-espaces de E stables par u . En effet, Eλ (u) contient alors une infinité de droites, et
chacune d’elles est stable par u . Par contraposition, cela prouve l’implication 1 =⇒ 2.
L’équivalence 2 ⇐⇒ 3 découle du résultat de l’exercice I.5.30 de la page 259 disant que, pour
toute valeur propre λ de u , la dimension de Eλ (u) est le nombre d’indices i ∈ [[1, m]] tels
que λi = λ.
Implication 3 =⇒ 4. Appliquons donc le théorème de Jordan (théorème 46 de la page 253),
en en reprenant les notations. La matrice de u dans la base B est alors la matrice diagonale
par blocs A := Diag Jr1 (λ1 ), . . . , Jrm (λm ) . Par hypothèse, les λi sont deux à deux distincts (ce qui, rappelons-le, n’est pas toujours le cas). Notons P le polynôme caractéristique
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
104
de A. La factorisation de P est donnée par la formule suivante (cf. par exemple l’exercice
l’exercice I.5.28 de la page 259 ou l’exercice I.5.30 de la page 259) :
P = (X − λ1 )r1 (X − λ2 )r2 · · · (X − λm )rm .
Dans l’exercice 16 de la page 255, nous avons montré que la matrice A est précisément une
réduite de Jordan de la matrice compagnon CP du polynôme P . Le théorème 47 de la page 254
montre alors que A est semblable à CP .
L’équivalence 4 ⇐⇒ 6 a été établie dans l’exercice I.5.31 de la page 259.
L’implication 4 =⇒ 5 est évidente. Soit en effet B := (e1 , . . . , en ) une base de E dans
laquelle la matrice de u soit la matrice compagnon d’un polynôme unitaire P (de degré n).
Par définition, u(ej ) = ej+1 pour tout j ∈ [[1, n − 1]], donc B = e1 , u(e1 ), . . . , un−1 (e1 ) .
Il reste l’implication 5 =⇒ 1, partie substantielle de l’exercice. Soit donc x un vecteur de E tel
que B := x, u(x), u2 (x), . . . , un−1 (x) soit une base de E . Soit f : C[X] → E l’application
(linéaire) Q 7→ Q(u)(x). Elle est surjective, car uj (x) = f (X j ) pour tout j ∈ [[0, n − 1]].
Le point important est que, si V est un sous-espace vectoriel de E stable par u , son image
réciproque f −1 (V ) est non seulement un sous-espace vectoriel, mais un idéal de C[X]. En
effet, si Q ∈ C[X] et R ∈ f −1 (V ), on a :
f (QR) = (QR)(u)(x) = Q(u) ◦ R(u) (x) = Q(u) R(u)(x) = Q(u) f (R) .
Par hypothèse, f (R) ∈ V et V est stable par u , donc par Q(u), d’où f (QR) ∈ V ,
soit QR ∈ f −1 (V ).
En particulier, le noyau de f est un idéal de C[X], et le lemme 20 de la page 228 montre
qu’il existe un unique polynôme unitaire P tel que Ker f = (P ). De plus, P est de degré n
car, avec les notations de ce lemme, Eu,x = E . Soit alors V un sous-espace de E stable
par u . L’idéal f −1 (V ) de C[X] contient Ker f = (P ). Il existe donc un unique polynôme
unitaire PV tel que f −1 (V ) = (PV ), et ce polynôme PV divise P .
Nous pouvons maintenant conclure. Nous avons construit une application V 7→ PV de l’ensemble des sous-espaces de E stables par u dans l’ensemble des diviseurs unitaires de P .
Cette application est injective. Soient en effet V, W deux sous-espaces de E stables par u tels
que PW = PW , c’est-à-dire f −1 (V ) = f −1 (W ). Puisque f est surjective, V = f f −1 (V ) ,
de même W = f f −1 (W ) , donc V = W . Comme l’ensemble des diviseurs unitaires de P
est fini, l’ensemble des sous-espaces de E stables par u est fini, ce qui achève la preuve de
l’implication 5 =⇒ 1.
I.5.34 Quitte à remplacer A par b−1 A (il est équivalent de diagonaliser l’une ou l’autre de ces
matrices), nous pouvons supposer que b := 1 , ce qui allègera un peu les calculs. Il s’agit de
prouver l’existence d’une base de Cn formée de vecteurs propres de A et d’expliciter une telle
base. Nous allons voir que la matrice A possède n valeurs propres distinctes, ce qui montrera
qu’elle est diagonalisable. Ce point pourrait être établi en calculant le polynôme caractéristique χA de A, mais il faudrait ensuite, de toutes façons, résoudre certains systèmes linéaires
pour trouver effectivement les vecteurs propres de A. Le plus logique est donc d’étudier ces
systèmes linéaires directement.
Considérons donc un vecteur colonne X ∈ Cn et posons Y := AX . Les coordon-
c Dunod 2014
I.5 : Réduction des matrices
105
nées y1 , . . . , yn de Y sont données en fonction des coordonnées x1 , . . . , xn par les formules :

y1 = x2





y2 = ax1 + x3





. . . . . . . . . . . . . . . . . . .
yk = axk−1 + xk+1



...................





y

n−1 = axn−2 + xn


yn = axn−1 .
Soit maintenant λ un nombre complexe donné. L’égalité Y = λX équivaut au système :


−λx1 + x2 = 0



ax1 − λx2 + x3 = 0





........................
(Sλ ) : axk−1 − λxk + xk+1 = 0



........................





axn−2 − λxn−1 + xn = 0



axn−1 − λxn = 0 .
Par définition, ce système possède une solution non triviale si, et seulement si, λ est valeur
propre de A. On remarquera aussi que, si X 6= 0 est solution de ce système, x1 n’est pas nul
(sinon tous les xk seraient nuls). Si X et λ sont donnés, posons x0 := 0 et xn+1 := 0 . Les n
équations constituant le système (Sλ ) s’écrivent alors de façon plus agréable :
xk+2 − λxk+1 + axk = 0
(k = 0, 1, . . . , n − 1).
Cela suggère, lorsque λ est donné, de s’intéresser aux suites (uk )k>0 vérifiant la relation de
récurrence linéaire d’ordre 2 suivante :
(Rλ ) : uk+2 = λuk+1 − auk
pour tout k ∈ N.
Le polynôme associé à cette relation de récurrence linéaire est P := X 2 − λX + a.
Restreignons-nous (parce que cela suffira pour la suite) au cas où ce polynôme a deux racines
distinctes r, s (non nulles parce que a 6= 0 ), autrement dit supposons λ2 6= 4a. La forme
générale d’une suite (uk ) vérifiant la relation de récurrence (Rλ ) est alors donnée par la formule uk := αrk + βsk , où α, β ∈ C sont arbitraires. Par ailleurs, une telle suite (uk ) est
entièrement déterminée par la donnée de u0 et u1 (conditions initiales). Vu le contexte, impo
sons les conditions u0 := 0 et u1 6= 0 . On obtient les suites α(rk − sk ) k>0 , où α ∈ C∗
est arbitraire. Le contexte impose aussi la condition un+1 := 0 , c’est-à-dire rn+1 = sn+1 .
Comme s 6= r , cela signifie que z := r/s doit être une racine (n + 1) ème de l’unité distincte
de 1 . N’oublions pas que la somme et le produit de r et s sont connus : r + s = λ et rs = a,
soit λ = s(1 + z) et zs2 = a.
Arrivés à ce stade, nous pouvons déterminer les éléments propres (valeurs propres
et vecteurs propres) de A. Pour simplifier, notons t l’une des deux racines carrées
de a et posons θ := π/(n + 1). Considérons un entier p ∈ [[1, n]] fixé, et posons z := e2piθ , de sorte que z est une racine n + 1 ème de l’unité distincte de 1 . Posons
ensuite s := te−piθ , r := zs = tepiθ , puis λp := r + s = 2t cos(pθ). Ainsi r 6= s, et r, s
sont les deux racines de l’équation x2 − λp x + a = 0 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
106
La suite (rk −sk )k>0 , c’est-à-dire 2itk sin(kpθ) k>0 , vérifie la relation de récurrence (Rλp ),
et ses termes d’indices 0 et n + 1 sont nuls. Autrement dit, le vecteur Xp ∈ Cn de coordonnées tk sin(kpθ) ( k = 1, . . . , n) est solution du système (Sλp ), ce qui signifie que λp est une
valeur propre de A et que Xp et un vecteur propre de A associé à λp . Lorsque p décrit [[1, n]],
les λp = 2t cos(pθ) sont deux à deux distincts. Nous aboutissons aux conclusions suivantes
(rappelons que nous avons supposé que b := 1 et que t est une racine carrée de a) :
2.
La
matrice
A
possède
n
valeurs
voir λp := 2t cos pπ/(n + 1) , p = 1, . . . , n.
3.
La famille (X1 , . . . , Xn ) est une base de Cn .
1.
propres
distinctes,
à
sa-
Pour p ∈ [[1, n]], soit Xp ∈ Cn le vecteur de coordonnées tk sin kpπ/(n + 1)
( k = 1, . . . , n). Alors Xp est un vecteur propre de A associé à la valeur propre λp .
Nous avons ainsi diagonalisé la matrice A.
Terminons par une remarque. Connaissant les valeurs propres de A, nous connaissons du même
coup le polynôme caractéristique de A :
n Y
pπ
χA =
X − 2t cos
= tn Un X/(2t) ,
n+1
p=1
où Un est le n ème polynôme de Tchebychev de deuxième espèce. Nous avons rencontré ces
polynômes Un dans le module II.6 de [L1], ils interviendront dans le module « Polynômes
orthogonaux » de [L2-L3]. D’autre part, faisons varier n et notons alors An la matrice donnée dans l’énoncé. Soit Dn le polynôme caractéristique de An . En développant le déterminant définissant Dn par rapport à une ligne, on obtient facilement (le vérifier) la relation de
récurrence Dn = XDn−1 − abDn−2 (on pose D0 := 1 et D1 := X ). Cette relation de récurrence est équivalente à celle que vérifient les Un (cf. le module « Polynômes orthogonaux »
de [L2-L3]) : Un = 2XUn−1 − Un−2 .
I.5.35 La nécessité est évidente : si A et B sont semblables, il en est de même pour (A − λIn )k
et (B − λIn )k , qui ont par conséquent même rang, ceci quel que soit le couple (λ, k). Pour la
réciproque, supposons désormais que, pour tout couple (λ, k), (A−λIn )k et (B −λIn )k aient
même rang. Il s’agit de montrer que A et B sont semblables. Dans cette situation, on peut bien
sûr remplacer A par une matrice semblable, cela ne change pas les rangs concernés. En vertu
du théorème de Jordan (théorème 47 de la page 254), nous pouvons donc supposer que A (et
de même B ) est une matrice diagonale par blocs du type A := Diag Jr1 (λ1 ), . . . , Jrm (λm ) ,
comme dans l’énoncé du théorème. L’idée est de montrer deux choses :
1.
2.
Pour chaque couple (λ, k), le rang de (A − λIn )k se calcule simplement en fonction de
la suite ξ := (r1 , λ1 ), . . . , (rm , λm ) .
La suite ξ , à l’ordre près, est bien déterminée par la connaissance de tous ces rangs.
La conclusion résultera alors du théorème de Jordan cité, disant que la suite ξ caractérise la
matrice A, à similitude près.
Commençons par observer que, si M := Diag(M1 , . . . , Mm ) est une matrice diagonale par
blocs, le rang de M est la somme des rangs des Mi . Nous laissons le lecteur vérifier ce point par
un raisonnement purement matriciel. En termes d’endomorphismes, ce résultat se traduit ainsi.
Soient E un espace vectoriel (de dimension finie) et u ∈ L(E). Supposons que E soit somme
c Dunod 2014
I.5 : Réduction des matrices
107
directe de sous-espaces vectoriels E1 , . . . , Em stables par u . Pour chaque i , soit ui ∈ L(Ei )
l’endomorphisme induit par u . Alors le rang de u est la somme des rangs des ui . Sous cette
forme, le résultat est évident, car Im u est la somme (directe) des Im ui pour i = 1, . . . , m.
Pour prouver le point 1 (et expliciter son résultat), l’alinéa précédent ramène au cas d’un bloc
de Jordan. Étant donnés un entier k > 1 et deux nombres λ, µ ∈ C, il s’agit de calculer
k
le rang de la matrice Jr (µ) − λIr . Si µ 6= λ, ce rang vaut r car, la seule valeur propre
de Jr (µ) étant λ, Jr (µ) − λIr est inversible, par définition d’une valeur propre. Supposons
que µ = λ, de sorte que Jr (λ) − λIr est la matrice Jr . Dans ce cas, le rang de Jrk est donné
par l’exercice 12 de la page 248. D’après cet exercice, la dimension du noyau de la matrice Jrk
(ou plutôt de l’endomorphisme de Cr qui lui est canoniquement associé) est min(k, r). En
vertu du théorème du rang, le rang de Jrk est donc r − min(k, r) = max(0, r − k). Nous avons
obtenu la formule générale :
(
k
r si λ 6= µ,
rang Jr (µ) − λIr
=
max(0, r − k) si λ = µ.
On peut écrire cette formule ainsi :
r − rang Jr (µ) − λIr
k
=
(
0 si λ 6= µ,
min(r, k) si λ = µ.
Revenons à A. Puisque n est la somme des ri , l’alinéa précédent et la formule ci-dessus
donnent :
X
n − rang(A − λIn )k =
min(ri , k),
λi = λ
la somme portant sur tous les indices i ∈ [[1, m]] tels que λi = λ. Nous avons réalisé la partie
1 du programme.
Comment maintenant récupérer la suite ξ à partir de tous ces rangs ? L’idée est simple.
Fixons λ ∈ C. Pour tout k ∈ N, posons pour simplifier uk := n−rang(A−λIn )k . En fonction
des uk , nous voulons déterminer à l’ordre près la famille formée des ri , indexée par l’ensemble
des i ∈ [[1, m]] tels que λi = λ. À l’ordre près, nous supposerons que cet ensemble est [[1, p]],
p
P
avec r1 > r2 > · · · > rp > 1 . Pour tout k , la formule ci-dessus s’écrit : uk =
min(ri , k).
i=1
Si k > 1 et i sont donnés, la différence min(ri , k) − min(ri , k − 1) vaut 1 si ri > k et 0
si ri < k . En sommant par rapport à i , il vient :
uk − uk−1 = card i ∈ [[1, p]] | ri > k
pour tout k > 1.
Remplaçons encore k par k + 1 et soustrayons :
2uk − (uk+1 + uk−1 ) = card i ∈ [[1, p]] | ri > k − card i ∈ [[1, p]] | ri > k + 1
= card i ∈ [[1, p]] | ri = k
pour tout k > 1.
En revenant à la suite ξ , on voit qu’elle est entièrement déterminée par les divers rangs. Plus
précisément, si λ ∈ C et k ∈ N∗ sont arbitrairement donnés, le nombre d’indices i ∈ [[1, m]]
tels que λi = λ et ri = k est :
rang(A − λIn )k+1 + rang(A − λIn )k−1 − 2 rang(A − λIn )k .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
108
I.5.36 Donnons deux solutions, l’une algébrique et l’autre « topologique ». Le fait que C(A) soit
une sous-algèbre de Mn (C) est évident. C’est un sous-espace vectoriel de Mn (C) parce que
l’application M 7→ AM − M A de Mn (C) dans Mn (C) est linéaire. Il est immédiat que
le produit de deux matrices commutant avec A commute avec A, et enfin In ∈ C(A). Par
ailleurs, A ∈ C(A), donc C(A) contient la sous-algèbre de Mn (C) engendrée par A, c’està-dire C[A].
Supposons ensuite que A, B ∈ Mn (C) soient semblables, et soit P ∈ GLn (C) telle
que B := P AP −1 . L’application M 7→ P M P −1 est un automorphisme de l’algèbre Mn (C),
elle applique donc C(A) sur C(B), ce qui fait que dim C(A) = dim C(B). La solution algébrique consiste à dire, vu ce qui précède et en vertu du théorème de Jordan, qu’il suffit de
traiter le cas où A est une matrice diagonale par blocs A := Diag(A1 , . . . , Am ), chaque Ai
étant un bloc de Jordan : Ai = Jri (λi ) ( ri ∈ N∗ , λi ∈ C). Si l’on considère pour tout i une
matrice Mi ∈ C(Ai ), il est clair que la matrice M = Diag(M1 , . . . , Mn ) appartient à C(A).
L’application (M1 , . . . , Mm ) 7→ M de C(A1 ) × C(A2 ) × · · · × C(Am ) étant linéaire et inm
P
jective, on en déduit l’inégalité dim C(A) >
dim C(Ai ). Puisque n est la somme des ri ,
i=1
il suffit de prouver pour tout i l’inégalité dim C(Ai ) > ri .
Nous sommes ainsi ramenés au cas où A := Jr (λ), avec r ∈ N∗ et λ ∈ C. Nous savons
que le polynôme minimal de A est (X − λ)r (cf. la section 3.4 de la page 253). Nous savons
aussi que, pour toute matrice carrée A, la dimension de C[A] est égale au degré du polynôme
minimal de A (cf. la section 1.3 de la page 220). Dans le cas présent, on a donc dim C[A] = r ,
d’où dim C(A) > dim C[A] = r , comme désiré. En fait, il se trouve ici que C(A) = C[A],
ce qui n’est pas toujours vrai, mais peu importe.
La deuxième solution est la suivante (on se reportera au module II.1 pour les notions topologiques utilisées ici). L’assertion à démontrer est vraie lorsque A est une matrice diagonale,
car C(A) contient alors toutes les matrices diagonales, lesquelles forment un sous-espace vectoriel de dimension n de Mn (C). L’assertion reste donc vraie lorsque A est diagonalisable,
i.e. semblable à une matrice diagonale. Notons alors D l’ensemble des matrices diagonalisables de Mn (C). Si l’on munit Mn (C) d’une norme quelconque, D est dense dans Mn (C) :
ce point sera établi dans le module I.6.
L’idée est maintenant la suivante. Par définition, C(A) est l’espace des solutions de l’équation AM − M A = 0 , l’inconnue M appartenant à Mn (C). Par rapport aux n2 coefficients
de M , cette équation se traduit par un système linéaire homogène de n2 équations à n2 inconnues. Notons SA ce système. La dimension de C(A) est donc n2 − rang(SA ). Il nous faut
donc établir, pour toute matrice A, l’inégalité :
rang(SA ) 6 n2 − n.
(∗)
Cette inégalité est vraie lorsque A ∈ D . Par ailleurs, les coefficients du système SA dépendent continûment (polynomialement) des coefficients de A. L’application ϕ de Mn (C)
dans Mn2 (C) associant à toute matrice A la matrice du système SA est donc continue. Soit enfin T l’ensemble des matrices de rang inférieur ou égal à n2 − n appartenant à Mn2 (C). C’est
un fermé de Mn2 (C), en vertu de l’exercice 7 de la page 412. Puisque ϕ est continue, ϕ−1 (T )
est un fermé de Mn (C). Explicitement, ϕ−1 (T ) est formé des matrices A ∈ Mn (C) telles que
le système SA vérifie l’inégalité (∗). Ainsi ϕ−1 (T ) est une partie fermée de Mn (C) contenant la partie dense D , d’où ϕ−1 (T ) = Mn (C), ce qui signifie que l’inégalité (∗) est vraie
c Dunod 2014
I.5 : Réduction des matrices
109
pour toute matrice A.
I.5.37 Soit g : E → E l’application M 7→ AM . L’exercice I.5.9 de la page 257 montre que g est
un endomorphisme de E , et que g est nilpotent (resp. diagonalisable) si, et seulement si, A a
la même propriété. Soit de même d : E → E l’application M 7→ M A. De manière analogue
(ou en transposant), on montre que d ∈ L(E), et que d est nilpotent (resp. diagonalisable) si,
et seulement si, A a la même propriété. Manifestement, u := g − d, donc u ∈ L(E).
Remarquons que g et d commutent. En effet, pour toute matrice M ∈ E , on a :
(g ◦ d)(M ) = g d(M ) = g(M A) = A(M A)
(d ◦ g)(M ) = d g(M ) = d(AM ) = (AM )A,
d’où la conclusion, par associativité. Si donc A est nilpotente, g et d sont deux endomorphismes nilpotents qui commutent, leur différence u est donc nilpotente (cf. le début de la
section 3.2 de la page 246. Si A est diagonalisable, g et d sont deux endomorphismes diagonalisables qui commutent, leur différence u est donc diagonalisable, car ils sont simultanément
diagonalisables, en vertu de l’exercice 9 de la page 237.
Pour toute matrice B ∈ E , notons uB l’endomorphisme M 7→ BM − M B de E . On
a uB = gB − dB , où gB est défini par M 7→ BM et dB est défini par M 7→ M B . L’application B 7→ uB de E dans L(E) est évidemment linéaire. En supposant que uA est diagonalisable, il nous reste à démontrer que A est diagonalisable. Écrivons pour cela la décomposition
de Dunford de A : A = D + N . Alors uA = uD + uN et, d’après ce qui précède, uD est
diagonalisable alors que uN est nilpotent.
Notons que uD et uN commutent, parce que DN = N D . En effet, par associativité, gD
commute avec dN et dD commute avec gN . Par ailleurs, l’égalité DN = N D montre
que gD commute avec gN et que dD commute avec dN . Ainsi uD = gD − dD commute
avec uN = gN − dN . Puisque uD et uN commutent, l’égalité uA = uD + uN donne la
décomposition de Dunford de A. Mais uA est diagonalisable, donc sa partie nilpotente uN est
nulle. Cela signifie que N M = M N pour toute matrice M ∈ E . On sait alors que N est une
matrice scalaire : N = λIn , λ ∈ C (cf. le module II.3 de [L1]). Une telle matrice scalaire n’est
nilpotente que si λ = 0 . Finalement, N = 0 , et donc A = D est diagonalisable.
I.5.38 Commençons par quelques remarques. Dans ce qui suit, pour deux matrices carrées A, B
de même taille, on écrit A ∼ B lorsque A et B sont semblables.
a) Le problème posé ne dépend en fait que de la classe de similitude de M . En effet, si M ′ ∈ Mn (C) est semblable à M , il est clair que aM ∼ aM ′ , et par conséquent (M ∼ aM ) ⇐⇒ (M ′ ∼ aM ′ ).
′
b) Soient T := Diag(T1 , . . . , Tm ) et T ′ := Diag(T1′ , . . . , Tm
) deux matrices diagonales par
blocs (de même format). Si Ti ∼ Ti′ pour tout i , alors T ∼ T ′ . En effet, pour chaque i
soit Pi une matrice carrée inversible de même taille que Ti telle que Pi Ti Pi−1 = Ti′ .
Alors P := Diag(P1 , . . . , Pm ) est inversible, de même taille que T , et P T P −1 = T ′ .
En particulier, si Ti ∼ aTi pour tout i , alors T ∼ aT .
c) Si T := Diag(T1 , . . . , Tm ) ∈ Mn (C) est une matrice diagonale par blocs et si s ∈ Sm ,
la matrice T ′ := Diag(Ts(1) , . . . , Ts(m) ) est semblable à T . Cela peut se déduire de la proposition 4 de la page 218. En effet, notons ri la taille de chaque Ti . Soient u ∈ L(Cn )
l’endomorphisme canoniquement associé à T et B := (e1 , . . . , en ) la base canonique de Cn .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
110
Les r1 premiers ei forment une base B1 d’un sous-espace E1 de Cn , les r2 vecteurs suivants
forment une base B2 d’un sous-espace E2 , et ainsi de suite. Pour tout i , le sous-espace Ei est
stable par u , et Ti est la matrice dans la base Bi de l’endomorphisme ui de Ei induit par u .
Enfin B est obtenue par juxtaposition des bases B1 , . . . , Bm .
Changeons l’ordre. On a aussi Cn = Es(1) ⊕ Es(2) ⊕ · · · ⊕ Es(m) . La matrice T ′ est la matrice
de u dans la base obtenue par juxtaposition des bases Bs(1) , . . . , Bs(m) , elle est donc semblable
à T.
d) Appliquons le théorème de Jordan (théorème 47 de la page 254). La matrice M est semblable
à une matrice M ′ diagonale par blocs, les blocs étant des blocs de Jordan (cf. la formule (29)
de la page 253) :
M ′ = Diag Jr1 (λ1 ), . . . , Jrm (λm ) et aM ′ = Diag aJr1 (λ1 ), . . . , aJrm (λm ) ,
les λi étant des nombres complexes, non nécessairement distincts, et les ri des entiers strictement positifs. Rappelons que, d’après la remarque de la page 254, un scalaire α est valeur
propre de M si, et seulement s’il est égal à l’un des λi .
Le théorème de Jordan donne en outre une propriété d’unicité. Pour tout λ ∈ C et tout r ∈ N∗ ,
le nombre d’indices i ∈ [[1, m]] tels que (ri , λi ) = (r, λ) ne dépend que de M et non de la
matrice M ′ semblable à M et de la forme ci-dessus. On peut donc noter ce nombre ν(M, r, λ).
Alors :
1.
Le spectre de M est formé des λ ∈ C tels que ν(M, λ, r) > 1 pour au moins un
entier r > 1 ;
2.
deux matrices M1 , M2 ∈ Mn (C) sont semblables si, et seulement si, pour tout
couple (r, λ) ∈ N∗ × C, on a ν(M1 , r, λ) = ν(M2 , r, λ).
En particulier, M ∼ aM si, et seulement si, ν(M, r, λ) = ν(aM, r, λ) pour tout couple (r, λ).
Une application (pas évidente a priori) de cette équivalence est la propriété de « simplifica′
tion » suivante. Étant données deux matrices
semblablesA′ et A et deux autres matrices car′
′
′
rées B, B , Diag(A, B) ∼ Diag(A , B ) ⇐⇒ (B ∼ B ).
e) Soit (r, λ) ∈ N∗ × C. Posons Dr := Diag(1, a, a2 , . . . , ar−1 ). La matrice Dr−1 Jr (λ)Dr
se déduit de Jr (λ) en multipliant chaque ligne d’indice i par a−(i−1) et chaque colonne d’indice j par aj−1 . Les termes λ de la diagonale ne changent pas, mais les termes égaux à 1 sont
remplacés par a−1 . D’où la formule :
aDr−1 Jr (λ)Dr = Jr (aλ).
(∗)
Ainsi, Jr (aλ) est semblable à aJr (λ). On en déduit l’égalité ν(aM, r, aλ) = ν(M, r, λ). Par
ailleurs, pour le bloc de Jordan nilpotent Jr := Jr (0), on a Jr ∼ aJr .
f) Si M est nilpotente, elle est semblable à aM . En effet, sp M = {0} donc, M ′ étant
comme ci-dessus, les λi sont tous nuls. Pour tout i , Jri ∼ aJri d’après l’alinéa précédent,
donc M ′ ∼ aM ′ en vertu de l’alinéa b). D’où M ∼ aM .
g) Supposons que M soit semblable à aM mais ne soit pas nilpotente. D’abord le spectre
de aM , c’est-à-dire a sp M , est égal à celui de M , i.e. le spectre de M est stable par multiplication par a : a sp M = sp M . On en déduit que ak sp M = sp M pour tout k ∈ N. Fixons
une valeur propre non nulle µ1 de M . Alors ak µ1 ∈ sp M pour tout k ∈ N. Puisque sp M
est fini, l’ensemble {ak | k ∈ N} est fini, ce qui équivaut à dire que a est une racine de l’unité.
Soit p l’ordre (multiplicatif) de a, de sorte que a est une racine p ème primitive de l’unité.
Noter que p > 2 , parce que a 6= 1 par hypothèse.
c Dunod 2014
I.5 : Réduction des matrices
111
Puisque µ1 ∈ sp M , il existe un entier ρ1 > 1 tel que Jρ1 (µ1 ) soit l’un des blocs constituant M ′ , i.e. tel que ν(M, ρ1 , µ1 ) > 1 . Puisque M ∼ aM , les alinéas d) et e) montrent
que ν(M, ρ1 , µ1 ) = ν(M, ρ1 , aµ1 ) = · · · = ν(M, ρ1 , ap−1 µ1 ). Pour tout k ∈ [[0, p − 1]], l’un
au moins des blocs constituant M ′ est égal à Jρ1 (ak µ1 ). Quitte à permuter les blocs de M ′ ,
on peut donc supposer que M ′ est égale soit à M1 , soit à Diag(M1 , M ′′ ), en posant :
M1 := Diag Jρ1 (µ1 ), Jρ1 (aµ1 ), . . . , Jρ1 (ap−1 µ1 ) .
On observera que M1 est semblable à aM1 , d’après les alinéas c) et e) et l’égalité ap = 1 :
aM1 ∼ Diag Jρ1 (aµ1 ), . . . , Jρ1 (ap−1 µ1 ), Jρ1 (ap µ1 )
= Diag Jρ1 (aµ1 ), . . . , Jρ1 (ap−1 µ1 ), Jρ1 (µ1 )
∼ Diag Jρ1 (µ1 ), Jρ1 (aµ1 ), . . . , Jρ1 (ap−1 µ1 ) = M1 .
Si M ′ 6= M1 , il faut noter que, d’après l’alinéa d), la matrice M ′′ est semblable àaM ′′ .
On peut donc appliquer à M ′′ ce qui vient d’être fait pour M ′ . On en déduit aussitôt
que, quitte à permuter les blocs de M ′ , on peut supposer que M ′ est de l’une des deux
formes suivantes Diag(M1 , . . . , Ms ) ou Diag(M1 , . . . , Ms , N ), où N est nilpotente et, pour
tout j ∈ [[1, s]], il existe un couple (ρj , µj ) ∈ N∗ × C∗ tel que :
Mj := Diag Jρj (µj ), Jρj (aµj ), . . . , Jρj (ap−1 µj ) .
Posons A := Diag Jρ1 (µ1 ), . . . , Jρs (µs ) . Alors A est inversible, et l’on a :
M ∼ Diag(A, aA, . . . , ap−1 A) ou M ∼ Diag(A, aA, . . . , ap−1 A, N ).
h) Voici ce que nous pouvons déduire de ce qui précède :
Conclusion : considérons une matrice M ∈ Mn (C) et un nombre a ∈ C \ {0, 1} . Supposons
que M soit semblable à aM . Alors :
- ou bien M est nilpotente ;
- ou bien a est une racine de l’unité, d’ordre p > 2 , et il existe une matrice inversible A
telle que M soit semblable à la matrice Diag(A, aA, . . . , ap−1 A) ;
- ou bien a est une racine de l’unité, d’ordre p > 2 , et il existe une matrice inversible A et une matrice nilpotente N telles que M soit semblable à la matrice Diag(A, aA, . . . , ap−1 A, N ).
La réciproque est évidente. En effet, dans le premier cas, M est semblable à aM , ceci quel que
soit a, d’après l’alinéa f). Dans le deuxième cas, le même raisonnement que ci-dessus montre
que Diag(A, aA, . . . , ap−1 A) est semblable à a Diag(A, aA, . . . , ap−1 A) parce que ap = 1 .
Enfin, dans le troisième cas, M est semblable à aM , à cause de l’alinéa b) et des deux cas
précédents.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
112
Module I.6 : Groupes classiques
I.6.1 (i) Si f, g se restreignent en l’identité sur H , il est immédiat que f g −1 aussi ; comme
IdG ∈ Γ(E, H), c’est bien un sous-groupe de GL(E).
Soient f, g ∈ Γ(E, H). Alors, par définition, pour tout x ∈ E :
(g ◦ f ) x (mod H) = g f x (mod H) = g f (x) (mod H) =
g f (x) (mod H) = (g ◦ f )(x) (mod H) = g ◦ f x (mod H) ,
d’où l’égalité g ◦ f = g ◦ f qui entraîne que f 7→ f est un morphisme de groupes. Pour voir
qu’il est surjectif de Γ(E, H) sur GL(E/H), on choisit un supplémentaire D de H dans E ,
et l’on relève tout endomorphisme de E/H en un endomorphisme de D ≃ E/H , que l’on
complète en l’endomorphisme de E qui est l’identité sur H .
Puisque H est un hyperplan, E/H est une droite et GL(E/H) s’identifie canoniquement à
K ∗ (il est constitué d’homothéties non triviales).
(ii) Soit f une forme linéaire sur E de noyau H et soit u ∈ H . La transvection x 7→ x+f (x)u
est évidemment dans Γ(E, H) (puisque f est nulle sur H ) et laisse stable x (mod H), donc
induit l’identité sur E/H : c’est donc un élément de Θ(E, H).
Soit réciproquement ϕ ∈ Θ(E, H). L’endomorphisme ϕ − IdE est nul sur H (car
ϕ ∈ Γ(E, H)) et envoie E dans H (car ϕ ∈ Θ(E, H)). Il se factorise donc par un morphisme de la droite E/H dans H , qui est donc de la forme y 7→ g(y)v . où v ∈ H et où g est
une forme linéaire sur E/H . Par composition avec la projection E → E/H , on obtient une
forme linéaire sur E nulle sur H , donc de la forme αf . L’endomorphisme ϕ − IdE est alors
égal à x 7→ f (x)u , où u := αv , et ϕ est bien une transvection d’hyperplan H .
Notons Tu cette transvection. On a :
(Tv ◦ Tu )(x) = (x + f (x)u) + f x + f (x)u v
= x + f (x)u + f (x)v + f f (x)u v = x + f (x)u + f (x)v = Tu+v (x).
Ainsi, u 7→ Tu est un isomorphisme de H sur Θ(E, H) (on vient de voir que c’est une surjection, et il est clair que c’est une injection).
(iii) Si u ∈
/ H , la dilatation x 7→ x + f (x)u est encore dans Γ(E, H) et ne laisse
pas stable x (mod H), donc n’induit pas l’identité sur E/H : c’est donc un élément de
Γ(E, H) \ Θ(E, H).
Soit ϕ ∈ Γ(E, H) \ Θ(E, H). Comme précédemment, on met l’endomorphisme ϕ − IdE sous
la forme x 7→ f (x)u , mais le fait que son image n’est pas dans H signifie que u ∈
/ H , donc
que ϕ est une dilatation d’hyperplan H .
I.6.2 Ces transvections sont toutes éléments de Tsun (K), donc le groupe qu’elles engendrent
est contenu dans Tsun (K). Réciproquement, pour toute matrice de Tsun (K), la version
suivante de l’algorithme du pivot ramène à l’identité : on annule toute la première ligne (sauf
son premier coefficient) par des opérations Cj ← Cj − a1,j C1 ( j > 2 ) ; puis on annule toute la
deuxième ligne (sauf son coefficient diagonal) par des opérations Cj ← Cj − a2,j C2 ( j > 3 ) ;
etc.
Pour engendrer Tsrn (K), on a besoin des mêmes transvections, et aussi des Di (λ).
Comme Ti,j (α) = In + αEi,j , un élément de Tsun (K) est dans le centre si, et seulement s’il
c Dunod 2014
I.6 : Groupes classiques
113
commute aux Ei,j telles que i < j . Écrivons In +
P
ak,ℓ Ek,ℓ un tel élément. On doit avoir,
k<ℓ
pour tout i < j :
X
k<i
ak,ℓ Ek,j =
X
aj,ℓ Ei,ℓ ,
j<ℓ
ce qui implique que tous les éléments non diagonaux sont nuls. Le centre de Tsun (K) est
donc réduit à {In } .
Le même calcul montre que le centre de Tsrn (K) est formé de matrices diagonales, et même
scalaires. C’est donc K ∗ In .
I.6.3 Il s’agit de démontrer que, si A ∈ GLn (K) est telle que :
∀B ∈ GLn (K) , ∃λ ∈ K ∗ : AB = λBA,
alors A est scalaire (et la même chose pour SLn (K)).
On va démontrer l’assertion suivante, qui subsume les deux cas : si A ∈ GLn (K) est telle que
∀B ∈ SLn (K) , ∃λ ∈ K ∗ : AB = λBA, alors A est scalaire.
Remarquons que l’égalité ci-dessus entraîne AB 2 = λBAB = λ2 B 2 A, et, par récurrence,
AB m = λm B m A.
En prenant les déterminants, on voit que λn = 1 . Si n est non nul dans K (i.e. non multiple
de la caractéristique), la suite de l’argument s’applique immédiatement. Sinon, on écrit d’abord
k
n = pk m avec p := car K et m ∧ p = 1 , d’où (λm )p = 1 , d’où λm = 1 (puisque x 7→ xp
est un endomorphisme injectif de K ∗ ).
Finalement, partant de AB = λBA, on obtient une égalité AB m = B m A pour un m non nul
P
dans K . Si par exemple on prend B := In + Ek,ℓ , en écrivant A :=
ai,j Ei,j , l’équation
devient, après division par m :
X
X
aℓ,j Ek,j =
ai,k Ei,ℓ .
j
i
Le raisonnement s’achève comme dans le calcul du centre de GLn (K).
I.6.4 (i) On sait que D(G) est bien un sous-groupe distingué de G. Dire que H est un sous-groupe
distingué de G tel que le quotient est abélien, c’est dire que, dans G/H , on a identiquement
[x, y] = 1 . Comme [g, g ′ ] = g, g ′ , c’est dire que [g, g ′ ] ∈ H pour tous g, g ′ ∈ G, c’est-àdire que H contient D(G).
En particulier, pour tout morphisme de G vers un groupe commutatif, le noyau H contient
D(G) (car G/H est isomorphe à l’image qui est commutative comme sous-groupe d’un groupe
commutatif), d’où la possibilité de factoriser à travers G/D(G). (Pour cette raison, G/D(G)
est appelé l’abélianisé de G.)
(ii) En prenant G := GLn (K), on sait que (sous les hypothèses énoncées) D(G) = SLn (K)
et det passe au quotient en un isomorphisme de G/D(G) sur K ∗ . La conclusion en découle.
I.6.5 Il suffit encore de démontrer que toute matrice de transvection est un commutateur d’éléments
de SLn (K). Vu le choix de K , il existe a ∈ K ∗ tel que a 6= a−1 . Soit λ ∈ K . On pose
−1
λ
a
b
a
0
b :=
· Le commutateur des matrices
et
est la matrice de
0 a−1
0
a
a − a−1
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
114
transvection T1,2 (λ). Le cas de T2,1 (λ) est laissé aux soins du lecteur.
Puisque dans F2 le seul déterminant non nul possible est 1 , on a bien GL2 (F2 ) = SL2 (F2 ).
Le fait que le groupe dérivé est un sous-groupe strict découle de l’identification avec le groupe
symétrique sur 3 éléments (exercice I.6.11). Mais on peut également le voir comme suit :
SL2 (F2 ) permute les trois éléments non nuls de F22 , le noyau de l’action est trivial et ce
groupe a 6 éléments. Comme le groupe dérivé du groupe symétrique est évidemment formé de
1 1
permutations paires, ce n’est pas le groupe entier. Par exemple
agit par transposition
0 1
et ne peut appartenir au groupe dérivé.
I.6.6 On a évidemment (In , Ip ).A = A et :
−1
(P ′ , Q′ ). (P, Q).A = P ′ P AQ−1 Q′ = (P ′ P )A(Q′ Q)−1 = (P ′ P, Q′ Q).A.
On a bien une action de groupe. Le lecteur consciencieux vérifiera que la formule
(P, Q).A := P AQ n’aurait pas fonctionné. La première assertion sur les orbites est tautologiquement équivalente à la définition des matrices équivalentes, et la deuxième aux résultats
prouvés dans [L1].
I.6.8 L’application de la méthode indiquée donne la formule :
n
Y
card Lr (E) = q r(r−1)/2
(q k − 1).
k=n−r+1
On peut retrouver cette égalité par un raisonnement combinatoire. Le choix de e1 dans
(e1 , . . . , er ) ∈ Lr (E) se fait dans E \ {0} , donc avec q n − 1 possibilités ; le choix de e2 ,
une fois e1 choisi, se fait dans E \ Ke1 , donc avec q n − q possibilités ; etc. Finalement :
card Lr (E) =
r−1
Y
i=0
(q n − q i ).
En sortant les puissances de q , on retrouve la formule précédente.
La description du stabilisateur Hr donne immédiatement :
card Hr = card Mr,n−r (K) card GLn−r (K) =
q r(n−r) q (n−r)(n−r−1)/2
n−r
Y
k=1
(q k − 1) = q (n−r)(n+r−1)/2
n−r
Y
k=1
(q k − 1).
Le cardinal de l’orbite Lr (E) est le quotient du cardinal de GL(E) par le cardinal du stabilisateur, d’où :
q n(n−1)/2
card Lr (E) =
n
Q
(q k − 1)
k=1
n−r
Q k
q (n−r)(n+r−1)/2
(q
k=1
ce qui est cohérent avec les calculs précédents.
c Dunod 2014
− 1)
= q r(r−1)/2
n
Y
(q k − 1),
k=n−r+1
I.6 : Groupes classiques
115
I.6.9 Après choix d’un supplémentaire de F et d’une base adaptée (obtenue par juxtaposition
d’une base B de F et d’un base C de son supplémentaire), on voit que le stabilisateur de F
est formé des éléments (dont la matrice est) de la forme :
A X
MA,X,B :=
avec A ∈ GLr (K), X ∈ Mr,n−r (K), B ∈ GLn−r (K).
0 B
La loi est donnée par la formule :
MA,X,B MA′ ,X ′ ,B ′ = MAA′ ,AX ′ +XB ′ ,BB ′ .
On munit F de la base B indiquée ci-dessus. L’élément MA,X,B agit sur F via la matrice A.
Le noyau de l’action correspondante est le sous-groupe formé des matrices MIr ,X,B .
On munit E/F de la base C image de la base C indiquée ci-dessus. L’élément MA,X,B agit
sur E/F via la matrice B . Le noyau de l’action correspondante est le sous-groupe formé des
matrices MA,X,In−r .
On munit F × E/F de la base obtenue par juxtaposition de B et de C . L’élément MA,X,B agit
sur F × E/F via la matrice MA,0,B . Le noyau de l’action correspondante est le sous-groupe
formé des matrices MIr ,X,In−r . Il est isomorphe au groupe additif Mr,n−r (K).
I.6.10 (i) On construit d’abord une base (e1 , . . . , en ) adaptée à F : notant di := dim Fi , cela
signifie que (e1 , . . . , edi ) est une base de Fi pour 1 6 i 6 k . On part pour cela d’une base
de F1 , que l’on étend en une base de F2 , etc. Un élément ϕ du stabilisateur G de F est
caractérisé par la propriété suivante : si 1 6 j 6 di , alors ϕ(ej ) est combinaison linéaire
de ϕ(e1 ), . . . , ϕ(edi ). La matrice de ϕ dans une base adaptée est donc caractérisée par la
description de l’énoncé.
On munit F1 de sa base (e1 , . . . , ed1 ) et, pour 2 6 i 6 k , chaque Fi /Fi−1 de la base image
de la famille des ej tels que di−1 < j 6 di . On munit enfin grF de la base obtenue par
juxtaposition. Soit g un élément de G, et soit M sa matrice dans la base (e1 , . . . , en ) ; notons
M1 , . . . , Mk les blocs diagonaux de M dans la description ci-dessus. L’action de g sur grF a
pour matrice dans la base décrite la matrice diagonale par blocs Diag(M1 , . . . , Mk ).
L’élément g est dans le noyau de l’action si, et seulement si, ses blocs diagonaux sont les
matrices identités de tailles d1 , d2 − d1 , . . . , dk − dk−1 , n − dk .
(ii) Dans le cas d’un drapeau maximal, on a k = n et di = i , les blocs diagonaux décrits sont
de taille 1 . Les stabilisateurs ont la forme matricielle Tsrn (K) et les noyaux des actions sur
les gradués la forme Tsun (K).
I.6.11 (i) Ici K ∗ = {1} , ce qui donne toutes les égalités d’un coup.
(iii) Les trois vecteurs non nuls (1, 0), (0, 1) et (1, 1) sont deux à deux non liés, ils engendrent
donc donc trois droites, dont les équations respectives sont y = 0 , x = 0 et x = y .
Le groupe GL2 (F2 ) permute ces trois droites, d’où le morphisme indiqué. Ce morphisme
est injectif, car un automorphisme qui fixe globalement une de ces droites fixe son unique
élément non nul. Pour voir qu’il est surjectif, on peut comparer les cardinaux (formule de la
proposition 24 de la page 85), ou bien exhiber un antécédent pour chaque transposition ; par
1 1
exemple, la matrice
transpose (0, 1) et (1, 1). (La recherche des deux autres est
0 1
laissée au plaisir du lecteur.)
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
116
(ii) Tout commutateur d’éléments de Sn a pour signature 1 . Le groupe dérivé de Sn est donc
inclus dans le groupe alterné. Le groupe dérivé de GL2 (F2 ) n’est donc pas SL2 (F2 ).
t
I.6.12 (i) L’application f 7→ f −1 est un morphisme de GL(E) dans GL(E ∗ ). L’application
g 7→ ρ′ (g) est la composée de ce morphisme et du morphisme ρ de G dans GL(E). C’est
donc bien un morphisme de G dans GL(E).
(ii) C’est l’intersection des noyaux des ρ(g) − IdE , donc un sous–espace vectoriel ; il est stable
puisque chacun de ces éléments est fixé.
1 P
On suppose que N n’est pas nul dans K , et l’on note p :=
ρ(g). C’est un endomorN g∈G
phisme de E , et, pour tout g0 ∈ G :
1 X
1 X
1 X
ρ(g0 ) ◦ ρ(g) =
ρ(g0 g) =
ρ(g) = p,
ρ(g0 ) ◦ p =
N
N
N
g∈G
g∈G
g∈G
puisque g 7→ g0 g permute G. On en déduit, pour tout x ∈ E et pour tout g0 ∈ G, l’égalité
ρ(g0 ) p(x) = p(x). Donc Im p ⊂ E G . De plus, si x ∈ E G , chacun des ρ(g)(x) est égal à
x, donc p(x) = x et la restriction de p à E G est l’identité. C’est donc bien un projecteur sur
EG .
Pour le calcul de la dimension, il faut pouvoir identifier un entier à un élément de K . On doit
donc supposer que K est de caractéristique nulle. Dans ce cas, la trace d’un projecteur est égale
à la dimension de son image ([L1]). Alors, par linéarité de la trace :
1 X
dim E G = Tr p =
Tr ρ(g).
N
g∈G
I.6.13 L’hypothèse sur ϕ est qu’il commute à chaque ρ(g). On sait alors que Ker ϕ et Im ϕ
sont stables par chaque ρ(g), donc par G. Par hypothèse, chacun de ces deux sous–espaces
vectoriels est nul ou égal à E . Donc ϕ est nul ou inversible.
Pour tout λ ∈ K , l’endomorphisme ϕ − λ IdE vérifie les mêmes hypothèses. On prend pour
λ une valeur propre (il y en a puisque le corps de base algébriquement clos) : alors ϕ − λ IdE
est non inversible, donc nul.
I.6.14 (i) Un sous-espace affine X ′ ⊂ X de direction E ′ ⊂ E contient Y si, et seulement s’il
contient y0 et si E ′ contient les vecteurs y − y0 ( y ∈ Y ). L’équivalence demandée en découle. Dans le cas indiqué, les vecteurs y − y0 tels que y ∈ Y \ {y0 } engendrent E , d’où
card Y − 1 = card (Y \ {y0 }) > dim E .
(ii) Le groupe décrit est formé des transformations affines qui laissent invariant y0 et dont l’automorphisme vectoriel sous-jacent laisse invariant tous les vecteurs y−y0 ( y ∈ Y ), c’est-à-dire
le sous–espace vectoriel E ′ qu’ils engendrent. On est donc conduit à démontrer l’équivalence
suivante au sujet d’un sous–espace vectoriel E ′ ⊂ E : le sous-groupe de GL(E) formé des
automorphismes triviaux sur E ′ est trivial si, et seulement si, E ′ = E . Mais c’est très facile.
(Prendre un supplémentaire de E ′ .)
c Dunod 2014
I.6 : Groupes classiques
117
A B
Y
et X =
(blocs selon les tailles n et 1 ), la condition
C D
1
nécessaire et suffisante pour que MA,B ∈ G est que, pour tout Y , CY + D = 1 . Cela équivaut
à C = 0 ∈ M1,n (K) et D = 1 ∈ K .
On a : MA,B MA′ ,B ′ = MAA′ ,AB ′ +B .
Y
AY + B
(ii) On a : MA,B
=
. L’action de G sur K n est donc décrite par
1
1
MA,B .Y = AY + B : on reconnait bien GA(K n ). (Naturellement, les deux lois de composition coïncident.)
(iii) est une simple traduction intrisèque de (ii) : choisir les coordonnées affines de telle sorte
que H soit défini par l’équation xn+1 = 1 .
I.6.15 (i) Écrivant MA,B =
I.6.16 (1) On a :
(y1 , . . . , yn−1 ) =
x1
xi−1 xi+1
xn
,...,
,
,...,
xi
xi
xi
xi
,
x1
xj−1 xj+1
xn
(z1 , . . . , zn−1 ) =
,...,
,
,...,
.
xj
xj
xj
xj
Pour relier ces deux égalités, on supposera que i < j (le cas i > j est symétrique, le cas i = j
est trivial).
Si 1 6 k 6 i − 1 :
xk /xj
zk
xk
yk =
=
= ·
xi
xi /xj
zi
Si i 6 k 6 j − 2 :
xk+1
xk+1 /xj
zk+1
yk =
=
=
·
xi
xi /xj
zi
Si k = j − 1 :
xk+1
xk+1 /xj
1
yk =
=
= ·
xi
xi /xj
zi
Si j − 1 6 k 6 n − 1 :
xk+1
xk+1 /xj
zk
yk =
=
= ·
xi
xi /xj
zi
Le lecteur trouvera de même l’expression de (z1 , . . . , zn−1 ) en fonction de (y1 , . . . , yn−1 ).
(ii) Supposons que la carte Ui contienne x = [x1 : · : xn ] et x′ := [A]x = [x′1 : · : x′n ] et
P
soient y, y ′ leurs images dans K n−1 . On a x′j = aj,k xk . Si j < i :
yj′ =
x′j
x′i
i−1
n
P
P
aj,k yk + aj,i +
aj,k yk−1
P
P
aj,k xk
aj,k xk /xi
k=1
k=i+1
= P
= P
= i−1
·
n
P
P
ai,k xk
ai,k xk /xi
ai,k yk + ai,i +
ai,k yk−1
k=1
Si j > i :
yj′
=
x′j+1
x′i
P
P
aj+1,k xk
aj+1,k xk /xi
= P
= P
=
ai,k xk
ai,k xk /xi
i−1
P
k=i+1
aj+1,k yk + aj+1,i +
k=1
i−1
P
k=1
ai,k yk + ai,i +
n
P
aj+1,k yk−1
k=i+1
n
P
ai,k yk−1
·
k=i+1
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
118
I.6.17 (i) Si SLn (K) était ouvert, toutes les matrices (1 + ε)In pour ε assez petit seraient de
déterminant 1 , ce qui est faux. Ce groupe n’est donc pas ouvert.
Comme le déterminant est continu, la condition det M > 0 définit un ouvert de Mn (R), et
c’est GL+
n (R).
(ii) Le groupe GLn (K) n’est pas borné car il contient toutes les matrices aIn avec a ∈ K ∗ .
(iii) Le sous-ensemble Tsrn (K) de l’espace vectoriel Tn (K) est défini par la condition
det 6= 0 , il est donc ouvert dans Tn (K). Il est dense car il suffit de perturber un tout petit
peu la diagonale d’un élément pour le rendre inversible. Il n’est donc pas fermé puisqu’il n’est
1
pas égal à Tn (K) tout entier. (Autre argument : car il contient les In , p > 1 et pas leur limite
p
0 ). Il n’est pas borné car il contient toutes les aIn avec a ∈ K ∗ . Il n’est pas d’intérieur vide,
car il contient toutes les matrices de Tn (K) suffisamment proches de In . Il est non connexe
pour K := R (signe du déterminant), et connexe pour K := C, ce que le lecteur prouvera par
les mêmes méthodes que dans le cours.
Le sous-ensemble Tsun (K) de Tn (K) est fermé car défini par les équations ai,i = 1 . Comme
il n’est pas égal à Tn (K) tout entier, il n’est donc pas dense. Il est pas d’intérieur vide (donc
pas ouvert) car il ne contient aucune matrice (1 + ε)In pour ε assez petit. Il n’est pas borné
car les coefficients au dessus de la diagonale sont arbitraires. Il est connexe, car c’est un espace
affine.
I.6.18 La condition à réaliser est :
∀p > 1 , ∀i 6= j ∈ [[1, n]] , ai − aj 6= p(λj − λi ).
On fixe a1 arbitrairement ; puis a2 arbitrairement dans le complémentaire d’un ensemble dénombrable ; etc.
I.6.19 On écrit :
(A + H)(B + K) − AB − (AK + HB) = HK = o(H, K),
et l’on voit que l’application produit est différentiable et que sa différentielle en (A, B) est
l’application linéaire (H, K) 7→ AK + HB de Mn (K) × Mn (K) dans Mn (K).
On écrit :
(A + H)2 − A2 − (AH + HA) = H 2 = o(H),
et l’on voit que l’application carré est différentiable et que sa différentielle en A est l’application linéaire H 7→ AH + HA de Mn (K) dans Mn (K).
I.6.20 On écrit le théorème de Cayley-Hamilton sous la forme : Dn + a1 Dn−1 + · · · + an In = 0 ,
1
avec an = (−1)n det D 6= 0 . Alors D−1 = − (Dn−1 + a1 Dn−2 + · · · + an−1 In ) est un
an
polynôme en D , donc en B .
I.6.21 (i) Le morphisme det : On (R) → {+1, −1} , resp. det : Un (C) → U est surjectif (le
vérifier avec des matrices diagonales) et de noyau SOn (R), resp. SUn (C).
c Dunod 2014
I.6 : Groupes classiques
119
(ii) Toute matrice orthogonale est de la forme ±A, où A ∈ SOn (R) (car n impair) et l’application (A, ε) 7→ εA est un isomorphisme de SOn (R) × {+1, −1} dans On (R).
Si n est pair, cette application n’est ni injective ni surjective, mais cela prouve seulement que
l’argument précédent ne s’applique pas, ce qui ne suffit pas à mettre en défaut la conclusion.
Cependant, on a en général Z(G × H) = Z(G) × Z(H) (vérification facile laissée au lecteur).
Le centre de On (R) a toujours 2 éléments, alors que le centre de SOn (R) × {+1, −1} a ici 4
éléments.
I.6.22 Soit U une matrice de Un (C) diagonalisable dans une base orthonormale et dont toutes les
valeurs propres sont distinctes. Si U ′ ∈ Un (C) commute avec U , il est diagonalisables dans la
même base. Un élément du centre est donc diagonalisable dans toute base orthonormale, donc
toutes les directions lui sont propres, c’est donc une matrice scalaire, et, bien sûr, son rapport
doit être dans U.
L’argument s’applique de même à SUn (C), et la conclusion est que le centre est formé des
matrices scalaires dont le rapport est dans µn (racines n èmes de l’unité).
Le centre U de Un (C) n’est pas isomorphe au centre µn × U de SUn (C) × U car le sousgroupe des éléments tels que xn = 1 est µn dans le premier et µn × µn dans le second. Donc
Un (C) n’est pas isomorphe à SUn (C) × U.
I.6.23 La première assertion découle de l’algorithme de Gram-Schmidt modifié pour les espaces
préhilbertiens complexes. Pour la seconde, on est ramené à prouver que, si Q ∈ Un (C) est
triangulaire supérieure à éléments diagonaux réels positifs, alors Q = In : comme dans le cas
réel, cela se prouve colonne après colonne (de 1 à n).
I.6.24 Une fois connue la factorisation QR réelle, il suffit de prouver que toute matrice R réelle triangulaire supérieure à éléments diagonaux positifs admet une unique décomposition R = DT ,
où D est diagonale à coefficients strictement positifs et où T ∈ Tsun (R). Mais c’est évident
(et D est la diagonale de R ).
I.6.25 Il est clair que l’application A 7→ A2 envoie bien Hn++ (C) dans lui-même. Si
B ∈ Hn++ (C) est de la forme A2 avec A ∈ Hn++ (C), les matrices A et B commutent
donc sont codiagonalisables dans une base orthonormale : B = P DP −1 , A = P CP −1 , avec
P unitaire, D = Diag(µ1 , . . . , µn ), les µi ∈ R∗+ et C = Diag(λ1 , . . . , λn ), les λi ∈ R∗+ .
√
Comme A2 = B ⇔ C 2 = D , il y a une unique possibilité qui consiste à prendre λi := µi .
On a donc établi que l’application A 7→ A2 est une bijection de Hn++ (C) dans lui-même.
Soit M ∈ GLn (C). On applique ce qui précède à B := M ∗ M qui est bien dans Hn++ (C).
On écrit donc M ∗ M = H 2 , avec H ∈ Hn++ (C), puis U := M H −1 . Il est immédiat que
U ∈ Un (C), d’où l’existence de la décomposition.
La preuve de l’unicité se ramène à vérifier que Un (C) ∩ Hn++ (C) = {In } . Or, toute matrice
de l’intersection est orthodiagonalisable avec valeurs propres dans U ∩ R∗+ = {1} .
I.6.26 On supposera que dim E > 2 , le cas où dim E 6 1 étant laissé à la patience du lecteur.
Pour que l’ensemble Ta,b,c (E) soit non vide, il est nécessaire, en vertu de l’inégalité du triangle,
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
120
que l’on ait les trois inégalités : a 6 b + c, b 6 a + c et c 6 a + b . Ces trois inégalités
sont équivalentes à l’encadrement : |a − b| 6 c 6 a + b (la minoration correspond aux deux
premières inégalités). Si réciproquement les réels a, b, c satisfont ces inégalités, on peut se
placer dans le plan complexe et chercher z ∈ U (i.e. de norme 1 ) tel que |a + bz| = c, ce qui
équivaut à 2ab Re(z) = c2 − a2 − b2 . Selon l’hypothèse, le membre droit est compris entre
2ab et −2ab et donc de la forme 2ab cos z , et u := eit convient. Alors les vecteurs u := a et
v := bz conviennent. Le triangle de côtés a, b, c est donc réalisable dans tout plan euclidien,
donc dans E .
Pour la question de la transitivité, on suppose d’abord que dim E = 2 et l’on identifie E
au plan complexe muni de sa structure euclidienne (tous les plans euclidiens sont isomorphes
entre eux). On fixe le triangle déterminé ci-dessus. On ne fera le raisonnement que dans le cas
“générique” ab 6= 0 , laissant à la patience du lecteur les cas particuliers manquants. Soit alors
un autre triangle u′ , v ′ , u′ + v ′ de longueurs a, b, c. On a donc u′ = aα et v ′ = bzβ , où
α, β ∈ U. La troisième condition de longueur donne : |aα + bzβ| = c, d’où |a + bzγ| = c,
en notant γ := βα−1 , d’où encore a2 + 2ab Re(zγ) + b2 = c2 . Puisque ab 6= 0 , on a
Re(zγ) = Re(z). Comme il s’agit de complexes de module 1 , cela implique que zγ = z ou
zγ = z . Dans le premier cas, le triangle u′ , v ′ , u′ + v ′ est obtenu à partir du triangle u, v, u + v
par la rotation de complexe α ; dans le second cas, par la même rotation suivie d’une symétrie.
De plus, sauf pour des valeurs particulières, on ne peut pas choisir : l’action de O(E) est donc
transitive, mais pas celle de SO(E).
Lorsque dim E > 3 , deux triangles étant donnés, chacun est contenu dans un plan de E . De
plus, deux plans étant donnés, il existe un élément de SO(E) amenant l’un sur l’autre, et aussi
un élément de O(E) \ SO(E). On déduit donc du premier cas examiné que l’action de SO(E)
sur Ta,b,c (E) est transitive.
I.6.27 (i) En généralisant le cas de S 2 , on trouve facilement :
(cos t1 · · · cos tn−1 , cos t1 · · · cos tn−2 sin tn−1 ,
cos t1 · · · cos tn−3 sin tn−2 , . . . , cos t1 sin t2 , sin t1 ).
(ii) Écrivons (λ, µ) la première ligne d’un élément A de GL2 (C). Pour que la deuxième ligne
lui soit orthogonale (pour le produit hermitien canonique de C2 ), il faut, et il suffit, qu’elle soit
de la forme u(−µ, λ) avec u ∈ C. Pour que les deux lignes soient de norme 1 (i.e. pour que
A soit unitaire), il faut, et il suffit, que u ∈ U et |λ|2 + |µ2 | = 1 . Pour que A soit spéciale
unitaire, il faut, et il suffit, que l’on ait de plus u = 1 : on a donc bien la description demandée
de SU2 (C).
L’application qui à A associe sa première ligne est un homéomorphisme de SU2 (C) sur
{(λ, µ) ∈ C2 | |λ|2 + |µ2 | = 1} . L’appplication (λ, µ) 7→ (Re λ, Re µ, Im λ, Im µ) est un
homéomorphisme de ce dernier ensemble sur S 3 .
Enfin, toutes les sphères S n (pour n > 1 ) sont connexes par arcs : en effet, le point
(cos t1 · · · cos tn−1 , cos t1 · · · cos tn−2 sin tn−1 , cos t1 · · · cos tn−3 sin tn−2 , . . . , cos t1 sin t2 , sin t1 )
peut être relié au point (1, 0, . . . , 0) par le chemin :
t 7→ (cos tt1 · · · cos ttn−1 , cos tt1 · · · cos ttn−2 sin ttn−1 ,
cos tt1 · · · cos ttn−3 sin ttn−2 , . . . , cos tt1 sin tt2 , sin tt1 ).
c Dunod 2014
I.6 : Groupes classiques
121
I.6.28 1) Le fait que (Ok )k∈N admet une sous-suite convergente est conséquence directe de la
compacité de On (R). Toute sous-suite convergente de (Ok )k∈N converge vers un élément O′
de On (R), et la sous-suite correspondante de (Sk )k∈N conversge alors vers un élément S ′
−1
de Sn+ (R), qui est égal à O′ A ∈ GLn (R), donc appartient en fait à Sn++ (R). L’égalité
A = O′ S ′ est donc la décomposition polaire de A, et, par unicité d’icelle, on a bien O′ = O
et S ′ = S .
2) Si une suite (un ) d’un espace vectoriel normé admet une sous-suite convergente et si toute
sous-suite convergente admet la même limite u , alors la suite (un ) converge vers u , ce qui
justifie la première assertion. L’application A 7→ (O, S) est donc continue, ce qui constitue la
partie manquante de la preuve de la proposition 28 de la page 287.
I.6.29 Notons J :=
l’égalité :
0
1
−1
0
. C’est une matrice diagonalisable de valeurs propres ±i, d’où
J = P DP −1 ,
On en déduit immédiatement :
où D := Diag(i, −i).
exp(aJ) = P Diag(eia , e−ia )P −1 = P (cos aI2 + sin aD)P −1
cos a − sin a
= cos aI2 + sin aJ =
.
sin a
cos a
I.6.30 La première assertion découle du théorème 21 de la page 281 et de l’exercice I.6.29 de la
page 310.
De même, les deux autres assertions découlent du théorème 113 de la page 204 et du fait que la
matrice P Diag(iθ1 , . . . , iθn )P −1 , où P est unitaire et les θi réels, est dans un (C), et même
P
dans sun (C) si
θi = 0 .
I.6.31 (i) Soit ϕ un tel automorphisme. On identifie E à R4 avec q(x, y, z, t) = x2 +y 2 +z 2 −t2 .
p
L’hypothèse dit que q ′ := q ◦ ϕ s’annule pour t = ± x2 + y 2 + z 2 . Mais q ′ est un polynôme
homogène du second degré, que l’on peut écrire : q ′ (x, y, z, t) = αt2 + β(x, y, z)t + γ(x, y, z),
où α ∈ R, où β est une forme linéaire et où γ est est un polynôme homogène du second degré
p
p
en x, y, z . On remplace successivement t par x2 + y 2 + z 2 puis par − x2 + y 2 + z 2 , et
l’on conclut que β est nulle, puis que γ(x, y, z) = −α(x2 +y 2 +z 2 ), d’où enfin : q◦ϕ = −αq .
Notons F le sous–espace vectoriel (t = 0) de E . Le sous–espace vectoriel F ∩ ϕ−1 (F ) est
au moins de dimension 2 . Tout u 6= 0 de ce sous–espace vectoriel est tel que q(u) > 0 et
√
q ′ (u) > 0 : on a donc −α > 0 . Posant a := −α et ψ := a−1 ϕ, on voit que ϕ = aψ et que
q ◦ ψ = ψ , autrement dit, ψ est q -orthogonal.
(ii) La condition q(u) < 0 entraîne q(λu) = λ2 q(u) < 0 , d’où la première assertion (on ne
considère que les homothéties non triviales). Sur C , on a t2 > x2 + y 2 + z 2 , donc t 6= 0 ,
et C + et C − ne peuvent être inclus dans la même composante connexe. On va montrer que
C + est convexe, donc C − = −C + également, ce qui entrainera leur connexité par arcs et la
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
122
conclusion. Soient maintenant u := (x, y, z, t) et u′ := (x′ , y ′ , z ′ , t′ ) deux éléments de C + et
α, α′ > 0 tels que α + α′ = 1 . Alors :
2
q(αu + α′ u′ ) = α2 q(u) + α′ q(u′ ) + 2αα′ (xx′ + yy ′ + zz ′ − tt′ ).
On applique l’inégalité de Cauchy-Schwarz :
2
2
2
2
(xx′ + yy ′ + zz ′ )2 6 (x2 + y 2 + z 2 )(x′ + y ′ + z ′ ) < t2 t′ =⇒ xx′ + yy ′ + zz ′ < tt′ ,
puisque t, t′ > 0 . On a donc bien q(αu + α′ u′ ) < 0 .
(iii) Notons plutôt s ∈ [0, 1] la variable, et γ ′ (s) = x(s), y(s), z(s), t(s) . Il s’agit de démontrer :
Z 1
Z 1
.
∀s ∈ [0, 1] , t(s) > x(s), y(s), z(s) 2 =⇒
t(s) ds > t(s)
x(s),
y(s),
z(s)
ds
0
0
2
3
Mais cela découle de l’inégalité des accroissements finis pour les fonctions à valeurs dans R .
2
2
I.6.32 Soit A ∈ SO1,1 (R). Ses lignes sont de normes respectives z 2 − t2 = 1 et z ′ − t′ = −1 ,
donc respectivement de la forme (cosh a, sinh a) et (sinh b, cosh b). L’orthogonalité des lignes
dit que zz ′ −tt′ = 0 , c’est-à-dire cosh a sinh b−sinh a cosh b = 0 , d’où, en vertu des formules
d’addition, sinh(b − a) = 0 , donc a = b .
On a les formules :
(
z = (cosh a)z ′ + (sinh a)t′ ,
t = (sinh a)z ′ + (cosh a)t′ .
z
L’origine du second repère vérifie z ′ = 0 , donc, vue du premier repère, U := = tanh a.
t
Un point mobile z ′ = V t′ du second repère vérifie alors :
z
(cosh a)V t′ + (sinh a)t′
(cosh a)V + (sinh a)
V + (tanh a)
U +V
=
=
=
=
·
t
(sinh a)V t′ + (cosh a)t′
(sinh a)V + (cosh a)
(tanh a)V + 1
1 + UV
(Cette loi d’addition est écrite en posant c := 1 .)
I.6.33 Il suffit d’interpréter les transvections et les dilatations de GL2 (K) en termes d’homographies. La dilatation D1 (λ) correspond à x 7→ λx, ainsi que D2 (λ−1 ). La transvection T1,2 (1)
correspond à x 7→ x + 1 , et T1,2 (α) lui est conjuguée par une dilatation. La transvection
T2,1 (1) correspond à x 7→ 1/(x + 1), qui est composée de x 7→ 1/x par x 7→ x + 1 , et
T2,1 (α) lui est conjuguée par une dilatation.
ax + b
.
cx + d
Si ∞ est point fixe, on a c = 0 et a 6= 0 . Si a = d, on a une translation et ( g étant supposée
b
non triviale), ∞ est le seul point fixe ; sinon, le seul autre point fixe est
·
d−a
Si c 6= 0 , les points fixes de sont les racines complexes de cx2 + (d − a)x − b = 0 : il y en a
une ou deux.
Si l’homographie a un seul point fixe, à conjugaison près, on peut supposer que c’est ∞. On a
vu que l’on a alors une translation x 7→ x+α non triviale, et celle-ci est conjuguée à x 7→ x+1
I.6.34 Notons g l’homographie x 7→
c Dunod 2014
I.6 : Groupes classiques
123
par une homothétie.
Si l’homographie a deux points fixes, à conjugaison près, on peut supposer que ce sont 0 et
∞. On a donc c = b = 0 et c’est bien la forme x 7→ qx, avec q 6= 0 (ce ne serait pas une
homographie) et q 6= 1 (elle serait triviale).
Le lecteur démontrera que x 7→ qx et x 7→ q ′ x sont conjuguées si, et seulement si, q ′ = q ou
q ′ = q −1 . (Étudier l’effet de la conjugante sur 0 et ∞.)
I.6.35 Sur tout corps, les points 0, 1, ∞ sont distincts. Sur le corps à deux éléments, ce sont les
seuls.
I.6.36 L’orbite de 0 et de 1 est {0, 1, ∞} .
Si x 6= 0, 1 , son orbite est {x, 1/x, 1−x, x/(x−1), 1/(1−x), 1−1/x} ; c’est une partie de K .
Elle a en général six éléments. Les seules exceptions sont l’orbite {−1, 2, 1/2} (si K n’est pas
de caractéristique 2 ) et, si K contient une racine cubique non triviale j de l’unité, {−j, −j 2 } .
Notons d’ailleurs que, si K est de caractéristique 3 , l’orbite {−1, 2, 1/2} n’a qu’un élément !
I.6.37 Il s’agit de combiner les trois transpositions du texte. On trouve :
[α, β, γ, δ]
= [α, β, γ, δ] ,
[α, β, δ, γ] = 1/ [α, β, γ, δ] ,
[α, γ, β, δ]
= 1 − [α, β, γ, δ] ,
[α, γ, δ, β] = 1/(1 − [α, β, γ, δ]),
[α, δ, β, γ] = 1 − 1/ [α, β, γ, δ] ,
[α, δ, γ, β] = [α, β, γ, δ] /([α, β, γ, δ] − 1),
[β, α, γ, δ]
= 1/ [α, β, γ, δ] ,
[β, α, δ, γ] = [α, β, γ, δ] ,
[β, γ, α, δ]
= 1 − 1/ [α, β, γ, δ] ,
[β, γ, δ, α] = [α, β, γ, δ] /([α, β, γ, δ] − 1),
[β, δ, α, γ] = 1 − [α, β, γ, δ] ,
[β, δ, γ, α] = 1/(1 − [α, β, γ, δ]),
[γ, α, β, δ]
= 1/(1 − [α, β, γ, δ]),
[γ, α, δ, β] = 1 − [α, β, γ, δ] ,
[γ, β, α, δ]
= [α, β, γ, δ] /([α, β, γ, δ] − 1),
[γ, β, δ, α] = 1 − 1/ [α, β, γ, δ] ,
[γ, δ, α, β] = [α, β, γ, δ] ,
[γ, δ, β, α] = 1/ [α, β, γ, δ] ,
[δ, α, β, γ] = [α, β, γ, δ] /([α, β, γ, δ] − 1),
[δ, α, γ, β] = 1 − 1/ [α, β, γ, δ] ,
[δ, β, α, γ] = 1/(1 − [α, β, γ, δ]),
[δ, β, γ, α] = 1 − [α, β, γ, δ] ,
[δ, γ, α, β] = 1/ [α, β, γ, δ] ,
[δ, γ, β, α] = [α, β, γ, δ] .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
124
Pour simplifier la lecture, on peut poser x := [α, β, γ, δ] et écrire plutôt :
[α, β, γ, δ] =
x,
[α, β, δ, γ] =
1/x,
[α, γ, β, δ] =
1 − x,
[α, γ, δ, β] =
1/(1 − x),
[α, δ, β, γ] =
1 − 1/x,
[α, δ, γ, β] =
x/(x − 1),
[β, α, γ, δ] =
1/x,
[β, α, δ, γ] =
x,
[β, γ, α, δ] =
1 − 1/x,
[β, γ, δ, α] =
x/(x − 1),
[β, δ, α, γ] =
1 − x,
[β, δ, γ, α] =
1/(1 − x),
[γ, α, β, δ] =
1/(1 − x),
[γ, α, δ, β] =
1 − x,
[γ, β, α, δ] =
x/(x − 1),
[γ, β, δ, α] =
1 − 1/x,
[γ, δ, α, β] =
x,
[γ, δ, β, α] =
1/x,
[δ, α, β, γ] =
x/(x − 1),
[δ, α, γ, β] =
1 − 1/x,
[δ, β, α, γ] =
1/(1 − x),
[δ, β, γ, α] =
1 − x,
[δ, γ, α, β] =
1/x,
[δ, γ, β, α] =
x.
Les permutations qui ne modifient pas le birapport sont donc : (α, β, γ, δ), (β, α, δ, γ),
(γ, δ, α, β) et (δ, γ, β, α).
I.6.38 Le groupe des six homographies qui apparaissent ci-dessus a été identifié à S3 via son action sur {0, 1, ∞} . On obtient donc un morphisme de S4 dans S3 . Ce morphisme est surjectif
(les six homographies apparaissent) et son noyau est constitué de l’identité et des produits de
deux transpositions à support disjoint, qui forment donc un sous-groupe distingué de S4 .
I.6.40 Puisque le groupe des homographies qui laissent invariant H est PSL2 (R) (loc. cit.), le
◦
groupe des homographies qui laissent invariant D(0, 1) est son conjugué g0 PSL2 (R)g0−1 par
z−i
1 −i
l’homographie g0 : z 7→
. Le conjugué G0 SL2 (R)G−1
par
G
:=
est le
0
0
1
i
z+i
groupe formé des matrices :
a b
u v
−1
G0
G0 =
,
c d
v u
c Dunod 2014
I.6 : Groupes classiques
125
a+d
b−c
a−d
b+c
+
i et v :=
−
i sont tels que |u|2 − |v|2 = ad − bc = 1 .
2
2
2
2
z−α
u
L’homographie correspondante est bien z 7→ θ
, avec θ :=
∈ U et
1 − αz
u
◦
v
α := − ∈ D(0, 1) . On laisse le soin au lecteur de montrer réciproquement qu’un tel couple
u
(θ, α) provient bien d’un tel couple (u, v).
où u :=
◦
I.6.41 Il s’agit en fait de déterminer les « droites hyperboliques de D(0, 1) ». Dans tous les cas,
l’image par une homographie d’une droite ou d’un cercle est une droite ou un cercle ; les angles
sont préservés ; la frontière R est envoyée bijectivement sur la frontière (le cercle unité) privé
de 1 , qui est l’image du point à l’infini.
Si l’on part d’une demi-droite verticale d’abcisse x, on obtient donc un arc de cercle orthogonal
x−i
et 1 . Cas particulier : si x = 0 ,
au cercle unité et de points limites (sur le cercle unité)
x+i
c’est le diamètre horizontal.
Si l’on part d’un demi-cercle de points limites x, y , on obtient un arc de cercle orthogonal
x−i
y−i
au cercle unité et de points limites (sur le cercle unité)
et
. Cas particulier : si
x+i
y+i
xy = −1 , ces points limites sont opposés et l’on a encore un diamètre.
Remarquons que les diamètres, qui passent par 0 , sont les images des droites hyperboliques
passant par i.
I.6.42 (i) La longueur minimum d(z, z ′ ) est bien définie d’après le cours. On peut même affiner
la définition en autorisant les chemins de classe C 1 par morceaux ; le raisonnement du texte se
transpose et l’on voit que l’on obtient la même chose qu’avec des chemins C 1 . Cela permet de
démontrer l’inégalité triangulaire pour d : le plus court chemin de z à z ′′ est évidemment plus
court que la juxtaposition du plus court chemin de z à z ′ et du plus court chemin de z ′ à z ′′ .
Les deux autres propriétés d’une distance (positivité, symétrie) sont évidentes.
(ii) D’après le premier exemple de la page 304, il suffit de démontrer qu’un tel couple peut être
amené sur (i, el i), mais cela découle des arguments du paragraphe 3.2.3.
I.6.43 Supposons d’abord que ∆ est une demi-droite verticale d’abcisse a. On trouve alors la
demi-droite verticale passant par M , et tous les demi-cercles de centre réel passant par M et
dont un point limite sur R est compris entre a et l’abcisse de M . Noter que la valeur a est
autorisée.
Si ∆ est un demi-cercle dont les points limites sur R sont a < b , et si l’abcisse de M est c,
il faut distinguer deux cas : si c 6∈ [a, b], la demi-droite verticale passant par M est une telle
parallèle, sinon, elle ne l’est pas. Pour le reste, il s’agit de déterminer les demi-cercles de centre
réel passant par M et ne coupant pas le demi-cercle ∆, ce qui est un joli exercice de géométrie
élémentaire et laissé au lecteur.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
126
Module I.7 : Polynômes à plusieurs indéterminées
I.7.1 Si n = 1 , il est nul et, si n = 2 , il est engendré par X2 − X1 ; dans ces deux cas, il est donc
principal. Si n > 3 , il contient X3 − X2 et X2 − X1 qui sont premiers entre eux. S’il était
principal, il serait égal à K[X1 , . . . , Xn ], ce qui n’est point (car il est inclus dans l’idéal maximal engendré par les Xi ). En conclusion, l’idéal <(Xi − Xj )16i,j6n > de K[X1 , . . . , Xn ] est
principal si, et seulement si, n 6 2 .
I.7.2 (i) On observe d’abord que tout P ∈ K[X1 , . . . , Xn ] admet une unique écriture :
P = (X1k − X1 )Q1 + · · · + (Xnk − Xn )Qn + Qn+1 ,
où le degré de chaque Qi en chaque Xj avec j < i est strictement inférieur à k . En effet,
il suffit d’effectuer la division euclidienne de P (considéré comme polynôme en X1 ) par le
polynôme unitaire X1k − X1 ∈ K[X2 , . . . , Xn ][X1 ], ce qui donne comme quotient Q1 et
comme reste P1 , puis d’effectuer la division euclidienne de P1 (considéré comme polynôme
en X2 ) par le polynôme unitaire X2k − X2 ∈ K[X1 , X3 , . . . , Xn ][X2 ], ce qui donne comme
quotient Q2 et comme reste P2 , etc. Les conditions sur les degrés viennent en remarquant
que, si degXj Pi < k pour j 6 i , alors degXj Qi+1 < k et degXj Pi+1 < k pour j 6 i , la
condition degXi+1 Pi+1 < k découlant de plus de la division euclidienne.
Ce résultat étant acquis, on voit de plus que P ∈ Ek si, et seulement si, Q1 = · · · = Qn = 0 .
Par ailleurs, tout polynôme P ∈ Ik s’écrit a priori P = (X1k − X1 )Q1 + · · · + (Xnk − Xn )Qn
sans condition sur les Qi . En effectuant la division euclidienne de Q2 , . . . , Qn par X1k − X1 ,
on peut leur imposer d’avoir un degré en X1 strictement inférieur à k (pour cela, on incorpore
les quotients dans Q1 ) ; de même, en effectuant la division euclidienne de Q3 , . . . , Qn par
X2k − X2 , on peut leur imposer d’avoir un degré en X2 strictement inférieur à k (pour cela,
on incorpore les quotients dans Q2 ) ; etc. On retrouve alors la forme vue plus haut, mais avec
Qn+1 = 0 . On en conclut donc qu’un polynôme P écrit sous cette forme est dans Ik si, et
seulement si, Qn+1 = 0 . Jointe à l’équivalence déjà obtenue, cette dernière entraîne que Ik et
Ek sont des sous–espaces vectoriels supplémentaires de K[X1 , . . . , Xn ].
Une base de K[X1 , . . . , Xn ]/Ik est donc formée des monômes xα tels que
α1 , . . . , αn ∈ [[0, k − 1]] . On note bien entendu xi := Xi (mod Ik ) les classes des
Xi dans A := K[X1 , . . . , Xn ]/Ik .
La dimension de K[X1 , . . . , Xn ]/Ik est donc le nombre de n-uplets d’entiers de [[0, k − 1]],
soit k n .
(ii) Dans le cas où k = 2 , chaque monôme xα de cette base est de la forme xE , où
E := {i ∈ [[1, n]] | αi = 1} . Les xE forment donc bien une base de A.
Puisque x2i = xi , la règle de multiplication dans cette base est la suivante :
∀E, F ∈ P [[1, n]] , xE xF = xE∪F .
I.7.3 (i) Chaque xi étant idempotent, il en est de même de 1 − xi (si x2 = x, alors
(1 − x)2 = 1 − 2x + x2 = 1 − 2x + x = 1 − x). Les produits d’idempotents étant évidemment idempotents, les uE sont des idempotents de A.
n
Q
En développant l’identité
xi + (1 − xi ) = 1 , on obtient la relation désirée :
i=1
X
E∈P [[1,n]]
c Dunod 2014
uE = 1.
I.7 : Polynômes à plusieurs indéterminées
127
Si E 6= F , il y a par exemple un indice i ∈ E \ F . Alors xi est un facteur de uE et 1 − xi un
facteur de uF . Comme xi (1 − xi ) = 0 , on a bien uE uF = 0 .
Notons d’abord que les uE ne sont pas nuls : de la définition, il ressort en effet que uE = xE +
′
une combinaison linéaire de xE tels que E ′ contient strictement E . Puisque la famille des uE
a le même nombre d’éléments que la base des xE , il suffit, pour prouver que c’est une base, de
P
vérifier qu’elle est libre. Mais, si
λE uE = 0 , en multipliant par un uE particulier, on trouve
λE uE = 0 , donc λE = 0 (puisque l’on a vu que uE 6= 0 ).
P
Tout a ∈ A s’écrit donc a =
λE uE , et, multipliant encore par un uE particulier, on voit
que la composante de a dans KuE est λE uE = auE .
Fixons E ⊂ [[1, n]]. Si E ⊂ F , on a xE uF = uF car tous les facteurs xi de xE sont facteurs
de uF et idempotents. Si E 6⊂ F , il existe un facteur xi de xE tel que 1 − xi est facteur de
P
uF (prendre i ∈ E \ F ), donc xE uF = 0 . Partant de la relation
uF = 1 , on calcule alors :
X
X
xE =
xE uF =
uF .
F ∈P [[1,n]]
F ∈P
[[1,n]]
F ⊃E
Réciproquement, il suffit de développer la formule définissant uE pour obtenir la formule :
X
uE =
(−1)card F −card E xF .
F ∈P
[[1,n]]
F ⊃E
L’écriture de de xi = x{i} dans la base des uE est : xi =
P
E∋i
Alors :
auE =
n X
X
uF uE =
i=1 F ∋i
d’où :
n X
X
uE . Notons a := x1 + · · · + xn .
uE = (card E)uE ,
i=1 E∋i
a=
X
(card E)uE .
E
Les uE étant des idempotents orthogonaux, on en tire :
X
ak =
(card E)k uE .
E
Enfin, l’écriture dans la base de départ s’obtient en combinant les égalités précédentes :
X
X
ak =
(card E)k
(−1)card F −card E xF
E
=
X
F ⊃E
card F
(−1)
F
=
X
F
X
(−1)
E⊂F
card F
(−1)
card E
card
XF
m=0
k
(card E)
!
xF
!
card F
mk xF
(−1)
m
m
(ii) Le jeu consiste à tirer au hasard des entiers (coupons) dans [[1, n]] ; après k tirages, combien
d’entiers distincts a-t’on tiré ? L’ensemble des entiers qui ont été tirés après k tirages est la
(k)
valeur prise par une certaine variable aléatoire. Notons pE la probabilité que cet ensemble
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
128
(k)
(k+1)
soit un certain E ⊂ [[1, n]]. Les relations qui relient les pE et les pE
une égalité dans A :
X (k+1)
x1 + · · · + xn X (k) E
pE
xE =
pE x .
n
E
sont résumées par
E
On en déduit qu’après k tirages :
X
(k)
pE xE
E
=
x1 + · · · + xn
n
k
=
1 k
a .
nk
On peut à partir de la retrouver tous les résultats déjà obtenus, et bien d’autres. Par exemple, on
a:
X (k)
X card E k
E
pE x =
uE ,
n
E
d’où l’on déduit que
P
E
(k)
pE xE
E
tend vers u[[1,n]] = x[[1,n]] lorsque k → +∞, c’est à dire que
la probabilité que l’on ait tiré tous les entiers tend vers 1 , avec une erreur en O
n−1
n
k
.
I.7.4 La preuve se fait par récurrence sur n. Pour n = 1 , le déterminant est X1,1 et l’irréductibilité
est évidente.
Soit n > 2 . Le développement du déterminant le long de la dernière ligne ou de la dernière
colonne donne une égalité de la forme Detn = aXn,n + b , où a, b sont des éléments de
l’anneau A des polynômes en tous les Xi,j tels que (i, j) 6= (n, n). De plus, a = Detn−1 ,
qui est irréductible dans A (hypothèse de récurrence). Or, sur un anneau intègre A, les seules
réductions possibles de aX + b ont la forme c(a′ X + b′ ), où c ∈ A est un diviseur commun de
a et b . Dans notre cas, pour que la réduction soit non triviale, il faut, et il suffit, que a divise b ,
ou encore que Detn divise Detn−1 . Mais cela entrainerait que, pour toute matrice M dont le
premier mineur principal a un déterminant nul, on a det M = 0 . Un contre-exemple est donné,
P
par exemple, par la matrice
Ei,n+1−i ayant des 1 sur la diagonale non principale et des 0
ailleurs.
I.7.5 Notons Cn le déterminant de Cauchy. C’est une fraction rationnelle de dénominateur
Q
Bn :=
(Xi + Yj ) et dont le numérateur est un polynôme homogène An de degré
16i,j6n
1
a deux lignes ou deux colonnes égales dès que
Xi + Yj
l’on substitue Xi := Xi′ avec i 6= i′ ou Yj := Yj ′ avec j 6= j ′ , le déterminant s’annule sous
les mêmes conditions, donc aussi An , qui est nécessairement divisible par tous les Xi − Xi′
et Yj − Yj ′ , donc par leur produit :
Y
Y
An = cA′n , où A′n :=
(Xi − Xi′ )
(Yj − Yj ′ ).
total n2 − n. Comme la matrice des
16i<i′ 6n
16j<j ′ 6n
Par comparaison des degrés, on voit de plus que c ∈ K . Il reste à déterminer cette constante.
Pour cela, on substitue 1/2 + i/T à Xi et 1/2 − j/T à Yj . La matrice obtenue est de la forme
In + M , où M ∈ Mn K(T ) à tous ses coefficients nuls en T = 0 . La fraction rationnelle
c Dunod 2014
I.7 : Polynômes à plusieurs indéterminées
129
F (T ) obtenue par la substitution précédente au déterminant de Cauchy vaut donc 1 en T = 0 .
Par ailleurs :
Y
Y
(1/2 + i/T )− (1/2 + i′/T )
(1/2 − j/T )− (1/2 − j ′/T ) = aT −n(n−1) ,
16i<i′ 6n
où a :=
16j<j ′ 6n
Q
(i − i′ )
16i<i′ 6n
Y
Q
(1/2+i/T +1/2−j/T ) =
16i,j6n
où b0 :=
(j ′ − j) et :
16j<j ′ 6n
Y
16i6=j6n
Q
16i6=j6n
(T +i−j) T −n(n−1) = (b0 +b1 T +· · · )T −n(n−1) ,
(i − j). La valeur prise en T = 0 par la fraction rationnelle obtenue par les
mêmes substitutions dans
A′n
a
est donc
= 1 , et c = 1 .
Bn′
b0
I.7.6 Une relation différentielle algébrique d’ordre 0 satisfaite par sin est un polynôme
P ∈ R[X0 ] tel que P (sin) = 0 , autrement dit, ∀x ∈ R , P (sin x) = 0 , ce qui entraîne
P = 0 (l’image de sin étant infinie). L’idéal des relations différentielles algébriques d’ordre 0
satisfaites par sin est donc l’idéal nul de R[X0 ].
Une relation différentielle algébrique d’ordre 1 satisfaite par sin est un polynôme
P ∈ R[X0 , X1 ] tel que P (sin, cos) = 0 , c’est-à-dire une relation algébrique entre sin et
cos. On a vu en exercice (paragraphe 1.2.1) que l’idéal de ces relations est <X02 + X12 − 1>
(à l’ordre près des deux éléments, mais ceux-ci jouent ici un rôle symétrique). L’idéal des relations différentielles algébriques d’ordre 1 satisfaites par sin est donc l’idéal <X02 + X12 − 1>
de R[X0 , X1 ].
Une relation différentielle algébrique d’ordre 2 satisfaite par sin est un polynôme
P ∈ R[X0 , X1 , X2 ] tel que P (sin, cos, − sin) = 0 . Outre les multiples de X02 + X12 − 1 , il y a
la relation X0 + X2 , traduisant l’équation différentielle sin +(sin)′′ = 0 . Soit P (X0 , X1 , X2 )
une relation arbitraire. La division euclidienne par le polynôme X2 + X0 , qui est unitaire
en X2 , donne P (X0 , X1 , X2 ) = (X2 + X0 )Q(X0 , X1 , X2 ) + R(X0 , X1 ), où R est une relation différentielle algébrique d’ordre 1 satisfaite par sin , donc un multiple de X02 + X12 − 1
dans R[X0 , X1 ]. L’idéal des relations différentielles algébriques d’ordre 2 satisfaites par sin
est donc l’idéal <X02 + X12 − 1, X0 + X2 > de R[X0 , X1 , X2 ].
2
I.7.7 On a f ′ (x) = 2xex . Une relation de dépendance algébrique entre f et f ′ est donc un
2
2
polynôme P ∈ R[X, Y ] tel que ∀x ∈ R , P (ex , 2xex ) = 0 . Soient Pi les composantes
homogènes de P . On a donc :
X 2
∀x ∈ R ,
eix Pi (1, 2x) = 0.
i
La comparaison des ordres de croissance montre que toutes les fonctions polynômiales
Pi (1, 2x) s’annulent à l’infini, donc que tous les Pi sont nuls, donc que P = 0 .
2
2
On a f ′′ (x) = (4x2 + 2)ex , d’où l’équation différentielle f (f ′′ − 2f ) = 2f ′ , et P0 est bien
une relation différentielle algébrique d’ordre 2 satisfaite par f .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
130
I.7.8 Soit P un élément quelconque de I . On a vu en exercice (module « Polynômes » du [L1])
que l’on peut effectuer une division euclidienne de P par le polynôme P0 non unitaire en X2 ,
sous la forme :
X2d P (X0 , X1 , X2 ) = P0 (X0 , X1 , X2 )Q(X0 , X1 , X2 ) + R(X0 , X1 ).
Puisque R est une relation entre f et f ′ , il découle de l’exercice précédent que R = 0 . Puisque
P0 divise X2d P et qu’il est premier avec X2 , il divise P , d’où la conclusion voulue,
I.7.9 Notons Pi les composantes homogènes de P . L’égalité ∀t ∈ K ∗ , P (tX) = tk P (X)
entraîne, pour chaque degré i , l’égalité ∀t ∈ K ∗ , (tk − ti )Pi (X) = 0 , donc, pour chaque i
tel que Pi 6= 0 , l’égalité ∀t ∈ K ∗ , tk − ti = 0 .
Si K est un corps infini, cela n’est possible que si i = k et le polynôme P est en effet
homogène de degré k .
Si K est un corps fini à q éléments, la relation ∀t ∈ K ∗ , tk − ti = 0 est équivalente à
i ≡ k (mod q − 1), et l’on n’a pas nécessairement P ∈ Sk . Par exemple, un polynôme dont
les composantes homogènes sont de degrés des puissances de q se comporte comme une forme
linéaire : il vérifie ∀t ∈ K ∗ , P (tX) = tP (X).
I.7.10 Écrivons P =
P
d6i6d′
Pi et Q =
P
Qj les décompositions respectives de P et Q en
e6j6e′
sommes de polynômes homogènes, avec Pd et Qe non nuls (ce sont donc les composantes de
plus bas degrés) et Pd′ et Qe′ non nuls (ce sont donc les composantes de plus hauts degrés). La
composante homogène de plus bas degré de P Q est Pd Qe , de degré d + e , et sa composante
homogène de plus haut degré est Pd′ Qe′ , de degré d′ + e′ (en effet, ces polynômes sont non
nuls). Si P Q est homogène, on a donc d + e = d′ + e′ , donc (puisque d 6 d′ et e 6 e′ )
d = d′ et e = e′ : les polynômes P et Q sont donc homogènes.
I.7.11 Les fractions rationnelles homogènes de degré 0 sont les P/Q où P et Q sont homogènes de même degré. Pour obtenir un corps, il faut naturellement convenir que 0 est
également une fraction rationnelles homogène de degré 0 , ce qui est un abus, mais simplifie le langage. Les égalités (P1 /Q1 ) − (P2 /Q2 ) = (P1 Q2 − P2 Q1 )/(Q1 Q2 ), 1 = 1/1 ,
(P1 /Q1 )(P2 /Q2 ) = (P1 P2 )/(Q1 Q2 ) et (P1 /Q1 )−1 = Q1 /P1 montrent que l’on a bien un
sous-corps, et il est clair qu’il contient K et les Xi /Xj . Enfin, si P et Q sont homogènes de
degré d, on calcule :
P (X1 , . . . , Xn )
X d P (1, X2 /X1 , . . . , Xn /X1 )
P (1, X2 /X1 , . . . , Xn /X1 )
= 1d
,
=
Q(X1 , . . . , Xn )
Q(1, X2 /X1 , . . . , Xn /X1 )
X1 Q(1, X2 /X1 , . . . , Xn /X1 )
ce qui entraîne que P/Q appartient au corps engendré sur K par les Xi /X1 , et, a fortiori, au
corps engendré sur K par les Xi /Xj .
I.7.12 Puisque L1 , . . . , Lr sont des éléments linéairement indépendants du K -espace vectoriel
S1 , ils peuvent être complétés en une base, et il existe ϕ ∈ GL(S1 ) tel que ϕ(Li ) = Xi
c Dunod 2014
I.7 : Polynômes à plusieurs indéterminées
131
pour i = 1, . . . , r . Soit ψ := ϕ−1 . Notons Φ (resp. Ψ ) l’unique endomorphisme de la K algèbre K[X1 , . . . , Xn ] tel que Xi 7→ ϕ(Xi ) (resp. tel que Xi 7→ ψ(Xi )) pour i = 1, . . . , n.
Alors Φ et Ψ sont en particulier K -linéaires, donc se restreignent en ϕ et en ψ sur S1 , donc
Ψ ◦ Φ et Φ ◦ Ψ se restreignent en IdS1 , donc sont égaux à IdK[X1 ,...,Xn ] : ce sont donc des
automorphismes de K[X1 , . . . , Xn ]. Enfin, si F est un polynôme en r indéterminées, alors
ϕ F (L1 , . . . , Lr ) = F (X1 , . . . , Xr ), d’où la conclusion. On notera que, bien que ce soit la
principale application, la restriction au cas où F est homogène de degré k est inutile.
I.7.13 (i) Dans le cas où F := Y1α1 · · · Yrαr , est un monôme de degré k := α1 + · · · + αr , l’expression F (P1 + Q1 , . . . , Pr + Qr ) − F (P1 , . . . , Pr ) est une combinaison linéaire de termes
de la forme P1β1 Qγ11 · · · Prβr Qγr r , où βi + γi = αi pour i = 1, . . . , r et où l’un au moins
des γi est non nul. L’ordre de chacun de ces termes est donc strictement plus grand que k . Si
F est homogène de degré l > k , la conclusion demeure a fortiori. Si F est de valuation k ,
pour chaque monôme G de F − In(F ), de degré l , l’expression G(P1 , . . . , Pr ) est d’ordre
l > k (ou bien nulle). Finalement, on voit que F (P1 + Q1 , . . . , Pr + Qr ) − F (P1 , . . . , Pr ) et
F (P1 , . . . , Pr ) − In(F )(P1 , . . . , Pr ) sont bien de valuations strictement plus grandes que k . Si
F (P1 + Q1 , . . . , Pr + Qr ) = 0 , on en conclut que In(F )(P1 , . . . , Pr ) = 0 , donc In(F ) = 0
d’après l’exercice précédent, ce qui contredit la définition de la forme initiale : on a donc nécessairement F = 0 .
(ii) Les mêmes calculs montrent que, si F (P1 , . . . , Pn ) = Xi , alors F est d’ordre 1 et
In(F ) In(P1 , . . . , In(Pn ) = Xi , autrement dit, que chaque Xi est combinaison linéaire des
formes homogènes In(Pi ) : cela n’est possible que si ces dernières sont linéaires et engendrent
S1 , donc en forment une base.
I.7.14 L’indication conduit immédiatement à une solution. En voici une autre. Le polynôme ci (A)
est une combinaison linéaire de déterminants de sous-matrices carrées d’ordre i de A ; chacun
de ces déterminants est un polynôme homogène de degré i en les coefficients de A.
I.7.15 Si P est homogène de degré k , on a, dans le corps des fractions rationnelles,
P (X, Y, Z) = Z k P (X/Z, Y /Z, 1). Si P (X, Y, 1) = 0 , alors P (X/Z, Y /Z, 1) = 0 et P = 0 .
I.7.16 On a bien entendu P h (1, X1 , . . . , Xn ) = P , comme cela est du reste indiqué dans le cours.
Mais il n’est pas toujours vrai que, si P (X1 , . . . , Xn ) := Q(1, X1 , . . . , Xn ), on ait P h = Q .
Par exemple, si Q(X0 , X1 ) = X0 , alors P = 1 , donc P h = 1 .
Le lecteur vérifiera sans peine (en tout cas, avec interêt) que, si X0 ne divise pas Q , alors (avec
les notations précédentes) P h = Q . Plus généralement, si Q = X0r Q1 , où X0 ne divise pas
Q1 , alors P h = Q1 .
I.7.17 Rappelons que l’on note pk le projecteur de K[X1 , . . . , Xn ] sur Sk qui, à chaque polynôme P , associe sa composante homogène de degré k , pk (P ). On a vu dans le cours que, si
P est homogène de degré d, pk (P Q) = P pk−d (Q) (ou 0 si d > k ).
Supposons (i) vérifiée, et soit (Pi ) une famille génératrice formée de polynômes homogènes ;
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
132
P
notons di le degré de Pi . Soit P =
Pi Qi ∈ I . Alors, d’après la formule rappelée ci-dessus,
P
pk (P ) =
Pi pk−di (Qi ). La composante homogène pk (P ) est donc dans I : on a prouvé
di >k
que (i) implique (ii).
Supposons (ii) vérifiée, et soit (Pi ) une famille génératrice arbitraire de I . Alors les composantes homogènes des Pi sont dans I et en forment donc une famille génératrice : on a prouvé
que (ii) implique (i).
Il est immédiat que la troisième condition implique (ii). Réciproquement, (ii) implique
P
L
I=
(I ∩ Sk ), et le fait que la somme soit directe est conséquence de S =
Sk .
k∈N
k∈N
I.7.18 On le montre par récurrence sur |α|. Pour |α| = 0 , c’est trivial ( Dα est l’identité). Pour
|α| > 1 , on le montre par récurrence sur k . Pour k = 0 , il n’y a rien à prouver (par convention,
I l = K[X1 , . . . , Xn ] pour l 6 0 ). Un élément de I k+1 est une somme de termes de la
forme P Q , où P ∈ I et Q ∈ I k . Il suffit donc de montrer que, pour un tel terme, on a
Dα (P Q) ∈ I k+1−|α| . On écrit la formule de Leibniz :
X α!
Dα (P Q) = P Dα (Q) +
(Dβ P )(Dγ Q).
β!
γ!
β+γ=α
β6=0
Le terme P Dα (Q) est dans II k−|α| = I k+1−|α| (hypothèse de récurrence sur k ). Chacun des
facteurs Dγ Q des termes (Dβ P )(Dγ Q) est dans I k+1−|α| , car Dγ Q ∈ I k−|γ| ⊂ I k+1−|α|
(hypothèse de récurrence sur |α|, jointe au fait que β 6= 0 ⇒ |γ| < |α|).
Voici une autre preuve, qui ne fait pas appel à la formule de Leibniz. Il suffit de montrer que,
pour chacune des dérivations Di , on a l’inclusion Di (I k ) ⊂ I k−1 (le cas général s’en déduit
en itérant cette relation, comme, par exemple, dans la preuve de la relation (5), page 327). Pour
k = 0 , c’est trivial (cf. convention ci-dessus). Pour k > 1 , un élément de I k est une somme
de termes de la forme P := P1 · · · Pk , où P1 , . . . , Pk ∈ I . Il suffit de prouver que, pour un tel
terme, Di (P ) ∈ I k−1 . Mais :
Di (P ) =
k
X
j=1
Di (Pj )P1 · · · Pˆj · · · Pk ,
où le facteur Pˆj est, par convention, absent. Les k termes de cette somme sont bien éléments
de I k−1 .
∂σ1
∂σ1
= 1 . Si n > 2 et k = 1 , on trouve de même
=1
∂X1
∂Xi
(pour i = 1, . . . , n). Si n, k > 2 , un calcul immédiat donne :
I.7.19 (i) Si n = 1 , on a simplement
∂σk
= σk−1 (X1 , . . . , X̂i , . . . , Xn ),
∂Xi
où l’argument X̂i est, par convention, absent. Si l’on convient que σ0 = 1 , ce cas recouvre les
précédents.
On en déduit :
n
∂σk (Q1 , . . . , Qn ) X
∂Qi
=
σk−1 (Q1 , . . . , Q̂i , . . . , Qn )
·
∂Yj
∂Yj
i=1
c Dunod 2014
I.7 : Polynômes à plusieurs indéterminées
133
(ii) Par application de la proposition 10 de la page 326, on trouve :
n
X
d
P Q1 (T ), . . . , Qn (T ) =
(Di P ) Q1 (T ), . . . , Qn (T ) Q′i (T ).
dT
i=1
(iii) De même :
n
n
X
∂ P (T X1 , . . . , T Xn )
∂(T Xi ) X
=
(Di P )(T X1 , . . . , T Xn )
=
Xi (Di P )(T X1 , . . . , T Xn ).
∂T
∂T
i=1
i=1
En substituant 1 à T , on retrouve la formule d’Euler.
I.7.20 Il s’agit de démontrer l’égalité :
n
∂(P ◦ Q) X ∂Qj ∂P
=
(Q1 , . . . , Qn ).
∂Yi
∂Yi ∂Xj
j=1
Mais c’est une conséquence de la 10 de la page 326.
I.7.21 Si P 7→ P ◦ Q est un automorphisme, les Xi sont dans l’image, donc leurs gradients sont
∂(Q1 , . . . , Qn )
dans l’image de la matrice
(exercice précédent). En évaluant en (0, . . . , 0), on
∂(X1 , . . . , Xn )
obtient la condition voulue.
P Dα P (0, . . . , 0) α
X . C’est un polynôme homogène de degré k .
α!
|α|=k
P
Pk . On a donc bien Pk = pk (P ).
D’après l’une des formules de Taylor, P =
I.7.22 Notons Pk :=
k>0
Prenant k := ω(P ), on sait que pk (P ) = In(P ), d’où la deuxième formule.
I.7.23 Comme dans la preuve de la formule de Taylor (théorème 12 de la page 328), on a a priori
une relation de la forme :
X
P (X1 + Y1 , . . . , Xn + Yn ) =
pα X α , pα ∈ L := K(Y1 , . . . , Yn ).
et l’on note ∆α P (Y1 , . . . , Yn ) le coefficient pα . En posant B := K[Y1 , . . . , Yn ] et
en raisonnant dans l’anneau K[X1 , . . . , Xn , Y1 , . . . , Yn = B[X1 , . . . , Xn ], on voit que
∆α P ∈ K[Y1 , . . . , Yn ].
Soient λ, µ ∈ K . Le coefficient en X α du polynôme :
(λP + µQ)(X1 + Y1 , . . . , Xn + Yn ) ∈ B[X1 , . . . , Xn ]
est la combinaison linéaire correspondante des coefficients en X α des polynômes :
P (X1 + Y1 , . . . , Xn + Yn ), Q(X1 + Y1 , . . . , Xn + Yn ) ∈ B[X1 , . . . , Xn ],
i.e. ∆α (λP + µQ) = λ∆α P + µ∆α Q : on a donc bien une application linéaire.
De l’égalité P (X1 +Y1 , . . . , Xn +Yn )Q(X1 +Y1 , . . . , Xn +Yn ) = (P Q)(X1 +Y1 , . . . , Xn +Yn ),
on tire :
X
X
X
∆γ P (Y1 , . . . , Yn )X γ =
∆α (P Q)(Y1 , . . . , Yn )X α .
∆β P (Y1 , . . . , Yn )X β
β
γ
α
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
134
En identifiant les coefficients de X α , on en déduit la formule :
X
∆α (P Q) =
∆β (P )∆γ (Q).
β+γ=α
Pour prouver la dernière assertion, nous allons introduire de nouvelles indéterminées
Z1 , . . . , Zn ; nous laissons au lecteur le soin d’identifier les anneaux dans lesquels ont lieu
les égalités qui suivent :
X
P (X1 + Y1 + Z1 , . . . , Xn + Yn + Zn ) =
(∆α P )(Y1 + Z1 , . . . , Yn + Zn )X α
X
=
∆β (∆α P )(Z1 , . . . , Zn )X α Y β .
Par ailleurs :
P (X1 + Y1 + Z1 , . . . , Xn + Yn + Zn ) =
=
=
P (X1 + Y1 ) + Z1 , . . . , (Xn + Yn ) + Zn
X
(∆α P )(Z1 , . . . , Zn )(X + Y )α


X
X (β + γ)!
(∆α P )(Z1 , . . . , Zn ) 
XβY γ .
β! γ!
β+γ=α
En identifiant les coefficients de X β Y γ dans les deux polynômes, on obtient bien la formule
(β + γ)!
∆β+γ =
∆β ◦ ∆γ .
β! γ!
1 α
Lorsque K est de caractéristique nulle, la formule de Taylor nous dit que ∆α =
D .
α!
La première formule est donc la formule de Leibniz et la deuxième formule est simplement
Dβ+γ = Dβ ◦ Dγ .
Q
(Xσ(j) − Xσ(i) ) s’annule si, et seulement si, Xσ(i) = Xσ(j) , pour un
Q
(Xj − Xi ). Vus les degrés, il est de la forme
i 6= j , c’est donc un multiple de ∆n :=
I.7.26 Le produit
16i<j6n
16i<j6n
ε(σ)∆n avec ε(σ) ∈ C∗ . Il est de plus évident que ε est un morphisme de groupes qui prend
la valeur −1 pour les transpositions. Enfin, dans le passage de ∆n au produit ci-dessus, chaque
facteur est multiplié par −1 si, et seulement si, il correspond à une inversion de σ .
I.7.27 (i) Si P 6= 0 et Φσ (P ) = λσ P pour tout σ , en composant on trouve que
Φστ (P ) = λσ λτ P = λστ P , d’où λσ λτ P = λστ : c’est donc bien un morphisme de groupes
de Sn dans C∗ , il est donc trivial, dans lequel cas P est un polynôme symétrique, ou égal au
morphisme signature.
(ii) est immédiat.
(iii) Si P est alterné, en faisant Xi = Xj (avec i 6= j ) on obtient un polynôme égal à son
opposé, donc nul ; donc chaque Xi − Xj divise P , donc ∆n divise P et l’on a P = ∆n P1 ,
où P1 est symétrique puisque P est alterné.
Dans le cas d’une fraction irréductible symétrique R = P/Q , soit P et Q sont symétriques ;
soit ils sont tous deux alternés, donc divisibles par ∆n , ce qui contredirait l’irréductibilité de R .
I.7.31 Le cas de la caractéristique nulle est immédiat avec l’indication. Si la caractéristique est
p > 0 , prendre n = p et tous les αi := 1 .
c Dunod 2014
I.7 : Polynômes à plusieurs indéterminées
135
I.7.32 (i) Soient Q un facteur irréductible de P , K ′ := K[X]/<Q> et x la classe de X dans
K ′ . Alors K ′ est un corps, une extension de K , et l’on y a P (x) = classe de P (X) = 0
puisque Q|P .
(ii) Dans K ′ [X] on a P = Q1 P1 , où Q1 est non constant et scindé, et l’on recommence avec
P1 .
(iii) Il suffit de remplacer le corps algébriquement clos de la démonstration par une extension
dans lequel le polynôme concerné est scindé (« corps de décomposition », voir [MPA1]).
I.7.33 (i) On a T n P (1/T ) =
n
Q
(T − λi ) : on reconnaît le polynôme caractéristique
i=1
χA (T ) := det(T In − A).
P′
est la somme des développeP
′
P k k
P
ments des −T i avec Pi := 1 − λi T et chacun de ces derniers est égal à
λi T . Comme
Pi
k>1
(ii) Le développement en série formelle (ou entière) de −T
Tr(Ak ) est la somme des λki pour i = 1, . . . , n, la formule vient.
Le rayon de convergence de cette série est en général (c’est-à-dire sauf s’il y a des annulations)
l’inverse du maximum des modules des valeurs propres.
Le calcul des sommes de Newton se ramène donc à un développement en série.
I.7.36 L’algorithme de Newton permet d’écrire les coefficients de Pk comme polynômes à coefficients entiers en les fonctions symétriques élémentaires des xi , donc en les coefficients de
P . On en déduit que Pk (X) ∈ Z[X]. Comme conséquence de l’hypothèse, les coefficients de
tous les Pk sont uniformément majorés en module par 2n . Il n’y a donc qu’un nombre fini de
polynômes Pk différents, donc, pour chaque xi , un nombre fini de puissances xki différentes.
Tous les xi sont donc des racines de l’unité.
I.7.40 À l’indication il suffit d’ajouter que si la fonction polynomiale (continue et nulle sur une
partie dense donc nulle partout) est nulle, le polynôme l’est également puisque le corps est
infini.
I.7.41 (i) Toute matrice A telle que Sep(A) 6= 0 admet n valeurs propres distinctes donc est
diagonalisable. L’ensemble des matrices diagonalisables contient donc le complémentaire du
lieu d’annulation de Sep, et il suffit de vérifier que ce polynôme n’est pas nul pour conclure à
la Zariski-densité. Mais le corps étant infini (puisqu’algébriquement clos) on peut former une
matrice diagonale dont les éléments diagonaux sont deux à deux distincts, et elle n’annule pas
Sep.
(ii) Soit A = P DP −1 , où D est diagonale. Alors χA = χD et :
χA (A) = χD (A) = χD (P DP −1 ) = P χD (D)P −1 = 0,
puisque χD (D) est la matrice diagonale formée des χD (λi ) = 0 , les λi désignant les valeurs
propres de A, donc les coefficients diagonaux de D .
(iii) Notons di,j (A) les coefficients de la matrice χA (A). Chaque di,j est un polynôme sur
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
136
Mn (K) qui s’annule sur le sous-ensemble Zariski-dense des matrices diagonalisables, donc
qui est nul.
Pour étendre ce résultat à un corps arbitraire, il suffit de considérer les matrices qui sont diagonalisables dans un corps de décomposition de leur polynôme caractéristique (exercice I.7.32).
I.7.43 On a Res(A, B) = Resp,1 (A, B) = det Sp,1 (A, B), où :


a0
µ 0 ... 0
 a1
λ µ . . . 0


 ..
.. . .
..  .
..
Sp,1 (A, B) =  .

.
.
.
.


ap−1 0 . . . λ µ
ap
0 ... 0 λ
En développant par rapport à la première colonne, on trouve un terme a0 λp , puis des termes
ai multipliés par (−1)i det Mi où Mi est une matrice diagonale par blocs avec deux blocs :
• Un bloc Ai carré de taille i avec des µ sur la diagonale, des λ juste au dessous et des 0
ailleurs, d’où det Ai = µi ;
• un bloc Bi carré de taille p − i avec des λ sur la diagonale, des µ juste au dessus et des
0 ailleurs, d’où det Bi = λp−i . On a donc det Mi = µi λp−i , d’où la formule demandée.
On peut également utiliser des opérations sur les lignes et les colonnes :
L0 ← L0 − (µ/λ)L1 + (µ2 /λ2 )L2 − . . .
donne une matrice triangulaire, le reste du calcul étant laissé au lecteur.
I.7.44 Si l’on note x0 , . . . , xq−1 les coefficients de P et y0 , . . . , yp−1 ceux de Q , la condition
AP + BQ = 0 se traduit par un système de p + q équations à p + q inconnues :
a0 x0 + b0 y0 = 0
a1 x0 + a0 x1 + b1 y0 + b0 y1 = 0
··· = ···
ap xq−1 + bq yp−1 = 0.
La matrice carrée de taille p + q de ce système est exactement Sp,q (A, B) et l’annulation de
son déterminant équivaut à l’existence de solutions non triviales.
I.7.46 Le calcul de Resp,q (λA, µB) comporte deg B colonnes multipliées par λ et deg A colonnes multipliées par µ, d’où, par multilinéarité du déterminant, la formule :
Resp,q (λA, µB) = λdeg B µdeg A Resp,q (A, B),
autrement dit, Resp,q est bihomogène de bidegré (deg B, deg A).
I.7.49 Pour projeter sur le plan des y, z , on élimine x, d’où l’annulation du déterminant :
2
y + z 2 − 1
0
y2
0 0
y 2 + z 2 − 1 −1 y 2 ,
1
0
1 −1
0
1
0
1
c Dunod 2014
I.7 : Polynômes à plusieurs indéterminées
137
ce qui donne l’équation y 2 + z 2 (z 2 − 1) = 0 . Le relèvement est garanti, puisque l’on a deux
polynômes unitaires en x. Le lecteur vérifiera que les équations des deux autres projections
sont (x + z 2 − 1)2 = 0 (parabole comptée avec « multiplicité » 2 ) et x2 − x + y 2 = 0 (cercle).
Noter que ces équations concernent des coubes dans C2 , nous éludons les questions de réalité :
faites appel à Maple pour voir ce qu’il en est ! (Des dessins figurent dans [MPA1].)
I.7.50 Nous laissons le lecteur trouver l’équation x2 −y 2 z = 0 . Mais ici le théorème de relèvement
ne s’applique pas car uv − x n’est unitaire ni en u ni en v .
Si l’on s’en tient aux solutions réelles, noter que l’équation cartésienne x2 − y 2 z = 0 permet
x = y = 0 avec z arbitraire, alors que le paramétrage emplique z > 0 .
I.7.51 Le plus simple est d’invoquer le théorème 24 de la page 341 avec A = tn −x et B = tp −y ,
d’où, en notant µp l’ensemble des racines p èmes de l’unité dans C, η une racine p ème de y ,
Q
d’où B =
(t − jη) ; et d := n ∧ p, n = dn′ , p = dp′ :
j∈µp
Res(A, B) =
Y
j∈µp
((jη)n − x) = (−1)p y n
Y
j∈µp
(x/η n − j n ).
Lorsque j parcourt µp , j n parcourt d fois µp′ , et :
′
′
′
Res(A, B) = (−1)p y n ((x/η n )p − 1)d = (−1)p (xp − y n )d .
I.7.54 On doit calculer le déterminant :
−Y
0
0
−2(X − 1)
0
0
0
−2(X − 1)
−Y
0
0
−2(X − 1)
0
0
0
−2(X − 1)
−Y
−6(X + 1)
0
−2(X − 1)
0
−2(X + 1)
0
−2(X − 1)
4Y
−6(X + 1)
0
−2(X − 1)
Y
−2(X + 1)
0
0
4Y
−6(X + 1)
0
0
Y
−2(X + 1)
0
0
4Y
−6(X + 1)
0
0
Y
−2(X + 1)
0
0
4Y
I.7.55 Posant t := tan(θ/2), on sait que sin 2θ =
t2
2t
t2 − 1
et cos θ = 2
. Pour exprimer
+1
t +1
tan 2θ , on fait appel à Maple
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
138
Module I.8 : Structures discrètes et récursivité
I.8.2 Les deux premières égalités sont triviales. On a alors :
f = ũũ
˜ = uũ,
uũ
qui est donc un palindrome. Mais par exemple le mot aba, qui est un palindrome, n’est pas de
cette forme. En fait, les uũ sont exactement les palindromes de longueur paire (prouvez-le !) et
ceux de longueur impaire sont exactement les uxũ , où x est une lettre.
I.8.3 Si w = u1 vu2 et w′ = u1 ṽu2 , alors xw = (xu1 )vu2 et xw′ = (xu1 )ṽu2 ; ainsi on a bien
l’implication w R w′ ⇒ xw R xw′ .
Supposons réciproquement que xw R xw′ , i.e. xw = u1 vu2 et xw′ = u1 ṽu2 . Si u1 est non
vide, on a donc u1 = xu′1 , d’où w = u′1 vu2 et w′ = u′1 ṽu2 , et l’on conclut que w R w′ .
Si u1 est le mot vide, on a xw = vu2 et xw′ = ṽu2 . Si v est le mot vide, w = w′ et l’on a
fini. Si v est de longueur 1 , on a v = x et à nouveau w = w′ . Si |v| > 2 , on a v = xv ′ puis
w = v ′ u′2 et w′ = v˜′ u′2 avec u′2 := xu2 , d’où encore une fois la conclusion w R w′ . Le cas
de l’hypothèse wx R w′ x se traite de même.
Les programmes CAML qui suivent prennent en compte deux mots u, v et comparent le sousmot de u formé des lettres de rang i à j au sous-mot de v formé des lettres de rang k à l .
let miroir u v =
let rec aux i j k l = ((l-k) == (j-i)) &&
((j < i) || ((u.[i] == v.[l]) && (aux (i+1) j k (l-1))))
in aux;;
let recombine u v =
let rec aux i j k l = ((l-k) == (j-i)) &&
((j < i) || ((u.[i] == v.[k]) && (aux (i+1) j (k+1) l))
|| ((u.[j] == v.[l]) && (aux i (j-1) k (l-1)))
|| (miroir u v i j k l))
in aux;;
Pour comparer u et v en entier, il suffit d’écrire :
let n = String.length u and p = String.length v
in recombine u v 0 (n-1) 0 (p-1);;
I.8.5 Pour chacune des trois relations, temporairement notées ≺ , on vérifie sans peine les propriétés suivantes :
u ≺ v =⇒ |u| 6 |v| ,
u ≺ v et |u| = |v| =⇒ u = v.
Pour toute suite (un ) décroissante (pour l’une quelconque de ces relations), la suite d’entiers
(|un |) décroît également, donc stationne, et la suite (un ) stationne au même rang.
Si v = ab , les facteurs a et b de v ne sont pas comparables.
c Dunod 2014
I.8 : Structures discrètes et récursivité
139
I.8.6 Puisque wk wl = wk+l = wl wk , il est clair que si u, v ∈ w∗ , alors uv = vu . Pour la
réciproque, on va raisonner par récurrence forte sur |u| + |v|. Si cet entier est nul, les deux
mots sont vides et on a terminé. Sinon, u et v jouant un rôle symétrique, on peut supposer que
|u| 6 |v| . d’après le lemme indiqué, on a donc v = uv ′ et v = v ′ u , d’où uv ′ = v ′ u . Soit u
est vide et la conclusion est immédiate, soit |u| + |v ′ | < |u| + |v| et l’hypothèse de récurrence
entraîne que u, v ′ ∈ w∗ , d’où v = uv ′ ∈ w∗ .
Pour la deuxième équivalence, on a encore une implication facile : si u, v ∈ w∗ , par exemple
u = wa et v = wb , alors soit a ou b est nul et le lecteur trouvera sans peine la conclusion, soit ab 6= 0 et l’on peut prendre (k, l) := (b, a). Supposons donc réciproquement que
uk = v l , avec l 6= 0 . Plutôt que de suivre l’indication (voie que le lecteur mènera facilement à
bien), nous allons esquisser une méthode entièrement différente. Encore une fois on peut supposer u et v non vides (sinon c’est très facile). L’égalité des longueurs permet d’introduire
N := k |u| = l |v| . Le mot uk = v l est une fonction de {0, . . . , N − 1} dans l’alphabet X
concerné. On peut donc l’étendre en une (unique) fonction N -périodique W de Z dans X .
Cette fonction est en fait |u|-périodique (car elle étend uk ) et |v| -périodique (car elle étend
v l ). Soit n le pgcd des longueurs |u| et |v|. La fonction W est n-périodique puisque, d’après
le théorème de Bézout, n appartient au groupe engendré par les périodes |u| et |v| . Soit w la
restriction de W à {0, . . . , n − 1} . Alors W est l’unique extension n-périodique de w et l’on
voit facilement que u, v ∈ w∗ .
I.8.7 (i) Si w = uv et w′ = vu , alors vw = vuv = w′ v .
Supposons réciproquement qu’il existe un mot v tel que vw = w′ v ; donc w et w′ ont même
longueur ℓ . On raisonne par récurrence forte sur ℓ . Si ℓ = 0 , la conclusion est immédiate.
Sinon, on invoque le lemme suggéré en indication. Deux cas sont possibles. Si |v| > ℓ , le
lemme dit que v = v1 w = w′ v1 avec |v1 | = |v| − ℓ < |v|, qui est une relation similaire ; on
peut donc réitérer, jusqu’à arriver au deuxième cas du lemme. Autrement dit, on peut supposer
que |v| < ℓ . Alors le lemme donne directement la conclusion voulue.
(ii) Soit w un mot de longueur n et soit t ∈ Z/nZ. Pour tout i ∈ {0, . . . , n − 1} on peut
définir i+t ∈ {0, . . . , n−1} comme l’unique représentant de i+t ∈ Z/nZ dans cet intervalle.
Alors en posant w′ (i) := w(i + t), on définit un mot w′ de longueur n, que l’on peut noter
t.w : on a bien une action de Z/nZ sur X n (la vérification des deux axiomes 0.w = w et
(t + t′ ).w = t.(t′ .w) est laissée au lecteur).
Si w = uv et si t est la classe de |u|, alors t.w = vu , ce qui montre que l’orbite de w est
l’ensemble de ses conjugués.
Le plus petit entier d > 0 dont la classe fixe w est sa période s’il en a une : alors w = un/d ,
où u est le préfixe de w de longueur d. C’est le plus petit mot u tel que w ∈ u∗ .
I.8.9 Dans la première série d’égalités, il y a une faute typographique . . . Il faut lire
(a∗ b)∗ a∗ = a∗ (ba∗ )∗ = (a + b)∗ .
Tous les langages indiqués sont inclus dans {a, b}∗ . Il suffit donc de prendre w ∈ {a, b}∗
arbitraire et de montrer qu’il appartient à chacun de ces langages. Nous montrerons que
w ∈ (a∗ b)∗ a∗ , l’autre cas se traitant de manière analogue. On raisonne (brièvement) par récurrence forte sur la longueur de w . Si elle est nulle, w est vide et c’est immédiat. Soit ak le plus
long préfixe de w dans a∗ et notons w = ak w′ . Si w′ est vide, w ∈ a∗ , donc w ∈ (a∗ b)∗ a∗ .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
140
Sinon, w′ = bw′′ (maximalité de k ) et l’hypothèse de récurrence appliquée à w′′ (qui est
strictement plus court que w ) montre que w′′ ∈ (a∗ b)∗ a∗ , donc qu’il en est de même de
w = ak bw′′ .
Par des arguments du même genre, on montre que (ab)∗ a et a(ba)∗ décrivent tous deux le
langage des mots où a et b alternent, et qui de plus commencent et finissent par a.
S
S
I.8.11 On a en général L Li = LLi (une forme généralisée de distributivité puisque l’on
autorise des familles infinies), d’où :
[
[
[
LL∗ = L
Ln =
LLn =
Ln = L+ .
n>0
n>0
n>1
La relation L+ = L∗ L se démontre de la même manière. Par ailleurs :
[
[
L∗ =
Ln = L0 ∪
Ln = {ε} ∪ L+ ,
n>0
∗
n>1
+
autrement dit L = ε + L .
L’égalité (ε + L)+ = L∗ s’obtient facilement par double inclusion, on laisse cette tâche au
lecteur.
I.8.12 On utilise de l’exercice précédent le fait que ε + L1 .L∗1 = L∗1 . En multipliant à droite par
L2 + L3 , il vient L2 + L3 + L1 L = L . Mais L3 ⊂ L ⇒ L3 ⊂ L1 L (puisque ε ∈ L1 ), donc
L3 + L1 L = L1 L et l’on obtient la formule désirée.
I.8.13 Notant Φ(X) := L1 X + L2 , nous laissons au lecteur le soin de prouver que l’application Φ
S
S
est croissante (pour l’inclusion) et vérifie Φ( Xi ) = Φ(Xi ).
On définit alors une suite (Xn ) de langages par X0 := ∅ et Xn+1 := Φ(Xn ), puis on pose
S
X :=
Xn . Des propriétés de Φ, on déduit immédiatement que la suite (Xn ) est croissante
n>0
pour l’inclusion et que X en est un point fixe, i.e. il est solution de l’équation d’Arden.
Si L est une autre solution, on a d’une part L = Φ(L), d’autre part X0 ⊂ L . Par application
itérée de Φ et invocation de ses propriétés, on montre par récurrence quz Xn ⊂ L pour tout
n, donc que X ⊂ L , et X est bien le plus petit point fixe de Φ (et la plus petite solution).
I.8.14 Avec les notations de la proposition, on introduit deux vecteurs et une matrice carrée de
langages :
 
 


L1
B1
A1,1 . . . A1,n
 
 

..  .
..
L :=  ...  , B :=  ...  , A :=  ...
.
. 
Ln
Bn
An,1 . . . An,n
Avec des définitions naturelles pour la somme et le produit de vecteurs et matrices, le système
étudié se ramèe à l’équation vectorielle L = AL + B . En itérant cette relation, vue sous la
forme d’équation au point fixe pour l’opérateur X 7→ B + AX (sur les vecteurs de langages),
on trouve :
L = B + AB + · · · + Ak−1 B + Ak L.
c Dunod 2014
I.8 : Structures discrètes et récursivité
141
Ceci suggère la solution :
L=
[
Ak B = A∗ B, où A∗ :=
k>0
[
Ak ,
k>0
la réunion de ces vecteurs de langages étant définie coefficient par coefficient.
On peut justifier cette égalité comme suit : puisque les langages Ai,j sont tous propres, les n
langages qui composent le vecteur Ak B ne contiennent que des mots de longueur > k . Si l’on
note Lk := B + AB + · · · + Ak−1 B , on voit donc que les langages composant le vecteur
L \ Lk (différence ensembliste appliquée coefficient par coefficient) ne contiennent que des
mots de longueur > k . Comme l’inclusion Lk ⊂ L est évidente (inclusion définie coefficient
par coefficient), la conclusion vient.
I.8.15 On a toujours u−1 (uL) = L car uw ∈ uL ⇔ w ∈ L .
Si w ∈ u−1 L , on a évidemment uw ∈ L , d’où l’inclusion u(u−1 L) ⊂ L . Mais si un mot
de L n’est pas de la forme uw , il ne peut appartenir à u(u−1 L) et l’inclusion est dans ce cas
stricte. En fait, notant X l’alphabet, on a de manière générale la relation : u(u−1 L) = L∩uX ∗
(preuve facile et laissée au lecteur).
I.8.17 Pour étudier le premier langage, considérons, pour i, j ∈ {0, 1} :
Li,j := {u ∈ {a, b}∗ | |u|a ≡ i
(mod 2) et |u|b ≡ j
(mod 2)}.
Le langage qui nous intéresse est L0,0 . On vérifie immédiatement les formules suivantes pour
les résiduels :
a−1 Li,j = L1−i,j et b−1 Li,j = Li,1−j .
Notre langage a donc exactement quatre résiduels, il est rationnel.
Pour étudier le second langage, on introduit pour tout n ∈ Z :
L′n := {u ∈ {a, b}∗ | |u|a = |u|b + n}.
Comme, pour tout n ∈ N, le mot an n’appartient qu’à L′n et le mot bn qu’à L′−n , ces langages
sont deux à deux distincts. Le langage qui nous intéresse est L′0 . On vérifie immédiatement les
formules suivantes pour les résiduels :
a−1 L′n = L′n−1 et b−1 L′n = L′n+1 .
Notre langage a donc une infinité de résiduels, il n’est pas rationnel.
I.8.18 On sait que ε ∈ P . Si u ∈ P n’est pas vide, il a au moins deux lettres puisque
|u| = |u|a + |u|b est pair. Si ces deux lettres sont aa ou bb , le suffixe correspondant est
dans P , et réciproquement ; si ces deux lettres sont ab ou ba, le suffixe correspondant est dans
I , et réciproquement. On a ainsi prouvé que P = (aa + bb)P + (ab + ba)I + ε . La preuve de
la deuxième égalité est analogue, à ceci près que tout u ∈ I a au moins deux lettres puisque
|u| est somme de deux nombres impairs.
On résoud la dernière égalité vue comme une équation en I , ce qui donne :
I = (aa + bb)∗ (ab + ba)P.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
142
On reporte cette relation dans la première égalité, ce qui donne :
d’où la solution :
P = (aa + bb)P + (ab + ba)(aa + bb)∗ (ab + ba)P + ε
= (aa + bb) + (ab + ba)(aa + bb)∗ (ab + ba) P + ε,
∗
P = (aa + bb) + (ab + ba)(aa + bb)∗ (ab + ba) .
Nous laissons au lecteur le soin de vérifier l’unicité de ces solutions (le langage que l’on doit
affecter d’une étoile est chaque fois propre) et d’en tirer une formule explicite pour I .
Noter que, selon les notations de l’exercice précédent, P = L0,0 et I = L1,1 , cequi permettrait
de donner d’autres formules.
I.8.19 Supposons que le mot x ∈ X ∗ code l’entier n et y l’entier p. Alors la relation x = y0
signifie que n = 2p et la relation x = y1 que n = 2p + 1 . De plus, on a les équivalences
suivantes entre congruences ; si n = 2p :
n≡0
(mod 3) ⇐⇒ p ≡ 0
(mod 3),
n≡1
(mod 3) ⇐⇒ p ≡ 2
(mod 3),
n≡2
(mod 3) ⇐⇒ p ≡ 1
(mod 3);
n≡0
(mod 3) ⇐⇒ p ≡ 1
(mod 3),
n≡1
(mod 3) ⇐⇒ p ≡ 0
(mod 3),
n≡2
(mod 3) ⇐⇒ p ≡ 2
(mod 3);
si n = 2p + 1 :
Comme ε appartient à L0 mais ni à L1 ni à L2 , on en tire immédiatement les égalités
L0 = L0 .0 + L1 .1 + ε , L1 = L2 .0 + L0 .1 et L2 = L1 .0 + L2 .1 . La résolution se fait
alors à l’aide de la proposition 7 de la page 359.
I.8.20 Pour simplifier le codage, on considérera les mots comme des listes de caractères. Dans la
fonction resid, x désigne un caractère ; dans la fonction residuel, u désigne un mot (une
liste de caractères).
type expreg =
Vide
| Epsilon
| Sing of char
| Plus of expreg * expreg
| Conc of expreg * expreg
| Star of expreg ;;
let rec propre e = match e with
Vide -> true
| Epsilon -> false
| Sing _ -> true
| Plus(e1,e2) -> (propre e1) && (propre e2)
| Conc(e1,e2) -> (propre e1) || (propre e2)
c Dunod 2014
I.8 : Structures discrètes et récursivité
143
| Star _ -> false ;;
let rec resid x e = match e with
Vide -> Vide
| Epsilon -> Vide
| Sing(a) -> if a = x then Epsilon else Vide
| Plus(e1,e2) -> Plus(resid x e1,resid x e2)
| Conc(e1,e2) -> let e3 = Conc(resid x e1, e2) in
if (propre e1) then e3 else Plus(e3,resid x e2)
| Star(e1) -> Conc(resid x e1, e);;
let rec residuel u e = match u with
| [] -> e
| x :: q -> residuel q (resid x e) ;;
let appartient u e = not (propre (residuel u e)) ;;
∗
Pour tester sur un exemple, prenons le langage P := (aa+bb)+(ab+ba)(aa+bb)∗(ab+ba)
des mots ayant un nombre pair de a et un nombre pair de b , et les mots u0 := abbbaa et ses
suffixes u1 , . . . , u6 :
let
let
let
let
let
let
let
let
let
let
let
e1 = Plus(Conc(Sing(’a’),Sing(’a’)),Conc(Sing(’b’),Sing(’b’))) ;;
e2 = Plus(Conc(Sing(’a’),Sing(’b’)),Conc(Sing(’b’),Sing(’a’))) ;;
e3 = Conc(e2,Conc(Star(e1),e2)) ;;
e = Star(Plus(e1,e3)) ;;
u0 = [’a’;’b’;’b’;’b’;’a’;’a’] ;;
u1 = List.tl u0 ;;
u2 = List.tl u1 ;;
u3 = List.tl u2 ;;
u4 = List.tl u3 ;;
u5 = List.tl u4 ;;
u6 = List.tl u5 ;;
CAML répond alors :
#
#
#
#
#
#
#
-
appartient u0 e
: bool = false
appartient u1 e
: bool = false
appartient u2 e
: bool = true
appartient u3 e
: bool = false
appartient u4 e
: bool = true
appartient u5 e
: bool = false
appartient u6 e
: bool = true
;;
;;
;;
;;
;;
;;
;;
I.8.21 On a D ∩ a∗ b∗ = {an bn | n ∈ N} , qui n’est pas rationnel ; donc D ne l’est pas non plus.
Puisque D0 = ε , on a |D0 | = 1 . La bijection indiquée donne la relation de récurrence
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
144
P
|Dn | =
i+j=n−1
|Di ||Dj |, d’où l’on déduit par récurrence que les |Dn | sont les nombres
de Catalan (page 42).
Pour une étude approfondie du langage D , voir par exemple le livre de J.-M. Autebert « Langages algébriques », Masson 1987.
I.8.22 On a L′ = {an ban | n ∈ N} = L ∩ a∗ ba∗ (immédiat), donc, si L était rationnel, L′
le serait. Montrons que les mots de L′ n’ont pas de facteur itérant. Si an ban = uvw avec v
non vide, on doit distinguer les trois cas : v est entièrement à gauche de b , v contient b , v
est entièrement à droite de b . Dans le deuxième cas, « pomper » v (c’est-à-dire calculer les
uv k w ) modifierait le nombre de b ; dans le premier et le troisième cas, cela déséquilibrerait les
nombres de a à gauche et à droite. Dans tous les cas, cela ferait sortir de L′ , qui n’est donc pas
rationnel.
I.8.23 Si n := card S , l’ensemble des paires d’éléments de S (donc de potentielles arêtes) a
n(n − 1)/2 éléments, il y a donc 2n(n−1)/2 possibilités pour A (cas d’un graphe non orienté) ;
et l’ensemble des couples d’éléments de S (donc de potentiels arcs) a n2 éléments, il y a
2
donc 2n possibilités pour A (cas d’un graphe orienté).
I.8.25 (i) Xm est l’ensemble des sommets accessibles depuis E par un chemin de longueur au
plus m, d’où les deux premières assertions. Comme les inclusions X0 ⊂ · · · ⊂ Xm sont
strictes, on a les inégalités :
m 6 card (Xm \ X0 ) 6 card S − card E =⇒ m 6 card S − card E.
(ii) Yk est l’ensemble des sommets accessibles depuis E par un chemin de longueur k mais
pas par un chemin plus court.
(iii) est immédiat avec l’indication.
I.8.26 Puisque l’on a trois boucles « pour » imbriquées, l’exécution de l’algorithme comprend
exactement n3 étapes, chacune ayant un coût essentiellement constant (addition, multiplication
et affectation booléennes) d’où un coût en O(n3 ).
(k)
Pour vérifier que le résultat est bien la matrice de descendance, considérons les booléens Yi,j
(k)
définis par Yi,j := 1 s’il existe un chemin de xi à xj tel que tous les sommets intermédiaires soient des xl avec l 6 k (et bien entendu 0 sinon). Pour k = 0 , la condition signifie
qu’il n’y a pas de sommets intermédiaires, donc que le chemin est vide ( xi = xj ) ou un arc
(0)
( (xi , xj ) ∈ A). Donc Yi,j est le coefficients d’indices (i, j) de In + M .
De manière générale, un chemin de xi à xj tel que tous les sommets intermédiaires soient des
xl avec l 6 k est soit un chemin qui ne passe que par des xl avec l 6 k − 1 , soit un chemin
de xi à xk qui ne passe que par des xl avec l 6 k − 1 , suivi par une éventuelle boucle, suivi
par un chemin de xk à xj qui ne passe que par des xl avec l 6 k − 1 . On a donc :
(k)
(k−1)
Yi,j = Yi,j
(k−1)
+ Yi,k
(k−1)
.Yk,j
.
On en déduit par récurrence qu’après l’étape k de l’algorithme, X est la matrice
(k)
(Yi,j )16i,j6n ∈ Mn ({0, 1}). Pour k = n (fin de l’algorithme), il est clair que c’est bien
c Dunod 2014
I.8 : Structures discrètes et récursivité
145
la matrice de descendance.
(0)
Attention : la définition donnée de la matrice Yi,j exige que ses coefficients diagonaux soient
égaux à 1 . Si l’on note M la matrice d’adjacence, l’initialisation de la variable X se fait donc
à la valeur In + M et non M comme semble le suggérer l’énoncé.
I.8.27 L’indication fournit la solution, mais voici un commentaire sur l’usage de ce résultat. Bien
que le calcul formel du déterminant ait une complexité exponentielle (il n’y a pas d’algorithme
de Gauß pour cela), son calcul numérique pour des valeurs substituées aux indéterminées a un
coût en O(n3 ). Si un tel calcul numérique donne un résultat non nul, on est certain que le
déterminant est non nul. Si « beaucoup » de tels calculs numériques donnent un résultat nul,
il est « probable » que le déterminant est nul. L’estimation quantitative de la valeur de ce test
probabiliste est abordée dans l’exercice I.7.38 de la page 350 du module sur les polynômes à
plusieurs indéterminées.
Remarque. En réalité, il est possible d’implémenter un algorithme de type pivot de Gauß
en opérant dans le corps des fractions rationnelles en les Xi,j ; mais on constate alors
que la taille des coefficients (c’est-à-dire de leurs représentations informatiques) croît de
manière rapide et ralentit les calculs, d’où encore une complexité insupportable.
N
I.8.30 Le coefficient d’indices s, t de M G vaut vrai si, et seulement si, il y a un chemin de s à t
de longueur au plus N . S’il existe un tel chemin, il en existe un sans boucle et ce dernier est de
lonngueur majorée par card A et par card S − 1 .
I.8.31 Notons n := card X et m := card Q .
2
Sans déterminisme : on doit compter les parties de X ×Q×Q , qui a m2 n éléments, d’où 2m n
m
m
telles parties ; les 2 parties de Q formées des états de départ ; et les 2 parties de Q formées
2
des états d’arrivée : d’où le compte final 22m+m n .
Avec déterminisme : on doit compter les mmn applications de X × Q dans Q , les m possibles
états de départ et les 2m ensembles possibles d’états d’arrivée, d’où le compte final m2m mmn .
I.8.32 L’indication rend la solution évidente, mais noter qu’elle n’est valable que sous l’hypothèse
que l’automate est déterministe complet.
I.8.37 Si L := a∗ b∗ , on calcule a−1 L = L , b−1 L = b∗ =: L′ , puis b−1 L′ = L′ et
a−1 L′ = ∅ = L′′ , puis bien entendu a−1 L′′ = b−1 L′′ = L′′ ; et on voit facilement que
L, L′ , L′′ sont deux à deux distincts. On obtient l’automate fini déterministe complet minimal :
a
/L
a,b
b
b
/ L′
a
/ L′′
L’état de départ est L , les états acceptants sont L et L′ (seul L′′ est un langage propre).
Pour reconnaître le complémentaire M de L , on introduit les complémentaires M ′ , M ′′ de
L′ , L′′ . On reprend le même graphe en remplaçant L, L′ , L′′ par M, M ′ , M ′′ ; l’état de départ
est M , le seul état acceptant est M ′′ .
Le lecteur pourra démontrer (et même de différentes manières) que M = X ∗ baX ∗ . De plus,
l’automate ci-dessus est son automate minimal.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
146
I.8.38 L’algorithme de Mc Naughton-Yamada est étudié en grand détail dans le livre de J.-M.
Autebert « Langages algébriques », Masson 1987.
I.8.39 Aucun mot de L n’a de facteur itérant dans {an bn | n ∈ N} donc a fortiori dans L . Du
lemme de l’étoile, on déduit que les mots de L sont de longueurs bornées, ce qui implique la
finitude de L .
I.8.40 Soit u un mot non vide de ce langage. Si u ∈ a∗ ou u ∈ b∗ , l’existence d’un facteur itérant
est triviale. Sinon, u contient un facteur ab ou un facteur ba ; par exemple (les deux cas étant
symétriques) : u = vabv ′ . Alors le facteur ab de u est itérant.
On a déjà vu que ce langage n’est pas rationnel ; mais tous ses mots non vides admettent un
facteur itérant : il satisfait donc à la conclusion mais pas à l’hypothèse du lemme d’itération,
dont la réciproque est par conséquent fausse.
I.8.44 La relation η(t) 6 |t| est vraie pour t = F car ses deux membres sont nuls. Supposons-la
vérifiée par t1 et t2 et soit t := N (t1 , t2 ). Alors :
η(t) = 1 + max(η(t1 ), η(t2 ) 6 1 + max(|t1 |, |t2 |) 6 1 + |t1 | + |t2 | = |t|,
ce qui achève la preuve par induction structurelle de la première inégalité.
La relation |t| 6 2η(t) − 1 est vraie pour t = F car ses deux membres sont nuls. Supposons-la
vérifiée par t1 et t2 et soit t := N (t1 , t2 ). Alors :
|t| = 1 + |t1 | + |t2 |
6 1 + 2η(t1 ) − 1 + 2η(t)2 − 1
= 2η(t1 ) + 2η(t)2 − 1
6 2.2max(η(t1 )η(t)2 ) − 1
= 21+max(η(t1 )η(t)2 ) − 1
= 2η(t) − 1,
ce qui achève la preuve par induction structurelle de la deuxième inégalité.
Pour les autres questions, se reporter à l’indication.
I.8.45 Outre le livre de J.-M. Autebert « Langages algébriques », Masson 1987, le lecteur peut
consulter le livre de R. Sedgewick et P. Flajolet « Introduction à l’analyse d’algorithmes »,
Thompson Publishing 1996.
I.8.47 Voici un programme en CAML :
let rec fib n = match n with
0 -> 0
| 1 -> 1
| _ -> (fib (n-1)) + (fib (n-2)) ;;
c Dunod 2014
I.8 : Structures discrètes et récursivité
147
Le nombre Cn d’appels récursifs vérifie C0 = C1 = 0 et Cn = 2 + Cn−1 + Cn−2 . On en
déduit par récurrence que Cn = 2Fn+1 − 1 : donc une croissance exponentielle !
I.8.48 Voici un programme naturel :
let rec pasc(n,p) = match (n,p) with
(_,0) -> 1
| (0,_) -> 0
| _ -> (pasc(n-1,p) + (pasc(n-1,p-1)) ;;
Le nombre an,p d’appels récursifs vérifie an,0 = a0,p = 0 et an,p = 2 + an−1,p + an−1,p−1 .
Sans résoudre complètement cette récurrence, on voit par exemple que an,n = 2n+1 − 1 , ce
qui indique un coût exponentiel.
Si l’on introduit les listes :
n
n
Ln :=
,...,
,
0
n
on voit que le passage de Ln à Ln+1 se fait en n additions. Mais bien entendu, on consomme
beaucoup plus d’espace ! Voici un programme qui réalise cela :
let rec accroit a l = match l with
[] -> [a]
| x :: q -> (a + x) :: (accroit x q) ;;
let rec pascqueue n = match n with
0 -> []
| _ -> accroit 1 (pascqueue (n - 1)) ;;
let pasclist n = 1 :: (pascqueue n) ;;
# pasclist 5 ;;
- : int list = [1; 5; 10; 10; 5; 1]
Pour une consommation d’espace en O(n), on a un coût en temps en O(n2 ).
I.8.49 Voici le programme :
let rec pair_impair n = match n with
0 -> (true,false)
| _ -> let (a,b) = pair_impair (n-1) in (not a,not b) ;;
I.8.51 Voici le programme :
let rec hanoi(n,s,b,g) = match n with
0 -> []
| _ -> hanoi(n-1,s,g,b) @ ((s,b) :: hanoi(n-1,g,b,s)) ;;
# hanoi(1,1,2,3) ;;
- : (int * int) list = [(1, 2)]
# hanoi(2,1,2,3) ;;
- : (int * int) list = [(1, 3); (1, 2); (3, 2)]
# hanoi(3,1,2,3) ;;
- : (int * int) list =
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
148
[(1, 2); (1, 3); (2, 3); (1, 2); (3, 1); (3, 2); (1, 2)]
# hanoi(4,1,2,3) ;;
- : (int * int) list =
[(1, 3); (1, 2); (3, 2); (1, 3); (2, 1); (2, 3); (1, 3); (1, 2);
(3, 2); (3, 1); (2, 1); (3, 2); (1, 3); (1, 2); (3, 2)]
# List.length(hanoi(10,1,2,3)) ;;
- : int = 1023
Il est clair que la longueur Ln de hanoi(n,s,b,g) vérifie L0 = 0 et Ln+1 = 2Ln + 1 ,
d’où Ln = 2n − 1 .
I.8.52 Supposons que la fonction termine prenne un argument de type ’a -> ’b et retourne
un booléen : type ’a -> ’b -> bool. Définissons alors :
let rec test x = if (termine test) then test x else true ;;
On voit que test est de type ’a -> bool et peut donc être passée en argument à termine
qui doit alors rendre un booléen.
• Si le résultat est true, l’exécution de test x bouclera toujours, contredisant la définition
de termine.
• Si le résultat est false, l’exécution de test x ne bouclera jamais, contredisant la définition de termine.
L’existence d’une fonction ayant les propriétés de termine conduirait donc à une contradiction.
Ce raisonnement qui peut sembler artificiel dans le cadre étroit de CAML est en fait le squelette
de celui qui conduit à un résultat très général et de plus rigoureusement défini et démontré : il
n’existe pas de programme (quel que soit le sens raisonnable donné au mot « programme ») qui
permette de décider quels programmes se terminent ou non : c’est le « problème de l’arrêt » (ou
“halting problem”).
I.8.53 L’appel sur (n, p) donne lieu à un appel récursif sur (n, p − 1) et un sur (n − 1, q),
qui sont tous deux strictement inférieurs à (n, p) pour l’ordre lexicographique, même si
q = AP (n, p − 1) est très grand (ce qui d’ailleurs sera souvent le cas). Comme N × N muni
de l’ordre lexicographique est bien ordonné (voir le module « Fondements » de [L1]), la terminaison est assurée dans tous les cas.
On calcule successivement :
AP (1, 0) = AP (0, 1) = 2,
AP (1, p) = AP (0, AP (1, p − 1)) = AP (1, p − 1) + 1 ⇒ AP (1, p) = p + 2,
AP (2, 0) = AP (1, 1) = 3,
AP (2, p) = AP (1, AP (2, p − 1)) = AP (2, p − 1) + 2 ⇒ AP (2, p) = 2p + 3,
AP (3, 0) = AP (2, 1) = 5,
AP (3, p) = AP (2, AP (3, p − 1)) = 2AP (3, p − 1) + 3 ⇒ AP (3, p) = 2p+3 − 3.
On laisse au lecteur le soin de trouver la chaîne de calcul qui conduit à l’égalité
AP (4, 1) = AP (3, 13) = 216 − 3 = 65533 .
c Dunod 2014
I.8 : Structures discrètes et récursivité
149
De même, AP (4, 2) = AP (3, 3, 65533) = 265536 − 3 , etc. Voici le programme et quelques
expériences :
let rec ackerman_peter (n,p) = match (n,p) with
(0,_) -> p + 1
| (_,0) -> ackerman_peter (n-1,1)
| _ -> ackerman_peter(n-1,ackerman_peter(n,p-1)) ;;
# ackerman_peter(1,0) ;;
- : int = 2
# ackerman_peter(1,100) ;;
- : int = 102
# ackerman_peter(2,0) ;;
- : int = 3
# ackerman_peter(2,100) ;;
- : int = 203
# ackerman_peter(3,0) ;;
- : int = 5
# ackerman_peter(3,5) ;;
- : int = 253
# ackerman_peter(3,10);;
- : int = 8189
# ackerman_peter(4,0) ;;
- : int = 13
# ackerman_peter(4,1) ;;
- : int = 65533
# ackerman_peter(4,2) ;;
Stack overflow during evaluation (looping recursion?).
Notons que l’évaluation de ackerman_peter(4,1) a pris trois minutes pleines en
ocaml sur un portable de puissance raisonnable tournant sous Linux Ubuntu ; et celle de
ackerman_peter(4,2) a pris un plein quart d’heure pour échouer à cause d’un trop grand
nombre d’appels récursifs. (Bien entendu, le diagnostic de « looping recursion » proposé par
ocaml est ici erroné.)
I.8.54 L’appel de la fonction sur l’argument (1, 0) boucle clairement !
let rec morris (n,p) = match n with
0 -> 1
| _ -> morris(n-1,morris(n,p)) ;;
# morris(1,0) ;;
Stack overflow during evaluation (looping recursion?).
La saturation de la pile est d’ailleurs presque instantanée.
I.8.55 Voici le programme (avec la nécessaire déclaration de type) :
type arbrebinaire = F | N of arbrebinaire * arbrebinaire ;;
let rec hauteur t = match t with
F -> 0
| N(t1,t2) -> 1 + max (hauteur t1) (hauteur t2) ;;
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
150
I.8.57 On a déjà construit ces fonctions pour un exercice analogue :
type expreg =
Vide
| Epsilon
| Sing of char
| Plus of expreg * expreg
| Conc of expreg * expreg
| Star of expreg ;;
let rec propre e = match e with
Vide -> true
| Epsilon -> false
| Sing _ -> true
| Plus(e1,e2) -> (propre e1) && (propre e2)
| Conc(e1,e2) -> (propre e1) || (propre e2)
| Star _ -> false ;;
let rec resid x e = match e with
Vide -> Vide
| Epsilon -> Vide
| Sing(a) -> if a = x then Epsilon else Vide
| Plus(e1,e2) -> Plus(resid x e1,resid x e2)
| Conc(e1,e2) -> let e3 = Conc(resid x e1, e2) in
if (propre e1) then e3 else Plus(e3,resid x e2)
| Star(e1) -> Conc(resid x e1, e);;
I.8.58 Cet exemple sera étudié de plus près dans le chapitre de combinatoire de [MPA].
c Dunod 2014
II.1 : Espaces vectoriels normés
151
Module II.1 : Espaces vectoriels normés
II.1.1 Soit x ∈ X . Supposons que x soit une valeur d’adhérence de la suite (un ). Montrons que
x ∈ A . D’après la proposition 3 de la page 402 de la page 402, x est limite d’une sous-suite
(unk )k>0 de (un ). Par définition de A, la suite (unk )k>0 est à valeurs dans A, donc x ∈ A
(théorème 8 de la page 405).
Supposons inversement que x ∈ A \ A, et montrons que x est valeur d’adhérence de (un ).
Puisque x ∈ A , toute boule de centre x rencontre A. Comme x 6= un pour tout n ∈ N, on
en déduit que, pour tout réel r > 0 , l’ensemble n ∈ N | un ∈ B(x, r) est infini. D’après la
propriété suivant la définition 7 de la page 402 de la page 402, x est valeur d’adhérence de la
suite (un ).
II.1.2 Posons u := x/kxk , a := kxk , v := y/kyk et b := kyk . L’inégalité à démontrer s’écrit
alors :
1
kau − bvk > max(a, b)ku − vk.
(∗)
2
Quitte à échanger x et y , on peut supposer que a > b . L’inégalité triangulaire donne :
kau − bvk > |kauk − kbvk| = |a − b| = a − b.
L’inégalité (∗) est donc vraie si par hasard a − b > aku − vk/2 . Si a − b < aku − vk/2 , on
change de tactique :
kau − bvk = ka(u − v) + (a − b)vk > ka(u − v)k − k(a − b)vk
1
= aku − vk − (a − b) > aku − vk/2 = max(a, b)ku − vk.
2
L’inégalité (∗) est donc vraie dans tous les cas. Montrons maintenant que 1/2 est la meilleure
constante possible. Considérons donc un réel C ayant la propriété suivante : pour tout e.v. n. E
et tous vecteurs non nuls x, y de E , on a :
kau − bvk > C max(a, b)ku − vk.
(∗∗)
Il s’agit de montrer que C 6 1/2 . Prenons E := R (avec comme norme la valeur absolue),
x := n ∈ N∗ et y := −1 . Avec les notations ci-dessus, u := 1 , v := −1 , a := n et b := 1 .
L’inégalité (∗∗) s’écrit n + 1 > 2Cn, soit C 6 1/2 + 1/(2n). Cette inégalité étant vraie pour
tout n ∈ N∗ , on en déduit C 6 1/2 , en faisant tendre n vers +∞.
II.1.3 Voyons à quelles conditions k·kA est une norme sur R[X]. D’abord, pour tout polynôme P ,
la borne supérieure sup |P (x)| doit être un réel, i.e. elle doit être finie. En prenant P := X ,
x∈A
il en résulte que A est bornée. Inversement, si A est bornée et si P ∈ R[X], la fonction
x 7→ |P (x)| est bornée sur A, donc la borne supérieure en question est finie. Supposons
désormais que A soit bornée, de sorte que P 7→ kP kA est bien une application de R[X]
dans R+ .
La propriété de séparation est vérifiée si, et seulement si, le seul polynôme s’annulant sur A
est le polynôme nul. Cela revient à dire que A est infinie. En effet, si A est finie, le polynôme
Q
(X − a) est un polynôme non nul s’annulant sur A. Si au contraire A est infinie et si P
a∈A
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
152
est un polynôme nul sur A, P possède une infinité de racines, donc P = 0 . En conclusion, la
propriété de séparation est vraie si, et seulement si, A est infinie.
La propriété d’homogénéité est vérifiée trivialement. Quant à l’inégalité triangulaire, soient
P, Q ∈ R[X]. Pour tout x ∈ A, |P (x) + Q(x)| 6 |P (x)| + |Q(x)| 6 kP kA + kQkA , d’où
kP + QkA = sup |P (x) + Q(x)| 6 kP kA + kQkA . L’inégalité triangulaire est donc toujours
x∈A
vérifiée.
Conclusion : k·kA est une norme si, et seulement si, la partie A est bornée et infinie.
II.1.4 Soit (x, y) ∈ R2 un vecteur fixé. La fonction f : t 7→ (x + ty)/(1 + t2 ) est continue sur
R et a pour limite 0 en ±∞. Il en résulte que f est bornée. Calculons k(x, y)k = kf k∞ . La
fonction f est dérivable, et :
f ′ (t) =
y(1 + t2 ) − 2t(x + ty)
−(yt2 + 2tx − y)
=
·
2
2
(1 + t )
(1 + t2 )2
Si y = 0 , il est clair que k(x, y)k = |x| . Supposons y 6= 0 . En posant r :=
s’annule en t1 = (−x + r)/y et t2 = (−x − r)/y . Le calcul donne :
p
x2 + y 2 , f ′
x+r
x−r
et f (t2 ) =
·
2
2
Si x > 0 , |f | atteint son maximum absolu, à savoir (r + x)/2 , en t1 . Si x < 0 , |f | atteint
son maximum absolu, à savoir (r − x)/2 , en t2 . Dans tous les cas (y compris le cas y = 0 ),
on obtient :
p
r + |x|
|x| + x2 + y 2
=
·
(∗)
k(x, y)k = sup |f (t)| =
2
2
t∈R
f (t1 ) =
Sur la formule (∗), ou directement sur la définition, il est clair que l’application k·k vérifie les
propriétés d’homogénéité et de séparation. L’inégalité triangulaire se démontre comme dans
l’exercice précédent. Soient (x, y), (x′ , y ′ ) ∈ R2 . Pour tout t ∈ R, on a :
′
′
(x + x′ ) + t(y + y ′ ) 6 x + ty + x + ty 6 k(x, y)k + k(x′ , y ′ )k,
1 + t2 1 + t2 1 + t2
et l’inégalité triangulaire s’en déduit en passant à la borne supérieure pour t ∈ R.
Compte tenu de la formule (∗), la boule-unité fermée B(0, 1) est formée des (x, y) ∈ R2
vérifiant les inégalités suivantes :
|x| 6 2 et x2 + y 2 6 (2 − |x|)2 ,
c’est-à-dire :
|x| 6 2 et y 2 6 4(1 − |x|).
Il s’agit de la région limitée par deux portions de paraboles d’axe Ox, symétriques par rapport
à Oy : P , définie par les conditions x2 + y 2 6 4(1 − x) et x > 0 , et P ′ , définie par les
conditions y 2 6 4(1 + x) et x 6 0 .
II.1.5 1. La fonction d : K[X] × K[X] → R+ est symétrique, car ω(−R) = ω(R) pour tout
polynôme non nul R . La propriété de séparation est vérifiée : dès que P, Q ∈ K[X] sont
distincts, d(P, Q) := exp −ω(P − Q) > 0 . Il reste à vérifier l’inégalité triangulaire.
Soit P un polynôme non nul. Par définition, ω(P ) est le seul entier m > 0 tel que P puisse
s’écrire P := aX m P1 , où a ∈ K ∗ , P1 ∈ K[X] et P1 (0) = 1 . Autrement dit, ω est la
c Dunod 2014
II.1 : Espaces vectoriels normés
153
y
2
y 2 = 4(1 + x)
y 2 = 4(1 − x)
−1
1
x
−2
multiplicité de 0 dans P . Étant donné un entier p > 0 , l’inégalité ω(P ) > p est donc satisfaite si, et seulement si, X p divise P . Soit Q un autre polynôme non nul. On écrit de même
Q := bX n Q1 , où b ∈ K ∗ , Q1 ∈ K[X], Q1 (0) = 1 et n := ω(Q). Démontrons l’inégalité :
ω(P + Q) > min ω(P ), ω(Q) si P + Q 6= 0.
(∗)
Supposons donc P + Q 6= 0 . Soit p := min(m, n). Puisque p 6 ω(P ) et p 6 ω(Q),
X p divise P et Q , donc X p divise P + Q , c’est-à-dire p 6 ω(P + Q), ce qui établit
l’inégalité (∗). Soient maintenant P, Q, R trois polynômes deux à deux distincts. Puisque
P − R = (P − Q) + (Q − R), l’inégalité (∗) donne :
ω(P − R) > min ω(P − Q), ω(Q − R) .
En appliquant la fonction t 7→ e−t (qui est décroissante) aux deux membres de cette inégalité,
il vient :
d(P, R) 6 max d(P, Q), d(Q, R) .
(∗∗)
L’inégalité (∗∗) reste vraie lorsque P = R , car d(P, Q) > 0 et d(Q, R) > 0 . Elle est
trivialement vraie si P = Q 6= R ou Q = R 6= P . Cette inégalité ultramétrique est donc vraie
pour tous P, Q, R ∈ K[X]. Pour deux réels positifs a, b , on a bien sûr max(a, b) 6 a + b . Il
en résulte que l’inégalité ultramétrique (∗∗) implique l’inégalité triangulaire.
2. Le résultat de l’exercice cité dans l’énoncé est faux pour deux raisons. Soit d’abord r ∈ ]0, 1].
La boule fermée B(0, r) est formée de 0 et des polynômes non nuls P tels que e−ω(P ) 6 r ,
ce qui équivaut à ω(P ) > − ln r . Soit alors p := E(− ln r), de sorte que p 6 − ln r < p + 1 ,
c’est-à-dire e−(p+1) < r 6 e−p . Étant donné un autre réel r′ ∈ e−(p+1 , e−p , il en résulte
que B(0, r) = B(0, r′ ). La boule B(0, r) ne change donc pas lorsque son rayon est modifié
« raisonnablement ».
La deuxième raison est plus surprenante : tout point d’une boule est « centre » de cette boule.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
154
Soient par exemple P ∈ K[X], r ∈ ]0, 1] et B := B(P, r). Considérons un point Q
de B . On a donc d(P, Q) 6 r . Si maintenant R ∈ B(Q, r), il vient d(Q, R) 6 r , d’où
d(P, R) 6 r à cause de l’inégalité ultramétrique. Ainsi B(Q, r) ⊂ B(P, r), et par conséquent
B(Q, r) = B(P, r) vu la symétrie de la fonction d. Le point Q est donc aussi « centre » de B
(le rayon étant toujours r ).
Dans l’espace métrique K[X], d , « tout triangle est isocèle ». Plus précisément, si
P, Q, R ∈ K[X], deux au moins des distances d(P, Q), d(Q, R), d(P, R) sont égales.
C’est en fait une conséquence de l’inégalité ultramétrique. Supposons par exemple que
d(P, Q) 6= d(Q, R), disons d(P, Q) > d(Q, R) pour fixer les idées. Dans ce cas, l’in
égalité ultramétrique d(P, Q) 6 max d(P, R), d(Q, R) implique d(P, R) > d(Q, R) et
donc d(P, Q) 6 d(P, R). De même, l’inégalité d(P, R) 6 max d(P, Q), d(Q, R) entraîne
d(P, R) 6 d(P, Q), d’où d(P, R) = d(P, Q) comme annoncé. L’inégalité ultramétrique (∗∗)
est donc une égalité lorsque les deux distances figurant dans le second membre sont inégales.
Soit enfin S la sphère de centre 0 et de rayon 1 . Elle est formée des polynômes P tels que
d(P, 0) = 1 , i.e. P 6= 0 et ω(P ) = 0 . Autrement dit, S = P ∈ K[X] | P (0) 6= 0 .
Montrons que cette sphère est ouverte (son intérieur est donc S elle-même). Soit P ∈ S . Pour
tout Q ∈ B(P, 1), on a d(P, Q) < 1 = d(0, P ), d’où d(0, Q) = 1 , en vertu de l’alinéa
précédent. Cela prouve l’inclusion B(P, 1) ⊂ S . Tout point de S est donc intérieur à S , d’où
notre assertion.
II.1.6 1. Soit P ∈ C[X]. Notons an les coefficients de P (ils sont presque tous nuls). Par définition, on a donc :
kP k = sup |an | | n ∈ N .
En particulier, |an | 6 kP k pour tout n ∈ N. La propriété de séparation est évidente : on
a toujours kP k > 0 , avec égalité si, et seulement si, tous les an sont nuls. Autrement dit,
kP k = 0 ⇐⇒ (P = 0). La propriété d’homogénéité est évidente elle aussi. En effet, si
P
λ ∈ C, on a λP = (λan )X n , d’où :
n
kλP k = sup |λan | | n ∈ N = |λ| sup |an | | n ∈ N = λkP k.
P
P
Prouvons l’inégalité triangulaire. Soient P := an X n et Q := bn X n deux polynômes et
n
n
P
P + Q := (an + bn )X n leur somme. Pour tout n, |an + bn | 6 |an | + |bn | 6 kP k + kQk .
n
Ainsi le réel kP k + kQk majore tous les |an + bn |, il majore donc leur borne supérieure
kP + Qk .
2. L’application L : C[X] → C (morphisme d’évaluation en t) est linéaire, c’est en fait
un morphisme de C-algèbres, cf. le module I.1. Supposons d’abord que L soit continue. Il
existe donc un réel C tel que |L(P )| 6 CkP k , c’est-à-dire |P (t)| 6 CkP k , et cela pour
tout P ∈ C[X]. En particulier, soit n ∈ N. Puisque kX n k = 1 , on a |tn | 6 C . La suite
géométrique (tn ) est donc bornée, ce qui est vrai si, et seulement si, |t| 6 1 .
Supposons ensuite que l’on ait |t| < 1 . Considérons un polynôme P , de degré d, écrivons
d
P
P :=
an X n . Puisque |an | 6 kP k pour tout n, l’inégalité triangulaire donne :
n=0
|L(P )| := |P (t)| 6
c Dunod 2014
d
X
n=0
|an | |t|
n
6 kP k
d
X
n=0
n
|t| =
kP k(1 − |t|
1 − |t|
d+1
)
6
kP k
·
1 − |t|
II.1 : Espaces vectoriels normés
155
Il en résulte que L est continue : prendre C := (1 − |t|)−1 .
Supposons enfin que |t| = 1 . Il existe donc un réel x tel que t := eix . Pour tout n ∈ N,
posons an := e−inx , de sorte que |an | = 1 . Considérons alors un entier d ∈ N arbitraire, et
d
P
posons P :=
an X n . Tous les coefficients de P sont de module 1 , donc kP k = 1 . D’un
n=0
autre côté, calculons P (t) :
L(P ) = P (t) =
d
X
a n tn =
n=0
d
X
e−inx einx = d + 1.
n=0
L’application L n’est donc pas bornée sur la sphère unité de C[X], i.e. L n’est pas continue.
Conclusion : L est continue si, et seulement si, |t| < 1 .
II.1.7 Remarquons d’abord que L(P ) = P (1) pour tout polynôme P : c’est vrai par définition
lorsque P = X n pour un certain n ∈ N, et notre assertion en résulte par linéarité, puisque
n
X | n ∈ N est une base de R[X]. Par ailleurs, pour tout P ∈ R[X], on a :
Z b
kP k2 =
P (x)2 d x.
a
Nous allons montrer que L n’est pas continue. Raisonnons par l’absurde, en supposant que
L est continue. Il existe donc un réel C tel que |L(P )| 6 CkP k pour tout polynôme P ,
c’est-à-dire :
Z b
P (x)2 d x.
(∗)
P (1)2 6 C 2
a
Choisissons un réel t > 1 tel que [a, b] soit inclus dans le segment J := [1 − t, 1 + t]. L’inégalité précédente donne a fortiori :
Z 1+t
2
2
P (1) 6 C
P (x)2 d x pour tout P ∈ R[X].
1−t
Pour tout P ∈ R[X], posons Q(X) := P (tX + 1). Ainsi P (x) = Q (x − 1)/t pour tout
x ∈ R, en particulier P (1) = Q(0). On a donc :
Z 1+t
Z 1
2
Q(0)2 6 C 2
Q (x − 1)/t d x = tC 2
Q(u)2 d u.
1−t
−1
2 n
Appliquons cette inégalité avec Q := (1 − X ) , où n ∈ N. Il vient :
Z 1
Z 1
(1 − u2 )2n d u = 2tC 2
(1 − u2 )2n d u.
1 6 tC 2
−1
0
Pour aboutir à une contradiction, il suffit d’observer que l’intégrale Kn :=
Z
0
1
(1 − u2 )2n d u
tend vers 0 lorsque n tend vers +∞. Le changement de variable u := sin x donne en effet
Z π/2
Kn =
cos4n+1 x d x . Autrement dit, Kn est l’intégrale de Wallis I4n+1 étudiée dans le
0
module II.8 (section portant sur la formule de Stirling). En se reportant à ce module, on voit
que Kn tend vers 0 lorsque n tend vers +∞.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
156
Indiquons une autre solution, utilisant le théorème d’approximation de Weierstraß (cf. le module
suivant). Choisissons un réel t > 1 tel que [a, b] soit inclus dans le segment J := [−t, t].
L’inégalité (∗) donne ici a fortiori :
Z t
P (1)2 6 C 2
P (x)2 d x pour tout P ∈ R[X].
−t
On en déduit l’inégalité suivante, valable pour toute fonction continue f : J → R :
Z t
f (1)2 6 C 2
f (x)2 d x.
(∗∗)
−t
Considérons en effet une telle fonction continue f , et soit ε > 0 . D’après le théorème de
Weierstraß, il existe un polynôme P tel que |f (x) − P (x)| 6 ε pour tout x ∈ J . On en déduit
|P (x)| − ε 6 |f (x)| 6 |P (x)| + ε pour tout x ∈ J , d’où par intégration :
2
f (1)2 6 |P (1)| + ε = P (1)2 + 2ε |P (1)| + ε2 6 P (1)2 + 2ε |f (1)| + ε + ε2
Z t
Z t
2
6 C2
P (x)2 d x + 2ε |f (1)| + 3ε2 6 C 2
|f (x)| + ε d x + 2ε |f (1)| + 3ε2
6 C2
Z
−t
t
f (x)2 d x + 2εC 2
−t
Z
t
−t
−t
|f (x)| d x + 2tC 2 ε2 + 2ε |f (1)| + 3ε2 .
L’inégalité (∗∗) s’en déduit, en faisant tendre ε vers 0 .
Considérons maintenant un réel α ∈ ]0, t − 1[. Soit f : J → R la fonction affine par morceaux
dont le graphe est représenté ci-dessus.
y
(1, 1)
1
x
0
−t
t
1−α 1 1+α
Ainsi f (x) := 0 si x ∈ J \ [1 − α, 1 + α], f (x) := (x + α − 1)/α si x ∈ [1 − α, 1] et
f (x) := (α + 1 − x)/α si x ∈ [1, 1 + α] . On a :
Z t
Z 1+α
2
f (x) d x =
f (x)2 d x
−t
1−α
1
= 2
α
1
= 2
α
c Dunod 2014
Z
1
2
1−α
Z α
(x + α − 1) d x +
u2 d u +
0
Z
0
α
Z
1
1+α
(α + 1 − x) d x
2α
(α − u)2 d u =
·
3
2
II.1 : Espaces vectoriels normés
157
Puisque f (1) = 1 , l’inégalité (∗∗) donne 1 6 2αC 2 /3 . Cette inégalité doit être vraie pour
tout α ∈ ]0, t − 1[, et l’on aboutit à une contradiction en faisant tendre α vers 0 . La forme
linéaire L n’est donc pas continue.
II.1.8 Soit T un fermé de X . Montrons que A ∩ T est fermé dans A. Soit (un ) une suite de
A ∩ T , convergeant vers un point a de A. Puisque T est fermé dans X et un ∈ T pour tout
n, a appartient à T , donc à A ∩ T , d’où notre assertion.
Soit inversement F un fermé de A. Notons F l’adhérence de F dans X . Évidemment
F ⊂ F , donc F ⊂ A ∩ F . Prouvons l’inclusion inverse A ∩ F ⊂ F . Soit donc x ∈ A ∩ F . Il
existe une suite (vn ) de F (donc de A) convergeant vers x dans X , donc dans A. Puisque F
est fermé dans A, x appartient à F . Ainsi F = A ∩ F est l’intersection de A avec un fermé
de X . En conclusion, les fermés de A sont exactement les intersections A ∩ T , où T est un
fermé arbitraire de X .
Pour les ouverts, passons aux complémentaires. Les ouverts de A sont exactement les
A \ (A ∩ T ) = A ∩ (X \ T ), où T est un fermé arbitraire de X . Ce sont donc exactement les
intersections A ∩ S , où S est un ouvert arbitraire de X (poser S := X \ T ).
II.1.9 Rappelons que, si Y est une partie de X , Y est, au sens de l’inclusion, le plus petit fermé
de X contenant Y , en particulier Y ⊂ Y . On en déduit que, pour deux parties quelconques
Y, Z de X , (Y ⊂ Z) =⇒ (Y ⊂ Z).
Revenons à A et B . Puisque A ⊂ A ∪ B et B ⊂ A ∪ B , ce qui précède montre que A ∪ B
contient A et B , i.e. A ∪ B ⊂ A ∪ B . D’un autre côté, A ∪ B est fermé (comme réunion de
deux fermés) et contient A ∪ B , d’où A ∪ B ⊃ A ∪ B . Ainsi A ∪ B = A ∪ B .
Ensuite, A ∩ B ⊂ A, d’où A ∩ B ⊂ A et de même A ∩ B ⊂ B . On en déduit l’inclusion
A ∩ B ⊂ A ∩ B.
Prenons X := R, A := ]−∞, 0[ et B := ]0, +∞[. On a A := ]−∞, 0] et B := [0, +∞[,
d’où A ∩ B = {0} , alors que A ∩ B = ∅ = ∅ . L’inclusion A ∩ B ⊂ A ∩ B est donc stricte
en général.
II.1.10 Ce n’est pas tout à fait évident : en effet, l’intérieur de U est en général plus gros que U ,
de même l’intérieur de V est en général plus gros que V , donc ces deux intérieurs pourraient
a priori ne plus être disjoints. Il va falloir utiliser le fait que U et V sont des ouverts de X .
Raisonnons par l’absurde, en supposant que les intérieurs de U et V ne soient pas disjoints.
Soit donc a ∈ Int(U ) ∩ Int(V ). Le point a étant intérieur à la fois à U et à V , il existe un
réel r > 0 tel que B(a, r) ⊂ U ∩ V . Puisque a ∈ U , tout voisinage de a rencontre U , en
particulier U ∩ B(a, r) n’est pas vide. Soit donc b ∈ U ∩ B(a, r). Puisque U ∩ B(a, r) est
ouvert, il existe ρ > 0 tel que B(b, ρ) ⊂ U ∩ B(a, r). Ainsi B(b, ρ) ⊂ B(a, r) ⊂ V , donc
B(b, ρ) rencontre V . Mais B(b, ρ) ⊂ U , et par suite U ∩V 6= ∅ , contrairement à l’hypothèse.
II.1.11 Raisonnons par l’absurde, en supposant que u ◦ v − v ◦ u = IdE . Composons les deux
membres de cette égalité par u à gauche (en omettant le signe de composition) :
u = u(uv − vu) = u2 v − (uv)u = u2 v − (vu + IdE )u = u2 v − vu2 − u,
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
158
d’où 2u = u2 v − vu2 . Démontrons alors pour tout k ∈ N∗ la formule suivante :
uk v − vuk = kuk−1 .
(∗)
Cette formule est vraie si k vaut 1 ou 2 . Supposons la formule (∗) vraie pour un certain
k ∈ N∗ . Comme ci-dessus, on compose à gauche par u :
kuk = u(uk v − vuk ) = uk+1 v − (uv)uk = uk+1 v − (vu + IdE )uk = uk+1 v − vuk+1 − uk ,
d’où l’égalité (∗) au rang k + 1 : (k + 1)uk = uk+1 v − vuk+1 . L’égalité (∗) est donc vraie
pour tout k ∈ N∗ .
Rappelons que l’on a |||f ◦ g||| 6 |||f ||| · |||g||| pour tous f, g ∈ Lc (E). Soit k ∈ N∗ . L’égalité
(∗) implique donc :
k|||uk−1 ||| = |||uk v−vuk ||| 6 |||uk v|||+|||vuk ||| 6 |||uk−1 ||| |||uv|||+|||vu||| 6 2|||u|||·|||v|||·|||uk−1 |||.
En choisissant k > 2|||u||| · |||v||| , on en déduit que |||uk−1 ||| 6 0 , c’est-à-dire uk−1 = 0 . Nous
avons ainsi montré que u est nilpotent.
Soit maintenant k le plus petit entier strictement positif tel que uk = 0 . Bien entendu k > 2 ,
car l’égalité uv − vu = IdE implique u 6= 0 ( E est non nul). L’égalité (∗) au rang k montre
que kuk−1 = 0 , d’où uk−1 = 0 (le corps de base est R ou C). La minimalité de k se trouve
contredite. L’égalité uv − vu = IdE est donc impossible.
II.1.12 Pour tout i , notons ui l’injection canonique x 7→ x de Fi dans X . Cette application est
continue, c’est en fait une isométrie de Fi dans X , car la distance sur Fi est la restriction à
Fi × Fi de la distance sur X . Soit alors f : X → Y une application. Pour tout i , la restriction
f|Fi : Fi → Y de f à Fi est la composée f ◦ ui . Si donc f est continue, chaque f|Fi est
continue, comme composée d’applications continues. On remarquera que, jusqu’à présent, le
fait que les Fi soient fermés ne nous a pas servi.
Supposons inversement que chaque f|Fi soit continue. Pour montrer que f est continue, il
suffit de vérifier que, pour tout fermé Z de Y , f −1 (Z) est un fermé de X (théorème 16 de la
page 411 de la page 411). Pour tout i ∈ [[1, n]], (f|Fi )−1 (Z) = Fi ∩ f −1 (Z) est un fermé de
Fi , parce que f|Fi est continue (même théorème). Ainsi Fi ∩ f −1 (Z) est un fermé de Fi , qui
est lui-même un fermé de X , donc Fi ∩ f −1 (Z) est un fermé de X (cf. par exemple l’exercice
II.1.8 de la page 469). Dans ces conditions, on a :
f −1 (Z) = f −1 (Z) ∩ X = f −1 (Z) ∩
n
[
i=1
Fi =
n
[
i=1
f −1 (Z) ∩ Fi .
Cela montre que f −1 (Z) est fermé dans X , comme réunion finie de fermés de X . D’où la
continuité de f .
II.1.13 Explicitons donc la norme |||·|||1 subordonnée à la norme k·k1 sur K n , donnée par
n
P
kXk1 :=
|xi | si X := (x1 , . . . , xn ) ∈ K n . Soit A := (ai,j ) ∈ Mn (K). Commeni=1
çons par majorer |||A|||1 .
c Dunod 2014
II.1 : Espaces vectoriels normés
159
Soit X := (x1 , . . . , xn ) ∈ K n , posons Y := AX := (y1 , . . . , yn ). Pour tout i ∈ [[1, n]],
n
n
P
P
l’égalité yi =
ai,j xj implique |yi | 6
|ai,j | |xj |. D’où :
j=1
kY k1 =
j=1
n
X
i=1
|yi | 6
n
X
i=1


n
X
j=1

|ai,j | |xj | =
n
X
j=1
|xj |
n
X
i=1
!
|ai,j | .
n
P
Pour tout j , notons Cj la colonne d’indice j de A, de sorte que la somme
i=1
norme kCj k1 de Cj . On obtient ainsi :
kY k1 6
|ai,j | est la
n
n
X
X
kCj k |xj | 6 max kC1 k1 , . . . , kCn k1
|xj | = max kC1 k1 , . . . , kCn k1 kXk1 .
j=1
j=1
Pour tout X ∈ K , on a donc kAXk1 6 max kC1 k1 , . . . , kCn k1 kXk1 , d’où :
|||A|||1 6 max kC1 k1 , . . . , kCn k1 .
n
En fait il y a égalité :
|||A|||1 = max(kC1 k1 , . . . kCn k1 ).
(∗)
En effet, soit j un indice tel que kCj k1 soit maximum. Notons Ej le j ème vecteur de la base
canonique de K n . Alors kEj k1 = 1 et AEj = Cj , d’où :
|||A|||1 > kAEj k1 = kCj k1 = max kC1 k1 , . . . , kCn k1 .
L’égalité (∗) est donc établie. On comparera avec l’égalité (28) de la page 443.
II.1.14 Soient V un espace vectoriel de dimension finie et f un endomorphisme de V . Il n’est
pas vrai, en général, que V soit somme directe de l’image et du noyau de f . Par exemple,
l’endomorphisme (x, y) 7→ (y, 0) de R2 a pour image et pour noyau l’axe des abscisses. Ce
qui est toujours vrai, par contre, est que dim V = dim(Ker f ) + dim(Im f ) (théorème du
rang).
Venons-en à l’exercice lui-même. Posons f := u − IdE . Comme nous l’avons rappelé,
dim(Ker f ) + dim(Im f ) = dim E . Il en résulte que E est somme directe de Ker f et Im f
si, et seulement si, Ker f ∩ Im f = {0} . Raisonnons alors par l’absurde, en supposant que
Ker f ∩ Im f n’est pas nul, et soit x ∈ Ker f ∩ Im f un vecteur non nul. D’une part u(x) = x,
et d’autre part il existe un vecteur y ∈ E tel que x = f (y) = u(y) − y , d’où u(y) = y + x.
On en déduit : u2 (y) = u(y + x) = u(y) + x = y + 2x. Démontrons plus généralement la
formule suivante pour tout k ∈ N :
uk (y) = y + kx.
(∗)
Cette formule est vraie si k ∈ {0, 1, 2} . Si elle est vraie pour un certain k . il vient :
uk+1 (y) = u uk (y) = u(y + kx) = (y + x) + kx = y + (k + 1)x,
d’où la formule au rang k + 1 . Jusqu’à présent, nous n’avons utilisé ni le fait que E est un
k
e.v. n. ni l’hypothèse |||u||| 6 1 . Cette dernière hypothèse entraîne |||uk ||| 6 |||u||| 6 1 pour tout
k ∈ N. Soit alors k ∈ N∗ . De l’égalité (∗), on tire :
kkxk = kkxk = k(uk − IdE )(y)k 6 |||uk − IdE ||| · kyk 6 |||uk ||| + |||IdE ||| · kyk 6 2kyk,
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
160
soit kxk 6 2k −1 kyk . En faisant tendre k vers +∞, on en déduit que kxk = 0 , c’est-à-dire
x = 0 , c’est la contradiction souhaitée.
II.1.15 Observons d’abord que l’hyperplan H est fermé, parce que la forme linéaire f est continue. Il en résulte qu’un vecteur y de E appartient à H , i.e. vérifie f (y) = 0 , si, et seulement
si, d(y, H) = 0 . L’égalité à établir est donc vraie pour tout y ∈ H . Soit désormais x un vecteur de E fixé n’appartenant pas à H : f (x) 6= 0 . L’espace E est donc somme directe de H
et de la droite Kx.
Par définition de la norme fonctionnelle, on a :
|||f ||| = sup
y6=0
|f (y)|
=
kyk
sup
y∈E\H
|f (y)|
·
kyk
L’application (λ, h) 7→ λx + h étant une bijection de K ∗ × H sur E \ H , on en déduit :
|f (λx + h)|
|λ| |f (x)|
|f (x)|
= sup
= sup
·
kλx
+
hk
kλx
+
hk
kx
+ λ−1 hk
(λ,h)
(λ,h)
(λ,h)
|||f ||| = sup
Lorsque (λ, h) décrit K ∗ × H , le vecteur u := −λ−1 h décrit évidemment H . D’où :
−1
|f (x)|
|||f ||| = sup
= |f (x)| sup kx − uk−1 = |f (x)| inf kx − uk)
u∈H
u∈H kx − uk
u∈H
−1
= |f (x)| inf d(x, u)
= |f (x)| d(x, H)−1 ,
u∈H
d’où l’égalité annoncée.
II.1.16 La fonction d : R × R → R est bien à valeurs dans R+ . La symétrie de la fonction d
est évidente. L’inégalité triangulaire aussi, car, pour tous x, y, z ∈ R, l’inégalité triangulaire
usuelle dans R donne :
d(x, z) = |f (x) − f (z)| = f (x) − f (y) + f (y) − f (z) 6 |f (x) − f (y)| + |f (y) − f (z)| = d(x, y) + d(y, z).
La propriété de séparation signifie ceci : pour tous x, y ∈ R, l’égalité f (x) = f (y) est vraie si,
et seulement si, x = y . Cela revient à dire que f est injective. Mais, puisque f est continue, elle
est injective si, et seulement si, elle est strictement monotone (cf. le cours de [L1]). Conclusion :
d est une distance si, et seulement si, f est strictement monotone, ce que nous supposons.
Quitte à remplacer f par −f , ce qui ne change pas d, nous pouvons supposer que f est
strictement croissante.
Notons δ la distance usuelle (x, y) 7→ |x − y| sur R et J := f (R) l’image de f . La définition
de d montre que f est une isométrie de (R, d) sur (J, δ). Il en résulte que l’espace métrique
(R, d) est complet si et seulement si J est une partie complète, c’est-à-dire fermée de R au
sens usuel. C’est évidemment le cas lorsque J = R, i.e. lorsque f est bijective. Montrons que
cette condition suffisante est aussi nécessaire.
Supposons donc que J soit fermée dans R. Il faut d’abord se rappeler que J est un intervalle
de R, simplement parce que f est continue. Ainsi, ou bien J = R, ou bien J est de l’une des
formes suivantes : [−∞, a] ou [a, +∞[ (avec a ∈ R) ou [a, b] (avec a, b ∈ R et a < b ). Pour
conclure, il suffit de montrer que la borne supérieure de J ne peut pas être un réel (on raisonne
c Dunod 2014
II.1 : Espaces vectoriels normés
161
de manière analogue pour la borne inférieure). Supposons au contraire que b := sup J ∈ R. Il
existe donc un réel β tel que b = f (β). Pour tout x > β , on a f (x) > f (β) = b puisque f
est strictement croissante. C’est absurde, car f (x) ∈ J , d’où f (x) 6 sup J = b .
Conclusion : l’espace métrique (R, d) est complet si, et seulement si, f est une bijection strictement monotone de R sur lui-même.
II.1.17 Reprenons les notations de l’exercice II.1.5 de la page 469. Pour tout n ∈ N, posons Pn := 1 + X + X 2 + · · · + X n . Soient n, p ∈ N tels que, par exemple, n < p.
Alors Pp − Pn = X n+1 + · · · + X p , donc ω(Pp − Pn ) = n + 1 et par conséquent
d(Pn , Pp ) = e−(n+1) . Il en résulte que (Pn ) est une suite de Cauchy de K[X]. Pour montrer
que l’espace métrique K[X], d n’est pas complet, il suffit de prouver que la suite (Pn ) ne
converge pas.
+∞
P n
Moralement, la limite de la suite (Pn ) ne peut être que
X = (1 + X)−1 , qui n’est
n=0
malheureusement pas un polynôme. Ce n’est là qu’un argument heuristique. Raisonnons donc
par l’absurde, en supposant que la suite (Pn ) a une limite P . Bien entendu, P est un polynôme,
notons an ses coefficients. Considérons un entier d ∈ N. Pour tout n ∈ N assez grand, on a
d(P, Pn ) 6 e−(d+1) , ce qui signifie que P = Pn ou bien P 6= Pn et ω(P − Pn ) > d + 1 .
Autrement dit, dès que n est assez grand (en tout cas n > d), X d+1 divise P − Pn ; en
particulier le coefficient de X d dans P − Pn est nul, i.e. ad = 1 . Ainsi ad = 1 pour tout
d ∈ N assez grand, ce qui est absurde : un polynôme n’a qu’un nombre fini de coefficients non
nuls (comparer avec l’argument heuristique).
II.1.18 Nous utilisons ici librement le module II.5. La fonction F est de classe C 1 , car ses composantes (x, y) 7→ x + f (y) et (x, y) 7→ y + g(x) le sont. Comme galop d’essai, il n’est
pas difficile de voir que F est injective (mais cela sera insuffisant). Observons que, pour
tous a, b ∈ R, l’inégalité des accroissements finis donne : |f (a) − f (b)| 6 k |a − b| et
|g(a) − g(b)| 6 k |a − b|. Considérons alors deux points Mi = (xi , yi ) ∈ R2 ( i = 1, 2 )
tels que F (M1 ) = F (M2 ). On a donc x1 + f (y1 ) = x2 + f (y2 ) et y1 + g(x1 ) = y2 + g(x2 ).
De la première égalité, on tire : |x1 − x2 | = |f (y2 ) − f (y1 )| 6 k |y2 − y1 | . De la deuxième,
on tire de même |y1 − y2 | = |g(x2 ) − g(x1 )| 6 k |x2 − x1 | . D’où |x1 − x2 | 6 k 2 |x1 − x2 |
et donc x1 = x2 parce que k 2 < 1 . De la même manière, on voit que y1 = y2 .
Pour établir que F est un C 1 -difféomorphisme de R2 sur lui-même, il suffit (et il faut) prouver
les deux assertions suivantes :
1. en tout point M de R2 , la différentielle de F est un automorphisme linéaire de R2 ,
i.e. le jacobien (déterminant de la matrice jacobienne) de F en M est non nul ;
2. l’application F est une bijection de R2 sur lui-même.
L’assertion 1 utilise le calcul différentiel, l’assertion 2 utilise la topologie.
1. Soit M := (a, b) ∈ R2 . En notant u, v : R2 → R les deux composantes de F , on a :
∂u (M ) ∂u (M ) 1
f ′ (y) ∂x
∂y
det JM (F ) = ∂v
=
∂v
g ′ (x)
1 (M ) ∂x (M ) ∂y
= 1 − f ′ (y)g ′ (x) > 1 − |f ′ (y)| |g ′ (x)| > 1 − k 2 > 0.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
162
La matrice jacobienne JM (F ) est donc inversible. L’assertion 1 est établie. À ce stade, nous
savons déjà que F est un C 1 -difféomorphisme local : tout point M ∈ R2 est centre d’une
boule ouverte B telle que la restriction de F à B soit un C 1 -difféomorphisme de B sur un
ouvert de R2 , à savoir F (B).
2. Soit A = (a, b) un point de R2 fixé. Il s’agit de prouver que A possède un unique antécédent par F . Autrement dit, l’équation F (M ) = A doit avoir dans R2 une solution unique
M . Avec M := (x, y), l’égalité F (M ) = A s’écrit x + f (y), y + g(x) = (a, b), ou encore
a−f (y), b−g(x) = (x, y). Nous voulons donc montrer que l’application ϕ : R2 → R2 défi
nie par (x, y) 7→ a−f (y), b−g(x) possède un unique point fixe. Pour cela, R2 étant complet,
il suffit de vérifier que ϕ est contractante (théorème du point fixe). Soient donc M1 := (x1 , y1 )
et M2 = (x2 , y2 ) deux points de R2 . On a :
2
2
d ϕ(M1 ), ϕ(M2 ) = f (y2 ) − f (y1 ), g(x2 ) − g(x1 ) 2 2
= f (y2 ) − f (y1 ) + g(x2 ) − g(x1 )
6 k 2 (y2 − y1 )2 + (x2 − x1 )2 = k 2 d(M1 , M2 )2 ,
ce qui montre que ϕ est k -lipschitzienne, donc contractante puisque k ∈ [0, 1[.
II.1.19 a) Montrons que f (Rn ) est un fermé de Rn . Soit (yk )k>0 une suite de f (Rn ) convergeant vers un point y de Rn . Il s’agit de voir que y ∈ f (Rn ). Pour tout k ∈ N, choisissons xk ∈ Rn tel que f (xk ) = yk . Pour tous indices h, k , l’hypothèse faite sur f donne
kxh − xk k 6 kf (xh ) − f (xk )k = kyh − yk k . La suite (yh ) étant de Cauchy (parce qu’elle
converge), il en résulte que la suite (xk ) est de Cauchy. Puisque Rn est complet, la suite
(xk ) converge, notons x sa limite. La fonction f étant continue, f (x) est limite de la suite
f (xk ) = (yk ), donc f (x) = y . D’où y ∈ f (Rn ), comme annoncé.
b) Soit a ∈ Rn . Montrons que la différentielle Da (f ) de f en a est inversible. Raisonnons par
l’absurde, en supposant que h est un vecteur non nul appartenant au noyau de Da (f ). Lorsque
t ∈ R tend vers 0 , la définition de Da (f ) donne :
f (a + th) = f (a) + Da (f )(th) + o kthk = f (a) + o(t).
En d’autres termes, kf (a + th) − f (a)k est négligeable devant t lorsque t tend vers 0 . C’est
absurde car, vu l’hypothèse faite sur f , kf (a + th) − f (a)k > |t| khk pour tout t.
En tout point a ∈ Rn , la différentielle Da (f ) est donc inversible, et il en résulte (théorème
d’inversion locale) que f est un C 1 -difféomorphisme local en a (cf. l’exercice précédent). En
particulier f est alors une application ouverte : pour tout ouvert U de Rn , f (U ) est un ouvert
de Rn . Soit en effet b ∈ f (U ). Il existe a ∈ U tel que b = f (a). D’après le théorème
d’inversion locale, il existe un ouvert U ′ contenant a et un ouvert V ′ contenant b tel que la
restriction f|U ′ soit un C 1 -difféomorphisme de U ′ sur V ′ . Cette restriction est a fortiori un
homéomorphisme de U ′ sur V ′ . Puisque U ∩ U ′ est un ouvert de U ′ , son image est alors un
ouvert de V ′ , donc de Rn , contenu dans f (U ) et contenant b . Ainsi f (U ) est un voisinage de
chacun de ses points, donc est un ouvert.
c) L’application f étant ouverte, f (Rn ) est un ouvert de Rn . D’après l’alinéa a), c’est aussi
un fermé. Mais Rn est connexe et f (Rn ) n’est pas vide, donc f (Rn ) = Rn : f est surjective.
c Dunod 2014
II.1 : Espaces vectoriels normés
163
L’injectivité est évidente : si x, y ∈ Rn sont tels que f (x) = f (y), l’hypothèse sur f implique :
kx − yk 6 kf (x) − f (y)k = 0 , d’où x = y .
Conclusion : f est une bijection de Rn sur lui-même et la différentielle de f en tout point
est inversible (i.e. f est un C 1 -difféomorphisme local en tout point), donc f est un C 1 difféomorphisme (global) de Rn sur lui-même. Précisons ce point. D’abord f est bijective
et ouverte. Pour tout ouvert U de Rn , f (U ) est ouvert, ce qui montre que f −1 est continue.
Ainsi f est déjà un homéomorphisme de Rn sur lui-même.
Il reste à montrer que f −1 est de classe C 1 au voisinage de tout point b ∈ Rn . Soit
a := f −1 (b). D’après le théorème d’inversion locale, il existe un ouvert U contenant a et
un ouvert V contenant b tel que la restriction f|U soit un C 1 -difféomorphisme de U sur V .
Le difféomorphisme réciproque de f|U est évidemment f|−1
. Ainsi f −1 est de classe C 1 sur
V
V , qui est un voisinage de b , d’où notre assertion.
II.1.20 L’unicité résulte de la proposition 12 de la page 410 de la page 410. Soient en effet
g, g ′ : X → Y deux applications continues prolongeant f . Alors g et g ′ coïncident sur
A, qui est une partie dense de X , donc g = g ′ .
Il reste à construire un prolongement continu de f à X . Soit x ∈ X . Puisque A est dense
dans X , il existe une suite (an ) de A convergeant vers x. Nous avons envie de poser :
g(x) :=
lim f (an ).
n→+∞
(∗)
Encore faut-il que la suite figurant dans le second membre converge ! Puisque Y est complet,
il suffit pour cela que f (an ) soit une suite de Cauchy. Soit donc ε > 0 . L’application f
étant uniformément continue, il existe un réel α tel que, pour tous a, b ∈ A, la condition
d(a, b) 6 α implique d f (a), f (b) 6 ε . La suite (an ) étant de Cauchy (parce qu’elle
converge), il existe de plus un entier N > 0 tel que d(an , ap ) 6 α dès que n > N et p > N .
Dès que n > N et p > N , on a donc d f (an ), f (ap ) 6 ε , ce qui montre que la suite f (an )
est une suite de Cauchy. Cette suite converge donc, i.e. le second membre de la formule (∗) est
défini.
Cela ne suffit pas. Il faut montrer que le second membre de ladite formule ne dépend que de
x, i.e. ne dépend pas du choix de la suite (an ) de A convergeant vers x. Soit donc (bn ) une
autre suite de A convergeant vers x. Soient ε > 0 et α comme ci-dessus. Il existe un rang
M à partir duquel d(an , x) 6 α/2 et d(bn , x) 6 α/2 . Pour tout n > M , il en résulte que
d(an , bn ) 6 α , d’où d f (an ), f (bn ) 6 ε . Les deux suites f (an ) et f (an ) ont donc
même limite, de sorte que la formule (∗) définit effectivement une application g : X → Y . Il
est clair que g prolonge f : dans ce qui précède, si x ∈ A, on peut poser an := x pour tout
n, et alors g(x) = f (x).
Il reste à voir que g est uniformément continue. Soient encore ε > 0 et α comme ci-dessus.
Il suffit de montrer que, pour tous x, x′ ∈ X , la condition d(x, x′ ) 6 α/2 implique
d f (x), f (x′ ) 6 3ε . Soient donc x, x′ ∈ X tels que d(x, x′ ) 6 α/2 . Choisissons une
suite (an ) de A convergeant vers x et une suite (a′n ) de A convergeant vers x′ . Par défini
tion, la suite f (an ) converge vers g(x), et la suite f (a′n ) converge vers g(x′ ). Pour tout
entier n suffisamment grand,
- d’une part d g(x), f (an ) 6 ε et d g(x′ ), f (a′n ) 6 ε ;
- d’autre part d(x, an ) 6 α/4 et d(x′ , a′n ) 6 α/4 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
164
Pour un tel n, d(an , a′n ) 6 d(an , x) + d(x, x′ ) + d(x′ , a′n ) 6 α/4 + α/2 + α/4 = α , d’où
d f (an ), f (a′n ) 6 ε , en vertu de la définition de α en fonction de ε . Un tel n étant fixé, on a
bien :
d g(x), g(x′ ) 6 d g(x), f (an ) + d f (an ), f (a′n ) + d f (a′n ), g(x′ ) 6 ε + ε + ε = 3ε,
ce qui établit l’uniforme continuité de g .
II.1.21 1. Rappelons que toute suite de Cauchy est bornée. Si donc u := (un ) ∈ A, la borne
supérieure kuk∞ := sup |un | est finie, i.e. est un réel. Cela étant, soient u := (un ) et
n
v := (vn ) deux éléments de A. Soit ε > 0 . Il existe un entier N tel que, pour tous entiers
n, p > N , on ait |un − up | 6 ε et |vn − vp | 6 ε . Dès que n, p > N , on en déduit d’abord
|(un + vn ) − (up + vp )| 6 2ε , ce qui montre que la suite u + v est de Cauchy. Ensuite :
|un vn − up vp | = |un (vn − vp ) + vp (un − up )| 6 |un (vn − vp )| + |vp (un − up )|
6 ε |un | + |vp | 6 ε kuk∞ + kvk∞ .
Il en résulte que la suite uv est de Cauchy. Comme A contient l’élément neutre multiplicatif
de la Q -algèbre S , à savoir la suite constante égale à 1 , A est une sous- Q -algèbre de S .
Toute suite de Cauchy u := (un ) de Q est aussi une suite de Cauchy de R, elle possède donc
une (unique) limite dans R, notons-la f (u). On définit ainsi une application f : A → R. Les
opérations classiques sur les suites réelles convergentes montrent que f est un morphisme de
Q -algèbres. Ce morphisme est surjectif, parce que tout réel x est limite d’une suite (un ) de
Q : prendre par exemple pour un la valeur approchée de x à 10−n près par défaut. Le noyau
de f est formé des suites u de Q convergeant vers 0 dans R, donc dans Q , autrement dit
Ker f = I . D’après le théorème d’isomorphisme, f induit un isomorphisme de A/I sur R, et
par suite A/I est un corps. Cela signifie que I est un idéal maximal de A.
2. Dans le cours de [L1], R a été défini à partir de Q à l’aide des développements décimaux.
Une façon différente de définir R à partir de Q est suggérée par ce qui précède : il n’y a qu’à
poser R := A/I . Où est l’erreur ? D’abord A est formée des suites u = (un ) de Q qui sont de
Cauchy. Qu’est-ce que cela veut dire ? Voici la réponse : pour tout réel ε > 0 , il existe etc. C’est
un cercle vicieux : pour définir R, nous utilisons déjà les réels. Il suffit de modifier la définition
d’une suite de Cauchy de Q : pour tout rationnel ε > 0 , il existe etc. On procède de même
pour expliquer qu’une suite de Q converge vers 0 , d’où la définition de I . Il reste un point plus
subtil : pour prouver que I était un idéal maximal de A, nous avons invoqué ci-dessus le fait
que R (supposé connu là encore) était un corps. Il faut donc démontrer directement que I est
un idéal maximal de A. C’est une vérification mécanique ne présentant pas de difficulté, nous
la laissons au lecteur.
II.1.22 D’après le théorème du point fixe, f n possède un unique point fixe a. Montrons que a est
un point fixe de f . Posons b := f (a). Alors :
f n (b) = f n f (a) = f n+1 (a) = f f n (a) = f (a) = b,
donc b est un point fixe de f n . Par unicité de a, b = a, c’est-à-dire f (a) = a : a est un point
fixe de f .
L’unicité est évidente : si a′ est un point fixe de f , c’est clairement un point fixe de f n , et
donc a′ = a.
c Dunod 2014
II.1 : Espaces vectoriels normés
165
II.1.23 Supposons que X soit fini, écrivons X := {x1 , . . . , xn } . Chaque singleton {xi } est
compact (c’est un point), donc X est compact comme réunion finie de parties compactes. Par
ailleurs chaque point est fermé, mais aussi ouvert, comme complémentaire de la réunion (finie)
des autres points). Il en résulte que X est discret.
Supposons inversement que X soit compact et discret. Pour tout x ∈ X , {x} est donc un
ouvert de X . Les singletons formant un recouvrement (en fait une partition) de X , la propriété
de Borel-Lebesgue montre que X est réunion finie de singletons, autrement dit X est fini.
Donnons une autre preuve (la propriété de Borel-Lebesgue a été admise dans ce volume). Raisonnons par l’absurde, en supposant que X est infini. Il existe alors une application injective
s de N dans X . Posons un := s(n) pour tout n ∈ N. Puisque X est compact, la suite
(un ) possède une valeur d’adhérence ℓ . Puisque X est discret, il existe un réel r > 0 tel
que B(ℓ, r) = {ℓ} . Cela contredit le fait que ℓ soit valeur d’adhérence de (un ) : d’après la
propriété suivant la définition 7 de la page 402 de la page 402, n ∈ N | un ∈ B(ℓ, r) doit
être infini, ce qui est absurde puisque les un sont distincts et B(ℓ, r) = {ℓ} .
II.1.24 Cet exercice est complètement trivial (et sans intérêt) lorsque n = 1 . Supposons donc
n > 2.
1. Il suffit de montrer que X est fermé et borné (parce que l’on travaille dans Rn ). Pour tout
P
x := (x1 , . . . , xn ) ∈ X , on a xi > 0 , mais aussi xi = 1 −
xj 6 1 . Ainsi 0 6 xi 6 1
pour tout i , d’où évidemment kxk =
P
i
x2i
1/2
j6=i
6
√
n. La partie X est donc bornée. Elle
est fermée, parce que c’est une intersection de n + 1 demi-espaces fermés : les demi-espaces
définis par les conditions xi > 0 ( i = 1, . . . , n) et le demi-espace défini par la condition
x1 + x2 + · · · + xn 6 1 . Bien entendu, ces demi-espaces sont fermés parce que l’on est en
dimension finie.
2. L’application (x1 , . . . , xn ) 7→ x1 x2 · · · xn de Rn dans R est n-linéaire, elle est donc continue parce que l’on est en dimension finie. Puisque la fonction f est la restriction de cette
application à X , elle est continue.
Puisque X est compact et f : X → R est continue, f est bornée et atteint son maximum
absolu M . Le point a = (1/n, 1/n, . . . , 1/n) appartient à X , et f (a) = n−n 6 M , en
particulier M > 0 . Soit alors x := (x1 , . . . , xn ) ∈ X tel que f (x) = M . D’abord les xi
sont non nuls, donc 0 < xi < 1 pour tout i (parce que n > 2 ). Supposons par l’absurde qu’il
existe deux indices i, j distincts tels que xi 6= xj , par exemple xi > xj . Considérons un réel
ε vérifiant 0 < ε < xi − xj . Posons ensuite yi := xi − ε ∈ ]0, 1[, yj := xj + ε ∈ ]0, 1[ et
yk := xk pour tout indice k distinct de i et j . Il est clair que y := (y1 , . . . , yn ) appartient à
X . De plus f (y) > f (x) = M , d’où la contradiction désirée. En effet :
yi yj = (xi − ε)(xj + ε) = xi xj + ε(xi − xj − ε) > xi xj .
En conclusion, tous les xi sont égaux. Leur somme valant 1 , chacun d’eux vaut 1/n, d’où
M = n−n .
3. Étant donnés des réels positifs t1 , . . . , tn , il s’agit de prouver l’inégalité suivante :
√
n
t1 t2 · · · tn 6
t1 + t2 + · · · + tn
·
n
(∗)
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
166
Si tous les ti sont nuls, le résultat est trivial. Dans le cas contraire, s :=
P
ti > 0 . Posons
i
pour tout i : xi := ti /s. Les xi sont positifs et de somme 1 , donc x := (x1 , . . . , xn ) ∈ X .
D’après la question 2, f (x) 6 M = n−n . D’où :
n
t1 + t2 + · · · + tn
n
−n n
t1 t2 · · · tn = s (x1 x2 · · · xn ) 6 n s =
.
n
L’inégalité arithmético-géométrique (∗) en résulte, en prenant les racines n èmes des deux
membres.
II.1.25 En premier lieu l’hypothèse de compacité est nécessaire, comme le montre l’exemple de la
√
fonction x 7→ x2 + 1 de R dans R, traité dans la section 2.2 de la page 427. Ensuite f est
continue, car elle est 1 -lipschitzienne. Par ailleurs, la partie unicité de l’exercice est évidente.
Raisonnons en effet par l’absurde, en supposant que f possède deux points fixes distincts a et
b . Par hypothèse a 6= b , donc d(a, b) = d f (a), f (b) < d(a, b), ce qui est absurde.
Il reste à montrer que f possède au moins un point fixe. La fonction g : x 7→ d f (x), x de
X dans R est continue, car la fonction distance est continue sur X × X et f est continue.
Puisque X est compact, g est bornée et atteint, en particulier sa borne inférieure m. Soit donc
a ∈ X tel que g(a) = m. Montrons que a est un point fixe de f . Raisonnons par l’absurde,
en supposant f (a) 6= a, c’est-à-dire m > 0 . Vu l’hypothèse faite sur f , la condition f (a) 6= a
implique :
g f (a) = d f 2 (a), f (a) < d f (a), a) = g(a) = m,
ce qui contredit la définition de m. En conclusion, f (a) = a.
II.1.26 a) Il faut montrer en premier lieu que F appartient à K , c’est-à-dire que F est compact et
non vide. La suite (Fk )k>0 est évidemment décroissante. En vertu de la proposition 49 de la
page 435 de la page 435, il suffit donc de montrer que chaque Fk est un compact ( Fk contient
Ak qui n’est pas vide) ; comme Fk est par définition fermé, il s’agit en fait de montrer que c’est
une partie bornée de Rn .
La suite (Ak )k>0 est bornée, car c’est une suite de Cauchy. Il existe donc un réel C > 0
tel que δ(A0 , Ak ) 6 C pour tout k . Fixons un point a ∈ A0 . Soit k ∈ N. La définition
de δ (formule (25) de la page 439) montre que d(a, Ak ) 6 δ(A0 , Ak ) 6 C . Soit x ∈ Ak .
Puisque A0 est compact non vide, il existe y ∈ A0 tel que d(x, y) = d(x, A0 ) 6 C . Alors
d(a, y) 6 Diam(A0 ), d’où d(x, a) 6 d(x, y) + d(y, a) 6 C + Diam(A0 ). La boule fermée
de centre a et de rayon C + Diam(A0 ) contient donc Ak , ceci pour tout k . Si k est fixé,
cette boule contient chaque Ap , elle contient donc la réunion des Ap pour p > k , et par suite
elle contient Fk , qui est l’adhérence de ladite réunion. Il en résulte que Fk est bornée. En
conclusion, F appartient à K .
b) Il reste à montrer que F est limite (dans K ) de la suite (Fk ). Soit donc ε > 0 . Il existe
un entier N > 0 tel que δ(Ah , Ak ) 6 ε dès que h > N et k > N . Il suffit de vérifier que
δ(F, Ak ) 6 ε pour tout k > N . Fixons donc un entier k > N . Pour tout entier p > k et
tout x ∈ Ap , on a d(x, Ak ) 6 δ(Ap , Ak ) 6 ε . L’inégalité d(x, Ak ) 6 ε est donc vraie pour
tout x appartenant à la réunion des Ap pour p > k . La fonction x 7→ d(x, Ak ) étant continue
sur Rn , l’inégalité d(x, Ak ) 6 ε reste vraie pour tout x ∈ Fk , et a fortiori pour tout x ∈ F .
Ainsi :
sup d(x, Ak ) 6 ε.
(∗)
x∈F
c Dunod 2014
II.1 : Espaces vectoriels normés
167
Soit y ∈ Ak . Considérons un entier p > k . Puisque d(y, Ap ) 6 δ(Ak , Ap ) 6 ε , il existe
zp ∈ Ap ⊂ Fk tel que d(y, zp ) 6 ε . Puisque Fk est compact, la suite (zp )p>k possède une
valeur d’adhérence z ∈ Fk . Si p > k est fixé, z est encore valeur d’adhérence de la suite
(zm )m>p à valeurs dans Fp , donc z ∈ Fp (car Fp est fermé). Ainsi z appartient à tous les
Fp , p > k , donc z ∈ F . Enfin d(y, z) 6 ε puisque d(y, zp ) 6 ε pour tout p > k . Nous avons
donc établi l’inégalité d(y, F ) 6 ε , ceci pour tout y ∈ Ak , d’où :
sup d(y, F ) 6 ε.
y∈Ak
En rapprochant cette inégalité de l’inégalité (∗), il vient : δ(F, Ak ) 6 ε , comme désiré.
II.1.27 Nous allons appliquer le résultat de l’exercice précédent, en prenant n := 1 . Ainsi K
est l’ensemble des compacts non vides de R, muni de la distance de Haussdorf δ définie
par la formule (25) de la page 439. Observons d’abord que f est bien une application de
K dans lui-même car, si A ∈ K , h(A) est un compact non vide de R (parce que h est
un homéomorphisme de R sur lui-même), de même h′ (A) est compact non vide, et enfin
f (A) := h(A) ∪ h′ (A) est compact non vide. Remarquons également que les fonctions h et
h′ sont 1/3 -lipschitziennes.
1. Soient A, B ∈ K et t := δ(A, B). Il s’agit de prouver l’inégalité δ f (A), f (B) 6 t/3 .
Vu la définition de δ , il suffit (par symétrie) de montrer que d y, f (B) 6 t/3 pour tout
y ∈ f (A). Soit donc y ∈ f (A). Si y ∈ h(A), a := 3y ∈ A, et :
d y, f (B) = d y, h(B) ∪ h′ (B) 6 d y, h(B)
= d h(a), h(B) = d(a, B)/3 6 δ(A, B)/3 = t/3.
De même, si y ∈ h′ (A), a′ := 3y − 2 ∈ A, et :
d y, f (B) = d y, h(B) ∪ h′ (B) 6 d y, h′ (B)
= d h′ (a′ ), h′ (B) = d(a′ , B)/3 6 δ(A, B)/3 = t/3.
L’application f : K → K est donc 1/3 -lipschitzienne.
2. L’exercice précédent montre que l’espace métrique (K, δ) est complet. D’après la question 1,
f est contractante. Le théorème du point fixe montre donc que f possède un unique point fixe
F . Il reste à montrer que F est l’ensemble triadique de Cantor K3 défini dans la proposition 53
de la page 436 de la page 436 et sa preuve.
Toujours d’après le théorème du point fixe, F est limite de la suite (Ak )k>0 de K définie par
son premier terme A0 := [0, 1] ∈ K et la relation de récurrence Ak+1 := f (Ak ). Puisque
f (A0 ) ⊂ A0 , on a f (Ak ) ⊂ Ak pour tout k (récurrence immédiate), autrement dit la suite
(Ak )k>0 est décroissante pour l’inclusion. Avec les notations de l’exercice précédent, il en
résulte que Fk = Ak pour tout k , d’où :
\
F =
Ak .
k>0
Il suffit maintenant d’expliciter les Ak . Reprenons les notations de la preuve de la proposition 53 de la page 436 de la page 436. Pour tout k ∈ N, Tk est donc l’ensemble des entiers de
k−1
P j
[[0, 3k − 1]] dont l’écriture en base 3 ne comporte pas le chiffre 1 , i.e. l’ensemble des
3 aj ,
j=0
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
168
chaque aj valant 0 ou 2 . Compte tenu de la preuve en question, tout revient à établir pour tout
k ∈ N l’égalité suivante :
[ Ak =
3−k t, 3−k (t + 1) .
(∗)
t∈Tk
Cette formule est vraie pour k := 0 , car T0 = {0} et A0 = [0, 1]. Supposons qu’elle soit
vraie pour un certain k . Observons d’abord que Tk+1 est la réunion disjointe de Tk et de
2 · 3k + Tk := t + 2 · 3k | t ∈ Tk . Soit t ∈ Tk . L’image de 3−k t, 3−k (t + 1) par l’homo
thétie h est 3−(k+1) t, 3−(k+1) (t + 1) . L’image de 3−k t, 3−k (t + 1) par l’homothétie h′
est 3−(k+1) t′ , 3−(k+1) (t′ + 1) , où t′ := t + 2 · 3k . Lorsque t décrit Tk , t′ décrit 2 · 3k + Tk ,
d’où :
i h
io
[ nh
Ak+1 = f (Ak ) =
3−(k+1) t, 3−(k+1) (t + 1) ∪ 3−(k+1) t′ , 3−(k+1) (t′ + 1)
t∈Tk
=
i
[ h
3−(k+1) τ, 3−(k+1) (τ + 1) ,
τ ∈Tk+1
ce qui établit la formule (∗) au rang k + 1 . Cette formule est donc vraie pour tout k , et par
conséquent F = K3 . En conclusion, K3 est bien l’unique point fixe de f .
II.1.28 Pour j = 1, 2, 3 , notons rj le rayon du cercle Cj , puis écrivons Oj = (aj , bj ) et
Mj := (xj , yj ). Un point variable M de C1 s’écrit M := M (t) := x(t), y(t) ), avec
x := x(t) := a1 + r1 cos t et y := y(t) := b1 + r1 sin t, où t décrit R. Considérons la
fonction f : R → R définie par :
f (t) = M (t)M2 + M (t)M3 + M2 M3 .
Le triangle M1 M2 M3 étant un triangle de périmètre minimum, la fonction f atteint a fortiori
son maximum absolu en un réel t1 tel que M1 = M (t1 ). À partir de là, l’idée est de montrer
que la fonction f est de classe C ∞ , puis de vérifier que la condition géométrique de l’énoncé
traduit l’égalité f ′ (t1 ) = 0 .
Soit A := (a, b) un point de R2 fixé. À tout point M := (x, y), associons le réel
g(M ) := M A2 = (x − a)2 + (y − b)2 . La fonction g : R2 → R est de classe C ∞ (elle
est polynomiale), et sa différentielle en un point P := (c, d) est donnée par la formule :
→
−
→
→
−
−→ −
DP (g)( h ) = 2 u(c − a) + v(d − b) = 2( AP | h ) pour tout h := (u, v) ∈ R2 .
√
√
La fonction x 7→ x est de classe C ∞ sur ]0, +∞[, sa dérivée étant x 7→ 1/(2 x). La
√
fonction g : M 7→ M A est donc de classe C ∞ sur R2 \ {A} , et sa différentielle en un point
P := (c, d) distinct de A est donnée par la formule :
→
−→ −
→
→
−
√ −
( AP | h )
DP g ( h ) =
pour tout h ∈ R2 .
PA
On en déduit que la fonction ϕ : M 7→ M M2 + M M3 + M2 M3 est de classe C ∞ sur
R2 \ {M2 , M3 } , sa différentielle en un point M étant donnée par la formule :
−−−→ −−−→ !
−
→
→ M2 M
−
→
−
M3 M
DM ϕ ( h ) =
h
+
pour tout h ∈ R2 .
M M2
M M3
c Dunod 2014
II.1 : Espaces vectoriels normés
169
La fonction t 7→ M (t) de R dans R2 est de classe C ∞ sur R, et sa dérivée en un point t est
−−−−→
→
−
w := (−r1 sin t, r1 cos t), c’est le vecteur de longueur r1 directement orthogonal à OM (t) .
Par composition, la fonction f : R → R est de classe C ∞ , et sa dérivée est donnée par la
formule :
−−−−−→ −−−−−→ !
M M (t) M M (t)
2
3
→
−
′
+
.
f (t) =
w
M (t)M2
M (t)M3
→
Appliquons cette formule avec t := t1 . Pour j = 2, 3 , soit −
τj le vecteur unitaire dirigé par
−−−−→
→
→
′
M1 Mj . Puisque f atteint en t1 son maximum absolu, f (t1 ) = 0 . Ainsi −
τ2 + −
τ3 est orthogonal
−
−
−
→
→
−
→
−
→
−
à w := (−r1 sin t1 , r1 cos t1 ), autrement dit τ2 + τ3 est colinéaire à O1 M1 . Considérons les
−−−→ → −−−→ −
−−−→
→
→
→
→
points P, P2 , P3 tels que −
τ2 = M1 P2 , −
τ3 = M1 P3 et →
τ2 + −
τ3 = M1 P . Puisque −
τ2 et −
τ3 sont
unitaires, le parallélogramme M1 P2 P M3 est un losange, donc la droite M1 P est la bissectrice
→
→
intérieure du triangle M1 M2 M3 en M1 . D’où la conclusion : en effet, −
τ2 + −
τ3 est colinéaire
−−−→
à O1 M1 , donc P appartient à la droite O1 M1 .
P2
→
τ2
O1
M1
→
→
P
τ2 + τ3
→
τ3
P3
II.1.29 On peut se limiter au cas où le corps de base est R, car tout e.v. n. complexe est aussi un
e.v. n. réel, la fonction distance étant la même, que l’on considère cet espace comme espace
vectoriel sur C ou comme espace vectoriel sur R. Rappelons la définition du diamètre de A :
Diam(A) := sup d(x, y) | (x, y) ∈ A × A .
Cette borne supérieure est finie parce que A est bornée. Il est clair que, si A1 , A2 sont deux
parties bornées non vides de E , (A1 ⊂ A2 ) implique Diam(A1 ) 6 Diam(A2 ) . L’in-
clusion A ⊂ A entraîne donc Diam(A) 6 Diam(A). Inversement, soient x, y ∈ A. Il
existe deux suites (xn ) et (yn ) de A convergeant vers x et y respectivement. Pour tout n,
d(xn , yn ) 6 Diam(A). La fonction distance étant continue, d(x, y) est la limite de d(xn , yn )
lorsque n tend vers +∞, d’où d(x, y) 6 Diam(A). Cette inégalité étant vraie pour tout
(x, y) ∈ A × A , on en déduit (en passant à la borne supérieure) Diam(A) 6 Diam(A), d’où
Diam(A) = Diam(A).
Rappelons ensuite la définition de la frontière ∂(A) de A : ∂(A) := A \ Int(A). Remarquons
que cette frontière n’est pas vide : si elle l’était, A = Int(A) serait fermé et ouvert, donc égal à
E puisque E est connexe et même convexe. C’est absurde, puisque A est bornée et E ne l’est
pas. Par ailleurs, Diam ∂(A) 6 Diam(A) = Diam(A) à cause de l’inclusion ∂(A) ⊂ A . Il
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
170
nous suffit donc de prouver l’inégalité suivante :
Diam(A) 6 Diam ∂(A) .
(∗)
Notons que A ⊂ A entraîne Int(A) ⊂ Int(A) puis ∂(A) ⊃ ∂(A), puisque A et A ont
même adhérence A . Il en résulte que l’inégalité (∗) sera une conséquence de la suivante :
Diam(A) 6 Diam ∂(A) . Autrement dit, quitte à remplacer A par A , qui est compacte, il
suffit d’établir l’inégalité (∗) lorsque A est un compact non vide de E , ce que nous supposons
désormais. Remarquer alors que ∂(A) = A \ Int(A).
Examinons d’abord le cas où E := R (avec comme norme la valeur absolue). Soient a := inf A
et b := sup A. Puisque A est compact, a et b appartiennent à A. Par contre, il est clair que a
et b n’appartiennent pas à Int(A), car A ⊂ [a, b]. Ainsi a, b ∈ ∂(A), d’où :
Diam(A) 6 Diam [a, b] = Diam {a, b} 6 Diam ∂(A) .
L’inégalité (∗) est donc vraie dans ce cas particulier. En fait, les normes sur R sont exactement
les k |·|, k > 0 étant fixé, donc l’inégalité (∗) est vraie lorsque E := R est muni d’une norme
arbitraire. On en déduit facilement que cette inégalité est vraie dès que E est un e.v. n. de
dimension 1 .
Passons au cas général. Vu la définition de Diam(A) comme borne supérieure, tout revient à
démontrer que, si x, y ∈ A sont fixés, on a d(x, y) = kx − yk 6 Diam ∂(A) . La distance d
étant invariante par translation, on peut supposer que y := 0 , quitte à remplacer A par A − y .
Ainsi A contient 0 et x, et l’inégalité à établir devient : kxk 6 Diam ∂(A) . C’est évident si
x := 0 , supposons donc x 6= 0 .
L’idée est alors d’appliquer le cas particulier précédent à la droite D := Rx. Soit B := A ∩ D .
C’est un compact non vide de D , contenant 0 et x. Puisque D ∩ Int(A) est un ouvert de
D , l’intérieur de B dans D contient D ∩ Int(A), donc la frontière ∂(B) de B dans D est
contenue dans (D ∩ A) \ D ∩ Int(A) = D ∩ ∂(A). D’après le cas particulier précédent, on
a Diam(B) 6 Diam ∂(B) , d’où :
kxk 6 Diam(B) 6 Diam ∂(B) 6 Diam ∂(A) .
II.1.30 Observons d’abord que f (λx) = λf (x) pour tout (λ, x) ∈ K × E , vu la définition de f
et la propriété d’homogénéité des normes. Cela étant, définissons g : E → E comme f , mais
en échangeant les rôles des deux normes : g(0) := 0 et g(x) := (kxk′ /kxk)x si x 6= 0 . Pour
tout x non nul, il vient :
kxk
kxk
x =
g(x) = x.
g f (x) = g
′
kxk
kxk′
De même f g(x) = x, donc f et g sont deux bijections réciproques l’une de l’autre.
Remarquons que, pour tout x non nul, kg(x)k = (kxk′ /kxk)kxk = kxk′ et de même
′
kf (x)k′ = kxk . On en déduit les inclusions f B(0, 1) ⊂ B (0, 1), f S(0, 1) ⊂ S ′ (0, 1)
′
′
et de même g B (0, 1) ⊂ B(0, 1), g S ′ (0, 1) ⊂ S(0, 1). Ainsi f B(0, 1) = B (0, 1) et
f S(0, 1) = S ′ (0, 1). Il nous reste à démontrer la continuité de f . La continuité de g = f −1
en résultera, en échangeant les deux normes, et alors f sera un homéomorphisme de E sur
lui-même.
c Dunod 2014
II.1 : Espaces vectoriels normés
171
Jusqu’à présent, le fait que E soit de dimension finie n’est pas intervenu. Cette hypothèse est
nécessaire pour donner un sens à la phrase « f est continue ». Cela signifie que f : E → E
est continue, quel que soit le choix des normes sur E , au départ et à l’arrivée, ce choix
étant d’ailleurs indifférent puisque E est de dimension finie. Montrons par exemple que
f : E, k·k → E, k·k′ est continue. La continuité en 0 résulte de l’égalité kf (x)k′ = kxk .
Soit x un vecteur non nul. Étant donnée une suite (xn ) de E convergeant vers x dans
E, k·k , il s’agit de montrer que la suite f (xn ) converge vers f (x) dans E, k·k′ . On
peut supposer que les xn sont tous non nuls (c’est vrai en tout cas dès que n est assez grand).
La norme k·k étant continue, kxn k tend vers kxk quand n tend vers +∞. La suite (xn )
converge aussi vers x dans E, k·k′ (parce que les deux normes sont équivalentes), donc
kxn k′ tend vers kxk′ quand n tend vers +∞. Comme la suite (xn ) converge aussi vers x
dans E, k·k′ , il en résulte que f (xn ) = kxn k/kxn k′ xn tend vers kxk/kxk′ x = f (x)
quand n tend vers +∞. D’où la continuité de f en x.
II.1.31 Soit donc E un e.v. n. de dimension finie n > 1 . Il s’agit de démontrer que E contient
une partie dense dénombrable (une partie dense ne peut évidemment pas être finie). Comme
toujours, on peut se limiter au cas où le corps de base est R. La notion de partie dense étant
topologique, on se ramène immédiatement au cas où E est l’espace Rn muni de sa norme
euclidienne usuelle.
Ce cas est évident, car Qn est une partie dénombrable dense de Rn . D’abord Q est dénombrable, donc Qn l’est aussi (cf. le cours de [L1]). Ensuite Q est dense dans R. Soit alors
x := (x1 , . . . , xn ) ∈ Rn . Étant donné un réel ε > 0 , il s’agit de montrer que la boule B(x, ε)
√
√
rencontre Qn . Pour tout j ∈ [[1, n]], le segment [xj − ε/ n, xj + ε/ n] contient (au moins)
un nombre rationnel yj . Alors y := (y1 , . . . , yn ) ∈ Qn , et l’on a :
kx − yk2 =
n
X
j=1
(xj − yj )2 6
n
X
(ε2 /n) = ε2 .
j=1
n
Il en résulte que y ∈ Q ∩ B(x, ε).
II.1.32 1. Rappelons qu’une norme matricielle est une norme k·k sur Mn (C) possédant la propriété suivante : kM N k 6 kM kkN k pour toutes matrices M, N ∈ Mn (C). Considérons une
telle norme matricielle k·k . Soient λ une valeur propre de A et X un vecteur propre de A
associé à λ. Soit M := [0; 0; . . . ; 0, X] ∈ Mn (C) la matrice dont toutes les colonnes sont
nulles, sauf la dernière qui est égale à X . Il est clair que AM = λM , d’où l’on déduit :
|λ| kM k = kλM k = kAM k 6 kAkkM k . Comme kM k > 0 , il en résulte que |λ| 6 kAk .
Cette inégalité étant vraie pour toute valeur propre de A, l’inégalité ρ(A) 6 kAk s’ensuit.
2. Observons d’abord que deux matrices semblables ont même rayon spectral (elles ont mêmes
valeurs propres). Cela étant, la matrice A est trigonalisable (parce que C est algébriquement clos), il existe donc une matrice P ∈ GLn (C) telle que T := P AP −1 soit triangulaire supérieure. Notons ti,j les coefficients de T , et posons λj := tj,j pour tout j . Ainsi
ρ(A) = max(|λj |). Par ailleurs ti,j = 0 dès que i > j .
2
Commençons par choisir un réel α assez petit pour avoir ρ(A)2 + (n − 1)α2 6 ρ(A) + ε .
Considérons ensuite un réel a > 1 et posons D := Diag(1, a, a2 , . . . , an−1 ). La matrice
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
172
DT D−1 se déduit de T en multipliant chaque ligne d’indice i par ai−1 puis en divisant
chaque colonne d’indice j par aj−1 . Cette matrice a mêmes termes diagonaux que T . Pour
tous indices i, j tels que 1 6 i < j 6 n, le coefficient d’indices (i, j) de DT D−1 est
ai−j ti,j . Si l’on choisit le réel a suffisamment grand, on aura ai−j ti,j 6 α dès que i < j .
Quitte à remplacer P par DP et donc T par DT D−1 , nous pouvons supposer que tous les
coefficients non diagonaux de T sont en module majorés par α .
Notons (E1 , . . . , En ) la base canonique de Cn . Munissons Cn de sa norme hermitienne
usuelle. Soit j ∈ [[1, n]]. L’une des composantes du vecteur T Ej vaut λj , chacune des autres
composantes étant majorée en module par α . D’où :
2
kT Ej k2 6 |λj | + (n − 1)α2 6 ρ(T )2 + (n − 1)α2 = ρ(A)2 + (n − 1)α2 .
Pour tout vecteur X := (x1 , . . . , xn ) ∈ Cn , on a donc :

2
X
X
2
kT Xk2 = xj T Ej 6 
|xj | kT Ej k
j
j
X
2
6 ρ(A)2 + (n − 1)α2
|xj | = ρ(A)2 + (n − 1)α2 kXk2
j
2
6 ρ(A) + ε kXk2,
d’où kT Xk 6 ρ(A) + ε kXk.
Ainsi |||T ||| 6 ρ(A) + ε , en désignant par |||·||| la norme matricielle subordonnée à la norme
hermitienne de Cn .
Il ne reste plus qu’à transporter la norme hermitienne par P . Plus précisément, définissons une
norme k·k′ sur Cn par la formule kY k′ := kP Y k . Pour tout vecteur Y , il vient :
kAY k′ = kP AY k = k(P AP −1 )P Y k = kT (P Y )k 6 ρ(A) + ε kP Y k = ρ(A) + ε kY k′ .
′
′
D’où |||A||| 6 ρ(A) + ε , en désignant par |||·||| la norme matricielle subordonnée à la norme
k·k′ sur Cn .
3. Observons d’abord que ρ(Ak ) = ρ(A)k pour tout k ∈ N. C’est évident lorsque A est
triangulaire. Dans le cas général, on écrit comme ci-dessus A = P −1 T P , où P ∈ GLn (C) et
où T est triangulaire. Alors, pour tout k , il vient :
ρ(Ak ) = ρ P −1 Ak P = ρ(T k ) = ρ(T )k = ρ(P AP −1 )k = ρ(A)k .
Implication a) =⇒ b)
Soit k·k une norme matricielle quelconque. Par hypothèse, la suite réelle kAk k converge
vers 0 . D’après la question 1, ρ(Ak ) 6 kAk k pour tout k , donc la suite ρ(Ak ) , qui n’est
autre que la suite géométrique ρ(A)k , converge vers 0 . D’où ρ(A) < 1 .
Implication b) =⇒ c)
Choisissons ε > 0 tel que ρ(A) + ε < 1 . D’après la question 2, il existe une norme matricielle
subordonnée |||·||| telle que |||A||| 6 ρ(A) + ε , d’où |||A||| < 1 .
Implication c) =⇒ d)
Soit k·k une norme sur Cn telle que |||A||| < 1 , en notant |||·||| la norme subordonnée à k·k .
Étant donné un vecteur C ∈ Cn , notons f l’application affine X 7→ AX + C de Cn dans
lui-même. Pour tous X, Y ∈ Cn , on a, par définition de la norme fonctionnelle |||A||| :
d f (X), f (Y ) = kf (X) − f (Y )k = kA(X − Y )k 6 |||A|||kX − Y k = |||A|||d(X, Y ).
c Dunod 2014
II.1 : Espaces vectoriels normés
173
Ainsi f est |||A||| -lipschitzienne, donc contractante puisque |||A||| < 1 . D’après le théorème
du point fixe, f possède un point fixe unique X . Ce vecteur est donc l’unique solution de
l’équation linéaire AX + C = X . Il en résulte que la matrice In − A est inversible et que
X = (In − A)−1 C .
Implication d) =⇒ a)
Soit j ∈ [[1, n]]. Prenons X0 := 0 et C := Ej . On montre facilement par récurrence que
k−1 P i
Xk :=
A Ej pour tout k . Par hypothèse, la suite formée par les j èmes colonnes des
matrices
général
i=0
k−1
P
i=0
k−1
P
Ai , k décrivant N, converge, ceci pour tout j . Il en résulte que la suite de terme
Ai converge, autrement dit la série
i=0
P
Ak converge. Le terme général de cette
k>0
série tend donc vers 0 , i.e. la suite (Ak ) converge vers 0 .
4. D’après la question 1, ρ(A)k = ρ(Ak ) 6 kAk k , c’est-à-dire kAk k1/k > ρ(A), ceci pour
tout k ∈ N∗ . Soit maintenant ε > 0 . D’après la question 2, il existe une norme subordonnée
|||·||| telle que |||A||| 6 ρ(A) + ε . Cette norme étant équivalente à la norme k·k , il existe en
particulier un réel t > 0 tel que kM k 6 t|||M ||| pour toute matrice M . Soit alors k ∈ N∗ . La
k
norme |||·||| est une norme matricielle, donc |||Ak ||| 6 |||A||| . D’où :
k
k
kAk k 6 t|||Ak ||| 6 t|||A||| 6 t ρ(A) + ε , soit kAk k1/k 6 t1/k ρ(A) + ε .
Lorsque k tend vers +∞, t1/k tend vers 1 , donc t1/k ρ(A) + ε 6 ρ(A) + 2ε dès que k est
assez grand. La suite de terme général kAk k1/k converge donc vers ρ(A) puisque, pour tout
entier k assez grand (en fonction de ε ), on a ρ(A) 6 kAk k1/k 6 ρ(A) + 2ε .
II.1.33 Considérons deux points y, y ′ de λ1 C1 + λ2 C2 et un réel t ∈ [0, 1]. Il existe x1 , x′1 ∈ C1
et x2 , x′2 ∈ C2 tels que y := λ1 x1 + λ2 x2 et y ′ := λ1 x′1 + λ2 x′2 . Alors :
(1 − t)y + ty ′ = λ1 (1 − t)x1 + tx′1 + λ2 (1 − t)x2 + tx′2 ∈ λ1 C1 + λ2 C2 .
En effet, puisque C1 et C2 sont convexes, (1 − t)x1 + tx′1 ∈ C1 et (1 − t)x2 + tx′2 ∈ C2 .
II.1.34 Rappelons ce que signifie l’hypothèse de concavité de f . Pour tous réels x, y > 0 et tout
λ ∈ [0, 1], on doit avoir :
f 1 − λ)x + λy > (1 − λ)f (x) + λf (y).
(∗)
Montrons que f est croissante. Soient A, B, M trois points du graphe de f , d’abscisses respectives a, b, x, avec 0 6 a < b < x. Puisque f est concave, pente(AB) > pente(AM ).
De plus, pente(AM ) = f (x) − f (a) /(x − a) > −f (a)/(x − a). Fixons A, B et faisons
tendre x vers +∞. On en déduit l’inégalité pente(AB) > 0 , autrement dit f (b) > f (a), ce
qui montre que f est croissante.
Étant donnés a, b ∈ R+ , prouvons l’inégalité f (a + b) 6 f (a) + f (b). C’est évident si a et b
sont nuls. Dans le cas contraire, a+b > 0 . En appliquant l’inégalité (∗) avec x := 0 , y := a+b
et λ := a/(a + b), il vient f (a) > af (a + b)/(a + b). De même f (b) > bf (a + b)/(a + b).
En additionnant ces inégalités membre à membre, on obtient l’inégalité annoncée.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
174
Considérons un espace métrique (X, d), et montrons que δ := f ◦ d : X × X → R est
une distance sur X . La fonction δ est symétrique parce que d l’est. Pour tous x, y ∈ X ,
δ(x, y) := f d(x, y) > 0 , avec égalité si, et seulement si, d(x, y) = 0 , c’est-à-dire x = y , et
cela parce que f (0) = 0 et f (t) > 0 pour tout t > 0 . Soient enfin x, y, z ∈ X . Alors :
δ(x, z) = f d(x, z) 6 f d(x, y) + d(y, z) 6 f d(x, y) + f d(y, z) = δ(x, y) + δ(y, z).
La première inégalité résulte de l’inégalité triangulaire dans (X, d) et du fait que f soit croissante, la deuxième vient de l’inégalité établie dans l’alinéa précédent. Ainsi la fonction δ vérifie
l’inégalité triangulaire, et c’est donc une distance sur X .
La fonction t 7→ min(1, t) est concave. Plus généralement, si f1 , f2 sont deux fonctions
concaves (sur un espace vectoriel réel E ), la fonction f := min(f1 , f2 ) est concave. Soient en
effet x, y ∈ E et λ ∈ [0, 1]. Pour i = 1, 2 , la concavité de fi donne :
fi (1 − λ)x + λy > (1 − λ)fi (x) + λfi (y) > (1 − λ)f (x) + λf (y),
d’où f (1 − λ)x + λy > (1 − λ)f (x) + λf (y), ce qui prouve la concavité de f .
La fonction g : t 7→ t/(1 + t) est strictement concave, car elle est de classe C ∞ et sa dérivée
seconde est strictement négative : cette dérivée seconde est t 7→ −2/(1 + t)3 .
Voici la conclusion obtenue : soit (X, d) un espace métrique. Chacune des fonctions
(x, y) 7→ min 1, d(x, y) et (x, y) 7→ d(x, y)/ 1 + d(x, y) est encore une distance sur X .
Remarquer que ces deux nouvelles distances sont bornées par 1 .
II.1.35 Rappelons que le corps de base doit être R lorsqu’il s’agit de convexité. La condition de
l’énoncé est nécessaire, que la partie C soit fermée ou non. En effet, supposons C convexe
et soient x, y ∈ C . Pour tout λ ∈ [0, 1], le point (1 − λ)x + λy appartient à C . Lorsque
λ := 1/2 , on obtient le milieu du segment joignant x et y .
Supposons réciproquement que C soit fermée et que (x + y)/2 ∈ C dès que x ∈ C et y ∈ C .
Notons T l’ensemble des réels λ ∈ [0, 1] tels que (1 − λ)x + λy ∈ C pour tous x, y ∈ C .
Ainsi 1/2 ∈ T , et bien sûr 0, 1 ∈ T . Il s’agit de prouver que T = [0, 1]. Montrons d’abord
que, si a, b ∈ T , alors (a + b)/2 ∈ T . Soient x, y deux éléments arbitraires de C . Appliquons
la propriété d’associativité des barycentres (cf. le module III.1 du cours de [L1]). Considérons
d’une part le barycentre u de (x, 1 − a) et (y, a), et d’autre part le barycentre v de (x, 1 − b)
et (y, b). Puisque a et b appartiennent à T , u et v appartiennent à C , donc le milieu w du
segment les joignant appartient à C . Ce milieu est le barycentre de (u, 1/2) et (v, 1/2) c’est
à-dire, par associativité, le barycentre de x, (1 − a)/2 , (y, a/2), x, (1 − b)/2 et (y, b/2).
Toujours par associativité, le point w est barycentre de x affecté du coefficient 1 − (a + b)/2
et de y affecté du coefficient (a + b)/2 , ce qui montre que (a + b)/2 ∈ T .
Soit D l’ensemble des nombres dyadiques de [0, 1], i.e. l’ensemble des rationnels de la forme
a/2k , où k ∈ N et a ∈ 0, 2k . Prouvons l’inclusion D ⊂ T . Il suffit de montrer, par
récurrence sur k , que si q := a/2k avec k ∈ N et a ∈ [[0, 2k ]] , alors q ∈ T . C’est vrai si
k := 0 , car 0, 1 ∈ T . Supposons que notre assertion soit vraie au rang k − 1 ( k > 1 ) et que
q := a/2k comme ci-dessus. Si a := 2b est pair, q = b/2k−1 ∈ T , d’après l’hypothèse de
récurrence. Si a := 2b + 1 est impair, l’inégalité 2b + 1 < 2k implique b + 1 6 2k−1 . Alors
q = (q ′ + q ′′ )/2 , où q ′ := b/2k−1 et q ′′ := (b + 1)/2k−1 . D’après l’hypothèse de récurrence,
q ′ et q ′′ appartiennent à T . L’alinéa précédent montre donc que q = (q ′ + q ′′ )/2 appartient
aussi à T . D’où l’inclusion D ⊂ T .
c Dunod 2014
II.1 : Espaces vectoriels normés
175
L’ensemble D est dense dans [0, 1]. Soient en effet x ∈ [0, 1] et ε > 0 . Choisissons un entier
n > 0 tel que 2n > 1/ε . Soit a := E(2n x) la partie entière de 2n x. Ainsi a 6 2n x < a + 1 ,
donc a/2n 6 x < (a + 1)/2n . Alors q := a/2n ∈ D , et |x − q| 6 1/2n 6 ε , ce qui établit
la densité de D dans [0, 1].
Montrons maintenant que T est fermé dans [0, 1]. Si x, y ∈ C sont fixés, notons Tx,y l’ensemble des λ ∈ [0, 1] tels que (1 − λ)x + λy ∈ C . L’application λ 7→ (1 − λ)x + λy de [0, 1]
dans E est continue, et Tx,y est l’image réciproque de C par cette application, donc Tx,y est
fermée puisque C est un fermé de E . Enfin, T est l’intersection des Tx,y lorsque (x, y) décrit
C × C , donc T est fermé.
Concluons : puisque T contient D qui est dense dans [0, 1], T est dense dans [0, 1]. Mais T
est aussi fermé dans [0, 1], donc T = [0, 1]. Cela veut dire que, pour tous x, y ∈ C et tout
λ ∈ [0, 1], le point (1 − λ)x + λy appartient à C . Autrement dit, C est convexe.
II.1.36 Soient U un ouvert de Rn et C une composante connexe de U . Soit A ∈ U . Il existe un
réel r > 0 tel que la boule B(A, r) soit contenue dans U . Cette boule est connexe par arcs,
a fortiori connexe. Elle est donc contenue dans C , ce qui montre que C est un voisinage de
chacun de ses points. Autrement dit, C est un ouvert de Rn .
Supposons maintenant que n soit égal à 1 . Notons Ci les composantes connexes de U , i
décrivant un certain ensemble I . Pour tout i ∈ I , l’alinéa précédent montre que Ci est un
ouvert de R. Comme Ci est connexe, c’est un intervalle de R (théorème 66 de la page 448
de la page 448), autrement dit Ci est un intervalle ouvert. Il reste à montrer que l’ensemble I
est fini ou dénombrable. Pour tout i ∈ I , l’intervalle Ci contient un nombre rationnel qi . Si
i, j ∈ I sont distincts, les composantes connexes Ci et Cj sont disjointes, donc qi 6= qj . Il en
résulte que i 7→ qi est une application injective de I dans Q . D’où la conclusion, puisque Q
est dénombrable.
II.1.37 La partie E \ {(0, 0)} est réunion disjointe des quatre parties suivantes :
]0, +∞[ × {0} , ]−∞, 0[ × {0} , {0} × ]0, +∞[ , {0} × ]−∞, 0[ .
Soit par exemple E1 := ]0, +∞[ × {0} . C’est l’intersection de E avec le demi-plan ouvert
(x, y) ∈ R2 | x > 0 , donc E1 est un ouvert de E \ {(0, 0)} . De plus E1 est convexe,
donc connexe, comme intersection du demi-plan en question avec l’axe Ox. Pour les mêmes
raisons, les trois autres parties ci-dessus sont des ouverts connexes de E \ {(0, 0)} . Il en résulte
que E \ {(0, 0)} a quatre composantes connexes, à savoir les quatre parties ci-dessus.
Raisonnons par l’absurde, en supposant qu’il existe un homéomorphisme f de E sur R. Po
sons a := f (0, 0) . Alors f induit un homéomorphisme de E \ {(0, 0)} sur R \ {a} . La
connexité étant une notion topologique, R \ {a} doit avoir quatre composantes connexes, à
savoir les images par f des composantes connexes de E \ {(0, 0)} . C’est absurde, car R \ {a}
a deux composantes connexes : ]−∞, a[ et ]a, +∞[. Conclusion : E n’est pas homéomorphe
à R.
II.1.38 Soient A, B deux points de X := R2 \ (0, 0) distincts. Il suffit de montrer qu’il existe
une partie de X connexe par arcs et contenant A, B . Si l’origine O n’appartient pas au segment
[A, B], ce segment convient. Si O ∈ [A, B], on peut prendre n’importe quel cercle passant par
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
176
A et B . En conclusion deux points arbitraires de X ont même composante connexe par arcs,
donc X est connexe par arcs.
Montrons alors que R2 et R ne sont pas homéomorphes. Raisonnons par l’absurde, en supposant qu’il existe un homéomorphisme f de R2 sur R. Soit a := f (O). D’abord, f induit un
homéomorphisme de X sur R \ {a} . La connexité par arcs étant une propriété topologique,
R\{a} est connexe par arcs puisque X l’est. En particulier, R\{a} est connexe. C’est absurde,
car en fait R \ {a} a deux composantes connexes, à savoir ]−∞, a[ et ]a, +∞[.
II.1.39 Traitons d’abord le cas n := 2 . Soient P := (a, b) et Q := (c, d) deux points de X .
Notons C la composante connexe par arcs de P . Il s’agit de montrer que Q ∈ C . Puisque la
partie S est finie, X est un ouvert de R2 . Si donc b′ ∈ R est assez voisin de b et M := (a, b′ ),
le segment P M est inclus dans X . Comme ce segment est connexe par arcs et contient P , il
est inclus dans C , en particulier M ∈ C . On peut ci-dessus choisir b′ de telle sorte qu’aucun
point de S n’ait pour ordonnée b′ . La droite horizontale d’équation y = b′ est alors contenue
dans X , donc dans C , puisque cette droite est connexe par arcs et passe par M .
Raisonnons de même avec les verticales. On peut choisir un réel c′ assez voisin de c pour que
d’une part X contienne le segment QN où N := (c′ , d), et d’autre part aucun point de S
n’ait pour abscisse c′ . La droite verticale d’équation x = c′ est alors contenue dans X . Cette
droite passe par le point (c′ , b′ ), qui appartient à C vu le choix de b′ , donc la verticale en
question est contenue dans C . Enfin le segment QN est contenu dans X et contient le point
N qui appartient à C ( N est sur la verticale ci-dessus). En conclusion, Q ∈ C , donc les points
P et Q appartiennent à une même composante connexe par arcs de X . Cela étant vrai pour
tous P, Q ∈ X , X est connexe par arcs. On aurait pu obtenir ce résultat en considérant tous
les cercles passant par P et Q et en remarquant qu’il n’y a qu’un nombre fini de tels cercles
contenant un point de S . Nous laissons au lecteur le soin de détailler cette autre méthode.
Q = (c, d)
M = (a, b′ )
N = (c′ , d)
(c′ , b′ )
P = (a, b)
Dans le plan, le complémentaire d’une partie finie est connexe par arcs
La propriété (P) annoncée est donc vraie pour l’espace R2 usuel. La connexité par arcs
étant une propriété topologique, (P) est vraie pour tout espace métrique homéomorphe à
R2 . Passons alors au cas où n > 2 est quelconque. Soient donc S une partie finie de Rn
et X := Rn \ S . Considérons deux points quelconques A et B de X . Choisissons arbitrairement un plan affine Π de Rn passant par A et B . Ce plan, muni de la restriction de
la distance usuelle de Rn , est homéomorphe à R2 . En effet, soient A0 , A1 , A2 trois points
non alignés de Π. L’application de R2 dans Rn associant à tout (x, y) le point M tel que
c Dunod 2014
II.1 : Espaces vectoriels normés
177
−−−→
−−−→
−−−→
A0 M = xA0 A1 + y A0 A2 est une bijection affine, donc un homéomorphisme puisque l’on est
en dimension finie, de R2 sur Π.
Ce qui précède montre que la propriété (P) est vraie pour Π. Soient alors T := S ∩ Π et
Y := Π \ T = X ∩ Π. Puisque T est finie, Y est connexe par arcs. Les points A et B
appartenant à Π, donc à Y , il existe un chemin continu γ : [0, 1] → Y joignant A à B . Enfin
Y ⊂ X , donc γ est aussi un chemin continu de X joignant A à B . Les points A et B de X
étant arbitraires, X est connexe par arcs.
II.1.40 Reprenons les notations de l’exemple 6 de la page 410. L’application x 7→ Rx de S
dans Pn−1 (R) est donc continue. Cette application est surjective, car chaque droite vectorielle
contient un vecteur unitaire (elle en contient exactement deux). Puisque la sphère S est compacte, le théorème 51 de la page 435 de la page 435 montre que Pn−1 (R) est compact.
Le même argument montre que Pn−1 (R) est connexe par arcs lorsque n > 2 parce que S est
connexe par arcs (cf. la proposition 72 de la page 451 de la page 451 et la proposition 73 de
la page 452 de la page 452). Si n := 1 , P0 (R) est un point (il n’y a qu’une seule droite dans
R !), donc P0 (R) est encore connexe par arcs.
II.1.41 1. Soit (x, y) un point de C . Il existe une suite (xn , yn ) de points de C convergeant vers
(x, y), autrement dit telle que x := lim xn et y := lim yn . Pour tout n, xn appartient
n→+∞
à I := ]0, +∞[, et yn = f (xn ), d’où y =
n→+∞
lim f (xn ). Si x > 0 , la continuité de f en
n→+∞
x montre que y = f (x), donc (x, y) ∈ C . Si x = 0 , on observe que y ∈ [−1, 1], puisque
yn = sin(1/xn ) ∈ [−1, 1] pour tout n. Dans ce cas, (x, y) = (0, y) ∈ T , d’où l’inclusion
C ⊂ C ∪T.
Pour établir l’égalité C = C ∪ T , il reste à prouver l’inclusion T ⊂ C (de toutes façons, C ⊂ C ). Soit donc t ∈ [−1, 1]. Posons θ := arcsin t ∈ [−π/2, π/2]. Pour
tout entier n > |θ/(2π)| , on a θ + 2nπ > 0 , donc xn := 1/(θ + 2nπ) > 0 , et
f (xn ) = sin(θ + 2nπ) = sin θ = t. Le point (xn , t) appartient donc à C . Lorsque n tend
vers +∞, xn tend vers 0 , donc (xn , t) tend vers (0, t). On en déduit que (0, t) ∈ C , ceci
pour tout t ∈ [−1, 1], d’où T ⊂ C . En fait, cette preuve montre que, pour tout β > 0 , T est
contenu dans l’adhérence du graphe Cβ de la restriction de f à ]0, β[.
2. Le graphe C de f est connexe et même connexe par arcs, comme image de I , qui est
connexe par arcs, par l’application continue x 7→ x, f (x) de I dans R2 . Il en résulte que C
est connexe (voir l’application suivant la proposition 67 de la page 449 de la page 449).
Montrons par contre que C n’est pas connexe par arcs. Raisonnons par l’absurde, en supposant
que C est connexe par arcs. Il existe alors un chemin continu γ : [0, 1] → C joignant un point
A de T à un point B de C . Puisque T est compact, γ −1 (T ) est un fermé de [0, 1], donc
ω := sup γ −1 (T ) appartient à γ −1 (T ). En particulier ω < 1 , puisque γ(1) = B appartient à
C , qui est disjoint de T .
La restriction de γ à J := ]ω, 1] est ainsi à valeurs dans C . Cette restriction s’écrit donc
t 7→ δ(t), f δ(t) , où δ est une application continue de J dans I . L’image de J par δ est
un sous-intervalle de I . Lorsque t tend vers ω + , γ(t) tend vers le point γ(ω) ∈ T , donc δ(t)
tend vers 0 . Il en résulte que inf δ(J) = 0 , et par suite il existe un réel β > 0 tel que δ(J)
contienne ]0, β[. Dans ces conditions, γ(J) contient Cβ .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
178
Considérons γ [ω, 1] . C’est un compact, comme image continue du compact [ω, 1]. Ensuite,
γ [ω, 1] = γ(J) ∪ γ(ω) , donc T ∩ γ [ω, 1] = γ(ω) parce que γ(J) ⊂ C . Par ailleurs,
J est dense dans [ω, 1], donc γ(J) est dense dans γ [ω, 1] . D’où :
T ⊂ T ∩ Cβ ⊂ T ∩ γ(J) = T ∩ γ [ω, 1] = γ(ω) ,
ce qui est absurde. Cette contradiction prouve que C n’est pas connexe par arcs.
II.1.42 1. Soit n ∈ N∗ . Pour tout t ∈ [0, 1], fn (t) vaut t−α si t > n−(p+1) et n si t 6 n−(p+1) .
Considérons alors deux entiers m, n tels que n > m > 1 . Pour tout t ∈ [0, 1], fn (t) − fm (t)
vaut n − m sur 0, n−(p+1) , t−α − m sur n−(p+1) , m−(p+1) et 0 sur m−(p+1) , 1 . D’où :
Z n−(p+1)
Z m−(p+1)
p
p
kfn − fm kp =
(n − m) d t +
(t−α − m)p d t.
n−(p+1)
0
p −(p+1)
La première intégrale est majorée par (n − m) n
, donc par 1/n et a fortiori par 1/m.
Dans la deuxième intégrale J , effectuons le changement de variable t := u−(p+1) , de sorte
que t−α = u . Cette intégrale devient :
Z m
Z n
p −(p+2)
J = −(p + 1)
(u − m) u
d u = (p + 1)
(u − m)p u−(p+2) d u
6 (p + 1)
Z
n
n
up u−(p+2) d u = (p + 1)
m
m
1
1
−
m n
6
p+1
·
m
Ainsi kfn − fm kpp 6 (p + 2)/m. Lorsque m et n tendent vers +∞, kfn − fm k tend donc
vers 0 , i.e. la suite (fn ) est une suite de Cauchy de E .
2. Pour tout n ∈ N∗ , définissons une fonction gn : I := ]0, 1] → R par la formule
p
gn (t) := t−α − fn (t) . Cette fonction est positive et continue sur I . Lorsque t tend vers
0+ , gn (t) ∼ t−p/(p+1) , donc gn est intégrable sur I . Si 1 6 m 6 n, le calcul fait dans la
question 1 montre que fm 6 fn , donc gn 6 gm . Soit t ∈ I . Dès que n > t−α , fn (t) = t−α ,
donc gn (t) = 0 . La suite de fonctions (gn ) converge donc simplement sur I vers la fonction
nulle. D’après le théorème de convergence monotone, on en déduit ceci :
Z 1
−α
p
lim
t − fn (t) d t = 0.
n→+∞
0
Fixons un réel ε ∈ ]0, 1[ et posons Iε := [ε, 1]. À plus forte raison, on a :
Z 1
−α
p
lim
t − fn (t) d t = 0.
n→+∞
ε
Cela signifie que, si l’espace C Iε , R est muni de la norme k·kp , la suite de terme général
(fn )|Iε converge vers la restriction de la fonction t 7→ t−α à Iε . D’un autre côté, par hypothèse,
cette suite converge vers la restriction de f à Iε . Il en résulte que f (t) = t−α pour tout
t ∈ Iε . C’est vrai pour tout ε ∈ ]0, 1[, donc f (t) = t−α pour tout t ∈ ]0, 1]. Cela contredit
évidemment le fait que f est une fonction continue sur [0, 1]. Cette contradiction provient de
l’hypothèse que nous avons faite, à savoir que la suite (fn ) converge dans E, k·kp .
Conclusion : (fn ) est une suite de Cauchy de E, k·kp , mais elle ne converge pas dans
E, k·kp . Muni de la norme k·kp , l’espace E n’est donc pas complet.
c Dunod 2014
II.1 : Espaces vectoriels normés
179
II.1.43 1. Soient X et Y deux ensembles. Rappelons que, s’il existe une injection de X dans Y
et une injection de Y dans X , le théorème de Cantor-Schröder-Bernstein (cf. le module I.1
du cours de [L1]) affirme que X et Y sont équipotents : il existe une bijection de X sur Y ).
En d’autres termes, les conditions (card X 6 card Y ) et (card Y 6 card X) impliquent
(card X = card Y ).
Le segment [0, 1] a la puissance du continu. En effet, ce segment est une partie de R, donc
card [0, 1] 6 card R. D’un autre côté, R est en bijection avec ]0, 1[, par exemple par la
fonction x 7→ (tanh +1)/2 , donc card R 6 card ]0, 1[ 6 card [0, 1]. On conclut grâce au
rappel ci-dessus. De plus :
card [0, 1[ 6 card R = card ]0, 1[ 6 card [0, 1[ ,
ce qui montre que [0, 1[ a lui aussi la puissance du continu.
Par définition, K3 ⊂ [0, 1], donc card K3 6 card [0, 1] = card R. Par ailleurs, la proposition 53 de la page 436 de la page 436 montre que K3 est en bijection avec {0, 1}N . Soit
maintenant x ∈ [0, 1[. On sait que x possède un unique développement propre en base 2 :
+∞
P
x =
un /2n+1 , chacun des un valant 0 ou 1 et les un n’étant pas tous égaux à 1
n=0
à partir d’un certain rang. On définit ainsi une application injective x 7→ (un ) de [0, 1[
dans {0, 1}N , d’où card R = card [0, 1[ 6 card K3 . Finalement, card K3 6 card R et
card R 6 card K3 , donc card K3 = card R, d’après le rappel ci-dessus.
2. Si n ∈ N, soit χn : R → R la fonction caractéristique de la partie Fn définie dans la
preuve de la proposition 53 de la page 436 de la page 436. Puisque Fn est réunion disjointe
de 2n segments de longueur 3−n chacun, χn est une fonction en escaliers, nulle en dehors-de
[0, 1]. Il en résulte que χn est intégrable sur R et que son intégrale sur R vaut (2/3)n . La
suite (Fn ) étant décroissante au sens de l’inclusion, la suite (χn ) est décroissante. De plus,
K3 étant l’intersection des Fn , la fonction χ est limite simple de la suite (χn ). Le théorème
de convergence monotone montre alors que χ est intégrable sur R et donne :
Z
Z
χ(t) d t = lim
χn (t) d t = lim (2/3)n = 0.
R
n→+∞
R
n→+∞
3. Raisonnons par l’absurde, en supposant que K3 contient un intervalle I := ]a, b[, avec
a < b . Pour tout n ∈ N, I est contenu dans Fn , qui est réunion disjointe de 2n segments de
longueur 3−n chacun. Ces segments sont donc les composantes connexes de Fn . Puisque I
est connexe, il est contenu dans l’un des segments en question, d’où b − a 6 3−n . Cela est vrai
pour tout n, d’où b − a 6 0 (faire tendre n vers +∞), ce qui est absurde. En conclusion, K3
ne contient aucun intervalle ouvert non vide. Il en résulte en particulier que l’intérieur de K3
dans R ou dans [0, 1], cela revient au même est vide.
Soient C une composante connexe de K3 et a un point de C . Puisque C est connexe, c’est un
intervalle contenant a. Les extrémités de cet intervalle ne peuvent pas être distinctes, compte
tenu de l’alinéa précédent. Il en résulte que C = {a} .
II.1.44 Pour chaque x ∈ E , x⊥ est un sous-espace vectoriel fermé de E (cf. l’exemple 2 de
la page 417). Si F est un sous-espace vectoriel de E , F ⊥ est l’intersection des x⊥ lorsque
x décrit F , donc F ⊥ est un sous-espace vectoriel fermé de E . Supposons de plus que F
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
180
soit fermé. Le théorème 87 de la page 462 de la page 462 montre alors que E est somme
directe (orthogonale) de F et de son orthogonal F ⊥ . Puisque F ⊥ est fermé, le même théorème
montre que E est somme directe orthogonale de F ⊥ et de son orthogonal F ⊥⊥ . Comme F
est évidemment inclus dans F ⊥⊥ (c’est une lapalissade !), les conditions E = F ⊕ F ⊥ et
E = F ⊥⊥ ⊕ F ⊥ entraînent l’égalité F ⊥⊥ = F (c’est un exercice trivial sur les sommes
directes).
Venons-en au sous-espace vectoriel V , qui n’est pas nécessairement fermé dans E . Posons
F := V . L’inclusion V ⊂ F donne V ⊥ ⊃ F ⊥ . Soit inversement x ∈ V ⊥ . Alors x⊥ est un
sous-espace vectoriel fermé, contenant V donc aussi son adhérence F . Ainsi x ∈ F ⊥ . D’où
V ⊥ ⊂ F ⊥ et par conséquent V ⊥ = F ⊥ . Puisque F est fermé, l’alinéa précédent donne :
V ⊥⊥ = (V ⊥ )⊥ = (F ⊥ )⊥ = F ⊥⊥ = F = V .
II.1.45 Soit donc E un espace de Hilbert possédant une base hilbertienne dénombrable (en )n∈N .
Supposons d’abord que le corps de base soit R. Le sous-espace vectoriel V de E engendré
par les en est donc dense dans E , par définition. Si n ∈ N, posons Vn := Vect(e0 , . . . , en ).
n
P
L’application (x0 , . . . , xn ) 7−→
xj ej est un isomorphisme de Rn+1 sur Vn . Comme Qn+1
j=0
est une partie dénombrable dense de Rn+1 , son image par la bijection précédente est une partie
dénombrable Sn de Vn dense dans Vn . Soit S la réunion des Sn pour n ∈ N. C’est une
réunion dénombrable de parties dénombrables, donc S est dénombrable (cf. le cours de [L1]).
Montrons que S est dense dans E .
Si n ∈ N, Vn = Sn car d’une part Sn est dense dans Vn , et d’autre part Vn est fermé
(parce que c’est un sous-espace vectoriel de dimension finie). Comme Sn ⊂ S , on en déduit
l’inclusion Vn ⊂ S . Maintenant, V est évidemment la réunion des Vn , donc V ⊂ S . D’un
autre côté, V est dense dans E , i.e. V = E . Puisque S est fermé et contient V , il contient
V = E , d’où S = E . Finalement S est une partie dénombrable dense de E , donc E est
séparable.
Supposons que le corps de base soit C. Il suffit alors de modifier la preuve ci-dessus en dén
P
finissant Sn comme l’image de Qn+1 + iQn+1 par la bijection (x0 , . . . , xn ) 7−→
xj ej ,
j=0
en remarquant que Q
isomorphe à Q2n+2 .
n+1
+ iQ
n+1
est encore dénombrable, car c’est un Q -espace vectoriel
II.1.46 1. C’est une conséquence immédiate du théorème de Riesz (théorème 88 de la page 463 de
la page 463).
2. Soit x un vecteur de E fixé. L’application y 7→ f (x, y) de E dans R est linéaire car
f est bilinéaire. Cette application est continue, comme composée de f , qui est continue, avec
l’application y 7→ (x, y), qui est une isométrie de E dans E×E . En effet, pour tous y, y ′ ∈ E ,
k(x, y)−(x, y ′ )k = k(0, y−y ′)k = ky−y ′ k . Ainsi y 7→ f (x, y) est une forme linéaire continue
sur E . D’après la question 1, appliquée à y 7→ f (x, y), il existe un unique vecteur u(x) ∈ E
tel que f (x, y) = ( u(x) | y ) pour tout y ∈ E .
Soient x, x′ ∈ E et λ, λ′ ∈ R. Pour tout y ∈ E , on a :
f (λx + λ′ x′ , y) = λf (x, y) + λ′ f (x′ , y) = λ( u(x) | y ) + λ′ ( u(x′ ) | y )
= ( λu(x) + λ′ u(x′ ) | y ).
c Dunod 2014
II.1 : Espaces vectoriels normés
181
Par définition de u(λx + λ′ x′ ), on a donc u(λx + λ′ x′ ) = λu(x) + λ′ u(x′ ), ce qui montre
que u : E → E est linéaire.
Puisque f est continue, il existe un réel C > 0 tel que |f (x, y)| 6 Ckxkkyk pour tous
x, y ∈ E . Pour tout x ∈ E , on a :
ku(x)k2 = ( u(x) | u(x) ) = f x, u(x) 6 Ckxkku(x)k.
Si u(x) 6= 0 , on en déduit ku(x)k 6 Ckxk en simplifiant, et cette inégalité reste vraie si
u(x) = 0 . Cela montre que u est continu, et de plus |||u||| 6 C .
3. Soit r un nombre réel strictement positif fixé ; nous en préciserons le choix plus loin. Défi
nissons g : E → E par g(x) := x + r b − u(x) . Pour tous x, y ∈ E , il vient, en posant
z := x − y et en tenant compte de la caractérisation de u de la question 2 :
kg(x) − g(y)k2 = kz − ru(z)k2 = z − ru(z) z − ru(z)
= kzk2 − 2r u(z) z + r2 ku(z)k2 = kzk2 − 2rf (z, z) + r2 ku(z)k2
6 kzk2 1 − 2kr + r2 C 2 = kzk2 1 − r(2k − rC 2 ) .
Nous avons utilisé ici les inégalités f (z, z) > kkzk2 et ku(z)k 6 |||u|||kzk 6 Ckzk . Im
posons maintenant au nombre r de vérifier les inégalités 0 < r < min 1/(2k), 2k/C 2 , et
posons ω = 1 − r(2k − rC 2 ). Alors ω < 1 parce que 2k − rC 2 > 0 , et ω > 0 puisque
√
ω > 1 − 2kr > 0 . Les inégalités ci-dessus montrent que g est ω -lipschitzienne, donc
contractante puisque ω ∈ ]0, 1[.
Puisque E est un espace de Hilbert, c’est un espace métrique complet. Le théorème du point
fixe montre alors que l’application g , qui est contractante, possède un unique point fixe a. Vu
la définition de g , cela signifie que a est l’unique antécédent de b par u . En passant, on en
déduit que u est un automorphisme linéaire de E . D’autre part, par définition de u , l’égalité
u(a) = b est équivalente aux égalités f (a, y) = ( b | y ) , c’est-à-dire ϕ(y) = f (a, y) pour tout
y ∈ E . Le théorème de Lax-Milgram est ainsi démontré.
4. Supposons que f soit symétrique. Pour tout vecteur x non nul de E , les inégalités
f (x, x) > kkxk2 > 0 montrent que f est un produit scalaire sur E . Notons k·k′ la norme
associée à ce produit scalaire. Pour tout x ∈ E , on a kkxk2 6 (kxk′ )2 = f (x, x) 6 Ckxk2 ,
donc les normes k·k et k·k′ sur E sont équivalentes. En particulier, E, k·k′ est encore un
espace de Hilbert. Par ailleurs, ϕ : E, k·k′ → R est encore une forme linéaire continue.
D’après le théorème de Riesz (théorème 88 de la page 463 de la page 463), il existe un unique
a ∈ E tel que ϕ(x) = f (a, x) pour tout x ∈ E . On obtient ainsi, dans le cas particulier où la
forme coercive f est symétrique, une preuve plus simple du théorème de Lax-Milgram.
Dans le cas général, remarquons que u est un automorphisme de l’e.v. n. E : non seulement u
est linéaire bijective et continue, mais u−1 est aussi continu. Soit en effet x un vecteur non nul
de E . L’inégalité de Cauchy-Schwarz donne :
kkxk2 6 f (x, x) = u(x) x 6 ku(x)kkxk, d’où ku(x)k > kkxk,
cette dernière inégalité restant vraie lorsque x = 0 . Le changement de variable x := u−1 (y)
montre que kyk > kku−1 (y)k pour tout y ∈ E , d’où la continuité de u−1 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
182
Module II.2 : Suites et séries de fonctions
II.2.1 Si x ∈ R est fixé et si l’entier n tend vers +∞, x/n tend vers 0 , donc arctan(x/n) tend
vers 0 . La suite de fonctions (fn ) converge donc simplement vers la fonction nulle. Ensuite, la
suite (fn′ ) converge vers 0 uniformément (sur R), à cause des majorations suivantes, n ∈ N∗
et x ∈ R étant quelconques :
0 6 fn′ (x) =
1
1
1
·
6 ·
n 1 + x2 /n2
n
Montrons par contre que la suite (fn ) ne converge pas uniformément sur R (nécessairement
vers 0 ). Comme chaque fn est bornée (par π/2 ), cela revient à dire que kfn k+∞ ne tend pas
vers 0 lorsque n tend vers +∞. Or, si n ∈ N∗ , on a |fn (x)| < π/2 pour tout x ∈ R et, par
ailleurs, lim arctan(x/n) = π/2 . Il en résulte que kfn k∞ = π/2 , d’où la conclusion.
x→+∞
Commentaire : nous pouvons appliquer le théorème 14 de la page 483. Mais ce théorème montre
seulement que la suite (fn ) converge vers 0 uniformément sur tout intervalle borné de R, il
ne dit pas qu’il y a convergence uniforme sur R tout entier.
II.2.2 Soit n ∈ N∗ . La fonction fn est continue, puisque (1 − x/n)n tend vers 0 lorsque x tend
vers n− . Cette fonction est manifestement décroissante. La suite de fonctions (fn ) converge
simplement vers la fonction f : x 7→ e−x . Soit en effet x ∈ R+ un point fixé. Pour tout entier
n > x, on a fn (x) = (1 − x/n)n = exp n ln(1 − x/n) . Or, lorsque n tend vers +∞,
ln(1 − x/n) ∼ −x/n, donc n ln(1 − x/n) ∼ −x, i.e. n ln(1 − x/n) tend vers −x. En prenant
les exponentielles, on en déduit que (1 − x/n)n tend vers e−x .
Puisque la fonction f : x 7→ e−x est continue, on peut penser à appliquer le deuxième théorème
de Dini (théorème 10 de la page 481). Il y a un premier problème, c’est que, dans ce théorème,
chaque fn est supposée croissante. Ce problème est mineur : il suffit évidemment de remplacer
la suite (fn ) par la suite (−fn ).
Un deuxième problème plus sérieux est que le théorème de Dini porte sur des fonctions définies
sur un segment. Nous allons nous ramener à cette situation, en remarquant que chacune des
fonctions fn ( n ∈ N∗ ) et f a pour limite 0 en +∞. Pour tout n ∈ N∗ , définissons une
fonction gn : [0, 1] → R par gn (0) := 0 et gn (x) = fn (− ln x) si x > 0 . La fonction gn
est continue (comme fonction composée) sur ]0, 1]. Lorsque x tend vers 0+ , − ln x tend vers
+∞, donc gn (x) tend vers 0 . Ainsi, gn est continue sur [0, 1]. Par ailleurs, gn est croissante,
puisque la fonction x 7→ − ln x est décroissante (ne pas oublier que la composée de deux
fonctions décroissantes est croissante). Pour tout x ∈ ]0, 1], la suite gn (x) converge vers
f (− ln x) = x, et c’est encore vrai pour x := 0 . Ainsi la suite (gn ) converge simplement vers
la fonction g : x 7→ x de [0, 1] dans R. Maintenant, le théorème de Dini s’applique : la suite
(gn ) converge vers g uniformément sur [0, 1]. Il en résulte que la suite (fn ) converge vers f
uniformément sur R+ . En effet, pour tout n ∈ N∗ , le changement de variable y := − ln x (ou
x := e−y ) donne :
sup |fn (y) − f (y)| = sup fn − ln x) − f − ln x) = sup |gn (x) − g(x)| ,
y ∈ R+
x ∈ ]0,1]
x ∈ [0,1]
et la dernière borne supérieure tend vers 0 lorsque n tend vers +∞.
c Dunod 2014
II.2 : Suites et séries de fonctions
183
II.2.3 Nous allons calculer explicitement kfn k∞ et montrer que cette norme tend vers 0 lorsque
n tend vers +∞. Fixons un entier n > 1 et posons α := (n+ 1)a /na . Lorsque x décrit [0, 1],
a
a
a
y := xn fait de même, et x(n+1) = (xn )α = y α . D’où :
kfn k∞ =
a
a
sup (xn − x(n+1) ) =
x ∈ [0,1]
sup (y − y α ).
y ∈ [0,1]
La fonction y 7→ y − y α a pour dérivée y 7→ 1 − αy α−1 . Sur [0, 1], elle atteint donc son
maximum absolu lorsque y α−1 = 1/α , soit y = α−1/(α−1) , et alors 1 − y α−1 = 1 − 1/α .
D’où :
kfn k∞ = (1 − 1/α)α−1/(α−1) .
Dans cette formule, α dépend de n et, lorsque n tend vers +∞, α = (n + 1)a /na tend
vers 1+ . Or kfn k∞ est majorée par 1 − 1/α , qui tend vers 0 lorsque n tend vers +∞,
donc lim kfn k∞ = 0 , ce qui signifie que la suite de fonctions (fn ) converge uniformément
n→+∞
vers 0 .
II.2.4 Étudions d’abord la convergence simple. Soit x ∈ [0, 1]. Si x = 0 , fn (x) = 0 pour tout n,
donc lim fn (0) = 0 . Si x = 1 , fn (x) = 1 pour tout n, donc lim fn (1) = 1 . Supposons
n→+∞
n→+∞
que x ∈ ]0, 1[. La relation de Chasles donne :
Z 1
−1 Z 1
Z x
2 n
2 n
2 n
1 − fn (x) =
(1 − t ) dt
(1 − t ) dt −
(1 − t ) dt
0
=
Z
0
1
x
(1 − t2 )n dt
Z
0
1
(1 − t2 )n dt
0
−1
.
Majorons l’intégrale sur [x, 1] et minorons l’intégrale sur [0, 1]. Sur l’intervalle [x, 1], (1−t2 )n
Z 1
2 n
est majoré par (1 − x ) , donc
(1 − t2 )n d t 6 (1 − x)(1 − x2 )n . Pour tout t ∈ [0, 1],
x
Z 1
Z 1
2 n
2
1 − t > 1 − t, donc
(1 − t ) d t >
(1 − t)n d t = 1/(n + 1). D’où :
0
0
0 6 1 − fn (x) 6 (n + 1) (1 − x)(1 − x2 )n .
Puisque 1 − x2 ∈ ]0, 1[, l’expression (n + 1)(1 − x2 )n tend vers 0 lorsque n tend vers +∞,
ce qui montre que fn (x) tend vers 1 .
Conclusion : la suite de fonctions (fn ) converge simplement vers la fonction f de [0, 1] dans R
valant 0 en 0 et 1 ailleurs. Puisque cette fonction f n’est pas continue, alors que chaque fn est
continue, le théorème 5 de la page 480 montre que la suite (fn ) ne converge pas uniformément.
II.2.5 On se ramène aussitôt au cas où a := 0 et b := 1 , à l’aide d’une transformation affine
convenable x 7→ αx + β sur la variable ( α 6= 0 ). Soit f : [0, 1] → R la limite simple
de la suite (fn ). D’abord f est évidemment k -lipschitzienne, en particulier continue. En effet, soient x, y ∈ [0, 1]. Pour tout n ∈ N, |fn (x) − fn (y)| 6 k |x − y|, et l’on en déduit
|f (x) − f (y)| 6 k |x − y|, en faisant tendre n vers +∞.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
184
Soit ε > 0 . Considérons un entier p tel que p > 2k/ε . Pour chaque j ∈ [[0, p]],
la suite fn (j/p) n>0 converge vers f (j/p). Il existe donc un entier N ∈ N tel que
|f (j/p) − fn (j/p)| 6 ε/2 pour tout n > N et tout j ∈ [[0, p]]. Considérons un entier n > N ,
et soit x ∈ [0, 1]. Il existe j ∈ [[0, p]] tel que |x − j/p| 6 1/(2p). Par inégalité triangulaire, il
vient :
|f (x) − fn (x)| = f (x) − f (j/p) + f (j/p) − fn (j/p) + fn (j/p) − fn (x) 6 k |x − j/p| + ε/2 + k |x − j/p| 6 ε/2 + k/p 6 ε/2 + ε/2 = ε.
Ainsi kf − fn k∞ 6 ε pour tout n > N , ce qui montre que la suite (fn ) converge uniformément vers f .
II.2.6 Soit f : I → R la limite simple de la suite (fn ). Remarquons que f est convexe, même
si nous n’utiliserons pas ce fait. Soient en effet x, y ∈ I et λ ∈ [0, 1]. Pour tout n, la
convexité de fn impliqe l’inégalité fn (1 − λ)x + λy 6 (1 − λ)fn (x) + λfn (y). Les suites
fn (x) et fn (y) convergent vers f (x) et f (y) respectivement, et l’on en déduit l’inégalité
f (1 − λ)x + λy 6 (1 − λ)f (x) + λf (y), par passage à la limite dans l’inégalité ci-dessus.
Soit maintenant J := [a, b] un segment inclus dans I ( a < b ). Compte tenu de l’exercice
précédent, il suffit de prouver l’existence d’un réel k > 0 tel que la restriction de chaque fn
à J soit k -lipschitzienne. Puisque I est ouvert, nous pouvons choisir deux réels c, d ∈ I tels
que c < a < b < d. Soient alors n ∈ N et x, y ∈ ]a, b[ tels que x < y . Puisque la fonction fn
est convexe, les inégalités (31) de la page 453 donnent :
fn (a) − fn (c)
fn (x) − fn (a)
fn (y) − fn (x)
fn (b) − fn (y)
fn (d) − fn (b)
6
6
6
6
·
a−c
x−a
y−x
b−y
d−b
Les suites de termes généraux fn (a) − fn (c) /(a − c) et fn (d) − fn (b) /(d − b) sont
convergentes, donc bornées. Il existe donc un réel k > 0 tel que, pour tout n ∈ N, on ait
fn (a) − fn (c) /(a − c) 6 k et fn (d) − fn (b) /(d − b) 6 k . Alors, compte tenu des
inégalités ci-dessus, |fn (y) − fn (x)| 6 k |x − y|, pour tout n ∈ N et tous x, y ∈ ]a, b[. Ces
inégalités sont en fait vraies pour x, y ∈ [a, b], par continuité de fn . Il en résulte que chaque fn
est k -lipschitzienne. D’après l’exercice précédent, la convergence de (fn ) vers f est uniforme
sur J .
II.2.7 Définissons une fonction g : [0, 1] → R par g(0) := ℓ et g(x) := f (− ln x) si x > 0 .
Lorsque le réel x ∈ ]0, 1] tend vers 0+ , − ln x tend vers +∞, donc g(x) tend vers ℓ . Ainsi g
est continue en 0 , d’où g ∈ C 0, 1], R .
Soit ε > 0 . D’après le théorème d’approximation de Weierstraß (théorème 17 de la page 487),
il existe un polynôme P ∈ R[X] tel que |g(x) − P (x)| 6 ε pour tout x ∈ [0, 1]. Écrivons
P := an X n + · · · + a1 X + a0 . Soit y ∈ R+ , posons x := e−y . Alors − ln x = y , d’où :
f (y) − (an e−ny + · · · + a1 e−y + a0 ) = |g(x) − P (x)| 6 ε.
Ainsi, pour tout ε > 0 , nous avons réussi à approcher f uniformément, à ε près, par une
combinaison linéaire de fonctions du type y 7→ e−ky , k ∈ N. D’où la conclusion : pour avoir
f comme limite uniforme, prendre ensuite ε = 1/p, p ∈ N∗ .
c Dunod 2014
II.2 : Suites et séries de fonctions
185
II.2.8 1. Soit donc k un entier impair assez grand, nous préciserons plus loin. Puisque k est impair,
x 7→ xk est un homéomorphisme de I sur J := −ak , ak , l’homéomorphisme réciproque
√
étant t 7→ k t. Attention, la fonction t 7→ t1/k = exp(ln t/k) n’est définie que pour t > 0 . La
√
fonction composée g : t 7→ f ( k t) est continue sur J . D’après le théorème d’approximation de
Weierstraß (théorème 17 de la page 487), il existe un polynôme Q tel que |g(t) − Q(t)| 6 ε/4
pour tout t ∈ J . Autrement dit :
f (x) − Q(xk ) 6 ε/4 pour tout x ∈ I.
En particulier, puisque f (0) = 0 , on a |Q(0)| 6 ε/4 . Posons R := Q − Q(0). Alors
R ∈ R[X], R(0) = 0 , et l’on a :
f (x) − R(xk ) 6 ε/2 pour tout x ∈ I.
(∗)
Écrivons R := a1 X + · · · + an X n , où les aj sont des réels. Le polynôme P que nous
cherchons doit être à coefficients entiers. Posons donc bj := E(aj ) pour tout j , puis
S := b1 X + · · · + bn X n . Cette fois, S ∈ Z[X]. Pour tout x ∈ I , le fait que a appartienne à
]0, 1[ entraîne, avec l’inégalité triangulaire, les majorations suivantes :
X
n
n
X
R(xk ) − S(xk ) = (aj − bj )xjk 6
|aj − bj | |x|jk
j=1
j=1
6
n
X
j=1
|x|
jk
6
n
X
j=1
ajk 6
+∞
X
j=1
ajk =
ak
·
1 − ak
Imposons maintenant à l’entier (impair) k la condition ak /(1−ak ) 6 ε/2 . Compte tenu des in
égalités (∗), on voit alors que le polynôme S vérifie la propriété suivante : f (x) − S(xk ) 6 ε
pour tout x ∈ I . Il suffit de poser P := S(X k ) = b1 X k +· · ·+bn X nk pour avoir les propriétés
demandées :
P ∈ Z[X] et |f (x) − P (x)| 6 ε pour tout x ∈ I.
(∗∗)
2. Soit A l’ensemble des fonctions polynomiales à coefficients entiers sur I . C’est un sous
anneau de C(I, R). Il en résulte que l’adhérence A de A dans C(I, R), k·k∞ est aussi un
sous-anneau de C(I, R) (pour ce point, cf. l’exercice suivant). Posons maintenant :
E := f ∈ C(I, R) | f (0) ∈ Z .
Nous allons montrer que A = E . D’abord, E est fermé dans C(I, R). En effet, f 7→ f (0) est
une forme linéaire continue L sur C(I, R), et E est l’image réciproque par L de Z, qui est
un fermé de R. Ensuite, il est clair que A est inclus dans E : si T ∈ Z[X], T (0) ∈ Z. D’où
l’inclusion A ⊂ E .
Soit inversement ϕ ∈ E , de sorte que p := ϕ(0) ∈ Z. Pour voir que ϕ ∈ A, il suffit de
montrer que A rencontre toute boule de centre ϕ. Soit donc ε > 0 . Appliquons la question
précédente à f := ϕ − p et ε . Soit P un polynôme vérifiant les conditions (∗∗). Notons
abusivement P + p ∈ A la fonction polynomiale sur I définie par le polynôme P + p. Alors
kϕ − (P + p)k∞ = kf − P k∞ 6 ε , donc P + p appartient à l’intersection de A avec la boule
de C(I, R), k·k∞ de centre ϕ et de rayon ε . Nous avons ainsi établi l’inclusion E ⊂ A.
Conclusion : l’adhérence de A dans C(I, R), k·k∞ est formé des fonctions polynomiales (à
coefficients réels) sur I prenant en 0 une valeur entière.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
186
II.2.9 D’abord, A est un sous-anneau de C(J, R), comme image de l’unique morphisme d’anneaux de Z[X] dans C(J, R) appliquant X sur la fonction h : x 7→ x de J dans R. Il en
résulte que l’adhérence A de A dans C(J, R) est elle aussi un sous-anneau de C(J, R), et
nous voulons montrer que A = C(J, R). Soient par exemple f, g ∈ A. Il existe deux suites
(fn ) et (gn ) de A convergeant vers f et g respectivement. Pour tout n, fn gn ∈ A, et la suite
(fn gn ) converge vers f g , donc f g ∈ A . On montre de même que f ± g ∈ A .
L’idée est de prouver que, pour tout réel t, la fonction constante égale à t, que nous noterons t par abus, appartient à A . Supposons ce point établi. Soit P ∈ R[X] un polynôme,
P := an X n + · · · + a1 X + a0 . Les fonctions h et a0 , . . . , an appartiennent à A . Puisque A
est un sous-anneau de C(J, R), la fonction polynôme P (h) : x 7→ an xn + · · · + a1 x + a0 appartient à A. Ainsi A contient toute fonction polynomiale (à coefficients réels) sur J . D’après
le théorème d’approximation de Weierstraß (théorème 17 de la page 487), l’ensemble de ces
fonctions polynomiales est dense dans C(J, R), k·k∞ , et il en résulte que A = C(J, R).
Soit maintenant p un nombre premier. Montrons que la fonction polynôme Qp définie
dans l’énoncé est à coefficients entiers. Si p > 3 , la formule du binôme donne, puisque
(−1)p = −1 :
p
pQp (x) := 1 − x −
p
X
p−1
X
p k
k+1 p
(−1)
x =
(−1)
xk .
k
k
k=0
k
k=1
p
Pour tout k ∈ [[1, p − 1]], on sait que le coefficient
est multiple de p (cf. un exercice du
k
module II.1 de [L1]), donc Qp est bien à coefficients entiers. C’est vrai également si p = 2 ,
car Q2 = x(1 − x).
Écrivons maintenant J := [a, b]. Par hypothèse, 0 < a 6 b < 1 . Pour tout x ∈ J , on a :
p
p
p
p
1
− Qp (x) = x + (1 − x) 6 b + (1 − a) , d’où :
p
p
p
p
p
1
− Qp 6 b + (1 − a) := ωp .
p
p
∞
(∗)
Noter que cette quantité ωp est définie en fait pour tout réel p > 0 .
Soit t ∈ R et ε > 0 . Pour conclure, il suffit de montrer qu’il existe une fonction f ∈ A telle
que kt − f k∞ 6 ε . Posons m := E(t). Lorsque le réel p tend vers +∞, pωp tend vers
0 , parce que b et 1 − a appartiennent à ]0, 1[. Puisque l’ensemble des nombres premiers est
infini, il existe un nombre premier p tel que 1/p 6 ε/2 et pωp 6 ε/2 . Subdivisons ensuite
le segment [m, m + 1], qui contient t, en p segments de longueur 1/p. Il existe un unique
k ∈ [[0, p − 1]] tel que m + k/p 6 t < m + (k + 1)/p. Posons alors f := m + kQp ∈ A.
Compte tenu de l’inégalité (∗) et de l’inégalité triangulaire, il vient :
kt − f k∞ = kt − m − kQp k∞ = kt − m − k/p + (k/p − kQp )k∞
6 kt − m − k/pk∞ + kk1/p − Qp k∞ 6 1/p + pωp 6 ε.
D’où la conclusion. On notera que la conclusion est très différente de celle de l’exercice précédent. Cela tient essentiellement au fait qu’ici le segment J ne contient aucun entier.
c Dunod 2014
II.2 : Suites et séries de fonctions
187
II.2.10 1. Pour tout x ∈ I := [a, b], f 7→ f (x) est une forme linéaire sur E , notons-la ϕx . Soit V
le sous-espace vectoriel de E ∗ engendré par les ϕx lorsque x parcourt I . Utilisons librement
les sections du module I.3 portant sur la dualité et l’orthogonalité. L’orthogonal V ◦ de V est
formé des fonctions f ∈ E telles que ϕx (f ) = 0 , c’est-à-dire f (x) = 0 , ceci pour tout x ∈ I .
Ainsi V ◦ = {0} . Puisque E est de dimension finie, nous savons que V = (V ◦ )⊥ , donc
V = {0}⊥ = E ∗ . Nous avons ainsi établi que (ϕx )x∈I est une famille génératrice de E ∗ .
Puisque dim E ∗ = dim E = n, il existe des points x1 , . . . , xn de I tels que ϕx1 , . . . , ϕxn
soit une base de E ∗ . Noter que les xi sont évidemment deux à deux distincts, puisque les
formes linéaires ϕxi sont deux à deux distinctes. Dans ce qui suit, les points x1 , . . . , xn sont
fixés.
2. Notons k·k∞ la restriction à E de la norme de la convergence uniforme. Nous allons
construire une autre norme k·k sur E . À toute fonction f ∈ E , associons le n-uplet
f (x1 ), . . . , f (xn ) ∈ Rn . Nous définissons ainsi une application θ , manifestement linéaire,
de E dans Rn . Montrons que θ est un isomorphisme. Puisque dim E = dim Rn , il suffit de
montrer que le noyau de θ est nul. Soit donc f ∈ Ker θ . Pour i = 1, . . . , n, on a f (xi ) = 0 ,
c’est-à-dire ϕxi (f ) = 0 . Comme les ϕxi forment une base de E ∗ , α(f ) = 0 pour toute forme
α ∈ E ∗ . Autrement dit, f appartient à (E ∗ )◦ = {0} , d’où f = 0 .
Munissons Rn de la norme k·k′ , définie par (t1 , . . . , tn ) 7→ max |t1 | , . . . , |tn | . À l’aide de
l’isomorphisme θ , « transportons » ensuite cette norme vers E . Nous obtenons une norme k·k
sur E , définie explicitement ainsi :
kf k := max |f (x1 )| , . . . , |f (xn )| pour toute f ∈ E.
Alors θ est, par construction, une isométrie de E, k·k sur Rn , k·k′ .
Soit maintenant (fp )p>0 une suite de E . Supposons que cette suite de fonctions (sur I )
converge simplement vers une fonction f : I → R. Pour chaque k ∈ [[1, n]], la suite
fp (xk ) p>0 converge donc vers f (xk ). Il en résulte que la suite fp (x1 ), . . . , fp (xn ) p>0
de Rn converge vers f (x1 ), . . . , f (xn ) . Or, la suite fp (x1 ), . . . , fp (xn ) p>0 est l’image
par θ de la suite (fp )p>0 de E . Puisque θ est une isométrie, (fp )p>0 est une suite convergente
de E, k·k , notons g ∈ E sa limite.
Puisque E est de dimension finie, les deux normes k·k∞ et k·k sur E sont équivalentes.
La suite (fp )p>0 converge donc vers g dans E, k·k∞ . Par définition de la norme k·k∞ ,
la suite de fonctions (fp )p>0 converge alors uniformément vers g . La convergence uniforme
impliquant la convergence simple, on en déduit (unicité de la limite) que g = f .
Conclusion : d’une part la suite (fp )p>0 converge uniformément vers f , et d’autre part f ∈ E
(en particulier, f est continue sur I ).
II.2.11 Soit E l’ensemble des fonctions en escalier de [a, b] dans R. C’est évidemment un sous
espace vectoriel de B [a, b], R , espace vectoriel des applications bornées de [a, b] dans R.
Munissons B [a, b], R de la norme k·k∞ . Par ailleurs, soit V l’ensemble des applications f
de [a, b] dans R possédant en tout point x de [a, b] une limite à droite finie (lorsque x 6= b )
notée f (x+0) et une limite à gauche finie (lorsque x 6= a) notée f (x−0). C’est un sous-espace
vectoriel de l’espace de toutes les applications de [a, b] dans R, et il contient évidemment E .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
188
Nous allons montrer d’abord que V est inclus dans B [a, b], R , puis que V est égal à E ,
adhérence de E dans B [a, b], R . Supposons ces deux points établis, et soit f une fonction
de [a, b] dans R. Si f possède en chaque point (où cela a un sens) une limite à gauche et une
limite à droite finies, f appartient à V = E , par définition. Il existe donc une suite (fn ) de
E convergeant vers f au sens de la norme k·k∞ , ce qui veut dire, puisque f et les fn sont
bornées, que la suite (fn ) converge uniformément vers f . Supposons inversement que f soit
limite uniforme d’une suite (gn ) de E . Puisque les fn sont bornées, f l’est aussi. Ainsi f est
limite de la suite (gn ) au sens de la norme k·k∞ , donc f ∈ E = V . Il reste donc à établir les
deux points ci-dessus.
Soit f ∈ V . Montrons que f est bornée. Supposons que ce ne soit pas le cas. Il existe alors une
suite (xn ) de [a, b] telle que |f (xn )| tende vers +∞ quand n tend vers +∞. Puisque [a, b]
est compact, on peut supposer, quitte à remplacer la suite (xn ) par une sous-suite, que (xn )
converge vers un point c ∈ [a, b]. Puisque f possède en c une limite à gauche et une limite à
droite finies (si c := a ou c := b , on adapte le raisonnement), elle est bornée dans un voisinage
U de c dans [a, b]. C’est absurde car, dès que n est assez grand, xn ∈ U , et |f (xn )| est aussi
grand que l’on veut.
Soit ensuite f ∈ E : f est bornée, et f est limite uniforme d’une suite (fn ) de E . Montrons
par exemple que, si c ∈ [a, b[ est fixé, f possède une limite à droite finie en c. Pour chaque n,
fn (x) tend vers fn (c + 0) lorsque x tend vers c+ . Puisque la suite formée par les restrictions
des fn à ]c, b] converge uniformément vers la restriction de f à ]c, b], le théorème de la double
limite (théorème 12 de la page 482) montre que f a une limite à droite finie en c, avec en outre
f (c + 0) = lim fn (c + 0). Le raisonnement est le même pour les limites à gauche, donc
n→+∞
f ∈ V , ce qui prouve l’inclusion E ⊂ V .
L’inclusion V ⊂ E est plus délicate. Il suffit de démontrer que, si l’on se donne une fonction
f ∈ V et un réel ε > 0 , il existe une fonction en escalier g telle que kf − gk∞ < ε .
Cela revient, dans l’e.v. n. B [a, b], R , k·k∞ , à établir l’inégalité d(f, E) < ε . Pour tout
x ∈ [a, b], on peut envisager l’inégalité analogue à d(f, E) 6 ε portant sur les restrictions à
[a, x]. Plus précisément, posons :
!
dx (f, E) = inf
g∈E
sup |f (y) − g(y)| .
y ∈ [a,x]
La fonction x 7→ dx (f, E) de [a, b] dans R est croissante, comme borne inférieure d’une
famille de fonctions croissantes, à savoir les fonctions x 7→ sup |f (y) − g(y)|, où g déy ∈ [a,x]
crit E . Par ailleurs, il est clair que da (f, E) = 0 prendre pour g la fonction constante
f (a) , et que db (f, E) = d(f, E). Puisque x 7→ dx (f, E) est croissante, l’ensemble
A := x ∈ [a, b] | dx (f, E) < ε est un sous-intervalle de [a, b] contenant a. Soit c l’extrémité droite de A. Il nous suffit désormais de montrer que c = b .
Montrons d’abord que c ∈ A. C’est vrai si c = a. Supposons c > a. Il existe un réel α
vérifiant 0 < α < c − a et tel que sup |f − f (c − 0)| < ε (définition de la limite à gauche).
]c−α,c[
Ensuite, c− α ∈ A, donc il existe g ∈ E telle que |f (x) − g(x)| < ε pour tout x ∈ [a, c − α] .
Soit h : [a, b] → R la fonction en escalier coïncidant avec g sur [a, c − α], prenant la valeur
f (c) en c et la valeur f (c − 0) sur ]c − α, c[ ∪ ]c, b]. On vérifie immédiatement l’inégalité
c Dunod 2014
II.2 : Suites et séries de fonctions
189
sup |f − h| < ε , ce qui montre que c ∈ A.
[a,c]
Pour conclure, il suffit de montrer que c = b . Raisonnons par l’absurde, en supposant c < b .
Par définition de la limite à droite, il existe un réel β vérifiant 0 < β < b − c et tel que
sup |f − f (c + 0)| < ε . soit alors u : [a, b] → R la fonction en escalier coïncidant avec h
]c,c+β]
sur [a, c] et prenant la valeur f (c + 0) sur ]c, b]. On a clairement sup |f − u| < ε , d’où
[a,c+β]
c + β ∈ A, ce qui contredit la définition de c comme extrémité droite de A.
II.2.12 Notons fn le terme général de la série de fonctions donnée. C’est une fonction de classe
C ∞ , comme composée de deux fonctions de classe C ∞ . Appliquons le théorème 24 de la
P
page 492. La série
fn (0) converge, et sa somme est nulle. Il nous suffit donc de monn>1
P ′
trer que, pour tout réel a > 0 fixé, la série
fn converge uniformément sur le segment
n>1
A := [−a, a]. Pour tout n ∈ N∗ et tout réel x, le calcul donne :
(−1)n fn′ (x) =
x2
2x(1 + n)
2x
2x
·
−
=
2
2
2
2
+ n(1 + x ) 1 + x
(1 + x ) x + n(1 + x2 )
Le critère spécial uniforme des séries alternées (corollaire 20 de la page 490) montre que la
P ′
série de fonctions
fn converge uniformément sur A, pourvu que deux conditions soient
n>1
vérifiées. La première est que la suite de fonctions |fn′ | n>1 converge vers 0 uniformément
sur A. C’est vrai, à cause des majorations uniformes évidentes :
2a
2x
6
·
n
(1 + x2 ) x2 + n(1 + x2 )
La deuxième condition à vérifier est que, si x ∈ A est fixé, la suite |fn′ (x)|
sante. C’est évident, vu l’égalité :
n>1
est décrois-
2 |x|
·
(1 +
x2 + n(1 + x2 )
P
En conclusion, nous savons que la série de fonctions
fn converge uniformément sur A
|fn′ (x)| =
x2 )
n>1
(ceci quel que soit a > 0 ), que la somme f de cette série de fonctions est de classe C 1 sur
+∞
P ′
R, et que f ′ x) =
fn (x) pour tout réel x. Un point important est à signaler. Il n’y a pas
n=1
P
P
convergence normale de
fn , même sur A. En effet, si x ∈ R∗ est fixé, la série
|fn (x)|
n>1
n>1
2
diverge, puisque son terme général est équivalent à x /n lorsque n tend vers +∞. Or, il faut
s’en souvenir, la convergence normale implique la convergence absolue en tout point.
II.2.13 Soit I := ]0, +∞[. Pour tout n ∈ N∗ et tout s ∈ I , posons fn (s) := (−1)n /ns . Soit
n ∈ N∗ . Pour tout s, n−s = exp(−s ln n). Il en résulte que fn est de classe C ∞ sur I . Pour
tout p ∈ N et tout s ∈ I , on a de plus :
fn(p) (s) = (−1)n+p (ln n)p n−s .
(∗)
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
190
La fonction f est la somme de la série de fonctions
P
fn . Pour montrer que f est de classe
n>1
C ∞ sur I , appliquons le théorème 28 de la page 495. Soient p ∈ N et A un compact de I .
P (p)
P
(p)
Il nous suffit de montrer que la série de fonctions
fn , ou
(−1)p fn , cela revient au
n>1
n>1
même, converge uniformément sur A. Il suffit même, étant donné un entier m > 1 dont nous
P
(p)
préciserons le choix plus loin, de montrer que la série de fonctions
(−1)p fn converge
n>m
uniformément sur A.
Il existe deux réels a, b tels que 0 < a < b et A ⊂ [a, b]. Il suffit d’établir la convergence uniforme sur J := [a, +∞[. Pour cela, appliquons le critère spécial uniforme des séries alternées
(corollaire 20 de la page 490). Nous avons deux choses à vérifier. La première est que la suite
de fonctions de terme général s 7→ (ln n)p n−s converge vers 0 uniformément sur J . Ce terme
général est positif et majoré uniformément par (ln n)p n−a . D’où la conclusion car, lorsque n
tend vers +∞, ln n est négligeable devant na/p , donc (ln n)p est négligeable devant na .
La deuxième condition à vérifier est que, si s ∈ J est fixé, la suite (ln n)p n−s n>m
est décroissante. C’est évident si p := 0 , supposons donc p > 1 . Notons g la fonction
x 7→ (ln x)p x−s . Sa dérivée est donnée par la formule :
g ′ (x) = p(ln x)p−1 x−1−s − s(ln x)p x−1−s = (ln x)p−1 x−1−s (p − s ln x).
Imposons maintenant à l’entier m la condition p − a ln m < 0 , soit m > ep/a . Pour tout
réel x > m, on a p − s ln x 6 p − s ln m 6 p − a ln m < 0 , donc la fonction g décroît sur
[m, +∞[ . D’où la conclusion : la suite (ln n)p n−s n>m est décroissante.
II.2.14 Lorsque x tend vers 0+ , x ln x tend vers 0 . La fonction f : [0, 1] → R définie par
f (0) := 0 et f (x) := −x ln x si x > 0 est donc continue, et par suite elle est bornée. En
Z 1
fait, le maximum absolu de |f | est 1/e . L’intégrale I :=
d x/xx est alors simplement
0
l’intégrale sur [0, 1] de la fonction composée exp f .
P n
Puisque |f | est bornée, exp f est la somme de la série de fonctions
f /n!, série qui
n>0
converge normalement sur [0, 1]. D’après le théorème 23 de la page 492, on peut intervertir les
Z
P
signes
et
:
I =
Z
1
exp f =
0
Pour tout n ∈ N,
Z
0
Z
1
1
+∞ n
X
f
n!
n=0
!
=
Z 1
+∞
X
(−1)n
xn (ln x)n d x .
n!
0
n=0
xn (ln x)n d x = (−1)n n!/(n + 1)n+1 en vertu de l’exercice II.2.30 de
0
la page 540. D’où :
I =
+∞
+∞
+∞
X
X
X
(−1)n
(−1)n n!
1
1
·
=
=
·
n+1
n+1
p
n!
(n
+
1)
(n
+
1)
p
n=0
n=0
p=1
II.2.15 La fonction qu’on doit intégrer ne possède pas de primitive « simple », c’est-à-dire s’exprimant à partir des fonctions usuelles. Nous allons en calculer de façon exacte l’intégrale sur
c Dunod 2014
II.2 : Suites et séries de fonctions
191
[0, 2π], mais on ne pourrait pas faire de même sur un segment quelconque. L’idée de départ est
simple : pour tout réel u , cos u = Re eiu . D’où :
Z 2π
Z 2π
I :=
ecos t cos(sin t − nt) d t = Re
ecos t ei(sin t−nt) d t
0
= Re
Z
2π
e
cos t+i sin t−int
d t = Re
0
La fonction t 7→ e
Z
0
2π
e
eit −nit
d t = Re
0
eit
Z
2π
it
ee e−nit d t.
0
étant un peu compliquée, on la développe en série :
it
ee
=
+∞
+∞ kit
X
X
(eit )k
e
=
,
k!
k!
k=0
(∗)
k=0
avec convergence normale, en particulier uniforme, sur [0, 2π]. La convergence normale est
P
conservée si l’on multiplie par e−nit . On peut donc calculer I par interversion des signes
Z
et
:
!
Z 2π
Z 2π X
+∞
+∞ (k−n)it
X
1
e
(k−n)it
I = Re
d t = Re
e
dt .
k!
k!
0
0
k=0
k=0
Pour tout p ∈ Z, l’intégrale de t 7→ epit sur [0, 2π] vaut 2π si p := 0 et 0 sinon. D’où aussitôt
la valeur de I :
(
2π/n! si n > 0
I =
0 si n < 0.
On peut interpréter ce résultat en termes de séries de Fourier (se reporter au module II.4). En efit
fet, I/2π est la partie réelle de cn , coefficient de Fourier d’indice n de la fonction g : t 7→ ee ,
qui est continue (de classe C ∞ , en fait) et 2π -périodique sur R. Or, le développement de g est
fourni par l’égalité (∗) (nous laissons le lecteur justifier ce point), ce qui montre que ck = 1/k!
lorsque k ∈ N et ck = 0 lorsque k < 0 .
II.2.16 Rappelons que ζ(s) :=
+∞
P
1/ns pour tout réel s > 1 . La première série à étudier s’écrit
n=1
donc :
X
k>2
+∞
X
1
nk
n=2
!
.
L’idée est alors évidemment d’appliquer le théorème de Fubini (théorème 15 de la page 485).
Pour tout couple d’entiers (n, k) tel que n > 2 et k > 2 , posons an,k := 1/nk . Si n est fixé,
P
P
la série
an,k =
1/nk est une série géométrique, de raison 1/n et de premier terme
k>2
k>2
1/n2 . Puisque n > 2 , cette série converge, et sa somme sn vaut :
+∞
X
1
1
1
1
1
1
= 2·
=
=
− ·
nk
n 1 − 1/n
n(n − 1)
n−1 n
k=2
P
Il est alors évident que la série
sn converge et a pour somme 1 . Les hypothèses du théorème
sn :=
n>2
de Fubini sont donc vérifiées, et ce théorème entraîne les égalités suivantes, avec convergence
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
192
de toutes les séries qui interviennent :
∞
X
k=2
ζ(k) − 1 =
+∞ X
+∞
X
k=2
an,k
n=2
!
=
+∞
X
n=2
La deuxième série à étudier s’écrit :
+∞
X
1
knk
n=2
X
k>2
+∞
X
!
k=2
an,k
!
=
+∞
X
sn = 1.
n=2
.
On raisonne comme précédemment, en posant ici an,k = 1/(knk ) pour tous n, k . ConsiP
P
dérons un entier n > 2 fixé. La série
an,k =
1/(knk ) n’est plus une série géomék>2
k>2
trique, mais elle converge (par comparaison avec le cas précédent). Considérons la série entière
P
(−1)k−1 xk /k . Son rayon de convergence est 1 , et sa somme est la fonction x 7→ ln(1+x),
k>1
sur l’intervalle ]−1, 1[. En prenant x := −1/n, on obtient donc :
sn :=
+∞
+∞
X
−1 X 1
1
=
+
= −1/n − ln(1 − 1/n).
knk
n
knk
k=1
k=2
Lorsque n tend vers +∞, ln(1 − 1/n) = −1/n + O(1/n2), d’où sn = O(1/n2 ). Il en résulte
P
que la série
sn converge. Le théorème de Fubini peut à nouveau être appliqué, et il donne
n>2
les égalités suivantes, avec convergence de toutes les séries qui interviennent :
!
!
∞
+∞ X
+∞
+∞ X
+∞
+∞
X
X
X
X
ζ(k) − 1
=
an,k =
an,k =
sn
k
n=2 k=2
n=2
k=2
k=2 n=2
!
!
N
N X
X
1
= lim
sn = − lim
+ ln (n − 1)/n
N →+∞
N →+∞
n
n=2
n=2
!
N X
1
= lim
ln n − ln(n − 1) −
N →+∞
n
n=2
!
!
N
N
X
X
1
1
= lim
ln N −
= lim
1 + ln N −
= 1 − C.
N →+∞
N →+∞
n
n
n=2
n=1
II.2.17 Il suffit d’appliquer la formule (16) de la page 498 en prenant x := 1 :
+∞ X
1
1
Γ′ (1)
= −C − 1 +
−
pour tout x > 0.·
Γ(1)
k 1+k
k=1
En effet, d’une part Γ(1) = 1 , et d’autre part la série figurant dans le membre de droite a pour
somme 1 , à cause des égalités :
n X
1
1
1
−
= 1−
pour tout n ∈ N∗ .
k
k+1
n+1
k=1
Conclusion : Γ′ (1) = −C , comme annoncé.
c Dunod 2014
II.2 : Suites et séries de fonctions
193
II.2.18 Posons D := R \ {0, −1, −2, . . .} . Pour tout (n, x) ∈ N × D , posons aussi
P
fn (x) := (−1)n /(n + x). La convergence simple de la série de fonctions
fn sur D est
n>0
P
évidente. En effet, si x ∈ D est fixé, la série
(−1)n /(n + x) converge, en vertu du critère
n>|x|
spécial des séries alternées. Notons alors f : D → R la somme de la série de fonctions
P
fn .
n>0
Chaque fn est de classe C ∞ sur D . Pour montrer que la fonction f est de classe C ∞ sur
D , il suffit de montrer qu’elle est de classe C ∞ sur chacun des intervalles I composant D :
I := ]0, +∞[ ou I := ]−m, −m + 1[ avec m ∈ N∗ (ces intervalles sont les composantes
connexes de D ).
Commençons par l’intervalle ]0, +∞[. Le fait pour une fonction d’être de classe C ∞ étant de
nature locale, il suffit de montrer que, si a est un réel strictement positif fixé, f est de classe
C ∞ sur I := [a, +∞[. Pour cela, appliquons le théorème 28 de la page 495. Soit p ∈ N un
P (p)
entier fixé. Il suffit de montrer que la série de fonctions
fn converge uniformément sur I .
n>0
Notons d’abord la formule (évidente par récurrence sur p) :
fn(p) (x) =
(−1)n+p p!
(n + x)p+1
pour tout x ∈ D.
(p) Sur l’intervalle I , la fonction fn est majorée par p!/(n + a)p+1 . Si p > 1 , la série numéP
rique
p!/(n + a)p+1 converge (c’est une série de Riemann, et p + 1 > 1 ), donc la série de
n>0
P
(p)
converge en fait normalement sur I . Il reste le cas p = 0 . La convergence
P
uniforme de la série de fonctions
fn est ici une conséquence immédiate du critère spéfonctions
fn
n>0
n>0
cial uniforme des séries alternées (corollaire 20 de la page 490). Puisque la série de fonctions
P
fn converge simplement, on peut aussi se dispenser du cas p := 0 , en appliquant cette fois
n>0
le théorème 27 de la page 494.
Soient enfin m ∈ N∗ et I := ]−m, −m + 1[. Chacune des fonctions f0 , . . . , fm−1 étant de
P
classe C ∞ sur I , il suffit de montrer que la fonction x 7→
(−1)n /(n + x) est de classe
n>m
C ∞ sur I . Via le changement de variable x := y − m, nous sommes ramenés à voir que la
P
fonction y 7→
(−1)n /(n − m + y) est de classe C ∞ sur ]0, 1[. Via le changement d’indice
n>m
n := m + k , cette fonction s’écrit y 7→
P
(−1)m+k /(k + y) = (−1)m f (y), elle est donc de
k>0
classe C ∞ sur ]0, 1[, d’après l’alinéa précédent.
II.2.19 Pour tout (n, x) ∈ N∗ × R, posons fn (x) := 2−n E(nx). La série de fonctions
P
fn
n>1
converge normalement, donc uniformément, sur tout compact de R. Il suffit en effet de voir
que, si m ∈ N∗ est fixé, il y a convergence normale sur le segment [−m, m]. Pour tout point
x de ce segment et tout n ∈ N∗ , l’inégalité |nx| 6 nm implique |E(nx)| 6 nm, d’où
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
194
|fn (x)| 6 nm2−n . La conclusion en résulte, puisque la série numérique
P
n2−n converge
n>1
(on peut, par exemple, appliquer la règle de d’Alembert). Notons f la fonction
+∞
P
fn (x).
n=1
Soit x0 ∈ R. La fonction partie entière est continue à droite en x0 . Elle est continue en x0 si,
et seulement si, x0 ∈
/ Z. On en déduit d’abord, par composition, que chaque fn est continue en
tout point de R \ Q car, si a ∈ R \ Q et n ∈ N∗ , na n’est pas entier. La convergence normale
sur tout compact suffit donc pour assurer la continuité de f en tout point de R \ Q , d’après le
théorème 5 de la page 480.
Soit maintenant x0 ∈ Q . Montrons que f n’est pas continue en x0 . Écrivons x0 := a/b , où
b ∈ N∗ , a ∈ Z et a ∧ b = 1 . Soit n ∈ N∗ . Le théorème de Gauß (cf. le module II.1 de [L1])
montre que nx0 ∈ Z, i.e. b divise na, si, et seulement si, n est multiple de b . Définissons
deux fonctions gn , hn : R → R comme suit. Si n est multiple de b , nous posons gn := fn
et hn := 0 . Si n n’est pas multiple de b , nous posons au contraire gn := 0 et hn := fn .
P
P
Ainsi fn = gn + hn pour tout n. Les deux séries de fonctions
gn et
hn convergent
n>1
n>1
encore normalement sur tout compact de R. Notons g et h leurs sommes respectives. Alors
f = g + h, et l’argument de l’alinéa précédent montre que h est continue au point x0 . Tout
revient ainsi à montrer que g n’est pas continue à gauche en x0 .
P
On notera d’abord que g est la somme de la séries de fonctions
fkb . En particulier, puisque
k>1
kbx0 = ka pour tout k , on a :
g(x0 ) = a
+∞
X
k2−kb .
(∗)
k=1
Soit maintenant x ∈ ]−∞, x0 [. Pour tout k ∈ N∗ , on a kbx < kbx0 = ka, donc
E(kbx) 6 ka − 1 . D’où :
g(x) =
+∞
X
2−kb E(kbx) 6
k=1
= g(x0 ) −
+∞
X
k=1
+∞
X
k=1
2−kb (ka − 1)
2−kb = g(x0 ) −
1
·
2b − 1
Pour tout réel x < x0 , on a donc |g(x) − g(x0 )| > 1/(2b − 1), ce qui montre que g n’est
pas continue à gauche en x0 . En conclusion, les nombres réels en lesquels f est continue sont
exactement les nombres irrationnels.
II.2.20 L’intégrale donnée diverge évidemment. En effet, la fonction de x qu’on intègre est la
dérivée de la fonction x 7→ sin(t ln x)/t, fonction qui n’a pas de limite finie lorsque x tend
P
P −(1+it)
vers +∞. Par ailleurs, la série
cos(t ln n)/n est la partie réelle de la série
n
.
n>1
n>1
En effet, pour tout n ∈ N∗ , on a :
n−(1+it) = n−it /n = exp −it ln n /n = cos(t ln n) − i sin(t ln n) /n.
P
Il suffit de montrer maintenant que la série
cos(t ln n)/n diverge. Nous allons pour
cela comparer cette série avec l’intégrale
Z
1
c Dunod 2014
n>1
+∞ cos(t ln x)/x d x . Notons f la fonction
II.2 : Suites et séries de fonctions
195
x 7→ cos(t ln x)/x sur ]0, +∞[. Étant donné un entier n > 1 , partons de l’égalité :
Z n+1
Z n+1
f (x) d x − f (n) =
f (x) − f (n) d x.
n
n
′
Majorons |f | sur le segment [n, n + 1]. Pour tout point y de ce segment, on a :
cos(t ln y) t sin(t ln y) ′
6 1 + |t| 6 1 + |t| ·
|f (y)| = −
−
y2
y2
y2
n2
Pour tout x ∈ [n, n + 1], l’inégalité des accroissements finis appliquée à f donne donc
|f (x) − f (n)| 6 1 + |t| /n2 . Par intégration de n à n + 1 , on en déduit :
Z n+1
1 + |t|
f (x) d x − f (n) 6
·
n2
n
X Z n+1
P
Il en résulte que la série
f (n) et la série
f (x) d x sont de même nature. Pour
n>1
n>1
n
conclure, il suffit de montrer que la deuxième de ces séries diverge. Raisonnons par l’absurde,
Z p
en supposant que cette série converge. D’après la relation de Chasles,
f (x) d x a donc une
1
limite finie ℓ lorsque p tend vers = ∞.
Considérons maintenant un réel b > 1 et soit p := E(b). La relation de Chasles donne :
Z p Z b
Z b !
f −ℓ =
f −ℓ +
f.
1
1
p
Faisons tendre b vers +∞. Le termes entre accolades tend vers 0 , par hypothèse. Par ailleurs,
comme |f (x)| 6 1/x pour tout x > 0 , on a :
Z
Z b
Z p+1
Z p+1
b dx
f 6
|f | 6
|f | 6
= ln(1 + 1/p),
p x
p
p
p
Z
b
f tend vers 0 . Il en résulte finalement que l’intégrale
Z
+∞
f converge (vers ℓ ), ce
P
qui est faux, comme nous l’avons dit. Cette contradiction montre que la série
f (n) diverge.
donc
p
1
n>1
En examinant le raisonnement ci-dessus, le lecteur constatera aisément qu’on a un résultat
plus général. Considérons une fonction réelle f de classe C 1 sur un intervalle I := [a, +∞[.
Faisons les deux hypothèses suivantes :
1. la fonction f a pour limite 0 en +∞ ;
Z +∞
2. l’intégrale
|f ′ | converge.
a
Alors l’intégrale
Z
+∞
f et la série
a
deux ou divergent toutes deux.
P
f (n) sont de même nature : elles convergent toutes
n>a
II.2.21 Pour tout n, posons bn := an n−z0 . Effectuons la translation z := z0 + y . La
P
P
série
an n−z est transformée en
bn n−y . Par ailleurs, lorsque y décrit le secteur
n>1
n>1
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
196
S0 := {reiθ | r > 0, −α 6 θ 6 α} , z décrit le secteur S défini dans l’énoncé. Quitte à
remplacer les an par les bn , nous sommes ramenés au cas où z0 := 0 , ce que nous supposons
désormais.
P
L’hypothèse est maintenant que la série
an converge. Notons (Rn ) la suite des restes de
n>1
cette série. Pour tout n ∈ N, rappelons que Rn :=
+∞
P
ak . La suite (Rn ) converge vers 0 ,
k=n+1
en particulier elle est bornée. Pour tout n ∈ N, posons encore : ωn := sup |Rk |. Lorsque n
k>n
tend vers +∞, ωn tend vers 0 .
Pour montrer que la série de fonctions donnée converge uniformément sur S , l’idée générale
est d’appliquer le critère de Cauchy uniforme (théorème 21 de la page 490). Étant donnés deux
entiers p, q tels que 1 6 p < q et un point z du secteur S , posons :
Sp,q (z) :
q
X
an
·
nz
n=p
Tout ce que nous avons à faire est de majorer |Sp,q (z)|, indépendamment de q et de z , par
une quantité tendant vers 0 lorsque p tend vers +∞. Pour cela, effectuons une transformation d’Abel (cf. la preuve de l’égalité (11) de la page 491), en partant de la remarque que
an = Rn−1 − Rn pour tout n > 1 . Pour tous p, q, z comme ci-dessus, on a :
Sp,q (z) =
q
X
n=p
an n−z =
q
X
(Rn−1 − Rn )n−z =
n=p
= p−z Rp−1 − q −z Rq +
q−1
X
n=p
q−1
X
n=p−1
Rn (n + 1)−z −
q
X
Rn n−z
n=p
Rn (n + 1)−z − n−z .
Puisque z ∈ S , Re z > 0 , donc |p−z | < 1 et de même |q −z | < 1 . Par inégalité triangulaire et
par définition des ωn , on obtient la majoration :
q−1
X
(n + 1)−z − n−z 6 ωp−1
|Sp,q (z)| 6 ωp−1 + ωq + ωp
n=p
!
q−1
X
−z
−z
(n + 1) − n .
2+
n=p
Par hypothèse, z = reiθ , où r est un réel strictement positif et θ ∈ [−α, α] . On observera que
|z| = r et cos θ > cos α > 0 . En outre, pour tout réel t > 0 , |t−z | = t− Re z = t−r cos θ .
Cela étant, soit n ∈ N∗ . La dérivée de t 7→ t−z étant t 7→ −zt−1−z , il vient :
Z
(n + 1)−z − n−z = z
n+1
n
Z
t−z−1 dt 6 r
n+1
n
t−1−r cos θ dt
1
1
1
=
−
cos θ nr cos θ
(n + 1)r cos θ
1
1
1
6
−
·
cos α nr cos θ
(n + 1)r cos θ
c Dunod 2014
II.2 : Suites et séries de fonctions
197
On en déduit la majoration suivante :
!
q−1 1 X
1
1
|Sp,q (z)| 6 ωp−1 2 +
−
cos α n=p nr cos θ
(n + 1)r cos θ
1
1
1
1
6 ωp−1 2 +
−
6
ω
2
+
.
p−1
cos α pr cos θ
q r cos θ
cos α
En effet, le dernier terme entre crochets est majoré par 1 . Nous avons ainsi obtenu une majoration de |Sp,q (z)| , indépendante de l’entier q > p et du point z ∈ S , par une quantité qui tend
vers 0 lorsque p tend vers +∞, puisque c’est le cas pour ωp−1 . Le critère de Cauchy uniforme
peut donc être appliqué, ce qui établit la convergence uniforme de la série de fonctions donnée
sur le secteur S .
P −s
Venons-en à la divergence de la série
n , avec les notations de l’énoncé. Raisonnons par
n>1
l’absurde, en supposant que cette série converge. On applique ce qui précède, avec an := 1
pour tout n et z0 := s. Pour tout α ∈ ]0, π/2[, notons Sα le secteur formé des points s + reiθ
P −z
lorsque r décrit ]0, +∞] et θ décrit [−α, α] . Pour tout z ∈ Sα , la série
n
converge
n>1
donc. C’est vrai pour tout α ∈ ]0, π/2[. Or il est clair que la réunion des secteurs Sα lorsque α
décrit ]0, π/2[ est le demi-plan ouvert z ∈ C | Re z > u = Re s (faire un dessin). Pour tout
P −z
point z de ce demi-plan, la série
n converge donc. Mais u ∈ ]0, 1[, donc 1 appartient au
n>1
P
demi-plan en question. Conclusion : la série harmonique
1/n converge, ce qui est absurde.
n>1
II.2.22 1. Notons fn (x) le terme général de la série. Chacune des fonctions fn est de classe C ∞
sur D et ses dérivées sont données par la formule :
fn(p) (x) =
(−1)n+p p!
n!(x + n)p+1
pour tout p ∈ N.
Pour montrer que f est de classe C ∞ sur D il suffit, en vertu du théorème 28 de la page 495, de
P (p)
montrer que si A est un compact de D et si p ∈ N, la série
fn converge uniformément
n>0
(par exemple normalement) sur A. On se ramène immédiatement au cas où A est un segment
de la forme [m + a, m + 1 − a], où m ∈ Z et a ∈ [0, 1/2[, avec a > 0 lorsque m 6 0 . Pour
tout entier n > |m| et tout x ∈ A, on a x + n > n + m + a > n − |m| + a, d’où la majoration :
p!
(p) fn (x) 6
p+1 ·
n! n − |m| + a
La convergence normale sur A est alors évidente, puisque déjà la série de terme général 1/n!
converge.
−1
2. Considérons un entier n > 0 fixé. La fraction rationnelle X(X + 1) · · · (X + n)
a
n + 1 pôles simples, à savoir les points −k , pour k = 0, 1, . . . , n. Il existe des coefficients ck
(uniques) tels que la décomposition en éléments simples de cette fraction soit :
n
X
1
ck
=
·
X(X + 1) · · · (X + n)
X +k
k=0
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
198
Soit k ∈ [[0, n]]. Pour calculer le coefficient ck (qui dépend aussi de n, mais peu importe),
remplaçons dans cette égalité X par un réel x tendant vers −k . En multipliant l’égalité obtenue
par x + k , on obtient :
ck =
1
(−1)k
=
·
(−k)(−k + 1) · · · (−1)(1)(2) · · · (n − k)
k!(n − k)!
D’où :
n
X
1
(−1)k
=
·
x(x + 1) · · · (x + n)
k!(n − k)!(x + k)
k=0
2
Pour tout couple (n, k) ∈ N , définissons un nombre réel an,k comme suit. Si n < k , posons
−1
an,k := 0 . Si n > k , posons an,k := (−1)k k!(n − k)!(x + k)
. Nous obtenons :
n
+∞
X
X
1
=
an,k =
an,k .
x(x + 1) · · · (x + n)
k=0
k=0
Appliquons maintenant le théorème de Fubini (théorème 15 de la page 485) à la série double
P P
an,k . Fixons d’abord k ∈ N. Le changement d’indice n := k + p transforme la série
k>0 n>0
−1
ap+k,k . À la constante (−1)k k!(x + k)
près, on obtient la série de terme
n>0
p>0
P
général 1/p!, qui converge et a pour somme e . La série
|an,k | converge donc, et l’on a :
P
an,k en
P
n>0
+∞
X
e
|an,k | =
k!
|x
+ k|
n=0
Puisque la série
et
+∞
X
an,k =
n=0
(−1)k e
·
k!(x + k)
−1
P e k! |x + k|
converge manifestement, nous pouvons effectivement ap-
k>0
pliquer le théorème de Fubini. Ce théorème donne l’égalité suivante, avec convergence de toutes
+∞ +∞
+∞
P
P P
P +∞
an,k , soit :
les séries qui apparaissent :
an,k =
k=0
ef (x) :=
n=0
n=0
k=0
+∞
+∞
X
X
(−1)k e
1
=
·
k!(x + k)
x(x + 1) · · · (x + n)
n=0
(∗)
k=0
On en déduit (avec le changement d’indice n := k + 1 ) :
exf (x) = 1 +
+∞
X
+∞
X
1
1
= 1+
(x + 1) · · · (x + n)
(x + 1) · · · (x + 1) + k
n=1
k=0
= 1 + ef (x + 1).
D’où xf (x) − f (x + 1) = 1/e pour tout x ∈ D .
3. Soit donc x un réel strictement positif fixé. Pour tous n ∈ N et t ∈ ]0, 1], posons
gn (t) := (−1)n tn+x−1 /n!. Chaque gn est intégrable sur ]0, 1], et son intégrale sur ]0, 1]
P
vaut (−1)n / n!(x + n) . La série de fonctions
gn converge simplement avec pour somme
n>0
Z
P
x−1 −t
la fonction g : t 7→ t
e . À condition de justifier l’interversion des signes
et
que
c Dunod 2014
II.2 : Suites et séries de fonctions
nous allons effectuer, on a :
Z 1
Z 1
tx−1 e−t d t =
0
0
+∞
X
199
+∞
X
(−1)n tn+x−1
n!
n=0
!
dt =
Z 1
+∞
X
(−1)n
tn+x−1 d t
n!
0
n=0
(−1)n
= f (x).
n!(x + n)
n=0
N
P
Pour tout entier N > 0 , la fonction gn est majorée par la fonction t →
7 etx−1 , qui est
=
n=0
intégrable sur ]0, 1]. L’interversion est alors justifiée par le théorème de convergence dominée
(cf. le module II.3).
II.2.23 1. Pour tout n ∈ N∗ et tout x ∈ R \ Z, posons fn (x) := (n − x)−2 + (n + x)−2 .
P
La convergence simple de la série de fonctions
fn est évidente car, si x est fixé et si n
n>1
2
tend vers +∞, fn (x) ∼ 2/n . D’où une fonction f : R \ Z → R, définie par la formule de
l’énoncé, c’est-à-dire :
+∞
X
1
f (x) = 2 +
fn (x).
(∗)
x
n=1
P
Soit x ∈ R \ Z. Dans la formule f (x + 1) :=
(n − x − 1)−2 , effectuons le changement
n∈Z
P
d’indice n := m + 1 . Il vient : f (x + 1) =
(m − x)−2 = f (x), ce qui montre que f
m∈Z
est 1 -périodique. Si l’on n’est pas convaincu par ce raisonnement utilisant les sommes du type
P
, on procède comme suit. Soit N ∈ N∗ . Évaluons les sommes partielles suivantes, à l’aide
n∈Z
de changements d’indices évidents :
N
SN =
N
N
−1
X
1
1
=
+
+
(x + 1)2
(k − x)2
k=0
TN =
=
N
X
X
X
1
1
1
1
+
fn (x + 1) =
+
+
2
2
2
(x + 1)
(x
+
1)
(n
−
x
−
1)
(n
+
x
+ 1)2
n=1
n=1
n=1
N
X
−2
X
k=−N −1
N
X
1
=
(k − x)2
N
−1
X
k=−N −1
1
,
(k − x)2
N
X
1
1
1
1
+
fn (x) = 2 +
+
2
2
x
x
(n − x)
(n + x)2
n=1
n=1
n=1
N
−1
X
X
1
1
1
+
+
=
x2
(k − x)2
(k − x)2
k=1
k=−N
N
X
k=−N
1
·
(k − x)2
Ainsi SN − TN = (x + N + 1)−2 − (x − N )−2 tend vers 0 lorsque N tend vers +∞, d’où
l’égalité f (x + 1) = f (x), par passage à la limite.
P
Pour la continuité de f il suffit de montrer que la série de fonctions
fn converge uniforn>1
mément sur tout compact de R \ Z. Vu la 1 -périodicité de f , il suffit de montrer qu’il y a
convergence normale sur tout segment du type I := [a, 1 − a], où a est fixé, 0 < a < 1/2 .
Pour tout entier n > 2 et tout x ∈ I , on a n− x > n+ a− 1 , donc (n− x)−2 6 (n+ a− 1)−2 ,
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
200
et de même n + x > n + a, donc (n + x)−2 6 (n + a)−2 . D’où la convergence normale sur
I , car la série numérique de terme général (n + a − 1)−2 + (n + a)−2 converge.
2. La fonction g est la différence de deux fonctions continues et 1 -périodiques sur R \ Z. Il
suffit donc de montrer que g(x) a une limite finie lorsque x tend vers 0 . Un calcul analogue
P
à celui fait plus haut montre que la série de fonctions
fn converge normalement sur tout
n>1
segment [−a, a], où a ∈ ]0, 1[ est fixé. Il en résulte que la différence f (x) − 1/x2 a une limite
finie lorsque x tend vers 0 , plus précisément :
lim
x→0
1
f (x) − 2
x
= 2
+∞
X
1
·
2
n
n=1
(∗∗)
Pour conclure, il suffit donc de montrer que π 2 / sin2 (πx) − 1/x2 a une limite finie lorsque x
tend vers 0 . Effectuons pour cela un développement limité en 0 :
2
π 2 x2 − πx − π 3 x3 /6 + O(x5 )
1
π 2 x2 − sin2 (πx)
π2
−
=
=
sin2 (πx) x2
x2 sin2 (πx)
x2 sin2 (πx)
(
2 )
π2
π 2 x2
=
1− 1−
+ O(x4 )
6
sin2 (πx)
2 2
π2
π x
4
=
+ O(x ) .
3
sin2 (πx)
Lorsque x tend vers 0 , sin(πx) ∼ πx, donc sin2 (πx) ∼ π 2 x2 . On en déduit alors que
π 2 / sin2 (πx) − 1/x2 tend vers π 2 /3 .
3. Puisque g est continue sur R, il suffit de prouver l’égalité de l’énoncé lorsque x ∈
/ Z. Notons
h la fonction x 7→ 1/ sin2 (πx) sur R \ Z. Il suffit de montrer que, si ϕ est l’une des fonctions
h ou f , et si x ∈ R \ Z est fixé, on a ϕ(x/2) + ϕ (x + 1)/2 = 4ϕ(x). Pour la fonction h,
c’est un petit calcul trigonométrique :
h(x/2) + h (x + 1)/2 =
1
1
+
sin2 (πx/2) sin2 (π(x + 1)/2)
1
1
sin2 (πx/2) + cos2 (πx/2)
+
=
2
sin (πx/2) cos (πx/2)
sin2 (πx/2) cos2 (πx/2)
1
4
=
= 4h(x).
=
2
2
2
sin (πx/2) cos (πx/2)
sin (πx)
P
P
Pour la fonction f , on a f (x/2) =
(n − x/2)−2 = 4
(2n − x)−2 . De la même façon,
=
f (x + 1)/2 =
P
n∈Z
2
n∈Z
−2
n − (x + 1)/2
= 4
P
n∈Z
(2n − x − 1)−2 . La conclusion est alors
n∈Z
évidente, en séparant les entiers pairs et les entiers impairs.
La fonction |g| : R → R est continue et 1 -périodique. En considérant sa restriction à [0, 1],
on en déduit qu’elle est bornée et atteint ses bornes. Elle atteint en particulier son maximum
absolu M > 0 en un point x ∈ [0, 1]. Alors :
4M = 4 |g(x)| = g(x/2) + g (x + 1)/2 6 |g(x/2)| + g (x + 1)/2 6 2M,
c Dunod 2014
II.2 : Suites et séries de fonctions
201
d’où M = 0 . La fonction g est donc nulle. Autrement dit, pour tout x ∈ R \ Z, on a :
X
π2
1
·
=
2
(n
−
x)2
sin πx
n∈Z
Par ailleurs, g(0) = 0 . Or g(0) est la limite, lorsque x tend vers 0 , de f (x) − π 2 / sin2 (πx).
Dans la question précédente, nous avons montré que π 2 / sin2 (πx) − 1/x2 tend vers π 2 /3 .
+∞
P
Compte tenu de la formule (∗∗), on obtient, comme souhaité, l’égalité
1/n2 = π 2 /6 .
n=1
II.2.24 Notons un le terme général de la série. Lorsque n tend vers +∞, n1/n tend vers 1
√
(regarder le logarithme), donc n un = a(n + 1)/n n−1/n tend vers a. La règle de Cauchy
montre donc que la série converge si a < 1 et diverge si a > 1 . Si a := 1 , cette règle ne
s’applique pas, mais un raisonnement direct permet de conclure. En effet, lorsque n tend vers
+∞, on a :
n
(n + 1)n
1
1
e
un =
=
1
+
·
∼ ,
n+1
n
n
n
n
donc la série diverge.
Appliquons ensuite la règle de d’Alembert. Pour tout n > 2 , il vient :
n
n
1/n
(n + 1)a
un
(n − 1)n
(n − 1)(n + 1)
1
=
·
= a
= a 1− 2
·
un−1
nn+1
(na)n−1
n2
n
On en déduit que un /un−1 tend vers a (passer là encore par le logarithme), et l’on peut
conclure, comme précédemment.
II.2.25 1. Rappelons le « Lemme de Cesàro » , dans le cas réel. Soit (un ) une suite réelle ayant
une limite ℓ . Pour tout n ∈ N∗ , posons sn := (u0 + u1 + · · · + un−1 )/n. Alors la suite (sn ) a
aussi comme limite ℓ . Ce résultat reste vrai dans le cas d’une « limite infinie », avec ℓ := +∞
ou ℓ := −∞. Par commodité, donnons une preuve de ce lemme.
Supposons d’abord que ℓ soit un réel. Par linéarité, on se ramène au cas où ℓ := 0 . Soit ε > 0 .
NP
−1
Il existe N ∈ N∗ tel que, pour tout entier n, (n > N ) =⇒ |un | 6 ε . Posons C :=
|uk |.
k=0
Pour tout entier n > N , l’inégalité triangulaire donne :
|nsn | 6
n−1
X
k=0
|uk | 6 C + (n − N )ε 6 C + nε,
d’où
|sn | 6 ε + C/n.
Il en résulte que |sn | 6 2ε dès que n est assez grand, donc la suite (sn ) converge vers 0 .
Supposons que ℓ := +∞ (si ℓ := −∞, on remplace la suite donnée par son opposée). La
démarche est alors analogue. Considérons un réel A > 0 . Il existe N ∈ N∗ tel que, pour tout
NP
−1
entier n, (n > N ) =⇒ un > A . Posons C :=
|uk |. Pour tout entier n > N , les
k=0
inégalités uk > A pour k = N, . . . , n − 1 donnent :
nsn > −C + (n − N )A,
d’où sn > A − (C + N A)/n.
Il en résulte que sn > A/2 dès que n est assez grand, donc la suite (sn ) tend vers +∞.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
202
Revenons à la suite (an ). Nous supposons donc que la suite (an+1 /an ) a une limite ℓ , éventuellement +∞. Bien entendu, ℓ > 0 . Pour tout n ∈ N, posons un := ln(an+1 /an ). Si
ℓ := +∞, la suite (un ) tend vers +∞, si ℓ := 0 , elle tend vers −∞, et, si ℓ est un réel
strictement positif, (un ) converge vers ln ℓ . Dans tous les cas, (un ) tend vers λ := ln ℓ , avec
la convention que λ := +∞ si ℓ := +∞ et λ := −∞ si ℓ = 0 . Cela étant, soit (sn )n>1
la suite formée des moyennes arithmétiques des un , comme ci-dessus. D’après le lemme de
Cesàro, (sn ) tend vers λ. Or, pour tout n ∈ N∗ , on a :
sn =
n−1
√ ln a0
1X
ln an − ln a0
ln(ak+1 /ak ) =
= ln n an −
·
n
n
n
k=0
√ Il en résulte que la suite de terme général ln n an tend vers λ donc, compte tenu de nos
√
conventions sur λ, la suite de terme général n an tend vers ℓ .
P
Supposons que la règle de d’Alembert permette de déterminer la nature de la série
an . Cela
n>0
veut dire que la suite (an+1 /an ) a une limite ℓ , finie ou non mais distincte de 1 . Puisque la
√ suite n an tend aussi vers ℓ , la règle de Cauchy permet également de conclure.
2. Soit p ∈ N. On a a2p = 2p ·3−2p , a2p+1 = 2p ·3−(2p+1) , et a2p+2 = 2p+1 ·3−(2p+2) . Ainsi
a2p+1 /a2p = 1/3 et a2p+2 /a2p+1 = 2/3 . La suite de terme général an+1 /an ne possède donc
pas de limite ; cette suite a deux valeurs d’adhérence, 1/3 et 2/3 . Dans ces conditions, la règle
de d’Alembert ne s’applique pas, i.e. elle ne permet pas de déterminer la nature de la série
P
an .
n>0
Pour tout n ∈ N, on a n/2 − 1 < E(n/2) 6 n/2 , d’où 2n/2−1 · 3−n 6 an < 2n/2 · 3−n ,
√
√
√
puis 2−1/n · 2/3 6 n an < 2/3 . Lorsque n tend vers +∞, 21/n tend vers 1 . D’après le
√
√
théorème des gendarmes (cf. [L1]), la suite de terme général n an converge vers 2/3 < 1 .
P
La règle de Cauchy montre alors que la série
an converge.
n>0
II.2.26 Pour tout n, cos(na) = (enia + e−nia )/2 . La série
est exp(xeia ). De même, la série
P
P
xn enia /n! converge, et sa somme
n>0
xn e−nia /n! converge, et sa somme est exp(xe−ia ). La
n>0
série donnée converge donc, et sa somme vaut :
+∞ n
X
x cos(na)
1
=
exp(xeia ) + exp(xe−ia )
n!
2
n=0
1
exp(x cos a + ix sin a) + exp(x cos a − ix sin a)
2
ex cos a ix sin a
=
e
+ e−ix sin a = ex cos a cos(x sin a).
2
=
p
II.2.27 Notons f la fonction x 7→
(1 + x)/(1 − x) . Elle est définie et de classe C ∞ sur
I := ]−1, 1[. Pour montrer que f est DSE sur I , et pour trouver son développement, il n’est
c Dunod 2014
II.2 : Suites et séries de fonctions
203
pas très judicieux, par exemple, de faire un produit de Cauchy des développements de (1+x)1/2
et de (1 − x)−1/2 . L’astuce est plutôt de partir des égalités suivantes, valables pour tout x ∈ I :
r
r
1+x
(1 + x)2
=
= (1 + x)(1 − x2 )−1/2 .
1−x
1 − x2
Il n’y a plus qu’à utiliser le développement en série entière de x 7→ (1 − x2 )−1/2 , cf. la formule
précédant la formule (33) de la page 525, puis à faire une somme de séries convergentes :
r
+∞
+∞
+∞
X
X
1+x
1 2p 2p X 1 2p 2p+1
=
x
+
x
=
an xn ,
2p
2p
1−x
2
p
2
p
p=0
p=0
n=0
les coefficients an étant définis par les formules suivantes (selon la parité de n) :
1 2p
pour tout p ∈ N.
a2p := a2p+1 := 2p
2
p
P
Le rayon de convergence R de la série entière
an xn est au moins égal à 1 , puisque le
n>0
rayon de convergence de la série entière donnant la fonction x 7→ (1 − x2 )−1/2 est 1 . En
P
fait R = 1 . En effet, soit g : ]−R, R[ la somme de la série entière
an z n . Raisonnons
n>0
par l’absurde, en supposant R > 1 . Lorsque x ∈ I tend vers 1− , g(x) tend alors vers g(1).
C’est absurde, car d’une part g(x) = f (x) pour tout x ∈ I et d’autre part f (x) tend vers +∞
lorsque x tend vers 1− . On a donc bien R = 1 .
II.2.28 Appliquons le théorème 22 de la page 491, dont nous reprenons les notations. Ici
X = [0, 1], E := C et, pour tout n ∈ N∗ et tout x ∈ X , on pose fn (x) := xn /n et
gn (x) := j n (de sorte que les gn sont des fonctions constantes). Si x ∈ X est fixé, la suite
fn (x) n>1 est à valeurs réelles positives, elle est décroissante et tend vers 0 . Cette convergence est uniforme sur X à cause des inégalités fn (x) 6 1/n. Ensuite, pour tout n ∈ N∗ , on
a:
n
X 1 − j n+1 2
2
k
6
j = = √ ·
1−j |1 − j|
3
k=0
P
Toutes les hypothèses du théorème étant satisfaites, la série de fonctions
fn gn , c’est-à-dire
n>1
P n n
j x /n, converge uniformément sur X . Notons donc f : [0, 1] → C la somme de cette
n>1
série de fonctions. Puisque tous les termes de cette série sont des fonctions continues sur X , f
est continue sur X .
Pour expliciter f sur [0, 1[, nous allons dériver. Chaque terme de la série définissant f est une
P n n−1
fonction de classe C ∞ sur R. La série des dérivées est
j x
. Pour tout réel r ∈ ]0, 1[
n>1
fixé, cette série de fonctions converge normalement sur [0, r[, puisqu’il s’agit d’une série entière de rayon de convergence 1 (série géométrique). D’après le théorème 14 de la page 483, f
est de classe C 1 sur [0, r[, et l’on a :
f ′ (x) =
+∞
X
n=1
j n xn−1 =
j
1 − jx
pour tout x ∈ [0, 1[ .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
204
Ainsi f est la primitive de x 7→ j/(1 − jx) nulle en 0 . On pourrait en déduire que
f (x) = − ln(1 − jx) pour tout x, mais il faudrait pour cela utiliser le logarithme complexe.
Procédons différemment. Soit x ∈ [0, 1[. Les égalités 1 + j + j 2 = 0 et j 3 = 1 donnent
(1 − jx)(1 − j 2 x) = 1 + x + x2 , d’où :
f ′ (x) =
j(1 − j 2 x)
j−x
=
·
2
1+x+x
1 + x + x2
Z
(2x + 1) d x
= ln(1 + x + x2 ) + constante, puis :
1 + x + x2
Z
Z
dx
2x + 1
4dx
2
√
=
= √ arctan
+ constante.
1 + x + x2
(2x + 1)2 + 3
3
3
√
Pour tout x ∈ [0, 1[, on en déduit, puisque arctan(1/ 3) = π/6 :
t=x
1
2j + 1
2t + 1
2
√
f (x) = − ln(1 + t + t ) + √ arctan
2
3
3
t=0
t=x
1
2t + 1
√
= − ln(1 + t + t2 ) + i arctan
2
3
t=0
1
2x + 1
iπ
√
= − ln(1 + x + x2 ) + i arctan
− ·
2
6
3
Un calcul élémentaire donne
Puisque f est continue sur [0, 1], sa valeur en 1 , c’est-à-dire
+∞
P
j n /n, est la limite de f (x)
n=1
quand x tend vers 1− . D’où aussitôt :
+∞ n
X
√
1
iπ
1
iπ iπ
1
iπ
j
= − ln 3 + i arctan( 3) −
= − ln 3 +
−
= − ln 3 + ·
n
2
6
2
3
6
2
6
n=1
Indiquons comment retrouver les résultats précédents en utilisant la section du module II.6
portant sur le logarithme complexe. Les résultats de ladite section montrent que, pour tout
x ∈ [0, 1[, on a :
+∞ n n
X
j x
= −Log(1 − jx).
n
n=1
√
Le module de 1 − jx est r := 1 + x + x2 . Calculons la détermination principale de
Arg(1 − jx) :
√ !
√ −1 i 3
1
+
=
x + 2 − ix 3 .
1 − jx = 1 − x
2
2
2
Par définition de la détermination principale de l’argument, on en déduit ceci :
√ !
x 3
Arg(1 − jx) = − arctan
, d’où
x+2
1
Log(1 − jx) = ln(1 + x + x2 ) − i arctan
2
c Dunod 2014
√ !
x 3
.
x+2
II.2 : Suites et séries de fonctions
205
On retrouve le résultat précédent, à condition de vérifier ceci, x ∈ [0, 1[ étant fixé :
√ !
x 3
2x + 1
π
√
arctan
= arctan
− ·
x+2
6
3
|
{z
}
|
{z
}
=a
=b
La formule d’addition de la fonction tangente donne :
√
2x+1
√
− √13
tan a − tan(π/6)
x 3
3
tan(a − π/6) =
=
=
= tan b.
√
1 + tan a tan(π/6)
x+2
1 + 2x+1
· √13
3
Pour en déduire l’égalité b = a − π/6 , il suffit de vérifier que a − π/6 ∈ ]−π/2, π/2[. C’est
évident, parce que x ∈ [0, 1[, donc a ∈ [π/6, π/3[.
II.2.29 Soit f la fonction x 7→ arctan(x + 1). Comme fonction composée, elle est de classe C ∞
sur R. Mais le fait que la fonction arctan soit DSE sur ]−1, 1[ ne suffit pas pour conclure que
f est DSE 0 , car la proposition 39 de la page 513 ne s’applique pas : la valeur de x 7→ x + 1
en 0 est 1 . L’idée est simple. La dérivée de f est une fraction rationnelle, sans pôle en 0 .
Cette dérivée est donc développable en série entière au voisinage de 0 . Par intégration, nous en
déduirons que f est DSE 0 .
On obtient la dérivée de f à l’aide de la formule de dérivation d’une fonction composée :
f ′ (x) =
1
1
= 2
·
(x + 1)2 + 1
x + 2x + 2
C’est là une fraction rationnelle, ayant deux pôles simples, à savoir −1 + i et −1 − i . Cette
fraction rationnelle étant de degré −2 , sa partie entière est nulle. La théorie de la décomposition
en éléments simples nous dit qu’il existe un unique couple (a, b) ∈ C2 tel que l’égalité cidessous soit vraie pour tout z ∈ C distinct des deux pôles :
1
a
b
=
+
·
z 2 + 2z + 2
z+1−i z+1+i
Le calcul donne a = −i/2 et b = i/2 . Par exemple, en multipliant l’égalité ci-dessus par
z + 1 − i puis en faisant tendre z vers −1 + i , on voit que a est l’inverse de la dérivée de
z 2 + 2z + 2 en −1 + i , d’où la valeur de a indiquée.
√
Soit ε ∈ {−1, 1} . Puisque |εi − 1| = 2 , on obtient le développement suivant (série géomé√
trique), valable pour tout z ∈ C tel que |z| < 2 :
−1
+∞
X
1
1
z
(−1)n z n
=
1+
=
·
z + 1 + εi
1 + εi
1 + εi
(1 + εi)n+1
n=0
Noter que (1 + εi)−1 = (1 − εi)/2 . On en déduit le développement suivant, valable pour tout
√
z ∈ C tel que |z| < 2 :
+∞
+∞
1
−i X (−1)n (1 + i)n+1 z n
i X (−1)n (1 − i)n+1 z n
=
+
z 2 + 2z + 2
2 n=0
2n+1
2 n=0
2n+1
=
+∞
X
n=0
an z n ,
où an :=
(−1)n+1 i (1 + i)n+1 − (1 − i)n+1 .
n+2
2
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
206
√
√
2 exp(iπ/4) et 1 − i = 2 exp(−iπ/4), il vient :
√
(1 + i)n+1 − (1 − i)n+1 = ( 2)n+1 exp (n + 1)iπ/4 − exp −(n + 1)iπ/4
√
= i( 2)n+3 sin (n + 1)π/4 , d’où
Soit n ∈ N. Puisque 1 + i =
(−1)n
sin (n + 1)π/4 .
(n+1)/2
2
Pour simplifier l’expression de an , effectuons la division de n par 4 : n := 4p + r , où p ∈ N
et r ∈ {0, 1, 2, 3} . On obtient ceci :
an =
(−1)p
(−1)p+1
(−1)p
, a4p+1 =
, a4p+2 = 2p+2 , a4p+3 = 0.
2p+1
2p+1
2
2
2
Observons que les an sont rationnels (sauriez-vous dire pourquoi c’était prévisible ?). Le rayon
√
P
de convergence de la série entière
an z n est 2 , en vertu de la proposition 38 de la
a4p =
n>0
page 511. En particulier, on a donc :
f ′ (x) =
+∞
X
an xn
n=0
Le théorème 42 de la page
f (0) = arctan 1 = π/4 , on obtient :
+∞
arctan(x + 1) =
i √ √ h
pour tout x ∈ − 2, 2 .
516
permet
d’intégrer
+∞
π X an−1 xn
π X an xn+1
+
=
+
4 n=0 n + 1
4 n=1
n
cette
égalité.
Puisque
i √ √ h
pour tout x ∈ − 2, 2 .
√
Le rayon de convergence de la série entière obtenue est encore 2 (proposition 40 de la
page 515). On peut écrire le développement précédent de façon plus explicite :
+∞
π X (−1)p x4p
2x
2x2
x3
arctan(x + 1) =
+
−
+
.
4 p=0 22p+2
4p + 1 4p + 2 4p + 3
Terminons par une remarque. Soit x ∈ R. Posons a := arctan(x + 1) et b := a − π/4 . En
général, la formule d’addition pour la fonction tangente donne :
tan b = tan a − tan(π/4) / 1 + tan a tan(π/4) = (x + 1 − 1)/(1 + x + 1) = x/(x + 2).
Cette formule est valable pourvu que tan a 6= −1 , c’est-à-dire x 6= −2 . Il est alors logique de
comparer les fonctions x 7→ arctan(x + 1) et x 7→ arctan x/(x + 2) . On vérifie que ces
deux fonctions ont même dérivée, elles diffèrent donc d’une constante. Mais cette constante
dépend de l’intervalle sur lequel on se place. Le lecteur pourra vérifier que, pour tout x 6= −2 ,
on a :
(
π/4 + arctan x/(x + 2) si x > −2
arctan(x + 1) =
−3π/4 + arctan x/(x + 2) si x < −2.
La proposition 39 de la page 513 montre que la fonction x 7→ arctan x/(x + 2) est DSE 0 , et
l’on retrouve ainsi le fait que f soit DSE 0 , sans pouvoir obtenir directement, par cette méthode,
√
le rayon de convergence 2 .
2
II.2.30 1. Pour tout couple (n, p) ∈ N , posons In,p :=
Z
0
1
tn (ln t)p d t . Soit (n, p) ∈ N2 . L’in-
tégrale In,p est impropre si p > 1 (à cause du comportement de ln t en 0 ). Montrons que
c Dunod 2014
II.2 : Suites et séries de fonctions
207
p
cette intégrale est convergente (cf. le module II.3). Lorsque t tend vers 0+ , tn+1/2 |ln t| tend
√
p
vers 0 . Il existe donc un réel C tel que tn |ln t| 6 C/ t pour tout t ∈ ]0, 1]. D’où par
Z 1
comparaison la convergence de In,p , car l’intégrale
t−1/2 d t est convergente.
0
Il reste à calculer les In,p . Fixons l’entier n > 0 , et cherchons une relation de récurrence entre
In,p−1 et In,p , p > 1 . Fixons un réel ε ∈ ]0, 1[. Intégrons par parties sur [ε, 1], en intégrant
tn et en dérivant (ln t)p . La dérivée de (ln t)p étant p(ln t)p−1 /t, il vient :
n+1
t=1
Z 1
Z 1
t
p
tn (ln t)p d t =
· (ln t)p
−
tn (ln t)p−1 d t
n+1
n
+
1
ε
ε
t=ε
Z 1
−εn+1 (ln ε)p
p
−
tn (ln t)p−1 d t.
=
n+1
n+1 ε
Lorsque ε tend vers 0 , le crochet tend vers 0 , d’où :
In,p =
La formule annoncée :
In,p =
−p
In,p−1 .
n+1
(−1)p p!
(n + 1)p+1
(∗)
s’en déduit aussitôt, par récurrence sur p (à n fixé).
2. Lorsque t tend vers 0+ , t ln t tend vers 0 . La fonction f : [0, 1] → R définie par f (0) := 0
et f (t) := t ln t si t > 0 est donc continue. Puisque f ′ (t) = 1 + ln t, la fonction f atteint son
minimum absolu en 1/e , ce minimum valant −1/e . Ainsi |f | 6 1/e . Cela étant, considérons
un réel x fixé. Pour tout t ∈ [0, 1], txt est par définition égal à exp(xt ln t), c’est-à-dire à
exp xf (t) . D’où :
+∞ n
X
x f (t)n
txt =
·
n!
n=0
La série de fonctions de t apparaissant ici converge normalement sur [0, 1], parce que |f | est
Z
P
majorée par 1/e . Cela autorise une interversion des signes
et
:
Z
1
txt d t =
0
D’après la question 1, on a donc :
Z 1
+∞ n Z 1
+∞ n
X
X
x
x
tn (ln t)n d t =
In,n .
n! 0
n!
n=0
n=0
txt d t =
0
+∞
X
(−1)n
xn
n+1
(n
+
1)
n=0
Cette égalité étant vraie pour tout réel x, c’est le développement en série entière demandé, et
le rayon de convergence est +∞. En fait, la formule obtenue est valable pour tout nombre
complexe x.
II.2.31 Puisque |a| 6= 1 , la fonction f : x 7→ (eix − a)−1 est définie sur R, elle est 2π -périodique
P
et de classe C ∞ . La série de Fourier
cn einx de f converge donc normalement vers f (cf. le
n∈Z
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
208
module II.4). Rappelons la formule donnant les cn :
Z 2π
Z 2π −inx
1
1
e
−inx
cn =
f (x)e
dx =
d x.
2π 0
2π 0 eix − a
Plutôt que de calculer directement ces intégrales, utilisons une méthode indirecte. Distinguons
deux cas, suivant que |a| < 1 ou |a| > 1 . Commençons par le cas |a| < 1 . Comme souvent,
l’idée est de faire intervenir une série géométrique. Soit x ∈ R. Puisque ae−ix < 1 , il vient :
f (x) =
+∞
X
1
e−ix
−ix
=
=
e
an e−inx
eix − a
1 − ae−ix
n=0
Puisque |a| < 1 , la dernière série de fonctions converge vers f normalement (donc uniformément) sur R. Cela permet de calculer les coefficients de Fourier de f par interversion des
Z
P
signes
et . Pour tout k ∈ Z, on a :
2πck =
Z
2π
e
−kix
0
+∞
X
n=0
n −(n+1)ix
a e
!
dx =
+∞
X
an
n=0
Z
2π
0
e−(n+k+1)ix d x .
Soit h ∈ Z. L’intégrale sur [0, 2π] de la fonction x 7→ ehix vaut 2π si h = 0 et 0 sinon. On
en déduit les coefficients de Fourier de f , dans le cas |a| < 1 :
(
0 si k > 0
ck =
a−(k+1) si k 6 −1.
Passons au cas |a| > 1 . Soit x ∈ R. Puisque eix /a < 1 , il vient :
f (x) =
+∞
X
−a−1
1
−1
=
=
−a
a−n einx
eix − a
1 − a−1 eix
n=0
Soit k ∈ Z. Comme dans le cas précédent, on obtient :
!
Z
Z 2π
+∞
+∞
X
X
−kix
−(n+1) nix
2πck =
e
−a
e
dx = −
a−(n+1)
0
n=0
n=0
0
2π
e(n−k)ix d x .
On en déduit les coefficients de Fourier de f , dans le cas |a| > 1 :
(
−a−(k+1) si k > 0
ck =
0 si k 6 −1.
II.2.32 La fonction θ 7→ f (reiθ ) est 2π -périodique et de classe C ∞ sur R. Pour tout θ ∈ [0, 2π],
+∞
P
on a f (reiθ ) =
an rn eniθ . Il y a de plus convergence normale (en θ ) sur R, parce que le
n=0
rayon de convergence de la série entière donnée est +∞. Comme dans l’exercice précédent,
on en déduit (par intégration) que, pour tout p ∈ N, le coefficient de Fourier d’indice p de la
fonction θ 7→ f (reiθ ) vaut ap rp . D’où :
Z 2π
1
p
ap r =
e−ipθ f (reiθ ) d θ.
2π 0
c Dunod 2014
II.2 : Suites et séries de fonctions
209
Pour tout θ , l’hypothèse faite sur f montre que f (reiθ ) 6 Kra , d’où la majoration
|ap rp | 6 Kra , soit |ap | 6 Kra−p . Fixons alors un entier p > a. La majoration précédente
est vraie pour tout réel r > 0 , et l’on en déduit que ap = 0 , en faisant tendre r vers +∞. La
série entière donnée n’a donc qu’un nombre fini de coefficients non nuls, autrement dit c’est un
polynôme.
√
√
II.2.33 Considérons un entier n > 1 , fixé pour l’instant. On sait que 3 est irrationnel, donc n 3
est irrationnel, en particulier n’est pas un demi-entier. Il existe donc un unique entier a tel que
√
√
√
n 3 − a < 1/2 . En fait a est égal à E(n 3) ou 1 + E(n 3), en tous cas a > 1 .
√
√
Pour la minoration visée, partons de l’égalité (a + n 3)(a − n 3) = a2 − 3n2 .
√
Puisque a 6= ±n 3 , a2 − 3n2 est un entier non nul, il est au moins égal à 1 . D’où
√ √ √ √
(a + n 3) a − n 3 > 1 , et par conséquent a − n 3 > (a + n 3)−1 . Puisque
√
√
√
√
√ √
a 6 n 3 + 1/2 < n 3 + 1 , on a a + n 3 < 2n 3 + 1 , d’où a − n 3 > (2n 3 + 1)−1 .
C’est l’inégalité annoncée.
√
√
Posons t := a − n 3 , de sorte que |t| < 1/2 . Alors πn 3 = πa − πt, d’où l’on tire
√
√
sin(πn 3) = (−1)a+1 sin(πt) et donc sin(πn 3) = |sin(πt)| . Cela étant, rappelons
que, pour tout réel x ∈ [0, π/2], on dispose de l’encadrement 2x/π 6 sin x 6 x. Ici
√ |πt| ∈ ]0, π/2], donc sin(πn 3) = |sin(πt)| = sin |πt| > 2 |t| . D’où :
√
√ √ 2
1
2n 3 + 1
√
√ 6
, donc ·
sin(πn 3) > 2 a − n 3 >
sin(πn 3)
2
2n 3 + 1
√
Pour tout entier n > 1 , posons an = sin(πn 3)−1 . Soit R le rayon de convergence de la
P
série entière
an z n . Évidemment |an | > 1 pour tout n, et par conséquent R 6 1 . En sens
n>1
inverse, les inégalités précédentes montrent que R est au moins égal au rayon de convergence
P √
de la série entière
n 3 + 1/2 z n , rayon de convergence qui est clairement égal à 1 .
n>1
Conclusion : R = 1 .
II.2.34 Notons ak ( k > 0 ) les coefficients et R le rayon de convergence de la série entière
proposée. On a ak = 1/k lorsque k est premier, et ak = 0 lorsque k n’est pas premier. En
tout cas, 0 6 ak 6 1/k pour tout k > 1 . On en déduit que R est au moins égal au rayon de
P n
convergence de la série entière
z /n, autrement dit R > 1 .
n>1
Considérons un réel r > 1 . Lorsque l’entier n tend vers +∞, rn /n tend vers +∞. En
particulier, il existe un entier N > 1 tel que rn /n > 1 pour tout n > N . Puisque l’ensemble
des nombres premiers est infini, il existe un entier h tel que pj > N pour tout j > h. Pour
P pk
tout j > h, on a rpj /pj > 1 , ce qui montre que le terme général de la série
r /pk ne
k>0
tend pas vers 0 . D’où r > R . Cette inégalité étant vraie pour tout réel r > 1 , on a R 6 1 , et
par suite R = 1 .
II.2.35 Notons fn (z) le terme général de la série. Pour chaque n > 1 , il faut déjà que fn (z) soit
défini, c’est-à-dire que z soit distinct de −n. Posons D := C \ {−1, −2, . . .} . Nous allons
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
210
montrer que D est le domaine de convergence simple de la série de fonctions donnée. Soit
P
donc z ∈ D . Pour affirmer que la série
(−1)n /(n + z), il ne faut pas appliquer le critère
n>1
spécial des séries alternées, qui ne s’applique qu’à des séries à termes réels (avec les hypothèses
adéquates). L’idée est de séparer parties réelles et parties imaginaires. Écrivons z := a + ib ,
avec a et b réels. Pour tout n > 1 , on a :
(−1)n
(−1)n
(−1)n (n + a − ib)
=
=
·
n+z
n + a + ib
(n + a)2 + b2
Considérons donc les deux séries :
X (−1)n (n + a)
X (−1)n+1 b
et
·
2
2
(n + a) + b
(n + a)2 + b2
n>1
n>1
La première converge : c’est cette fois une application immédiate du critère spécial des séries
alternées. La deuxième série converge, et même absolument : si b 6= 0 , son terme général est
P
équivalent, en valeur absolue, à |b| /n2 . La série
fn (z) converge donc (mais pas absolun>1
ment), et ceci pour tout z ∈ D .
On ne peut espérer pouvoir développer f en série entière que dans le disque unité D(0, 1),
puisque 1 ∈
/ D . Fixons donc un point z de ce disque. Pour tout n > 1 , on a |z/n| < 1 , d’où
(toujours les séries géométriques) :
+∞
+∞
X
(−1)n
(−1)n X (−1)k z k
(−1)n+k z k
(−1)n
=
=
=
·
n+z
n(1 + z/n)
n
nk
nk+1
k=0
k=0
P
À condition de justifier l’interversion des signes
que nous allons effectuer, il vient :
!
!
+∞
+∞
+∞
+∞
n+k
k
X X (−1)
X
X
z
(−1)n
k k
f (z) =
(−1) z
=
nk+1
nk+1
n=1
n=1
k=0
=
+∞
X
ak z k ,
k=0
en posant pour tout k > 0 : ak := (−1)k
k=0
On peut en fait préciser les valeurs des ak :
+∞
X
(−1)n
·
nk+1
n=1
a0 = − ln 2 et ak = (−1)k+1 (1 − 2−k )ζ(k + 1) pour tout k > 1.
(∗)
La première égalité résulte du corollaire 44 de la page 516, les suivantes viennent de l’exercice 6
de la page 498.
Justifions l’interversion. Pour cela, appliquons le théorème de Fubini (théorème 15 de la
page 485), dont nous reprenons les notations. On ne peut pas appliquer brutalement ce théoP
rème car, si on le pouvait, la série
fn (z) convergerait absolument, ce qui est faux. Il faut
n>1
en fait « écarter » la valeur k := 0 . Pour tout couple d’entiers (n, k) tels que n > 1 et k > 1 ,
P
posons an,k := (−1)k+n z k /nk+1 . Pour tout n > 1 , la série
|an,k | converge, car c’est une
k>1
série géométrique de raison |z| /n < 1 . La somme de cette série est sn := |z| / n(n − |z|) .
P
Ainsi la série
sn converge, ce qui nous permet d’appliquer le théorème de Fubini. On a
n>1
donc (avec convergence de toutes les séries qui interviennent) :
!
!
+∞ X
+∞
+∞ X
+∞
+∞
X
X
X
(−1)n+k z k
(−1)n+k z k
=
=
ak z k ,
k+1
k+1
n
n
n=1
n=1
k=1
c Dunod 2014
k=1
k=1
II.2 : Suites et séries de fonctions
211
c’est-à-dire (penser à la valeur k := 0 ) :
+∞ +∞
X
X
(−1)n
(−1)n
−
=
ak z k .
n
+
z
n
n=1
k=1
Dans cette égalité, le membre de gauche vaut f (z) + ln 2 . Puisque a0 = − ln 2 , on obtient :
f (z) =
+∞
X
ak z
k
k=0
= − ln 2 +
+∞
X
(−1)k+1 (1 − 2−k )ζ(k + 1)z k
k=1
Soit R le convergence de la série entière
P
pour tout z ∈ D(0, 1).
ak z k . D’abord R > 1 , en vertu de ce qui précède.
k>0
En fait, R = 1 . Pour le voir, commençons par démontrer que ζ(s) tend vers 1 lorsque le réel
s tend vers +∞. C’est une conséquence immédiate du théorème de la double limite. En effet,
P
fixons un réel b > 1 . La série de fonctions
1/ns converge normalement sur [b, +∞[.
n>1
D’autre part, si l’entier N > 1 est fixé, la somme partielle
N
P
1/ns tend vers 1 lorsque s
n=1
tend vers +∞. Notre assertion en résulte.
Lorsque k tend vers +∞, ζ(k + 1) tend ainsi vers 1 , donc |ak | tend vers 1 . Il en résulte que
P k
R est égal au rayon de convergence de la série entière
z , d’où R = 1 .
k>0
II.2.36 Soit donc f : I := ]−1, 1[ → C la fonction x 7→ sin(a arcsin x). Rappelons que la
fonction sinus, elle, est définie et de classe C ∞ sur C. Comme la fonction arcsin est de classe
C ∞ sur I , la fonction f est (comme composée) de classe C ∞ sur I . Par contre, il n’est pas
évident a priori que f soit DSE sur I . Tout ce que nous savons au départ, c’est que f est DSE 0
(cf. la première proposition de la section 3.4 de la page 521). Pour montrer que f est DSE sur
I , nous allons procéder en trois étapes :
1. Montrer que f vérifie une certaine équation différentielle linéaire homogène d’ordre 2 .
2. Montrer que ladite équation différentielle possède, à une constante multiplicative près,
une unique solution DSE sur I .
3. Grâce à la condition initiale en 0 , déterminer pour f un développement en série entière
valable sur I .
1. Pour tout x ∈ I , on a :
f ′ (x) =
a cos(a arcsin x)
√
,
1 − x2
Dérivons la dernière égalité :
Multiplions par
p
soit f ′ (x) 1 − x2 = a cos(a arcsin x).
p
xf ′ (x)
−a2 sin(a arcsin x)
√
f ′′ (x) 1 − x2 − √
=
·
2
1−x
1 − x2
√
1 − x2 :
(1 − x2 )f ′′ (x) − xf ′ (x) + a2 sin(a arcsin x) = 0.
Ainsi, f est solution, sur I , de l’équation différentielle linéaire suivante :
(E) : (1 − x2 )y ′′ − xy ′ + a2 y = 0.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
212
2. À ce stade, la démarche est la suivante. Soit G :=
P
an z n une série entière. Voyons à
n>0
quelles conditions G vérifie l’égalité suivante (entre séries entières) :
(1 − z 2 )G′′ − zG′ + a2 G = 0.
(∗)
Notons H le premier membre. Alors la série entière H est nulle si, et seulement si, chacun de
ses coefficients est nul, notons cn ces coefficients. Calculons :
X
X
X
H = (1 − z 2 )
n(n − 1)an z n−2 − z
nan z n−1 + a2
an z n
n>2
=
=
X
n>1
n
(n + 2)(n + 1)an+2 z −
n>0
X
X
(n + 2)(n + 1)an+2 z n −
X
n>0
n>0
n
n>0
n>0
=
X
n(n − 1)an z −
X
nan z n + a2
n>0
X
an z n
n>0
(n2 − a2 )an z n
n>0
(n + 2)(n + 1)an+2 − (n2 − a2 )an z n .
|
{z
}
cn
Ainsi H = 0 si, et seulement si, les cn vérifient la relation de récurrence suivante :
(n + 2)(n + 1)an+2 = (n2 − a2 )an
pour tout n ∈ N.
(∗∗)
Puisque f (0) = 0 et f ′ (0) = a, il est logique d’imposer les conditions initiales a0 := 0
et a1 := a. Avec ces conditions initiales, il y a une unique série entière vérifiant l’égalité
(∗), notons-la encore G. Le calcul des an est simple : en premier lieu, an = 0 lorsque
n est pair. Supposons n impair : n := 2p + 1 . Alors a1 = a, a3 = a(1 − a2 )/(3 · 2),
a5 = a(1 − a2 )(32 − a2 )/(5 · 4 · 3 · 2). Par une récurrence immédiate, on trouve :
a2p+1
p−1
Y
a
=
(2k + 1)2 − a2 .
(2p + 1)!
k=0
3. Déterminons le rayon de convergence R de G. Il faut ici distinguer deux cas. Supposons
d’abord que a soit un entier impair, de signe quelconque. La formule précédente montre alors
que les an sont tous nuls à partir d’un certain rang, autrement dit G est un polynôme et
R = +∞. Dans ce cas, f est en fait un polynôme en x. Si a := 3 , par exemple, en posant t := arcsin x, on a sin t = x puis f (x) = sin(3t) = 3 sin t − 4 sin3 t = 3x − 4x3 . Par
√
contre, si par exemple a := 2 , f (x) = 2 sin t cos t = 2x 1 − x2 , avec un signe + puisque
t ∈ ]−π/2, π/2[.
Supposons désormais que a ne soit pas un entier impair. Les a2p+1 , p ∈ N, sont donc tous non
nuls. Si z ∈ C∗ est donné, voyons si la série de terme général up := a2p+1 |z|
Il suffit d’appliquer la règle de d’Alembert :
2
|z| (2p + 1)2 − a2
up+1
=
·
up
(2p + 3)(2p + 2)
2
2p+1
converge.
Ainsi up+1 /up tend vers |z| lorsque p tend vers +∞. Il en résulte que ladite série converge
si |z| < 1 et diverge si |z| > 1 . En conclusion, R = 1 .
4. Soit g : I := ]−1, 1[ → C la somme de la série entière G. C’est une fonction de classe C ∞ .
D’après le théorème 45 de la page 517, g est solution de l’équation différentielle (E), puisque
G vérifie l’égalité (∗). En outre, g(0) = a0 = 0 et g ′ (0) = a1 = a. Les fonctions f et
c Dunod 2014
II.2 : Suites et séries de fonctions
213
g vérifient toutes deux l’équation différentielle (E), avec mêmes conditions initiales en 0 . Le
coefficient de y ′′ dans (E), à savoir 1 − x2 , ne s’annulant pas sur I , il résulte du théorème de
Cauchy-Lipschitz (cf. le module II.7) que f = g . D’où le développement de f en série entière
sur I :
+∞
X
(12 − a2 )(32 − a2 ) · · · (2p − 1)2 − a2 2p+1
sin(a arcsin x) = a
x
pour tout x ∈ I.
(2p + 1)!
p=0
5. Opérons de même à partir de la fonction f : x 7→ (arcsin x)2 , en abrégeant les calculs,
semblables aux précédents. On a ici :
2 arcsin x
f ′ (x) = √
, puis
1 − x2
p
xf ′ (x)
2
f ′′ (x) 1 − x2 − √
−√
= 0.
1 − x2
1 − x2
L’équation (E) doit donc être remplacée par la suivante :
(E) : (1 − x2 )y ′′ − xy ′ = 2.
Cette équation est encore linéaire, mais n’est plus homogène. Avec les notations précédentes,
on a ici pour tout n :
cn = (n + 2)(n + 1)an+2 − n2 an .
On doit avoir c0 = 2 , autrement dit a2 = 1 , et cn = 0 pour tout n > 1 . Par ailleurs, les
conditions initiales sont a0 = a1 = 0 . On en déduit facilement que an = 0 lorsque n est
impair, et, lorsque n := 2p est pair, an est donné par la formule :
2
22p−1 (p − 1)!
22
42
(2p − 2)2
a2p =
×
× ··· ×
=
·
4·3 6·5
2p(2p − 1)
(2p)!
Le rayon de convergence est encore 1 et, par un raisonnement analogue au précédent, on aboutit
au développement en série entière suivant :
2
+∞ 2p−1 X
2
(p − 1)!
2
(arcsin x) =
x2p pour tout x ∈ I.
(2p)!
p=1
Dans le second membre, prenons x := 1 . La série obtenue converge car, en vertu de la for√
√
mule de Stirling (cf. le module II.8), son terme général est équivalent à π/(2p p). D’après
le théorème d’Abel (théorème 34 de la page 506), on obtient la formule suivante, puisque
arcsin 1 = π/2 :
2
+∞ 2p+1 +∞ 2p+1
X
X
2
(p − 1)!
2
2
·
π =
=
(2p)!
p2 2p
p
p=1
p=1
II.2.37 Soit n ∈ N. Pour tout t ∈ [0, 1], on a t 6 (1 + t2 )/2 6 1 , d’où l’encadrement :
n
Z 1
Z 1
Z 1
1
1 + t2
n
=
t d t 6 an =
dt 6
d t = 1.
n+1
2
0
0
0
P n
P n
Chacune des séries entières
z et
z /(n + 1) ayant pour rayon de convergence 1 , le
n>0
n>0
P
rayon de convergence de la série entière F :=
an z n vaut 1 . Soit f : I := ]−1, 1[ → R
n>0
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
214
la somme de la série entière F . Considérons un point x de I fixé. À condition de justifier
Z
P
l’interversion des signes
et
ci-après, il vient :
f (x) =
+∞ Z
X
n=0
=
Z
1
0
1
0
1 + t2
2
n
dt x
n
+∞ X
x(1 + t2 )
2
n=0
n
!
=
+∞ Z
X
0
n=0
dt =
Z
1
0
1
x(1 + t2 )
2
n
dt
=
1 − x(1 + t2 )/2
dt
Z
0
1
2dt
·
(2 − x) − xt2
Justifions l’interversion effectuée. Le point x ∈ I étant toujours fixé, considérons la suite
n
de fonctions fn : [0, 1] → R définie par fn (t) = x(1 + t2 )/2 . Cette série de foncn
tions converge normalement donc uniformément (en t), puisque |fn (t)| 6 |x| pour tout
(n, t) ∈ N × [0, 1]. En vertu du théorème 13 de la page 483 de la page 483, on peut interZ
P
vertir les signes
et
:
Z
+∞
X
1
0
n=0
!
fn (t) d t =
C’est la justification annoncée, puisque la série
+∞ Z
X
n=0
P
1
0
fn (t) d t .
fn (t) est une série géométrique de raison
n>0
x(1 + t2 )/2 . Ainsi :
f (x) =
Z
0
1
2dt
2
=
(2 − x) − xt2
2−x
Z
0
1
dt
·
1 − x(2 − x)−1 t2
(∗)
Distinguons alors trois cas, suivant le signe de x. Il est clair que f (0) = 1 . Supposons ensuite
p
x < 0 . Posons a := −x/(2 − x) . Le changement de variable u := at donne :
Z 1
Z a
2
dt
2
du
f (x) =
=
2 − x 0 1 + a 2 t2
a(2 − x) 0 1 + u2
p
2 arctan x/(x − 2)
2 arctan(a)
p
=
=
pour tout x ∈ ]−1, 0[ .
a(2 − x)
x(x − 2)
p
Supposons enfin x > 0 . Posons ici a := x/(2 − x) . Le changement de variable u := at
donne :
Z 1
Z a
2
dt
2
du
f (x) =
=
2 − x 0 1 − a 2 t2
a(2 − x) 0 1 − u2
p
2 argth x/(2 − x)
2 argth(a)
p
=
=
pour tout x ∈ ]0, 1[ .
a(2 − x)
x(2 − x)
II.2.38 Reprenons les notations de l’exercice 15 de la page 526 et de sa solution. Par hypothèse,
le rayon de convergence R de la série entière entière F est strictement positif. Choisissons un
réel r ∈ ]0, R[. Par définition du rayon de convergence, la suite (an rn )n>0 est bornée, i.e. la
borne supérieure M := sup |an | rn | n ∈ N est finie. Ainsi |an | 6 M r−n pour tout n ∈ N.
c Dunod 2014
II.2 : Suites et séries de fonctions
215
Notre objectif est de montrer que la série entière G :=
P
bn z n a un rayon de convergence R′
n>0
strictement positif. Rappelons que la suite (bn ) est définie par son premier terme b0 := 1 et la
relation de récurrence :
bn := − a1 bn−1 + a2 bn−2 + · · · + an b0
pour tout n > 1.
(∗)
Pour minorer R′ , il suffit de majorer convenablement les |bn | . Plus précisément, supposons
que nous ayons trouvé un réel ω > 0 tel que les inégalités suivantes soient vérifiées :
|bn | 6 ω n
pour tout n ∈ N.
Alors R′ sera au moins égal au rayon de convergence de la série entière
(∗∗)
P
ω n z n , c’est-à-dire
n>0
ω −1 . On aura donc bien R′ > ω −1 > 0 . Il reste à choisir ω de façon adéquate. Pour cela,
essayons de démontrer les inégalités (∗∗) par récurrence sur n. L’inégalité (∗∗) est vraie pour
n = 0 . Supposons que, pour un certain entier n > 1 , on ait |bk | 6 ω k pour k = 0, . . . , n − 1 .
L’égalité (∗) donne alors, en imposant la condition ωr > 1 :
n−1
n−1
X
(ωr)n − 1
M ωn
X
|bn | = bk an−k 6
ω k (M rk−n ) = M r−n
6
·
ωr − 1
ωr − 1
k=0
k=0
n
L’inégalité |bn | 6 ω sera donc vérifiée pourvu que ωr > M + 1 , soit ω > (M + 1)/r . On
peut choisir par exemple ω := (M + 1)/r . Alors, d’une part les inégalités (∗∗) sont vérifiées
pour tout n, et d’autre part R′ > ω −1 , soit R′ > r/(M + 1) > 0 .
II.2.39 Soit n ∈ N. Par définition, an est le nombre de triplets (a, b, c) ∈ N3 tels que
a + 2b + 5c = n. En appliquant (deux fois) la définition 6 de la page 510 de la page 510,
P n P 2n
on voit que an est le coefficient d’indice n du produit des trois séries entières
z ,
z
n>0
n>0
P 5n
et
z , ayant chacune pour rayon de convergence 1 . Nous connaissons les sommes de
n>0
ces séries entières (ce sont des séries géométriques). Pour tout z ∈ C tel que |z| < 1 , le
théorème 36 de la page 510 de la page 510 donne donc :
+∞
X
n=0
an z n =
1
·
(1 − z)(1 − z 2 )(1 − z 5 )
(∗)
À partir de là, il ne reste plus qu’à développer la fraction rationnelle F figurant dans le second
membre de cette égalité (à l’aide de la proposition 38 de la page 511 de la page 511 et de sa
preuve). Les coefficients an s’obtiennent ensuite par identification, grâce au théorème 47 de la
page 522 de la page 522.
Posons ω := exp(2iπ/5), c’est une racine primitive 5 ème de l’unité. La fraction rationnelle
F est de degré −8 , donc sa partie entière est nulle. Cette fraction a un pôle triple en 1 et cinq
pôles simples : −1 et ω k pour k = 1, 2, 3, 4 . Il existe donc des nombres complexes uniques
a, b, c, d, u1 , u2 , u3 , u4 tels que F s’écrive :
4
X uk
1
a
b
c
d
=
+
+
+
+
· (∗∗)
(1 − z)(1 − z 2 )(1 − z 5 )
(1 − z)3
(1 − z)2
1−z
1+z
1 − ωk z
k=1
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
216
La formule (20) de la page 510 permet alors l’identification des an . Pour tout n ∈ N, on
obtient :
n+2
an = a
+ b(n + 1) + c + (−1)n d + u1 ω n + u2 ω 2n + u3 ω 3n + u4 ω 4n . (∗∗∗)
2
Le calcul de a est simple : en multipliant les deux membres de l’égalité (∗∗) par (1 − z)3 et
−1
en remplaçant z par 1 , on voit que a est la valeur en 1 de (1 + z)(1 + z + z 2 + z 3 + z 4 )
:
a = 1/10 . De même, en multipliant les deux membres de l’égalité (∗∗) par 1 + z et en
−1
remplaçant z par −1 , on voit que d est la valeur en −1 de (1 − z)2 (1 − z 5 )
: d = 1/8 .
Procédons de la même manière avec les pôles simples ω k . Soit k ∈ {1, 2, 3, 4} . Multiplions
les deux membres de l’égalité (∗∗) par 1 − ω k z , puis faisons tendre z vers ω −k . Il vient :
−1
1 − ωk z
ωk
z5 − 1
uk = lim
=
lim
·
(1 − ω −k )(1 − ω −2k ) z→ω−k z − ω −k
z→ω −k (1 − z)(1 − z 2 )(1 − z 5 )
La dernière limite est la dérivée de z 5 − 1 en ω −k , c’est-à-dire 5ω −4k = 5ω k . D’où :
uk =
=
1
ω 3k
=
5(1 − ω −k )(1 − ω −2k )
5(1 − ω k )(1 − ω 2k )
ω 3k (1 − ω 3k )(1 − ω 4k )
·
5(1 −
− ω 2k )(1 − ω 3k )(1 − ω 4k )
ω k )(1
Simplifions cette expression de uk . Puisque le polynôme X 5 − 1 est le produit des X − ω h
pour h ∈ [[0, 4]], on a :
X4 + X3 + X2 + X + 1 =
4
Y
X5 − 1
(X − ω h ),
=
X −1
h=1
donc
4
Q
(1 − ω h ) = 5 et
h=1
4
P
h=1
ω h = −1 . Ainsi :
ω 3k (1 − ω 3k )(1 − ω 4k )
ω 3k − ω 6k − ω 7k + ω 10k
=
25
25
3k
k
2k
ω −ω −ω +1
=
·
25
En particulier, la somme des uk vaut 1/5 . Pour chaque n ∈ N, calculons la somme
4
P
αn :=
uk ω kn figurant dans le second membre de l’égalité (∗∗∗). Pour tout m ∈ Z, la
uk =
k=1
somme sm :=
4
P
ω km vaut 5 si m est multiple de 5 et 0 sinon. D’où :
k=0
25αn =
4
X
k=1
ω kn (ω 3k − ω k − ω 2k + 1) =
= sn+3 − sn+1 − sn+2 + sn .
4
X
k=0
ω kn (ω 3k − ω k − ω 2k + 1)
On en déduit aisément la valeur de αn , selon la valeur du reste de la division de n par 5 :


1/5 si ce reste est 0 ou 2
αn = 0 si ce reste est 1


−1/5 si ce reste est 3 ou 4.
c Dunod 2014
II.2 : Suites et séries de fonctions
217
Calculons enfin les coefficients b et c figurant dans l’égalité (∗∗). Une première relation entre
ces coefficients s’obtient en remplaçant z par 0 dans ladite égalité. Il vient :
1 = a+b+c+d+
4
X
k=1
uk ,
d’où b + c = 1 −
1
1 1
23
− − =
·
10 8 5
40
On obtient une deuxième relation en multipliant les deux membres de l’égalité (∗∗) par z ∈ R,
puis en faisant tendre z vers +∞. Il vient :
0 = −c + d −
4
X
k=1
uk ω −k = −c + d −
4
X
ω 2k − 1 − ω k + ω −k
k=1
25
1
= −c + d + ·
5
On en déduit c = 1/8+1/5 = 13/40 , puis b = 23/40−c = 23/40−13/40 = 1/4 . Reportons
dans la formule (∗∗∗) :
an =
1 n+2
n + 1 13 (−1)n
+
+
+
+ αn ,
10
2
4
40
8
c’est-à-dire finalement :
an =
2n2 + 16n + 27 (−1)n
+
+ αn .
40
8
Dans ce résultat, la valeur de αn est donnée par la formule ci-dessus, en fonction du reste de la
division de n par 5 . Précisons encore plus, en fonction du reste r de la division de n par 10 :
an


(n2 + 8n + 20)/20





(n2 + 8n + 11)/20




(n2 + 8n + 20)/20





(n2 + 8n + 7)/20



(n2 + 8n + 12)/20
=

(n2 + 8n + 15)/20





(n2 + 8n + 16)/20




(n2 + 8n + 15)/20



(n2 + 8n + 12)/20



(n2 + 8n + 7)/20
si r = 0
si r = 1
si r = 2
si r = 3
si r = 4
si r = 5
si r = 6
si r = 7
si r = 8
si r = 9.
En fait, on peut retrouver ces formules simplement, sans utiliser de séries entières. Traitons
par exemple le cas où n est multiple de 10 : n := 10p. Par définition, an est le nombre de
triplets (a, b, c) d’entiers positifs tels que a + 2b + 5c = 10p. Pour tout entier c ∈ [[0, 2p]],
notons γc le nombre de couples (a, b) d’entiers positifs tels que a + 2b = 10p − 5c. Alors
2p
P
an =
γc . Soit maintenant c ∈ [[0, 2p]]. L’application b 7→ (10p − 5c − 2b, b) est une
c=0
bijection de [[0, E (10p − 5c)/2 ]] sur l’ensemble des couples (a, b) d’entiers positifs tels que
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
218
a + 2b = 10p − 5c. Ainsi γc = 1 + E (10p − 5c)/2 . D’où :
an =
2p
X
c=0
=
p
X
h=0
1 + E (10p − 5c)/2
p−1
X
1 + (5p − 5h) +
1 + (5p − 5h − 3)
h=0
= (p + 1) + 5
p
X
j=0
j − 2p + 5
p
X
j=1
j = 1 − p + 10
p
X
j
j=1
= 1 − p + 5p(p + 1) = 5p2 + 4p + 1 = (n2 + 8n + 20)/20.
II.2.40 Notons un le terme général de la série figurant dans l’énoncé. Le terme figurant entre cro
chets dans un est positif et majoré par 4/(8n + 1), d’où 0 6 un 6 1/ 16n (2n) . Il en résulte
P
que la série
un converge, notons S sa somme. Pour calculer S , il est naturel d’introduire
n>0
des séries entières. Dans ce qui suit, k désigne l’un des entiers 1, 4, 5, 6 . Partons de la série
P 8n+k−1
entière
z
. Son rayon de convergence est 1 , et sa somme est z 7−→ z k−1 /(1 − z 8 ),
n>0
elle est définie pour |z| < 1 . Posons I := ]−1, 1[, et notons fk la primitive de la fonction
x 7−→ xk−1 /(1 − x8 ) sur I nulle en 0 . Pour tout x ∈ I , f (x) peut être calculé par intégration
terme à terme (théorème 42 de la page 516 de la page 516) :
fk (x) =
+∞ 8n+k
X
x
·
8n + k
n=0
√
Posons a = 1/ 2 , de sorte que a8 = 1/16 . Il vient :
fk (a) = ak
+∞
X
1
·
n (8n + k)
16
n=0
On comprend l’intérêt d’avoir introduit les fonctions fk , car on en déduit :
4f1 (a) 2f4 (a) f5 (a) f6 (a)
−
−
−
a
a4
a5
a6
√ = 4 2 f1 (a) − f5 (a) − 8 f4 (a) + f6 (a) .
S=
Revenant à la définition des fk comme primitives, on peut écrire :
Z a √
4 2(1 − x4 ) − 8(x3 + x5 )
d x.
S =
1 − x8
0
Des égalités 1 − x8 = (1 + x4 )(1 − x4 ) = (1 + x4 )(1 + x2 )(1 − x2 ), on tire :
Z a
√ Z a dx
x3 d x
S = 4 2
−
8
·
4
4
2
0 1+x
0 (1 + x )(1 − x )
(∗)
Il reste donc à calculer ces deux intégrales de fractions rationnelles. Pour cela, effectuons des
décompositions en éléments simples. D’abord, l’égalité x4 + 1 = (x2 + 1)2 − 2x2 donne la
c Dunod 2014
II.2 : Suites et séries de fonctions
219
√
√
factorisation x4 + 1 = (x2 + x 2 + 1)(x2 − x 2 + 1). La fraction à décomposer étant paire,
la théorie nous dit qu’il existe deux réels α, β (uniques) tels que :
√
4 2
αx + β
−αx + β
√
√
=
+
·
4
2
2
1+x
x +x 2+1 x −x 2+1
√
On trouve β := 2 2 (prendre x := 0 ), puis α := 2 . Déterminons une primitive de la première
fraction :
√
√
√
Z
Z
Z
2x + 2 2
2x + 2
2dx
√
√
√
dx =
dx +
2
2
2
x +x 2+1
x +x 2+1
x +x 2+1
√
Z
√
2dx
2
√
= ln x + x 2 + 1 +
·
2
x +x 2+1
√
√
Ensuite, 2 x2 + x 2 + 1 = (x 2 + 1)2 + 1 , d’où :
√
√
Z
Z
√
2dx
2 2dx
√
√
=
= 2 arctan x 2 + 1 + constante.
2
2
x +x 2+1
(x 2 + 1) + 1
√
Puisque a = 1/ 2 , il vient :
√
Z a
h
√
√
ix=a
2x + 2 2
√
d x = ln x2 + 2x + 1 + 2 arctan x 2 + 1
2
x=0
0 x +x 2+1
= ln(5/2) + 2 arctan(2) − 2 arctan(1).
En changeant x en −x, on a de même :
√
√
Z a
Z 0
−2x + 2 2
2x + 2 2
√
√
dx =
dx
2
2
0 x −x 2+1
−a x + x 2 + 1
h
√
√
ix=0
= ln x2 + x 2 + 1 + 2 arctan x 2 + 1
x=−a
= 2 arctan(1) − ln(1/2).
On en déduit la première intégrale figurant dans la formule (∗) :
√ Z a dx
4 2
= ln(5) + 2 arctan(2).
4
0 1+x
Pour la deuxième intégrale, le changement de variable t := x2 donne :
Z a
Z 1/2
x3 d x
tdt
8
=
4
·
4 )(1 − x2 )
2 )(1 − t)
(1
+
x
(1
+
t
0
0
La décomposition en éléments simples est ici immédiate :
4t
(1 +
4
Z
0
1/2
t2 )(1
− t)
=
2t − 2
2
+
,
2
1+t
1−t
d’où :
h
it=1/2
tdt
2
=
ln(1
+
t
)
−
2
arctan(t)
−
2
ln(1
−
t)
(1 + t2 )(1 − t)
t=0
= ln(5/4) − 2 arctan(1/2) − 2 ln(1/2) = ln(5) − 2 arctan(1/2).
En revenant à la formule (*), on obtient : S = 2 arctan(2) + arctan(1/2 . Il est classique
que, pour tout x ∈ R∗ , arctan(x) + arctan(1/x) vaut π/2 si x > 0 et −π/2 si x > 0 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
220
Rappelons pourquoi. Par imparité, on peut se limiter au cas x > 0 . Soit θ := arctan(x). Cet
angle est caractérisé par les propriétés θ ∈ ]0, π/2[ et tan θ = x. L’angle π/2 − θ appartient
aussi à ]0, π/2[, et sa tangente vaut tan(π/2 − θ) = cotan(θ) = 1/x ; ces deux propriétés caractérisent arctan(1/x), donc π/2 − θ = arctan(1/x), d’où la formule annoncée :
π/2 − arctan(x) = arctan(1/x).
Conclusion : la somme de la série figurant dans l’énoncé est effectivement :
+∞
X
1
4
2
1
1
−
−
−
= S = 2 arctan(2) + arctan(1/2 = π.
n
16 8n + 1 8n + 4 8n + 5 8n + 6
n=0
II.2.41 1. Notons Jn l’intégrale à calculer. C’est une intégrale de Wallis d’indice impair, son
calcul est moins rapide que pour les intégrales de Wallis d’indice pair (cf. l’exercice II.2.0 de la
page 535). On effectue une intégration par parties. Soit n ∈ N.
Z π/2
Z π/2
2n+1
Jn =
cos
xdx =
cos2n+1 x(cos2 x + sin2 x) d x
0
= Jn+1 +
Z
0
π/2
cos2n+1 x sin2 x d x = Jn+1 +
0
Z
π/2
0
2n+1
(cos
x) d x.
{zx sin x})(sin
|{z}
|
u′
v
On pose donc pour tout x : u(x) := −1/(2n + 2) cos2n+2 x et v(x) := sin x. Le produit
uv est nul en 0 et π/2 , d’où :
Z π/2
Z
π/2
Jn = Jn+1 −
u(x)v ′ (x) d x = Jn+1 + 1/(2n + 2)
cos2n+3 x d x
0
= Jn+1 + 1/(2n + 2) Jn+1 ,
d’où Jn+1 =
0
2n + 2
2n + 3
Jn .
Nous avons ainsi obtenu une relation de récurrence sur les Jn . Démontrons alors la formule de
Zπ/2
l’énoncé par récurrence sur n. D’abord J0 =
cos x d x = sin(π/2) = 1 , et la formule est
0
vraie au rang 0 . Supposons la formule vraie pour un certain n. Alors :
2n + 2
2n + 2
22n
2n + 2 22n (n!)2
Jn+1 =
Jn =
·
=
2n + 3
2n + 3 (2n + 1) 2n
2n + 3 (2n + 1)!
n
2
22n+2 (n + 1)!
22n (2n + 2)2 (n!)2
22n+2
·
=
=
=
(2n + 3)!
(2n + 3)!
(2n + 3) 2n+2
n+1
La formule est donc vraie au rang n + 1 .
2. Supposons d’abord que la série donnée converge, et notons S sa somme. L’idée est de rem 2n
placer le coefficient
par sa valeur en fonction de Jn , tirée de la question 1 :
n
!
Z π/2
+∞
+∞
X
X
(2n
+
1)J
n(2n
+
1)
n
S =
(n2n )
=
cos2n+1 x d x .
2n
n
2
2
0
n=1
n=1
c Dunod 2014
II.2 : Suites et séries de fonctions
221
Supposons qu’on puisse intervertir les signes
S =
Z
π/2
0

P
et
Z
(cela sera justifié plus loin). Alors :

X

Z π/2
 +∞ n(2n + 1) cos2n+1 x 

dx =
f (x) d x.


2n
0
n=1

|
{z
}
(∗)
= f (x)
Cela suggère d’introduire la série entière
P
n(2n + 1)z 2n+1 . On remplacera ensuite z par
n>1
√
P 2n+1
cos x/ 2 . Partons de la série entière
z
. Son rayon de convergence est 1 et sa somme,
n>0
pour |z| < 1 , est z/(1 − z 2 ) (c’est une série géométrique). En dérivant deux fois, ce qui ne
change pas le rayon de convergence, le calcul donne :
+∞
X
d2
z
2z(3z 2 + z 4 )
2n(2n + 1)z 2n+1 = z 2 2
=
·
2
dz
1−z
(1 − z 2 )3
n=1
Pour tout r ∈ [0, 1[, la série entière obtenue converge normalement, donc uniformément, sur le
√
disque D(0, r). Remplaçons maintenant z par cos x/ 2 , où x décrit R. On obtient l’égalité
suivante, avec convergence normale (sur R) de la série de fonctions qui apparaît :
2n+1
+∞
+∞
X
1 X
n(2n + 1) cos2n+1 x
cos x
√
√
f (x) =
=
2n(2n
+
1)
2n
2 n=1
2
n=1
= cos x
2 cos x(6 cos2 x + cos4 x)
3(cos2 x)/2 + (cos4 x)/4
=
·
(1 − cos2 x/2)3
(2 − cos2 x)3
Puisque la série de fonctions définissant f converge normalement, donc uniformément, sur
Z
P
R, on peut calculer l’intégrale de f sur [0, π/2] par interversion des signes
et
. Il en
résulte d’une part que la série donnée dans l’énoncé converge (nous laissons le lecteur vérifier
directement ce point, par exemple à l’aide de la formule de Stirling, cf. le module II.8), et
d’autre part que la somme S de cette série est donnée par la formule (∗). Le calcul de S se
ramène ainsi au calcul d’une intégrale :
Z π/2
2 cos x(6 cos2 x + cos4 x)
S =
d x.
(2 − cos2 x)3
0
Le changement de variable t := sin x s’impose :
Z 1
Z 1 4
12(1 − t2 ) + 2(1 − t2 )2
2t − 16t2 + 14
S =
d
t
=
d t.
(1 + t2 )3
(1 + t2 )3
0
0
Effectuons le changement de variable t := tan u , de sorte que d t/(1 + t2 ) = d u et
(1 + t2 )−1 = cos2 u . Il vient :
Z π/4
S=
cos4 u 2 tan4 u − 16 tan2 u + 14 d u
0
=
Z
0
π/4
(2 sin4 u − 16 sin2 u cos2 u + 14 cos4 u) d u.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
222
La fonction u 7→ ϕ(u) à intégrer s’écrit :
ϕ(u) = 8(cos2 u − sin2 u)2 + 6(cos4 u − sin4 u)
= 8(cos2 u − sin2 u)2 + 6(cos2 u − sin2 u)
On en déduit S :
= 8 cos2 (2u) + 6 cos(2u) = 4 1 + cos(4u) + 6 cos(2u).
S =
h
sin(4u) + 3 sin(2u) + 4u
iu=π/4
u=0
= 3 + π.
II.2.42 Il est évident que A2 = 02 = B 2 (calcul direct, ou via les endomorphismes cano
1 0
A
niquement associés). Il en résulte que e = I2 + A =
. De façon analogue,
1 1
1 1
1 0
1 1
1 1
eB = I2 + B =
, puis eA eB =
=
.
0 1
1 1
0 1
1 2
0 1
La matrice C := A + B =
est la matrice, dans la base canonique, de l’endo1 0
morphisme (x, y) 7→ (y, x) de R2 , qui est la symétrie orthogonale par rapport à la première
bissectrice de R2 . Il en résulte que C 2 = I2 . On en déduit que C 2p = I2 et C 2p+1 = C pour
tout p ∈ N. Calculons alors eC :
+∞
+∞
+∞
X
X
X
1
1
1 n
C =
I2 +
C
n!
(2p)!
(2p
+
1)!
n=0
p=0
p=0
cosh(1) sinh(1)
1
= cosh(1)I2 + sinh(1)C =
6=
sinh(1) cosh(1)
1
eA+B =
1
2
= eA eB .
II.2.43 Posons T := Tr(A) et D := det(A). Supposons d’abord que la trace T soit nulle. Le
polynôme caractéristique de A est alors X 2 + D , donc A2 = −DI2 , en vertu du théorème de
Cayley-Hamilton. On en déduit que, pour tout p ∈ N, A2p = (−D)p I2 et A2p+1 = (−D)p A.
D’où :
+∞
+∞
+∞
X
X
X
1 n
(−D)p
(−D)p
eA =
A =
I2 +
A.
n!
(2p)!
(2p + 1)!
n=0
p=0
p=0
Distinguons trois cas, suivant le signe de D :
√ √ sin D
e = cos D I2 + √
A si D > 0,
D
√
√
sinh −D
A
√
e = cosh −D I2 +
A si D < 0,
−D
A
eA = I2 + A si D = 0.
Dans le cas général, soit ∆ le discriminant du polynôme caractéristique χA de A. Ainsi
χA = X 2 − (a + d)X + (ad − bc), d’où ∆ = (a + d)2 − 4(ad − bc) = T 2 − 4 det A.
Posons ensuite B := A − (T /2)I2 , de sorte que Tr(B) = 0 et A = B + (T /2)I2 . Puisque
c Dunod 2014
II.2 : Suites et séries de fonctions
223
B et (T /2)I2 commutent, nous savons que eA = e(T /2)I2 eB = eT /2 eB . Mais Tr(B) = 0 ,
donc le cas particulier traité ci-dessus donne eB , en fonction de D := det(B). En fait, puisque
T = a + d, on a :
2
a − T /2
b
= T − 2(a + d)T + 4(ad − bc) = −∆ ·
D := c
d − T /2 4
4
D’où les formules générales suivantes :
"
√
√
#
!
√
T sinh ∆/2
2 sinh ∆/2
A
T /2
√
√
e = e
cosh ∆/2 −
I2 +
A
si ∆ > 0,
∆
∆
"
#
!
√
√
√
T sin −∆/2
2 sin −∆/2
A
T /2
√
√
e = e
cos −∆/2 −
I2 +
A
si ∆ < 0,
−∆
−∆
eA = eT /2 (1 − T /2)I2 + A si ∆ = 0.
Bien entendu, puisque ∆ est le discriminant du polynôme caractéristique de A, la matrice A
possède deux valeurs propres réelles distinctes lorsque ∆ > 0 , une valeur propre double réelle
lorsque ∆ = 0 et deux valeurs propres complexes non réelles conjuguées lorsque ∆ < 0 .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
224
Module II.3 : Intégration
II.3.1 Il suffit en fait de supposer que f est continue, avec f (x) 6 1 pour tout x ∈ [a, b] et
Z b
f = b − a.
a
On a
Z
b
f 6
a
Z
b
a
1 = b − a − (b − a) = 0 , donc
Z
b
a
(1 − f ) = 0 . Puisque 1 − f > 0 et que
la fonction 1 − f est continue, ceci implique 1 − f = 0 , donc f = 1 .
II.3.3 Soit f : [a, b] → R une fonction bornée. Montrons que l’on a la relation de Chasles pour
l’intégrale inférieure :
Z b
Z c
Z b
f.
f+
f=
∀ c, tel que : a < c < b,
∗ c
∗ a
∗ a
Z b
Z b
f=
sup
ψ,
On a
ψ6f,ψ∈E([a,b]) a
∗ a
A tout couple (ψ1 , ψ2 ) ∈ E([a, c]) × E([c, b]) on associe une fonction ψ ∈ E([a, b]) définie
par :
(
ψ1 (x), si x ∈ [a, c[
ψ : x 7→
.
ψ2 (x), si x ∈ [c, b]
Z b
Z c
Z b
On a
ψ=
ψ1 +
ψ2 , d’où :
a
a
Z
∗
c
b
f>
sup
ψ1 6f,ψ1 ∈E([a,c])
a
Z
c
ψ1 +
sup
ψ2 6f,ψ2 ∈E([c,b])
a
Z
b
ψ2 =
c
Z
∗
a
c
f+
Z
∗
b
f.
c
Montrons l’inégalité opposée. À ψ ∈ E([a, b]) on associe ses restrictions ψ1 := ψ|[a,c] et
ψ2 := ψ|[c,b] , ce sont des fonctions en escalier et l’on a :
Z
b
Z
Z
c
c
∗ a
Z b
ψ=
Z
a
c
ψ1 +
Z
c
b
ψ2 6
Z
∗
a
c
f+
Z
∗
b
f,
c
f.
f+
∗ c
∗ a
∗ a
On traiterait le cas des intégrales supérieures de façon similaire.
donc
f6
II.3.5 Le sous-ensemble U ⊂ [0, 1] contient ]0, 1[ ∩ Q , il est donc dense dans [0, 1]. Ainsi toute
fonction en escalier ϕ sur [0, 1] majorant 1U est minorée par 1 sauf éventuellement sur un
Z 1
Z∗ 1
ensemble fini de points et l’on a 1 6
ϕ, donc 1 6
1U . On a par ailleurs 1U 6 1 , donc
0
0
Z∗ 1
1U = 1 .
0
c Dunod 2014
II.3 : Intégration
225
Z
1
1U est la borne supérieure des longueurs
∗ 0
des ouverts élémentaires contenus dans U (un ensemble élémentaire contient un ouvert éléZ 1
X 1
1
1U 6 long U 6
mentaire de même longueur). On en déduit
= .
n+1
2
2
∗ 0
n∈N∗
Z∗ 1
Z 1
1U , la fonction 1U n’est pas R -intégrable sur [0, 1].
Puisque
1U 6=
0
∗ 0
D’après la proposition 25, l’intégrale inférieure
II.3.6
1. Pour tout n ∈ N, Fn est compact. La famille (Fn )n∈N est décroissante, donc K est
un compact non vide.
On a, pour tous n ∈ N et k ∈ [[1, 2n ]] , long(In,k ) < 1/2n . Si a ∈ K , la borne inférieure
des longueurs des In,k contenant a est donc nulle. Si J est un intervalle contenu dans
K et contenant a, il est contenu dans tous les In,k contenant a, il est donc de longueur
nulle, c’est-à-dire J = {a} . Donc K est d’intérieur vide.
S
2. On a U =
(Fn \ Fn+1 ). Cette réunion est disjointe et chaque Fn \ Fn+1 est une
n∈N
réunion finie d’intervalles ouverts. Pour tout n ∈ N on a long(Fn \ Fn+1 ) =
P 1
1
1
en déduit long U =
2n+2 = 2 , puis long K = 2 .
1
2n+2
. On
n∈N
Le compact K n’est pas négligeable (sinon sa longueur serait nulle). Par ailleurs, ce
compact K étant d’intérieur vide, il est égal à sa frontière. L’ensemble des points de
discontinuité de 1K n’est donc pas négligeable et 1K n’est pas R -intégrable.
3. Si K était dénombrable, il serait négligeable. Ce n’est pas le cas.
4. Soit V ⊂ [0, 1] un ouvert de longueur strictement plus grande que 1/2 . S’il ne rencontrait
pas K , il serait contenu dans U et l’on aurait 12 = long U > long V > 12 , d’où une
contradiction.
II.3.7 Si les An ne sont pas fermés on les « corrige un peu ». Soit ε > 0 , en « approchant par l’intérieur » chaque sous-intervalle maximal de longueur non nulle contenu dans
An par un segment, on obtient un sous-ensemble élémentaire compact Kn ⊂ An tel que
long Kn > long An − 2−n ε . Deux cas sont alors possibles :
a) Ou bien la suite (Kn )n∈N ∗ est décroissante et l’on est ramené au cas traité dans le cours :
il existe N ∈ N tel que, pour tout n > N , Kn = ∅ et, par suite, long Kn = 0 . On en
déduit que, pour tout n > N , long An 6 2−n ε 6 ε . Par suite lim long An = 0 .
n→+∞
b) Ou bien la suite (Kn )n∈N n’est pas décroissante et on la « corrige » pour qu’elle le devienne. On procède de la façon suivante. On note Ln := K1 ∩ . . . ∩ Kn ⊂ An . Les
Ln sont des sous-ensembles élémentaires compacts et la suite (Ln )n∈N ∗ est décroissante.
Admettons provisoirement le résultat suivant :
long Ln > long An − ε/2 − · · · − ε/2n .
(38)
On applique alors le résultat de a) à la suite (Ln )n∈N . Il existe N ∈ N tel que, pour tout
n > N , Ln = ∅ et, par suite, long Ln = 0 . Donc, d’après (38), pour tout n > N ,
long An 6 ε/2 + · · · + ε/2n < ε . Par suite lim long An = 0 .
n→+∞
Il reste à montrer (38). Nous allons utiliser une récurrence sur n.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
226
On a L1 = K1 , donc long L1 > long An − ε/2 .
Supposons (38) vraie pour n > 1 .
On a Ln+1 = Ln ∩ Kn+1 , donc Ln ∪ Kn+1 = (Ln \ Ln+1 ) ∪ (Kn+1 \ Ln+1 ) ∪ Ln+1 (la
réunion étant disjointe) et :
long Ln+1 + long(Ln ∪ Kn+1 ) = long Ln + long Kn+1
> long An − ε/2 − . . . − ε/2n + long An+1 − ε/2n+1 .
On a Kn+1 ⊂ An+1 ⊂ An et Ln
long An − long(Ln ∪ Kn+1 ) > 0 et :
⊂ An , donc Ln ∪ Kn+1
⊂ An , d’où
long Ln+1 > long An − long(Ln ∪ Kn+1 ) + long An+1 − ε/2 − . . . − ε/2n − ε/2n+1
> long An+1 − ε/2 − . . . − ε/2n − ε/2n+1 .
II.3.8 Supposons x > 0 .
Z
i) Posons I(x) :=
Z xb
θ(xt)dt, on a xI(x) =
θ(u)du . Puisque θ admet T pour péa
xa
Z α+T
Z T
riode, on sait que pour tout réel α,
θ(u)du =
θ(u)du . Soit nx := E(x b−a
T ),
α
0
Z T
Z xb
on a xI(x) = nx
θ(u)du +
θ(u)du . La fonction θ est intégrable sur [0, T ]
b
0
xa+nx T
et périodique, elle est donc bornée sur R, soit K := sup|θ(u)|. On a :
u∈R
Z
xb
xa+nx T
nx
x→+∞ x
D’autre part, lim
ii)
θ(u)du 6 T K et
=
b−a
T ,
1
lim
x→+∞ x
Z
xb
θ(u)du = 0.
xa+nx T
d’où le résultat.
On vérifie aisément le résultat lorsque f est en escalier sur [a, b], il suffit d’appliquer le
résultat de i) à chacun des intervalles où f est constante. Supposons f intégrable sur [a, b] ;
pour tout ε > 0 il existe deux fonctions en escalier ϕε : [a, b] 7→ C et ψε : [a, b] 7→ R+
telles que :
Z
∀t ∈ [a, b], |f (t) − ϕε (t)| 6 ψε (t), et
Posons
1
T
Z
T
θ(t)dt := M et ∆(x) :=
0
Z
a
∆(x) =
Z
a
b
b
ψε (t) 6 ε.
a
b
(θ(xt) − M )f (t)dt, on a :
(θ(xt) − M ) f (t) − ϕε (t) dt +
Z
b
a
(θ(xt)dt − M )ϕε (t)dt.
Z b
∀x > 0, (θ(xt) − M ) f (t) − ϕε (t) dt 6 (K + M )ε.
a
On sait :
lim
x→+∞
c Dunod 2014
Z
a
b
θ(xt)ϕε (t)dt = M
Z
b
ϕε (t)dt.
a
II.3 : Intégration
227
Z b
Il existe donc A > 0 tel que ∀x > A, (θ(xt)dt − M )ϕε (t)dt 6 ε, d’où le résultat.
a
iii)
On a :
1+2
n
X
cos kt =
k=1
+n
X
eikt =
k=−n
sin(n + 12 )t
e−int − ei(n+1)t
=
·
1 − eit
sin( 2t )
On peut appliquer les résultats de (ii) si f : t ∈ [0, π] →
Par suite
4π
t(t−2π)
sin( 2t )
et θ : u ∈ R → sin u.
Z π
+∞
X
1
2
=
−
t(t − 2π)dt = π 3 ,
2
k
3
0
k=1
d’où le résultat.
II.3.9 Soit u := (xk )k∈[[0,n]] une subdivision de [a, b]. Pour tout k ∈ [[0, n − 1]] :
Z xk+1
Z xk+1
f ′ (t)dt
donc
|f (xk+1 ) − f (xk )| 6
|f ′ (t)|dt.
f (xk+1 ) − f (xk ) =
xk
Par suite V (f, u) 6
Montrons V (f ) =
Z
Z
b
a
a
xk
b
|f ′ (t)|dt, ainsi f est variation bornée et V (f ) 6
Z
a
b
|f ′ (t)|dt.
|f ′ (t)|dt. Pour tout k ∈ [[0, n − 1]], il existe ck ∈ ]xk , xk+1 [ tel que
f (xk+1 )−f (xk ) = (xk+1 −xk )f ′ (ck ), ainsi V (f, u) =
n−1
P
(xk+1 −xk )|f ′ (ck )|, on reconnait
n
o
la somme de Riemann de |f | pour la subdivision pointée D := [xk , xk+1 ], ck
.
k∈[[0,n−1]]
Z b
Pour tout ε > 0 , il existe une subdivision pointée D telle que V (f, u) >
|f ′ (t)|dt − ε ,
k=0
a
d’où le résultat.
II.3.10 Nous avons vu (cf. (11)) que, pour tous f, g ∈ BV ([a, b] , E) et tout λ ∈ R on a
V (λf ) = |λ| V (f )
On en déduit :
et V (f + g) 6 V (f ) + V (g),
(39)
N (λf ) = |λ| N (f ) et N (f + g) 6 N (f ) + N (g),
ν(λf ) = |λ| ν(f ) et ν(f + g) 6 ν(f ) + ν(g).
Si ν(f ) = 0 , sup f (x) = 0 , donc f = 0 . ainsi ν est une norme sur BV ([a, b] , E).
x∈[a,b]
On a, pour tout x ∈ [a, b], f (x) − f (a) 6 f (x) − f (a) + f (b) − f (x) 6 V (f ), donc
f (x) 6 f (x) − f (a) + f (a) 6 V (f ) + f (a) et sup f (x) 6 V (f ) + f (a) .
x∈[a,b]
On en déduit :
V (f ) + f (a) 6 V (f ) + sup f (x) 6 2 V (f ) + f (a) ,
x∈[a,b]
soit : N (f ) 6 ν(f ) 6 2N (f ). Ainsi N est aussi une norme sur BV ([a, b] , E) et elle est
équivalente à ν .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
228
II.3.12 En utilisant le changement de variable : t = a+(b−a)u , on se ramène au cas a = 0, b = 1 .
On a alors :
Z 1
n−1
n−1 Z k+1 n
1 X k X
k Rn (f ) =
f (t)dt −
f
=
f (t) − f
dt
k
n
n
n
0
n
k=0
1
n
=
n−1
XZ 1
0
k=0
k=0
x + k
k −f
dx
n
n
f
(i) Pour tout k ∈ [[0, n − 1]], |f (t) − f ( nk )| 6 K(t − nk ), donc :
|
Z
k+1
n
k
n
Z k+1
n
k k
1
f (t) − f
(t − )dt = K 2 ,
dt| 6 K
k
n
n
2n
n
d’où le résultat.
(ii) Pour tout k ∈ [[0, n − 1]] ,
avec mk :=
x + k
k
x
− f( ) =
mk 6 f
n
n
n
f ′ (u) et Mk =
inf
k k+1
u∈[ n
, n ]
Z
sup
Z
x+k
n
k
n
1
f
n−1
1 X ′
f (ck ) et
2n
nRn (f ) =
k=0
iii)
Pour tout k ∈ [[0, n − 1]], f
m′k :=
inf
k k+1
t∈[ n
, n ]
x
n
f ′ (u).
k k+1
u∈[ n
, n ]
x + k
k − f ( ) dx, on a
n
n
0
1 ′
ck ∈ [ nk , k+1
]
tel
que
δ
=
f
(c
).
Ainsi :
n,k
k
n
2n
Posons δn,k =
f ′ (t)dt 6 Mk
x+k
n
f ′′ (t) et Mk′ =
m′k
x2
6
2n2
Z
mk
2n
6 δn,k 6
lim nRn (f ) =
n→+∞
− f ( nk )
sup
=
x ′ k
nf (n)+
f ′′ (t), on a :
Z
Il existe donc
1
(f (1) − f (0) .
2
x+k
n
k
n
Mk
2n .
(
x+k
− t)f ′′ (t)dt. Posons
n
k k+1
t∈[ n
, n ]
x+k
n
(
k
n
x+k
x2
− t)f ′′ (t)dt 6 Mk′ 2 ·
n
2n
Il existe donc dk ∈ [ nk , k+1
n ] tel que :
Z 1 Z
0
Z
(
k
n
x+k
1
− t)f ′′ (t)dt dx = 2 f ′′ (dk )
n
6n
x + k
k 1 ′ k
1
− f ( ) dx =
f ( ) + 2 f ′′ (dk ).
n
n
2n
n
6n
0
n−1
P 1 ′ k
1
′′
Ainsi nRn (f ) =
2n f ( n ) + 6n2 f (dk ). D’après la question (ii), on a
et
1
x+k
n
f
k=0
Rn (f ′ ) =
Z
0
c Dunod 2014
1
f′ −
n−1
X
k=0
1
1 ′ k
1 ′
f ( )=
f (1) − f ′ (0) + εn avec
n
n
2n
n
lim εn = 0,
n→+∞
II.3 : Intégration
par suite
229
n−1
P
k=0
1 ′ k
nf (n)
n−1
X
k=0
= f (1) − f (0) −
1
2n
f ′ (1) − f ′ (0) + n1 εn . De plus :
1 ′′
f (dk ) = f ′ (1) − f ′ (0) + δn avec
n
lim δn = 0.
n→+∞
En regroupant ces résultats, on obtient :
1
1 ′
1 ′
1
f (1) − f ′ (0) +
f (1) − f ′ (0) + o( )
nRn (f ) = f (1) − f (0) −
2
4n
6n
n
1
1
1
= f (1) − f (0) −
f ′ (1) − f ′ (0) + o( )·
2
12n
n
II.3.14
1. On raisonnera de façon similaire au cas de ℓ2 en montrant que les suites des « coordonnées » convergent.
2. a) Pour tout n ∈ N, ken k = 1 , donc la fonction kf k est :
(
0 si t ∈
/Q
kf k : t 7→
.
1 si t ∈ Q.
Cette fonction n’est pas R -intégrable (cf. l’exercice 2 de la page 556). Si f était
R -intégrable, kf k le serait (cf. la proposition 63 de la page 587) et l’on aboutirait à
une contradiction.
b) Soit n ∈ N. La fonction un ◦f est nulle en tout point de [0, 1] sauf au point rationnel
ϕ(n) où elle prend la valeur 1 . Elle est donc R -intégrable et son intégrale est nulle :
Z 1
un ◦ f = 0 .
0
n
o
c) Soit D = [ti , ti+1 ], ξi
une subdivision pointée de pas inférieur à δ de
i∈[[0,m−1]]
P
[0, 1]. Considérons la somme de Riemann SD (f ) :=
(ti+1 −ti )f (ξi ). Pour
i∈[[0,m−1]]
tout i ∈ [[0, m − 1]], on a f (ξi ) = 0 (si ξi ∈
/ Q ) ou f (ξi ) = eni , pour un ni ∈ N
convenable unique (si ξi ∈ Q ). De plus, si i 6= j , nj 6= nj , donc eni 6= enj . On en
déduit que les termes de la suite SD (f ) = (sn )n∈N ∈ ℓ∞ sont nuls ou de la forme
sn = ti+1 − ti (avec i tel que ni = n) et, par suite, que :
SD (f ) 6 sup (ti+1 − ti ) 6 δ.
i∈[[0,m−1]]
Soit ε > 0 , si 0 < δ 6 ε , on a, pour toute subdivision pointée D de pas inférieur
à δ , SD (f ) 6 ε . Ainsi les sommes de Riemann de f « tendent vers 0 quand le
pas de la subdivision tend vers 0 », bien que f ne soit pas R -intégrable.
II.3.15 On prolonge f en continuité en 0 en posant f (0) = 0 . Cette fonction est continue sur
[0, 1], donc réglée. La fonction g est monotone sur R, donc réglée.
On a g ◦ f (t) = 0 si t = 0 et g ◦ f (t) = sgn(t sin 1/t) si t 6= 0 . On considère les suites
1
1
tn := π/2+2nπ
et un := 3π/2+2nπ
. On a, pour tout n ∈ N, sin 1/tn = 1 et
n∈N
n∈N
sin 1/un = −1 , donc g ◦ f (tn ) = 1 et g ◦ f (un ) = −1 . On a lim tn = lim un = 0 , donc
n→∞
n→∞
g ◦ f n’a pas de limite à droite en 0 . Par suite elle n’est pas réglée.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
230
Z 1/e
1
dt, on obII.3.20 En faisant le changement de variables u := 1/t dans l’intégrale
λ | ln t|µ
t
0
Z +∞
Z +∞
1
1
tient
du
.
Nous
allons
étudier
l’intégrale
du , où ν := 2 − λ.
2−λ lnµ u
ν lnµ u
u
u
e
e
On note, pour u > e , f : u 7→ u−ν ln−µ u et g : u 7→ u
1.
On suppose ν > 1 ( λ < 1 ). On a
ν+1
2
f (u).
ν+1
2
> 1 et lim g(u) = 0 , donc f = o u−
ν+1
2
< 1 et
u→+∞
l’intégrale converge.
2.
On suppose ν < 1 ( λ > 1 ). On a
ν+1
2
et
lim g(u) = +∞. L’intégrale est donc
u→+∞
divergente.
3.
II.3.21
2.
On suppose ν = 1 ( λ = 1 ). On introduit la fonction F définie, pour u > e , par
Z u
1
F : u 7→
µ dv . en utilisant le changement de variables w = ln v , on obtient
e v ln v
Z ln u
dw
1
F (u) :=
ln1−µ u − 1 si µ 6= 1 et F (u) = ln(ln u) si
. Donc F (u) = 1−µ
µ
w
1
µ = 1 . Ainsi l’intégrale converge si, et seulement si, µ > 1 .
1. On suppose α > 1 . On a, pour tout t > 1 , |t−α cos t| 6 t−α et |t−α sin t| 6 t−α ,
les deux intégrales sont donc absolument convergentes.
On suppose 0 < α 6 1 . On a vu dans les exercices 19 de la page 621 et 22 de la page 623
que les deux intégrales sont convergentes. Montrons qu’elles ne sont pas absolument
convergentes.
Z +∞
En utilisant un changement de variables, on montre que l’intégrale
t−α cos 2t dt
1
Z +∞
−α
est convergente. Par ailleurs l’intégrale
t dt est divergente. En utilisant
1
cos2 t = 21 (1 + cos 2t) et sin2 t = 12 (1 − cos 2t), on en déduit que les intéZ +∞
Z +∞
grales
t−α cos2 t dt et
t−α sin2 t dt sont divergentes. On a, pour tout
1
1
Z +∞
2
2
t > 1 , |cos t| > cos t et |sin t| > sin t, donc les intégrales
t−α |cos t| dt et
1
Z +∞
t−α |sin t| dt sont divergentes.
1
3.
On suppose α 6 0 . Alors les deux intégrales sont divergentes. Nous allons le montrer
pour la seconde, la preuve pour la première est similaire.
On note, pour tout n ∈ N∗ :
Z (n+1)π
Z π
−α
n
un :=
t sin t dt = (−1)
(u + nπ)−α sin u du.
nπ
0
La fonction sin est positive sur [0, π], donc :
Z π
Z
−α
−α
|un | =
(u + nπ) sin u du > (nπ)
0
c Dunod 2014
0
π
sin u du = 2(nπ)−α .
II.3 : Intégration
231
Ceci montre que l’intégrale
Z
1
+∞
t−α |sin t| dt ne satisfait pas la condition de conver-
gence de Cauchy, elle est donc divergente.
II.3.22 Soient x ∈ R et a > 0 tel que t2 + x > 0 si t > a.
Soit A > a. Considérons :
3
3
Z A
Z A
t
t
dt
+ xt dt =
(t2 + x) cos
+ xt
cos
2
3
3
t +x
a
a
3
A
3
Z A
1
t
t
t
= 2
sin
+ xt
+2
sin
+
xt
dt.
2
2
t +x
3
3
a (t + x)
a
3
Z +∞
3
t
t
t
t
t
On a (t2 +x)2 sin 3 + xt 6 (t2 +x)2 , l’intégrale
sin
+ xt dt est
(t2 + x)2
3
a
3
donc convergente. Par ailleurs lim A21+x sin A3 + xA = 0 , on en déduit que l’intégrale
A→+∞
3
3
Z +∞
Z +∞
t
t
cos
+ xt dt converge. Par suite
cos
+ xt dt converge.
3
3
a
0
Z +∞ 3
cos t + xt dt ne converge pas.
Montrons que l’intégrale
3
0
Z A
3
cos t + xt dt et l’on utilise le changement de variables u := t3 + xt.
On considère
3
3
a
2
3
= t + x, la fonction t 7→ t3 + xt est donc strictement croissante sur [a, +∞[
Z A 3
Z A33 +xA
t
du
et l’on a
|cos u| 2
· On a, au voisinage de +∞,
cos 3 + xt dt = a3
t +x
a
3 +xa
On a
du
dt
3
t2 + x ∼ 32/3 u2 . Par suite, il existe b > a tel que t2 1+x > 12 32/31 u2 pour tout u > b3 + xb . On
3
Z A
Z A33 +xA
du
t
1 1
|cos u| 2/3 . Nous
en déduit, pour tout A > b ,
cos 3 + xt dt > 2 32/3 b3
u
+xb
b
Z +∞ 3
du
avons vu dans l’exercice précédent II.3.21 que l’intégrale
|cos u| 2/3 est divergente, il
u
1
Z +∞ 3
cos t + xt dt .
en est donc de même de
3
0
II.3.23 Les signes o et ∼ sont implicitement au voisinage de +∞.
|ln g| = o(ln x). On considère la fonction x 7→ x−ε /g(x) = e− ln g−ε ln x , on
a : lim − ln g − ε ln x = −∞, donc x−ε = o(g). On en déduit que l’intégrale
x→+∞
Z +∞
impropre
g(x)dx est divergente.
a
b) Puisque xg ′ (x) = o g(x) , on a g(x) + xg ′ (x) ∼ g(x).
c) Par intégration par parties on obtient :
Z x
Z x
g(t)dt = xg(x) − ag(a) −
tg ′ (t)dt,
1. a)
a
a
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
232
Z
x
g(t) + tg ′ (t) dt = xg(x) − ag(a). On en déduit, en utilisant
a
Z x
′
g(x) + xg (x) ∼ g(x), que
g(t)dt ∼ xg(x).
d’où
a
1
ln x
g (x)
g(x)
On pose, pour tout x > a > 1 , g(x) :=
2.
1
classe C . On a
la question 1.
′
g (x)
g(x)
=
1
− x ln
x
, donc
′
, c’est une fonction strictement positive, de
= o( x1 ) et l’on peut utiliser les résultats de
1. On définit une fonction f : [1, +∞[ → R par :
(
1/x2 si x ∈
/ N∗
f : x ∈ [1, +∞[ 7→
1 si x ∈ N∗
II.3.24
.
Z
+∞
1
est conver2
x
1
gente et, pour tout sous-segment I de [1, +∞[, I ∩ N∗ est fini, donc f est localement
Z
Z
Z +∞
Z +∞
1
1
.
Donc
f
est
convergente
et
est
égale
à
= 1.
intégrable et
f=
2
2
x
x
1
1
I
I
La fonction f n’admet pas de limite quand x → +∞. L’intégrale
On définit une fonction f : [1, +∞[ → R par :

1
1
n
∗

2 x − n + 2n si x ∈ n − 2n , n , n ∈ N , n > 1
f : x ∈ [1, +∞[ 7→ 2n n + 21n − x si x ∈ n, n + 21n , n ∈ N∗ , n > 1,


0 sinon.
On a, pour tout n ∈ N∗ , n > 1 , f n ± 21n = 0 et f (n) = 1 . Ainsi f est continue et,
Z n+ 21n
1
pour tout n ∈ N∗ , n > 1 :
f = n . On en déduit que f n’admet pas de limite
2
n− 21n
Z +∞
Z +∞
X 1
1
quand x → +∞ et que l’intégrale
f est convergente :
f=
= ·
n
2
2
1
1
2.
n>2
Z a
Z E(a)
Z a
x − E(x) − 21
x − E(x) − 12
x − E(x) − 12
II.3.25 Soit a > 1 ,
=
+
. On
x
x
x
1
1
E(a)
Z
Z a
a x − E(x) − 1 x − E(x) − 12
1
2
a , ainsi lim
= 0 . Soit n ∈ N∗ ,
6
a→+∞ E(a)
E(a)
x
2E(a)
x
Z n+1
x − E(x) − 21
considérons In :=
. On a :
x
1
Z n+1
n
n
X
E(x) X
=
k ln(k + 1) − ln k = −
ln k + n ln(n + 1)
x
1
k=1
et
Z
1
n+1
x−
x
c Dunod 2014
1
2
=n−
k=2
1
ln(n + 1). Ainsi :
2
1
en n!
In = n − (n + ) ln(n + 1) + ln n! = ln
1 .
n+
2
(n + 1) 2
II.3 : Intégration
233
D’après la formule de Stirling (qu’il faut rectifier dans l’énoncé) n! ∼
√
lim In = ln( 2π) − 1 .
√
2πn ( ne )n , et
n→+∞
II.3.26
i)
On a xn =
n
X
k=0
f (a + k) −
f (a + k) −
Z
Z
a+k+1
a+k
a+k+1
f (t)dt et
f (t)dt =
a+k
Z
a+k+1
a+k
t − (a + k + 1) f ′ (t)dt
(faire une intégration par parties).
Z a+k+1
Z a+k+1
On en déduit f (a + k) −
f (t)dt 6
|f ′ (t)|dt ; la suite (xn ) est donc
a+k
a+k
convergente.
Z +∞
P
f (t)dt converge la série
f (a + n) converge ; réciproquement si la série
ii) Si
a
Z a+n+1
P
f (a + n) converge alors la suite
f (t)dt converge. Soit x > a + 1 , poa
Z x
Z x
sons n := E(x − a − 1), on a f (t)dt 6 |f (a + n + 1)| +
|f ′ (t)|dt, par
a+n+1
a+n+1
Z x
Z +∞
suite lim
f (t)dt = 0 ,
f (t)dt est donc convergente.
x→+∞ a+n+1
a
P 1
iii) Posons un = n1s , si Re s = α on a |un | = n1α Si α > 1 , la serie
ns est absolument
n∈N∗
convergente. Si α < 0 , la série est divergente car un ne tend pas vers zéro. Supposons
0 < α 6 1 et s 6= 1 . Soit f : t ∈ [1, +∞[ → t−s = e−s ln t , f est de classe C 1 sur
Z +∞
|s|
s
; on a |f ′ (t)| = tα+1
,
|f ′ (t)|dt est donc convergente.
[1, +∞[ → et f ′ (t) = − ts+1
1
Z +∞
Z X
1
Étudions
f (t)dt. Soit X > 1,
f (t)dt =
(X 1−s − 1), l’intégrale est donc
1−s
1
1
P 1
divergente, de même que la série
ns .
n∈N∗
II.3.27
i)
Soit x
lim
e−t −e−xt
t
t→0
−t
−xt
1 , l’application t ∈ ]0, +∞[→ e −e
est continue et
t
Z +∞
= x − 1 l’intégrale
f (x, t) dt est donc convergente.
>
0
−xt
Pour tous (x, t) ∈ [1, +∞[×]0, +∞[, on a ∂f
< e−t , l’intégrale
∂x (x, t) = e
Z +∞
e−t dt converge. D’après le théorème 129 de la page 644 la fonction F est de classe
0
Z +∞
1
1
′
C sur [1, +∞[ et F (x) =
e−xt dt = ·, par suite F (x) = ln x + F (1) = ln x.
x
0
Z +∞ −at
e
− e−bt
iii) Il suffit de faire le changement de variable u := at dans l’intégrale
dt
t
0
Z +∞ −u
b
e − e− a u
pour se ramener à
du .
u
0
ii)
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
234
II.3.28 Pour tout t ∈ ]0, 1[,
+∞
X
ln(1 − t)
tn
=−
·
t
n+1
n=0
tn
ln t. On a :
n+1
Z 1
Z 1 n
tn+1
1
t
1
tn ln tdt =
ln t 0 −
dt = −
n
+
1
n
+
1
(n
+
1)2
0
0
Pour tout n ∈ N, posons un :=
Z
et
1
0
un = −
1
·
(n + 1)3
D’après la proposition 124 de la page 638, I est convergente et I = ζ(3).
II.3.29
En faisant le changement de variable t = xu on a :
Z x1
Z 1
Z
1
1
(1 + uα )− α du =
(1 + uα )− α du +
f (x) =
i)
0
0
1
α −α
ii)
1
x
1
(1 + uα )− α du.
1
−1
Au voisinage de +∞, (1 + u )
∼ u on a donc f (x) ∼0 − ln x (voir la partie 7.3).
On peut écrire :
Z x1 Z 1
1
1
1
f (x) + ln x =
(1 + uα )− α du +
(1 + uα )− α −
du.
u
0
1
Z x1 1
1
(1 + uα )− α −
du, en faisant le changement de variable v = u1
Posons g(x) :=
u
1
on a :
Z x 1
1
g(x) = −
(1 + v α )− α − 1 dv.
1 v
1
La fonction v ∈ ]0, +∞[ → v1 (1 + v α )− α − 1 admet au voisinage de 0 un développen
P
ment limité à tout ordre n, soit
ak v αk−1 + o v (n+1)α−2) un tel développement, on
Z
k=1
n
X
1
1
1
a
(1 + v α )− α − 1 dv =
ak xαk + o(x(n+1)α−1 ).
v
αk
0
k=1
Z 1 n
X
1
1
1
Par suite g(x) =
(1 + v α )− α − 1 dv −
ak xαk + o(x(n+1)α−1 ).
αk
0 v
x
k=1
Si α = 3 , on a :
et :
1
1
v2
2
14
(1 + v 3 )− 3 − 1 = − + v 5 − v 8 + o(v 10) )
v
3
9
81
f (x) + ln x = C +
avec :
C :=
Z
0
c Dunod 2014
1
1
x3
x6
14 x9
−
+ 3 + o(x11 )
9
27
9
(1 + t3 )− 3 dt +
Z
0
1
1
1
(1 + t3 )− 3 − 1 dt.
t
II.3 : Intégration
235
−(t2 +i)x2 1
i) Pour tous x ∈ R et t ∈ [0, +∞[ on a e t2 +i 6 √1+t
, on sait que
4
Z +∞
1
√
dt est convergente, d’où le résultat.
1 + t4
0
ii) Montrons que F est continue sur R. On applique le théorème 126 de la page 642
−(t2 +i)x2 1
et la convergence de l’intégrale
en utilisant la majoration e t2 +i 6 √1+t
4
Z +∞
1
√
dt.
1 + t4
0
Pour tous x ∈ R et t ∈ [0, +∞[, on a :
−(t2 +i)x2 ∂ e t2 +i
2
2
= −2xe−(t +i)x .
∂x
II.3.30
Montrons d’abord que la fonction F est de classe C 1 sur R∗ . La fonction F étant paire,
2
il suffit de traiter le cas x > 0 . Si 0 < a 6 x 6 b, |xe−(t
2 2
−t a
+i)x2
2 2
| 6 be−t
a
. La fonction
t ∈ [0, +∞[ →
7 be
est intégrable sur [0, +∞[, donc, d’après le théorème 129 de la
page 644, F est de classe C 1 sur [a, b]. On en déduit que F est de classe C 1 sur R∗ et
Z +∞
2
2
′
que, pour tout x 6= 0 , F (x) = −2x
e−(t +i)x dt. Si x 6= 0 , on peut effectuer le
0
changement de variable u = tx, on en déduit :
Z +∞
√
2
2
′
−ix2
e−u du = − πe−ix .
F (x) = −2e
0
√
Montrons, pour finir, que F est dérivable en 0 , de dérivée égale à − π . Pour tout x 6= 0 ,
la fonction F est continue sur [0, x] et dérivable sur ]0, x[. Donc, d’après le théorème des
√
2
(0)
accroissements finis, il existe ξx ∈ ]0, x[ tel que F (x)−F
= − πe−iξx . On en déduit
x
√
(0)
= − π . Par suite F est de classe C 1 sur R.
F ′ (0) = lim F (x)−F
x
x→0,x6=0
Z x
√ −iu2
iii) Soit x > 0 . On a, pour tout x > 0 , F (x) − F (0) = −
πe
du .
0
Montrons que lim F (x) = 0 .
x→+∞
Z +∞
Z +∞
2 2
1 1√
−t2 x2
On a |F (x)| 6
e
dt et, ∀x 6= 0,
e−t x dt =
π , d’où le résultat.
x2
0
Z 0+∞
Z +∞
√
2
1
On en déduit :
du = F (0) = π
e−iu du . On a :
2+i
u
0
0
Z +∞
Z +∞ 2
Z +∞
1
u −i
u2
du
=
du
=
(1
−
i)
du,
u2 + i
1 + u4
1 + u4
0
0
0
Z +∞
Z +∞
u2
1
car
du =
du .
4
1
+
u
1
+
u4
0
0
Z +∞ 2
Z +∞
u +1
u2
Calculons
du
=
2(
)du . On a :
1 + u4
1 + u4
0
0
u2 + 1
1
1
1
√
√
=
+
;
1 + u4
2 1 + u2 − 2u 1 + u2 + 2u
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
236
par suite :
Z +∞ 2
Z
Z
u +1
1 +∞
1 +∞
1
1
1 √
√ du =
du =
du = π 2,
1
1
4
2
2
√
1+u
2 −∞ 1 + u + 2u
2 −∞ (u +
2
) +2
0
2
d’où le résultat.
II.3.31
1. Si long(X) = 0 il suffit de prendre pour K un ensemble réduit à un point. Sinon il suffit de traiter le cas où X est une réunion finie d’intervalles ouverts disjoints :
S
X :=
Ii . Il existe des intervalles fermés Ki ⊂ Ii ( i ∈ [[1, m]]) tels que
i∈[[1,m]]
long Ki > long Ii − ε/m et, en posant K :=
2.
S
i∈[[1,m]]
Ki , on a long K > long X − ε .
La suite (αn )n∈N∗ est évidemment décroissante. Nous allons raisonner par l’absurde, si
elle ne tendait pas vers 0 il existerait δ > 0 tel que αn > δ pour tout n ∈ N. Supposons
qu’il en soit ainsi.
Pour tout n ∈ N on choisit (en utilisant 1.) un sous-ensemble
T élémentaire fermé
n
Xn ⊂ An tel que long Xn > αn − δ/2 et l’on pose Hn :=
Xi ⊂ An .
i∈[[1,n]]
La suite de fermés (Hn )n∈N∗ de [a, b] est décroissante. Ces fermés sont compacts, si
l’on montre que chacun est non vide nous aboutirons à une contradiction puisque ceci
T
T
T
T
implique
Hn 6= ∅ et, par suite,
An 6= ∅ puisque
Hn ⊂
An .
n∈N∗
n∈N∗
n∈N∗
n∈N∗
Montrons que chaque Hn est non vide, ce qui terminera la preuve. Nous allons le faire
en trois étapes.
a) Soit X ⊂ An \ Xn un sous-ensemble élémentaire. Montrons que long X < δ/2n .
Le sous-ensemble X ∪ Xn est élémentaire et contenu dans An , on a donc :
long X + long Xn = long(X ∪ Xn ) 6 αn
et, en utilisant long Xn > αn − δ/2n :
long X − δ/2n + αn < long X + long Xn 6 αn
et
long X < δ/2n
b) Soit Y ⊂ An \ Hn un sous-ensemble élémentaire. Montrons que long Y < δ .
On écrit Y comme réunion de sous-ensembles élémentaires :
Y = (Y \ X1 ) ∪ (Y \ X2 ) ∪ . . . ∪ (Y \ Xn ).
P
On en déduit long Y 6
long(Y \ Xi ). Puisque, pour tout i ∈ [[1, n]],
i∈[[1,n]]
Y \ Xi ⊂ Ai \ Xi est un sous-ensemble élémentaire, on a, en utilisant a),
long(Y \ Xi ) < δ/2i , d’où long Y < δ .
c) Puisque, d’après l’hypothèse faite plus haut, αn > δ , il existe un sous-ensemble
élémentaire Z ⊂ An tel que long Z > δ . Si Hn était vide, l’on aurait
Z ⊂ An = An \ Hn , d’où, d’après b), long Z < δ et une contradiction.
II.3.32
1. Soit ε > 0 . On définit des sous-ensembles {An }n∈N de [a, b] par
ε
An := {x ∈ [a, b] ∃k > n, fk (x) > 2(b−a)
} . La famille de parties {An }n∈N est déT
croissante et, puisque fn converge simplement vers 0 , on a
An = ∅ . En appliquant
n∈N
c Dunod 2014
II.3 : Intégration
237
le résultat de la question 2 de de l’exercice II.3.31, on montre qu’il existe N ∈ N tel que,
ε
pour tout n > N et tout sous-ensemble élémentaire X de An l’on ait long(X) 6 2K
.
Z b
Montrons que, pour tout n > N ,
fn 6 ε (ce qui terminera la preuve, ε > 0 étant ara
Z b
fn 6 ε , c’est-à-dire que,
bitraire). Puisque fn est intégrable, il suffit de montrer que
∗ a
Z b
pour toute fonction en escalier ψ telle que 0 6 ψ 6 fn , on a
ψ 6 ε.
a
Soit ψ une fonction en escalier telle que 0 6 ψ 6 fn . On définit
ε
X := {x ∈ [a, b] ψ(x) > 2(b−a)
} et Y := [a, b] \ X . Les sous-ensembles X et
ε
. Par suite :
Y sont élémentaires et l’on a X ⊂ An , donc long(X) 6 2K
Z b
Z b
Z b
Z b
Z b
ε
ψ=
ψ 1X +
ψ 1Y 6 K
1X +
a
a
a
a
a 2(b − a)
ε
ε ε
= K long(X) +
(b − a) 6 + = ε.
2(b − a)
2 2
2. On se place dans les hypothèses du théorème d’Arzela. Soit (fn )nN une suite de fonctions
R -intégrables sur [a, b] convergeant simplement vers une fonction f R -intégrable sur
[a, b]. On suppose qu’il existe K > 0 tel que |fn | 6 K pour tout n ∈ N. En remplaçant
fn par fn − f et K par une autre constante positive ( f est bornée), on peut supposer
que f = 0 . On obtient le résultat en appliquant celui de la question 1 aux fonctions f +
et f − .
II.3.33
1
1. La fonction g : t 7→
est continue donc localement intégrable sur [0, +∞[ et
1 + t2
Z +∞
π
dt
l’on a
= . Posons X := [0, +∞[, I = [0, +∞[ et soit f : X × I → R
2
1
+
t
2
0
la fonction définie par :
2
e−x(1+t )
·
1 + t2
Alors, f est continue sur X × I et pour tout (x, t) ∈ X × I , on a 0 6 f (x, t) 6 g(t).
Le théorème de continuité d’une fonction définie par une intégrale implique que F est
définie et continue sur X .
Z +∞ −xt2
Z +∞
e
1
π −x
−x
−x
On a F (x) = e
dt 6 e
dt =
e . Par suite
2
2
1
+
t
1
+
t
2
0
0
lim F (x) = 0 .
f (x, t) :=
x→+∞
2. Pour montrer que F est dérivable sur ]0, +∞[, observons que pour tout t ∈ I , la fonction
x 7→ f (x, t) est dérivable et :
2
∂f
(x, t) = −e−x(1+t ) .
∂x
Notons que pour tout r > 0 , on a :
∀x > r,
06−
∂f
(x, t) 6 h(t) avec
∂x
2
h(t) := e−r(1+t ) .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
238
La fonction h est continue donc localement intégrable sur I = [0, +∞[ et l’on a
Z +∞
Z
e−r +∞ −u2
h(t)dt = √
e
du < +∞. D’après le théorème de dérivation d’une
r 0
0
fonction définie par une intégrale, F est dérivable sur ]r, +∞[ pour tout r > 0 , donc sur
]0, +∞[, et :
Z +∞
Z +∞
Z
2
e−x +∞ −u2
∂f
(x, t) dt = −
e−x(1+t ) dt = − √
e
du.
F ′ (x) =
∂x
x 0
0
0
3.
La fonction F ′ est continue sur ]0, +∞[. Donc, pour tous 0 < a < b < +∞,
Z +∞
Z b
π
′
F (x) dx = F (b) − F (a). Par suite
F ′ (x) dx = − . Donc
2
a
0
Z
Z +∞ −x +∞
2
e
π
√ dx =
e−u du
· En utilisant le changement de variables
x
2
0
0
Z +∞
2
√
Z +∞
π
π
−u2
−u2
2
x = u , on en déduit
e
du = · Donc
e
du =
·
4
2
0
0
II.3.34 On prolonge par continuité en 0 la fonction t 7→ sint t en lui donnant la valeur 1 .
Z +∞
sin t
Nous avons vu que l’intégrale
dt est convergente. Par ailleurs, si x > 0 ,
t
0
Z +∞
sin t −tx
e
dt est évidemment (absolument) convergente. On en déduit que, pour tout
t
1
Z +∞
sin t −tx
x > 0,
e
dt est convergente et que la fonction f est bien définie.
t
0
Z +∞
sin t
La fonction F : y 7→ −
dt est de classe C 1 sur [0, +∞[ et est une primitive de
t
y
t 7→
sin t
t
.
Soit ε > 0 . Il existe A > 0 tel que, pour tout y > A, l’on ait F (y) 6 ε . On fixe A dans
toute la suite.
On suppose x > 0 . Soient A 6 α 6 β , on a la formule d’intégration par parties :
Z β
Z β
β
sin t −tx
e
dt = e−tx F (t) α + x
e−tx F (t) dt.
t
α
α
β
On a [e−tx F (t)]α 6 F (α) + F (β) 6 2ε et :
Z
Z β
Z +∞
β
−tx
e F (t) dt 6 εx
e−tx 6 εx
e−tx 6 ε.
x
α
α
0
Z
β sin t
Par suite, pour tout x > 0 , e−tx dt 6 3ε .
α t
Montrons que la fonction f est continue à droite en x = 0 . On a, pour tout x > 0 :
Z A
Z +∞
Z +∞
sin t
sin t −tx
−tx sin t
f (x) − f (0) =
1−e )
dt +
dt −
e
dt.
t
t
t
0
A
A
c Dunod 2014
II.3 : Intégration
239
Z +∞
sin t On a dt 6 ε , et, en choisissant α := A, et en faisant tendre β vers +∞ :
t
Z +∞ A
sin t −tx e
dt 6 3ε . Par ailleurs, |sin t/t| 6 1 sur [0, +∞], et, pour tout t ∈ [0, A],
t
A
Z
A
−tx sin t
−tx
−Ax
dt 6 A(1 − e−Ax ). En utilisant
−e
6 −e
, on a donc 1−e )
0
t
lim (1 − e−Ax ) = 0 ( A étant fixé), on en déduit qu’il existe η > 0 tel que, si 0 < x 6 η , on
−tx sin t
a
1−e )
dt 6 ε et, par suite |f (x) − f (0)| 6 5ε . Ainsi f est continue en 0 .
0
t
∂ sin t −tx
Montrons que f est dérivable (donc continue) sur ]0, +∞[. On a ∂x
= − sin t e−tx
t e
−tx
−tx
−tx
et |sin t e | 6 e
. Pour tout γ > 0 et tout x > γ , on a 0 < e
6 e−γx En appliquant le théorème de dérivation (théorème 129) on en déduit que f est dérivable et de dérivée
Z +∞
x 7→ −
sin t e−tx dt sur tout intervalle [γ, +∞[ ( γ > 0 ), donc sur ]0, +∞[.
x→0+
Z
A
0
On a :
Z +∞
Z
−
sin t e−tx dt = − Im
+∞
et(i−x) dt = Im
0
0
et(i−x)
x−i
+∞
0
= − Im
1
1
=−
.
x−i
1 + x2
Par suite, il existe C > 0 , tel que, pour tout x > 0 , f (x) = C − arctan x. On a, pour tout
Z +∞
1
x > 0 , |f (x)| 6
e−tx dt = . On en déduit lim f (x) = 0 et C = π/2 . Par suite
x→∞
x
0
f (0) = lim f (x) = π/2 .
x→0+
x−1
II.3.35 Pour tout x ∈ R, l’application t 7→ t1+t est positive et continue sur ]0, +∞[. Au voisiZ 1 x−1
x−1
t
nage de 0 , t1+t ∼ tx−1 , l’intégrale
dt converge donc si, et seulement si, 1 − x < 1 ,
0 1+t
Z 1 x−1
x−1
t
c’est-à-dire x > 0 . Au voisinage de +∞, t1+t ∼ tx−2 , l’intégrale
dt converge
0 1+t
donc si, et seulement si, 2 − x > 1 , c’est-à-dire 1 < x.
On note :
Z 1 x−1
Z +∞ x−1
t
t
g : x ∈ ]0, 1[ 7→
dt et h := x ∈ ]0, 1[ 7→
dt.
1
+
t
1
+t
0
1
La fonction f est définie sur ]0, 1[ et l’on a f = g + h. Prouvons que g et h sont de classe
C ∞ sur ]0, 1[, il en résultera que f est de classe C ∞ sur ]0, 1[.
Pour tout t > 0 , l’application x ∈ ]0, 1[ 7→
tx−1
1+t
est de classe C ∞ et, pour tout p ∈ N∗ :
x−1
∂ p tx−1
p t
=
(ln
t)
·
∂xp 1 + t
1+t
Soient 0 < a < b < 1 et x ∈ ]a, b[.
x−1
(i) Pour tous t ∈ ]0, 1] et p ∈ N∗ , on a |ln t|p t1+t 6 |ln t|p tx−1 6 |ln t|p ta−1 . D’après
Z 1
l’exercice II.3.20, l’intégrale
|ln t|p tx−1 dt converge. On en déduit, par récurrence sur
0
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
240
(ii)
p, en utilisant le théorème 129 de la page 644, que g est de classe C ∞ sur ]a, b[ et que,
Z 1
x−1
∂ pg
p t
pour tout p ∈ N,
(x)
=
(ln
t)
dt.
∂xp
1+t
0
x−1
Pour tous t ∈ [1, +∞[ et p ∈ N∗ , on a |ln t|p t1+t 6 |ln t|p tx−2 6 |ln t|p tb−2 . D’après
Z +∞
l’exercice II.3.20, l’intégrale
|ln t|p tx−2 dt converge. On en déduit, par récurrence
1
sur p, en utilisant le théorème 129, que h est de classe C ∞ sur ]a, b[ et que, pour tout
Z 1
∂ ph
tx−1
p ∈ N,
(x)
=
(ln t)p
dt.
p
∂x
1+t
0
Les choix de a et b étant arbitraires, sous la condition 0 < a < b < 1 , on en déduit que g
et h sont de classe C ∞ sur ]0, 1[.
II.3.36
1. On écrit U :=
S
Ii ou les Ii sont des intervalles ouverts de [a, b] et où la réunion
S
est disjointe. On pose Un :=
Ii et on considère la suite (1Un )n∈N . Cette suite est
i∈N
i∈[[0,n]]
uniformément majorée par 1 et elle converge simplement vers 1U . En effet :
–
–
si x ∈ U , il existe m ∈ N tel que x ∈ Im , donc, pour tout n > m, 1Un (x) = 1 ;
si x ∈
/ U , alors, pour tout n ∈ N, x ∈
/ Un et 1Un (x) = 0 .
De ( ⋆ ) on déduit alors que IU est T -intégrable sur [0, 1] et que :
Z 1
X
1U = lim 1Un = lim long Un =
long Ii = long U .
0
n→+∞
n→+∞
i∈N
Si K ⊂ [0, 1] est compact, U := [0, 1] \ K est ouvert dans [0, 1] et 1K = 1 − 1U . Donc
1K est intégrable. Si K est le compact de Smith-Cantor-Volterra, long U = 1/2 donc
Z 1
1K = 1/2 .
0
2.
Soient K est le compact de Smith-Cantor-Volterra. La fonction caractéristique 1K est
T -intégrable mais n’est pas R -intégrable ( ∂K = K n’est pas négligeable, sinon,
Z 1
d’après 1. appliqué aux ouverts contenant K , on aurait
1K = 0 6= 1/2 ).
0
3.
Dans les hypothèses du théorème d’Arzela la limite simple f est supposée R -intégrable.
Elle est donc T -intégrable et les deux intégrales coïncident, le résultat s’en déduit en
utilisant la propriété ( ⋆ ).
Il existe des théories T vérifiant ( ⋆ ), par exemple celles de Lebesgue et de HenstockKurzweil. Nous le montrerons dans le module Intégration du livre [L2-L3].
c Dunod 2014
II.4 : Séries de Fourier
241
Module II.4 : Séries de Fourier
II.4.1
1.
cn =
1
2π
Z
π
1
2π
(−1−in)t π
cosh(t)e−int dt =
−π
Z
π
e(1−in)t + e(−1−in)t dt
−π
1 e(1−in)t
e
+
4π 1 − in
−1 − in −π
π
n
−π
(−1)
e −e
e−π − eπ
(−1)n sinh(π)
+
=
.
=
4π
1 − in
−1 − in
π(1 + n2 )
=
De plus, an = cn + c−n = 2cn et bn = 0 car f est paire.
Z π
Z π
1
π2
2 −int
2. On a cn =
t e
dt et donc, c0 =
t2 dt =
. Si n 6= 0 , on fait des
2π −π
3
−π
intégrations par parties :
π
Z π
1 2 e−int
1
e−int
cn =
t
−
2t
dt
2π
−in −π 2π −π −in
π
Z π
e−int
1
e−int
1
=0−
2t
+
2
dt
2π
(−in)2 −π 2π −π (−in)2
−iπnt π
1 (−1)n 4π
1
e
2
=
= (−1)n 2 + 0.
+
2
2
3
2π
n
2π (−in) −π
n
De plus, an = cn + c−n = 2cn et bn = 0 car f est paire.
3. On a an = 0 car f est impaire. De plus
bn =
2
2
Z
1
f (t) sin(πnt) dt = 2
−1
Z
0
1
t(1 − t) sin(πnt) dt
1
Z 1
− cos πnt
cos πnt
+2
(1 − 2t)
= 2 t(1 − t) ·
dt
πn
πn
0
0
1
Z 1
sin πnt
sin πnt
= 0 + 2 (1 − 2t) ·
−
2
(−2) ·
dt
(πn)2 0
(πn)2
0
1
cos πnt
−4
=0−4
=
(−1)n − 1 .
(πn)3 0
(πn)3
8
si n est impair. Etant donné que
(πn)3
−ibn
−4i
=
, on voit que cn = 0 si n est pair et cn =
si n est
2
(πn)3
Par conséquent, bn = 0 si n est pair et bn =
an − ibn
2
impair.
cn =
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
242
4.
La fonction est périodique de période 1. On a
Z 1
Z 1 iπt
e − e−iπt −2iπnt
−2πint
cn =
sin πte
dt =
e
dt
2i
0
0
1
1 eiπ(1−2n)t
eiπ(−1−2n)t
1
−1 − 1
−1 − 1
=
−
=
−
2i iπ(1 − 2n) iπ(−1 − 2n) 0
2i iπ(1 − 2n) iπ(−1 − 2n)
=
2
.
π(1 − 4n2 )
De plus, an = cn + c−n = 2cn et bn = 0 car f est paire.
5.
La fonction est périodique de période 2π . On a
Z π/2
Z π/2
2
1
an =
cos t cos nt dt =
cos(n − 1)t + cos(n + 1)t dt
2π −π/2
2π −π/2
π/2
1 sin(n − 1)t sin(n + 1)t
=
+
= 0 si n est impair.
2π
n−1
n+1
−π/2
Si n = 2k , alors
sin(n − 1)π/2
sin(n + 1)π/2
1
2
+2
an =
2π
n−1
n+1
1 −(−1)k
(−1)k
−2 · (−1)k
=
+
=
.
π
n−1
n+1
π(n2 − 1)
On fait le changement de variable t = u + T /2 :
Z
Z
1 T
2π · 2pt
1 T /2
T
2π · 2pu
a2p (f ) =
f (t) cos
dt =
f u+
cos
+ 2pπ du
T 0
T
T −T /2
2
T
Z
1 T /2
2π2pu
=
−f (u) · cos
du = −a2p (f ).
T −T /2
T
II.4.2
1.
De même,
b2p (f ) =
2.
1
T
Z
T
f (t) sin
0
2π · 2pt
T
T
2π · 2pu
u+
sin
+ 2pπ du
2
T
−T /2
Z T /2
1
2π2pu
=
−f (u) · sin
du = −b2p (f ).
T −T /2
T
dt =
1
T
Z
T /2
f
On fait le changement de variable t = T /2 − u :
Z
1 3T /4
2π(2p + 1)t
a2p+1 (f ) =
f (t) cos
dt
T −T /4
T
Z
T
2π(2p + 1)u
1 −T /4
=
f
− u cos (2p + 1)π −
(−du)
T 3T /4
2
T
Z
1 3T /4
2π2pu
=
f (u) · − cos
du = −a2p+1 (f ).
T T /4
T
c Dunod 2014
II.4 : Séries de Fourier
243
De même,
II.4.3 On a
3
sin (x) =
b2p (f ) =
1
T
=
1
T
=
1
T
eix − e−ix
2i
2π · 2pt
dt
T
−T /4
Z −T /4 T
2π(2p + 1)u
f
− u sin 2pπ −
(−du)
2
T
3T /4
Z 3T /4
2π2pu
f (u) · − sin
du = −b2p (f ).
T
T /4
Z
3
3T /4
f (t) sin
=
=
II.4.4
e3ix − 3e2ix e−ix + 3eix e−2ix + e−3ix
−8i
1 e3ix − e−3ix
3 eix − e−ix
1
3
+
= − sin(3x) + sin(x).
4
2i
4
2i
4
4
P
1. Pour tout x ∈ R, on a |einx /n3 | 6 1/n3 et la série
1/n3 converge. Par conséquent, la série de fonction est normalement convergente. La somme est donc continue.
P inx 2
2. La série des dérivées
ie /n est également normalement convergente étant donné
X einx
P
que la série
1/n2 converge. Par conséquent, f est de classe C 1 et f ′ (x) =
i 2 .
n
n>1
3. La série de fonctions étant normalement convergente, on peut échanger série et intégrale.
On a donc cn (f ) = 0 si n 6 0 et cn (f ) = 1/n3 si n > 1 .
II.4.5
1. Pour tout t ∈ R, on a 1 − 2r cos t + r2 > 1 − 2r + r2 = (1 − r)2 > 0 . Par conséquent,
le dénominateur ne s’annule pas et la fonction f est de classe C ∞ sur R. Ses coefficients
de Fourier sont donc à décroissance rapide : cn (f ) = o(1/nα ) pour tout α > 1 . La série
de Fourier est donc normalement convergente.
2. La fonction f est une fonction paire. Donc, bn (f ) = 0 pour tout n > 1 . De plus,
1 = (1 − 2r cos t + r2 ) · f (t)
= (1 − 2r cos t + r2 )
X
a0 X
+
(1 + r2 )an cos(nt) −
2ran cos(t) cos(nt)
2
n>1
n>1
a0
= (1 − 2r cos t + r2 )
2
X
X
X
2
+
(1 + r )an cos(nt) −
ran cos (n − 1)t −
ran cos (n + 1)t
n>1
n>1
n>1
a0
= (1 − 2r cos t + r2 )
2
X
X
X
2
+
(1 + r )an cos(nt) −
ran−1 cos(nt) −
ran+1 cos(nt)
n>1
n>2
n>0
X
a0
= (1 + r2 ) − ra1 +
(1 + r2 )an − ran+1 − ran−1 cos(nt).
2
n>1
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
244
Par conséquent, (1 + r2 )a0 /2 − ra1 = 1 et pour n > 1 ,
(1 + r2 )an − ran+1 − ran−1 = 0.
3.
Les racines de l’équation caractéristiques rx2 − (1 + r2 )x + r sont r et 1/r . Par conséβ
quent, il existe α et β tels que pour tout n > 0 , on ait an = αrn + n .
r
La suite an étant à décroissance rapide, on a forcément β = 0 . Pour calculer a0 , on fait
le changement de variable u = tan(t/2) et v = u(1 + r)/(1 − r) :
Z
Z
1 π
1
1 ∞
1
2 du
a0 =
dt =
π −π 1 − 2r cos t + r2
π −∞ 1 − 2r(1 − u2 )/(1 + u2) + r2 1 + u2
Z
Z ∞
1 ∞
2 du
2
dv
2
=
=
=
.
π −∞ (1 − r)2 + u2 (1 + r)2
π(1 − r2 ) −∞ 1 + v 2
1 − r2
2rn
.
1 − r2
Comme f est C ∞ , elle est somme de sa série de Fourier. On a donc, pour tout t ∈ R :
On a donc, pour tout n > 0 , an =
4.
(1 − r2 )f (t) = (1 − r2 )
5.
+∞
X
a0 X
+
(1 − r2 )an cos(nt) = 1 + 2
rn cos nt.
2
n=1
n>1
On a :
+∞
X
n
r cos nt = Re
n=1
= Re
+∞
X
n int
r e
n=1
reit
1 − reit
!
= Re
reit (1 − re−it )
(1 − reit )(1 − re−it )
=
r cos t − r2
.
1 − 2r cos t + r2
Par conséquent,
1+2
+∞
X
rn cos nt = 1 +
n=1
II.4.6
1.
2r cos t − 2r2
1 − r2
=
.
2
1 − 2r cos t + r
1 − 2r cos t + r2
D’après l’inégalité triangulaire, on a :
n
1X
1
|vn − ℓ| = (u1 + u2 + · · · + un ) − nℓ 6
|uk − ℓ|.
n
n
k=1
Pour n > p, on peut majorer uk − ℓ par max |uk − ℓ|. On a alors,
p<k6n
1
|vn − ℓ| 6
n
p
X
k=1
p
=
|uk − ℓ| +
p
X
k=n+1
max |uk − ℓ|
p<k6n
1X
n−p
|uk − ℓ| +
max |uk − ℓ|
n
n p<k6n
k=1
p
6
1X
|uk − ℓ| + max |uk − ℓ|.
p<k6n
n
k=1
c Dunod 2014
!
II.4 : Séries de Fourier
245
2. Pour tout ε > 0 , il existe un entier p tel que pour tout k > p, |uk − ℓ| 6 ε/2 . Quand
p
1X
n → +∞,
|uk − ℓ| tend vers 0 . Par conséquent, il existe un entier n0 tel que pour
n
k=1
tout n > n0 :
p
1X
ε
|uk − ℓ| 6 .
n
2
k=1
Posons n1 = max(p, n0 ). Alors, pour tout n > n1 , on a :
p
1X
ε ε
|uk − ℓ| + max |uk − ℓ| 6 + = ε.
p<k6n
n
2 2
|vn − ℓ| 6
k=1
II.4.7 D’après l’exercice II.4.1, les coefficients de Fourier an de la fonction f qui est 2π périodique et coïncide avec t2 sur [−π, π] vérifient :
c0 =
π2
3
et cn = (−1)n
2
pour n 6= 0.
n2
De plus, an = 2cn . La fonction étant continue et C 1 par morceaux sur R, le théorème de
Dirichlet implique que f est somme de sa série de Fourier, donc que pour t ∈ [−π, π] :
t2 =
+∞
X
π2
cos(nt)
+4
(−1)n
.
3
n2
n=1
La fonction f étant continue donc de carré intégrable, la formule de Parseval implique que
Z π
X
X 4
π4
1
π4
|cn |2 =
=
t4 dt =
+2
.
5
2π −π
9
n4
n∈Z
Donc,
n>1
X 1
1 π4
π4
π4
=
−
=
.
n4
8 5
9
90
n>1
On a alors
X 1
X 1
X
1
=
+
,
4
4
n
(2p)
(2p + 1)4
n>1
ce qui implique que
X
p>0
II.4.8
1. On a :
cn (h) =
1
T
Z
0
T
p>1
p>0
1
15 X 1
π4
=
=
·
4
4
(2p + 1)
16
n
96
f (t) · g(t)e−iωnt dt =
n>1
1
T
Z
0
T
f (t) · g(t) · en (t) dt = ( g · en | f ).
2. Les fonctions étant continues, on peut appliquer la version polarisée de la formule de
Parseval :
+∞
X
cn (h) = ( g · en | f ) =
ck (f ) · ck (g · en ).
k=−∞
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
246
Or,
ck (g · en ) =
II.4.9
1.
Z
1
T
T
g(t)eiωnt e−iωkt dt =
0
Pour n = 0 , on a c0 (f ) =
Z
cn (f ) =
1
te
−2πint
0
Z
T
g(t)e−iω(n−k)t dt = cn−k (g).
0
1
t dt = 1/2 . Pour n 6= 0 ,
0
Z
1
T
−2πint 1 Z 1 −2πint
e
e
1
dt = t
−
dt = −
.
−2πin 0
−2πin
2πin
|0
{z
}
=0
2.
La fonction f est C 1 par morceaux. Elle est continue sur ]0, 1[. D’après le théorème de
Dirichlet, pour tout x ∈ ]0, 1[, on a
X
1
1 X
1 X sin(2πnx)
−
(e2πinx − e−2πinx ) = −
.
f (x) =
cn (f )e2πinx = +
2
2πin
2
πn
n>1
n∈Z
3.
n>1
Pour x = 1/4 , on a
sin(2πnx) = sin(nπ/2) =
L’égalité précédente donne donc
1
1
1
= −
4
2 π
4.
(
0
(−1)k
si n est pair
si n = 2k + 1.
1 1
1 − + − ··· ,
3 5
d’où le résultat.
La formule de Parseval implique
Z 1
X 1
X
1
1
cn (f )2 =
+2
=
t2 dt = ·
4
4π 2 n2
3
0
n>1
Par conséquent,
n∈Z
X 1
1 1
π2
2
=
2π
−
=
·
2
n
3 4
6
n>1
II.4.10
1. On a
cn (f ) =
=
2.
1
2π
Z
π
eiat e−int dt =
−π
π
1 ei(a−n)t
2π i(a − n) −π
sin π(a − n)
1
ei(a−n)π − e−i(a−n)π
(−1)n sin(aπ)
=
=
·
π(a − n)
2i
π(a − n)
π(a − n)
La formule de Parseval implique
Z π
X sin(aπ) 2
1
=
|eiat |2 dt = 1.
π(a − n)
2π −π
n∈Z
On en déduit immédiatement que
c Dunod 2014
X
1
π2
=
·
2
(a − n)2
sin (πa)
n∈Z
II.4 : Séries de Fourier
II.4.11
247
1. On a (−1)n
+∞
X
cos(nt)
cos(nt)
2
=
O(1/n
).
Par
conséquent,
la
série
=
(−1)n 2
·
2
2
n +a
n + a2
n=1
est normalement convergente. La somme f (t) définie donc une fonction continue sur R.
2. On a
π
Z π
1
1 e(a−in)t
at −int
e e
dt =
cn =
2π −π
2π a − in −π
1
e(a−in)π − e−(a−in)π
(−1)n sinh(aπ)
(−1)n sinh(aπ)(a + in)
=
=
·
π(a − in)
2
π(a − in)
π(a2 + n2 )
Par conséquent,
=
an = cn + c−n = (−1)n
2a sinh(aπ)
π(n2 + a2 )
et bn = icn − ic−n = −(−1)n
2n sinh(aπ)
·
π(n2 + a2 )
cos(nt)
et observons que
n2 + a2
n sin(nt)
π
fn′ (t) = −(−1)n 2
=
bn sin(nt)
n + a2
2 sinh(aπ)
π
=
an cos(nt) + bn sin(nt) − afn (t).
2 sinh(aπ)
3. Posons fn (t) := (−1)n
Par consqéquent, la série des dérivées
+∞
X
n=1
de la fonction
t 7→
−(−1)n
n sin(nt)
est donc la série de Fourier
n2 + a2
π
πa0
π
1
eat − af (t) −
=
eat − af (t) − ·
2 sinh(aπ)
4 sinh(aπ)
2 sinh(aπ)
2a
Cette fonction étant continue sur ] − π, π[, la convergence est localement uniforme. Par
conséquent, f est dérivable sur ] − π, π[ et
π
1
f ′ (t) + af (t) =
eat − ·
2 sinh(aπ)
2a
4. Les solutions de l’équation homogène sont de la forme λe−at . La méthode de variation
π
1
de la constante implique que f (t) = λ(t)e−at avec λ′ (t)e−at =
eat − ·
2 sinh(aπ)
2a
On a donc
π
1
λ(t) =
e2at − 2 eat + C.
4a sinh(aπ)
2a
On choisit la constante C de sorte que f (−π)− = f (π), c’est -à-dire
π
1
π
1
e−aπ − 2 + Ceaπ =
eaπ − 2 + Ce−aπ .
4a sinh(aπ)
2a
4a sinh(aπ)
2a
π
π cosh(at)
1
et f (t) =
− 2·
4a sinh(aπ)
2a sinh(aπ) 2a
5. Pour finir, d’après le théorème de Dirichlet,
On a donc C =
+∞
X
(−1)n
π cosh(a · 0)
1
π
1
= f (0) =
− 2 =
− 2·
2 + a2
n
2a
sinh(aπ)
2a
2a
sinh(aπ)
2a
n=1
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
248
Module II.5 : Fonctions de plusieurs variables
II.5.1
La matrice jacobienne n’est pas carrée ( m 6= n), on ne peut donc pas l’inverser.
2xy x2
J =
, donc det J = 2x2 est nul en (0, 1) : application non localement
−2 0
inversible.
2x −1
J=
, donc det J = 1 ne s’annule jamais : application localement inversible
1
0
en tout point.
1.
2.
3.
(x + 1)yex xex
, donc det J = ye2x est si, et seulement si, y = 0 : application
yex
ex
localement inversible en tout point (x, y) tel que y 6= 0 .
II.5.3
J =
II.5.5
∂F
∂F
∂F
(x, y) = 3x2 − 3y et
(x, y) = 3y 2 − 3x, d’où
(0, 1) = −3 6= 0 et
∂x
∂y
∂x
∂F
(0, 1) = 3 6= 0 ; on peut appliquer le théorème des fonctions implicites. On a alors
∂y
∂F
∂F
(0, 1) +
(0, 1)ϕ′ (0) = 0 , d’où ϕ′ (0) = 1 .
∂x
∂y
−3
0
1 −2
et M0 :=
, on a bien G(M0 ) = N0 .
0 −3
2 −1
Pour calculer la différentielle en M0 , on isole la partie linéaire en H
dans G(M0 +H) = N0 +M0 H +HM0 +H 2 : c’est l’application linéaire H 7→ M0 H +HM0 .
Par calcul direct on constate que son noyau est nul ; elle est donc inversible et le théorème
d’inversion locale s’applique.
II.5.8 Notant N0 :=
II.5.10
1. Les dérivées partielles sont 3x2 + 3y et 3x, le seul point critique est (0, 0) 6∈ X ;
donc X est lisse en tout point.
2.
Le seul point critique est (0, 0). Si c 6= 0 , il n’est pas sur Yc qui est donc lisse. Si c = 0 ,
au voisinage de (0, 0) sur Yc on a x = ±y 3/2 , y > 0 (ce n’est pas localement un graphe)
et y = x2/3 (c’est un graphe mais pas de classe C 1 ) : donc Y0 n’est pas lisse en (0, 0).
3.
Les dérivées partielles sont x(y + 2) et
pas sur Z qui est donc lisse.
x2
2
+ y 2 − 4 . Les points critiques (0, ±2) ne sont
II.5.12 Son seul point critique est (0, 0, 0). En son voisinage, aucune des trois coordonnées n’est
fonction C 1 des deux autres : le cône n’est donc pas lisse en ce point.
II.5.13
1. (a) Le développement Q(x + h) = Q(x) + 2Φ(x, h) + Q(h) montre que la différentielle de Q en x est l’application linéaire h 7→ 2Φ(x, h). Cette dernière est de
rang 1 puisque la forme quadratique est non dégénérée.
c Dunod 2014
II.5 : Fonctions de plusieurs variables
249
(b) L’espace tangent en ce point a donc pour direction le noyau de cette application,
c’est-à-dire l’orthogonal de x pour Φ.
2. (a) L’argument de non-dégénérescence s’applique tel quel.
(b) Il s’agit d’examiner l’hypersurface d’équation x21 + · · · + x2p − y12 − · · · − yq2 = 0
au voisinage de l’origine. Aucine coordonnée ne s’y exprimant comme fonction C 1
des autres, cette hypersurface n’est pas lisse en ce point.
II.5.15
p
1. Observons d’abord que si (x, y, z) appartient à ϕ(R2 ), alors x2 + y 2 2 = cos r
p
2
x2 + y 2 − 2 + z 2 = 1 .
et z = sin r , ce qui implique que
p
2
Réciproquement, si
x2 + y 2 − 2
+ z 2 = 1 , alors il existe r ∈ R tel
p
x2 + y 2 − 2 = cos r et z = sin r , et comme x2 + y 2 = (2 + cos r)2 ,
que
il existe s ∈ R tel que x = (2 + cos r) cos s et y = (2 + cos r) sin s. Par
conséquent, ϕ(R2 ) est le sous-ensemble de R3 défini par l’équation F (x, y, z) = 0
2
p
x2 + y 2 − 2 + z 2 − 1 . Les dérivées partielles de F par rapport
avec F (x, y, z) =
à x, y , et z , sont
p
2x
x2 + y 2 − 2
∂F
p
=
,
∂x
x2 + y 2
p
2y x2 + y 2 − 2
∂F
p
=
∂y
x2 + y 2
et
∂F
= 2z.
∂z
La dérivée partielle par rapport à z ne s’annule que lorsque z = 0 . Dans ce
p
cas, x2 + y 2 − 2 = ±1 . Si l’on requiert que les dérivées partielles par rapport à x et y
s’annulent également, cela force x = y = 0 et donc, F (x, y, z) = F (0, 0, 0) = 3 6= 0 .
On voit donc que ϕ(R2 ) est une sous-variété lisse de R3 .
2. L’espace tangent est l’image de la différentielle du paramétrage, donc l’espace vectoriel
engendré par les dérivées partielles de ϕ, c’est-à-dire : (− sin r cos s, − sin r sin s, cos r)
et (−(2 + cos r) sin s, (2 + cos r) cos s, 0). Comme 2 + cos r 6= 0 , la deuxième peut être
remplacée par (− sin s, cos s, 0).
II.5.17
1. L’application étant polynomiale, il est clair qu’elle est de classe C ∞ . En développant F (M + H), on voit que sa différentielle au point M est l’application linéaire
H 7→ tM · H + tH · M .
2. Un élément du noyau est une matrice H telle que tM · H est antisymétrique. Le noyau
−1
est donc tM
· Ea , qui est de dimension n(n − 1)/2 . Le rang de la différentielle est
donc n(n + 1)/2 .
3. Par application du théorème des fonctions implicites, on en déduit que l’ensemble des
matrices orthogonales est une sous-variété lisse de dimension n(n − 1)/2 .
II.5.19 Nous emploierons les notations de Monge p, q, r, s, t (vues comme fonctions de x, y ).
Si l’on note a la valeur de la fonction en (x0 , y0 ) et et p0 , q0 , r0 , s0 , t0 les valeurs
de p, q, r, s, t en (x0 , y0 ), le polynôme de Taylor d’ordre 2 correspondant est donc
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
250
P (x, y) = a + p0 x + q0 y + 21 (r0 x2 + 2s0 xy + t0 y 2 ). Nous indiquons ci-dessous p, q, r, s, t,
les valeurs données dans l’indication s’en déduisent immédiatement.
1.
2.
p = cos(x + 2y), q = 2 cos(x + 2y), r = − sin(x + 2y), s = −2 sin(x + 2y),
t = −4 sin(x + 2y).
p=
−2x
(x2 +y 2 +1)2
−2y
(x2 +y 2 +1)2
,q=
,r=
6y 2 −2x2 −2
(x2 +y 2 +1)3
,s=
8xy
(x2 +y 2 +1)3
,t=
6x2 −2y 2 −2
(x2 +y 2 +1)3 ·
3.
2
+y 2
ex
2
+y
2
ex
2
+y 2
r = (4x2 − y 2 − 2) cos xy + 4xy sin xy,
2
+y 2
s = 3xy cos xy + (2x2 + 2y 2 − 1) sin xy,
ex
ex
ex
4.
2
p = −2x cos xy − y sin xy,
q = −2y cos xy − x sin xy,
+y 2
t = (4y 2 − x2 − 2) cos xy + 4xy sin xy.
Ici, nous utilisons un raccourci :
sin xy = xy + O((xy)3 )
cos xy = 1 − (xy)2 /2 + O((xy)4 ),
et
d’où le résultat en additionnant et en tronquant.
5.
2
Encore un raccourci : e(x−1) = 1+(x−1)2 +O((x−1)4) et cos y = 1−y 2/2+O(y 4),
d’où le résultat en multipliant et en tronquant.
II.5.21 Nous employons ici les notations de Monge r, s, t pour les valeurs des dérivées partielles
secondes au point critique considéré.
1.
Les dérivées partielles sont 2x et −2y , le seul point critique est donc (0, 0).
Comme (r, s, t) = (2, 0, −2), c’est un point selle.
2.
Les dérivées partielles sont 4x3 et −4y 3 , le seul point critique est donc (0, 0).
Comme (r, s, t) = (0, 0, 0), c’est un point critique dégénéré. Ce n’est ni un maximum
local (faire y = 0 , laisser varier x), ni un minimum local (faire x = 0 , laisser varier y ).
3.
Les dérivées partielles sont 3x2 − 3y et 3y 2 − 3x, les seuls points critiques sont
donc (0, 0) et (1, 1). Pour le premier, (r, s, t) = (0, 6, 0), c’est donc un point selle.
Pour le second, on pose x = 1 + u et y = 1 + v . En (u, v) = (0, 0), le forme initiale est
3(u2 − uv + v 2 ), forme quadratique définie positive, d’où un minimum local.
4.
Les
dérivées
−(2x2 +3y 2 )
partielles
2
sont
2
e−(2x
2
+3y 2 )
(1 − 2(x2 + y 2 )) × 2x
et
e
(1 − 3(x + y )) × 2y . Les points critiques sont donc (0, 0), les
√
√
deux points (0, ± 3/3) et (± 2/2, 0). Pour le premier, le polynôme de Taylor
d’ordre 2 est 1 + x2 + y 2 , on a un minimum local. Pour les deux suivants, posant
√
y = 3/3 + v (par exemple ; le cas de l’autre signe est similaire), le polynôme de
1
Taylor d’ordre 2 est 3e
(1 + x2 − 6v 2 ), on a un point selle. Pour les deux derniers,
√
posant x = 2/2 + u (par exemple ; le cas de l’autre signe est similaire), le polynôme
1
de Taylor d’ordre 2 est 2e
(1 − 4u2 − y 2 ), on a un maximum local.
c Dunod 2014
II.5 : Fonctions de plusieurs variables
251
II.5.23 Dans les trois premiers cas, dω = 0 (calcul direct) et l’ouvert est convexe, donc étoilé : la
forme est fermée, donc exacte. On précise :
1. C’est d(xey − y 2 ).
2. C’est d(xy + ln(xy)).
3. C’est d( x
2
+y 2
).
2
4. Ici, dω = −2 dx dy 6= 0 . La forme est non fermée et a fortiori non exacte.
II.5.25 Les relations de Cauchy-Riemann disent que, pour que f (x, y) soit une fonction C∂f
∂f
′
dérivable de x + iy , il faut, et il suffit, que ∂f
∂y = i ∂x . De plus, dans ce cas, f (z) = ∂x .
1. Écrivant f = P + iQ , la relation ci-dessus entraîne :
df =
2. La relation
∂f
∂y
∂f
∂f
∂f
∂d
∂d
dx +
dy =
(dx + i
y) = f ′ (z)(dx + i
y).
∂x
∂y
∂x
∂y
∂y
= i ∂f
∂x dit que cette forme est fermée. L’ouvert étant étoilé, elle est exacte.
3. Si F est telle que dF = f (z)(dx + i dy), d’après la question 1 on a F ′ = f .
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
252
Module II.6 : Fonctions analytiques
II.6.2
1.
La série de Taylor est
P
n>0
n
an (x − a)n , où an :=
f (n) (a)
·
n!
On a donc |an | 6 M r et le rayon de convergence est supérieur ou égal à r−1 .
2.
D’après la formule de Taylor-Lagrange, le reste RN (x) := f (x) −
NP
−1
n=0
an (x − a)n est
f (N ) (a)
(y − a)N pour un certain y compris entre a et x. Si |x − a| < ρ < r−1 ,
N!
on en déduit la majoration |RN (x)| < M (ρr)N , d’où RN (x) → 0 .
égal à
II.6.4
1.
Si f (z) =
P
bn z n = (z − α)
b0 = −αa0
P
an z n , alors :
et
∀n > 1 , bn = an−1 − αan .
Par réxurrence, ou par téléscopage, il s’ensuit immédiatement que
b0 + · · · + bn αn = −αn+1 an . (On peut également obtenir cette formule en développant
1
−1
f (z).) Puisque b0 + · · · + bn αn → f (α) 6= 0 ,
le produit de séries entières
α 1 − z/α
f (α)
on a an ∼ − n+1 , d’où la conclusion.
α
2.
Soit g(z) :=
1
P (z+z0 )
, de sorte qu’avec les notations de l’indication on est bien
dans les conditions de la question précédente. On prolonge f en z = α en posant
1
(c’est possible puisque la racine est simple) et l’on utilise le fait que
f (α) := P ′ (α
0)
1
1 (n)
an = n! P
(z0 ).
II.6.5 Il est immédiat que les fonctions y1 et y2 de l’indication sont bien des solutions de l’équation et que ce sont des fonctions entières. On peut de plus remarquer que w := y1 y2′ − y2 y1′ est
tel que :
w′ = y1 y2′′ − y2 y1′′ = −xy1 y2 + xy2 y1 = 0,
donc que w est constant égal à w(0) = 1 .
Pour en déduire quelque chose sur une solution arbitraire y , on résoud le système y = f1 y1 + f2 y2 , y ′ = f1 y1′ + f2 y2′ en les inconnues f1 , f2 ; c’est possible puisque
le déterminant est 1 . En dérivant la première relation, on trouve :
y ′ = f1′ y1 + f1 y1′ + f2′ y2 + f2 y2′ = f1′ y1 + f2′ y2 + y ′ =⇒ f1′ y1 + f2′ y2 = 0.
De même, en dérivant la deuxième relation :
y ′′ = f1 y1′′ + f2 y2′′ + f1′ y1′ + f2 y2′ =⇒ −xy = f1 (−xy1 ) + f2 (−xy2 ) + f1′ y1′ + f2 y2′
=⇒ f1′ y1′ + f2 y2′ = 0.
Du système f1′ y1 + f2′ y2 = f1′ y1′ + f2 y2′ = 0 on déduit (le déterminant w étant non nul)
que f1′ = f2′ = 0 . Donc y est combinaison linéaire à coefficients constants de y1 et y2 , donc
c’est une fonction entière.
c Dunod 2014
II.6 : Fonctions analytiques
253
P
II.6.8 Si f (z) =
an z n , on a par unicité du développement en série entière 2n an = an pour
tout n ∈ N donc an = 0 pour tout n ∈ N∗ .
II.6.9
1. Le sous-groupe mτ1 + nτ2 m, n ∈ Z de R engendré par τ1 et τ2 est un sousgroupe non trivial du groupe des périodes de R.
Si G admet un plus petit élément τ0 > 0 , on voit que tout élément τ du groupe est un
multiple entier de τ0 : en effet, on aurait sinon τ ∈ ]mτ0 , (m + 1)τ0 [ pour un m ∈ Z et
donc 0 < τ − mτ0 < τ0 ; comme τ − mτ0 ∈ G, cela contredirait la minimalité de τ0 . En
écrivant τ1 = m1 τ0 et τ2 = m2 τ0 , on en déduit que τ1 /τ2 = m1 /m2 ∈ Q , contredisant
l’hypothèse.
Puisque G n’admet pas de plus petit élément strictement positif, il existe une suite strictement décroissante (gn ) d’élements de G ∩ R∗+ de limite inf(G ∩ R∗+ ). La suite des
hn := gn − gn+1 ∈ G ∩ R∗+ a pour limite 0 et chaque hn est une période de f . En
appliquant le principe des zéros isolés à la fonction h 7→ f (x + h) − f (x), on en déduit
que f est constante. Le même argument que celui concernant τ0 ci-dessus montre qu’en
fait G est dense dans R.
2. Si τ1 /τ2 = m1 /m2 , posant τ0 := τ1 /m1 = τ2 /m2 , on voit que n’importe quelle
fonction de période τ0 satisfait l’hypothèse ; par exemple la fonction analytique non
constante e2iπx/τ0 .
1. Il est immédiat que la fonction f de l’énoncé est analytique sur U , que f (0) = 0
Z x
1
dt
′
et que f (z) =
· Pour x ∈ ]−1, 1[, on en déduit que f (x) =
et l’on
2
2
1−z
0 1−t
reconnaît argth.
2. Le raisonnement est le même à ceci près que la fonction g de l’énoncé vériZ x
1
dt
fie f ′ (z) =
,
donc,
pour
x
réel,
g(x)
=
et l’on reconnaît arctan.
2
2
1+z
0 1+t
II.6.13
II.6.15 Puisque F est impaire, sa réciproque G l’est aussi : G = w + aw3 + bw5 + O(w7 ).
Notant f et g les troncatures de degé 5 , on doit avoir g ◦f (z) ≡ z (mod z 7 ). Or f 3 ≡ z 3 −z 5
et f 5 ≡ z 5 , d’où les équations a − 1/3 = b − a + 1/5 = 0 , d’où a = 1/3 et b = 2/15 .
1
On peut également remarquer que F ′ =
, donc que F est le développement en série
1 + z2
de arctan, donc G celui de tan .
II.6.16
1. L’identité F n ◦ G = wn donne :
X
X
X
wn =
am,n Gm =
am,n
am,n bk,m wk ,
m>n
m>n
k>m
et l’on conclut par identification des coefficients.
Le système obtenu entraîne bn,n = 1/an,n = 1/an1 puis, pour k > n :
bk,n = −
1
an,n
k−1
X
bk,m ,
m=n
ce qui détermine uniquement les bk,n , k > n, par récurrence.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
254
2.
3.
4.
II.6.17
2.
(F n )′
n
est la dérivée de
F n−p (pour n > p), donc son résidu en 0
Fp
n−p
est nul. Le développement en série correspondant n’a donc pas de terme en 1/z , et
(F n )′
donc z p+1
= z(F n )′ H p n’a pas de terme en z p , ce qui donne exactement l’annuFp
lation demandée.
n
′
Si l’on pose b′k,n := ck−n,k , on voit que b′n,n = c0,n = a−n
1 = bn,n , puis que les bk,n
k
sont solutions du même système que les bk,n en vertu des relations obtenues à la question
précédente. Par unicité, on a b′k,n = bk,n .
La fonction
La conclusion en découle en prenant k = 1 .
1. La fonction f : x 7→ 1/(1 + x2 ) est rationnelle et ne s’annule pas sur I = R, donc
y admet un développement en série entière en tout point. Cependant elle a un maximum
local en 0 mais n’est pas constante.
En fait, sur un voisinage de 0 dans C on n’a plus un maximum local : prendre x = it, t
réel.
P
Le développement en série entière
(−1)n x2n n’est valide que pour |x| < 1 , donc
n>0
pas sur le plus grand intervalle centré en x0 et contenu dans I = R (à savoir l’intervalle
I lui même).
En fait, la présence de pôles de f en ±i empêche cette série de converger pour |x| > 1 .
II.6.19
2.
3.
II.6.21
2.
3.
1. Si f =
P
an z n , on a a0 = 0 et l’on peut prendre g :=
P
an+1 z n .
Si g est constante, f = a1 z donc |a1 | 6 1 et la conclusion s’ensuit ainsi que la suite de
l’exercice ; on supposera donc g non constante. Son maximum sur le compact D(0, r)
( 0 < r < 1 ) est donc pris sur la frontière (sinon g aurait un maximum local) donc majoré
par 1/r (puisque |f | 6 1 ). En faisant r → 1 , on obtient la conclusion.
On a f ′ (0) = g(0), d’où la première égalité en vertu de la question précédente ; la
deuxième est conséquence immédiate de cette même question.
1. Puisque |f | → 1 au bord du disque, ses zéros sont inclus dans un disque compact D(0, r), r < 1 , et ils y sont isolés donc en nombre fini.
Tous les facteurs sont analytiques et les dénominateurs ne s’annulent pas sur D(0, 1)
puisque |aj | < 1 . On trouve la limite voulue en remarquant que :
2
2
z − a 2
|z| + |a| − 2 Re(az)
1 − az = 1 + |z|2 |a|2 − 2 Re(az) ,
qui tend vers 1 lorsque |z| → 1 .
De manière générale, si ϕ est analytique et s’annule en a à l’ordre m, alors ϕ = (z−a)ψ
où ψ est analytique et (si m > 2 ) s’annule en a à l’ordre m − 1 . En itérant ce processus
on obtient f = g1 h1 , où g1 désigne le numérateur de g et h1 est analytique. La décomposition f = gh s’en déduit facilement. La limite de |h| au bord est 1 parce que c’est
vrai de f et de g .
c Dunod 2014
II.6 : Fonctions analytiques
255
4. En appliquant l’exercice 11 de la page 790, on voit alors que h est constante.
II.6.22 Tout élément z ∈ C s’écrit λ1 τ1 + λ2 τ2 avec λ1 , λ2 ∈ R, donc z = u + τ
avec u = u1 τ1 + u2 τ2 , u1 , u2 ∈ [0, 1] et τ = m1 τ1 + m2 τ2 , m1 , m2 ∈ Z (prendre
pour mi la partie entière de λi ). On a donc f (z) = f (u), où u est élément du com
pact {u1 τ1 + u2 τ2 0 6 u1 , u2 6 1} sur lequel la fonction continue f est bornée : f est
donc bornée sur C.
On peut donc appliquer le théorème de Liouville.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
256
Module II.7 : Équations différentielles
√
II.7.1 Si ẋ ne s’annule pas sur I := ]a, b[, elle y garde un signe constant et x/ E0 réalise un difféomorphisme strictement monotone de classe C 1 de I sur un intervalle ouvert J ⊂ ]−1, +1[.
√
Donc u := arcsin(x/ E0 ) réalise un difféomorphisme strictement monotone de classe C 1
√
de I sur un intervalle ouvert K ⊂ ]−π/2, +π/2[. En posant x = E0 sin u , on déduit de
l’équation différentielle de départ cos2 u(u̇2 − 1) = 0 . Puisque cos u ne s’annule pas et que u̇
est continue, la conclusion vient.
II.7.3 Puisque f et g sont proportionnelles sur chacune des demi-droites ouvertes R∗− et R∗+ , leur
wronskien y est nul ; puisque f ′ et g ′ s’annulent en 0 , le wronskien est aussi nul en 0 .
II.7.7 La constante y0 := −l/k est une solution bornée. Toute autre solution est de la forme
y0 + λekt , λ constante, et ne peut être bornée que si λ = 0 .
II.7.8 La méthode de variation des constantes appliquée à l’équation f + f ′ = g donne :
Z x
−x
f (x) = e
et g(t)dt + Ce−x ,
0
avec C constante. Soit ε > 0 et soit x0 > 0 tel que |g(x)| < ε dès que x > x0 . Alors, pour
Z x0
−x
x > x0 , on a |f (x)| < M e + ε , où l’on a posé M := |C| +
et |g(t)| dt. La conclusion
0
est alors facile.
II.7.9 Si par exemple b et d ont un zéro isolé commun, on n’est dans aucun des cas envisagés.
II.7.12 On calcule d’abord :
Z t
0
X (t) :=
A(s) ds =
0
0
t2 /2
1 −it/2
0
=
it
0
1
0
0
it
−1
1 −it/2
0
1
donc :
exp
Z
t
A(s) ds
0
0 t2 /2
1 −it/2
1 0
1
=
0
it
0
1
0 eit
0
it
1 it(1 − e )/2
=
.
0
eit
=
On vérifie ensuite que :
AX =
donc X (t) 6= R(t, 0).
c Dunod 2014
0
0
teit
ieit
6= X ′ =
0 i/2 + (−i)teit /2
,
0
ieit
−1
−it/2
1
II.7 : Équations différentielles
II.7.13 Soit B(t) := exp
257
Z
t
t0
A(s) ds . Alors B(t0 ) = In et B ′ = A. En écrivant B(t)
comme une limite de sommes de Riemann, donc de combinaisons linéaires de valeurs A(ti ),
on voit que B(t) commute avec toute valeur A(t′ ) (c’est en effet le cas de chaque A(ti )).
Donc BB ′ = B ′ B , donc (eB )′ = eB B ′ = B ′ eB . La conclusion est alors immédiate.
II.7.14 Puisque B ′ (t) est la limite des (B(t + h) − B(t))/h qui commutent toutes avec B(t), on
a bien BB ′ = B ′ B .
0 g
Si l’on prend B :=
, on voit que BB ′ = B ′ B équivaut à l’annulation du wronskien
f 0
de f et g ; mais la commutation de toutes les valeurs de B équivaut à la colinéarité de f et g ,
qui est une condition strictement plus forte (voir par exemple l’exercice II.7.3 de la page 876).
II.7.16 Si
Z
a
+∞
kA(t)k dt < ε , alors, pour t1 , t2 > a, on a :
kX (t2 ) − X (t1 )k 6 ε max kX k .
[a,+∞[
On en déduit d’abord que X est bornée, ensuite (avec le critère de Cauchy) qu’elle
admet une limite en +∞. Son déterminant W vérifie W ′ = Tr(A)W . Comme
Z +∞
Tr(A(s)) ds 6= 0 (parce que Tr(A) est absolument intégrable), la limite en +∞
exp
t0
de X est inversible.
II.7.17 Le champ de vecteurs associé est V (x, y) = (y, −x). La condition sur E(x, ẋ) = E(x, y)
est y∂E/∂x = −x∂E/∂y . Cela entraîne que E est constante sur toute courbe x2 − y 2 = c
(ce sont en fait les courbes intégrales) donc fonction de x2 − y 2 .
II.7.18 La solution générale est u = 1 + λex + µe−x .
On doit alors résoudre λ + µ = λe + µe−1 = −1 , ce qui donne λ = −1/(1 + e) et
µ = −e/(1 + e).
II.7.19 On cherche I = α cos(ωt + ϕ) + β sin(ωt + ϕ). Alors :
LI¨ + RI˙ + CI = (−αLω 2 + βRω + αC) cos(ωt + ϕ) + (−βLω 2 − αRω + βC) sin(ωt + ϕ),
(
α(C − Lω 2 ) + βR = a,
d’où le système
Si Lω 2 ± Riω + C 6= 0 , ce système ad−αRω + β(C − Lω 2 ) = 0.
met une unique solution (α, β) qui donne l’expression de I . Sinon, on doit avoir R = 0 et
ω 2 = −C/L et l’on retrouve le phénomène de résonance de l’exercice 6 de la page 814.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
258
II.7.22 On cherche u 6= 0 .
L’équation satisfaite par y est y ′′ + (p + 2u′ /u)y ′ + (q + (u′′ + pu′ )/u)y = 0 . On prend donc
pour u une primitive logarithmique de −p/2 et l’on a y ′′ + ry = 0 avec r = q − p2 /4 − p′ /2 .
2
II.7.26 L’« énergie » E := f 2 +
f′
2
a pour dérivée −f ′ q ′ /q 2 < 0 , donc décroît strictement,
q
d’où la conclusion.
II.7.27 En posant g(u) := f (eu ), on trouve l’équation g ′′ − g ′ + 5g/4 = 0 . Les racines de l’équation caractéristique sont 1/2 ± i, d’où des solutions de la forme g = eu/2 (a cos u + b sin u),
√
d’où f (t) = t(a cos ln t + b sin ln t). Lorsque t → 0+ , la fonction ln t prend toutes les
valeurs strictement négatives et en particulier une infinité de valeurs annulant le facteur trigonométrique.
II.7.28 En posant Y = eAt Z , on trouve la quadrature Z ′ = e−At B . La condition de périodicité
s’écrit Z(t) = eA Z(t + 1). On a :
Z t
Z t
Z 1
−As
−A
−As
Z(t) = Z0 +
e
B(s) ds =⇒ Z(t+1) = Z0 +e
e
B(s) ds+
e−As B(s) ds.
0
0
0
(On a pris en compte la périodicité de B .) La condition de périodicité s’écrit alors :
Z 1
(In − eA )Z0 = eA
e−As B(s) ds.
0
A
Puisque 1 n’est pas valeur propre de e , cette équation admet une unique solution Z0 .
Z t
II.7.32 Soient G(t) :=
B(s)g(s) ds. On a donc par hypothèse G′ = Bg 6 BA + BG
t0
Z t
Soit C(t) := exp
B(s) ds, de sorte que C ′ = BC et C(0) = 1 . On en déduit que
t0
Z t
C(t)
−1
′
−1
(C G) 6 C BA. Comme G(t0 ) = 0 , on a G(t) 6
A(s)B(s)
ds, puis
C(s)
t0
g 6 A + G (par hypothèse) qui donne la conclusion.
II.7.34 Dans le lemme de Gronwall, prendre ε1 = ε2 et δ > 0 arbitraire, puis faire tendre δ
vers 0 .
fi+1
=
Φ(fi ), où l’on a introduit l’application Φ telle que
Z t
Φ(f ) : t 7→ 1 +
f 2 (s) ds. On vérifie facilement que si 0 < f < g alors 0 < Φ(f ) < Φ(g).
II.7.35 On
a
0
1
est point fixe de Φ (calcul direct). Puisque f0 = 0 , f1 = 1 et
1−t
1
1
f0 < f1 <
, d’où par récurrence fi < fi+1 <
· On peut appliquer le théorème de
1−t
1−t
convergence monotone pour en déduire que la suite des fn tend vers f tel que Φ(f ) = f .
De plus, la fonction t 7→
c Dunod 2014
II.7 : Équations différentielles
259
II.7.37 Pour y − t > O , on a l’équation y ′ = y − t dont la solution générale est
fc (t) := 1 + t + Cet . Pour y − t < 0 , on a l’équation y ′ = −y + t, dont la solution générale est gD (t) := t − 1 + De−t . Les fc , C > 0 et les gD , D 6 0 , sont des solutions de
notre équations de départ définies sur R. Pour C < 0 et D > 0 , les fonctions fC et gD telles
que CD = −1 se recollent au point t0 défini par et0 = D = −1/C pour fournir une solution
globale (la solution est égale à fC à gauche et à gD à droite de t0 ).
II.7.42 Si la solution n’est pas monotone, quitte à changer x en −x (ainsi que la fonction ϕ),
on peut trouver t1 < t2 < t3 dans I tels que x(t1 ), x(t3 ) < x(t2 ). On peut même supposer
(grâce au théorème des valeurs intermédiaires) que x(t1 ) = x(t3 ). Soit a compris strictement
entre x(t1 ) = x(t3 ) et x(t2 ). Il existe donc t′ , t′′ tels que t1 < t′ < t2 < t′′ < t3 et
x(t′ ) = x(t′′ ) = a. On va démontrer que ẋ(t′ ) = ẋ(t′′ ) = 0 . Il sera alors facile (et cette tâche
sera laissée au lecteur) d’en déduire une contradiction avec le fait que x(t1 ), x(t3 ) < x(t2 ).
Parmi les t′ < t2 tels que x(t′ ) = a, il y en a un plus grand (continuité), notons le u′ . Puisqu’entre u′ et t2 la fonction x ne reprend pas la valeur a, elle ne prend que des valeurs strictement supérieurs à a. Donc ẋ(u′ ) > 0 . Mais ẋ(u′ ) = ϕ(x(u′ )) = ϕ(a) = ϕ(x(t′ )) = ẋ(t′ ).
On a donc démontré que ẋ(t′ ) > 0 . De même, en choisissant u′′ > t2 minimum tel que
x(u′′ ) = a, on déduit que ẋ(t′′ ) 6 0 . Mais ẋ(t′ ) = ẋ(t′′ ) = ϕ(a). On a donc bien démontré
que ẋ(t′ ) = ẋ(t′′ ) = 0 .
II.7.43 Soit M un majorant de |ρ̈| sur [a, +∞[. Soient t0 > a et α < 0 tels que ρ̇(t0 ) 6 α . Alors
pour t > a tel que |t − tO | 6 |α| /2M , on a |ρ̇(t) − ρ̇(t0 )| 6 |α| /2 , donc ρ̇(t) 6 α/2 < 0 .
Cela entraîne en particulier l’inégalité :
ρ (t + |α| /2M ) 6 ρ(t0 ) + α |α| /4M.
Comme ρ est décroissante positive, elle admet en +∞ une limite l > 0 . Pour tout ε > 0 , il
existe b > a tel que ρ(t) < l + ε pour t > b . Prenant en particulier le t0 ci-dessus > b , on
déduit de ce qui précède que |α|2 6 4M ε . C’est vrai en particulier en choisissant α := ρ̇(t0 ),
ce qui implique :
√
∀t0 > b , |ρ̇(t0 )| 6 4M ε.
1
II.7.44 La formule de Taylor à l’ordre 2 permet d’écrire U (x) = E0 + α(x−x0 )2 +o (x−x0 )2
2
avec α := U ′′ (x0 ) > 0 . Il existe donc une fonction u(x) de classe C 1 telle que
√
u(x) = α(x − x0 ) + o(x − x0 ) et que u2 = 2(U − E0 ). Pour x assez proche de x0 ,
la fonction u est un difféomorphisme de classe C 1 (et tel que u′ (x0 ) = 1 ), donc un changement de variable licite dans le calcul de l’intégrale :
Z +cE
u′ (t) dt
TE = 2
,
√ p
2 2
−cE cE α 1 − t /cE
r
2(E − E0 )
où cE :=
·. Par un nouveau changement de variable (linéaire) :
α
Z +1 ′
2
u (scE ) ds
√
TE = √
·
α −1
1 − s2
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
260
Puisque u′ (scE ) → 1 uniformément quand E → E0 , la conclusion s’ensuit. L’exercice 38 de
1
la page 869 correspond au cas de base où U (x) = E0 + α(x − x0 )2 .
2
√
II.7.50 Soit f := ρ2 − λ, qui ne s’annule pas (sinon on aurait la solution constante ρ = λ
comme conséquence de l’unicité dans le théorème de Cauchy-Lipschitz) donc garde un signe
constant. On a f˙ = −2f (f + λ). Si f > 0 , on en déduit que f décroît strictement, donc admet
une limite à l’infini pour laquelle la limite de f˙ est 0 (voir l’argument de l’exercice II.7.43).
√
Donc ρ → λ, qui signifie un enroulement sur le cycle limite (cercle). Si f < 0 , comme
f + λ > 0 , on voit que f croît et l’on a un argument analogue.
c Dunod 2014
II.8 : Méthodes numériques
261
Module II.8 : Méthodes numériques
II.8.1 On a
P
j>1
dj b−j 6
P
j>1
(b − 1)b−j = 1 avec égalité si, et seulement si, les dj sont tous égaux
à b − 1.
P
Soit y ∈ [0, 1[. L’égalité y =
dj b−j équivaut pour tout p > 1 à :
j>1
bp y = (d1 bp−1 + · · · + dp ) +
X
dp+j b−j .
j>1
Si y 6∈ Z[1/b], c’est-à-dire si bp y 6∈ N pour tout p, ceci permet de définir d1 , . . . , dp comme
les chiffres de l’écriture en base b de ⌊bp y⌋. Il faut vérifier la cohérence, autrement dit qu’en
notant d′1 , . . . , d′p+1 les chiffres de l’écriture en base b de ⌊bp+1 y⌋, on a bien di = d′i pour
i = 1, . . . , p : mais cela découle de l’encadrement 0 6 ⌊bz⌋ − b⌊z⌋ < b (dont la preuve est
laissée au lecteur) appliqué à z := bp y .
Si bp y = a ∈ N \ bN, on a deux possibiltés d’écriture :
• a = d1 bp−1 +· · ·+dp et tous les dp+j = 0 pour j > 1 (exemple décimal : 1/20 = 0, 05 ).
• a − 1 = d1 bp−1 + · · · + dp et tous les dp+j = b − 1 pour j > 1 (exemple décimal :
1/20 = 0, 04999 . . . ).
Le programme CAML suivant affiche les n premiers chiffres après la virgule du développement
en base b de y ∈ [0, 1[ :
let mantisse u = u -. (floor u) ;;
let ecrire y b n =
let rec aux p u = if (p < n) then
(print_int (int_of_float (b *. u));
aux (p+1) (mantisse (b *. u)))
in aux 0 y ;;
Exemple :
# ecrire (sqrt 2. -. 1.) 10. 5;;
41421- : unit = ()
# ecrire (sqrt 3. -. 1.) 2. 10;;
1011101101- : unit = ()
# ecrire (1./.121.) 11. 10;;
0100000000- : unit = ()
II.8.3
1. Premier cas : on veut |c/n| < b−k , i.e. n > cbk .
√
2. Deuxième cas : on veut |c/ n| < b−k , i.e. n > (cbk )2 .
k
3. Troisième cas : on veut |c/ ln nn| < b−k , i.e. n > ecb .
Donc, convergence de plus en plus lente.
II.8.4 On peut penser qu’il s’agit des premières décimales après la virgule lors de l’exécution d’un
algorithme itératif et que le dernier nombre écrit a huit décimaes correctes. À chaque étape on
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
262
a gagné une décimale : convergence linéaire. Avec une convergence quadratique, on aurait vu
par exemple :
30000000
32000000
32370000
32374658
II.8.6 L’identité mentionnée dans l’indication implique (2p + 1)I2p I2p+1 = π/2 , d’où, avec la
formule pour I2p donnée dans la preuve de la proposition 3 de la page 892, la première égalité
à démontrer. Comme I2p+1 /I2p → 1 quand p → +∞, on en déduit (toujours avec la même
π
42p
formule) : = lim
et la fraction au membre droit vaut :
n→+∞ 2p 2
2
(2p + 1)
p
42p (p!)4
(2.4 · · · 2p)4
(2.4 · · · 2p)2
=
=
,
2
2
2
(2p!) (2p + 1)
(2.4 · · · 2p) (1.3 · · · (2p − 1)) (2p + 1)
(1.3 · · · (2p − 1))(1.3 · · · (2p + 1))
ce qui était demandé.
II.8.7 Voici un programme qui suppose que f (a) < 0 < f (b) :
let zero f a b epsilon =
let rec aux u v =
let w = (u+.v)/.2. in let y = f w in
if (y == 0. || v -. u < epsilon) then w
else if y < 0. then aux w v else aux u w
in aux a b;;
Exemple :
# let f x = x *. x -. 2.;;
val f : float -> float = <fun>
# zero f 1. 2. 0.0001;;
- : float = 1.414215087890625
√
√
√ II.8.8 On a ici f (0) = 3 > 0 , f ( 2) = −4 2 + 3 < 0 et f ′ = 3x2 − 6 < 0 sur 0, 2 ,
√
√ f ′′ = 6x > 0 sur 0, 2 . On peut donc poser x0 := 2 et prendre pour xi+1 l’abcisse de
l’intersection de la droite reliant (0, f (0)) à (xi , f (xi )) avec l’axe des x :
xi+1 :=
0.f (xi ) − xi .f (0)
3
=
·
f (xi ) − f (0)
6 − x2i
Voici une programmation de l’itération :
let f x = x ** 3. -. 6. *. x +. 3.;;
let phi x = 3./.(6. -. (x *. x));;
let iter u x =
let rec aux p = if p == 0 then x else u (aux (p-1))
in aux ;;
c Dunod 2014
II.8 : Méthodes numériques
263
Et les calculs correspondants :
#
#
#
#
#
#
#
#
#
#
-
f
:
f
:
f
:
f
:
f
:
f
:
f
:
f
:
f
:
f
:
(iter
float
(iter
float
(iter
float
(iter
float
(iter
float
(iter
float
(iter
float
(iter
float
(iter
float
(iter
float
phi (sqrt 2.) 0) ;;
= -2.65685424949238058
phi (sqrt 2.) 1) ;;
= -1.07812500000000089
phi (sqrt 2.) 2) ;;
= -0.142400262413382883
phi (sqrt 2.) 3) ;;
= -0.0142020685584030026
phi (sqrt 2.) 4) ;;
= -0.00136734779896441339
phi (sqrt 2.) 5) ;;
= -0.000131185213370521581
phi (sqrt 2.) 6) ;;
= -1.25818452447745699e-05
phi (sqrt 2.) 7) ;;
= -1.20667341141356133e-06
phi (sqrt 2.) 8) ;;
= -1.15726761507062292e-07
phi (sqrt 2.) 9) ;;
= -1.10988436219372488e-08
√
αt
II.8.9 D’abord, ϕ(β) = (1 − t)β + p−1 , ce qui, pour β := p α, donne ϕ(β) = β : on a donc
β
√
bien un point fixe en β := p α .
On veut de plus ϕ′ (β) = 0 . Comme ϕ′ (x) = (1 − t) − (p − 1)αtx−p , on a sans condition
ϕ′ (β) = 1 − pt : il faut donc prendre t := 1/p. Pour p = 2 , on retrouve l’algorithme de
Babylone.
Voici un programme CAML faisant appel à l’itération de ϕ déjà utilisée dans la solution de
l’exercice II.8.7 :
let racine p alpha n =
let q = p -. 1. in
let phi x = (q *. x +. (alpha/. (x ** q))) /. p
in iter phi 1. n ;;
√
Voici le calcul approché de 3 1728 = 12 :
#
#
#
#
#
#
racine 3.
: float =
racine 3.
: float =
racine 3.
: float =
racine 3.
: float =
racine 3.
: float =
racine 3.
1728. 0 ;;
1.
1728. 1 ;;
576.666666666666629
1728. 2 ;;
384.446176543746105
1728. 3 ;;
256.30134821747555
1728. 4 ;;
170.87633388535582
1728. 5 ;;
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
264
#
#
#
#
#
#
#
#
#
#
-
: float = 113.937282814706961
racine 3. 1728. 6 ;;
: float = 76.0025586798763868
racine 3. 1728. 7 ;;
: float = 50.7680887305636475
racine 3. 1728. 8 ;;
: float = 34.0688736155918548
racine 3. 1728. 9 ;;
: float = 23.2088397386703029
racine 3. 1728. 10 ;;
: float = 16.5418993620347088
racine 3. 1728. 11 ;;
: float = 13.1329311369366284
racine 3. 1728. 12 ;;
: float = 12.0949235432840947
# racine 3. 1728. 13 ;;
: float = 12.0007430313207593
racine 3. 1728. 14 ;;
: float = 12.0000000460041658
racine 3. 1728. 15 ;;
: float = 12.
La convergence est lente au début, mais dès qu’on approche la racine exacte, elle est visiblement
quadratique.
II.8.12 Ici, n = 2 ,
1
1
= et f (n+1) ∞ = k24xk∞ = 24 .
(n + 1)!
6
Premier cas : ω = x3 − x, kωk∞ =
2
1
√ (atteint en ± √ , erreur théorique égale à
3 3
3 3
1 2
8
. √ .24 = √ ≃ 1, 54 .
6 3 3
3 3
1
1
2
On a L = x et x4 − x2 ∞ = (atteint en ± √ .
4
2
Deuxième cas : ω = x3 − 3x/4 , kωk∞ =
1 1
. .24 = 1 .
6 4
1
1
(atteint en ± , erreur théorique égale à
4
2
9
, correspondant à un maximum relatif atteint en
On a L = 3x2 /4 et x4 − 3x2 4∞ =
64
r
3
±
. Mais le véritable maximum est 1/4 , atteint en ±1 .
8
Cependant, à la vue des graphes, globalement, x4 est mieux approché par 3x2 /4 que par x2
sur [−1, 1].
c Dunod 2014
II.8 : Méthodes numériques
265
II.8.14 (i) Par intégration par parties :
Z 1
Z
1
ln(α2 + t2 ) dt = t ln(α2 + t2 ) 0 −
0
Z
1
0
1
2t2
dt
+ t2
α2
2α2
dt
+ t2
0
1
= ln(1 + α2 ) − 2 + 2α arctan ·
α
Lorsque α → 0+ , la limite de cette expression est −2 , qui est < 2(ln 2 − 1) puisque ln 2 > 0 .
(ii) L’encadrement permet d’appliquer le théorème, la conclusion est alors immédiate.
= ln(α2 + 1) − 2 +
α2
II.8.15 Dire que P (j) (a) = 0 pour j = 0, . . . , µ équivaut à dire que (X − a)µ divise P . Comme
les (X − ai )µi sont premiers entre eux deux à deux, la conclusion s’ensuit.
Puisque de manière générale la dimension du K -espace vectoriel K[X]/ < P > est deg P
P
(si P 6= 0 ), on a bien n = µi .
L’extension indiquée du lemme 12 de la page 906 est celle-ci : si g (j) (ai ) = 0 pour
i = 1, . . . , n et 0 6 j < µi , alors g (N −1) (ξ) = 0 pour un ξ appartenant au plus petit
intervalle contenant les ai . La preuve par récurrence repose sur le principe suivant : à chaque
dérivation, on gagne n − 1 points d’annulation par Rolle ; et l’on abaisse tous les µi > 0 de
1 . Donc N diminue au total de 1 .
On a alors la formule étendant le théorème 7 de la page 906 avec pour ω le P0 ci-dessus, L
obtenue par interpolation de Lagrange-Hermite.
II.8.17 Le fait que l’ordre est au moins 3 découle de la proposition 22 de la page 924 avec
n = 2 . Pour vérifier que l’ordre est exactement 3 , on applique la méthode à x4 avec
un seul segment, par exemple [0, 1]. L’intégrale vaut 1/5 , l’approximation de Simpson est
2
1
1
f (0) + f (1/2) + f (1) = 5/24 , donc pas la valeur exacte (mais pas loin).
6
3
6
II.8.18 Avec les notations de la section 4.2.2, on doit calculer les wj :=
j = 0, . . . , 8 , où
lj (s) =
1
8
Z
8
lj (s) ds,
0
\
(s − 0) · · · (s
− j) · · · (s − 8)
·
(j − 0) · · · (j\
− j) · · · (j − 8)
Avec l’aide de Maple, on trouve les valeurs suivantes :
w0 = w8 = 989/28350,
w1 = w7 = 2944/14175,
w2 = w6 = −464/14175,
w3 = w5 = 5248/14175,
w4 = −454/2835.
c Dunod 2014
Tout-en-un pour la licence • Niveau 2 • Solution des exercices
266
II.8.20 On veut choisir a0 , a1 , w0 , w1 de telle sorte que :
Z b
f (t) dt = w0 f (a0 ) + w1 f (a1 )
a
pour tous les polynômes f de degré deg f 6 N , ou encore, de manière équivalente, pour tous
les monômes f = xn , n 6 N . Prenant N = 3 , on obtient quatre équations en quatre inconnues, ce qui laisse croire à une chance raisonnable de résolution. Quitte à opérer un changement
de variable affine, nous supposerons que a = 0 et b = 1 . On est ramené au système :
w0 + w1 = 1,
w0 a0 + w1 a1 = 1/2,
w0 a20 + w1 a21 = 1/3,
w0 a30 + w1 a31 = 1/4.
p
p
1 − 1/3
1 + 1/3
On trouve w0 = w1 = 1/2 , a0 =
et a1 =
(à transposition près, mais
2
2
nous choisissons naturellement a0 < a1 ). On ne peut pas faire mieux car au degré suivant on
devrait avoir w0 a40 + w1 a41 = 1/5 alors que la véritable valeur 7/36 en diffère légèrement.
II.8.22 Avec la définition du produit scalaire donnée dans l’indication, on voit que Hn est la
matrice de Gram de la famille (1, x, x2 , . . . , xn−1 ).
II.8.24 De l’exercice I.3.14 de la page 140 on déduit sue la suite (Dn ) des déterminants est
donnée par les conditions initiales D0 = 1 , D1 = 2X et la relation de récurrence
Dn = 2XDn−1 − Dn−2 . On a donc Dn = Un (polynômes de Tchebychev).
Les valeurs propres λ sont racines de l’équation Un (1 + α−λ
2 ) = 0 , ce sont donc les
λk := α + 2 − 2 cos kπ/(n + 1), 1 6 k 6 n.
II.8.27 Il faut vérifier que, pour 0 6 r 6 1 , on a :
√
1 − 1 − r2
√
6 r2 ,
1 + 1 − r2
ce que par équivalences logiques évidentes on ramène à
ce qui est facile à prouver.
p
1 − r2
6
1 − r2 ,
1 + r2
II.8.28 De l’identité cos(π − x) = − cos x, on déduit, avec les notations de l’exemple de la page
937, que λn+1−k = −λk .
c Dunod 2014
Téléchargement