Module I.1 : Compléments d’algèbre I.1.1 Si les éléments (a, b) et (a′ , b′ ) de (Z \ {0}) × N∗ sont équivalents, c’est-à-dire si ab′ = ba′ , alors vp (ab′ ) = vp (ba′ ) ⇒ vp (a) − vp (b) = vp (a′ ) − vp (b′ ). Ainsi, l’application (a, b) 7→ vp (a) − vp (b) de (Z \ {0}) × N∗ dans Z est compatible avec la relation d’équivalence a et passe au quotient en une application 7→ vp (a) − vp (b) de Q∗ dans Z. (Si l’on prolonge b cette application à Q par 0 7→ ∞, on obtient encore une valuation.) En revanche, les couples équivalents (1, 2) et (2, 4) ont pour image respective par l’applicaa2 + 1 2 5 tion (a, b) 7→ 2 les rationnels distincts et : cette application ne passe donc pas au b +1 5 17 a a2 + 1 quotient, et l’on ne peut définir 7→ 2 de Q dans Q . b b +1 I.1.2 Nous laisserons au lecteur le soin de vérifier que la relation est bien réflexive et symétrique et prouverons le point le plus difficile, la transitivité. Supposons donc que (f1 , J1 ) ∼ (f2 , J2 ) et (f2 , J2 ) ∼ (f3 , J3 ), les intervalles de coïncidence étant K ⊂ J1 ∩ J2 et K ′ ⊂ J2 ∩ J3 . Alors K ′′ := K ∩ K ′ est un intervalle ouvert contenant a et contenu dans J1 ∩ J3 et sur lequel f1 et f3 coïncident, d’où (f1 , J1 ) ∼ (f2 , J2 ) et la transitivité. Montrons la compatibilité à gauche de cette relation et de l’addition (qui est commutative). On suppose que (f1 , J1 ) ∼ (f1′ , J1′ ), avec intervalle de coïncidence K . Pour comparer (f1 , J1 ) + (f2 , J2 ) à (f1′ , J1′ ) + (f2 , J2 ), il suffit de vérifier que f1 + f2 et f1′ + f2 sont définies et égales sur L := K ∩ J2 ⊂ (J1 ∩ J2 ) ∩ (J1′ ∩ J2 ), et que L est bien un intervalle ouvert contenant a ; c’est immédiat. Le cas de la multiplication se traite pareillement. Il est clair que, si (f1 , J1 ) ∼ (f2 , J2 ), alors f1 (a) = f2 (a) ; l’application (f, J) 7→ f (a) est donc compatible avec la relation d’équivalence, et passe donc au quotient. De même, si f1 et f2 sont k fois dérivables et égales sur un intervalle ouvert contenant a, alors leurs dérivées en a jusqu’à l’ordre k sont égales. I.1.3 On a (par exemple) 1 6≡9 4 , mais 3 × 1 ≡9 3 × 4 , donc 3 n’est plus régulier après passage au quotient par ≡9 . En fait, si n ∈ N∗ , dire que a ∈ N est régulier après passage au quotient par ≡n , c’est dire que l’image de a dans Z/nZ est simplifiable, c’est-à-dire que a est premier avec n. I.1.4 (i) Bien sûr, selon les hypothèses du paragraphe 1.2.1 de la page 8, le groupe M doit être commutatif. On vérifie alors que les éléments (a, 0) et (a′ , 0) de M × M sont équivalents si, et seulement s’il existe c ∈ M tel que a + c = a′ + c, donc, M étant un groupe, si, et seulement si, a = a′ . Le morphisme M → G est donc injectif. D’autre part, (a, b) ∈ M × M est équivalent à (a − b, 0) ∈ M × M , donc la classe de (a, b) dans G est image d’un élément de M et le morphisme M → G est donc surjectif. (ii) Puisque A est intègre, x, y 6= 0 ⇒ xy 6= 0 et M est stable par multiplication ; il est alors immédiat que c’est bien un monoïde commutatif. La relation sur M ×M qui donne par passage au quotient son groupe des fractions est la relation : (a, b) ∼ (a′ , b′ ) si, et seulement s’il existe c ∈ M tel que ab′ c = a′ bc, c’est-à-dire ab′ = a′ b (puisque c n’est pas diviseur de 0 ). C’est donc la restriction de la relation sur A × M qui donne par passage au quotient le corps des fractions de A. De plus, la définition du produit est la même dans les deux cas. Tout-en-un pour la licence • Niveau 2 • Solution des exercices 2 I.1.5 Nous noterons additivement les lois, mais la notation multiplicative est tout aussi justifiée (comme dans l’indication). Notons a := i(a) la classe de (a, 0) ∈ M × M dans G. La classe de (a, b) est donc a − b . Tout morphisme g répondant à la question vérifie donc : g a − b = g (a) − g b = g i(a) − g i(b) = f (a) − f (b). Il n’y a donc qu’un tel morphisme possible. L’application ϕ : (a, b) 7→ f (a) − f (b) de M × M dans G′ passe au quotient ; en effet, a + b′ + c = a′ + b + c entraîne f (a + b′ + c) = f (a′ + b + c), d’où ( f étant un morphisme et f (c) ∈ G′ étant simplifiable), f (a) − f (b) = f (a′ ) − f (b′ ). Il est immédiat que l’application g : G → G′ obtenue par passage au quotient est telle que f = g ◦ i , et le lecteur vérifiera sans peine que c’est un morphisme de groupes. I.1.6 On a les équivalences : i(a) inversible ⇔ ∃(b, s) ∈ A × S : (a, 1)(b, s) ∼ (1, 1) ⇔ ∃(b, s) ∈ A × S : ∃t ∈ S : tab = ts, ce qui implique que a divise ts ∈ S ; réciproquement, si a divise s ∈ S , il suffit de prendre t := 1 . Lorsque S = A∗ , on vérifie que A → S −1 A est injectif ( a est dans le noyau si sa = 0 avec s ∈ S , donc a = 0 ) et surjectif ( a/s est l’image de as−1 ) ; on peut donc dans ce cas identifier A à S −1 A. Si S contenait le nilpotent s, on aurait 0 = sn ∈ S , ce que l’on a interdit. Si on l’avait permis, on aurait (0, 1) ∼ (1, 1) et l’anneau S −1 A serait trivial. I.1.7 (i) Notons a/s l’image de (a, s) dans S −1 A : ainsi, i(a) = a/1 et l’inverse de 1/s est s/1 . S’il existe g comme dans l’énoncé, alors : g(a/s) = g(a/1)g(1/s) = g(a/1)g(s/1)−1 = f (a)f (s)−1 . Le morphisme g est donc unique. Réciproquement, l’application (a, s) 7→ f (a)f (s)−1 passe qu quotient, car : (a, s) ∼ (a′ , s′ ) ⇔ ∃t ∈ S : tas′ = ta′ s, ce qui entraîne f (a)f (s)−1 = f (a′ )f (s′ )−1 (calcul facile). Le lecteur vérifiera que l’application g obtenue par passage au quotient convient. (ii) Il suffit d’appliquer la « propriété universelle » ci-dessus au morphisme A → T −1 A car l’image de S dans T −1 A est formée d’éléments inversibles. Notons que le morphisme obtenu s’écrit a/s 7→ a/s, mais les deux notations a/s désignent respectivement des classes dans S −1 A et dans T −1 A ! (iii) Puisque 0 ne divise que lui-même, 0 6∈ T . Si t1 , t2 divisent respectivement s1 , s2 ∈ S , alors t1 t2 divise s1 s2 ∈ S et T est une partie multiplicative, qui contient évidemment S , d’où le morphisme S −1 A → T −1 A. Si tu = s ∈ S , alors l’élément a/t = au/tu de T −1 A est image de au/s ∈ S −1 A, d’où la surjectivité. Si a/s a pour image 0 ∈ T −1 A, alors il existe t ∈ T tel que ta = 0 . Prenant s′ ∈ S multiple de t (puisque t ∈ T ), on a s′ a = 0 , donc a/s = 0 ∈ S −1 A, d’où l’injectivité. (iv) Le morphisme S −1 A → T −1 A a ici pour but le corps des fractions, et son injectivité se prouve comme en (iii). c Dunod 2014 I.1 : Compléments d’algèbre 3 I.1.9 On sait déjà que ιa est un automorphisme de G. La loi de groupes sur Aut(G) est, bien entendu, la composition et l’élément neutre est IdG . On calcule : ιa ◦ ιb (x) = a(bxb−1 )a−1 = (ab)x(ab)−1 = ιab (x), d’où ιa ◦ ιb = ιab , et l’on a bien un morphisme de groupes. Un élément a du noyau est tel que ιa = IdG , c’est-à-dire x = axa−1 pour tout x : le noyau est donc le centre de G. Dire que H est distingué, c’est dire que aHa−1 ⊂ H pour tout a, donc que H est stable par tous les automorphismes intérieurs. Rappelons à ce propos que la propriété ∀a ∈ G , aHa−1 ⊂ H implique la propriété apparemment plus forte ∀a ∈ G , aHa−1 = H . I.1.10 Puisque H ′ est distingué, on a un morphisme G′ → G′ /H ′ . Le noyau du morphisme composé G → G′ → G′ /H ′ est f −1 (H ′ ) qui est donc bien distingué. Si l’on prend H = G = un sous-groupe non distingué de G′ et, pour f , l’inclusion canonique, on obtient un contre-exemple à la deuxième question. Supposons f surjectif. Pour tout b ∈ G′ , on a b = f (a) avec a ∈ G et : bf (H)b−1 = f (a)f (H)f (a−1 ) = f (aHa−1 ) ⊂ f (H), et la réponse est positive : f (H) ⊳ G′ . I.1.11 On a nZ = mpZ ⊂ mZ et le groupe mZ/nZ est bien défini. Le composé des morphismes surjectifs x 7→ mx de Z sur mZ et y 7→ y (mod n) de mZ sur mZ/nZ est l’application de l’énoncé, qui est donc un morphisme surjectif de Z sur mZ/nZ. Pour que a ∈ Z soit dans le noyau, il faut, et il suffit, que ma ∈ nZ, c’est-à-dire que p divise a. Le noyau est donc pZ, d’où un isomorphisme x (mod p) 7→ mx (mod n) de Z/pZsur mZ/nZ. I.1.12 Rappelons que HG′ = {hg ′ | h ∈ H , g ′ ∈ G′ } . Naturellement, e = ee ∈ HG′ (élément neutre). D’autre part, avec des notations évidentes : −1 (h1 g1′ )(h2 g2′ ) = h1 (g1′ h2 g1′ ) (g1′ g2′ ) = hg, −1 où h := h1 (g1′ h2 g1′ ) ∈ H (car celui-ci est distingué) et g := g1′ g2′ ∈ G′ . Ainsi, HG′ est stable par multiplication. De plus : (hg ′ )−1 = (g ′ −1 −1 ′ h g )g ′ −1 −1 = h′′ g ′′ , −1 où h′′ := g ′ h−1 g ′ ∈ H (car celui-ci est distingué) et g ′′ := g ′ ∈ G′ . Ainsi, HG′ est stable par passage à l’inverse. C’est donc un sous-groupe de G. Enfin : (hg ′ )h0 (hg ′ )−1 = h(g ′ h0 g ′ −1 )h−1 ∈ H, car g ′ h0 g ′ −1 ∈ H (puisque celui-ci est distingué). On en déduit que H est distingué dans HG′ . L’élément hg ′ (mod H) de HG′ /H est l’image de g ′ ∈ G′ par le morphisme composé G′ → HG′ → HG′ /H . Ce morphisme est donc surjectif. De plus, g ′ ∈ G′ est dans le noyau si, et seulement si, g ′ ∈ H . Le noyau est donc G′ ∩ H , d’où l’isomorphisme g ′ G′ HG′ (mod G′ ∩ H) 7→ g ′ (mod H) de ′ sur . G ∩H H c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 4 I.1.13 Rappelons qu’un élément de torsion d’un groupe abélien (noté additivement) est un élément d’ordre fini. L’élément a := a (mod Z) ∈ C/Z est de torsion si, et seulement s’il existe m ∈ N∗ tel que ma = 0 , i.e. ma ∈ Z, autrement dit si, et seulement si, a ∈ Q/Z. L’image d’un élément de torsion par un morphisme est un élément de torsion (car ma = 0 ⇒ mf (a) = f (ma) = 0 ), et le seul élément de torsion de C est 0 , donc tout morphisme f de C/Z dans C est trivial sur Q/Z. Rechercher un morphisme logarithme de C∗ dans C, c’est rechercher une application log de C∗ dans C qui soit un morphisme de groupe et telle que exp(log x) = x. Il revient au même 1 log tel que E L(x) = x, où l’on a introduit l’application de chercher le morphisme L = 2iπ E : z 7→ exp(2iπz). Le morphisme L serait donc nécessairement injectif. Le morphisme E du groupe additif C sur le groupe multiplicatif C∗ induit par passage au quotient un isomorphisme ε de C/Z sur C∗ . En composant, on obtiendrait donc un morphisme injectif de C/Z dans C, ce qui est impossible d’après ce qui a été vu plus haut. I.1.14 Puisque n = mp, on a nZ ⊂ mZ, l’image de l’idéal nZ par le morphisme surjectif Z → Z/mZ est nulle, et l’on obtient par passage au quotient un morphisme surjectif d’anneaux Z/nZ → Z/mZ. Son noyau est formé des x (mod nZ) tels que x (mod mZ) = 0 , c’est-àdire tels que x ∈ mZ : ce noyau est donc l’idéal mZ/nZ de Z/nZ. I.1.15 Il est clair que (X 2 + 1)Z[X] ⊂ Z[X] = A et que (X 2 + 1)Z[X] ⊂ (X 2 + 1)R[X] = J , donc que (X 2 + 1)Z[X] ⊂ A ∩ J . Soit réciproquement P ∈ A ∩ J . La division euclidienne de P ∈ A = Z[X] par le polynôme unitaire X 2 + 1 ∈ Z[X] donne un quotient et un reste Q, R ∈ Z[X]. Comme c’est aussi une division euclidienne dans R[X] et que P ∈ J , le reste R est nul, et P = (X 2 + 1)Q ∈ (X 2 + 1)Z[X], d’où l’égalité A ∩ J = (X 2 + 1)Z[X]. R[X] Le morphisme A → = R + Ri = C a pour noyau A ∩ J et identifie donc (X 2 + 1)R[X] A Z[X] = au sous-anneau Z + Zi de C formé des entiers de Gauß. A∩J (X 2 + 1)Z[X] I.1.16 On sait déjà que la relation (congruence modulo un sous-groupe dans un groupe commutatif) est compatible avec l’addition. Soient a, b ∈ A tels que a ≡ b (mod I), c’est-à-dire a−b ∈ I . Alors, pour tout c ∈ A : ca−cb = c(a−b) ∈ I ⇒ ca ≡ cb (mod I) et ac−bc = (a−b)c ∈ I ⇒ ac ≡ bc (mod I). La relation est donc compatible avec la multiplication. Les mêmes méthodes que dans le cours permettent alors de munir le groupe quotient A/I d’une (unique) structure d’anneau telle que la projection canonique A → A/I soit un morphisme d’anneaux : on pose (a (mod I)) (b (mod I)) := (ab (mod I)) . Soit réciproquement une relation d’équivalence compatible avec l’addition et la multiplication. En notant I la classe de 0 , on sait déjà que I est un sous-groupe et que notre relation est la congruence modulo I . La compatibilité avec la multiplication entraîne de plus que I est un idéal bilatère. c Dunod 2014 I.1 : Compléments d’algèbre 5 I.1.17 Soit M := (ai,j ) ∈ Mn (K). Alors Ei,j M Ek,l = aj,k Ei,l . Si l’on suppose que M est un élément non nul d’un idéal bilatère I et que aj,k 6= 0 , on en déduit que I contient tous les Ei,l et donc que I = Mn (K). (Il est clair a priori qu’un idéal bilatère est en particulier un sous–espace vectoriel). Soient ϕ et ψ des endomorphismes de l’espace vectoriel E de dimension infinie. On suppose que ϕ est de rang fini. Alors ϕ ◦ ψ et ψ ◦ ϕ sont de rang fini (majoré par celu de ϕ), d’où la stabilité de l’ensemble des endomorphismes de E de rang fini par multiplication dans LK (E). L’endomorphisme nul est de rang fini. Si ϕ et ψ sont tous deux de rang fini, leur somme est de rang fini (majoré par la somme des deux rangs) et −ϕ également. On a donc bien un idéal bilatère. Il n’est pas nul, car il contient les projections sur des droites, ni égal à LK (E), car IdE n’est pas de rang fini. E+F si, et seulement si, x ∈ F . Le noyau est donc F E dans bien E ∩ F , d’où, par passage au quotient, une application linéaire injective de E∩F E+F E+F . Si e ∈ E, f ∈ F , l’élément (e + f ) (mod F ) de admet pour antécédent e F F E (mod E ∩ F ) dans , et le morphisme est surjectif. E∩F Remarquons que, si tous ces espaces sont de dimension finie, on en déduit la formule : I.1.18 L’élément x ∈ E a pour image 0 ∈ dimK E − dimK (E ∩ F ) = dimK (E + F ) − dimK F. Sous une forme encore plus utile : dimK (E + F ) = dimK E + dimK F − dimK (E ∩ F ). I.1.19 On a vu dans [L1] que K[X] = <P > ⊕ Kn−1 [X], la décomposition A = P Q + R étant obtenue par division euclidienne. Cette décomposition est d’ailleurs valable pour n = 0 , car on a alors <P > = K[X] et Kn−1 [X] = {0} . On a donc un isomorphisme d’espaces vectoriels : K[X]/<P > ≃ Kn−1 [X]. Comme tout idéal non nul de K[X] est de la forme <P > avec P unitaire de degré n > 0 , la conclusion s’ensuit. I.1.20 Écrivons H1 := Ker λ1 , . . . , Hk := Ker λk , où λ1 , . . . , λk sont des formes linéaires non nulles sur le K -espace vectoriel E . Alors H1 ∩ . . . ∩ Hk est le noyau de l’application linéaire Λ := (λ1 , . . . , λk ) de E dans K k . D’après le théorème du rang, la codimension de H1 ∩ . . . ∩ Hk est égale au rang de Λ . Cette codimension vaut donc k si, et seulement si, Λ est surjective. Par ailleurs, Λ n’est pas surjective si, et seulement si, son image est contenue dans un hyperplan de K k , c’est-à-dire si, et seulement s’il existe une équation non triviale a1 x1 + · · · + ak xk = 0 sur K k satisfaite par tous les éléments de Im Λ , c’est-à-dire si, et seulement si, λ1 , . . . , λk sont liées. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 6 I.1.21 Notons C := (u1 , . . . , uk ) et D := (v1 , . . . , vℓ ). (i) On choisit des représentants vj ∈ E des vj ∈ E/F et l’on pose D := (v1 , . . . , vℓ ). Si la famille D était liée, son image D par la projection E → E/F le serait. Elle est donc libre. Soit G l’espace vectoriel qu’elle engendre (c’en est donc une base). P P Tout élément de F ∩ G s’écrit λj vj et a pour image λj vj = 0 ∈ E/F ; on a donc λ1 = · · · = λℓ = 0 et l’on en déduit que F ∩ G = {0} . P P Soit x ∈ E . Alors x ∈ E/F s’écrit x = λj vj , de sorte que x− λj vj ∈ F , et x ∈ F +G et l’on en déduit que E = F + G. Ainsi, B = (u1 , . . . , uk , v1 , . . . , vℓ ) est bien une base de E = F ⊕ G. (ii) Pour que F soit stable par f , il faut, et il suffit, que f (u1 ), . . . , f (uk ) ∈ F , i.e. que les k premières colonnes de la matrice M n’aient que des coefficients nuls sur les ℓ dernières lignes. Les coefficients des k premières lignes constituent alors la matrice A ∈ Mk (K) de fF dans la base C , et M a la forme : A B M= . 0 C Les matrices B ∈ Mk,ℓ (K) et C ∈ Mℓ (K) ont pour coefficients les coordonnées de f (v1 ), . . . , f (vℓ ) dans la base B , les coefficients de C correspondant aux composantes dans D . La matrice C est donc la matrice de l’endomorphisme f de E/F obtenu par passage au quotient relativement à la base D . I.1.22 Puisque : I = 2A = 2Z[X] = {2P | P ∈ Z[X]} et que J = XA = XZ[X] = {XP | P ∈ Z[X]}, on a I + J = 2A + XA = {2P + XQ | P, Q ∈ Z[X]} = <2, X>. Le polynôme F := 2P + XQ est tel que F (0) = 2P (0) ∈ 2Z. Réciproquement, si F (0) = 2p, p ∈ Z, alors F − F (0) F = 2P + XQ avec P = p et Q = éléments de Z[X]. X Il est évident que IJ = (2A)(XA) = 2XA ⊂ I ∩ J . Mais, si F = I ∩ J , ses coefficients sont pairs et le coefficient constant est nul, donc F est multiple de 2X (dans ( Z[X]) : on a bien IJ = I ∩ J = 2XA. Pour tout idéal principal K := P A = P Z[X], on a KB = P Z[X]Q[X] = P Q[X] = P B . Ainsi IB = 2B = B (car 2 est inversible dans Q donc dans Q[X]) et JB = XB . On calcule : A/I = Z[X]/2Z[X] ≃ (Z/2Z)[X] = F2 [X], et A/J = Z[X]/XZ[X] ≃ Z. Dans les deux cas, on peut le vérifier en calculant les noyaux des morphismes surjectifs A → F2 [X] et A → Z. Le quotient A/(I + J) peut se calculer en quotientant successivement A par I , ce qui donne F2 [X] ; et le résultat par l’image de J , i.e. XF2 [X], ce qui donne F2 . On peut aussi quotienter d’abord par J , résultat Z ; puis par l’image 2Z de I , résultat F2 . Enfin, (I + J)2 est l’idéal engendré par {2, X}2 = {4, 2X, 2X, X 2} = {4, 2X, X 2} , d’où (I + J)2 = 4A + 2XA + X 2 A. Par ailleurs, I 2 = 4A, IJ = 2XA et J 2 = X 2 A, d’où I 2 + IJ + J 2 = 4A + 2XA + X 2 A = (I + J)2 . P I.1.23 Il est évident que les xi yj appartiennent à IJ . Tout élément de IJ est de la forme ik jk , où les ik sont dans I , donc combinaisons linéaires des xi , et où les jk sont dans J , donc c Dunod 2014 I.1 : Compléments d’algèbre 7 combinaisons linéaires des yj . Tout élément de IJ est donc combinaison linéaire des xi yj . Le carré de I := <a, b> est donc engendré par {a, b}{a, b} = {a2 , ab, ba, b2} = {a2 , ab, b2 } . Prouvons par récurrence que I n est engendré par {an , an−1 b, . . . , abn−1 , bn } . Il suffit de voir que {an+1 , an b, . . . , abn , bn+1 } = {a, b}{an, an−1 b, . . . , abn−1 , bn } , ce qui est aisé. √ √ √ Dans le cas de l’idéal I = <1 + −5, 1 − −5> de l’anneau A = Z[ −5], on trouve : √ √ I 2 = < − 4 + 2 −5, 6, −4 − 2 −5>. √ √ Cet idéal contient −(−4 + 2 −5) − 6 − (−4 − 2 −5) = 2 , et ses générateurs sont multiples de 2 , donc I 2 = <2>. Si I était principal de générateur u , ce serait en particulier un diviseur √ √ de 1 + −5 + 1 − −5 = 2 . Écrivant 2 = uv et utilisant, comme dans le texte, la norme algébrique, on aurait une décomposition 4 = (a2 +5b2 )(c2 +5d2 ) dans Z, ce qui n’est possible que si l’un des facteurs vaut 1 et l’autre 4 . On voit donc que u est (à un inversible près) 1 ou 2 . le deuxième cas est impossible car 2 ne divise pas les générateurs de I . Le premier cas signifierait que I = <1>, ce qui contredirait le calcul de I 2 . I.1.24 (i) Voici une preuve sans calcul de la première assertion : le morphisme surjectif naturel de A1 × A2 sur A1 /I1 × A2 /I2 a pour noyau I1 × I2 . Soit I un idéal quelconque de A1 × A2 et soient I1 , I2 ses images par les projections sur A1 , A2 . Comme les projections sont des morphismes surjectifs, I1 et I2 sont des idéaux. Il est évident que I ⊂ I1 × I2 . Soient i1 ∈ I1 , i2 ∈ I2 : il existe donc a1 , a2 tels que (i1 , a2 ), (a1 , i2 ) ∈ I . Alors (i1 , i2 ) = (1, 0)(i1 , a2 ) + (0, 1)(a1 , i2 ) ∈ I . (ii) et (iii) De l’égalité (1, 0)(0, 1) = (0, 0), on déduit d’abord qu’un produit d’anneaux B1 × B2 ne peut être intègre que si B1 ou B2 est trivial ; et donc que B1 × B2 est intègre (resp. un corps) si, et seulement si, B2 est trivial et B1 intègre (resp. un corps), ou vice-versa. Soit I = I1 × I2 un idéal de A1 × A2 et notons B1 := A1 /I1 , B2 := A2 /I2 . Il découle de ce qui précède que I est premier (resp. maximal) si, et seulement si, I1 est premier (resp. maximal) et I2 = A2 , ou vice-versa. I.1.25 Soit P = P1r1 · · · Pkrk la décomposition de P en facteurs premiers. D’après le lemme chinois : K[X]/ < P >≃ K[X]/<P1r1 > × · · · × K[X]/<Pkrk >· Si r1 = · · · = rk = 1 (c’est-à-dire si P est produit de facteurs premiers distincts), c’est un produit de corps. Sinon, si ri > 2 , alors x := Pi (mod Piri ) est un élément nilpotent non trivial de K[X]/<Piri > , et (0, . . . , x, . . . , 0) (où x est en i ème position) est un élément nilpotent non trivial de K[X]/ < P > , qui ne peut donc être un produit de corps. (Un produit de corps est un anneau réduit.) I.1.26 (i) Notons x := cl(X), De l’égalité K[X] = K1 [X] ⊕ <X 2 + X + 1>, on déduit que (1, x) est une base du F2 -espace vectoriel F2 [X]/<X 2 + X + 1> , dont les éléments sont 0, 1, x, y := 1 + x. La table d’addition est celle de (Z/2Z)2 . Pour dresser la table de multiplication, il suffit de calculer : x2 = 1 + x = y , xy = x + x2 = 1 , y 2 = 1 + x2 = x. On vérifie que le groupe multiplicatif de ce corps est cyclique d’ordre 3 . (ii) Tout polynôme irréductible P de degré 3 sur F2 fournira un corps à 8 éléments c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 8 F2 [X]/<P > . Pour être irréductible, il suffit qu’un polynôme de degré 3 n’ait pas de racines. Sur F2 , on trouve les polynômes X 3 + X 2 + 1 et X 3 + X + 1 . De même, tout polynôme irréductible P de degré 2 sur F3 fournira un corps à 9 éléments F3 [X]/<P > . Pour être irréductible, il suffit qu’un polynôme de degré 2 n’ait pas de racines. Sur F3 , on trouve les polynômes X 2 + 1 , X 2 + X − 1 et X 2 − X + 1 (et leurs opposés). I.1.27 (i) Le morphisme d’anneaux f 7→ f (x) est surjectif de A sur le corps R, son noyau Mx est donc un idéal maximal. (ii) On prouve la dichotomie par l’absurde, en niant l’assertion à prouver : s’il y avait une fonc a+b tion f ∈ I qui ne s’annule pas sur a, et une fonction g ∈ I qui ne s’annule pas sur 2 a+b , b la fonction f 2 + g 2 ∈ I serait strictement positive sur [a, b], donc ne s’y annulerait 2 pas, donc elle serait inversible dans A et l’on aurait I = A, contredisant l’hypothèse. En itérant, on choisit à chaque étape un segment [an , bn ] qui est la moitié gauche ou la moitié droite de [an−1 , bn−1 ], et tel que toute fonction f ∈ I s’annule en au moins un point xn,f ∈ [an , bn ]. L’intersection des [an , bn ] est un singleton {x} ⊂ [a, b] (segmente emboités de longueur tendant vers 0 ) et, pour tout f ∈ I , on a : ∀n > 0 , f (xn,f ) = 0 et lim xn,f = x, n→+∞ d’où f (x) = 0 . On en déduit que I ⊂ Mx . Puisque tout idéal propre de A est inclus dans l’un des Mx , ces derniers sont les seuls idéaux maximaux de A. (iii) Nous laissons au lecteur le soin de démontrer que I est bien un idéal de B . Il s’agit de vérifier que, pour tout x ∈ ]a, [ b , il existe une fonction de I qui n’est pas dans Mx , c’està-dire une fonction non nulle en x et nulle en dehors d’un segment [c, d] ⊂]a, b[. Il suffit de a+x x+b prendre c := , d := et pour f la fonction nulle hors de [c, d], affine de (c, 0) à 2 2 (x, 1) et encore affine de (x, 1) à (d, 0) (tente). I.1.28 Si a est inversible, le seul idéal qui le contient est A, qui n’est pas maximal (les idéaux maximaux sont propres par définition). Si a n’est pas inversible, l’idéal <a> est propre, donc, d’après le théorème de Krull, contenu dans un idéal maximal M et a ∈ M. Supposons A local, d’idéal maximal M. Les éléments de M sont non inversibles (car M est propre) et les éléments de A \ M sont inversibles (sinon, ils seraient contenus dans M d’après le résultat précédent). L’ensemble des éléments non inversibles est donc M, donc il est stable pour l’addition. Réciproquement, supposons que l’ensemble des éléments non inversibles est stable pour l’addition. Cet ensemble est également stable par multiplication externe (c’est la contraposée de l’implication : ab inversible entraîne a inversible). L’ensemble des éléments non inversibles est donc un idéal M. Comme tout idéal propre est formé d’éléments non inversibles, tout idéal propre est inclus dans M, qui est donc l’unique idéal maximal. Les éléments inversibles de Z/pk Z (resp. de K[X]/<X k > ) sont les classes des éléments de Z (resp. de K[X]) étrangers à pk , donc à p (resp. à X k , donc à X ). Les éléments non inversibles de Z/pk Z (resp. de K[X]/<X k >) sont donc les classes des multiples de p (resp. de X ) et forment l’idéal pZ/pk Z (resp. XK[X]/<X k >). L’anneau Z/pk Z (resp. K[X]/<X k > ) est donc local. c Dunod 2014 I.1 : Compléments d’algèbre 9 I.1.29 Tout d’abord, S −1 I est bien un idéal, car : a, a′ ∈ I ⇒ a/s + a′ /s′ = (as′ + a′ s)/ss′ ∈ S −1 I et (a/s)(b/t) = (ab)/(st) ∈ S −1 I. Il est clair que i(I) = {a/1 | a ∈ I} ⊂ S −1 I . Enfin, l’égalité a/s = (1/s)(a/1) montre que l’idéal engendré par i(I) contient S −1 I . I.1.30 Puisque P ∩ S = ∅ , aucun a/s ∈ S −1 P n’est égal à 1 , et c’est un idéal propre. Si (b/t)(c/u) ∈ S −1 P , on écrit (b/t)(c/u) = a/s avec a ∈ P , d’où s′ (bcs − atu) = 0 , d’où s′ sbc ∈ P , d’où b ou c ∈ P , d’où b/t ou c/u ∈ S −1 P , qui est bien premier. Remarquons de plus, pour la suite, que a/1 ∈ S −1 P entraîne s′ (at − b) = 0 , avec b ∈ P , d’où l’on tire a ∈ P : on a donc i−1 S −1 P = P . Soit Q un idéal premier de S −1 A. Si P := i−1 (Q) rencontrait S , son image par i , qui est dans Q, contiendrait des inversibles, ce qui n’est pas possible. Avec ces notations, On a évidemment i(P) ⊂ Q, d’où S −1 P ⊂ Q. D’autre part, tout a/s ∈ Q est tel que a ∈ P (facile et laissé au lecteur), d’où enfin S −1 P = Q. Nous avons bien prouvé que les deux applications considérées sont réciproques l’une de l’autre. I.1.31 Puisque x n’est pas nilpotent, l’ensemble S := {xn | n ∈ N} est multiplicatif et ne contient pas 0 et l’anneau S −1 A n’est pas trivial. Il contient donc un idéal maximal, donc premier, Q. D’après l’exercice I.1.30, l’image réciproque de Q dans A est un idéal premier qui ne rencontre pas S , donc qui ne contient pas x. Ainsi, pour tout élément non nilpotent, il existe un idéal premier qui ne le contient pas ; autrement dit, l’intersection des idéaux premiers de A est incluse dans le radical. (L’inclusion réciproque est la partie facile du théorème.) I.1.32 Notons x := x (mod I). Alors : √ x ∈ I ⇔ ∃n : xn ∈ I ⇔ ∃n : xn = 0 ⇔ x ∈ rad(A/I), où l’on a noté rad(A/I) le nilradical de cet anneau. On a ainsi prouvé que la racine de I est l’image réciproque du nilradical (c’est-à-dire du radical) de A/I , donc l’image réciproque de l’intersection des idéaux premiers de A/I , donc l’intersection des images réciproques des idéaux premiers de A/I , donc l’intersection des idéaux premiers de A contenant I . I.1.34 (i) L’élément (a1 , a2 ) ∈ A1 ×A2 est inversible si, et seulement s’il existe (b1 , b2 ) ∈ A1 ×A2 tel que (a1 , a2 )(b1 , b2 ) = (1, 1), i.e. a1 b1 = 1 et a2 b2 = 1 (noter que le premier 1 désigne le neutre de A1 , le deuxième, le neutre de A2 ). L’égalité (A1 × A2 )∗ = A∗1 × A∗2 en découle. (ii) Le lemme chinois assure que, si m, n ∈ N sont premiers entre eux, l’anneau Z/mnZ est isomorphe à l’anneau (Z/mZ) × (Z/nZ) ; d’après (i), le groupe (Z/mnZ)∗ est alors isomorphe au groupe (Z/mZ)∗ × (Z/nZ)∗ . On retrouve l’égalité ϕ(mn) = ϕ(m)ϕ(n) en comparant les cardinaux. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 10 I.1.35 Il est clair que X 4 −1 = (X −1)(X +1)(X 2 +1) et que ces trois facteurs sont irréductibles dans Q[X] et primitifs, donc irréductibles dans Z[X]. La seule décomposition (à facteurs constants près) de X 4 + 1 dans R[X] est √ √ √ X 4 + 1 = (X 2 + 2X + 1)(X 2 − 2X + 1). Comme aucun C(X 2 + 2X + 1), C ∈ R∗ n’est dans Q[X], le polynôme X 4 + 1 est irréductible dans Q[X]. Comme il est primitif, il est irréductible dans Z[X]. On a X 4 + X 2 + 1 = (X 2 + X + 1)(X 2 − X + 1), et les deux facteurs sont irréductibles dans Q[X] (et même dans R[X]) et primitifs, donc irréductibles dans Z[X]. Le polynôme P := X 4 + aX 2 − 1 est primitif. Dans une décomposition P = QR, P, Q ∈ Z[X], le produit des coefficients dominants valant 1 , on peut supposer Q et R unitaires (sinon, prendre leurs opposés). Pour une raison similaire, Q(0) = −ε et R(0) = ε , où ε ∈ {+1, −1} . Si par exemple Q est de degré 1 , on voit que ε est racine de P , i.e. que a = 0 , ce qui est exclu. On écrit donc Q = X 2 + bX − ε et R = X 2 + cX + ε . Par identification, on obtient les équations : b + c = 0 , bc = a et ε(b − c) = 0 . De la première et la troisième, on tire b = c = 0 , puis, de la deuxième, a = 0 , contradiction. I.1.36 Le noyau est formé des polynômes de A[X] dont tous les coefficients sont dans Ker f . I.1.37 Si an = 0 , le polynôme n−1 P i=0 (−aX)i est inverse de 1 + aX . Si P := a0 + · · · + ad X d est inverse de 1 + aX , on a (par identification) les équations a0 = 1 , ai a + ai+1 = 0 pour 0 6 i 6 d − 1 et ad a = 0 . On en déduit par récurrence ai = (−a)i , puis ad+1 = 0 . Si a n’est pas nilpotent, 1 + aX n’étant pas inversible, il est contenu dans un idéal premier Q de A[X] (en fait, un idéal maximal : théorème de Krull). L’idéal premier P de A ne peut contenir a (sinon, on aurait a ∈ Q, donc 1 ∈ Q). On achève le raisonnement comme dans l’exercice I.1.31 de la page 54. a (fraction irréductible). Le noyau contient évidemment l’idéal <bX − a> . b Cet idéal est engendré par un élément primitif de degré 1 , donc premier. Si P (x) = 0 , P appartient à l’idéal engendré par bX−a dans Q[X], donc un multiple N P (avec N ∈ N∗ ) appartient à <bX −a>. Comme N est premier avec bX −a (démontrez-le !), on a P ∈ <bX −a>. Le noyau est donc <bX − a> . I.1.38 Écrivons x = I.1.39 Les axiomes disent que la loi d’anneau (x, y) 7→ x ⋆ y est une application bilinéaire de V × V dans V . I.1.40 Le noyau de ϕ est un idéal propre de K (s’il n’était pas propre, on aurait 1A = ϕ(1K ) = 0 et A serait trivial), donc, puisque K est un corps, Ker ϕ = {0} . On identifie donc K à son image, ce qui revient à supposer que K ⊂ A. La structure de K -algèbre sur A s’obtient en posant : ∀λ ∈ K , ∀x ∈ A , λ.x := λ ⋆ x( multiplication de A). L’axiome ∀λ ∈ K , ∀x, y ∈ A , x ⋆ (λ.y) = λ.(x ⋆ y) dit alors que les éléments de K commutent avec ceux de A, c’est-à-dire que K est central. c Dunod 2014 I.1 : Compléments d’algèbre 11 I.1.41 On notera, dans chaque cas, x la classe de X . Chacune des trois K -algèbres admet, en tant que K -espace vectoriel, la base (1, x) et sa structure de K -espace vectoriel est celle de K ⊕ Kx ≃ K 2 . Dans la table de multiplication de 1, x, seul le carré x2 nécessite un calcul. (i) Dans la K -algèbre K[X]/<X 2 − 1>, on a x2 = 1 . Cette algèbre n’est pas intègre, puisque X 2 −1 est réductible. Les idéaux de K[X] contenant X 2 −1 , sont : <1>, <X−1>, <X+1> et <X 2 − 1>. Les idéaux de K[X]/<X 2 − 1> sont donc : <1>, <x − 1> , <x + 1> et <x2 − 1> = <0> . Les idéaux premiers sont <x − 1> et <x + 1>, et ce sont aussi les idéaux maximaux. Si K est de caractéristique 2 , ils sont égaux et le radical est <x − 1> : en fait, l’élément x − 1 est de carré nul dans ce cas. On peut même remarquer que l’automorphisme P (X) 7→ P (X +1) fournit par passage au quotient (toujours dans ce cas) un isomorphisme de K[X]/<X 2 − 1> sur K[X]/<X 2 > . Si K est de caractéristique différente de 2 , le radical est <0> et l’algèbre est réduite. En fait, dans ce cas, le lemme chinois fournit un isomorphisme : K[X]/<X 2 − 1> ≃ K[X]/<X − 1> × K[X]/<X + 1>, c’est-à-dire K[X]/<X 2 − 1> ≃ K × K . (ii) Dans la K -algèbre K[X]/<X 2 > , on a x2 = 0 . Cette algèbre n’est pas intègre, puisque X 2 est réductible, ni même réduite, puisque x est nilpotent d’ordre 2 . Les idéaux de K[X] contenant X 2 , sont : <1> , <X> et <X 2 > . Les idéaux de K[X]/<X 2 > sont donc : <1>, <x> et <x2 > = <0> . Le seul idéal premier est <x> et c’est aussi un idéal maximal. Le radical est <x> . (iii) Dans la K -algèbre K[X]/<X 2 + 1> , on a x2 = −1 . Il y a deux cas à considérer. Si −1 est un carré dans K , cette algèbre n’est pas intègre, puisque X 2 + 1 est réductible. Dans ce cas, l’étude ressemble en tous points à celle de K[X]/<X 2 − 1> , y compris la discussion sur la caractéristique de K . En fait, il y a même un isomorphisme explicite entre ces deux algèbres, obtenu par passage au quotient à partir de l’automorphisme P (X) 7→ P (iX) de K[X], où i ∈ K est un élément de carré −1 . Si −1 n’est pas un carré dans K , l’idéal <X 2 + 1> de K[X] est premier non nul, donc maximal, et K[X]/<X 2 + 1> est un corps. L’étude est alors triviale. I.1.42 Comme dans toute algèbre, l’application λx : y 7→ xy est linéaire quel que soit x. Si x 6= 0 , l’hypothèse d’intégrité dit que cette application est injective. Comme c’est un endomorphisme d’espace vectoriel en dimension finie, elle est bijective, ce qui est équivalent à dire que x est inversible. I.1.43 Si K est de caractéristique 0 , pour tout polynôme P := aX n + · · · de degré exactement n, l’endomorphisme P (D) ∈ LK (E) envoie X n ∈ E sur un polynôme de terme constant n!a 6= 0 , donc P (D) 6= 0 : l’élément D de la K -algèbre LK (E) n’est donc pas algébrique. En toutes caractéristiques, l’image de X n par Dp est 0 si n < p, et p! np X n−p sinon. Si K est de caractéristique p > 0 , on en déduit que Dp = 0 , donc D est un élément nilpotent, donc algébrique. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 12 I.1.44 Si µx désigne le polynôme annulateur de x, on a : C[x] ≃ C[X]/<µx > et, pour appliquer le théorème chinois, il suffit de décomposer µx en facteurs primaires (c’est-à-dire puissances de facteurs premiers distincts). Si x est la matrice scalaire λI2 , µx = X − λ et C[x] ≃ C[X]/<X − λ> ≃ C. En fait, dans ce cas, C[x] = CI2 . Si x admet deux valeurs propres λ, µ (et n’est donc évidemment pas scalaire), µx = (X − λ)(X − µ), et l’on peut appliquer le théorème chinois : C[x] ≃ C[X]/<(X − λ)(X − µ)> ≃ C[X]/<X − λ> × C[X]/<X − µ> ≃ C × C. Si x n’est pas scalaire mais admet pour seule valeur propre λ, µx = (X − λ)2 et C[x] ≃ C[X]/<(X − λ)2 > n’admet pas de description beaucoup plus simple. On peut cependant remarquer que l’automorphisme P (X) 7→ P (X + λ) de C[X] passe au quotient en un isomorphisme C[X]/<(X − λ)2 > ≃ C[X]/<X 2 > . I.1.45 (i) On a un morphisme d’algèbres en vertu des calculs suivants : λax+a′ x′ (y) = (ax + a′ x′ )y = axy + a′ x′ y = aλx (y) + a′ λx′ (y) = (aλx + a′ λx′ )(y) λxx′ (y) = xx′ y = λx λx′ (y) = (λx ◦ λx′ )(y). et Si x est dans le noyau, λx = 0 , d’où x = λx (1) = 0 : le morphisme est donc injectif. L’affirmation concernant les polynômes minimaux est valable pour tout morphisme injectif d’algèbre : si ϕ est un tel morphisme, on a P (x) = 0 ⇔ P ϕ(x) = ϕ P (x) = 0 . (ii) Puisque ϕ : x 7→ λx est un morphisme et que le déterminant est multiplicatif, la norme l’est également. Remarquons que N (1) = 1 (déterminant de l’identité). Si x est inversible, alors xx′ = 1 ⇒ N (x)N (x′ ) = N (xx′ ) = 1 , donc N (x) 6= 0 . Supposons réciproquement que N (x) 6= 0 . Alors λx est inversible. Cependant, même pour un morphisme injectif, ϕ(x) inversible n’entraîne pas que x est inversible : penser à l’inclusion de K[X] dans K(X). Ici, on raisonne comme suit : λx étant inversible, c’est un endomorphisme surjectif et il existe y tel que λx (y) = 1 , i.e. xy = 1 , donc x est inversible. (iii) Si A = K[X]/<X 2 − d> , on prend pour base 1, δ := cl(X) et la matrice de la multipli a bd cation par x := a + bδ dans cette base est , d’où N (x) = a2 − db2 . b a √ Si K = Q et A = Q[ d] on doit distinguer deux cas. Si d est un carré dans Q , alors A = Q = K et N (x) = x. Sinon, on est ramené au cas précédent. Si K = R et A = C, on est encore dans le premier cas, avec d = −1 et δ = i, d’où N (a + bi) = a2 + b2 . Si K = R et A = H , on prend pour base 1, i, j, k. La matrice de la multiplication par a −b −c −d b a −d c . Avec un peu de courage, on x := a + bi + cj + dk, dans cette base est : c d a −b d −c b a 2 2 2 2 2 trouve que le déterminant est (a + b + c + d ) . (On peut se simplifier la vie de la manière suivante : notant M cette matrice, on constate que M tM = (a2 + b2 + c2 + d2 )I4 . En fait, cela revient à mettre à profit l”egalité xx = a2 + b2 + c2 + d2 .) c Dunod 2014 I.1 : Compléments d’algèbre 13 I.1.46 (i) Plutôt que de plagier la démonstration du [L1], en voici une autre. Supposons que xn + a1 xn−1 + · · · + an = 0 et y p + b1 y p−1 + · · · + bp = 0 . Alors le sous–espace vectoriel de A engendré par les xi y j , 0 6 i 6 n − 1 , 0 6 j 6 p − 1 , est stable par multiplication par x et par y (c’est ici qu’intervient l’hypothèse de commutation), d’où l’on déduit que c’est une sous-algèbre de dimension finie, dont tous les éléments sont donc algébriques, en particulier x + y et xy . (ii) Si x := αi + βj + γk est algébrique, alors −x2 = α2 + β 2 + γ 2 l’est également d’après la question (i). Réciproquement, toute équation algébrique satisfaite par −x2 = α2 + β 2 + γ 2 fournit ipso facto une équation algébrique satisfaite par x. Soient x := αi + βj + γk et x′ := α′ i + β ′ j + γ ′ k de norme 1 , c’est-à-dire tels que 2 2 2 α2 + β 2 + γ 2 = α′ + β ′ + γ ′ = 1 . Ils sont donc algébriques. Pour que x + x′ soit algébrique, il faut, et il suffit, que αα′ + ββ ′ + γγ ′ soit algébrique. Les contre-exemples abondent. Par exemple, x := i , α′ transcendant et petit (mettons 1/π ), γ ′ := 0 et β ′ ajusté pour avoir la norme 1 . P I.1.47 Si f ∈ A[[X]] est inversible, f g = 1 ⇒ f (0)g(0) = 1 et f (0) ∈ A∗ . Si f := an X n P ∗ avec a0 ∈ A , le système des équations a0 b0 = 1 et, pour tout n > 1 , ai bj = 0 (qui i+j=n P disent que f g = 1 , où g := bn X n ) peut être résolu par les mêmes formules que dans le n−1 −1 P texte : b0 := a−1 an−i bi . 0 et, pour tout n > 1 , bn := −a0 i=0 Supposons A intègre. Soient f, g ∈ A[[X]] non nuls. Ils sont donc de la forme : P P P f := an X n avec ap 6= 0 et g := bn X n avec bq 6= 0 . Alors f g = cn X n , avec n>p n>q n>r r := p + q et cr := ap bq 6= 0 (puisque A est intègre). Donc f g 6= 0 , et A[[X]] est intègre. En fait, si K désigne le corps des fractions de A, on peut identifier A[[X]] à un sous-anneau de l’anneau intègre K[[X]]. I.1.48 On écrit : √ 1 i 3 1 − X3 2 2iπ/3 1+X +X = = (1 − jX)(1 − j X), où j := e =− + , 1−X 2 2 2 d’où : 2 −1 (1 + X + X ) ce qui donne a = j j − j2 a b = + 1 − jX 1 − j2X et b = avec ( a + b = 1, aj 2 + bj = 0, j2 , d’où enfin : −j j2 (1 + X + X 2 )−1 = X j n+1 − j 2n+2 X n. j − j2 n>0 I.1.49 Puisque f ∈ Gk ⇒ f (0) = 1 , il est clair que Gk est inclus dans K[[X]]∗ ; il est tout aussi clair que 1 ∈ Gk . Remarquons que f ∈ Gk ⇔ f − 1 ∈ <X k > . Si f, g ∈ Gk , on c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 14 écrit : f g − 1 = f (g − 1) + (f − 1) ∈ <X k > , d’où f g ∈ Gk . Enfin, si f ∈ Gk , on écrit f −1 − 1 = −f −1 (f − 1) ∈ <X k > , d’où f −1 ∈ Gk . On a donc bien un sous-groupe. De plus, l’inclusion Gk+1 ⊂ Gk est évidente. Considérons l’application a 7→ (1+aX k ) (mod Gk+1 ) de K dans Gk /Gk+1 . Des relations : (1 + aX k )(1 + bX k ) = 1 + (a + b)X k + abX 2k = 1 + (a + b)X k (1 + abX 2k + · · · ) ≡ 1 + (a + b)X k (mod Gk+1 ), on déduit que c’est un morphisme de groupes. Pour que a appartienne au noyau, il faut, et il suffit, que 1 + aX k ∈ Gk+1 , c’est-à-dire que a = 0 . Le morphisme est donc injectif. Enfin, des relations : 1 + aX k + bX k+1 + · · · = (1 + aX k )(1 + bX k+1 + · · · ) ≡ 1 + aX k (mod Gk+1 ), on déduit que c’est un morphisme surjectif, donc un isomorphisme. I.1.50 Ce qui suit est en fait valable sur tout corps algébriquement clos de caractéristique nulle. Écrivons la décomposition en éléments simples de R ∈ C(X) sous la forme : R=E+ m0 X a0,i i=1 Xi + mλ XX λ∈P i=1 aλ,i , (X − λ)i où E ∈ C[X] est la partie entière et où P est l’ensemble des pôles non nuls de R . Par convention, si 0 n’est pas un pôle de R , on prend m0 := 0 , et le second terme est absent ; dans ce cas, le développement en série de Laurent de R est une série entière. Si 0 est un pôle, m0 > 1 m P0 a0,i . et la partie polaire du développement en série de Laurent de R est la somme i i=1 X Pour la composante en degrés positifs ou nuls du développement en série de Laurent, la contriaλ,i bution de E est explicite, et il faut calculer celle des termes · De l’exercice 21 de la (X − λ)i page 37, on déduit l’égalité : X n + i − 1 a a(−1)i λ−i−n X n . = (X − λ)i k n>0 En prenant λ ∈ P , i ∈ [[1, mλ ]] et a := aλ,i , on obtient tous les termes voulus. (k) 2 (k) (k) (k+1) (k−1) I.1.51 L’identité admise est Hn Hn+2 −Hn Hn+2 = Hn+1 ; on en trouvera par exemple une preuve dans le livre “Problems and Theorems in Analysis, vol. II” de G. Polya et G. Szegö, Springer-Verlag, 1976. (k+1) L’hypothèse est que l’on a, pour n ∈ [[m, m + r − 1]] : Hn = 0 , donc (d’après l’identité (k) (k) (k) 2 (k) de Hadamard), Hn Hn+2 = Hn+1 . Ainsi, si Hn = 0 avec n ∈ [[m, m + r − 1]], (k) (k) (k) alors Hn+1 = 0 ; et si si Hn+2 = 0 avec n ∈ [[m, m + r − 1]], alors Hn+1 = 0 . La première conclusion s’ensuit. La deuxième est alors conséquence immédiate de l’exercice 19 de la page 34. I.1.52 Si une série de K[[X]] est le développement d’une fraction rationnelle de L(X), elle vérifie le critère de l’exercice I.1.51 de la page 55. Si elle vérifie ce critère, c’est le développement d’une fraction rationnelle de K(X). c Dunod 2014 I.1 : Compléments d’algèbre 15 I.1.53 Si D est une dérivation de la K -algèbre K[[X]] telle que D(X) = h, on a D(f ) = f ′ h pour tout polynôme f (calcul direct). On en déduit en particulier que D(X N f ) = N X N −1 hf + X N D(f ) pour toute série formelle f , donc due D est continue. L’égalité D(f ) = f ′ h reste donc vraie pour toute série formelle f . P I.1.54 Écrivant f = an X n , on voit que a0 = 0 , a1 = 1 et, pour n > 2 , (n − 1)an−1 = an , P d’où, par récurrence : an = (n − 1)!. On a donc en fin de compte : f = n! X n+1 . n>0 Cette série formelle de rayon de convergence 0 est appelée série d’Euler. Elle joue un rôle particulier dans la théorie des équations différentielles analytiques complexes dites « irrégulières » ; voir dans [MPA] le chapitre correspondant ainsi que le chapitre sur les développements asymptotiques complexes. I.1.55 Soit (un ) une suite d’éléments deux à deux distincts de K . Alors leurs distances deux à deux sont toutes égales à 1 , et la suite n’admet pas de sous-suite convergente. Donc, pour que K[[X]] soit compact, il est nécessaire que K soit un corps fini. Supposons réciproquement que K est un corps fini. Soit (un ) une suite d’éléments de K[X]. (0) Leurs termes constants ne prenant qu’un nombre fini de valeurs, il y a une sous suite (un ) de (un ) dont tous les éléments ont le même terme constant a0 ∈ K . Il y a de même une sous suite (1) (0) (un ) de (un ) dont tous les éléments ont le même coefficient en degré 1 , soit a1 ∈ K . En (k) itérant, on construit des sous-suites (un ) et des coefficients a0 , . . . , ak tels que : k ∀n ∈ N , u(k) (mod X k+1 ). n ≡ a0 + · · · + ak X P Il est alors facile de conclure que ak X k est un point d’accumulation de la suite (un ). I.1.56 La convergence du produit infini découle du fait que 1−X n → 1 . Les coefficients d’indices n 6 N sont égaux aux coefficients correspondants de : Q N X Y 1 X kn = = n 1 − X n=1 n=1 N Y k>0 X X k1 +2k2 +···+N kN . k1 ,...,kN >0 P 1 Finalement, an X n , où an est le nombre d’écritures de n sous la forme = n n>1 1 − X n>0 k1 + 2k2 + · · · , les ki ∈ N. Il y a une autre description combinatoire en termes de partitions, que nous retrouverons en L3. I.1.57 Rappelons que Pi,k (a1 , . . . , ak ) est le coefficient de X k dans f i , où f := P an X n . On n>0 a clairement P0,k = δ0,k , P1,k = ak , et, pour i > 2 : i f = X n1 ,...,ni >0 an1 · · · ani X n1 +···+ni d’où la formule : Pi,k (a1 , . . . , ak ) = = X k>0 X X n1 +···+ni =k n1 +···+ni =k an1 · · · ani ! Xk, an1 · · · ani . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 16 I.1.58 La substitution de g dans f est possible si, et seulement si, ω(g) > 1 , ce qui est bien le P P cas si g := 0 . Si l’on note f := an X n , c’est la somme de la série convergente an g n , n>0 n>0 laquelle n’a qu’un terme non nul si g := 0 , à savoir a0 . I.1.59 On peut définir, sur n’importe quel corps de caractéristique nulle, les séries formelles P (−1)p 2p P (−1)p X 2p+1 et sin := X . On vérifie sans peine que cos′ = − sin cos := p>0 (2p)! p>0 (2p + 1)! et sin′ = cos. La dérivée de sin2 + cos2 est donc nulle. Comme le terme constant est 1 , on a bien sin2 + cos2 = 1 . I.1.60 On peut par exemple dériver l’égalité √ 1 − 4X = 1 − 2 la page 42). La conclusion est alors immédiate. P 1 n>1 n n X (exercice 24 de 2n−2 n−1 I.1.61 On a : VN +p − VN = N Y (1 + wn ) n=0 N Y ! (1 + wN +p ) − 1 . n=N +1 Le premier facteur est évidemment majoré (en module) par N Q (1 + |wn |). Si l’on développe n=0 le second facteur et que l’on prend le module, l’inégalité triangulaire fournit comme majorant N +p Q le développement de (1 + |wn |) − 1 . On a donc justifié la première majoration. La n=N +1 seconde majoration est conséquence de l’inégalité : 1 + x 6 ex . N P P Puisque la série wn est absolument convergente, le facteur exp |wn | est majoré, les n=0 restes NP +p n=N +1 |wn | tendent vers 0 quand n tend vers l’infini (indépendamment de p, donc les |VN +p − VN | également. D’après le critère de Cauchy, la suite (Vn ) admet donc une limite. N Q Pour montrer que cette limite est non nulle, on peut considérer les inverses : VN′ := vn′ , où n=0 vn′ := vn−1 est bien défini par hypothèse. Alors wn′ := vn′ − 1 = −vn−1 wn . Comme vn tend P ′ P vers 1 , la série |wn | est de même nature que la série |wn |, c’est-à-dire convergente, et l’on déduit de ce qui précède que la suite (Vn′ ) admet une limite dans R. Comme VN VN′ = 1 , l’assertion est démontrée. I.1.62 Lorsque l’on remplace p par p + 1 et n par n + 1 , on a les quotients : p+1/2 p + 1/2 n+1 = p−1/2 n+1 n c Dunod 2014 I.1 : Compléments d’algèbre 17 et : (−1)p+1 (−1)p 2p+2 p+1 2p p n+1 −1 4 p n n+1 −1 p+1 4 n 2(n−p) n−p 2(n−p) n−p = (−1) (2p + 2)(2p + 1) p + 1 p + 1/2 (−1/4) = · 2 (p + 1) n+1 n+1 Il suffit donc de prouver la formule pour p := 0 , ce qui découle du développement de 1 √ dans un exercice antérieur. 1 − 4X De la formule de Stirling on déduit alors : p p − 1/2 C (2p)! 1 −1 √ · ∼ p+1/2 où C := n 4 p! π n c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 18 Module I.2 : Actions de groupes I.2.1 L’élément neutre de G est l’élément neutre multiplicatif 1 de A, et l’on a bien 1n a = a pour tout a ∈ A. Par ailleurs, soient g, h ∈ G et a ∈ A. Puisque A est commutatif, (gh)n = g n hn , d’où g n (hn a) = (gh)n a, ce qui démontre l’associativité mixte. I.2.2 Si X n’a qu’un élément, il en est de même pour X 2 , et l’action ne peut être que transitive. Supposons que X possède au moins deux éléments distincts x, y . Il n’existe alors aucun g ∈ G appliquant (x, x) sur (x, y), c’est-à-dire tel que gx = x et gx = y . L’action de G sur X 2 n’est donc pas transitive, car (x, x) et (x, y) n’appartiennent pas à une même orbite sous G. I.2.3 Pour la transitivité il s’agit, étant donnés deux sous-espaces vectoriels V, V ′ de dimension k de E , de montrer qu’il existe g ∈ GL(E) tel que g(V ) = V ′ . Soient (e1 , . . . , ek ) une base de V et (e′1 , . . . , e′k ) une base de V ′ . On peut compléter la famille libre (e1 , . . . , ek ) en une base (e1 , . . . , en ) de E , et compléter de même la famille (e′1 , . . . , e′k ) en une base (e′1 , . . . , e′n ) de E . Il existe une unique transformation linéaire élément de GL(E) g de E telle que g(ei ) = e′i pour i = 1, . . . , n. L’image par g de V = Vect(e1 , . . . , ek ) est Vect g(e1 ), . . . , g(ek ) = Vect(e′1 , . . . , e′k ) = V ′ . D’où g(V ) = V ′ . Le noyau de l’action de GL(E) sur l’ensemble des sous-espaces de dimension k de E est formé des g ∈ GL(E) tels que g(V ) = V pour tout sous-espace V de dimension k de E . Ce noyau contient évidemment toutes les homothéties λ IdE , λ ∈ K ∗ , car une homothétie laisse stable tout sous-espace vectoriel. Inversement, soit g un élément de ce noyau. Nous allons montrer que g est une homothétie. Pour cela, il suffit de montrer que g laisse stable chaque droite vectorielle D (cf. le module II.3 de [L1]). La droite D peut être définie par n − 1 équations linéaires indépendantes. Autrement dit, il existe sur E des formes linéaires f1 , . . . , fn−1 linéairement indépendantes et telles que D soit l’intersection des hyperplans Ker fi pour i = 1, . . . , n − 1 . Pour toute partie J à n − k éléments de [[1, n − 1]], soit VJ l’intersection des Ker fi pour i ∈ J . C’est un sous-espace de dimension k de E et, par hypothèse, VJ est stable par g . La réunion de toutes les parties à n − k éléments de [[1, n − 1]] est évidemment égale à [[1, n − 1]]. On en déduit que l’intersection des hyperplans VJ , pour toutes les parties à n − k éléments de [[1, n − 1]], est égale à D . Alors D est stable par g , comme intersection de parties stables par g . I.2.4 Notons E la direction de X . Pour la transitivité, soient Y, Y ′ deux sous-espaces affines de dimension k de X et F, F ′ ⊂ E leurs directions respectives. Il s’agit de trouver une transformation affine f de X appliquant Y sur Y ′ . C’est évident si k = 0 . En effet, dans ce −−→ cas, Y := {A} et Y ′ := {A′ } sont des points (singletons), et la translation de vecteur AA′ convient. Supposons donc k > 1 . −−−→ −−−→ Choisissons des points A0 , . . . , Ak de Y tels que A0 , (A0 A1 , . . . , A0 Ak ) soit un repère cartésien de Y . Considérons ensuite une base B := (e1 , . . . , en ) de E complétant la famille −−−→ −−−→ libre (A0 A1 , . . . , A0 Ak ). De la même manière, choisissons des points A′0 , . . . , A′k de Y ′ −−−→ −−−→ tels que A′0 , (A′0 A′1 , . . . , A′0 A′k ) soit un repère cartésien de Y ′ , puis complétons la fa−−−→ −−−→ mille libre (A′0 A′1 , . . . , A′0 A′k ) en une base B ′ := (e′1 , . . . , e′n ) de E . Soit g ∈ GL(E) c Dunod 2014 I.2 : Actions de groupes 19 l’unique transformation linéaire appliquant ei sur e′i pour i = 1, . . . , n. L’applica−−→ tion f : M 7→ A′0 + g(AM ) est une transformation affine de X , appliquant A0 sur A′0 . −−−→ −−−→ Pour tout i ∈ [[1, k]], on a f (Ai ) = f (A0 ) + g(A0 Ai ), soit f (Ai ) = A′0 + A′0 A′i = A′i . Il en résulte que f (Y ) = Y ′ . Soit f un élément du noyau de l’action de GA(X) sur l’ensemble Ak des sous-espaces affines de dimension k de X . Il s’agit de montrer que f est l’identité. C’est évident si k = 0 car, dans ce cas, f laisse stable chaque singleton {M } , i.e. f (M ) = M . Supposons donc k > 1 . Soit M ∈ X , montrons que f (M ) = M . L’application qui à chaque sous-espace affine Y de X contenant M associe sa direction induit une bijection, respectant les inclusions, de l’ensemble des Y ∈ Ak contenant M sur l’ensemble des sous-espaces vectoriels de dimension k de E . Puisque k 6 n − 1 , l’intersection de tous les sous-espaces vectoriels de dimension k de E est nulle. En effet, soit u ∈ E un vecteur non nul. Il existe une base (u1 , . . . , un ) de E telle que u1 = u . Alors u n’appartient pas au sous-espace vectoriel Vect(u2 , . . . , uk+1 ) de E . Il en résulte que l’intersection des sous-espaces Y ∈ Ak contenant M est le singleton {M } . Vu l’hypothèse faite sur f , chaque Y est stable par f , et il en est donc de même pour {M } , autrement dit f (M ) = M . Ceci étant vrai pour tout point M , f est l’identité. Conclusion : le noyau de l’action de GA(X) sur Ak est trivial, ce qui signifie que cette action est fidèle. On comparera ce cas affine avec le cas vectoriel de l’exercice précédent. I.2.5 1. La formule donnant la partie imaginaire de g · z est évidente. Puisque a, b, c, d sont réels, on a en effet : ! az + b (az + b)(cz̄ + d) Im(g · z) = Im = Im 2 cz + d |cz + d| ! 2 ac |z| + bd + (ad + bc) Re z + i(ad − bc) Im z = Im |cz + d|2 = (ad − bc) Im z |cz + d| 2 = Im z |cz + d|2 · La dernière égalité vient du fait que g appartienne à SL2 (R), i.e. ad − bc = 1 . L’égalité que nous venons d’établir montre que g · z ∈ H dès que g ∈ SL2 (R) et z ∈ H , ce qui définit une application de SL2 (R) × H dans H . Il est clair que I2 · z = z pour tout z ∈ H . Soient maintenant g, g ′ ∈ SL2 (R) et z ∈ H . Montrons que g · (g ′ · z) = (gg ′ ) · z . Écri ′ a b a b′ vons g := et g ′ := , puis posons Z := g · z . Alors : c d c′ d′ ′ g · (g ′ · z) = g · Z = ′ z+b a a′ z+d aZ + b ′ + b = ac′ z+b ′ cZ + d c c′ z+d′ + d a(a′ z + b′ ) + b(c′ z + d′ ) (aa′ + bc′ )z + (ab′ + bd′ ) = · ′ ′ ′ ′ c(a z + b ) + d(c z + d ) (ca′ + dc′ )z + (cb′ + dd′ ) ′ a b a b′ aa′ + bc′ ab′ + bd′ D’où la conclusion, puisque = . Nous c d c′ d′ ca′ + dc′ cb′ + dd′ avons donc bien défini une action de SL2 (R) sur H . = c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 20 Montrons que cette action est transitive. Pour cela, il suffit de montrer que l’orbite Ω de i sous SL2 (R) contient tout point ζ de H . C’est évident géométriquement. Posons a := Re ζ √ et b := Im ζ . Par hypothèse b > 0 . Posons β := b . La permutation de H induite par la β 0 matrice diagonale h := est z 7→ β 2 z , c’est-à-dire z 7→ bz . En identifiant un 0 β −1 point de C avec son affixe, c’est la restriction à H de l’homothétie (affine) de centre O et de rapport b , elle applique i sur ib . Ensuite la permutation de H induite par la matrice (de 1 a transvection) t := est z 7→ z + a, c’est la restriction à H de la translation de 0 1 vecteur a. Dans ces conditions, t · (h · i) = t(ib) = a + ib = ζ , donc ζ = (th) · i ∈ Ω. a b Soit g := ∈ SL2 (R). L’égalité g · i s’écrit ai + b = i(ci + d), elle équivaut c d au système formé par les deux égalités a = d et b = −c. Supposons que ces deux égalités soient vérifiées. Puisque det g = 1 , on en déduit que 1 = ad − bc = a2 + c2 . Il existe donc cos θ − sin θ un réel θ tel que a = cos θ et c = sin θ , d’où g = ∈ SO2 (R). La sin θ cos θ réciproque est évidente. Ainsi, pour l’action de SL2 (R) sur H considérée, le stabilisateur de i est SL2 (R)i = SO2 (R). Soit maintenant z un point de H arbitraire. Puisque l’action de SL2 (R) sur H est transitive, il existe g ∈ SL2 (R) tel que z = g · i . La proposition 11 de la page 71 montre alors que le stabilisateur de z est le conjugué du stabilisateur de i par g : SL2 (R)z = gSL2 (R)i g −1 , soit SL2 (R)z = gSO2 (R)g −1 . 2. Il suffit de poser : g · Z = f g · f −1 (Z) pour tout (g, Z) ∈ SL2 (R) × D. (∗) Cette formule a bien un sens. En effet, z := f −1 (Z) ∈ H , donc g · z a été défini dans la question précédente, c’est un point de H , dont l’image par f appartient à D . Si g ∈ SL2 (R), notons ψ(g) l’application Z 7→ g · Z de D dans lui-même. En fait, si ϕ : SL2 (R) → S(H) est le morphisme associé à l’action de SL2 (R) considérée plus haut, la formule (∗) se traduit ainsi : ψ(g) = f ◦ ϕ(g) ◦ f −1 pour tout g ∈ SL2 (R). (∗∗) On en déduit d’abord que, si g ∈ SL2 (R), ψ(g) est une permutation de D , parce que f est une bijection de H sur D et ϕ(g) est une permutation de H . Ensuite, la formule (∗∗) montre que ψ est bien un morphisme de SL2 (R) dans S(D), ce qui veut dire que la formule (∗) définit bien une action de SL2 (R) sur D . Explicitons f −1 . Il suffit de résoudre l’équation (z − i)/(z + i) = Z par rapport à z : f −1 (Z) = Soient g := c Dunod 2014 α γ β δ i(1 + Z) 1−Z pour tout Z ∈ D. ∈ SL2 (R) et s := ψ(g). Considérons un point Z ∈ D et po- I.2 : Actions de groupes 21 sons z := f −1 (Z) ∈ H . Alors g · z = (αz + β)/(γz + δ), d’où : (αz + β)/(γz + δ) − i s(Z) = f (g · z) = f (αz + β)/(γz + δ) = (αz + β)/(γz + δ) + i (αz + β) − i(γz + δ) (α − iγ)z + (β − iδ) = = = (αz + β) + i(γz + δ) (α + iγ)z + (β + iδ) (γ − β) + i(α + δ) Z + (γ + β) + i(α − δ) = −(γ + β) + i(α − δ) Z + (β − γ) + i(α + δ) (α + δ) + i(β − γ) Z + (α − δ) − i(β + γ) = = (α − δ) + i(β + γ) Z + (α + δ) − i(β − γ) u := (α − iγ) i(1+Z) 1−Z + (β − iδ) (α + iγ) i(1+Z) 1−Z + (β + iδ) u(Z + a) , 1 + Za′ en posant : (α + δ) + i(β − γ) (α − δ) − i(β + γ) (α − δ) + i(β + γ) , a := , a′ := · (α + δ) − i(β − γ) (α + δ) + i(β − γ) (α + δ) − i(β − γ) Il est clair que |u| = 1 et a′ = ā. Il reste à montrer l’inégalité |a| < 1 . Elle équivaut 2 2 à |(α − δ) − i(β + γ)| < |(α + δ) + i(β − γ)| , ce qui s’écrit : (α + δ)2 − (α − δ)2 − (β + γ)2 − (β − γ)2 = 4(αδ − βγ) > 0, ce qui est vrai parce que g ∈ SL2 (R). Ainsi, s := ψ(g) est de la forme annoncée. Il reste la réciproque. Soient donc u, a ∈ C tels que |u| = 1 et |a| < 1 . Notons s la permutation Z 7→ u(Z +a)/(1+āZ) de D . Pour tout Z ∈ D , noter que 1+āZ 6= 0 puisque |āZ| < 1 . En outre s(Z) ∈ D , à cause du calcul suivant : 2 2 2 2 2 2 |1 + āZ| − |Z + a| = 1 + |a| |Z| + 2 Re(āZ) − |Z| + |a| + 2 Re(āZ) 2 2 = (1 − |a| )(1 − |Z| ) > 0. Ainsi, s est en tout cas une application de D dans lui-même. Pour conclure, vu les calculs ci-dessus, il suffit de prouver qu’il existe (α, β, γ, δ) ∈ R4 vérifiant les conditions : (α − δ) − i(β + γ) (α + δ) + i(β − γ) = u, = a (α + δ) − i(β − γ) (α + δ) + i(β − γ) et αδ − βγ = 1. (∗∗∗) Soit θ ∈ R tel que u := e2iθ . Montrons que le quadruplet (α, β, γ, δ) défini par les formules ci-dessous convient : Re eiθ (1 + a) Im eiθ (1 − a) q q α := , β := 2 2 1 − |a| 1 − |a| − Im eiθ (1 + a) Re eiθ (1 − a) q q γ := , δ := · 1 − |a|2 1 − |a|2 q Soit t := 2e / 1 − |a|2 . D’abord t/t̄ = e2iθ = u . Ensuite, il vient : iθ 2α = Re t(1 + a) , 2β = Im t(1 − a) , 2γ = − Im t(1 + a) , 2δ = Re t(1 − a) , (α + δ) + i(β − γ) = t et (α − δ) − i(β + γ) = ta, c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 22 ce qui montre que les deux premières égalités (∗∗∗) sont vérifiées. La troisième aussi : 4(αδ − βγ) = Re(t(1 + a) Re t(1 − a) + Im t(1 + a) Im t(1 − a) = Re t(1 + a) t(1 − a) = |t|2 Re(1 − |a|2 + a − ā) 2 2 = |t| (1 − |a| ) = 4. I.2.6 Soient y un point quelconque de Y et Ω son orbite sous G. Puisque G est fini, cette orbite est finie, car l’application g 7→ g(y) de G dans X a pour image Ω, par définition d’une orbite. Posons N := card (Ω). Notons ω l’isobarycentre de Ω, c’est-à-dire le barycentre des points de Ω, chacun étant affecté du coefficient 1/N . La partie Y étant stable sous G, Ω est contenue dans Y . Par hypothèse, Y est convexe, donc ω appartient à Y (cf. la section 5.1 de la page 444). Il suffit maintenant de montrer que ω est un point fixe sous l’action de G. Soit donc g ∈ G. En premier lieu, g est affine, donc conserve les barycentres. Puisque ω est le barycentre de la famille (t, 1/N )t∈Ω , son image par g est le barycentre de la fa mille g(t), 1/N t∈Ω . Mais t 7→ g(t) est une permutation de Ω, parce que Ω est stable sous g . Par commutativité des barycentres, il en résulte que g(ω) = ω . I.2.7 1. Par définition, NG (H) := g ∈ G | gHg −1 = H . Comme tout stabilisateur d’un point dans une action de groupe, c’est un sous-groupe de G. Il contient H car, pour tout h ∈ H , hH = H et de même Hh−1 = H . La première égalité, par exemple, vient du fait que h′ 7→ hh′ soit une bijection de H sur lui-même, la bijection réciproque étant h′ 7→ h−1 h′ . Puisque gHg −1 = H pour tout g ∈ NG (H), H est un sous-groupe distingué de NG (H). Inversement, soit M un sous-groupe de G contenant H , et supposons que H soit un sousgroupe distingué de M . Pour tout g ∈ M , on a donc gHg −1 = H , d’où g ∈ NG (H). Ceci étant vrai pour tout g ∈ M , M est inclus dans NG (H). 2. D’abord HK contient 1 , parce que 1 ∈ H et 1 ∈ K . Étant donnés deux éléments x, y de HK , il s’agit de démontrer que xy et x−1 appartiennent à HK . Par définition de HK , il existe deux couples (h, k), (h′ , k ′ ) ∈ H × K tels que x := hk et y := h′ k ′ . Alors xy = (hk)(h′ k ′ ) = h(kh′ k −1 )(kk ′ ). Puisque k ∈ NG (H), h1 := kh′ k −1 ∈ H , donc hh1 ∈ H ( H est un sous-groupe de G). De plus kk ′ ∈ K ( K est un sous-groupe de G), d’où xy = (hh1 )(kk ′ ) ∈ HK . De même k −1 ∈ NG (H), donc h2 := k −1 h−1 k ∈ H . Enfin, on a : x−1 = (hk)−1 = k −1 h−1 = (k −1 h−1 k)k −1 = h2 k −1 ∈ HK. il en résulte que HK est un sous-groupe de G. I.2.8 Soit a ∈ C∗ . Il existe un unique morphisme ϕa de l’algèbre C[X] dans elle-même appliquant X sur aX (substitution de aX à X ). Par définition, a·P = ϕa (P ) pour tout P ∈ C[X]. Soient a, b ∈ C∗ . Le composé ϕa ◦ ϕb est un morphisme de l’algèbre C[X] dans ellemême, appliquant X sur ϕa (bX) = b(aX) = (ab)X . Ce morphisme est donc égal à ϕab . Ainsi a · (b · P ) = (ab) · P pour tout polynôme P et tous a, b ∈ C∗ . Il est clair que 1 · P = P pour tout P , donc (a, P ) 7→ a · P est une action de C∗ sur C[X]. Le morphisme de C∗ dans S C[X] correspondant est a 7→ ϕa . c Dunod 2014 I.2 : Actions de groupes 23 Soit donc a ∈ C∗ . Puisque ϕa est un morphisme bijectif de l’algèbre C[X] sur elle-même, c’est un automorphisme de cette algèbre. L’ensemble A des points fixes de ϕa est alors une sous-algèbre de C[X], i.e. c’est un sous-espace vectoriel contenant 1 et stable par multiplication. Explicitons cette sous-algèbre en fonction de a. Bien entendu, A contient déjà C (polynômes constants), puisque c’est un sous-espace vectoriel de C[X] contenant 1 . Considérons un polynôme P , de degré n > 1 . Il sécrit P := cn X n + · · · + c1 X + c0 , avec cn 6= 0 . Par définition, a · P = ϕa (P ) est défini par : a · P := P (aX) = cn (aX)n + · · · + c1 (aX) + c0 . n P Ainsi a · P − P = ck (ak − 1)X k . Un polynôme étant nul si, et seulement si, tous ses k=0 coefficients sont nuls, P appartient à A si, et seulement si, ck (ak −1) = 0 pour tout k ∈ [[0, n]], ou encore pour tout k ∈ [[1, n]]. Distinguons alors deux cas. 1. Supposons d’abord que a ne soit pas une racine de l’unité. Alors ak 6= 1 pour tout entier k > 1 . Si donc P ∈ A, le calcul ci-dessus montre que tous les coefficients de P sont nuls, sauf peut-être le coefficient constant. Il en résulte que A = C. 2. Supposons que a soit une racine de l’unité, notons p > 1 son ordre. Ainsi, a est une racine p ème de l’unité, i.e. un élément d’ordre p du groupe (C∗ , ×). Pour tout entier k ∈ Z, il en résulte que ak = 1 si, et seulement si, k est un multiple de p. Un polynôme P écrit comme ci-dessus appartient donc à A si, et seulement si, pour tout k ∈ N non multiple de p, le coefficient de degré k de P est nul. Cela revient à dire que P est une somme finie de termes du type cX hp , où h ∈ N et c ∈ C, ou encore que P est un polynôme en X p , i.e. un élément de C[X p ]. Dans ce cas, la sous-algèbre A est égale à C[X p ]. Conclusion : la sous-algèbre A est donnée par la formule suivante : ( C si a n’est pas racine de l’unité, A = C[X p ] si a est une racine pème primitive de l’unité, p > 1. I.2.9 1. Pour simplifier, notons ici X (k) l’ensemble des k -uplets injectifs d’éléments de X . Supposons que l’action de G sur X soit k fois transitive. Autrement dit, l’action natu relle g, (x1 , . . . , xk ) 7→ (gx1 , . . . , gxk ) de G sur X (k) est transitive. En particulier, X (k) n’est pas vide, i.e. card (X) > k . Considérons un point a ∈ X , et montrons que l’orbite G · a est égale à X . Soit b ∈ X . Puisque card (X) > k , il existe deux k -uplets ξ := (x1 , . . . , xk ) et η := (y1 , . . . , yk ) appartenant à X (k) tels que x1 = a et y1 = b . Par hypothèse, il existe g ∈ G tel que g · ξ = η , c’est-à-dire gxi = yi pour i = 1, . . . , k . En particulier, ga = gx1 = y1 = b , donc b ∈ G · a. Ainsi G · a = X , ce qui signifie que l’action de G sur X est transitive. Le fait que l’action de Ga sur X \ {a} soit k − 1 -fois transitive est évident. En effet, soient ξ ′ := (u2 , . . . , uk ) et η ′ := (v2 , . . . , vk ) deux (k − 1)-uplets injectifs de X \ {a} . Alors (a, u2 , . . . , uk ) et (a, v2 , . . . , vk ) appartiennent à X (k) . Par hypothèse, il existe g ∈ G tel que g · (a, u2 , . . . , uk ) = (a, v2 , . . . , vk ), c’est-à-dire ga = a et gui = vi pour i = 2, . . . , k . En résumé, g ∈ Ga applique ξ ′ sur η ′ , d’où la conclusion. Supposons inversement que l’opération de G sur X soit transitive et que l’opération de Ga sur X \ {a} soit k − 1 fois transitive. D’abord card X \ {a} > k − 1 , donc card (X) > k . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 24 Soient ξ := (x1 , . . . , xk ) et η := (y1 , . . . , yk ) deux éléments de X (k) . Il s’agit de démontrer l’existence d’un élément g de G tel que g · ξ = η . Puisque G agit transitivement sur X , il existe γ, δ ∈ G tels que γx1 = a et δa = y1 . Considérons les deux k -uplets injectifs γ · ξ = (a, γx2 , . . . , γxk ) et δ −1 · η = (a, δ −1 y2 , . . . , δ −1 yk ). Puisque l’opération de Ga sur X \ {a} est k − 1 fois transitive, il existe h ∈ Ga tel que h · (γx2 , . . . , γxk ) = (δ −1 y2 , . . . , δ −1 yk ). Posons g := δhγ ∈ G. D’abord gx1 = y1 . En effet, gx1 = (δhγ)x1 = (δh)a = δ(ha) = δa = y1 . Soit ensuite i ∈ [[2, k]]. Cette fois, on a gxi = δ h(γxi ) = δ(δ −1 yi ) = yi . Finalement, gxi = yi pour i = 1, . . . , k , donc g·ξ = η . 2. Notons E la direction de X . Soient (A, A′ ) et (B, B ′ ) deux couples injectifs de points −−→ −−→ de X . Puisque les vecteurs AA′ , BB ′ ∈ E sont non nuls, il existe g ∈ GL(E) tel −−→ −−→ −−→ que g(AA′ ) = BB ′ (en vertu de l’exercice 3 de la page 66). L’application M 7→ B + g(AM ) de X dans lui-même est affine et bijective, parce que g est linéaire et bijective. Autrement −−→ −−→ dit, f ∈ GA(X). Ensuite, f (A) = B + g(0) = B , et f (A′ ) = B + g(AA′ ) = B + BB ′ = B ′ , donc f applique (A, A′ ) sur (B, B ′ , ce qui établit la double transitivité de l’action de GA(X) sur X . 3. Notons D l’ensemble des droites vectorielles de E . Puisque n > 2 , D a au moins deux éléments. Considérons deux couples injectifs (D1 , D2 ), (D1′ , D2′ ) d’éléments de D . Pour i = 1, 2 , choisissons des vecteurs non nuls xi ∈ Di et x′i ∈ Di′ . Puisque D1 6= D2 , (x1 , x2 ) est une famille libre de E , on peut la compléter en une base (x1 , . . . , xn ) de E . De même, la famille libre (x′1 , x′2 ) peut être complétée en une base (x′1 , . . . , x′n ) de E . Soit g ∈ GL(E) l’unique transformation linéaire telle que g(xi ) = x′i pour i = 1, . . . , n. De g(x1 ) = x′1 , on tire g(D1 ) = g(Kx1 ) = Kg(x1 ) = Kx′1 = D1′ et de même g(D2 ) = D2′ , ce qui établit la double transitivité de l’opération de GL(E) sur D . Si n > 3 , nous allons montrer que l’opération de GL(E) sur D n’est pas 3 fois transitive. Considérons trois vecteurs linéairement indépendants x, y, z . Les droites Kx, Ky, Kz sont deux à deux distinctes, et il en est de même pour les droites Kx, Ky, K(x + y). Cependant, il n’existe pas d’élément g ∈ GL(E) appliquant Kx, Ky, Kz sur Kx, Ky, K(x + y) respectivement. Supposons en effet qu’un tel g existe. Puisque g(Kx) = Kx, g(Ky) = Ky et g(Kz) = K(x + y), il existe λ, µ, ν ∈ K ∗ tels que g(x) = λx, g(y) = µy et g(z) = ν(x + y). C’est absurde, car la famille (x, y, z) est libre, alors que son image λx, µy, ν(x+y) par l’application linéaire et bijective g est liée. L’opération de GL(E) sur D n’est donc pas 3 fois transitive. Supposons que n soit égal à 2 , et montrons cette fois que l’opération de GL(E) sur D est 3 fois transitive. Considérons deux triplets injectifs (D1 , D2 , D3 ), (D1′ , D2′ , D3′ ) d’éléments de D . Pour i = 1, 2, 3 , choisissons des vecteurs non nuls xi ∈ Di et x′i ∈ Di′ . Puisque D1 6= D2 , (x1 , x2 ) est une famille libre de E , c’est donc une base de E car dim E = 2 . Il existe donc un unique couple (λ1 , λ2 ) ∈ K 2 tel que x3 = λ1 x1 + λ2 x2 . De plus, λ1 et λ2 sont non nuls, car la droite D3 est distincte de D1 et D2 . De même, il existe unique couple (λ′1 , λ′2 ) ∈ (K ∗ )2 tel que x′3 = λ′1 x′1 + λ′2 x′2 . Soit g ∈ GL(E) ′ ′ −1 ′ l’unique transformation appliquant la base (x1 , x2 ) sur la base λ′1 λ−1 1 x1 , λ2 λ2 x2 . Évidemment, g(D1 ) = D1′ et g(D2 ) = D2′ . D’autre part, on a : ′ ′ −1 ′ g(x3 ) = g(λ1 x1 + λ2 x2 ) = λ1 g(x1 ) + λ2 g(x2 ) = λ1 (λ′1 λ−1 1 x1 ) + λ2 (λ2 λ2 x2 ) = λ′1 x′1 + λ′2 x′2 = x′3 , c Dunod 2014 d’où g(D3 ) = D3′ . I.2 : Actions de groupes 25 Ainsi, g ·(D1 , D2 , D3 ) = (D1′ , D2′ , D3′ ), d’où la triple transitivité de l’action de GL(E) sur D . 4. Soient (j1 , . . . , jn ) et (k1 , . . . , kn ) deux n-uplets injectifs de points de [[1, n]]. Par définition même, l’application s : i 7→ ji de [[1, n]] dans lui-même est injective, donc bijective. Autrement dit, s ∈ Sn . De même, l’application t : i 7→ ki de [[1, n]] dans lui-même appartient à Sn . Pour tout i ∈ [[1, n]], s(i) = ji et t(i) = ki . En posant g := t ◦ s−1 ∈ Sn , on a donc g(ji ) = t s−1 s(i) = t(i) = ki , donc g · (j1 , . . . , jn ) = (k1 , . . . , kn ). L’opération de Sn sur [[1, n]] est donc n fois transitive. Supposons n > 3 , et soient (j1 , . . . , jn−2 ) et (k1 , . . . , kn−2 ) deux (n − 2)-uplets injectifs de points de [[1, n]]. Notons jn−1 , jn les deux éléments (pris dans un ordre arbitraire) de [[1, n]] distincts de j1 , . . . , jn−2 et kn−1 , kn les deux éléments de [[1, n]] distincts de k1 , . . . , kn−2 . D’après le point précédent, il existe une permutation s ∈ Sn telle que s(ji ) = ki pour i = 1, . . . , n. En particulier, s · (j1 , . . . , jn−2 ) = (k1 , . . . , kn−2 ). Si s ∈ An , on a gagné. Sinon, considérons la transposition t := (jn−1 jn ). On observe qu’elle laisse fixe (j1 , . . . , jn−2 ). Alors g := s ◦ t ∈ An (parce que t est une permutation impaire), et g ·(j1 , . . . , jn−2 ) = (k1 , . . . , kn−2 ). Dans les deux cas, nous avons trouvé un élément de An appliquant (j1 , . . . , jn−2 ) sur (k1 , . . . , kn−2 ), ce qui établit la (n − 2)-transitivité de l’action de An sur [[1, n]]. I.2.10 1. Implication a) =⇒ b). Soit Y une partie non vide de X satisfaisant la condition énoncée en b). Supposons que Y ne soit pas un singleton, et montrons que Y = X . Choisissons un point y de Y . Dans un premier temps, montrons que H ′ := h′ ∈ G | h′ y ∈ Y est un sous-groupe de G. Il est clair que H ′ contient Gy , en particulier 1 ∈ H ′ . Soient h′1 , h′2 ∈ H ′ . L’élément g := h′2 (h′1 )−1 ∈ G applique h′1 y sur h′2 y . Par définition de H ′ , h′1 y et h′2 y appartiennent à Y . On en déduit que h′2 y ∈ Y ∩ gY . Vu l’hypothèse faite sur Y , gY = Y . En particulier, gy ∈ Y , c’està-dire g ∈ H ′ . Nous avons ainsi montré que h′2 (h′1 )−1 appartient à H ′ , et donc H ′ est un sous-groupe de G contenant Gy . De plus, H ′ 6= Gy . En effet, Y contient par hypothèse un point y ′ 6= y . Puisque l’action de G sur X est transitive, il existe h′ ∈ G tel que y ′ = h′ y . Alors h′ ∈ H ′ parce que h′ y = y ′ ∈ Y , mais h′ ∈ / Gy parce que h′ y = y ′ 6= y . Puisque l’action de G sur X est transitive, il existe γ ∈ G tel que y = γa. La proposition 11 de la page 71 montre alors que Gy = γGa γ −1 . En conjuguant par γ −1 , on voit donc que H := γ −1 H ′ γ est un sous-groupe de G contenant Ga strictement. D’après l’hypothèse, H = G, d’où H ′ = γHγ −1 = G. Soit alors x un élément arbitraire de X . Il existe g ∈ G tel que x = gy . Alors g ∈ G = H ′ , donc x = gy ∈ Y , par définition de H ′ . D’où Y = X . Implication b) =⇒ a). Soit donc H un sous-groupe de G contenant Ga . Supposons H 6= Ga , et montrons que H = G. Montrons que la partie Y := H · a possède la propriété énoncée en b). Soit g ∈ G tel que Y ∩ g · Y ne soit pas vide, et soit z un point de cette intersection. Il existe donc h, h′ ∈ H tels que h′ a = z = g(ha). Alors h′−1 gh ∈ Ga ⊂ H , donc g ∈ H . Mais alors, gY = g · (H · a) = (gH) · a = H · a = Y , comme désiré. La partie Y contient a. Ce n’est pas le singleton {a} , car sinon H · a = {a} , d’où ha = a pour tout h ∈ H , c’est-à-dire H ⊂ Ga , ce qui contredit l’hypothèse. La condition b) étant vérifiée, Y = X , c’est-à-dire H · a = X . Soit alors γ un élément quelconque de G. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 26 Puisque γa ∈ X = H · a, il existe h ∈ H tel que γa = ha. Alors h−1 γ ∈ Ga ⊂ H , donc γ = h(h−1 γ) ∈ H . D’où H = G, comme désiré. 2. Posons donc Y := K ·a. Montrons que Y possède la propriété énoncée en b). Soit g ∈ G tel que Y ∩ g · Y ne soit pas vide, et soit z un point de cette intersection. Il existe donc k, k ′ ∈ K tels que k ′ a = z = g(ka). Alors γ := k ′−1 gk ∈ Ga . Puisque K est un sous-groupe distingué de G, k1 := gkg −1 ∈ K , et γ = k ′−1 k1 g , d’où g = k2 γ , avec k2 := k1−1 k ′ ∈ K . Dans ces conditions, il vient : g · Y = g · (K · a) = (gK) · a = (Kg) · a = K · (ga) = K · (k2 γ)a = K · (k2 a) = (Kk2 ) · a = K · a = Y. Ainsi, Y possède la propriété énoncée en b), de sorte que K · a est par hypothèse égal à X ou à {a} . Dans le premier cas, l’opération de K sur X est transitive. Supposons au contraire que cette opération ne soit pas transitive. Alors K · a = {a} , i.e. le point a est fixe sous l’action de K . L’idée est maintenant de remarquer que le fait que l’action de G sur X soit primitive ne dépend pas du choix du point a ∈ X (la condition b) ne dépend pas de a). Dans ces conditions, tout point x ∈ X est un point fixe de K , ce qui signifie que K opère trivialement sur X . 3. Supposons donc que l’action de G sur X soit deux fois transitive. D’après l’exercice I.2.9 de la page 90, l’action de G sur X est en particulier transitive. Soit a ∈ X . Pour prouver que l’action de G sur X est primitive, il suffit de montrer que tout sous-groupe de G contenant Ga strictement est égal à G. Soit H un tel sous-groupe. Puisque H 6⊂ Ga , il existe h ∈ H tel que ha soit distinct de a. Soit alors g un élément quelconque de G, montrons que g ∈ H . C’est clair si g ∈ Ga . Supposons donc ga 6= a. L’action de G sur X étant deux fois transitive, il existe γ ∈ Ga tel que γ(ha) = ga. Alors γ et h appartiennent à H , ainsi que (γh)−1 g , donc g ∈ H . En conclusion, tout élément g de G appartient à H , donc H = G. I.2.11 Tout élément g de G conserve les distances (d’où le nom d’isométrie) : si A, B ∈ R2 , d g(A), g(B) = d(A, B). En effet, puisque ~g ∈ O(R2 ), on a : −−−−−−→ −−→ −−→ d g(A), g(B) = kg(A)g(B)k = k~g(AB)k = kABk = d(A, B). a) Précisons ensuite quelques notations. L’ensemble des droites affines de R2 est noté D . Pour tout vecteur ~u de R2 , on désigne par tu~ la translation de vecteur ~u , c’est un élément de G. Pour toute droite D ∈ D , on note SD la symétrie orthogonale par rapport à D (ou réflexion d’axe D ). À tout point M ∈ R2 , SD associe le point M ′ caractérisé par les deux propriétés −−−→ → − suivantes : M M ′ est orthogonal à D et le milieu de M M ′ appartient à D . La partie linéaire → − de SD est la symétrie (vectorielle) orthogonale par rapport à D , de sorte que SD ∈ G. b) L’action de SO(R2 ) sur l’ensemble des droites vectorielles de R2 est transitive. Cela résulte si l’on veut de l’exercice 5 de la page 67, puisque chaque droite vectorielle contient exactement deux vecteurs unitaires (opposés). Montrons alors que l’action de G sur D est transitive. Ce qui précède montre que toutes les droites passant par l’origine appartiennent à une même orbite de G sur D , notons-la Ω. Soit D ∈ D . Étant donné un point A de D , la −→ − →. droite D′ := D + AO passe par l’origine, et D est l’image de D′ par la translation t− OA ′ − → ∈ G et D ∈ Ω, on en déduit que D ∈ Ω, d’où Ω = D , comme désiré. Puisque t− OA c) Cherchons ensuite à décrire les orbites de G sur l’ensemble P des paires de droites affines de R2 . Cet ensemble est réunion disjointe de l’ensemble P ′ des paires de droites parallèles et c Dunod 2014 I.2 : Actions de groupes 27 de son complémentaire P ′′ . L’ensemble P ′ est stable sous l’action de G et même du groupe affine GA(R2 ). En effet, les images par une application affine de deux droites parallèles sont deux droites parallèles. L’ensemble P ′′ est donc lui aussi stable sous l’action de G. → − Soit {D, D′ } ∈ P ′ : D et D′ sont parallèles et distinctes, elles ont même direction D . → − Il existe un unique vecteur ~u orthogonal à D tel que D′ = D + ~u . De plus, pour tout point A de D , la distance d(D, D′ ) (distance de D à D′ ), est égale à k~uk , ou encore à AA′ = d(A, A′ ), en posant A′ := A + ~u ∈ D′ . Soit alors {D1 , D1′ } un autre élément de P ′ . Montrons que {D, D′ } et {D1 , D1′ } appartiennent à une même orbite sous G si, et seulement si, d(D, D′ ) = d(D1 , D1′ ). La nécessité est évidente : s’il existe un élément g de G appliquant {D, D′ } sur {D1 , D1′ } , on a par exemple g(D) = D1 et g(D′ ) = D1′ , quitte à échanger D et D′ , ce qui ne modifie pas d(D, D′ ). Puisque g conserve les dis tances, d(D1 , D1′ ) = d g(D), g(D′ ) = d(D, D′ ). Supposons inversement que d(D, D′ ) = d(D1 , D1′ ). Il existe d’abord h ∈ G tel que h(D) = D1 , vu la transitivité de l’action de G sur D . Posons D2′ := h(D′ ). Alors D2′ est parallèle à D1 , et d(D1 , D2′ ) = d h(D), h(D′ ) = d(D, D′ ) = d(D1 , D1′ ). On en →, − → déduit que D2′ est égale soit à D1′ , soit à SD1 (D1′ ). Soient en effet − u 1 u2 les vecteurs −→⊥ → et D′ = D + − → . Les vecteurs − →, − → de D1 tels que D1′ = D1 + − u u u 1 1 2 1 u2 ont même norme, 2 − → égale à d(D1 , D1′ ), et ils appartiennent à la droite vectorielle D1 ⊥ . Ces deux vecteurs sont donc égaux ou opposés, d’où notre assertion. Si D2′ = D1′ , h · {D, D′ } = {D1 , D1′ } . Sinon, (SD1 ◦ h) · {D, D′ } = {D1 , D1′ } . Dans les deux cas, {D, D′ } et {D1 , D1′ } sont dans une même orbite sous G. d) Il reste à décrire les orbites de P ′′ sous G. C’est ici la notion d’angle (de deux droites) qui va remplacer celle de distance, utilisée ci-dessus. Précisons de quoi il s’agit. Soient D, D′ deux droites affines distinctes se coupant en un point A. Considérons un point M de D distinct de A et un point M ′ de D′ distinct de A. Posons : −−→ −−→ ( AM | AM ′ ) · θ := arccos AM · AM ′ Ce réel est évidemment indépendant du choix des points M, M ′ (à cause de la valeur absolue), et il appartient à ]0, π/2] ; c’est l’angle (non orienté) de D et D′ , notons-le ici [D, D′ ]. On observera que [D′ , D] = [D, D′ ]. Montrons que deux éléments {D, D′ } et {∆, ∆′ } de P ′′ appartiennent à une même orbite sous G si, et seulement si, les angles θ := [D, D′ ] et η := [∆, ∆′ ] sont égaux. Notons A le point d’intersection de D et D′ . Choisissons un point M ∈ D tel que AM = 1 et un −−→ −−→ point M ′ ∈ D′ tel que AM ′ = 1 . Alors ( AM | AM ′ ) = ± cos θ . Quitte à remplacer M ′ −−→ −−→ par son symétrique par rapport à A, on peut supposer que ( AM | AM ′ ) = cos θ . De même, en notant B le point d’intersection de ∆ et ∆′ , il existe des points N ∈ ∆ et N ′ ∈ ∆′ tels −−→ −−→ que BN = BN ′ = 1 et ( BN | BN ′ ) = cos η . Supposons d’abord qu’il existe une isométrie g ∈ G telle que g · {D, D′ } = {∆, ∆′ } . Quitte à échanger D, D′ , nous pouvons supposer que g(D) = ∆ et g(D′ ) = ∆′ , de sorte que g(A) = B . Posons P := g(M ) et P ′ := g(M ′ ). Puisque ~g ∈ O(R2 ), les produits c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 28 −−→ −−→ −−→ −−→ scalaires ( AM | AM ′ ) et ( BP | BP ′ ) sont égaux, de même BP = 1 = BP ′ , d’où : −−→ −−→ −−→ −−→ ( AM | AM ′ ) ( BP | BP ′ ) θ = arccos = arccos = η. AM · AM ′ BP · BP ′ Supposons inversement que θ = η . Soit γ ∈ GL(R2 ) l’unique transformation linéaire ap−−→ −−→ −−→ −−→ pliquant la base (AM , AM ′ ) sur la base (BN , BN ′ ). C’est une transformation orthogonale, −−→ −−→ −−→ −−→ car AM = BN = 1 , AM ′ = BN ′ = 1 et ( AM | AM ′ ) = cos θ = ( BN | BN ′ ) . L’appli−→ cation g : P 7→ B + γ(AP ) est alors une isométrie de R2 , appliquant A, M, M ′ sur B, N, N ′ respectivement. Ainsi, g(D) = ∆ et g(D′ ) = ∆′ , d’où g · {D, D′ } = {∆, ∆′ } . Conclusion : considérons deux paires de droites {D, D′ } et {∆, ∆′ } . Ces deux paires appartiennent à une même orbite sous G si, et seulement si, - ou bien D, D′ sont parallèles, ∆, ∆′ sont parallèles, et les distances d(D, D′ ), d(∆, ∆′ ) sont égales, - ou bien D, D′ sont concourantes, ∆, ∆′ sont concourantes, et les angles [D, D′ ], [∆, ∆′ ] sont égaux. On en déduit une paramétrisation des orbites de P sous G. Ces orbites sont les suivantes : - pour tout réel δ > 0 , l’ensemble des paires de droites parallèles à distance δ l’une de l’autre ; - pour tout réel θ ∈ ]0, π/2], l’ensemble des paires de droites concourantes formant entre elles un angle égal à θ . I.2.12 1. Implication a) =⇒ c). −−−→ −−−→ Soit F le sous-espace vectoriel de E engendré par les vecteurs A0 A1 . . . , A0 An . Alors Y := A0 + F est un sous-espace affine de X , de direction F , et les points A0 , . . . , An appartiennent à Y . Vu l’hypothèse, Y = X , donc F = E . Puisque E est de dimen−−−→ −−−→ sion n, (A0 A1 . . . , A0 An ) est une base de E . Implication c) =⇒ b). Considérons un point M de X . Il existe un unique n-uplet (λ1 , . . . , λn ) ∈ K n tel n n P P −−−→ −−−→ que A0 M = λi A0 Ai . Si l’on pose λ0 := 1 − λi , le point M est barycentre i=1 i=1 de (A0 , λ0 ), . . . , (An , λn ) . Inversement, soient µ0 , . . . , µn des scalaires de somme 1 tels n P −−−→ −−−→ que le point M soit barycentre de (A0 , µ0 ), . . . , (An , µn ) . Alors A0 M = µi A0 Ai , i=1 donc (µ1 , . . . , µn ) = (λ1 , . . . , λn ). On en déduit évidemment que µ0 = λ0 , ce qui établit la propriété d’unicité annoncée. Implication b) =⇒ a). Soit Y un sous-espace affine de X contenant A0 , . . . , An . Considérons un point M ∈ X . Par hypothèse, il existe des scalaires λ0 , . . . , λn de somme 1 tels que M soit barycentre de la famille (A0 , λ0 ), . . . , (An , λn ) . Comme chaque Ai appartient à Y , le point M appartient à Y , car tout sous-espace affine est « stable par barycentre ». Conclusion : Y = X . 2. L’ensemble B des bases affines de X est stable par l’action naturelle du groupe GA(X) sur X n+1 , d’où une action de GA(X) sur B . Soient en effet β := (A0 , . . . , An ) une base affine de X et g une transformation affine de X . Si Y est un sous-espace affine de X contenant c Dunod 2014 I.2 : Actions de groupes 29 tous les points g(Ai ), g −1 (Y ) est un sous-espace affine de X contenant tous les Ai . Par défini tion d’une base affine, g −1 (Y ) = X , d’où ( g étant surjective) Y = g g −1 (Y ) = g(X) = X . Ainsi, g(β) est une base affine de X . Montrons que l’action de GA(X) sur B est simplement transitive. Considérons deux bases affines de X : β := (A0 , . . . , An ) et β ′ := (A′0 , . . . , A′n ). Il s’agit de prouver qu’il existe une unique transformation affine g de X telle que g(Ai ) = A′i pour i = 0, . . . , n. Ces n + 1 −−−→ −−−→ égalités sont équivalentes aux suivantes : g(A0 ) = A′0 et ~g (A0 Ai ) = A′0 A′i pour i = 1, . . . , n. −−−→ −−−→ −−−→ −−−→ Puisque (A0 A1 , . . . , A0 An ) et (A′0 A′1 , . . . , A′0 A′n ) sont deux bases de E , il existe une unique −−−→ −−−→ transformation linéaire γ de E telle que γ(A0 Ai ) = A′0 A′i pour i = 1, . . . , n. Il est alors clair qu’il y a une seule transformation affine g de X vérifiant les égalités ci-dessus, à savoir −−−→ l’application M 7→ A′0 + γ(A0 M ). Soit β := (A0 , . . . , An ) une base affine de X et S := {A0 , . . . , An } . Notons Γ le stabilisateur de S pour l’action naturelle de GA(X) sur l’ensemble des parties de X . Autrement dit, Γ est formé des g ∈ GA(X) tels que g(S) = S . Définissons une application π de Γ dans S(S) comme suit. Soit g ∈ Γ. Puisque g est une permutation de X et g(S) = S , la restriction de g à S est une permutation de S , nous la notons π(g). Il est clair que π est un morphisme car, pour tous g, h ∈ Γ, (g ◦ h)|S = (g|S ) ◦ (h|S ). Ce morphisme est injectif. Soit en effet g ∈ Ker π . Par définition, g(Ai ) = Ai pour i = 0, . . . , n, autrement dit g · β = β . D’où g = IdX , puisque l’action de G sur B est simplement transitive. Pour la même raison, π est surjectif. Soit en effet s ∈ S(S). Évidemment, β ′ := (s(A0 ), . . . , s(An )) est encore une base affine de X (cf. la condition a)). Il existe donc un unique élément g de G tel que g · β = β ′ , c’est-à-dire g(Ai ) = s(Ai ) pour i = 0, . . . , n. La restriction de g à S est ainsi égale à s, i.e. π(g) = s. Conclusion : π est un isomorphisme de Γ sur S(S). Enfin, la bijection i 7→ Ai−1 de [[1, n+1]] sur S induit un isomorphisme θ de Sn+1 sur S(S), et θ−1 ◦ π est un isomorphisme de Γ sur Sn+1 . I.2.13 Notons E la direction de X et T (X) le groupe des translations de X . Avec les notations standard, ~u 7→ tu~ est un isomorphisme du groupe additif de E sur T (X). L’idée fondamentale est d’utiliser la formule de conjugaison (formule (6) de la page 64), que nous rappelons par commodité : f ◦ tu~ ◦ f −1 = tf~(~u) . (∗) Cette formule est valable pour tout vecteur ~u ∈ E et toute transformation affine f de X . Soit alors g un élément du centre de GA(X), autrement dit, g commute avec tout élément de GA(X). En particulier, g commute avec toute translation de X . En d’autres termes, pour tout ~u ∈ E , les translations de vecteurs ~u et ~g (~u) sont égales, i.e. ~g(~u) = ~u . Il en résulte que ~g = IdE . Cette propriété caractérise les translations, donc g est une translation : il existe ~v ∈ E tel que g := t~v . Il reste à montrer que ~v = 0 , sauf peut-être dans le cas particulier signalé dans l’énoncé. La formule (∗), dans laquelle ~u est remplacé par ~v , montre que f~(~v ) = ~v pour toute transformation affine f de X . L’application f 7→ f~ est un morphisme surjectif de GA(X) sur GL(E) (cf. la section 1.2). Il en résulte que γ(~v ) = γ(~v ) pour toute transformation linéaire γ de E . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 30 Autrement dit, ~v est un point fixe pour l’action naturelle de GL(E) sur E . Or, d’après l’exercice 3 de la page 66, il y a deux orbites pour cette action, à savoir {0} et E \ {0} . Ainsi, 0 est le seul point fixe de cette action, et par conséquent ~v = 0 , sauf dans le cas où E \ {0} est un singleton. Puisque E est en bijection avec K n , ce cas particulier se produit si, et seulement si, card E = 2 , c’est-à-dire si, et seulement si, n = 1 et card K = 2 . I.2.14 Le cardinal de K 2 est 4 . En numérotant les points de K 2 de 1 à 4 , on définit un isomorphisme θ de S(K 2 ) sur S4 . Nous allons montrer que le groupe GA(K 2 ) est d’ordre (ou cardinal) 24 . Si c’est vrai, on aura GA(K 2 ) = S(K 2 ), autrement dit toute permutation de K 2 sera une transformation affine du plan K 2 , c’est là une propriété très particulier au cas K := Z/2Z. L’application ϕ : f 7→ f~ est un morphisme surjectif de GA(K 2 ) sur GL(K 2 ), de noyau T (K 2 ), groupe des translations (cf. la section 1.2). Le groupe T (K 2 ) est isomorphe au groupe additif de K 2 = (Z/2Z)2 , il est donc d’ordre 4 . Par ailleurs, le groupe GL(K 2 ), isomorphe à GL2 (K), est d’ordre 6 , comme le montre la proposition 12 de la page 85 (prendre n := 2 et q := 2 dans cette formule). Cela étant, le théorème d’isomorphisme montre que le morphisme ϕ induit un isomorphisme de GA(K 2 )/ Ker ϕ = GA(K 2 )/T (K 2 ) sur GL(K 2 ). D’après la proposition 13 de la page 72, on en déduit les égalités : card GA(K 2 ) = card T (K 2 ) × card GL(K 2 ) = 4 × 6 = 24, comme annoncé. Nous disposons maintenant d’un isomorphisme ϕ de GA(K 2 ) sur S4 . Nous savons que T (K 2 ) est un sous-groupe de GA(K 2 ), isomorphe à (Z/2Z)2 . C’est un sous-groupe distingué de GA(K 2 ) (cf. la section 1.2). Par transport de structure, l’image de T (K 2 ) par θ est un sous-groupe distingué de S4 , isomorphe à (Z/2Z)2 . I.2.15 Soit donc G un groupe fini, de cardinal m. D’après le théorème de Cayley (cf. la section 1.1), G est isomorphe à un sous-groupe de Sm . Pour conclure, il suffit donc de montrer, par exemple, que Sm est isomorphe à un sous-groupe de Am+2 . Identifions Sm au sousgroupe de Sm+2 formé des permutations de [[1, m + 2]] laissant fixes m + 1 et m + 2 . Notons t ∈ Sm+2 la transposition (m + 1 m + 2), échangeant m + 1 et m + 2 . Définissons ensuite une application f : Sm → Sm+2 en posant, pour toute permutation s ∈ Sm : ( s si ε(s) = 1 f (s) = s ◦ t si ε(s) = −1 . Dans cette formule, ε : Sm+2 → {−1, 1} est le morphisme de signature. Montrons d’abord que f est un morphisme. Soient s, s′ ∈ Sm . Il s’agit de montrer que f (s ◦ s′ ) = f (s) ◦ f (s′ ). Notons que les permutations s′ et t de [[1, m + 2]] commutent, parce que leurs supports sont disjoints. Séparons les différents cas possibles, suivant les valeurs de ε(s) et ε(s′ ). Rappelons que ε(s ◦ s′ ) = ε(s)ε(s′ ). - Si ε(s) = ε(s′ ) = 1 , on a f (s) = s, f (s′ ) = s′ et f (s ◦ s′ ) = s ◦ s′ , d’où f (s ◦ s′ ) = f (s) ◦ f (s′ ). - Si ε(s) = 1 et ε(s′ ) = −1 , on a f (s) = s, f (s′ ) = s′ ◦ t et f (s ◦ s′ ) = (s ◦ s′ ) ◦ t, d’où f (s ◦ s′ ) = f (s) ◦ f (s′ ). c Dunod 2014 I.2 : Actions de groupes 31 Si ε(s) = −1 et ε(s′ ) = 1 , on a f (s) = s ◦ t, f (s′ ) = s′ et f (s ◦ s′ ) = (s ◦ s′ ) ◦ t, d’où f (s ◦ s′ ) = s ◦ (s′ ◦ t) = s ◦ (t ◦ s′ ) = f (s) ◦ f (s′ ). - Si ε(s) = ε(s′ ) = −1 , on a f (s) = s ◦ t, f (s′ ) = s′ ◦ t et f (s ◦ s′ ) = s ◦ s′ , d’où f (s ◦ s′ ) = (s ◦ t) ◦ (s′ ◦ t) = (s ◦ t) ◦ (t ◦ s′ ) = s ◦ s′ = f (s) ◦ f (s′ ). Ainsi, f est un morphisme de Sm dans Sm+2 . Ce morphisme est injectif. Soit en effet s ∈ Ker f . Si ε(s) = 1 , s = f (s) = 1 . Si ε(s) = −1 , 1 = f (s) = s ◦ t, soit s = t−1 = t, ce qui est absurde, car t n’appartient pas à Sm , i.e. ne fixe pas m + 1 et m + 2 . D’où l’injec tivité de f . La formule définissant f (s) montre que ε f (s) = 1 pour tout s ∈ Sm . Ainsi, f est en fait un morphisme injectif de Sm dans Am+2 , c’est donc un isomorphisme de Sm sur un sous-groupe de Am+2 . D’où la conclusion. - I.2.16 Rappelons que l’action de G par translations à gauche sur G/H , ensemble des classes à gauche de G modulo H , est définie par (g, C) 7→ gC lorsque g ∈ G et C est une classe à gauche de G modulo H . Soit C ∈ G/H . Déterminons le stabilisateur GC de C dans cette action de G sur G/H . Par définition, GC := g ∈ G | gC = C . Soit a ∈ C , de sorte que C = aH , classe à gauche de a modulo H . Notons que, si x est un élément de G, xH = H si, et seulement si, x ∈ H . Pour tout g ∈ G, on a donc les équivalences : (gC = C) ⇐⇒ (gaH = aH) ⇐⇒ (a−1 gaH = H) ⇐⇒ (a−1 ga ∈ H) ⇐⇒ (g ∈ aHa−1 ). d’où la formule suivante : GaH = aHa−1 pour tout a ∈ G. (25) Le noyau K de l’action de G sur G/H est formé des g ∈ G tels que gC = C pour toute classe C ∈ G/H , c’est l’intersection des stabilisateurs GaH lorsque a parcourt G. D’où : \ aHa−1 . K = a∈G Les conjugués de H dans G étant par définition les sous-groupes aHa−1 , où a ∈ G, K est bien l’intersection de ces conjugués. Le sous-groupe K est aussi le noyau du morphisme de G dans S(G/H) associé à l’action considérée. En tant que noyau, c’est un sous-groupe distingué de G. Il est inclus dans H (prendre a = 1 ). Soit inversement K ′ un sous-groupe distingué de G inclus dans H . Pour tout a ∈ G, K ′ = aK ′ a−1 ⊂ aHa−1 . Ainsi, K ′ est inclus dans tout conjugué de H dans G, il est donc contenu dans l’intersection de ces conjugués, à savoir K . I.2.17 a) Soit S une partie génératrice finie de G, card S := k . Fixons un entier n ∈ N∗ , et soit Gn l’ensemble des sous-groupes d’indice n de G. Considérons un tel sousgroupe H , et soit K l’intersection des conjugués de H dans G. Appliquons l’exercice précédent. D’abord, K est un sous-groupe distingué de G. Ensuite, K est le noyau du morphisme ϕ : G → S(G/H) donnant l’action de G par translations à gauche sur G/H , ensemble des classes à gauche de G modulo H . D’après le théorème d’isomorphisme, G/K est isomorphe à Im ϕ. Comme l’ensemble G/H est de cardinal fini n, le groupe S(G/H) est d’ordre fini n!. D’après le théorème de Lagrange, G/K est d’ordre fini divisant n!. Autrement dit, l’indice d := (G : K) de K dans G est fini et divise n!. Choisissons une bijection ψ de G/K sur Γd := [[1, d]] . Par transport de structure, nous déduisons de la loi de groupe de G/K une loi de groupe ∗ sur l’ensemble Γd (cette loi dépend non seulement de d, mais c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 32 aussi de H ), et ψ devient un isomorphisme de G/K sur (Γd , ∗). Soit π : G → G/K la projection canonique. Le composé θ := ψ ◦ π est alors un morphisme de G dans (Γd , ∗), ayant pour noyau K , c’est là le point essentiel. b) Soient en général d ∈ N∗ et Γ un groupe d’ordre d. Notons Hom(G, Γ) l’ensemble des morphismes de G dans Γ. À un tel morphisme f , associons sa restriction f|S à la partie génératrice donnée de G. L’application f 7→ f|S de Hom(G, Γ) dans F (S, Γ), ensemble de toutes les applications de S dans Γ est injective. En effet, si f, f ′ : G → Γ sont deux morphismes coïncidant sur S , ils sont égaux, puisque g ∈ G | f (g) = f ′ (g) est un sousgroupe de G contenant la partie génératrice S . L’ensemble F (S, Γ) étant de cardinal fini dk , il en résulte que l’ensemble Hom(G, Γ) est fini, de cardinal au plus égal à dk . c) Soient H et K comme dans l’alinéa a). Nous avons montré qu’il existe : - un entier d > 1 divisant n! ; - une loi de groupe (∗) sur l’ensemble [[1, d]] ; - un morphisme θ de G dans le groupe [[1, d]], ∗ tels que le noyau de θ soit égal à K . Il n’y a qu’un nombre fini de possibilités pour l’entier d. Lorsque d est fixé, il n’y a qu’un nombre fini de possibilités pour la loi ∗ , qui n’est qu’une application de [[1, d]] × [[1, d]] dans [[1, d]] (possédant certaines propriétés). Enfin, si d et la loi ∗ sont fixés, l’alinéa précédent montre qu’il n’y a qu’un nombre fini de possibilités pour le morphisme θ , donc pour son noyau K . Au total, il n’y a qu’un nombre fini de sous-groupes distingués de G tels que K . Supposons maintenant que K soit fixé. Quelles sont les possibilités pour H ? Il faut au moins que H soit un sous-groupe de G contenant K . D’après la première section du module I.1, H 7→ H/K est une bijection de l’ensemble des sous-groupes de G contenant K sur l’ensemble des sous-groupes de G/K . Puisque G/K est fini, il n’y a qu’un nombre fini de sous-groupes H de G contenant K . Ainsi, lorsque K est fixé, il n’y a qu’un nombre fini de possibilités pour H . En conclusion, il n’y a qu’un nombre fini de sous-groupes H d’indice n de G. I.2.18 Écartons le cas trivial s = 1 := IdX (l’ordre de s est alors 1 ). Soient S1 , . . . , Sr les orbites non ponctuelles de X sous hsi (ainsi r > 1 ). La décomposition canonique de s s’écrit (en supprimant le symbole de composition ◦ ) s = c1 c2 · · · cr où, pour tout i , ci est un cycle ayant pour support Si , de sorte que ci est de longueur mi := card Si . Nous allons établir la formule suivante : ordre(s) = card hsi = ppcm(m1 , . . . , mr ) := m. (∗) Soit en général c := (a1 a2 · · · ak ) un cycle de longueur k > 2 . Rappelons que l’ordre de c est égal à k (que l’ensemble X soit fini ou non, d’ailleurs). En effet, pour tout entier j ∈ [[1, k]], on a aj = cj−1 (a1 ). Ainsi, ck (a1 ) = c ck−1 (a1 = c(ak ) = a1 . Pour tout j ∈ [[2, k]], on en déduit que ck (aj ) = ck+j−1 (a1 ) = cj−1 ck (a1 ) = cj−1 (a1 ) = aj . Par ailleurs, c laisse fixe tout élément de X distinct des aj , il en est donc de même pour ck , ce qui montre que ck = 1 . En revanche, si j ∈ [[1, k − 1]], cj 6= 1 puisque cj (a1 ) = aj+1 6= a1 . L’ordre de c est donc bien égal à k . i Revenons aux ci et à s. Pour tout i , cm = 1 , d’où cm = 1 , puisque m est multiple i i m m de mi . Puisque les ci commutent deux à deux, sm = (c1 c2 · · · cr )m = cm 1 c2 · · · cr = 1 . L’ordre d de s divise donc m. Montrons inversement que d est multiple de m, i.e. que d c Dunod 2014 I.2 : Actions de groupes 33 est multiple de chaque mi . Soit i ∈ [[1, r]] , notons ri le reste de la division de d par mi , et soit a ∈ Si . Puisque ci est d’ordre mi , cdi (a) = cri i (a). Mais ci est la restriction de s à Si , donc cd (a) = sd (a) = a. D’où cri i (a) = a. Comme ri ∈ [[0, mi − 1]], cela n’est possible que si ri = 0 , par définition d’un cycle de longueur mi . Ainsi, d est un multiple de mi , ce qui achève la démonstration de la formule (∗). I.2.19 Soit donc s une permutation de [[1, n]], n > 2 . D’après le théorème 19 de la page 80, s peut se décomposer sous la forme s = c1 ◦ c2 ◦ · · · ◦ cr , où les cj sont des cycles à supports deux à deux disjoints, et une telle décomposition est unique, à l’ordre des facteurs près. Le programme ci-dessous détermine les cycles c1 , . . . , cr . Nous représenterons s par la liste s := s(1), . . . , s(n) . Le programme calcule et renvoie la liste [c1 , . . . , cr ]. Si le cycle cj est égal à (aj,1 aj,2 · · · aj,hj ), il est représenté sous forme de liste : [aj,1 , aj,2 , · · · , aj,hj ]. Pour avoir unicité, on impose deux conditions : d’une part aj,1 < aj,i pour tous i, j tels que 1 6 j 6 r et 2 6 i 6 hj , et d’autre part a1,1 < a2,1 < · · · < ar,1 . Rappelons que le support de s, noté Supp(s), est le complémentaire de l’ensemble des points fixes de s : Supp(s) := k ∈ [[1, n]] | s(k) 6= k . Les éléments de Supp(s) sont exactement les aj,i . Le programme détermine successivement les aj,1 . Pour chaque j , il calcule le plus petit entier hj > 1 tel que shj (aj,1 ) = aj,1 , cj étant alors donné par la formule : cj := aj,1 , s(aj,1 ), s2 (aj,1 ), . . . , shj −1 (aj,1 ) . Quelques précisions concernant les listes : - les listes intervenant ici sont formées d’éléments deux à deux distincts ; - la liste vide est notée [ ] ; - la fonction taille(L) rend le nombre d’éléments de la liste L ; - la concaténation de deux listes L et L′ est notée conc(L,L’) ; - la procédure k dans L renvoie vrai si k appartient à la liste L et faux sinon. Decompositionencycles(s) n := taille(s); support := [ ]; decomposition := [ ]; pour k de 1 à n-1 faire si k dans support alors rien sinon si s[k] = k alors rien sinon j := k; cycle := [k]; (*début d’un nouveau cycle*) tant que s[j] <> k faire cycle := conc(cycle,[j]); support := conc(support,cycle);; decomposition := conc(decomposition,[cycle]);; rendre(decomposition) Par exemple, si n := 10 et si l’on rentre s := [10, 9, 8, 7, 2, 6, 1, 3, 5, 4], le programme renvoie : [[1, 10, 4, 7], [2, 9, 5], [3, 8]]. Autrement dit, la décomposition canonique de s est s = (1 10 4 7) ◦ (2 9 5) ◦ (3 8). Le seul point fixe de s est 6 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 34 I.2.20 Considérons les 3 -cycles a := (1 2 3), b := (4 5 6), c := (7 8 9), et notons H le sous-groupe de S9 engendré par S := {a, b, c} . Nous allons d’abord montrer que H est d’ordre 27 . Considérons l’application f : (i, j, k) 7→ ai bj ck de Z3 dans S9 . Son image est contenue dans H . Ensuite, f est un morphisme, parce que a, b, c commutent deux à deux. Il en résulte que Im f est un sous-groupe de H . Comme il contient a = f (1, 0, 0), b = f (0, 1, 0) et c = f (0, 0, 1), il est égal à H : H = Im f . Soit (i, j, k) ∈ Z3 . Notons i′ , j ′ , k ′ les restes des divisions de i, j, k respectivement par 3 . ′ ′ ′ Comme a3 = b3 = c3 = 1 , on a ai = ai , bj = bj et ck = ck , d’où f (i, j, k) = f (i′ , j ′ , k ′ ). Il en résulte que H = f (T ), où T := {0, 1, 2}3 . Autrement dit, la restriction de f à T induit une surjection ϕ de T sur H . Cette restriction est aussi injective, ce qui revient à dire que T ∩ Ker f = {(0, 0, 0)} . Soit en effet (i, j, k) ∈ T tel que la permutation s := ai bj ck soit égale à 1 . La restriction de s à {1, 2, 3} est (1 2 3)i , ce qui montre que i est multiple de 3 , puisque le 3 -cycle (1 2 3) ∈ S {1, 2, 3} est d’ordre 3 . Ainsi, i = 0 , et de même j = k = 0 . En conclusion, ϕ est une bijection de T sur H , d’où card H = card T = 27 . En d’autres termes, nous avons montré que tput élément h de H s’écrit de manière unique sous la forme : h = ai b j ck , où (i, j, k) ∈ {0, 1, 2}3. (∗) Puisque a, b, c commutent deux à deux, cette formule montre aussi que H est commutatif. Considérons maintenant la permutation d := (1 4 7)(2 5 8)(3 6 9). Elle est d’ordre 3 (cf. l’exercice I.2.18 de la page 91). Le sous-groupe K de S9 engendré par d est donc d’ordre 3 . Rappelons ici une formule de conjugaison établie dans le module II.2 (section 2.3) de [L1]. Soient X un ensemble (fini ou non), (a1 a2 · · · ak ) un cycle de longueur k > 2 et s une permutation quelconque de X . Alors : s ◦ (a1 a2 · · · ak ) ◦ s−1 = s(a1 ) s(a2 ) · · · s(ak ) . (∗∗) Dans la situation présente, il vient : dad−1 = d(1) d(2) d(3) = (4 5 6) = b, dbd−1 = d(4) d(5) d(6) = (7 8 9) = c, dcd−1 = d(7) d(8) d(9) = (1 2 3) = a. Considérons l’automorphisme α : s 7→ dsd−1 de S9 (conjugaison par d). L’image de H par α est un sous-groupe de S9 . Puisque H est engendré par S = {a, b, c} , α(H) est engendré par {α(a), α(b), α(c)} = {b, c, a} = S , donc α(H) = H . En d’autres termes, dHd−1 = H . Appliquons l’exercice I.2.7 de la page 90, dont nous reprenons les notations, en posant ici G := S9 . L’égalité dHd−1 = H signifie que d ∈ NG (H), d’où K = hdi ⊂ NG (H). L’exercice en question montre que HK := {hk | (h, k) ∈ H × K} est un sous-groupe de G. Nous allons montrer que HK est d’ordre 81 . Il est clair que HK contient H : h = h1 ∈ HK pour tout h ∈ H , de même HK contient K . Nous savons aussi que H est un sous-groupe distingué de HK , et il alors clair que le groupe quotient HK/H est engendré par la classe de d modulo H . Or, d3 = 1 , mais d ∈ / H , par exemple parce que H est commutatif, alors que dad−1 = b 6= a, i.e. d ne commute pas avec a. Il en résulte que la classe de d modulo H est d’ordre 3 , et par suite card (HK/H) = 3 , i.e. (HK : H) = 3 . Enfin, card H = 27 , et la proposition 13 de la page 72 montre que HK est d’ordre 3 × 27 = 81 . c Dunod 2014 I.2 : Actions de groupes 35 I.2.21 1. Puisque l’ordre de G, à savoir 2n, est multiple de 2 , le théorème de Cauchy (cf. la section 2.3 de la page 71) montre que G possède effectivement un élément c d’ordre 2 . Soit a un élément quelconque de G. Puisque c2 = 1 mais c 6= 1 , les éléments a, ca sont distincts, et c(ca) = a. Dans l’action de G sur lui-même par translations à gauche, l’orbite de a sous hci = {1, c} est donc {a, ca} . Cette orbite est aussi l’orbite de a sous hϕ(c)i, dans l’action naturelle de S(G) sur G. Ainsi, toute orbite de hϕ(c)i est de cardinal 2 . Comme G est de cardinal 2n, il y a n orbites de G sous hϕ(c)i. D’après la preuve du théorème 19 de la page 80, cela montre que la permutation ϕ(c) de G est la composée de n transpositions à supports deux à deux disjoints. 2. Puisque ϕ(c) est un produit de n transpositions, on a ε ϕ(c) = (−1)n . Ainsi, (ε ◦ ϕ)(c) = −1 , parce que n est impair. Cela montre que le morphisme ε ◦ ϕ : G → {−1, 1} est surjectif. D’après le théorème d’isomorphisme, ε ◦ ϕ induit donc un isomorphisme du quotient G/ Ker(ε ◦ ϕ) sur {−1, 1} , en particulier G/ Ker(ε ◦ ϕ) est d’ordre 2 , autrement dit Ker(ε ◦ ϕ) est un sous-groupe d’indice 2 de G. Ce sous-groupe est distingué dans G, pour deux raisons (une suffit !) : d’une part c’est le noyau d’un morphisme partant de G, et d’autre part tout sous-groupe d’indice 2 d’un groupe est distingué, nous l’avons vu dans la section 3.4 de la page 83. I.2.22 1. Soient A et B deux éléments de E . Alors A et B ont même cardinal k , donc X \ A et X \B ont même cardinal N −k . Il existe donc une bijection σ de A sur B et une bijection τ de X \A sur X \B . Supposons que σ et τ aient été choisies. L’application s : X → X définie par s(x) := σ(x) lorsque x ∈ A et s(x) := τ (x) lorsque x ∈ / A est surjective, puisque s(X) contient σ(A) = B ainsi que τ (X \ A) = X \ B . Ainsi, s est une permutation de X , et s(A) = σ(A) = B . Puisque A et B étaient quelconques, l’action de S(X) sur E est transitive. Montrons que cette action est fidèle. Étant donnée une permutation s de X distincte de l’identité, il s’agit de trouver un élément A de E tel que s(A) 6= A. Soit x ∈ X tel que y := s(x) 6= x. Puisque N − 2 > k − 1 , nous pouvons choisir une partie T à k − 1 éléments de X \ {x, y} . Posons A := T ∪ {x} . C’est une partie à k éléments de X , i.e. un élément de E , et x ∈ A mais y ∈ / A. Dans ces conditions, y = s(x) ∈ s(A), d’où s(A) 6= A. Soit A ∈ E . Toute permutation s de X telle que s(A) = A induit (par restriction) une permutation sA de A et une permutation sX\A de X \ A. L’application s 7→ (sA , sX\A ) de S(X)A , stabilisateur de A dans S(X), dans S(A) × S(X \ A) est évidemment un morphisme. Il est injectif, car, si s est un élément de son noyau, s(x) = x pour tout x ∈ A et tout x ∈ X \ A, donc s = IdX . Ce morphisme est aussi surjectif. En effet, si σ ∈ S(A) et τ ∈ S(X \ A), le premier alinéa prouve l’existence d’une permutation s de X prolongeant σ et τ , i.e. telle que sA = σ et sX\A = τ (prendre B := A). Ledit morphisme est donc un isomorphisme de S(X)A sur S(A) × S(X \ A). 2. Soit {A, B} une paire d’éléments de E ( A 6= B ). Pour toute permutation s de X , on a card s(A) ∩ s(B) = card s(A ∩ B) = card (A ∩ B). Si donc {A′ , B ′ } est une paire d’éléments de E appartenant à l’orbite de {A, B} , on a card (A′ ∩ B ′ ) = card (A ∩ B). Cette condition est aussi suffisante. Soient en effet {A, B} et {A′ , B ′ } deux paires d’éléments de E telles que card (A′ ∩ B ′ ) = card (A ∩ B) := h. Les parties de X suivantes : A ∩ B, A \ B, B \ A et X \ (A ∪ B) forment une partition de X , et les cardinaux de c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 36 ces parties sont, dans l’ordre : h, k − h, k − h, N − 2k + h. Il en est de même pour les parties A′ ∩ B ′ , A′ \ B ′ , B ′ \ A′ et X \ (A′ ∪ B ′ ). Un raisonnement analogue à celui du début de la question 1, avec quatre parties au lieu de deux, montre qu’il existe une permutation s de X appliquant A ∩ B, A \ B, B \ A et X \ (A ∪ B) respectivement sur A′ ∩ B ′ , A′ \ B ′ , B ′ \ A′ et X \ (A′ ∪ B ′ ). Alors s · {A, B} = s(A), s(B) = {A′ , B ′ } , donc {A′ , B ′ } et {A, B} appartiennent à une même orbite sous S(X). Soient {A, B} une paire d’éléments de E et h := card (A ∩ B). Alors : card (A ∪ B) = card A + card B − card (A ∩ B) = 2k − h 6 N = card X, d’où max(0, 2k − N ) 6 h 6 k . Inversement, si h est un entier vérifiant ces inégalités, il est facile de construire une paire {A, B} d’éléments de E telle que card (A ∩ B) = h. D’où une bijection de [[max(0, 2k − N ), k]] sur l’ensemble des orbites de S(X) sur l’ensemble des paires d’éléments de E . 3. Considérons une transposition t := (x y) de X . Calculons la signature de la permutation ϕ(t) de E correspondante. Puisque ϕ(t)2 = ϕ(t2 ) = IdE , nous savons que ϕ(t) est la composée d’un certain nombre r de transpositions de E à supports deux à deux disjoints, et l’on a ε ϕ(t) = (−1)r . La réunion des supports en question est le complémentaire de l’en semble des points fixes de s dans E , c’est-à-dire le complémentaire de A ∈ E | t(A) = A . Comptons donc les parties A à k éléments de X telles que t(A) = A. Puisque t échange x, y et laisse fixes les autres éléments de X , les parties A en question sont : - d’une part les parties A à k éléments de X ne contenant ni x ni y , i.e. les parties N −2 à k éléments de X \ {x, y} . Ces parties A sont au nombre de (qui vaut 0 k si k := N − 1 ) ; - d’autre part, les parties A à k éléments de X contenant x et y , i.e. de la forme A := P ∪ {x, y} , où P est une partie à k − 2 éléments de X \ {x, y} . Ces N −2 parties A sont au nombre de . k−2 N −2 N −2 Le nombre de points fixes de t sur E est donc + . Par ailleurs, on a : k k−2 N N −1 N −1 card E = = + k k k−1 N −2 N −2 N −2 N −2 = + + + , d’où : k k−1 k−1 k−2 N −1 N −2 N −2 N −2 N N −2 = 2 . − − − = 2r = card (E) − k−1 k−2 k k k−2 k N −2 Ainsi r = ne dépend pas de t (i.e. de x et y ), et la signature de ϕ(t) est donc : k−1 ε ϕ(t) = (−1)r . Puisque les transpositions engendrent S(X), l’image de ϕ est contenue dans le groupe alterné A(E) si, et seulement si, ϕ(t) ∈ A(E) pour toute transposition t de X , c’est-à-dire si, et seulement si, (−1)r = 1 . c Dunod 2014 I.2 : Actions de groupes 37 Conclusion : l’image de ϕ est contenue dans le groupe alterné A(E) si, et seulement N −2 si, est pair. k−1 I.2.23 Soient s un élément non trivial de Sn et s := c1 c2 · · · cr sa décomposition canonique comme produit de cycles à supports deux à deux disjoints. D’après l’exercice I.2.18 de la page 91, l’ordre de s est le ppcm des longueurs des cycles ci . Il en résulte que la permutation s est d’ordre 2 si, et seulement si, c’est un produit d’un certain nombre (évidemment inférieur ou égal à n/2 ) de transpositions à supports deux à deux disjoints. Pour tout entier r ∈ [[1, E(n/2)]], notons Cr l’ensemble des permutations de [[1, n]] qui sont produit de r transpositions à supports deux à deux disjoints. Comme nous l’avons vu dans la section 3.3, chaque Cr est une classe de conjugaison de Sn . Ce sont donc là exactement les classes de conjugaison de Sn formées d’éléments d’ordre 2 . L’entier n étant fixé, calculons, pour tout entier r ∈ [[1, E(n/2)]], le cardinal Nr de Cr . Le cas r := 1 est évident. En effet, une transposition t := (i j) est parfaitement déterminée par son support {x, y} , qui est une partie à deux éléments de [[1, n]]. Le nombre de transpositions n dans Sn est donc N1 = . Supposons maintenant qu’on ait r > 2 , d’où n > 4 . No2 tons Ar l’ensemble des arrangements de 1, . . . , n pris 2r à 2r . Un élément de Ar est donc un 2r -uplet injectif α := (j1 , . . . , j2r ) d’entiers compris entre 1 et n. Dans le module II.1 de [L1], nous avons vu que le cardinal de Ar est n!/(n − 2r)!. À tout arrangement α := (j1 , . . . , j2r ) ∈ Ar , associons la permutation de [[1, n]] suivante : s := (j1 j2 )(j3 j4 ) · · · (j2r−1 j2r ). Nous définissons ainsi une application f de Ar dans Cr . Le théorème 19 de la page 80 montre que f est surjective. Mieux : si s ∈ Cr est donnée, l’écriture de s comme produit de r transpositions à supports deux à deux disjoints est unique, à l’ordre des facteurs près. Plus précisément, une écriture telle que s := (j1 j2 )(j3 j4 ) · · · (j2r−1 j2r ) de s est unique, à l’ordre des facteurs près, et à l’échange près, pour chaque facteur (j2i−1 j2i ), de j2i−1 et j2i . On en déduit aussitôt que s possède exactement 2r r! antécédents par f . La formule de Fubini (cf. la section 2.1 du module II.1 de [L1]) donne donc : Cr = card Ar n! = r · r 2 r! 2 r!(n − 2r)! (∗) Soit α un automorphisme de Sn . L’image par α d’une classe de conjugaison de Sn est aussi une classe de conjugaison de Sn . Par ailleurs, α conserve l’ordre des éléments de Sn . il existe donc un entier r ∈ [[1, E(n/2)]] tel que α(C1 ) = Cr , d’où Nr = N1 . Il s’agit d’en déduire que r := 1 , sauf peut-être si n := 6 . Supposons donc que r soit supérieur ou égal à 2 (ainsi, n > 4 ). Rappelons que la signature ε est le seul morphisme non trivial de Sn dans {−1, 1} . Comme le morphisme ε ◦ α est non trivial, ε ◦ α = ε , autrement dit α conserve la parité. Puisque les transpositions sont des permutations impaires, nécessairement r est impair. Ainsi r > 3 , et donc n > 6 . Cela étant , l’égalité (∗) donne : d’où, puisque n > 2r : n(n − 1) n! = N1 = Nr = r , 2 2 r!(n − 2r)! 2r−1 r! = (n − 2)(n − 3) · · · (n − 2r + 1) > (2r − 2)(2r − 3) · · · 1 = (2r − 2)!. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 38 En divisant par tous les entiers pairs entre 2 et 2r − 2 , il reste : r > 1 × 3 × 5 × · · · × (2r − 3). En particulier r > 2r − 3 , c’est-à-dire r 6 3 , et donc r = 3 . Nous avons maintenant : 24 = 2r−1 r! = (n − 2)(n − 3) · · · (n − 5), égalité qui est vraie lorsque n = 6 mais fausse si n > 6 , puisque le second membre croît strictement avec n. En conclusion, si r est l’entier tel que α(C1 ) = Cr , on a r = 1 , sauf peut-être si n := 6 et r := 3 . Lorsque n := 6 , la formule (∗) montre effectivement que N3 = N1 = 15 . Par ailleurs, on peut montrer (mais nous ne le ferons pas ici) qu’il existe vraiment un automorphisme de S6 appliquant C1 sur C3 . I.2.24 1. Observons d’abord que f est injective, puisque f 2 est la translation y 7→ y + n de N, translation qui est injective. Pour tout x ∈ N, on a ensuite : f (x + n) = f f 2 (x) = f 3 (x) = f 2 f (x) = f (x) + n. D’où l’égalité annoncée : f (x + n) = f (x) + n pour tout x ∈ N. (∗) En appliquant cette égalité plusieurs fois, on en déduit ceci (par récurrence sur k ) : f (x + kn) = f (x) + kn pour tous x, k ∈ N. (∗∗) Ainsi, dès que x, y ∈ N sont congrus modulo n, f (x) et f (y) sont congrus modulo n. Pour définir l’application s, il est plus simple de considérer l’intervalle E := [[0, n − 1]]. Définissons donc une application s de E dans lui-même ainsi : pour tout a ∈ E , s(a) est le reste de la division de f (a) par n. Montrons que s est injective (donc bijective). Soient a, b ∈ E tels que s(a) = s(b). Ainsi, f (a) et f (b) sont congrus modulo n. Si (par exemple) f (b) > f (a), il existe k ∈ N tel que f (b) = f (a) + kn, d’où f (b) = f (a + kn), en vertu de la formule (∗∗). D’où b = a + kn, puisque f est injective. Mais a et b appartiennent à E , donc k = 0 , soit a = b . Pour tout x ∈ E , la définition même de s fait que f (x) ≡ s(x) mod n. Montrons que s2 = Id. Soit a ∈ E . Puisque f (a) est congru à s(a) modulo n, on obtient : s s(a) ≡ f s(a) ≡ f f (a) = a + n ≡ a mod n. Comme a et s2 (a) appartiennent à E , il en résulte que s2 (a) = a, d’où l’égalité s2 = Id . 2. Soient f et s comme dans la question 1. Montrons d’abord que s ∈ S(E) n’a pas de point fixe. Supposons au contraire que s possède un point fixe x, de sorte que f (x) ≡ x mod n. Puisque x ∈ E et f (x) ∈ N, il existe k ∈ N tel que f (x) = x + kn. Alors : x + n = f 2 (x) = f (x + kn) = f (x) + kn = x + 2kn, d’où 2kn = n, ce qui est absurde. Ainsi, la permutation s de E est d’ordre 2 et n’a pas de point fixe. Il en résulte que s est produit d’un certain nombre m de transpositions à supports deux à deux disjoints, la réunion de ces supports étant E . On en déduit que n := card E = 2m. Ce qui précède montre que, si F n’est pas vide, n est nécessairement pair. Supposons désormais que ce soit le cas, et posons m := n/2 . Soit S l’ensemble des permutations de E produits de m transpositions à supports deux à deux disjoints. Dans l’exercice précédent, nous avons montré que S est une classe de conjugaison, de cardinal : card S = c Dunod 2014 (2m)! · 2m m! I.2 : Actions de groupes 39 Le fait que l’ensemble [[1, n]] ait ici été remplacé par E = [[0, n − 1]] n’a évidemment pas d’importance. En associant à toute fonction f ∈ F la permutation s ∈ S comme dans la question 1, nous définissons une application ϕ : F → S . Pour calculer le cardinal de F , nous allons calculer le cardinal de chaque fibre ϕ−1 (s), s ∈ S . Lorsque s décrit S , ces fibres forment une partition de F , d’où : X card F = card ϕ−1 (s). s∈S Soit donc s ∈ S . Déterminons les f ∈ F tels que ϕ(f ) = s. Considérons une telle fonction f . Soit (a b) l’une des transpositions constituant s, de sorte que s échange a et b . Par définition, f (a) ≡ b mod n. Il existe donc λ ∈ N tel que f (a) = b + λn. De même f (b) ≡ a mod n, donc il existe µ ∈ N tel que f (b) = a + µn. D’où : a + n = f 2 (a) = f (b + λn) = f (b) + λn = a + (λ + µ)n, ce qui montre que λ + µ = 1 , donc (λ, µ) = (1, 0) ou (λ, µ) = (0, 1). Écrivons s = t1 t2 . . . , tm , les ti étant des transpositions à supports deux à deux disjoints. En opérant comme ci-dessus pour chaque ti , on définit une application θ de [[1, m]] dans {0, 1} , possédant les deux propriétés suivantes : a) Pour tout a ∈ E , θ(a) + θ s(a) = 1 . Autrement dit, θ + θ ◦ s = 1 . b) Pour tout a ∈ E , f (a) = s(a) + θ(a)n. Soit alors x ∈ N un entier quelconque. Soient q et r respectivement le quotient et le reste de la division de x par n. Puisque f (x) = f (r) + qn, nous obtenons la formule : f (x) = s(r) + q + θ(r) n. (∗∗∗) Inversement, soit θ : [[1, m]] → {0, 1} une fonction vérifiant la condition a). Définissons une application f : N → N en définissant f (x) par la formule (∗∗∗), ceci pour tout x ∈ N. Cette fonction f vérifie évidemment la condition b). Elle vérifie aussi la condition f (x + kn) = f (x) + kn pour tous x, k ∈ N. Soient a ∈ E et b := s(a), de sorte que θ(a) + θ(b) = 1 , en vertu de la condition a). Appliquons deux fois la formule (∗∗∗) : f (a) = s(a) + θ(a)n = b + θ(a)n, puis : f 2 (a) = f b + θ(a)n = s(b) + θ(a) + θ(b) n = a + n. On en déduit aussitôt que f 2 (x) = x + n pour tout x ∈ N, autrement dit f ∈ F . Enfin, pour tout a ∈ E , la formule (∗∗∗) montre que f (a) est congru à s(a) modulo n, ce qui signifie que ϕ(f ) = s. Il est alors immédiat que la fibre ϕ−1 (s) est en bijection avec l’ensemble des fonctions θ : [[1, m]] → {0, 1} vérifiant la condition a). Le nombre de telles fonctions θ est 2m , car il y a deux choix possibles pour la restriction de θ à chacun des supports des si . D’où : (2m)! · m! En conclusion, l’ensemble F est vide si n est impair et il est de cardinal (2m)!/m! si n := 2m est pair. card F = 2m card S = I.2.25 Supposons d’abord que n soit premier. Considérons, dans le groupe symétrique S(X), un cycle c de longueur n et une transposition s := (a b). Puisque a appartient au support de c (ce support est X ), la définiton d’un n-cycle montre que les éléments aj := cj−1 (a), j = 1, . . . , n, sont distincts et que c = a1 a2 · · · an ). Par ailleurs, puisque b 6= a, il existe un unique k ∈ [[2, n]] tel que b = ak . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 40 Si k = 2 , considérons la bijection f : j 7→ aj de [[1, n]] sur X . Elle induit un isomorphisme ϕ : σ 7→ f ◦ σ ◦ f −1 de Sn sur S(X). On vérifie sans peine que c et s sont les images respectives par ϕ du n-cycle (1 2 · · · n) et de la transposition (1 2). Il est classique que (1 2 · · · n) et (1 2) engendrent Sn (cf. le module II.2 de [L1]). Via l’isomorphisme ϕ, on en déduit que c et s engendrent S(X). Si k > 3 , nous allons remplacer c par c′ := ck−1 . Montrons que, lorsque i décrit [[0, n − 1]], les éléments c′ i (a1 ) sont distincts. Soient en effet i, j ∈ [[0, n − 1]] tels que c′ i (a1 ) = c′j (a1 ) et, par exemple, i 6 j . Alors c′j−i = c(j−i)(k−1) laisse fixe a1 . Soit r le reste de la division de (j − i)(k − 1) par n, de sorte que c(j−i)(k−1) = cr et donc cr (a1 ) = a1 . Il en résulte que r = 0 , i.e. n divise (j − i)(k − 1). Puisque 1 < k − 1 < n, n ne divise pas k − 1 . Mais n est premier et divise (j − i)(k − 1). D’après le lemme d’Euclide, n divise j − i . Enfin, 0 6 j−i < n, donc j = i . Les c′ i (a1 ) sont donc bien distincts, et il en résulte que c′ est lui aussi un n-cycle : c′ = a1 c′ (a1 ) · · · c′n−1 (a1 ) . Cette fois, b = ak = ck−1 (a1 ) = c′ (a1 ). D’après le cas traité ci-dessus ( cas k = 2 ), le groupe S(X) est engendré par c′ et s, ce que nous notons hc′ , si = S(X). Puisque c′ est une puissance de c, on a hc′ i ⊂ hci, d’où S(X) = hc′ , si ⊂ hc, si, et par conséquent hc, si = S(X). Pour terminer, supposons que n ne soit pas premier. Il s’écrit donc n := pq , où p et q sont deux entiers strictement supérieurs à 1 . Dans le groupe Sn , considérons le n-cycle c := (1 2 · · · n) et la transposition s = (1 p + 1). Montrons que hc, si 6= S(X). L’idée est d’observer que cp est produit de p cycles de longueur q à supports deux à deux disjoints. Plus précisément, il est immédiat de vérifier l’égalité suivante : cp = c1 c2 · · · cp où, pour chaque k ∈ [[1, p]], ck est le q− cycle : ck = k (p + k) (2p + k) · · · q − 1)p + k . Noter que les supports Sk des cycles ck ( k = 1, . . . , p) forment une partition de [[1, n]], et que 1, p + 1 ∈ S1 . Par ailleurs, la formule de conjugaison d’un cycle, cf. la formule (∗∗) de la page 34, donne les égalités suivantes : cc1 c−1 = c2 , cc2 c−1 = c3 , . . . , ccp−1 c−1 = cp , ccp c−1 = c1 . Il en résulte que c permute circulairement les parties S1 , S2 , . . . , Sp . Cela étant, le groupe Sn agit naturellement sur l’ensemble P des parties de [[1, n]], donc aussi sur l’ensemble des parties de P . Pour cette action, la partie T := {S1 , S2 , . . . , Sp } est stable par c, nous venons de le voir, mais aussi par s, car s(Sk ) = Sk pour k = 1, . . . , p. Cependant, si τ est la transposition échangeant un élément (fixé) de S1 avec un élément (fixé) de S2 , il est clair que τ (T ) 6= T car τ (S1 ) ∈ / T. Nous pouvons conclure : le stabilisateur de T dans l’action de Sn sur l’ensemble des parties de P est un sous-groupe distinct de Sn contenant c et s. Cela montre que le sous-groupe hc, si est distinct de Sn : c et s n’engendrent pas Sn . I.2.26 Le but de l’exercice est de prouver l’inégalité r > n − 1 . Raisonnons par l’absurde, en supposant r 6 n − 2 , d’où n > 2 . Puisque la partie S engendre Sn , elle n’est pas vide. Ainsi, r > 1 , donc n > 3 . En fait, r > 2 , donc n > 4 , car, si r était égal à 1 , le groupe Sn serait d’ordre 2 , alors qu’il est d’ordre n! > 6 . Nous allons construire par récurrence une suite (s1 , . . . , sr ) d’éléments de S , deux à deux distincts, vérifiant pour tout k ∈ [[1, r]] la propriété suivante, que nous noterons (P k ) : le composé tk := s1 ◦ s2 ◦ · · · ◦ sk a un support Tk de cardinal k + 1 , et Tk contient le support c Dunod 2014 I.2 : Actions de groupes 41 de chacune des transpositions s1 , . . . , sk . Pour k := 1 , il suffit de prendre pour s1 un élément quelconque de S . Supposons que, pour un certain entier k ∈ [[1, r − 1]] , nous ayons construit des éléments de S distincts s1 , . . . , sk , de sorte que la propriété (P h ) soit vérifiée pour h = 1, . . . , k . Pour tout h ∈ [[1, k]], le support de la transposition sh est par hypothèse inclus dans Tk , donc sh (Tk ) = Tk . Soit H := σ ∈ Sn | σ(Tk ) = Tk le stabilisateur de Tk pour l’action de Sn sur l’ensemble des parties de [[1, n]]. Ainsi, s1 , . . . , sk appartiennent à H . Puisque Tk est de cardinal k + 1 6 r < n, Tk n’est ni vide ni égale à [[1, n]]. Soient donc a ∈ Tk et b ∈ [[1, n]] \ Tk . La transposition (a b) échange a et b , donc elle ne laisse pas Tk stable : (a b) ∈ / H . Le sous-groupe H est ainsi distinct de Sn . Comme la partie S engendre Sn , elle n’est pas incluse dans H . Il existe donc une transposition sk+1 ∈ S telle que sk+1 (Tk ) 6= Tk . Cela signifie que sk+1 s’écrit sk+1 := (c d), où c ∈ Tk et d ∈ [[1, n]]\Tk . En tout cas, sk+1 ∈ / H , donc sk+1 est distincte de s1 , . . . , sk . Posons donc tk+1 := s1 ◦ s2 ◦ · · · ◦ sk+1 = tk ◦ sk+1 , et soit Tk+1 le support de tk+1 . Ce support est contenu dans la réunion des supports de tk et sk+1 , c’est-à-dire dans Tk ∪ {c, d} = Tk ∪ {d} . Montrons que Tk+1 = Tk ∪ {d} . Si x ∈ Tk est distinct de c, sk+1 (x) = x, donc tk+1 (x) = tk (x) 6= x, puisque x ∈ Supp(tk ) = Tk . Ensuite, d ∈ / Supp(tk ), donc tk+1 (c) = tk (d) = d 6= c, ce qui montre que c ∈ Tk+1 . Enfin, tk+1 (d) = tk (c) ∈ Tk , donc tk+1 (d) 6= d, i.e. d ∈ Tk+1 . D’où l’égalité Tk+1 = Tk ∪{d} . Il en résulte que card Tk+1 = 1 + card Tk = k + 2 , et, par ailleurs, le support de sk+1 , à savoir {c, d} , est inclus dans Tk+1 . La propriété (P k+1 ) est donc vérifiée, et cela achève la construction de la suite (s1 , . . . , sr ). Puisque s1 , . . . , sr ∈ S sont distinctes deux à deux et card S = r , on a S = {s1 , . . . , sr } . Pour tout k ∈ [[1, r]] , le support de sk est inclus dans Tr , donc sk (Tr ) = Tr . Le stabilisateur H ′ de Tr dans Sn est un sous-groupe de Sn contenant la partie génératrice S , donc H ′ = Sn . Mais Tr est de cardinal r + 1 6 n − 1 . Comme ci-dessus, considérons alors un élément x de Tr et un élément y de [[1, n]] \ Tr . La transposition (x y) échange x et y , elle ne laisse donc pas Tr stable : (x y) ∈ / H ′ . C’est absurde, puisque H ′ = Sn . Cette contradiction prouve l’inégalité r > n − 1 . I.2.27 Notons A la somme des Φ(s) lorsque le couple (g, s) décrit F . On peut calculer A de deux manières, en sommant d’abord soit par rapport à g soit par rapport à s (avec des notations évidentes) : X X X A= Φ(s) := Bg g∈G = X s∈G g∈G s∈G , (g,s)∈F Φ(s) X g∈G , (g,s)∈F 1 := X Φ(s)Cs . s∈G Remarquons ensuite que, pour un élément (g, s) de G2 , la condition (g, s) ∈ F équivaut à s ∈ g −1 Hg = g −1 Ga g = Gg−1 a , elle signifie donc que g −1 a est un point fixe de s (cf. la proposition 11 de la page 71). Fixons d’abord s ∈ G. La somme Cs à calculer est le nombre de g ∈ G tels que g −1 a soit un point fixe de s. Soit x l’un de ces points fixes. Combien y a-t-il d’éléments g de G c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 42 tels que g −1 a = x, c’est-à-dire a = gx ? Il y en a, puisque l’action de G sur X est transitive. Soit g0 l’un de ces éléments. Il est clair que γ 7→ g0 γ est une bijection de Gx sur {g ∈ G | gx = a = g0 x} . Le nombre de g ∈ G tels que gx = a est donc card Gx , c’està-dire N/ card X , en vertu du théorème 14 de la page 72. Comme il y a Φ(s) points fixes de s, le nombre de g ∈ G tels que g −1 a soit un point fixe de s est Cs = N Φ(s)/ card X , d’où : X X N A = Φ(s)Cs = Φ(s)2 . card X s∈G s∈G Fixons maintenant g ∈ G, et posons b := g −1 a. La somme Bg à évaluer est la somme des Φ(s) pour tous les s ∈ G laissant fixe b , c’est-à-dire pour tous les s appartenant à Gb . Appliquons alors le théorème de Frobenius (théorème 25 de la page 87) à l’action de Gb sur X . Le nombre µ′ d’orbites de X sous Gb vaut : X 1 card X X Φ(s) = Φ(s). µ′ = card Gb N s ∈ Gb s ∈ Gb ′ En fait, µ = µ, i.e. le nombre µ ne dépend pas du choix du point a. En effet, on vérifie aisément que les orbites de X sous Gb sont les images des orbites de X sous Ga par la permutation y 7→ g −1 y de X , à cause de la formule suivante, valable pour tout x ∈ X : Gb x = (g −1 Ga g)x = g −1 Ga (gx) . Il en résulte que Bg = N µ/ card X , d’où : A = X Bg = g∈G X g∈G Nµ N 2µ = · card X card X En comparant avec la formule précédemment obtenue pour A, il vient : X N 1 X N 2µ = Φ(s)2 , d’où µ = Φ(s)2 . card X card X N s∈G s∈S I.2.28 Les points de K étant deux à deux symétriques par rapport à l’origine, l’isobarycentre de K est évidemment O . Cet isobarycentre est fixé par tout élément de G, car toute application affine conserve les barycentres. Ainsi, tout élément de G laisse fixe O , de sorte que G est, en fait, un sous-groupe de GL(Rn ). Notons B := (e1 , . . . , en ) la base canonique de Rn . Posons Di := Rei pour i = 1, . . . , n, et soit D := {D1 , . . . , Dn } . Enfin, convenons d’identifier toute transformation linéaire de Rn avec sa matrice dans la base B . a) Montrons que D est stable sous G. Pour cela, partons d’une remarque simple. Soient M = (ε1 , . . . , εn ) et M ′ = (ε′1 , . . . , ε′n ) deux points de K et I = (α1 , . . . , αn ) le milieu de M M ′ . Soit i ∈ [[1, n]]. Alors αi = 0 lorsque εi 6= ε′i , et sinon αi = εi = ε′i . Chaque coordonnée de I appartient donc à {−1, 0, 1} . Soit inversement I = (α1 , . . . , αn ) ∈ {−1, 0, 1}n . Dénombrons d’abord les points M = (ε1 , . . . , εn ) ∈ K tels que le symétrique M ′ de M par rapport à I appartienne à K . Écrivons M ′ = (ε′1 , . . . , ε′n ), de sorte que εi + ε′i = 2αi pour i = 1, . . . , n. Soit i ∈ [[1, n]]. Si αi = ±1 , nécessairement εi = αi (= ε′i ). Si αi = 0 , εi ∈ {−1, 1} peut être choisi arbitrairement, et alors ε′i = −εi . Si donc p ∈ [[0, n]] est le nombre d’indices i ∈ [[1, n]] tels que αi = 0 , il y a 2p points M ∈ K tels que le symétrique de M par rapport à I appartienne à K . c Dunod 2014 I.2 : Actions de groupes 43 Soit T l’ensemble des points de Rn ayant toutes leurs coordonnées nulles, sauf une qui vaut ±1 . Ce qui précède montre qu’un point I ∈ Rn appartient à T si et seulement s’il y a exactement 2n−1 points M ∈ K tels que le symétrique de M par rapport à I appartienne à K . Compte tenu de cette caractérisation de T , il est clair que G laisse stable T . Pour −−→ −−→ tout i ∈ [[1, n]], soient Ai , A′i ∈ Rn les points définis par les égalités OAi = ei et OA′i = −ei . Ainsi Di est la droite Ai A′i . Par ailleurs, on a : T = A1 , A′1 , . . . , An , A′n . Puisque chaque élément de G laisse stable T et fixe le point O , il applique chaque paire {Ai , A′i } sur une paire analogue, et par suite G laisse stable D . Puisque G laisse stable D , nous obtenons une action naturelle de G sur D , correspondant à un morphisme ψ : G → S(D) ≡ Sn . Nous allons étudier ce morphisme, en particulier nous en déterminerons le noyau et l’image. b) Le groupe G possède deux sous-groupes évidents. Le premier est le sous-groupe ∆ de GLn (R) formé des matrices diagonales dont chaque terme diagonal vaut ±1 : ∆ = Diag(ε1 , . . . , εn ) (ε1 , . . . , εn ) ∈ {−1, 1}n . Il est clair que ∆ est isomorphe à {−1, 1}n, × , ou encore à (Z/2Z)n , + . En particulier, ∆ est d’ordre 2n . Il est également clair que ∆ est un sous-groupe de G : si g = Diag(ε1 , . . . , εn ) ∈ ∆ et si M = (x1 , . . . , xn ) ∈ K , g(M ) = (ε1 x1 , . . . , εn xn ) ∈ K puisque, pour tout i , εi et xi appartiennent à {−1, 1} . Si g = Diag(ε1 , . . . , εn ) ∈ ∆ et si i ∈ [[1, n]], on a g(ei ) = εi ei = ±ei , donc g(Di ) = Di . En d’autres termes, g agit trivialement sur D , ce qui prouve l’inclusion ∆ ⊂ Ker ψ . En fait, ∆ = Ker ψ . Soit en effet g ∈ Ker ψ : pour tout i , g(Di ) = Di . Cela signifie que g est une matrice diagonale : g := Diag(a1 , . . . , an ). Le point M := (1, 1, . . . , 1) appartient à K , donc g(M ) ∈ K . Les coordonnées de g(M ) étant les ai , il en résulte que ai ∈ {−1, 1} pour tout i , d’où g ∈ ∆. c) Le deuxième sous-groupe évident de G est formé des matrices de permutations Pσ , σ parcourant Sn . Si σ ∈ Sn , Pσ est l’automorphisme de Rn appliquant chaque ei sur eσ(i) , i ∈ [[1, n]]. L’application σ 7→ Pσ est un morphisme injectif de Sn dans GLn (R), c’est donc un isomorphisme de Sn sur le sous-groupe S = Pσ σ ∈ Sn de GLn (R). Le groupe S est donc d’ordre n!. Là encore, il est clair que S est un sous-groupe de G : le fait que toutes les coordonnées d’un point soient égales à ±1 est invariant par permutation des coordonnées. Pour toute permutation σ ∈ Sn , on a Pσ (ei ) = eσ(i) et donc Pσ (Di ) = Dσ(i) pour tout i . Cela montre que ψ(Pσ ) = σ pour toute permutation σ . Il en résulte que la restriction de ψ à S est un isomorphisme de S sur Sn , ce qui montre en particulier que ψ est surjectif. d) Appliquons le théorème d’isomorphisme. Le morphisme ψ est surjectif, et son noyau est ∆. Il induit donc un isomorphisme du quotient G/∆ sur S(D). La proposition 13 de la page 72 donne alors, au niveau des ordres, les égalités : card G = card ∆ × card (G/∆) = card ∆ × card S(D) = 2n n!. L’ordre de G est bien celui qui est que nous voulions. e) Nous allons enfin préciser la structure du groupe G. Considérons l’application f du produit {−1, 1}n × Sn dans G définie par la formule : f (ε1 , . . . , εn ), σ := Diag(ε1 , . . . , εn )Pσ . (∗) c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 44 Cette application est surjective. Soit en effet g ∈ G, posons σ := ψ(g). Alors g et Pσ ont même image par ψ , donc gPσ−1 ∈ Ker ψ = ∆. Il existe donc (ε1 , . . . , εn ) ∈ {−1, 1}n tel que gPσ−1 = Diag(ε1 , . . . , εn ), d’où g = f (ε1 , . . . , εn ), σ . L’application f est injective. Soient en effet (ε1 , . . . , εn ), (ε′1 , . . . , ε′n ) ∈ {−1, 1}n et σ, σ ′ ∈ Sn tels que Diag(ε1 , . . . , εn )Pσ = Diag(ε′1 , . . . , ε′n )Pσ′ . En prenant les images des deux membres de cette égalité par ψ , on obtient σ = σ ′ . On en déduit évidemment que (ε1 , . . . , εn ) = (ε′1 , . . . , ε′n ). f) Attention, f est une bijection, mais ce n’est pas un isomorphisme de groupes. Précisons ce point. Considérons deux éléments g, g ′ de G. Soient (ε, σ) et (ε′ , σ ′ ) les images respectives de g et g ′ par f −1 , avec ε := (ε1 , . . . , εn ) et ε′ := (ε′1 , . . . , ε′n ). Nous voulons expliciter l’image de gg ′ par f −1 . D’abord, ψ étant un morphisme, ψ(gg ′ ) = σ ◦ σ ′ . D’après l’alinéa précédent, il en résulte qu’il existe η := (η1 , . . . , ηn ) ∈ {−1, 1}n tel que gg ′ = Diag(η1 , . . . , ηn )Pσ ◦ σ′ . Il reste à expliciter les ηi . Pour cela, partons de l’égalité : Diag(ε1 , . . . , εn )Pσ Diag(ε′1 , . . . , ε′n )Pσ′ = Diag(η1 , . . . , ηn )Pσ ◦ σ′ . En simplifiant à droite par Pσ′ , cette égalité équivaut à la suivante : Diag(η1 , . . . , ηn ) = Diag(ε1 , . . . , εn ) Pσ Diag(ε′1 , . . . , ε′n )Pσ−1 . {z } | =γ En termes d’endomorphismes de Rn on a, pour tout j ∈ [[1, n]] : γ(ej ) = Pσ Diag(ε′1 , . . . , ε′n ) (eσ−1 (j) ) = Pσ (ε′σ−1 (j) eσ−1 (j) ) = ε′σ−1 (j) ej , ce qui montre que ηj = εj ε′σ−1 (j) . D’où : Diag(ε1 , . . . , εn )Pσ Diag(ε′1 , . . . , ε′n )Pσ′ = Diag(ε1 ε′σ−1 (1) , . . . , εn ε′σ−1 (n) )Pσ ◦ σ′ . Ainsi, f −1 (gg ′ ) = (ε1 ε′σ−1 (1) , . . . , εn ε′σ−1 (n) ), σ ◦ σ ′ n’est le produit de f −1 (g) et f −1 (g ′ ) dans le groupe produit {−1, 1}n × Sn que si ε′σ−1 (j) = ε′j pour tout j . Ce n’est pas vrai, par exemple, si σ est la transposition (1 2) et ε′ := (−1, 1, 1, . . . , 1). En conclusion, f n’est pas un isomorphisme de groupes. I.2.29 Soit B la base canonique de K 2 . L’application ϕ associant à tout u ∈ GL(K 2 ) sa matrice dans la base B est un isomorphisme de GL(K 2 ) sur GL2 (K). Par ailleurs, posons X := K 2 \ {0} . L’action naturelle de GL(K 2 ) sur K 2 laisse stable 0 , elle laisse donc stable X . D’où une action de GL(K 2 ) sur X , se traduisant par un morphisme ψ de GL(K 2 ) dans S(X). L’action de GL(K 2 ) sur X est évidemment fidèle, donc ψ est injectif. Or, d’après la proposition 12 de la page 85, l’ordre de GL(K 2 ), c’est-à-dire l’ordre de GL2 (K), est 6 = 3! (prendre n := 2 et q := 2 dans la proposition). Il en résulte que ψ est bijectif, c’est donc un isomorphisme. Le choix d’une numérotation des trois éléments de X définit de manière évidente un isomorphisme θ de S(X) sur S3 . Alors, α := θ ◦ ψ ◦ ϕ−1 est un isomorphisme de GL2 (K) sur S3 . En posant par exemple x1 := (1, 0), x2 := (0, 1) et x3 := (1, 1), l’image 0 1 1 1 de ∈ GL2 (K) par α est le 3 -cycle (1 2 3), et l’image de est la 1 1 0 1 transposition (2 3). c Dunod 2014 I.2 : Actions de groupes 45 I.2.30 Le groupe Aut(G) des automorphismes de G est un sous-groupe de S(G), il laisse stable X := G \ {1} . L’action de Aut(G) sur X est évidemment fidèle, elle se traduit par un morphisme injectif ϕ : Aut(G) → S(X). En particulier, ϕ(σ) est une permutation d’ordre p de X . Puisque p est premier, il en résulte, par exemple en vertu de l’exercice I.2.18 de la page 91, que ϕ(σ) est le produit d’un certain nombre de p-cycles à supports deux à deux disjoints. Mais X est de cardinal p, donc ϕ(σ) est en fait un p-cycle. Ainsi, le sous-groupe hσi de Aut(G) agit transitivement sur X . L’idée est maintenant d’observer que tous les éléments de X ont même ordre. Soient en effet x, y ∈ X . Il existe un entier k ∈ [[0, p − 1]] tel que y = σ k (x). Puisque σ k est un automorphisme de G, y = σ k (x) et x ont le même ordre, car σ k induit un isomorphisme de hxi sur hyi. Ainsi, tous les éléments de G distincts de 1 ont un même ordre d. Puisque l’ordre p + 1 de G est pair, le théorème de Cauchy (cf. la section 2.3 de la page 71) montre que G possède un élément d’ordre 2 , ce qui montre que d = 2 . Puisque tout élément de G distinct de 1 est d’ordre 2 , on a x2 = 1 pour tout x ∈ G. Un exercice classique (cf. le module II.2 de [L1]) montre alors que G est abélien (i.e. commutatif). Rappelons pourquoi. Soient x, y ∈ G. L’égalité x2 = 1 équivaut à x−1 = x, de même y −1 = y et (xy)−1 = xy . Mais on a toujours (xy)−1 = y −1 x−1 , donc xy = (xy)−1 = y −1 x−1 = yx. Ainsi xy = yx pour tous x, y ∈ G, ce qui établit la commutativité de G. À ce stade, il sera plus commode d’utiliser pour G la notation additive. Nous avons donc maintenant 2x = 0 pour tout x ∈ G. Considérons alors le corps K := Z/2Z, dont les deux éléments seront notés 0̄ et 1̄ . Définissons une loi externe K × G → G par 0̄ · x = 0 et 1̄ · x pour tout x ∈ G. Cette loi externe et l’addition de G font de G un K -espace vectoriel. La seule propriété non évidente a priori est la distributivité à gauche : (α + β) · x = α · x + β · x pour tout x ∈ G et tous α, β ∈ K . Dans le seul cas non trivial α = β = 1̄ , cette propriété s’écrit 0̄ · x = 1̄ · x + 1̄ · x, soit 0 = x + x, ou encore 2x = 0 . En conclusion, c’est le fait que 2x soit nul pour tout x ∈ G qui nous a permis d’obtenir sur G cette structure de K -espace vectoriel. Insistons sur un point : (G, +, ·) est un K -espace vectoriel, dont le groupe additif est simplement le groupe G de départ, écrit additivement. Puisque G est fini en tant qu’ensemble, c’est un K -espace vectoriel de dimension finie ( G est une partie génératrice finie de cet espace vectoriel), notons n sa dimension. Alors G est isomorphe à K n = (Z/2Z)n comme espace vectoriel, a fortiori comme groupe (additif). En particulier, p + 1 = card G = 2n , soit p := 2n − 1 . Par hypothèse, p est un nombre premier, ce qui entraîne que n est lui-même un nombre premier. En effet, si n n’était pas premier, on pourrait l’écrire n := ab , où a, b sont deux entiers strictement supérieurs à 1 , et alors 2a − 1 serait un diviseur de p = 2n − 1 distinct de 1 et p, ce qui contredirait le fait que p soit premier. Conclusion : il existe un nombre premier n tel que p := 2n − 1 , autrement dit, p est un nombre premier de Mersenne, cf. le module II.1 de [L1]. Réciproquement, soit n un nombre premier tel que le nombre de Mersenne p := 2n − 1 soit lui aussi premier. On peut ainsi prendre n := 5 et p := 31 ou n := 7 et p := 127 , mais pas n := 11 , car 211 − 1 = 2047 = 23 × 89 n’est pas premier. Posons G := (Z/2Z)n , c’est un espace vectoriel de dimension n sur le corps K := Z/2Z. Il est facile de voir que le groupe Aut(G) des automorphismes du groupe additif G est en fait égal à GL(K n ), groupe des automorphismes linéaires de K n (le fait qu’un automorphisme du groupe additif G respecte la loi externe est évident). Le groupe GL(K n ) est isomorphe à GLn (K). D’après la c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 46 proposition 24 de la page 85 (prendre q := 2 ), on a donc : card Aut(G) = 2n(n−1)/2 (2n − 1)(2n−1 − 1) · · · (22 − 1)(2 − 1). En particulier, l’ordre de Aut(G) est divisible par le nombre premier p = 2n − 1 . D’après le théorème de Cauchy, le groupe Aut(G) possède donc un élément σ d’ordre p. Au total, p est premier, G est un groupe d’ordre p + 1 = 2n possédant un automorphisme d’ordre p, ce qui constitue la réciproque cherchée. I.2.31 D’abord, G est un sous-groupe de GL3 (Z/pZ), car nous savons en général que, si K est un corps et n ∈ N∗ , les matrices triangulaires supérieures dont les termes diagonaux valent 1 a b tous 1 forment un sous-groupe de GLn (K). L’application (a, b, c) 7→ 0 1 c est par 0 0 1 3 définition une bijection de (Z/pZ) sur G, ce n’est pas un isomorphisme de groupes, comme la suite le montrera. En tout cas, l’ordre (cardinal) de G est p3 . Le fait que G ne soit pas commutatif résulte du calcul suivant : 1 1 0 1 0 0 1 1 1 0 1 0 0 1 1 = 0 1 1 , 0 0 1 0 0 1 0 0 1 alors que : 1 0 0 1 0 0 0 1 1 0 1 0 1 0 1 1 1 0 = 0 1 0 1 0 0 0 1 . 1 I.2.32 Le nombre N (q) de coloriages cherché ne dépend évidemment que de q , et non du cube particulier considéré (pourquoi ?). Reprenons donc les notations de l’exemple 2 de la page 76, en particulier K désigne le cube {A, B, C, D, A′ , B ′ , C ′ , D′ } . Rappelons que G ⊂ O(R3 ) est le groupe des symétries de K et que G+ ⊂ SO(R3 ) est le groupe des rotations de K . Nous avons vu que l’action naturelle de G sur l’ensemble A := {α, β, γ, δ} des diagonales du cube induit un isomorphisme ϕ de G+ sur S(A). Chacune des six faces du cube est entièrement déterminée par son centre, par exemple le carré ABCD , qui est l’une de ces faces, a pour centre (0, 0, 1). De cette manière, nous identifions l’ensemble des faces de K à l’ensemble : T := (±1, 0, 0), (0, ±1, 0), (0, 0, ±1) . Nous avons montré que T est stable sous G, d’où une action naturelle de G sur T . Numérotons ensuite les couleurs de 1 à q . Un coloriage (des faces) de K est simplement une application f de T dans [[1, q]], i.e. un élément de F T, [[1, q]] , ensemble des applications de T dans [[1, q]]. Le groupe G agit naturellement sur T , faisons-le agir trivialement sur [[1, q]]. D’après l’exemple 10 de la page 61, ces deux actions induisent une action de G sur F T, [[1, q]] , via la formule suivante, dans laquelle f ∈ F T, [[1, q]] , g ∈ G et t ∈ T sont arbitraires : (g · f )(t) := f g −1 t . Deux coloriages f, f ′ du cube se déduisent l’un de l’autre par une rotation du cube si, et seule ment si, f et f ′ appartiennent à une même orbite de F T, [[1, q]] sous G+ . Il en résulte que c Dunod 2014 I.2 : Actions de groupes 47 le nombre N (q) cherché est simplement le nombre d’orbites de F T, [[1, q]] sous G+ . Le théorème de Frobenius (théorème 25 de la page 87) donne donc : 1 X N (q) = Φ(g). 24 + g∈G Dans cette formule, pour tout g ∈ G+ , rappelons que Φ(g) est le nombre de points fixes de g dans F T, [[1, q]] . Soient g ∈ G+ et f ∈ F T, [[1, q]] . Pour que f soit un point fixe de g , c’est-à-dire g · f = f ou encore f g −1 t = f (t) pour tout t ∈ T , il faut et il suffit que la fonction f soit constante sur chaque orbite de T sous hgi. Si l’on note ω(g) le nombre d’orbites de T sous hgi, il y a évidemment q ω(g) fonctions f possédant cette propriété : on choisit arbitrairement une couleur pour chacune des orbites de T sous hgi. Ainsi, Φ(g) = q ω(g) . D’où : 1 X ω(g) N (q) = q . (∗) 24 + g∈G + Il reste à calculer les entiers ω(g), g ∈ G . Observons d’abord que ω(ghg −1 ) = ω(h) pour tous g, h ∈ G+ . En effet, si Y1 , . . . , Yr sont les orbites de hhi sur T , on vérifie aisément que les orbites de hghg −1 i sur T sont gT1 , . . . , gTr . Cela étant, nous savons que ϕ est un isomorphisme de G+ sur S(A). Par ailleurs, les classes de conjugaison du groupe S(A), qui est isomorphe à S4 , sont connues (cf. la section 3.3 de la page 78). Il y a dans G+ cinq classes de conjugaison, que nous allons détailler. - Le singleton réduit à l’identité est l’une de ces classes, évidemment ω(Id) = 6 . - Il y a dans S(A) six transpositions. L’une d’elles est (γ δ). Géométriquement, c’est l’image par ϕ de la rotation g d’angle π et d’axe la droite joignant les milieux −1 0 0 de CD et C ′ D′ . Matriciellement, g = 0 0 1 . Sur T , g échange (1, 0, 0) 0 1 0 et (−1, 0, 0), (0, 1, 0) et (0, 0, 1), ainsi que (0, −1, 0) et (0, 0, −1), donc ω(g) = 3 . - Il y a dans S(A) trois produits de deux transpositions à supports disjoints. L’un de ces produits est (α γ)(β δ). Géométriquement, c’est l’image par ϕ de la rota −1 0 0 tion g d’angle π et d’axe Re3 . Matriciellement, g = 0 −1 0 . Sur T , g 0 0 1 échange (1, 0, 0) et (−1, 0, 0), (0, 1, 0) et (0, −1, 0), mais laisse fixes (0, 0, 1) et (0, 0, −1), donc ω(g) = 4 . - Il y a dans S(A) six 4 -cycles. L’un de ces cycles est (α β γ δ). Géométriquement, c’est l’image par ϕ de la rotation g d’angle π/2 et d’axe Re3 . Matricielle 0 −1 0 ment, g = 1 0 0 . Sur T , g laisse fixes (0, 0, 1) et (0, 0, −1), et permute 0 0 1 circulairement (1, 0, 0), (0, 1, 0), (−1, 0, 0) et (0, −1, 0), donc ω(g) = 3 . - Il y a dans S(A) huit 3 -cycles. L’un de ces cycles est (β δ γ). Géométriquement, nous avons vu dans l’exemple 2 de la page 76 que c’est l’image par ϕ de la rotation g 0 0 −1 −−′→ 0 0 . Sur T , g d’angle 2π/3 et d’axe dirigé par A A . Matriciellement, g = 1 0 −1 0 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 48 permute circulairement (1, 0, 0), (0, 1, 0) et (0, 0, −1), ainsi que (−1, 0, 0), (0, −1, 0) et (0, 0, 1), donc ω(g) = 2 . En vertu de la formule (∗), nous obtenons ainsi : N (q) = 1 q 6 + 3q 4 + 12q 3 + 8q 2 1 × q6 + 6 × q3 + 3 × q4 + 6 × q3 + 8 × q2 = · 24 24 I.2.33 1. L’action naturelle de S(S) sur S induit une action de S(S) sur P(S), ensemble des parties de S , puis sur l’ensemble des parties de P(S). L’ensemble A des arêtes de Γ est une partie de P(S), et G n’est autre que le stabilisateur de A dans cette action de S(S) sur P P(S) , c’est donc un sous-groupe de S(S). 2. Appelons degré d’un sommet le nombre de sommets reliés à ce sommet. Parmi les sommets de Γ, trois sont de degré 4 , notons-les a, b, c. Hormis b et c, il y a deux autres sommets reliés à a, notons-les a1 , a−1 . Définissons de même b1 , b−1 et c1 , c−1 . Le groupe G laisse stable la partie T := {a, b, c} . En effet, si x ∈ S et g ∈ G, l’application {x, y} 7→ g(x), g(y) est une bijection de l’ensemble des arêtes contenant x sur l’ensemble des arêtes contenant g(x). Il en résulte que g conserve les degrés des sommets, d’où g(T ) = T . Puisque T est stable pour G, il en résulte une action de G sur T , se traduisant par un morphisme χ : G → S(T ). Ce morphisme est surjectif. Soit en effet σ ∈ S(T ). Avec des notations évidentes, définissons une application gσ : S → S comme suit. Pour tout x ∈ T , nous posons gσ (x) := σ(x), gσ (x1 ) := σ(x)1 et gσ (x−1 ) = σ(x)−1 . Il est clair que gσ est une permutation de S . Les neuf arêtes de Γ sont {a, b} , {a, c} , {b, c} et les {x, xi } pour x ∈ T et i ∈ {−1, 1} . Il en résulte aussitôt que gσ conserve les arêtes, autrement dit, gσ ∈ G. Puisque gσ coïncide avec σ sur T , on a χ(gσ ) = σ , d’où la surjectivité de χ. Il est facile de déterminer le noyau de χ. Un élément g de ce noyau fixe a, b, c. Il doit fixer ou échanger a1 et a−1 , seuls sommets autres que b, c reliés à a. Ainsi g laisse stable {a1 , a−1 } , et de même {b1 , b−1 } et {c1 , c−1 } . Il existe donc α, β, γ ∈ {−1, 1} tels que, pour tout j ∈ {−1, 1} , on ait : g(aj ) = ajα , g(bj ) = bjα , g(cj ) = cjα et g(a) = a , g(b) = b , g(c) = c. Inversement étant donnés α, β, γ ∈ {−1, 1} , définissons g : S → S par ces formules. Il est évident que g ∈ G, plus précisément g ∈ Ker χ. On voit aussitôt que (α, β, γ) 7→ g est un isomorphisme d du groupe (multiplicatif) produit {−1, 1}3 sur Ker χ. En particulier, Ker χ est d’ordre 8 . D’après le théorème d’isomorphisme, S(T ) = Im χ est isomorphe au quotient G/ Ker χ. Puisque S(T ) est d’ordre 3! = 6 et Ker χ est d’ordre 8 , on en déduit que G est d’ordre 6 × 8 = 48 (cf. la proposition 13 de la page 72). La structure de G peut être précisée. Montrons que l’application θ : {−1, 1}3 × S(T ) → G définie par la formule ci-dessous est bijective : θ (α, β, γ), σ := d(α, β, γ) ◦ gσ . Soit g ∈ G, posons σ := χ(g). Alors χ(g) = σ = χ(gσ ), donc g ◦ gσ−1 ∈ Ker χ. Il existe donc un unique triplet (α, β, γ) ∈ {−1, 1}3 tel que g ◦ gσ−1 = d(α, β, γ), d’où g = d(α, β, γ) ◦ gσ = θ (α, β, γ), σ . Inversement, soient (α′ , β ′ , γ ′ ) ∈ {−1, 1}3 et σ ′ ∈ S(T ), supposons que g = d(α′ , β ′ , γ ′ ) ◦ gσ′ . Alors, σ = χ(g) = χ(gσ′ ) = σ ′ . c Dunod 2014 I.2 : Actions de groupes 49 Dans ces conditions, d(α, β, γ) = d(α′ , β ′ , γ ′ ), d’où (α, β, γ) = (α′ , β ′ , γ ′ ). En conclusion, g possède un unique antécédent par θ , ce qui prouve que θ est bijective. Attention, θ n’est pas un isomorphisme (de groupes) du groupe produit {−1, 1}3 × S(T ) sur G, cf. la fin de l’exercice I.2.28 de la page 92. 3. Reprenons les notations de l’exemple 2 de la page 76, concernant le cube K . En particulier, D := {D1 , D2 , D3 } . Notons F l’ensemble des six faces du cube. Explicitement, en identifiant une face, qui est un carré, avec l’ensemble de ses quatre sommets, on a : F := ABCD, A′ B ′ C ′ D′ , ABC ′ D′ , A′ B ′ CD, ADB ′ C ′ , A′ D′ BC . b = (S, b A) b de la façon suivante. L’ensemble des somDéfinissons un graphe Γ b est la réunion Sb := D ∪ F . Les arêtes de Γ b sont d’une part les mets de Γ paires {D1 , D2 } , {D1 , D3 } , {D2 , D3 } , et d’autre part les paires (Di , F ), où i ∈ {1, 2, 3} et la face F ∈ F est orthogonale à Di . Ainsi, les arêtes contenant D3 sont {D1 , D3 } , {D2 , D3 } , {D3 , ABCD} et {D3 , A′ B ′ C ′ D′ } . Soit λ la bijection de S sur Sb définie ainsi : λ(a) := D1 , λ(b) := D2 , λ(c) := D3 , λ(a1 ) := A′ D′ BC , λ(b1 ) := A′ B ′ CD , λ(c1 ) := ABCD , λ(a−1 ) := ADB ′ C ′ , λ(b−1 ) := ABC ′ D′ , λ(c−1 ) := A′ B ′ C ′ D′ . b . Il en résulte que g 7→ λ ◦ g ◦ λ−1 est un isomorOn constate que λ applique A sur A b Par ailleurs, le groupe des symétries du cube, notons-le phisme du groupe Aut(Γ) sur Aut(Γ). ici Sym(K) et non pas G, agit naturellement sur chacun des ensembles D et F , d’où une action évidente sur Sb . Cette action conserve les arêtes parce que Sym(K) est un sous-groupe du groupe orthogonal O(R3 ), de sorte que chaque élément de Sym(K) conserve l’orthogonalité entre droites et plans. b Cette action de Sym(K) sur Sb définit donc un morphisme ζ de Sym(K) dans Aut(Γ). Montrons que ζ est injectif, autrement dit que Sym(K) agit fidèlement sur Sb . Soit g un élément du noyau de ζ . D’abord, g agit trivialement sur D , donc g est une matrice diagonale : g := Diag(ε1 , ε2 , ε3 ), avec (ε1 , ε2 , ε3 ) ∈ {−1, 1}3 . Ensuite, g laisse fixe la face ABCD , i.e. g laisse stable {A, B, C, D} , et l’on en déduit que ε3 = 1 . De même, g laisse stable {A, B, C ′ , D′ } , d’où ε2 = 1 , et g laisse stable {A, D, B ′ , C ′ } , d’où ε1 = 1 . b est donc injectif. Or, Sym(K) est d’ordre 48 , et le Le morphisme ζ : Sym(K) → Aut(Γ) b aussi, car il est isomorphe à Aut(Γ). Il en résulte que ζ est un isomorphisme, groupe Aut(Γ) et par conséquent le groupe Aut(Γ) est isomorphe à Sym(K), ou encore à S4 × (Z/2Z). I.2.34 Posons X := [[1, 5]], et soit donc E l’ensemble des parties à deux éléments de X . La partie {1, 2} ∈ E , par exemple, peut être identifiée au sommet 12 du graphe Γ donné. Avec cette identification, l’ensemble des sommets de Γ est E . Sur la figure de l’énoncé, on observe que deux sommets hi et jk sont reliés par une arête de Γ si, et seulement si, les parties {h, i} et {j, k} de X sont disjointes. L’exercice I.2.22 de la page 92 montre que l’action naturelle de S5 sur E est transitive et fidèle. Le morphisme ϕ : S5 → S(E) correspondant à cette action est donc injectif. L’image de ϕ est contenue dans le groupe Aut(Γ) des automorphismes du graphe Γ. En effet, soit s ∈ S5 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 50 Si α et β sont deux parties de X disjointes et chacune de cardinal 2 , il en est de même pour s(α) et s(β), puisque s est une bijection de X sur X . Supposons alors que nous ayons établi la majoration card Aut(Γ) 6 120 . Puisque card S5 = 5! = 120 , il en résultera que ϕ est un isomorphisme de S5 sur Aut(Γ), ce qui terminera l’exercice. Il nous faut donc majorer l’ordre de Aut(Γ). Observons que le graphe Γ est de degré 3 , en ce sens que chaque sommet appartient à trois arêtes exactement. Considérons l’ensemble W des couples de la forme α, (a, b, c) , où α ∈ E et où a, b, c sont les trois arêtes de Γ contenant α . Le graphe Γ comporte 10 sommets, donc le cardinal de W est 10 · 3! = 60 . Le groupe Aut(Γ) agit naturellement sur W , puisque chaque élément de ce groupe est une permutation de E conservant les arêtes. Montrons que l’action de S5 sur W est transitive. Considérons deux élé ments de W , α, (a, b, c) et α′ , (a′ , b′ , c′ ) . On peut écrire α := {i, j} et a := {i, j}, {h, k} , b := {i, j}, {h, m} , c := {i, j}, {k, m} , où i, j, h, k, m sont des éléments de X deux à deux distincts. De même, on peut écrire α′ := {i′ , j ′ } et a′ := {i′ , j ′ }, {h′ , k ′ } , b′ := {i′ , j ′ }, {h′ , m′ } , c′ := {i′ , j ′ }, {k ′ , m′ } , où i′ , j ′ , h′ , k ′ , m′ sont des éléments de X deux à deux distincts. Soit s ∈ S5 la permutation appliquant dans l’ordre i, j, h, k, m sur i′ , j ′ , h′ , k ′ , m′ . Il est alors clair que s · α, (a, b, c) = α′ , (a′ , b′ , c′ ) , ce qui établit la transitivité de S5 sur W . Soit w := α, (a, b, c) , où : α := {1, 2}, a := {1, 2}, {3, 4} , b := {1, 2}, {3, 5} , c := {1, 2}, {4, 5} . Considérons le stabilisateur Aut(Γ)w de w dans Aut(Γ). Puisque l’action de Aut(Γ) sur W est transitive (car celle de son sous-groupe Im ϕ l’est déjà), l’égalité (8) de la page 72 donne : card Aut(Γ) = card W × card Aut(Γ)w , c’est-àdire card Aut(Γ) = 60 card Aut(Γ)w . Le stabilisateur Aut(Γ)w contient déjà la permuta tion ω := ϕ (1 2) de E . Pour conclure, il suffit détablir l’égalité Aut(Γ)w = {1, ω} . Soit donc g une permutation de E laissant fixe chacun des sommets 12 , 34 , 35 et 45 . Les deux sommets reliés à 45 et distincts de 12 sont 13 et 23 , ils sont donc soit échangés par g soit tous les deux fixés par g . Quitte à remplacer g par g ◦ ω , nous pouvons supposer que g fixe 13 et 23 . Il s’agit alors de montrer que g = IdE . Le seul sommet relié à 34 et 13 est 25 . Comme 34 et 13 sont fixés par g , 25 l’est aussi. De même : - le seul sommet relié à 35 et 23 est 14 , qui est donc fixé par g ; - le seul sommet relié à 34 et 23 est 15 , qui est donc fixé par g ; - le seul sommet relié à 35 et 13 est 24 , qui est donc fixé par g . Finalement, g laisse fixes tous les sommets (points de E ), donc g = IdE . I.2.35 Soit D(E) l’ensemble des drapeaux de E . Rappelons (cf. l’exercice I.2.0 de la page 88) qu’un drapeau de E est une suite δ := (V0 , . . . , Vn ) de sous-espaces vectoriels de E , croissante pour l’inclusion, telle que dim(Vi ) = i pour i = 0, . . . , n. Il s’agit de calculer le cardinal de D(E). Ce cardinal ne dépend évidemment que de n ( q étant fixé), notons-le Dn . Le ré sultat est évident si n := 1 : il y a dans ce cas un seul drapeau, à savoir {0}, E . Dans le cas n > 2 , notons H l’ensemble des hyperplans de E . Fabriquer un drapeau (V0 , . . . , Vn ) de E revient à se donner un hyperplan Vn−1 de E et un drapeau (V0 , . . . , Vn−1 ) de Vn−1 . D’où aussitôt Dn = Dn−1 × card H . c Dunod 2014 I.2 : Actions de groupes 51 À toute forme linéaire non nulle sur E , associons son noyau. On définit ainsi une application ψ de E ∗ \ {0} dans H . Cette application est surjective, et chacune de ses fibres est de cardinal q − 1 , car deux formes linéaires non nulles définissent le même hyperplan si, et seulement si, elles sont proportionnelles. Les fibres de ψ formant une partition de E ∗ \ {0} , on en déduit ceci : qn − 1 q n − 1 = card E ∗ \ {0} = (q − 1) card H , d’où card H = · q−1 Nous obtenons ainsi la formule récurrente suivante : Dn = qn − 1 · Dn−1 q−1 pour tout n > 2. Par récurrence sur n, on en déduit la valeur de Dn pour tout n : card D(E) := Dn = n n Y Y qk − 1 qk − 1 = · q−1 q−1 k=2 k=1 Notons B l’ensemble des bases de E . Considérons une base β := (e1 , . . . , en ) de E . Pour tout k ∈ [[0, n]], posons Vk := Vect(e1 , . . . , ek ), de sorte que V0 := {0} . Il est clair que δ := (V0 , . . . , Vn ) est un drapeau de E . D’où une application θ : β 7→ δ de B dans D(E). Calculons les cardinaux des fibres de θ . Soit donc δ := (V0 , . . . , Vn ) un drapeau de E . Il est clair que la fibre θ−1 (δ) est simplement le produit cartésien : θ−1 (δ) = (V1 \ V0 ) × (V2 \ V1 ) × · · · × (Vn \ Vn−1 ). Puisque chaque Vk est de cardinal q k , le cardinal de θ−1 (δ) est le produit des q k − q k−1 , k variant de 1 à n. Puisque les fibres de θ forment une partition de B et ont toutes le même cardinal, il vient : card B = card D(E) × n Y (q k − q k−1 ) = k=1 n Y (q k − q k−1 )(q k − 1) , q−1 k=1 c’est-à-dire : card B = n Y k=1 q k−1 (q k − 1) = q n(n−1)/2 n Y k=1 (q k − 1). Soit β une base de E fixée. L’action de GL(E) sur B est simplement transitive, donc l’application g 7→ g · β est une bijection de GL(E) sur B . L’ordre de GL(E), qui est aussi l’ordre du groupe GLn (K), est donc égal au cardinal de B . Nous avons ainsi retrouvé le résultat de la proposition 24 de la page 85. I.2.36 Soit E la direction de X . Notons θ : GA(X) → GL(E) le morphisme f 7→ f~ . C’est un morphisme surjectif, dont le noyau est le groupe des translations T (X) (cf. la section 1.2). Puisque ~u 7→ tu~ est un isomorphisme du groupe additif de E sur T (X), le groupe T (X) est d’ordre card E = q n , car E est isomorphe à K n comme K -espace vectoriel. Par ailleurs, l’ordre du groupe GL(E), isomorphe à GLn (K), est donné par la proposition 24 de la page 85. Puisque θ est surjectif et de noyau T (X), le théorème d’isomorphisme montre que GL(E) est isomorphe au groupe quotient GA(X)/T (X). D’où, en vertu de la proposition 13 de la c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 52 page 72 : card GA(X) = card T (X) × card GL(E) = card T (X) × card GLn (K) n n Y n(n−1)/2 Y k n(n+1)/2 = q q (q − 1) = q (q k − 1) n k=1 k=1 = q n (q n − 1)(q n − q)(q n − q 2 ) · · · (q n − q n−1 ). Voici une autre manière de calculer l’ordre de GA(X). Soit B l’ensemble des bases affines de X . D’après l’exercice I.2.12 de la page 91, l’action naturelle du groupe GA(X) sur B est simplement transitive. Autrement dit, si β ∈ B est une base affine fixée, g 7→ g · β est une bijection de GA(X) sur B . Il en résulte que l’ordre de GA(X) est égal au cardinal de B . Il reste à prouver la formule suivante : card B = q n n−1 Y k=0 (q n − q h ). (∗) Nous laissons au lecteur le soin de rendre tout à fait rigoureux ce qui suit, à l’aide de raisonnements ensemblistes en bonne et due forme. Comment « fabriquer » une base affine β := (A0 , . . . , An ) de X ? Pour tout k ∈ [[0, n]], notons Xk le sous-espace affine de X −−−→ −−−→ engendré par A0 , . . . , Ak . Sa direction est Ek := Vect A0 A1 , . . . , A0 Ak , et Xk est de dimension k . Le point A0 peut être arbitrairement choisi. Soit k ∈ [[0, n − 1]]. Si les points A0 , . . . , Ak −−−−−→ sont déjà connus, la seule contrainte sur Ak+1 est que A0 Ak+1 ne doit pas appartenir à Ek , autrement dit, Ak+1 ne doit pas appartenir à Xk . Le nombre de « choix possibles » pour Ak+1 , une fois les points A0 , . . . , Ak choisis, est donc card X \ Xk = q n − q k . D’où : card B = q n × (q n − 1) × (q n − q) × (q n − q 2 ) × · · · × (q n − q n−1 ), et nous retrouvons ainsi le résultat obtenu précédemment. I.2.37 Écartons le cas évident où G est trivial. Posons X := G \ {1} et N := card G (ainsi, N > 2 ). Supposons que l’action de G sur X soit transitive. Étant donnés deux éléments quelconques x, y de X , il existe donc un automorphisme α de G tel que y = α(x). Comme dans l’exercice I.2.30 de la page 93, nous en déduisons que x et y ont même ordre. Tous les éléments de G distincts de 1 ont donc un même ordre p > 2 . Puisque N > 2 , N possède un facteur premier q , et le théorème de Cauchy montre que G possède un élément d’ordre q . Il en résulte que p = q est un nombre premier. Le théorème de Cauchy montre de plus que G est un p-groupe, i.e. il existe un entier n > 1 tel que N := pn . Soit Z(G) le centre de G. D’après la proposition 22 de la page 83, Z(G) n’est pas trivial. Soit donc a ∈ Z(G), a 6= 1 . Soit maintenant x ∈ X . Il existe un automorphisme β de G appliquant a sur x. Mais β laisse évidemment Z(G) stable. En effet, si z ∈ Z(G) et t ∈ G, zβ −1 (t) = β −1 (t)z , d’où, en appliquant β , β(z)t = tβ(z). Ainsi, x = β(a) ∈ Z(G). Nous avons donc démontré que Z(G) = G, ce qui veut dire que G est commutatif. Notons désormais additivement le groupe G. Puisque tout élément de X := G \ {0} est d’ordre p, le groupe G possède la propriété suivante : px = 0 pour tout x ∈ G. Considérons alors le corps K := Z/pZ. Comme dans l’exercice cité, la propriété précédente fait qu’il existe une unique loi externe · : K × G → G c Dunod 2014 I.2 : Actions de groupes 53 telle que (G, +, ·) soit un espace vectoriel. Explicitement, pour tout k ∈ Z et tout x ∈ G, on pose k̄ · x := kx, en notant k̄ la classe de k modulo p. Puisque le cardinal de G est pn , G est de dimension n sur K . Ainsi, G est isomorphe à K n = (Z/pZ)n , en tant que K -espace vectoriel, et a fortiori en tant que groupe. Soient inversement p un nombre premier et n ∈ N∗ . Soit toujours K le corps Z/pZ, et notons G le groupe additif de K n . Le groupe des automorphismes de G contient le groupe GL(K n ) (en fait, il y a égalité, mais peu importe). D’après l’exercice 3 de la page 66, le groupe GL(K n ) agit transitivement sur K n \ {0} , a fortiori l’action de Aut(G) sur G \ {0} est transitive. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 54 Module I.3 : Algèbre bilinéaire I.3.1 Nous supposerons n > 3 . Pour tous i, j, 1 6 i 6 n, 1 6 j 6 n, les applications li , cj n n T T sont des formes linéaires sur Mn (R), M0 = Ker li ∩ Ker cj est donc un sous espace i=1 j=1 de Mn (R). On remarque aussi que n X li (A) = i=1 X aij = (i) La matrice A est dans M0 , avec 1 6 i 6 n − 1, 1 6 j 6 n − 1 on a : ain = − k=1 aik , anj = − cj (A). j=1 16i6n 16j6n n−1 X n X n−1 X h=1 si, ahj et seulement et ann = si, n−1 X n−1 X pour tous i, j , ahj . j=1 h=1 On en déduit que les matrices (Eij + Enn − Ein − Enj ) 16i6n−1 ( i 6= j ) forment une base 16j6n−1 de M0 . La dimension de M0 est donc égale à (n − 1)2 . (ii) Soit J la matrice de Mn (R) dont tous les coefficients sont égaux à un, pour toute matrice A de M1 , A − lJ , si l = li (A), appartient à M0 . On en déduit que M1 est un sous espace de Mn (R) de dimension égale à (n − 1)2 + 1 . (iii) Les formes linéaires Tr et d restreintes à M0 , sont libres, donc M2 est un sous espace de Mn (R) de dimension égale à (n − 1)2 − 2 . (iv) De même qu’en (ii), on en déduit que M3 est un sous espace de Mn (R) de dimension égale à n(n − 2). I.3.2 Soit H un hyperplan de Mn (K) ; il est le noyau d’une forme linéaire non nulle sur Mn (K). Il existe donc une matrice A non nulle de Mn (K) telle que : H = {M ∈ Mn (K) | Tr(AM ) = 0}. Soit r ∈ [[1, n]], le rang de A, A est équivalente à la matrice Jr de Mn (K) égale à Diag(1, 1 . . . , 1, 0, 0, . . . , 0), il existe donc un couple P, Q de matrices de GLn (K) tel | {z } r que A = P Jr Q , donc Tr(AM ) = Tr(P Jr QM ) = Tr(Jr QM P ). On est ainsi ramené à déterminer une matrice M ′ = QM P telle que Tr(Jr M ′ ) = 0, M ′ étant inversible. Toute matrice de Mn (R), inversible et de diagonale nulle convient, la matrice M ′ dont tous les éléments sont nuls sauf m′n1 , m′12 , m′23 , . . . , m′n−1n , lesquels sont tous égaux à 1 est une solution ; elle est inversible puisqu’elle est une matrice de permutation. Remarque : Une autre solution possible Recherchons une solution parmi les matrices inversibles de Mn (K) bien connues, à savoir les matrices de transvection, soit (i, j), 1 6 i 6 n, 1 6 j 6 n, i 6= j et Tij = In + λEij , on A a Tr ATij = Tr A + λaji , si aji 6= 0 , on peut choisir λ = − Tr aji et la matrice Tij est élément de H ; ceci permet de déterminer une matrice solution si A n’est pas une matrice diagonale. Si A est diagonale, la matrice M ′ déterminée ci-dessus convient. c Dunod 2014 I.3 : Algèbre bilinéaire 55 I.3.3 a) Soit (i, j), 1 6 i 6 n, 1 6 j 6 n, i 6= j , g(Ei1 E1j ) = g(Eij ) et g(E1j Ei1 ) = 0 et pour tout i ∈ [[2, n]], g(Ei1 E1i ) = g(E1i Ei1 ) = g(E11 ), on en déduit donc que g = g(E11 ) Tr . b) On sait queTr(BC − CB) = 0 . Réciproquement , soit A ∈ Mn (K) de trace nulle, soit V le sous espace de Mn (K) engendré par les matrices de Mn (K) de la forme BC − CB , d’après le résultat obtenu ci-dessus V ⊥ est la droite engendrée par la forme Trace. En utilisant le théorème 11, on en déduit que A est dans V . I.3.4 a) Soit f ∈ Im tv , il existe g ∈ G∗ telle que f = g ◦ v , pour tout x ∈ Ker v , on a < f, x >= g ◦ v(x) = 0 , les sous espaces Ker v et Im tv sont donc orthogonaux. b) Déterminons l’orthogonal de Im tv , x ∈ (Im tv)◦ si, et seulement si, pour tout g ∈ G∗ , tv(g)(x) = 0 , soit g ◦ v(x) = 0 . On sait que (G∗ )◦ = {0} (proposition 4 de la page 98), donc x ∈ (Im tv)◦ si et seulement si v(x) = 0 , soit x ∈ Ker v , ainsi (Im tv)◦ = Ker v , F étant de dimension finie on a aussi Im tv = (Ker v)⊥ (théorème 11 de la page 102). Soit n = dim F , on a rang tv = dim(Im tv) = dim(Ker v)⊥ = n − dim Ker v , on en déduit donc : rang v = rang tv . t c) Supposons maintenant v ◦ u = 0 , on en déduit (v ◦ u) = 0 donc tu ◦ tv = 0 , ainsi que Im u ⊂ Ker v et Im tv ⊂ Ker tu , et ces quatre sous espaces sont de dimension finie. On sait (proposition 28 de la page 114) que dim H = dim Ker v − dim Im u et dim H ′ = dim Ker tu − dim Im tv . De même qu’au b), on démontre que (Im u)⊥ = Ker tu , donc dim H ′ = n − dim Im u − (n − dim Ker v) = dim H. Soit x ∈ E, y ∈ Ker v, g ∈ G∗ , f ∈ Ker tu , on a : < y+u(x), f +tv(g) >=< y, f > + < u(x), f > + < y, g◦v > + < u(x), g◦v >=< y, f >, on en déduit que l’on peut définir l’application ϕ : (ȳ, f¯) 7→< y, f > . La forme bilinéaire ϕ ainsi définie sur H × H ′ est non dégénérée car l’égalité < y, f >= 0, ∀f ∈ Ker tu , implique y ∈ Im u , donc ȳ = 0 . Les espaces H ′ et H ∗ sont isomorphes. I.3.5 a) Montrons que les formes linéaires fk , 0 6 k 6 n forment un système libre de E ∗ . Soient n n P P λk tk , des scalaires λk , 0 6 k 6 n, tels que pour tout P ∈ E, λk fk (P ) = 0 . Si P := on a Z 0 k=0 1 k=0 P 2 (t) dt = 0 , l’application t 7→ P 2 (t) étant une fonction continue et positive sur [0, 1], on peut affirmer que P = 0 donc que λk = 0 pour tout k ∈ [[0, n]]. n P b) Pour tout k ∈ [[0, n]] et pour tout P = a j tj , j=0 fk (P ) = Z n 1X 0 j=0 aj tk+j dt = n X j=0 aj · k+j+1 La matrice de passage de la base duale de B à la base (fk ) est donc : 1 M= · j + k + 1 06j6n 06k6n c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 56 I.3.6 a) Les polynômes Pn , pour n ∈ N, sont de degrés échelonnés, il forment une base de R[X]. On vérifie que, pour tout n ∈ N∗ , ∆(Pn ) = nPn−1 , donc pour tout P ∈ K[X] de degré n > 0 , on a deg ∆(P ) = deg ∆(Pn ) = deg Pn−1 = n − 1 = deg P − 1 ; en particulier ∆(P ) 6= 0 . Par ailleurs, si P est constant ∆(P ) = 0 . Par suite le noyau de ∆ est l’ensemble des polynômes constants et pour tout n > 0, ∆( Pn!n ) = Pn−1 (n−1)! · b) Pour tout k ∈ [[0, n]], on a ∆k (Pn /n!) = Pn−k /(n − k)!, donc pour tout k ∈ [[0, p]] : ∆k (P ) = p X n=k an Pn−k , (n − k)! on en déduit ak = ∆k (P )(0)· pour tout k ∈ [[0, p]]. c) D’après le résultat obtenu ci-dessus, pour tout polynôme P ∈ Kp [X], on a P = La base duale de la base Pn n! 06n6p p P n=0 est donc la base P 7→ ∆n (P )(0) 06n6p . ∆n (P )(0) Pn!n · I.3.7 Soient B := (e1 , . . . , en ) une base de E et (x1 , . . . , xp ) une famille de p vecteurs de E . n P Pour tout i ∈ [[1, p]], on a xi = ξiji eji . ji =1 Soit u une forme p-linéaire alternée sur E , on a : X u(x1 , x2 , . . . , xp ) = ξ1j1 ξ2j2 . . . ξpjp u(ej1 , ej2 , . . . , ejp ), (ji ) la somme du second membre étant étendue à tous les p-uples (j1 , . . . , jp ) tels que 1 6 ji 6 n. Puisque p > n, il existe au moins deux vecteurs égaux parmi chaque liste de vecteurs (ej1 , ej2 , . . . , ejp ) écrite ci-dessus, donc tous les u(ej1 , ej2 , . . . , ejp ) sont nuls et u = 0 . I.3.8 L’espace R3 étant muni de sa base canonique, la matrice associée à Φa est a −1 1 A = −1 a 1 . 1 1 a a) On a det A = (a + 1)2 (a − 2), Φa est donc dégénérée si et seulement si a = −1 ou a = 2 . Si a = −1, A est de rang 1 et Φ−1 (x) = −(x1 + x2 − x3 )2 , si a = 2, A est de rang 2, et son noyau est la droite dirigée par le vecteur (1, 1, −1). b) Les vecteurs v1 = (1, 0, 1), v2 = (1, −2, −1) forment une base Φa -conjuguée du plan d’équation :x1 + x2 − x3 = 0 , et le vecteur v3 = (1, 1, −1) est Φa -conjugué de v1 et v2 . Une base de R3 formée de vecteurs Φa conjugués, pour tout a, est la base (v1 , v2 , v3 ). I.3.9 • P P P P P P On peut écrire Φ1 (x) = ixi xj + (j − 1)xi xj = i xi xj + (j − 1)xj xi . i,j i,j i j j i P P On en déduit : Φ1 (x) = (2i − 1)xi xj , et Φ1 est le produit de deux formes linéaires i j indépendantes, elle est donc de signature égale à (1, −1). c Dunod 2014 I.3 : Algèbre bilinéaire • Φ2 (x) = P 57 inf(i, j)xi xj . i,j Si Rn est muni de sa base canonique, la matrice associée à la forme Φ2 est 1 1 1 ... 1 1 1 1 2 2 . . . 2 2 2 .. .. .. .. .. .. .. . . . . . . . A= 1 2 3 . . . k k k . . . .. .. . . .. .. .. .. . . . . 1 2 3 ... k ... n On peut appliquer la méthode de Gauß à la forme Φ2 : Φ2 (x) = x21 + 2x1 n X xi + i=2 X inf(i, j)xi xj 26i6n 26j6n Φ2 (x) = (x1 + x2 + · · · + xn )2 + X 16i6n−1 16j6n−1 inf(i, j)xi+1 xj+1 · Ainsi, par récurrence sur n, on obtient : • • Φ2 (x) = (x1 + x2 + · · · + xn )2 + (x2 + x3 + · · · + xn )2 + · · · + (xn−1 + xn )2 + x2n · P Φ3 (x) = (xi − xj )2 . i<j On note que la forme Φ3 est positive ; son noyau est donc égal à son cône isotrope. Or Φ3 (x) = 0 si, et seulement si, x1 = x2 = · · · = xn , le noyau de Φ3 est donc une droite et la signature de Φ3 est (n − 1, 0). P Φ4 (x) = cosh((i + j)α)xi xj . i,j On sait que cosh(i + j)α = cosh iα cosh jα + sinh iα sinh jα , donc : X X Φ4 (x) = ( (cosh αi)xi )2 + ( sinh(αi)xi )2 . i • i Si α 6= 0 , Φ4 est de signature (2, 0), si α = 0 , Φ4 est un carré. P Φ5 (x) = sin(θi + θj )xi xj . i,j On écrit sin(θi + θj ) = sin θi cos θj + cos θi sin θj et l’on en déduit : X X Φ5 (x) = 2 sin θi xi cos θj xj . i j Ainsi Φ5 est le produit de deux formes linéaires, ces formes sont liées si, et seulement si, pour tous i, j, 1 6 i 6 n, 1 6 j 6 n, sin θi cos θj − cos θi sin θj = 0 , c’est à dire sin(θi − θj ) = 0 , soit θi − θj = 0 (π). Si les formes ne sont pas liées, la signature de Φ5 est (1,1). Si les formes sont liées, pour tout i, 1 6 i 6 n, θi = θ1 (π), donc sin θi = εi sin θ1 , cos θi = εi cos θ1 , εi = ±1 , P donc Φ5 (x) = sin θ1 cos θ1 ( εi xi )2 , ou bien Φ5 est nulle ou bien de signature (1,0) ou i (0,1) suivant le signe de sin θ1 cos θ1 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 58 • n P Φ6 (x) = i=1 x2i − ( n P αi xi )2 . Nous supposerons que les scalaires αi ne sont pas tous i=1 nuls. Soit H l’hyperplan d’équation n P αi xi = 0 , pour tout x dans H , Φ6 (x) = i=1 n P i=1 x2i , la restriction de Φ6 à cet hyperplan est donc définie positive, on en déduit que la signature de Φ6 est ou bien (n, 0), ou bien (n − 1, 0), ou bien (n − 1, 1). n n P P P Si ϕ est la forme polaire associée à Φ6 , on a ϕ(x, y) = xi xj − ( αi xi )( αi yi ). ij i=1 i=1 Soit D la droite dirigée par v := (α1 , α2 , . . . , αn ), pour tous x ∈ D, y ∈ H, ϕ(x, y) = 0 , ainsi il nous suffit d’étudier les restrictions de Φ6 à H et à D . n P Soit s := α2i . Φ6 (v) = s(1 − s). Si s < 1 , Φ6 est définie positive, si s = 1 , la i=1 signature de Φ6 est (n − 1, 0), si s > 1 , la signature de Φ6 est (n − 1, 1). I.3.10 Soit Φ(x) = n P (i2 + i − 1)x2i + 2 i=1 Gauß. On a Φ(x) = puis : P 2 inf(i, j) − 1 xi xj ; appliquons la méthode de 16i<j6n n P P (x1 + x2 + · · ·+ xn )2 + (i2 + i − 2)x2i + 2 i=2 26i<j6n 2 inf(i, j)− 2 xi xj , Φ(x) = (x1 + x2 + · · · + xn )2 + (2x2 + x3 + · · · + xn )2 + n X i=3 (i2 + i − 3)x2i + 2 X 36i<j6n Soit k, 1 6 k 6 n − 2 , supposons que : 2 inf(i, j) − 3 xi xj . Φ(x) = (x1 + x2 + · · · + xn )2 + · · · + (kxk + xk+1 + · · · + xn )2 + n X i=k+1 i2 + i − (k + 1) x2i + 2 X k+16i<j6n 2 inf(i, j) − (k + 1) xi xj . En appliquant une fois de plus le procédé de Gauß , on obtient : Φ(x) = (x1 + x2 + · · · + xn )2 + · · · + (k + 1)xk+1 + xk+2 + · · · + xn + n X i=k+2 i2 + i − (k + 2) x2i + 2 On en déduit donc : Φ(x) = n P k=1 X k+26i<j6n 2 2 inf(i, j) − (k + 2) xi xj . (kxk + xk+1 + · · · + xn )2 , la forme Φ est définie positive. I.3.11 a) Soit P ∈ R[X], P 6= 0 , de degré k , il existe un réel C > 0 tel que |P (n)| 6 Cnk et |P (−n)| 6 Cnk , donc |P (n)P (−n) exp(−n)| 6 C 2 n2k exp(−n), on sait que n2k exp(−n) = O+∞ (1/n2 ), la série est donc absolument convergente. b) Considérons l’application ϕ qui au couple (P, Q) de R[X] × R[X] associe +∞ X 1 Φ(P + Q) − Φ(P ) − Φ(Q) , on a ϕ(P, Q) = P (n)Q(−n) + P (−n)Q(n) exp(−n), 2 n=0 c Dunod 2014 I.3 : Algèbre bilinéaire 59 l’application ϕ est bilinéaire et symétrique, de plus pour tous α ∈ R, P ∈ R[X], on a Φ(αP ) = α2 Φ(P ). On peut donc affirmer que Φ est une forme quadratique sur R[X]. Pour tout polynôme P pair, Φ(P ) = +∞ X P 2 (n) exp(−n) et pour tout polynôme P im- n=0 pair, Φ(P ) = − +∞ X P 2 (n) exp(−n), dans les deux cas Φ(P ) = 0 si, et seulement n=0 si, P (n) = 0 pour tout n, c’est à dire P = 0 ; la restriction de Φ au sous espace des polynômes pairs (respectivement impairs) est définie positive (respectivement définie négative). La signature de la forme quadratique restriction de Φ à l’espace Rp [X] est donc : E(p/2) + 1, p − E(p/2) . I.3.12 La forme bilinéaire associée à Φ est la forme ϕ qui, au couple (x, y) ∈ E × E associe ϕ(x, y) = f (x)f (y), on peut donc consulter l’exercice 8 de la page 113. On peut préciser le résultat obtenu dans l’étude de la réciproque : il existe λ ∈ K tel que ϕ(x, y) = λf (x)f (y). Si K = C, λ est un carré et ϕ est le carré d’une forme linéaire, si K = R, ϕ est égal à plus ou moins le carré d’une forme linéaire. I.3.13 Pour tous i, j , on sait que : Z +∞ 1 e−(ai +aj )t dt = , a + aj i 0 Φ(x) = donc i,j 0 +∞ e−(ai +aj )t dt xi xj = Z +∞ 0 = Z +∞ X i,j n X 0 +∞ 0 i,j On a aussi : X Z X Z e−(ai +aj )t dt xi xj . e−ai t xi e−aj t xj dt e −ai t i=1 xi !2 dt. La forme Φ est donc positive, de plus Φ(x) = 0 si, et seulement si, n P e−ai t xi = 0 i=1 pour tout t ∈ [0, +∞[, les réels (ai , 1 6 i 6 n) étant deux à deux distincts les applican P tions t ∈ [0, +∞[ 7→ e−ai t sont indépendantes, ainsi e−ai t xi = 0 pour tout t ∈ [0, +∞[, i=1 si, et seulement si, xi = 0 pour tout i ∈ [[1, n]] , la forme Φ est donc définie positive. 1 Remarques : On appelle matrice de Cauchy, toute matrice M = ai +b 16i6n , les ai et les bj j 16j6n étant des éléments d’un corps K tels que, pour tout (i, j), ai + bj 6= 0 . On peut en calculer le déterminant, par récurrence sur n, et l’on obtient : Y Y (ai − aj ) (bi − bj ) Det M = i<j i<j Y (ai + bj ) · i,j c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 60 Dans le cas où, pour tout i ∈ [[1, n]], ai = bi , les scalaires ai étant des réels strictement positifs deux à deux distincts, les mineurs principaux de M sont tous strictement positifs, la matrice M est donc définie positive. 1 On appelle matrice de Hilbert de taille n la matrice H = i+j−1 16i6n , en appliquant le ré16j6n sultat ci-dessus on peut affirmer que la matrice H est définie positive. On peut aussi remarquer, en anticipant le paragraphe 1.3 du module I.4, qu’elle est la matrice de Gram des applications t 7→ ti−1 , 1 6 i 6 n, si l’on a muni l’espace des applications continues sur [0, 1] du Z 1 produit scalaire ( f | g ) = fg. 0 I.3.14 a) Soit k ∈ [[2, n]] et : b1 a2 0 Ak = . .. 0 0 c1 b2 a3 .. . 0 c2 b3 .. . 0 0 c3 .. . ... ... ... .. . ... ... 0 0 ak−1 0 bk−1 ak 0 0 0 . ck−1 bk On calcule Dk = det(Ak ) grâce au développement de ce déterminant par rapport à la dernière ligne, et l’on obtient : Dk = bk Dk−1 − ak ck−1 Dk−2 , on vérifie de plus que D2 = d2 et D1 = d1 , ce qui permet d’affirmer que Dk = dk , ∀k ∈ [[1, n]]. b) On vérifie que pour tout k ∈ [[1, n − 1]], (LU )k,k+1 = ck , de plus (LU )11 = b1 , et ∀k ∈ [[2, n − 2]] , (LU )kk = ak ck−1 dk−2 +dk dk−1 = bk , (LU )k k−1 = ak et (LU )kl = 0 dans tous les autres cas. Donc A = LU . c) Pour résoudre le système AX = V , on détermine d’abord Y solution de l’ équation L∆Y = V , puis l’on résout l’équation ∆−1 U X = Y . Soit Z = ∆−1 U , on a : 1 z1 0 ... ... 0 0 1 z2 . . . . . . 0 0 0 1 z . . . 0 3 Z = . . .. .. . . . . . . . . . . 0 . . . . . . 0 1 zn−1 0 ... ... 0 1 d ck Les scalaires (zk ), 1 6 k 6 n − 1 sont tels que zk = ck k−1 dk = bk −ak zk−1 , d’autre part on a: d1 0 0 ... 0 0 d0 a2 d 2 0 ... 0 0 d1 d3 0 a ... 0 0 3 d2 . L∆ = .. . . .. .. . . . 0 0 . 0 0 . . . an−1 ddn−1 0 n−2 dn 0 0 ... ... an dn−1 On en déduit : y1 = yk = c Dunod 2014 v1 b1 , et, pour tout k ∈ [[2, n]], ak yk−1 + dk dk−1 yk = vk , soit dk−1 zk (vk − ak yk−1 ) (vk − ak yk−1 ) = (vk − ak yk−1 ) = · dk ck (bk − ak zk−1 ) I.3 : Algèbre bilinéaire 61 Il reste donc à déterminer X tel que ZX = Y , on a xn = yn , et pour tout k ∈ [[1, n − 1]], xk = yk − zk xk+1 . Pour une telle résolution, on effectue 3(n − 1) additions , 3(n − 1) multiplications et 2n divisions, soit 8n − 6 opérations. I.3.15 La propriété énoncée est certainement vraie pour une matrice de taille 1 ! Utilisons un raisonnement par récurrence, supposons que toute matrice symétrique de taille n dont tous les mineurs principaux sont strictement positifs est définie positive. Soit A une matrice de Sn+1 (R), de mineurs principaux strictement positifs, a11 a12 . . . a1 n a1 n+1 a2 n+1 a21 a22 . . . a2 n A V A= t1 , avec A1 := . et V := . . . . . .. .. .. V an+1 n+1 .. .. an 1 an 2 . . . an n an n+1 D’après l’hypothèse, la matrice symétrique A1 , de taille n, a tous ses mineurs principaux strictement positifs, elle est donc définie positive et congruente à la matriceIn , il existe donc une matrice P de GLn (R) telle que A1 = tP −1 P −1 , on peut donc écrire : t t A1 V P 0 In−1 PV P 0 = t t 0 1 0 1 V an+1 n+1 V P an+1 n+1 et l’on se ramène au cas d’une matrice de la forme : 1 0 0 ... 0 0 1 0 ... 0 .. .. M = . . 0 0 0 ... 1 m1 m2 . . . mn On a det M = mn+1 − t n P i=1 m2i et, pour tout x dans Rn+1 : XM X = n X x2i + 2 i=1 On en déduit : t m1 m2 . mn mn+1 XM X = n X n X mi xi xn+1 + m2n+1 x2n+1 . i=1 (xi + mi xn+1 )2 + det M x2n+1 . i=1 D’après l’hypothèse, on sait que le déterminant de M est strictement positif, d’où le résultat. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 62 Module I.4 : Espaces préhilbertiens I.4.1 Montrons : (i) =⇒ (ii). Les projecteurs orthogonaux p et q de l’espace vectoriel euclidien E sont diagonalisables, de plus ils commutent. Il existe donc une base de E formée de vecteurs propres communs à p et q . Montrons : (ii) =⇒ (iii). Soit B une base de vecteurs propres communs à p et q . On a : P := MatB (p) = Diag(p1 , . . . , pk , . . . , pn ), Q := MatB (q) = Diag(q1 , . . . , qk , . . . , qn ). On en déduit : P Q = MatB (pq)=Diag(p1 q1 , . . . , pk qk , . . . , pn qn ). Pour tout k ∈ [[1, n]], les réels pk et qk valent 1 ou 0 , il en est de même de pk qk ; pq est donc un projecteur. Montrons :(iii) =⇒ (i) . Nous allons montrer que pq est orthogonal, dans ce cas, il est symétrique donc pq = qp. Remarquons tout d’abord que, pour tout vecteur v de E , kpq(v)k 6 kq(v)k 6 kvk (un projecteur orthogonal « diminue » les normes). Pour tout (x, y) ∈ Im(pq) × Ker(pq), et pour tout t ∈ R, pq(x + ty) = x ; on a donc : kxk2 6 kx + tyk2 , soit t2 kyk2 + 2t(x|y) > 0 , ce qui implique (x|y) = 0 ; Im pq et Ker pq sont donc orthogonaux, pq est bien un projecteur orthogonal. I.4.2 Si (e1 , e2 , . . . , en ) est la base canonique de Rn , les vecteurs (e1 − en , e2 − en , . . . , en−1 − en ) forment une base de l’hyperplan, on peut alors appliquer l’orthogonalisation de Gram-Schmidt à cette famille, désignons par (v1 , v2 , . . . , vn−1 ) le système obtenu. Par récurrence sur k , on vérifie que : vk = ek − k1 (e1 + e2 + · · · + ek−1 + en ) pour tout k ∈ [[1, n − 1]]. Une base orthonormée de l’hyperplan est donc : r k 1 B := ek − (e1 + e2 + · · · + ek−1 + en ) , k ∈ [[1, n − 1]] · k+1 k I.4.3 Soit u une application de E dans E conservant le produit scalaire, elle appartient à O(E) si, et seulement si, elle est linéaire, ce que nous allons montrer. Soit (e1 , e2 , . . . , en ) une base orthonormée de E , u(e1 ), u(e2 ), . . . , u(en ) est une base orthonormée de E car u conserve le produit scalaire. Pour tout x dans E , on a : x= n X i=1 D’où le résultat. (x|ei )ei et u(x) = n X i=1 n X u(x) u(ei ) u(ei ) = (x|ei )u(ei ). i=1 I.4.4 Exemples de groupes de Coxeter. a) Soit E un espace vectoriel euclidien de dimension n > 1 , soient s une symétrie orthogonale hyperplane et g ∈ O(E), on définit σ := g ◦ s ◦ g −1 . On vérifie que σ est une symétrie orthogonale, en effet σ 2 = g ◦ s2 ◦ g −1 = Id c Dunod 2014 I.4 : Espaces préhilbertiens 63 et σ = g ◦ s ◦ g ∗ = σ ∗ . Cherchons maintenant l’axe de σ . On a σ(x) = x si, et seulement si, g ◦ s ◦ g −1 (x) = x, soit s ◦ g −1 (x) = g −1 (x), c’est à dire g −1 (x) ∈ H , l’axe de σ est donc l’hyperplan g(H). b) Simple conséquence de la définition de deux hyperplans perpendiculaires. c) Soient s1 (resp. s2 ), deux symétries hyperplanes d’axe H1 (resp. H2 ), soient v1 (resp. v2 ) un vecteur unitaire orthogonal à H1 (resp. H2 ), et p1 (resp. p2 ) le projecteur orthogonal 1 2 sur Rv1 (resp. Rv2 ). On sait que p1 = Id −s , de même p2 = Id −s , donc s1 et s2 2 2 commutent si, et seulement si, p1 et p2 commutent. Pour tout x ∈ E, p1 (x) = (x|v1 )v1 et p2 (x) = (x|v2 )v2 , donc : p1 ◦ p2 (x) = (x|v2 )(v1 |v2 )v1 , p2 ◦ p1 (x) = (x|v1 )(v1 |v2 )v2 . Ainsi p1 et p2 commutent si, et seulement si, ou bien (v1 |v2 ) = 0 , c’est à dire H1 et H2 sont perpendiculaires, ou bien si v1 et v2 sont colinéaires, c’est à dire s1 = s2 . d) Si n = 3 , un tel sous groupe est engendré par 1 , 2 ou 3 symétries orthogonales hyperplanes. On obtient les cas suivants : 1) G1 = {s, Id}, s étant une symétrie orthogonale hyperplane. 2) G2 = {s, t, s ◦ t, Id}, s, t étant deux symétries orthogonales hyperplanes d’axes perpendiculaires. Dans ce cas, si l’on choisit les axes de s et t comme plans de coordonnées, les matrices S et T associées à s et t sont : 1 0 0 1 0 0 1 0 et T = 0 −1 0 . S= 0 0 0 −1 0 0 1 3) G3 = {s, t, u, s ◦ t, s ◦ u, t ◦ u, Id}, s, t, u étant trois symétries orthogonales hyperplanes d’axes deux à deux perpendiculaires. Dans ce cas, si l’on choisit les axes de s, t et u comme plans de coordonnées, les matrices S, T et U associées à s, t et u sont : 1 0 0 1 0 0 −1 0 0 1 0 T = 0 −1 0 U = 0 1 0 . S= 0 0 0 −1 0 0 1 0 0 1 I.4.5 a) Soit x = p P xi vi , on a : i=1 2 kxk = p X p X i=1 j=1 On en déduit : xi xj (vi |vj ) p X p X i=1 j=1 et p 2 p X p X X |xi |vi = |xi ||xj |(vi |vj ). i=1 i=1 j=1 (|xi ||xj | − xi xj )(vi |vj ) 6 0. En effet |xi ||xj | − xi xj > 0 et (vi |vj ) < 0 . p p p X X X b) D’après a), si λi vi = 0 , alors |λi |vi = 0 , et |λi |(vi |a) = 0 , ce qui entraîne, i=1 i=1 i=1 puisque (vi |a) > 0 , que tous les λi sont nuls, la famille (v) est donc libre. c) Supposons que l’un des λi soit nul, à une permutation près, on peut supposer λ1 = 0 , pour tout i ∈ [[2, p]], (−v1 |vi ) est strictement positif et la famille (v2 . . . vp ) est liée, ce qui, d’après c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 64 b) est contradictoire. Supposons que les λi ne soient pas tous de même signe, soit : On a p X I = {i ∈ [[1, p]]| λi > 0} p X λi vi = 0 et i=1 i=1 on en déduirait donc X i∈I |λi |vi = 0 , soit et X J = {j ∈ [[1, p]]| λj < 0}. λi vi + i∈I X λj vj = 0 et j∈J X i∈I λi vi − X λj vj = 0 , j∈J λi vi = 0 , ce qui est impossible (I 6= ∅). Montrons maintenant que le rang de (v) est égal à p − 1 ; supposons qu’il existe une autre relation de liaison de la p p X X forme µi vi = 0 , on en déduirait (λ1 µi − λi µ1 )vi = 0 , donc(λ1 µi − λi µ1 ) = 0 pour i=1 i=2 tout i ∈ [[2, p]], et µi = µλ11 λi , les deux relations de dépendance sont donc proportionnelles, d’où le résultat. On peut donc affirmer que (p − 1) 6 n soit p 6 n + 1. d) Le système (v) étant lié, il existe des réels, non tous nuls, λ1 , . . . , λn+1 tels n+1 P que λi vi = 0 . i=1 Pour tout k ∈ [[1, n + 1]], Définissons s := n+1 P i=1 n+1 P i=1 λi (vi |vk ) = 0 , soit λk − α n+1 P λi = 0 . i6=k λi . Pour tout k ∈ [[1, n + 1]], −αs + (1 + α)λk = 0 soit λk = ainsi pour tout k ∈ [[1, n + 1]], λk = On a alors P (n+1)α α+1 λk et α = αs α+1 , 1 n· vi = 0 . i=1 I.4.6 Il existe une base orthonormée de E , soit B , formée de vecteurs propres de a. Les valeurs propres de l’endomorphisme a, défini positif, sont des réels strictement positifs. On a : D := MatB (a)=Diag(d21 , . . . , d2k , . . . , d2n ). Si B := MatB (b), C := MatB (c), on a ac + ca = b si et seulement si d2i ci,j + ci,j d2j = bi,j , soit ci,j = bi,j d2i +d2j (avec les notations usuelles). La matrice C existe donc, elle est unique et symétrique, il en va de même de l’endomorphisme c. Montrons maintenant que toutes les valeurs propres de c sont positives. Considérons un vecteur propre X de C , associé à une valeur propre λ : C(X)=λX . On a DCX + CDX = BX et t XDCX + t XCDX = t XBX ; or t XDCX = t XCDX , on en déduit : 2λt XDX = t XBX . On sait que t XDX est strictement positif et que t XBX est positif, λ est donc positif, il en est de même de la matrice C et de l’endomorphisme c. D’après le corollaire de la proposition 55, page 183, on peut affirmer que C ∈ Sn+ (R) et que l’endomorphisme c est positif. I.4.7 Soient C1 , C2 , C3 , les vecteurs colonnes de la matrice c Dunod 2014 1 −1 2 A := −1 0 −1 0 −1 , 1 I.4 : Espaces préhilbertiens 65 et (e1 , e2 , e3 ) la base canonique de R3 , on voit de suite que C1 + C2 + C3 = 0 et 1 que C1 − C3 = 0 .On en déduit donc que e1 + e2 + e3 est vecteur propre de A −1 associé à la valeur propre 0 et que e1 − e3 est vecteur propre de A associée à 1 . La trace de A étant égale à 4 , on sait que 3 est valeur propre de A, un vecteur propre associé à 3 étant e1 − 2e2 + e3 = (e1 − e3 ) ∧ (e1 + e2 + e3 ) puisque l’on sait que les vecteurs propres de A sont deux à deux orthogonaux. Le couple des matrices : 1 √ √1 √1 1 0 0 2 6 3 −2 √1 D := 0 3 0 P := 0 √ 6 3 −1 √ √1 √1 0 0 0 2 est donc une solution. 6 3 2 −2 1 4 −4 , contrairement au cas précédent, On suppose maintenant que A := −2 1 −4 −2 il n’apparaît pas de « combinaisons linéaires » simples des colonnes de A, on calcule donc det(λI − A) = (λ − 1)(λ + 4)(λ − 7) et l’on recherche les vecteurs propres associés respectivement à (1, −4, 7). On détermine alors le couple de matrices : 5 √ √1 0 1 0 0 30 6 −2 0 P := √230 √15 √ D := 0 −4 6 −1 √ √2 √1 0 0 7 30 tel que A = P DP −1 5 6 . I.4.8 Calcul de la distance d’un point à un sous espace de dimension finie d’un espace euclidien : un « bon classique ». Considérons l’espace E des applications continues sur ]0, 1], à valeurs dans R, de carré intéZ 1 grable. On peut munir E du produit scalaire : (f1 |f2 ) = f1 (t)f2 (t) dt. 0 L’application g : t 7→ ln(t) est dans E (ln(t))2 6 ( √1t ) ; l’application f admet donc un minimum égal au carré de la distance de g à Rn [T ]. n P Soit p le projecteur orthogonal sur Rn [T ] : p(g) = ak tk , (a0 . . . an ) étant solution du k=0 système linéaire non homogène (S) de n équations : n X k=0 ak (tk |th ) = (g|th ), ∀h ∈ [[0, n]], qui équivaut au système : n X k=0 ak 1 =− , k+h+1 (h + 1)2 ∀h ∈ [[0, n]]. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 66 Considérons la fraction rationnelle F (t) := n X k=0 ak 1 + ; (a0 , . . . an ) est solution k + t + 1 (t + 1)2 Pn (t) (t+1)2 (t+2)...(t+n+1) 1 coefficient de (t+1) 2 dans la de (S) si, et seulement si, F (0) = · · · = F (n) = 0 . On a F (t) = avec deg Pn 6 n + 1 , d’où Pn (t) = Cn t(t − 1) . . . (t − n). Le décomposition en éléments simples de F est 1 , donc : 1= Pn (−1) (−1)n+1 Cn (n + 1)! = n! n! Cn = et On sait que d2 (g, Rn [T ]) = kgk2 − p(g) g . On a kgk2 = n P intégration par parties), et p(g) g = − k=0 On remarque : F ′ (t) = −2 (t+1)3 n − n P k=0 ′ ak (k+1+t)2 Z 1 (−1)n+1 · n+1 (ln(t))2 dt = 2 (faire une 0 ak (k+1)2 · , donc d2 (g, Rn [T ]) = −F ′ (0). Au voisinage Cn 1 de zéro, F (t) ∼ t (−1) (n+1) donc F (0) = − (n+1)2 , et inf(f ) = 1 (n+1)2 · Z 1 I.4.9 a) Soit g ∈ E , on vérifie sans difficulté que l’application de E dans R : f 7→ (f g + f ′ g ′ ) 0 Z 1 est linéaire, on a aussi (f |g) = (g|f ). De plus (f |f ) = f 2 + f ′2 > 0 et (f |f ) = 0 si 0 et seulement si l’application f 2 + f ′2 , continue et positive sur [0, 1], est nulle, ce qui entraîne f 2 = 0 . L’application (f, g) 7→ (f |g) est donc bien un produit scalaire sur E . b) Soient ϕ0 et ϕ1 ) les applications respectivement définies par : f ∈ E 7→ f (0) et f ∈ E 7→ f (1)), ce sont des formes linéaires sur E et V = Ker ϕ0 ∩ Ker ϕ1 . Soit u l’application : f ∈ E 7→ f − f ′′ , u est une application linéaire de E dans C 0 ([0, 1], R) et W = Ker u ; ainsi V et W sont des sous espaces vectoriels de E . Pour tous g dans V et h dans W , on a (gh + g ′ h′ ) = gh′′ + g ′ h′ = (gh′ )′ , d’où : (g|h) = g(1)h′ (1) − g(0)h′ (0) = 0 ; V et W sont donc orthogonaux. Soit hα,β l’application : t 7→ β sinh(t)−α sinh(t−1) sinh(1) , elle est dans W, et hα,β (0) = α , hα,β (1) = β . Pour tout f de E , si α = f (0) et β = f (1), l’application g := f − hα,β est dans V ; V et W sont donc supplémentaires orthogonaux. c) D’après b), pour tout f ∈ F, f = hα,β + g , avec g ∈ V , donc F = hα,β + V , on en déduit : Z 1 (α2 + β 2 ) cosh(1) − 2αβ inf = (f 2 (t) + f ′2 (t)) dt = khα,β k2 = · f∈ F sinh(1) 0 I.4.10 Applications des propriétés de u∗ u , de Ker u∗ u et de Im u∗ u Montrons tout d’abord la propriété suivante : pour tout endomorphisme u d’un espace vectoriel euclidien : Ker u = Ker u∗ u. En effet Ker u ⊂ Ker u∗ u , et pour tout x ∈ Ker u∗ u, 0 = (x|u∗ u(x)) = ku(x)k2 , donc Ker u∗ u ⊂ Ker u ; ainsi Ker u = Ker u∗ u . c Dunod 2014 I.4 : Espaces préhilbertiens 67 a) Soit u dans E , tel que u = uu∗ u , alors u∗ u = u∗ uu∗ u , ainsi u∗ u est un projecteur symétrique, il est donc orthogonal. Réciproquement supposons que u∗ u soit un projecteur orthogonal. Pour tout x dans Ker u∗ u , on a u(x) = 0 = uu∗ u(x), et pour tout x dans Im u∗ u , on a u∗ u(x) = x et uu∗ u(x) = u(x). Les applications u et uu∗ u sont égales sur deux sous espaces supplémentaires, elles sont donc égales. b) Supposons u dans A. On sait que u∗ u est un projecteur orthogonal, donc : (Ker u)⊥ = (Ker u∗ u)⊥ = Im u∗ u; ainsi, pour tout x dans (Ker u)⊥ , u∗ u(x) = x, et ( x | x ) = x u∗ u(x) = ku(x)k2 . Réciproquement, nous allons montrer que u∗ u est un projecteur en montrant que ses valeurs propres sont dans {0,1}. Soit λ une valeur propre non nulle de u∗ u et x un vecteur propre associé, x ∈ Im u∗ u , et kxk2 = ku(x)k2 = x u∗ u(x) = λkxk2 , donc λ = 1 . c) D’après les résultats obtenus au b), nous savons que (Ker u)⊥ ⊂ {x ∈ E | kxk = ku(x)k} . Réciproquement, si x ∈ E et si kxk = ku(x)k , on a : kxk2 = ku(x)k2 = x u∗ u(x) 6 kxk2 ; d’après l’inégalité de Cauchy-Schwarz : u∗ u(x) = x . I.4.11 a) Pour tout P ∈ E , u(P )(x) = Z seulement si, pour tout k ∈ [[0, n]], 1 n X n k=0 k xn−k Z 1 tk P (t) dt ; donc u(P ) = 0 si, et 0 tk P (t) dt = 0 ; un tel polynôme P orthogonal à tout 0 l’espace est nul. Pour tous P, Q , dans E , grâce à la formule de Fubini (calcul d’intégrales doubles) on a : Z 1 Z 1 u(P ) Q = (x + t)n P (t) dt Q(x) dx 0 = 0 Z 1 Z 0 0 1 (x + t)n Q(x) dx P (t) dt = u(Q) P . L’application u est donc un automorphisme autoadjoint de E . b) Pour tout y ∈ R, (x+y)n est un polynôme élément de E , appelons le Qn ; (P0 , P1 . . . , Pn ) n P étant une base orthonormée deE , on sait que Qn = Qn Pk Pk . Or Qn Pk = Z k=0 1 (t + y)n Pk (t) dt = λk Pk (y), d’où le résultat. 0 On peut donc écrire : Z 1 Z 1 n n X X 2n (x + t) dt = (x + t)n λk Pk (x)Pk (t) dt = λ2k Pk2 (x). 0 0 k=0 k=0 c) Par définition Tr(u) = n X k=0 u(Pk ) Pk = Z n 1X λk (Pk (t))2 dt; 0 k=0 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 68 d’après b), nous savons que : n P λk Pk (t)2 = (2t)n , donc Tr u = 2n /(n + 1). k=0 De même : Tr(u2 ) = n X k=0 Z u2 (Pk ) Pk = 0 k=0 22n+1 −1 (n+1)(2n+1) · 2 et l’on obtient Tr(u ) = I.4.12 1) Si Q0 existe, pour tout n ∈ N, on a 2n = Z 1 déduirait : 2n 6 |Q0 |, ce qui n’est pas. Z n 1X 1 0 λ2k Pk2 (t) dt, tn Q0 , or | Z 1 0 tn Q 0 | 6 Z 1 |Q0 |, on en 0 0 2.a) Pour tout P ∈ E et tout t ∈ [0, 1], |P (t)| 6 kP k∞ , si kP k∞ = sup |P (t)| ; l’applicat∈[0,1] tion : t ∈]0, 1] 7→ S’il existe Q1 = P (t) √ est t p X k=0 tout n ∈ N, 2 2n+1 = continue et dominée par kP k∞ √ t , elle est donc intégrable. αk tk tel que pour tout P ∈ E : f (P ) = ( Q1 | P ) , alors pour p P k=0 αk n+k+1 · Par conséquent, pour tout x ∈ R, 2 2x+1 = p P k=0 αk x+k+1 ; les fractions écrites dans chaque membre de l’égalité n’ont pas les mêmes pôles, elles ne peuvent être égales, d’où la contradiction. 2.b) Si w admet un adjoint w∗ , pour tous P, Q ∈ E : w(P ) Q = P w∗ (Q) ; en Z 1 particulier si Q = 1 , pour tout P ∈ E , on a P = P w∗ (Q) , d’après le résultat vu en 0 a), ceci est impossible. I.4.13 Cet exercice ne fait appel qu’à des connaissances très simples, mais il demande un peu d’habileté dans les majorations. Soient B := (e1 , . . . , en ) la base canonique de Rn et a l’endomorphisme de Rn tel que A = MatB (a). Soit (v1 , v2 , . . . , vn ) une base orthonormée de vecteurs propres de a. Pour tout i ∈ [[1, n]] : n X aii = a(ei ) ei = λh (ei |vh )2 et aii 6 h=1 n P On sait d’autre part que k X h=1 λh (ei |vh )2 + λk n X (ei |vh )2 . h=k+1 (ei |vh )2 = k ei k2 = 1 . h=1 On en déduit : aii 6 k P (λh − λk )(ei |vh )2 + λk . h=1 En sommant ces inégalités, on obtient : k X aii 6 i=1 k X k X (λh − λk )(ei |vh )2 + kλk = i=1 h=1 6 k X k X (λh − λk ) + kλk = i=1 h=1 c Dunod 2014 k X h=1 λh · k X (λh − λk ) h=1 k X i=1 (ei |vh )2 + kλk I.4 : Espaces préhilbertiens 69 I.4.14 a) Considérons le produit scalaire sur Rn : (x, z) 7→ tXAZ , et appliquons la formule de Cauchy-Schwarz. On sait que pour tous x, z dans Rn , (tXAZ)2 6 (tXAX)(tZAZ) ; si Z := A−1 Y , on a donc (tXY )2 6 (tXAX)(tY A−1 Y ). b) La matrice A étant définie positive, Ai l’est aussi, donc det Ai > 0 , de plus det Ai Ai ème terme de la diagonale de A−1 . est le cofacteur d’indice (i, i) de A, et det det A est le i Soit (v1 , v2 , . . . , vn ) la base canonique de Rn , tVi A−1 Vi = tout x ∈ Rn : (tXVi )2 6 (tXAX)(tVi A−1 Vi ), det Ai det A ; d’après a), pour t Ai 2 soit (tXAX) det det A > xi . On en déduit, si xi = 1 , l’inégalité : XAX > Pour X := det A −1 Vi , det Ai A on a xi = 1 et tXAX = det A det Ai , d’où le résultat. det A det Ai · I.4.15 Soit B := (e1 , . . . , en ) la base canonique de Rn , soit Φ (resp.Ψ ), la forme quadratique sur Rn telle que A = Mat(Φ; B) (resp.B = Mat(Ψ; B)). i) Soit A ∈ Sn+ (R), si rang(A) = 1 , on sait que (voir l’exercice 12 de la page 129) Φ est le carré d’une forme linéaire, donc pour tout (i, j) ∈ [[1, n]] × [[1, n]] on a ai,j = αi αj , (α1 , α2 , . . . , αn ) ∈ Rn . Ainsi : Ψ(x) = n n X n X X 1 xi xj =( xi )2 . α α α i j i i=1 j=1 i=1 Ce qui montre que B est dans Sn+ (R). ii) Réciproquement, examinons d’abord le cas où n = 2 , A ∈ S2+ (R), donc a11 > 0 et a11 a22 − a212 > 0 , de même B ∈ S2+ (R) donc ( a111a22 − a12 ) > 0 . 12 Ainsi a11 a22 − a212 = 0 , A est donc de rang un ( a11 6= 0 ). Étudions maintenant le cas général ; pour tout (i, j) ∈ [[1, n]] × [[1, n]], i 6= j , les restrictions de Ψ et de Φ au plan engendré par (ei , ej ) sont positives, on a donc aii ajj − a2ij = 0 , √ on en déduit aij = εij αi αj , si αi = aii , 1 6 i 6 n, et εij = ±1 , pour tout (i, j) ∈ [[1, n]] × [[1, n]], i 6= j . n P Ainsi Φ(x) = (α1 x1 + ε1i αi xi )2 + Ξ(x2 , . . . , xn ), avec : i=2 Ξ(x2 , . . . , xn ) = X 26i<j6n (αi αj εij − εi1 εj1 αi αj )xi xj . La matrice C associée à Ξ dans la base (e2 , . . . , en ) est une matrice de diagonale nulle ; si C n’est pas nulle, elle possède des valeurs propres de signe distinct, et Φ n’est pas positive. n P Ainsi Ξ = 0 , Φ(x) = (α1 x1 + ε1i αi xi )2 , la matrice A est donc de rang un. i=2 I.4.16 Soit A ∈ An (R), tA = −A, donc A2 = −tAA. Soient λ une valeur propre de A, considérée comme matrice de Mn (C), et V un vecteur propre de A associé ; on sait que : λ2 V = A2 (V ) = −tAA(V ), les valeurs propres de tAA étant des réels positifs, on a donc λ2 6 0 , soit λ ∈ iR. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 70 I.4.17 (i) Pour tous x, y ∈ E , u(x) y = ( a | x )( b | y ) , on en déduit que u∗ est l’application x 7→ ( x | b )a. (ii) Pour tout x ∈ E , f (x) = ( a | x )b+( b | x )a, les vecteurs a, b étant indépendants, on peut dire que Im(f ) = Vect(a, b) et que Ker(f ) = a⊥ ∩ b⊥ . Pour rechercher les valeurs propres non nulles de f , on étudie alors la restriction-corestriction de f au plan engendré par a, b ; sa matrice associée dans la base (a, b) est : ( a | b ) kbk2 M := . kak2 ( a | b ) 2 Le polynôme caractéristique de M est : λ − ( a | b ) − kbk2 kak2 . On en déduit que la droite dirigée par kbka+ kakb est la droite propre associée à la valeur propre ( a | b )+ kbkkak , et que la droite dirigée par kbka−kakb est la droite propre associée à la valeur propre ( a | b )−kbkkak . I.4.18 Nous souhaitons indiquer ici une solution ne faisant pas appel aux résultats concernant les endomorphismes normaux d’un espace vectoriel hermitien. Soit S une matrice non nulle de Sn (R). On suppose que ses valeurs propres sont ou nulles ou strictement négatives d’ordre de multiplicité pair. Il existe P ∈ On (R) et des réels non nuls a1 , a2 . . . , ak , 1 6 k 6 n, tels que S = tP DP avec : D = Diag(0, · · · 0, −a21 , −a21 , −a22 , −a22 , . . . , −a2k , −a2k ), alors S = A2 avec A = tP RP où 0 .. . R= (O) et pour tout i ∈ [[1, n]], Ri = 0 −ai ai 0 (O) 0 R1 R2 .. . Rk . Réciproquement, soit A une matrice antisymétrique réelle, et S := A2 = −tAA, S est symétrique, négative, elle est diagonalisable et Ker A2 = Ker tAA = Ker A, donc (voir l’exercice I.5.11 de la page 257) A considérée comme matrice de Mn (C) est diagonalisable, ses valeurs propres non nulles peuvent être regroupées par paires imaginaires pures conjuguées ; les valeurs propres non nulles de S sont donc de multiplicité paire. I.4.19 Soit n > 3 . Soient (C1 , C2 , . . . , Cn ) les vecteurs colonnes de M . Soit V = (1, 1, . . . , 1) dans Rn . c Dunod 2014 I.4 : Espaces préhilbertiens 71 Pour tout k ∈ [[1, n]], Ck = C1 + (k − 1)V , M est donc de rang 2, M étant diagonalisable, on sait que zéro est valeur propre de M de multiplicité (n − 2), et l’espace propre associé est défini par les deux équations : x1 + x2 + · · · + xn = 0 et x1 + 2x2 + · · · + kxk · · · + nxn = 0. On recherche alors les valeurs propres non nulles de M en remarquant que les vecteurs propres associés sont dans le plan engendré par C1 et V . n X n(n − 1) Calculons les images de C1 et de V , on a M V = C1 + (k − 1)V = nC1 + V 2 k=1 et M C1 = n X k=1 n(n + 1) n(n2 − 1) k(C1 + (k − 1)V ) = C1 + V. 2 3 Les valeurs propres non nulles de M sont celles de la matrice : n(n + 1)/2 n M′ = 2 n(n − 1)/3 n(n − 1)/2 1 2 2 dont le polynôme caractéristique est : λ2 − n2 λ − 12 n (n − 1). q 4n2 −1 n ), sont associés les vecteurs propres : Aux valeurs propres λ = 2 (n ± 3 r 4n2 − 1 −2C1 + (1 ± )V. 3 I.4.20 On applique la méthode exposée dans le paragraphe Réduction simultanée de deux formes quadratiques (remarque pratique de la page 185). On vérifie facilement que Ψ(x) = (x1 − x2 )2 + (x2 − x3 )2 + (x3 − x4 )2 + x24 , ce qui permet de voir que Ψ est une forme quadratique définie positive. On recherche ensuite les scalaires λ et les vecteurs non nuls V ∈ R4 tels que : B(V ) = λA(V ), si 1 −1 0 0 1 −1 0 0 −1 3 −2 0 2 −1 0 et A := −1 . B := 0 −2 1 1 0 −1 2 −1 0 0 1 −1 0 0 −1 2 Pour tout λ ∈ R, on a : det(B − λA) = λ(2 − λ)(1 − λ)(1 + λ), et : 1 1 1 0 1 1 (B − A) 0 = 0; (B − 2A) 0 = 0; (B + A) 1 = 0; 0 0 0 On détermine ainsi la base B de R4 formée des vecteurs : 1 1 1 0 1 1 V1 = 0 , V2 = 0 , V3 = 1 , 0 0 0 1 1 B 1 = 0. 1 1 1 V4 = 1 . 1 Ces quatre vecteurs sont d’autre part Ψ orthonormés, la matrice associée à Φ dans cette base est Diag(1, 2, −1, 0). c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 72 I.4.21 Nous utilisons ici la réduction simultanée de deux matrices symétriques réelles positives (voir page 185). a) Nous supposerons λi > 0, ∀i ∈ [[1, n]], sinon l’inégalité est évidente . Soit f l’applicaexp t tion t 7→ ln(1 + exp t), f est de classe C ∞ sur R, et ∀t ∈ R, f ′′ (t) = (1+exp t)2 > 0 , f est n n P P convexe. Donc, ∀n ∈ N ∗ , ∀(t1 , . . . , tn ) ∈ Rn , f ( n1 ti ) 6 n1 f (ti ). Si l’on définit, pour i=1 i=1 tout i ∈ [[1, n]], ti := ln λi , on obtient l’inégalité : n n Y n1 1X ln(1 + λi ). ln 1 + λi 6 n i=1 i=1 b) Si A et B ne sont pas inversibles, l’inégalité est évidente. Supposons A inversible, nous savons qu’il existe un couple (D, P ) formé d’une matrice diagonale D et d’une matrice inversible P tel que A = tP P, B = tP DP , les éléments diagonaux de D étant positifs puisque B est positive. On peut écrire : (A + B) = A(I + A−1 B) = AP −1 (I + D)P et det(A + B) = det(A) det(I + D), det(B) = det(A) det(D). Pour démontrer l’inégalité demandée, il suffit donc de vérifier que : 1 1 1 + (det D) n 6 det(I + D) n . Si D = Diag(λ1 , . . . , λn ), cette inégalité s’écrit : 1+ n Y i=1 λi n1 6 n n1 Y 1 + λi . i=1 Elle a été prouvée ci-dessus. I.4.22 La matrice A est antisymétrique et son polynôme caractéristique est :λ(λ2 + 9). La recherche des vecteurs propres de A conduit au résultat suivant : 2 2 4+3i 4−3i 1 −2 √ √ 0 −2 −1 0 0 0 3 3 3 3 3 10 3 10 5 4+3i 2−6i 2−6i 2+6i 2 √ √ 0 3i 0 2 = 13 0 3√10 3√10 3√10 . 3 10 3 10 4−3i 2+6i −2 √ √ √5 √5 √5 1 −2 0 0 0 −3i 3 3 10 3 10 3 10 3 10 3 10 I.4.23 a) Si ϕ existe, les identités de polarisation montrent qu’elle est égale à l’application : (x, y) ∈ E × E 7→ 1 (kx + yk2 − kx − yk2 ). 4 Soit f l’application : (x, y) ∈ E × E 7→ kx + yk2 − kx − yk2 . On vérifie : (i) Pour tous x, y dans E , f (x, 2y) = 2f (x, y). En effet : kx + 2yk2 = kx + y + yk2 = 2kx + yk2 + 2kyk2 − kxk2 kx − 2yk2 = kx − y − yk2 = 2kx − yk2 + 2kyk2 − kxk2 . Ainsi f (x, 2y) = kx + 2yk2 − kx − 2yk2 = 2(kx + yk2 − kx − yk2 ) = 2f (x, y). c Dunod 2014 I.4 : Espaces préhilbertiens 73 (ii) Montrons maintenant, pour tous x1 , x2 , y dans E , la relation : f (x1 + x2 , y) = f (x1 , y) + f (x2 , y). On a : f (x1 , y) + f (x2 , y) = kx1 + yk2 − kx1 − yk2 + kx2 + yk2 − kx2 − yk2 = kx1 + yk2 + kx2 + yk2 − kx1 − yk2 + kx2 − yk2 . Soit : 1 kx1 + x2 + 2yk2 − kx1 + x2 − 2yk2 2 1 = f (x1 + x2 , 2y) = f (x1 + x2 , y). 2 f (x1 , y) + f (x2 , y) = b) On vérifie aisément, par récurrence sur n ∈ N, que : ∀n ∈ N , f (n + 1)x, y = (n + 1)f (x, y). On note que f (x, y) = −f (−x, y), donc ∀n ∈ Z, f (n + 1)x, y = (n + 1)f (x, y). Enfin, pour tous p, q dans Z avec q 6= 0 , on peut écrire : p pf (x, y) = f (px, y) = qf ( x, y), q p p soit f ( x, y) = f (x, y), q q c’est à dire f (rx, y) = rf (x, y) pour tout r ∈ Q . L’application : α ∈ R 7→ f (αx, y) est continue et Q est dense dans R, donc f (αx, y) = αf (x, y) pour tout (α, x, y) ∈ R × E × E . On peut affirmer que f , donc ϕ est une forme bilinéaire sur E , de plus ϕ(x, x) = kxk2 , la norme considérée est donc euclidienne. c) Considérons, comme ci-dessus, l’application f et définissons l’application g telle que pour tous x, y dans E , 4g(x, y) = f (x, y) − if (x, iy). On vérifie que pour tous x, y dans E , on a les égalités suivantes : (i) g(x, x) = kxk2 (ii) g(x, y) = g(y, x) (iii) g(ix, y) = −ig(x, y). En utilisant les résultats de a) on obtient aussi que pour tous x1 , x2 , y dans E , g(x1 + x2 , y) = g(x1 , y) + g(x2 , y) et pour tous α, (x, y) dans R et E × E , g(αx, y) = αg(x, y). Soient maintenant λ ∈ C et (x, y) dans E × E , on a λ = α + iβ , (α, β) ∈ R × R, et g(λx, y) = αg(x, y) + βg(ix, y) = (α − iβ)g(x, y), l’application g est donc une forme sesquilinéaire hermitienne, et la norme proposée est une norme hermitienne. I.4.24 a) Soient k ∈ [[1, n]] et Ek := Vect(εk , . . . , εn ), pour tout V ∈ Vk : dim(V ∩ Ek ) + dim(V + Ek ) = dim V + dim Ek = n + 1, on a donc dim(V ∩ Ek ) 6= 0 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 74 Soit y ∈ V ∩ Ek , y 6= 0 , Y ∗ AY > λk Y ∗ Y , donc sup X∈V X6=0 si V := Vect(ε1 . . . , εk ), on a sup X∈V X6=0 X ∗ AX > λk . De plus, X ∗X X ∗ AX = λk , on peut donc affirmer que : X ∗X inf V ∈Vk sup X∈V X6=0 X ∗ AX X ∗X = λk . b) Soient p ∈ [[1, n]] et Ep′ := Vect(ε1 , . . . , εp ), on sait que : dim(F ∩ Ep′ ) + dim(F + Ep′ ) = dim F + dim Ep′ > n + 1, on a donc dim(F ∩ Ep′ ) 6= 0 . Soit y ′ ∈ F ∩ Ep′ , y ′ 6= 0 , Y ′∗ AY ′ 6 λp Y ′∗ Y ′ , donc inf X∈F X6=0 si F := Ep′ , on a inf X∈F X6=0 X ∗ AX 6 λp . De plus, X ∗X X ∗ AX > λp , on peut donc affirmer que : X ∗X sup F ∈Fp X ∗ AX inf X∈F X ∗ X X6=0 = λp . c) Tout sous espace vectoriel V ′ de G de dimension p est un sous espace vectoriel de E de dimension p ; en utilisant le résultat vu en a), on sait que λp est inférieur ou égal à µp . Soit F ′ un sous espace de G de codimension strictement inférieure à p, on a : dim F ′ > n − (p + r), F ′ est donc un sous espace de E de codimension strictement inférieure à p + r , d’après b) on a λp+r > µp . Soient q ∈ [[1, n]] et G := Eq′ , pour tout k ∈ [[1, q]], λk 6 µk , donc λ1 + · · · + λq 6 µ1 + · · · + µq = a11 + · · · + aqq . I.4.25 a) Les valeurs propres de A étant imaginaires, la matrice A + I est inversible, donc B = 2(I + A)−1 − I , on peut écrire : I = (I + A)−1 (I + A), on en déduit B = (I + A)−1 (I − A), et tBB = (I + A)(I − A)−1 (I + A)−1 (I − A) = I , car toutes les matrices écrites dans ce produit commutent. De plus I + B est inversible, −1 n’est donc pas valeur propre de B . b) Nécessairement : A = (I + B)−1 (I − B), t A = (I − B −1 )(I + B −1 )−1 = (I − B −1 )BB −1 (I + B −1 )−1 . −1 On a donc tA = (B − I) (I + B −1 )B = (B − I)(I + B)−1 = −A. et I.4.26 a) Les valeurs propres de la matrice hermitienne A sont réelles, pour tout λ ∈ C \ R, la matrice A − λ I est donc inversible. De plus il existe un couple (D, U ) ∈ Dn (R) × Un (C) tel que A = U DU −1 , ainsi B(λ) = U (D + λ I)(D − λ I)−1 U −1 , et B(λ) est unitaire si, et seulement si, (D + λ I)(D − λ I)−1 l’est. c Dunod 2014 I.4 : Espaces préhilbertiens 75 dn +λ Si D = Diag(d1 , . . . , dh , . . . , dn ), (D + λ I)(D − λ I)−1 = Diag( dd11 +λ −λ , . . . , dn −λ ). +λ | = 1 si, et seulement si, αdh = 0 ; A n’étant pas Supposons λ = α+iβ avec α, β ∈ R, | ddhh −λ nulle, il existe h ∈ [[1, n]] tel que dh 6= 0 . Donc B(λ) est unitaire si, et seulement si, α = 0 , c’est à dire λ ∈ Ri . +λ Pour tout h ∈ [[1, n]], ddhh −λ 6= 1 car λ 6= 0 . b) La matrice B étant unitaire, il existe un couple (D′ , U ′ ) ∈ Dn (C) × Un (C) tel que B = U ′ D′ U ′−1 , avec D′ = Diag(eiθ1 , . . . , eiθh , . . . , eiθn ), (θ1 , . . . , θh , . . . , θn ) ∈ Rn \{0} . Si A existe, nécessairement (A − λI)B = A + λI , soit : A = λ(I + B)(B − I)−1 = λU ′ (D′ + I)(D′ − I)−1 U ′−1 . On a (D′ + I)(D′ − I)−1 = −i Diag(cot θ21 , . . . , cot θ2h , . . . , cot θ2n ), et λ = iα avec α ∈ R \ 0 , on a donc A = αU ′ Diag(cot θ21 , . . . , cot θ2h , . . . , cot θ2n )U ′−1 , ce qui montre que A est hermitienne. I.4.27 Supposons qu’il existe P ∈ C[X] tel que u∗ = P (u), on a bien uP (u) = P (u)u , donc u est normal. Réciproquement, si u est normal, il est diagonalisable, de valeurs k P propres λ1 , . . . , λk . On peut alors écrire la décomposition spectrale de u : u = λh ph , h=1 M ph désignant le projecteur sur Eλh (u) parallèlement à Eλi (u) ; on sait de plus que 16 i6k i6=h pour tout h ∈ [[1, k]], ph est un polynôme en u , d’où le résultat. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 76 Module I.5 : Réduction des matrices I.5.1 Remarquons que AB ∈ Mp (K), alors que BA ∈ Mq (K). En notant systématiquement Mi,j les coefficients d’une matrice M , la définition de la trace donne : p p q p q X X X X X Tr(AB) = (AB)i,i = Ai,j Bj,i = Bj,i Ai,j i=1 = q X j=1 i=1 p X i=1 Bj,i Ai,j ! j=1 = q X i=1 j=1 (BA)j,j = Tr(BA). j=1 I.5.2 1. Montrons par récurrence sur n que toute matrice carrée d’ordre n à coefficients dans K et de trace nulle est semblable à une matrice à diagonale nulle. Le cas n = 1 est évident : seule la matrice nulle est de trace nulle. Considérons un entier n > 2 tel que la propriété soit vraie au rang n − 1 . Soit M ∈ Mn (K) une matrice de trace nulle. Notons u l’endomorphisme de K n canoniquement associé à M : M est la matrice de u dans la base canonique B de K n . Si M est une matrice scalaire, i.e. si M := λIn pour un certain λ ∈ K , on a 0 = Tr(λIn ) = λ Tr(In ) = nλ. Comme le corps K est de caractéristique 0 , λ = 0 , donc M = 0 , et la conclusion est claire. Supposons que M ne soit pas une matrice scalaire. Autrement dit, u n’est pas une homothétie. Rappelons une caractérisation classique des homothéties (vectorielles) : un endomorphisme d’un espace vectoriel est une homothétie si, et seulement si, l’image d’un vecteur quelconque est colinéaire à ce vceteur (cf. le module II.3 de [L1]). Puisque u n’est pas une homothétie, il existe un vecteur x ∈ K n tel que la famille x, u(x) soit libre. D’après le théorème de la base incomplète, il existe une base C := (e1 , . . . , en ) de K n telle que e1 = x et e2 = f (x). Soit M ′ la matrice de u relativement à C . On sait que M ′ est semblable à M , en particulier Tr(M ′ ) = 0 . En outre, la première colonne de M ′ est, par construction, le vecteur colonne t (0, 1, 0, . . . , 0). On peut donc écrire M ′ par 0 tV blocs : M ′ = , où V, W ∈ K n−1 sont des vecteurs colonnes et N ∈ Mn−1 (K). W N Il est clair que Tr(N ) = Tr(M ′ ) = 0 . D’après l’hypothèse de récurrence, il existe donc une matrice Q ∈ GLn−1 (K) telle que la diagonale de QN Q−1 soit nulle. La matrice par 1 0 1 0 blocs P := ∈ Mn (K) est inversible, son inverse étant . La multi0 Q 0 Q−1 plication des matrices par blocs donne alors : 1 0 0 tV 1 0 ′ −1 PM P = 0 Q W N 0 Q−1 t t 0 V 1 0 0 V Q−1 = = . QW QN 0 Q−1 QW QN Q−1 La matrice M est semblable à M ′ , donc à P M ′ P −1 . De plus, la diagonale de P M ′ P −1 est nulle, puisque la diagonale de QN Q−1 l’est. Notre assertion est donc vraie au rang n. 2. Notons L l’endomorphisme A 7→ DA − AD de Mn (K). Le noyau de L contient le sous-espace ∆ formé des matrices diagonales, car deux matrices diagonales quelconques commutent. Il est clair que dim ∆ = n : (t1 , . . . , tn ) 7→ Diag(t1 , . . . , tn ) est un isomorphisme de K n sur ∆. c Dunod 2014 I.5 : Réduction des matrices 77 Montrons que Ker L = ∆. Soit A := (ai,j ) ∈ Ker L , de sorte que DA = AD . La ma- trice DA se déduit de A en multipliant la i ème ligne de A par i , ceci pour tout i (revoir à ce sujet les opérations élémentaires sur les matrices, dans le module II.4 de [L1]). De même, la matrice AD se déduit de A en multipliant la j ème colonne de A par j , ceci pour tout j . Pour tous indices i, j ∈ [[1, n]], on a donc iai,j = jai,j . On en déduit que ai,j = 0 dès que i 6= j , ce qui montre que A est diagonale. Soit S le sous-espace vectoriel de Mn (K) formé des matrices dont la diagonale est nulle. C’est le noyau de l’application linéaire (ai,j ) 7→ (a1,1 , . . . , an,n ) de Mn (K) dans K n . Cette application est évidemment surjective, donc dim S = n2 − n, en vertu du théorème du rang. Soit A := (ai,j ) ∈ Mn (K). Comme nous l’avons vu précédemment, le terme général de la matrice L(A) = DA − AD est (i − j)ai,j . La diagonale de L(A) est donc nulle, ce qui prouve l’inclusion Im L ⊂ S . En fait, il y a égalité, pour une raison de dimensions. En effet, le théorème du rang donne : dim(Im L) = dim Mn (K) − dim Ker L = dim Mn (K) − dim ∆ = n2 − n = dim S. Conclusion : Ker L = ∆ et Im L = S . 3. Soit M ∈ Mn (K) une matrice de trace nulle. D’après la question 1, M est semblable à une matrice M ′ ∈ S . Il existe une matrice P ∈ GLn (K) telle que M = P M ′ P −1 . Par ailleurs, puisque S est l’image de L , il existe une matrice C ∈ Mn (K) telle que M ′ = L(C), soit M ′ = DC − CD . Rappelons que l’application N 7→ P N P −1 est un automorphisme de la K -algèbre Mn (K), en particulier elle respecte la multiplication, l’addition et la soustraction. Alors : M = P M ′ P −1 = P (DC − CD)P −1 = P (DC)P −1 − P (CD)P −1 = AB − BA, en posant A := P DP −1 et B := P CP −1 . D’où la conclusion. I.5.3 Le programme ci-dessous se déduit immédiatement de la proposition 33 de la page 241. Pour simplifier, il fait appel à deux procédures. La procédure identité(n) rend la matrice In , et la procédure trace(A) rend la trace d’une matrice carrée A. Faddeev(M) n := taille(M); (* nombre de lignes et de colonnes de M *) I := identité(n); A:=M; t := trace(M); P := X^n-t*X^(n-1); pour k de 2 à n faire A := A*M-t*M; t := trace(A)/k; P := P-t*X^(n-k); rendre(P) Ce programme nécessite n − 1 multiplications de matrices de taille n, plus des opérations de moindre coût. I.5.4 Observons d’abord que le cas p = q = 1 est évident. De quoi s’agit-il alors ? Étant donnée a b une matrice M := ∈ M2 (K) telle que a 6= 0 , on veut montrer que M est de c d rang 1 si, et seulement si, d = ca−1 b , ce qui équivaut ( K est commutatif !) à ad − bc = 0 , c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 78 c’est-à-dire à det M = 0 . Cela résulte des propriétés élémentaires du rang d’une matrice (revoir à ce sujet le module II.7 de [L1]). Notons ai,j , 1 6 i, j 6 p, les coefficients de A et de même pour les matrices B, C, D . La matrice A est une matrice carrée inversible extraite de M . On sait alors que M est de rang p si, et seulement si, A ne possède aucune matrice bordante inversible (cf. le module II.7 de [L1]). Il y a q 2 matrices bordantes de A, obtenues comme suit. On choisit arbitrairement deux indices j, k ∈ [[1, q]], la matrice bordante correspondante étant : a1,1 . . . a1,p b1,k .. .. .. . . Wj,k := . . ap,1 . . . ap,p bp,k cj,1 . . . cj,p dj,k Les colonnes de A étant linéairement indépendantes, les p premières colonnes de Wj,k sont linéairement indépendantes. Ainsi Wj,k est non inversible si, et seulement s’il existe (t1 , . . . , tp ) ∈ K p tel que les égalités suivantes soient vérifiées : a1,1 x1 + a1,2 x2 + · · · + a1,p xp = b1,k a2,1 x1 + a2,2 x2 + · · · + a2,p xp = b2,k ................................... a p,1 x1 + ap,2 x2 + · · · + ap,p xp = bp,k c x + c x + · · · + c x = d . j,1 1 j,2 2 j,p p j,k En notant X le vecteur colonne t (x1 , . . . , xp ) et Bk la k ème colonne de B , les p premières égalités ci-dessus signifient que AX = Bk , soit X = A−1 Bk . En notant Cj la j ème ligne de C , la dernière égalité ci-dessus signifie que dj,k = Cj X , soit dj,k = Cj A−1 Bk . Par définition de la multiplication matricielle (ligne par colonne), A−1 Bk est la k ème colonne de A−1 B et donc Cj (A−1 Bk ) est le coefficient d’indices (j, k) de la matrice CA−1 B . 2 Conclusion : M est de rang p si, et seulement si, pour tout couple (j, k) ∈ [[1, q]] , les matrices D et CA−1 B ont le même coefficient d’indices (j, k), ce qui équivaut évidemment à l’égalité matricielle D = CA−1 B . I.5.5 Notons P (resp. Q ) le polynôme minimal de la matrice A considérée comme élément de Mn (K) resp. de Mn (L) . Puisque P appartient a fortiori à L[X] et annule A, c’est un multiple de Q , par définition du polynôme minimal Q de A (sur L ). En particulier, deg P > deg Q . Puisque P et Q sont unitaires, il suffit, pour établir l’égalité P = Q , de prouver l’inégalité deg P 6 deg Q . Notons d le degré de Q , et écrivons Q := X d + td−1 X d−1 + · · · + t1 X + t0 , les tj étant des éléments de L (c’est important pour la suite). Puisque Q est le polynôme minimal de A (sur L ), on a : Ad + td−1 Ad−1 + · · · + t1 A + t0 In = Q(A) = 0. Pour tout entier k ∈ N, notons ai,j;k les coefficients de la matrice Ak , 1 6 i, j 6 n. L’égalité matricielle ci-dessus est équivalente aux n2 égalités suivantes : td−1 ai,j;d−1 + · · · + t1 ai,j;1 + t0 ai,j;0 = −ai,j;d (i, = 1, . . . , n ; j = 1, . . . , n). c Dunod 2014 (∗) I.5 : Réduction des matrices 79 On peut considérer ces égalités comme un système linéaire (S) de n2 équations à d inconnues. Ce qui est essentiel, c’est que les coefficients de ce système appartiennent à K (parce que la matrice A est à coefficients dans K et ses puissances aussi), et de même le second membre est à coefficients dans K . Les égalités (∗) signifient que le système (S) possède une solution sur L , à savoir (td−1 , . . . , t0 ). D’après l’exercice évoqué dans l’énoncé, le système (S) possède alors au moins une solution (ud−1 , . . . , u0 ) ∈ K d . Considérons le polynôme R := X d + ud−1 X d−1 + · · · + u1 X + u0 ∈ K[X]. Le fait que (ud−1 , . . . , u0 ) soit solution du système (S) signifie que R(A) = 0 (se rappeler d’où vient ce système). Par définition de P comme polynôme minimal de A sur K , R est donc un multiple de P , et par suite deg P 6 deg R = d = deg Q , comme désiré. I.5.6 Nous allons montrer que A est diagonalisable. À partir de là, les idées seront exactement les mêmes que dans l’exercice 8 de la page 236. En fait, A est une matrice réelle symétrique, elle est donc déjà diagonalisable sur R (cf. la section 1.7 du module I.4). On peut encore remarquer que les deux dernières colonnes de A sont opposées, donc 0 est valeur propre de A. Plus précisément, en notant B := (e1 , e2 , e3 ) la base canonique de C3 et u l’endomorphisme de C3 canoniquement associé à A, ε1 := e2 + e3 est un vecteur propre de f associé à la valeur propre 0 . Le calcul donne : χA = X 3 − 17X 2 + 16X = X(X − 1)(X − 16). Ainsi A a trois valeurs propres, à savoir 0, 1 et 16 . Puisque A possède trois valeurs propres distinctes, nous retrouvons le fait qu’elle soit diagonalisable, déjà sur Q car ses valeurs propres sont rationnelles. On vérifie que ε2 := e1 + e2 − e3 et ε3 := 2e1 − e2 + e3 sont des vecteurs propres de f , associés aux valeurs propres 1 et 16 respectivement. Soit C := (ε1 , ε2 , ε3 ). C’est une base de C3 (on vérifie en fait que c’est une base orthogonale de l’espace euclidien R3 usuel, comme il se doit). 0 1 2 1 −1 . Nous savons Soit P la matrice de passage de B à C , c’est-à-dire P := 1 1 −1 1 −1 déjà que P AP = D , où D := Diag(0, 1, 16). L’équation N 2 = D a exactement quatre solutions dans M3 (C), à savoir ± Diag(0, 1, 4) et ± Diag(0, 1, −4). Pour le voir, on peut raisonner comme dans l’exercice 8 de la page 236. On peut aussi dire que, si N est l’une des solutions de cette équation, alors N commute avec D , donc N est diagonale parce que les termes diagonaux de D sont distincts (cf. les calculs de l’exercice I.5.2 de la page 256). Comme dans l’exercice 8 de la page 236, N 7→ P N P −1 est une bijection de l’ensemble des solutions N de l’équation N 2 = D sur l’ensemble des solutions M de l’équation M 2 = A. On calcule alors P −1 (par exemple en exprimant les ej en fonction des εi : 0 3 3 1 2 −2 . P −1 = 2 6 2 −1 1 On en déduit que l’équation M 2 = A possède exactement quatre solutions, à savoir : 3 −1 1 1 −1 et ±P Diag(0, 1, 4)P −1 = ± −1 1 −1 1 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 80 ±P Diag(0, 1, −4)P −1 −7 1 = ± 5 3 −5 5 −5 −1 1 . 1 −1 Parmi ces solutions, une seule est une matrice symétrique réelle positive (c’est la « racine car 3 −1 1 rée » de A, cf. la section 1.7 du module I.4), à savoir −1 1 −1 . 1 −1 1 I.5.7 Si λ ∈ sp u et si Vλ est un sous-espace vectoriel quelconque de Eλ (u), Vλ est stable par u , car la restriction de u à Eλ (u) est l’homothétie vectorielle de rapport λ. Comme toute somme P de sous-espaces stables par u est stable par u , on en déduit que toute somme Vλ où, λ∈sp(u) pour tout λ ∈ sp(u), Vλ est un sous-espace vectoriel arbitraire de Eλ (u), est un sous-espace vectoriel de E stable par u . La réciproque est plus subtile. Soit donc V un sous-espace vectoriel de E stable par u . Pour toute valeur propre λ de u , posons Vλ := V ∩ Eλ (u). La somme des Vλ est directe parce P que la somme des Eλ (u) l’est . Par ailleurs, le sous-espace V ′ := Vλ est évidemment λ∈sp(u) inclus dans V . Il s’agit d’établir que V ′ = V . Voici un moyen d’y parvenir. Soit v := uV l’endomorphisme de V induit par u . Considérons d’autre part le polyQ (X − λ). En fait, P est le polynôme minimal de u (en vertu, par nôme P := λ∈sp(u) exemple, de la proposition 18 de la page 227). En particulier, P annule u , donc P annule aussi v , par restriction. D’après le lemme des noyaux, V = Ker P (v) est la somme directe, lorsque λ décrit sp u , des sous-espaces Ker(v − λ IdV ). La conclusion est alors claire : pour toute λ ∈ sp u , Ker(v − λ IdV ) est l’intersection de V avec Ker(u − λ IdE ) = Eλ (u), P c’est-à-dire Ker(v − λ IdV ) = Vλ . D’où V = Vλ = V ′ . λ∈sp(u) I.5.8 Pour tout polynôme P ∈ K[X], nous savons que P (A) = Diag P (A1 ), . . . , P (Am ) . En particulier, P annule A si, et seulement s’il annule chacune des matrices Ai . Notons Q le polynôme minimal de A et Qi le polynôme minimal de Ai . L’argument ci-dessus montre que Q est le ppcm des Qi (cf. la proposition 19 de la page 227). Si A est diagonalisable, Q est scindé à racines simples. Pour tout i , Qi a la même propriété puisqu’il divise Q , et il en résulte que Ai est diagonalisable (corollaire 27 de la page 235). Supposons inversement que chaque Ai soit diagonalisable. Pour tout i , Qi est donc scindé à racines simples. C’est alors un exercice simple d’arithmétique des polynômes de montrer que le ppcm d’une famille finie de polynômes scindés à racines simples est un polynôme scindé à racines simples : il suffit de se rappeler comment l’on calcule ce ppcm à partir des facteurs irréductibles des polynômes considérés. En conclusion, Q est donc scindé à racines simples, et par suite A est diagonalisable, toujours d’après le corollaire 27 de la page 235. Autre solution, plus directe, pour le dernier point. Supposons que, pour tout i , Ti soit une matrice inversible (de même taille que Ai ) telle que Di := Ti Ai Ti−1 soit diagonale. La matrice par blocs T := Diag(T1 , . . . , Tm ) est alors inversible, et T AT −1 = Diag(D1 , . . . , Dm ) est diagonale. c Dunod 2014 I.5 : Réduction des matrices 81 I.5.9 La multiplication Mn (K) × Mn (K) → Mn (K) est une application K -bilinéaire donc, la matrice A étant fixée, l’application M 7→ AM de Mn (K) dans Mn (K) est linéaire, autrement dit u est un endomorphisme de l’espace vectoriel Mn (K). L’idée essentielle est la suivante : soit P := am X m +· · ·+a1 X +a0 un polynôme à coefficients dans K . Alors, pour toute matrice M ∈ Mn (K), on a : P (u)(M ) = P (A)M. (∗) Dans le premier membre, on applique à M ∈ Mn (K) l’endomorphisme P (u) de Mn (K) alors que, dans le second membre, on multiplie simplement les matrices P (A) et M . Pour démontrer l’égalité (∗), les deux membres dépendant linéairement de P , il suffit d’examiner le cas où P := X k , k ∈ N (ces monômes forment une base de K[X] sur K ). Dans ce cas, on raisonne par récurrence sur k . La conclusion est évidente si k := 0 ou k := 1 . Si la conclusion est vraie pour un certain k , on a, pour toute matrice M ∈ Mn (K) : uk+1 (M ) = (uk ◦ u)(M ) = uk u(M ) = uk (AM ) = Ak (AM ) = Ak+1 M, d’où la conclusion au rang k + 1 . L’égalité (∗) est donc vraie pour tout polynôme P . On en déduit d’abord qu’un polynôme P annule u si, et seulement s’il annule A. La suffisance est évidente : si P (A) = 0 , l’égalité (∗) montre que P (u)(M ) = 0 pour toute matrice M , donc P (u) = 0 . Supposons inversement que P (u) = 0 . Alors, en particulier, 0 = P (u)(In ) = P (A)In = P (A), donc P (A) = 0 . Il en résulte que le polynôme minimal µu de u est égal au polynôme minimal µA de A. Ensuite, A est nilpotente si, et seulement s’il existe un entier k > 0 tel que X k annule A, i.e. tel que X k annule u . Il en résulte que A est nilpotente si, et seulement si, u est nilpotent. D’après le théorème 25 de la page 235, u est diagonalisable si, et seulement si, µu est scindé et à racines simples, i.e. si, et seulement si, µA est scindé et à racines simples. En vertu du corollaire 27 de la page 235, cela revient à dire que A est diagonalisable. I.5.10 Supposons que u soit diagonalisable, et soit V un sous-espace vectoriel de E stable par u . P D’après l’exercice I.5.7 de la page 257, V s’écrit V = Vλ où, pour tout λ ∈ sp(u), Vλ λ∈sp(u) est un sous-espace vectoriel de Eλ (u). Choisissons pour chaque λ ∈ sp u un supplémentaire P quelconque Wλ de Vλ dans Eλ (u), puis posons W := Wλ . Il est clair que W est un λ∈sp(u) supplémentaire de V dans E ( E = V ⊕ W ), et l’exercice cité montre que W est stable par u . La réciproque est moins triviale. Supposons donc que chaque sous-espace vectoriel de E stable par u possède un supplémentaire (dans E ) lui aussi stable par u . Soit V la somme (nécessairement directe) des sous-espaces propres Eλ (u), λ décrivant sp u . Il s’agit de montrer que V = E (théorème 24 de la page 232). Raisonnons par l’absurde, en supposant V 6= E . Puisque V est stable par u (car chaque sous-espace propre l’est), il possède par hypothèse un supplémentaire W lui aussi stable par u , et W 6= {0} . Soit w = uW l’endomorphisme de W induit par u . Alors w est un endomorphisme de W , espace vectoriel de dimension finie au moins égale à 1 sur C. Puisque C est algébriquement clos, w possède au moins une valeur propre λ. Soit x ∈ W un vecteur propre de w associé à λ. On a u(x) = w(x) = λx, donc λ ∈ sp u et x ∈ Eλ (u). Mais Eλ (u) ⊂ V , donc x ∈ V ∩ W = {0} . Cela contredit le fait que x soit un vecteur propre de w (un vecteur propre est toujours non nul, par définition). En conclusion, V = E , donc u est diagonalisable. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 82 Dans R2 , soit r la rotation d’angle π/2 . Les seuls sous-espaces vectoriels de R2 stables par r sont R2 et {0} , car, si D est une droite vectorielle, D n’est pas propre pour u , i.e. n’est pas stable par u . Ainsi tout sous-espace vectoriel de R2 stable par r possède un supplémentaire stable par r . Cependant, r n’est pas diagonalisable : son polynôme caractéristique X 2 + 1 n’est pas scindé sur R. L’exercice devient donc faux si l’on remplace C par R. I.5.11 Posons S := sp(up ) et, pour tout λ ∈ S , Eλ := Eλ (up ). Puisque up est diagonalisable, E est somme directe des Eλ , λ décrivant S . Par ailleurs (c’est la première idée importante), u commute avec up , donc laisse stable chaque Eλ . Pour chaque λ ∈ S , notons uλ l’endomorphisme de Eλ induit par u . Puisque E est somme directe des Eλ , u est diagonalisable si, et seulement si, chaque uλ l’est : la suffisance est évidente, et la nécessité résulte du corollaire 26 de la page 235. Soit λ ∈ S , supposons d’abord λ 6= 0 . Puisque upλ est l’homothétie vectorielle de Eλ de rapport λ, uλ est annulé par le polynôme X p − λ ∈ C[X]. Ce polynôme est scindé (comme tout polynôme sur C) et à racines simples : ses racines sont les p racines p èmes de λ. Ainsi, dans ce cas, uλ est diagonalisable. Il en résulte déjà que u est diagonalisable si, et seulement si, ou bien 0 ∈ / S ou bien 0 ∈ S et u0 est diagonalisable. Notons que 0 appartient à S si, et seulement si, up n’est pas injectif, ce qui revient à dire que u n’est pas injectif. Si u est injectif, Ker u = Ker up = {0} , et nous avons vu que u est diagonalisable. Supposons désormais que 0 ∈ S . D’abord Ker up est l’espace propre de up relatif à la valeur propre 0 , i.e. Ker up = E0 . Ensuite, Ker u est évidemment inclus dans Ker up = E0 . De plus, Ker u = Ker up si, et seulement si, u0 = 0 . D’un autre côté, u0 est nilpotent, puisque up0 = 0 : la restriction de up à E0 = Ker up est nulle. Il en résulte que u0 est diagonalisable si, et seulement s’il est nul. Autrement dit, u est diagonalisable si, et seulement si, Ker u = Ker up . I.5.12 Identifions M avec l’endomorphisme de C2n qui lui est canoniquement associé, et de même pour A. Puisque M est donnée par blocs, il est logique de rechercher les vecteurs X propres Z de M sous la forme Z := , où X, Y ∈ Cn sont des vecteurs colonnes. Y 0 A X AY Si Z est de cette forme, M Z = = . D’où, pour tout λ ∈ C, In 0 Y X les équivalences : (M Z = λZ) ⇐⇒ (AY = λX) et (X = λY ) ⇐⇒ (AY = λ2 Y ) et (X = λY ) . Soit λ ∈ C. Les équivalences ci-dessus montrent que λ est valeur propre de M si, et seulement λY 2 si, λ est valeur propre de A. Si c’est le cas, on voit de plus que Y 7→ est un Y isomorphisme de Ker(A − λ2 In ) sur Ker(M − λI2n ), en particulier : dim Ker(M − λI2n ) = dim Ker(A − λ2 In ). (∗) Cette égalité est en fait vraie pour tout λ ∈ C. Par ailleurs, la somme des espaces propres de M étant directe, on a toujours : X α := dim Ker(M − λI2n ) 6 2n, λ ∈ sp M c Dunod 2014 I.5 : Réduction des matrices 83 avec égalité si, et seulement si, M est diagonalisable (en vertu du théorème 24 de la page 232). De même : X dim Ker(A − µIn ) 6 n, β := µ ∈ sp A avec égalité si, et seulement si, A est diagonalisable. Soient µ1 , . . . , µr les valeurs propres non nulles de A. Pour tout j , notons λj une racine carrée de µj et posons mj = dim Ker(A − µj In ). Les égalités (∗) montrent que les valeurs propres non nulles de M sont exactement les ±λj , j = 1, . . . , r . Les égalités (∗) impliquent aussi les suivantes : α = dim Ker(A) + 2 r X j=1 r X mj = 2 dim Ker(A) + mj − dim Ker(A), j=1 soit α = 2β − dim Ker(A). Si A est inversible et diagonalisable, β = n et dim Ker(A) = 0 , donc α = 2n, ce qui montre que M est diagonalisable. Supposons inversement que M soit diagonalisable, ce qui revient à dire que α = 2n, soit 2β − dim Ker(A) = 2n. Puisque β 6 n, l’égalité 2β − dim Ker(A) = 2n n’est possible que si β = n et dim Ker(A) = 0 , ce qui montre que A est inversible et diagonalisable. I.5.13 La suffisance étant triviale, supposons que M soit diagonalisable. Il s’agit de montrer que A est nulle. Il est possible de raisonner sur les vecteurs propres de M et de A, comme dans l’exercice précédent. Nous laissons le lecteur détailler une telle solution. Voici une méthode plus rapide, utilisant les polynômes. D’après le corollaire 27 de la page 235, il existe un polynôme non nul P ∈ C[X], scindé (c’est automatique), à racines simples, et annulant M . Calculons P (M ) en fonction de A. Commençons par les puissances de M : 2 A A A A A 2A2 2 M = = . 0 A 0 A 0 A2 k A kAk k Par récurrence sur k , on montre ensuite aisément que M = pour tout k ∈ N. 0 Ak Par linéarité par rapport à Q , on en déduit la formule suivante : Q(A) AQ′ (A) Q(M ) = pour tout Q ∈ C[X]. 0 Q(A) Puisque P (M ) = 0 , l’égalité précdente, appliquée à P , montre que P (A) = 0 = AP ′ (A). En d’autres termes, chacun des polynômes P et XP ′ annule A. Mais P est à racines simples, donc P ∧ P ′ = 1 . D’après le théorème de Bézout, il existe deux polynômes U, V ∈ C[X] tels que U P + V P ′ = 1 . Substituons A à X dans cette égalité. Nous obtenons l’égalité U (A)P (A) + V (A)P ′ (A) = In , soit V (A)P ′ (A) = In , car P (A) = 0 . Multiplions enfin par A : A = AIn = AV (A)P ′ (A) = V (A) AP ′ (A) = 0 . I.5.14 Notons aussi A ∗ B la matrice M , produit de Kronecker de A et B . Commençons par une remarque. Soient A′ := (a′i,j ) ∈ Mp (C), B ′ ∈ Mn (C) et M ′ := A′ ∗ B ′ le produit de Kronecker de A′ et B ′ . Notons ci,j le terme général de la matrice AA′ . La règle de multiplication c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 84 de deux matrices par blocs donne : a1,1 B a1,2 B . . . a2,1 B a2,2 B . . . MM′ = .. .. .. . . . ap,1 B ap,2 B ′ . . . c1,1 BB ′ c1,2 BB ′ c2,1 BB ′ c2,2 BB ′ = .. .. . . cp,1 BB ′ cp,2 BB ′ a1,p B a2,p B .. . ap,p B ... ... .. . a′1,1 B ′ a′2,1 B ′ .. . a′1,2 B ′ a′2,2 B ′ .. . ... ... .. . a′p,1 B ′ ′ a′p,2 B ′ . . . a′p,p B ′ c1,p BB c2,p BB ′ .. . . . . cp,p BB ′ a′1,p B ′ a′2,p B ′ .. . , autrement dit M M ′ est le produit de Kronecker de AA′ et BB ′ : (A ∗ B)(A′ ∗ B ′ ) = (AA′ ∗ BB ′ ). (∗) On en déduit que, si P ∈ GLp (C), la matrice P ∗ In ∈ Mpn (C) est inversible, son inverse étant P −1 ∗ In . Cela étant, puisque A est diagonalisable, il existe une matrice P ∈ GLp (C) telle que la matrice D := P −1 AP soit diagonale : D = Diag(λ1 , . . . , λp ). Comme nous l’avons dit, la matrice Q = P ∗ In ∈ Mpn (C) est inversible et son inverse est P −1 ∗ In . La règle de calcul (∗) donne alors : Q−1 M Q = (P −1 ∗ In )(A ∗ B)(P ∗ In ) = D ∗ B = Diag(λ1 B, . . . , λp B). Maintenant, la matrice B étant elle aussi diagonalisable, il existe R ∈ GLn (C) telle que la matrice ∆ := R−1 BR soit diagonale. Considérons la matrice diagonale par blocs (il y a p blocs, chacun de taille n) : S := Diag(R, R, . . . , R). Cette matrice est inversible, et son inverse est S −1 := Diag(R−1 , R−1 , . . . , R−1 ). Dans ces conditions, il vient : (QS)−1 M (QS) = S −1 Q−1 M Q)S = Diag(R−1 , . . . , R−1 ) Diag(λ1 B, . . . , λp B) Diag(R, . . . , R) = Diag(λ1 R−1 BR, . . . , λp R−1 BR) = Diag(λ1 ∆, . . . , λp ∆). Puisque la matrice ∆ est diagonale, la matrice Diag(λ1 ∆, . . . , λp ∆) l’est aussi. Cette matrice est semblable à M , puisqu’elle est égale à (QS)−1 M (QS). Il en résulte que M est diagonalisable. Terminons par deux remarques. Avec les notations précédentes, le polynôme caractéristique p Q de A est χA := (X − λi ). Par ailleurs, le polynôme caractéristique de ∆ est le même i=1 que celui de B . Factorisons-le : χB := n Q (X − µj ). Pour tout i , le polynôme caractéristique j=1 de λi ∆ est évidemment n Q j=1 ceci : (X − λi µj ). D’après la proposition 19 de la page 227, on en déduit χA∗B = p Y i=1 n Y (X − λi µj ) . j=1 Par ailleurs, lorsque A et B sont non nulles, on peut montrer que A ∗ B est diagonalisable si, et seulement si, chacune des matrices A et B est diagonalisable. Nous venons de prouver la suffisance de cette condition, mais la nécessité est un peu plus délicate. c Dunod 2014 I.5 : Réduction des matrices 85 I.5.15 Commençons par deux cas évidents. Si n := 1 , A est diagonale. Nous supposerons donc n > 2 . Si t := 1 , A est diagonalisable. En effet, une première raison est que A est alors symétrique réelle, elle est donc déjà diagonalisable sur R. Autre raison : puisque tous les termes de A valent 1 , on a A2 = nA. Ainsi A est annulée par le polynôme X 2 − nX = X(X − n). Ce polynôme est scindé et à racines simples, donc A est diagonalisable. Supposons donc désormais t 6= 1 . Notons B := (e1 , . . . , en ) la base canonique de Cn et u ∈ L(Cn ) l’endomorphisme canoniquement associé à A. Soit e la somme des ej . On a donc u(ej ) = e pour tout j ∈ [[1, n]] distinct de q , et u(eq ) = e + (t − 1)ep . Il en résulte, puisque t 6= 1 , que l’image de u est le plan P engendré par e et ep . En particulier, le rang de u est 2 . D’après le théorème du rang, dim Ker u = n − 2 . En fait, le noyau de u est visible. Soit x une combinaison linéaire des ej P P pour j 6= q : x := xj ej . Alors u(x) = xj e . Notons alors H le sous-espace vectoriel j6=q j6=q P P de Cn formé des combinaisons linéaires xj ej pour lesquelles xj = 0 . La dimension j6=q j6=q de H est évidemment n − 2 . Puisque H est inclus dans Ker u , on a Ker u = H , à cause des dimensions. Montrons que Cn est somme directe de H et de P . Puisque dim H = n − 2 et dim P = 2 , il suffit de vérifier que H ∩P = {0} . Soit x ∈ H ∩P . Il existe λ, µ ∈ C tels que x := λe + µep . Puisque x ∈ H , la q ème coordonnée de x doit être nulle. Si p 6= q , cette coordonnée est λ, d’où λ = 0 , puis µ = 0 et donc x = 0 . Si p = q , ladite coordonnée est λ + µ, donc µ = −λ P et par suite x = λ ej . La somme des coordonnées de x vaut alors (n − 1)λ, d’où là j6=q encore λ = 0 (parce que x appartient à H ) et donc x = 0 . En conclusion, Cn = H ⊕ P . Puisque H et P sont respectivement le noyau et l’image de u , chacun d’eux est stable par u . Il en résulte que A est diagonalisable, autrement dit u est diagonalisable, si, et seulement si, l’endomorphisme induit par u sur chacun de ces deux sous-espaces est diagonalisable. Pour H , c’est vrai, car la restriction de u à H est nulle. Pour P , soit M la matrice de uP dans la base (e, ep ). Alors A est diagonalisable si, et seulement si, M l’est : nous nous sommes ramenés à une matrice 2 × 2 ! Il reste à calculer M . Notons d’abord que u(e) = (n − 1)e + u(eq ) = ne + (t − 1)ep . Pour u(ep ), on doit distinguer deux cas. n 1 Supposons d’abord p distinct de q . Dans ce cas, u(ep ) = e , donc M = . Le t−1 0 polynôme caractéristique de M est χM = X 2 −nX+(t−1), son discriminant est n2 −4(t−1). Si donc t 6= 1 − n2 /4 , la matrice M a deux valeurs propres distinctes et par conséquent elle est diagonalisable. Si t := 1 − n2 /4 , χM a une racine double, à savoir n/2 , et M ne peut être diagonalisable que si son polynôme minimal est X − n/2 , ou encore si, et seulement si, M est une matrice scalaire. Ce n’est pas le cas (regarder les termes diagonaux de M ). Supposons que p = q . Dans ce cas, u(ep ) = u(eq ) = e + (t − 1)eq , et par n 1 suite M = . Ici, χM = X 2 −(n+t−1)X +(t−1)(n−1), son discriminant t−1 t−1 est ∆ := (n + t − 1)2 − 4(t − 1)(n − 1) = t2 − 2(n − 1)t + (n2 + 2n − 3). Pour les mêmes raisons que ci-dessus, M est diagonalisable si, et seulement si, ∆ 6= 0 . Résumons : Cas p 6= q : A est diagonalisable si, et seulement si, t 6= 1 − n2 /4 . Cas p = q : A est diagonalisable si, et seulement si, t2 − 2(n − 1)t + (n2 + 2n − 3) 6= 0 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 86 Ces conclusions restent valables lorsque t := 1 et n > 2 . I.5.16 Le calcul donne : χA = X 3 + 6X 2 + 12X + 8 = (X + 2)3 . Ainsi A a une valeur propre triple, à savoir −2 . On peut déjà conclure que A n’est pas diagonalisable. Si elle l’était, son polynôme minimal serait nécessairement X + 2 , et l’on aurait A = −2I3 , ce qui est faux. Notons B := (e1 , e2 , e3 ) la base canonique de C3 et u l’endomorphisme de C3 canoniquement associé à A. On vérifie que l’espace propre de u associé à −2 est la droite Cε1 , où ε1 := e1 − e2 − e3 . On remarque ensuite que u(e3 ) = −2e3 + 2ε1 . En posant ε2 := e3 , on a donc u(ε2 ) = 2ε1 − 2ε2 . Posons enfin, par exemple, ε3 := e2 , d’où u(ε3 ) = −3ε1 + ε2 − 2ε3 . Alors C := (ε1 , ε2 , ε3 ) est une base de C3 , et la matrice −2 2 −3 1 . La matrice de passage de B à C de u dans cette base est : A′ := 0 −2 0 0 −2 1 0 0 1 0 0 est P := −1 0 1 , et P −1 = 1 0 1 . −1 1 0 1 1 0 A. On peut d’abord calculer les puissances de A′ puis 2 −3 0 1 . Alors A′ = −2I3 + N ′ , et N ′ est nilpo0 0 0 0 2 tente, plus précisément N ′ 3 = 0 . De plus, N ′ 2 = 0 0 0 . Il suffit alors d’appliquer 0 0 0 la formule du binôme. Pour tout entier k > 0 , on a : Venons-en au calcul des puissances de 0 conjuguer par P . Posons N ′ := 0 0 A′ k = (−2I3 + N ′ )k = (−2)k I3 + (−2)k−1 kN ′ − (−2)k−3 k(k − 1)N ′ 2 1 0 0 0 2 −3 0 1 + k(k − 1) 0 = (−2)k−2 4 0 1 0 − 2k 0 0 0 0 1 0 0 0 0 2 4 −4k k + 5k 4 −2k . = (−2)k−2 0 0 0 4 0 1 0 0 0 0 Conjuguons par P . En partant de A = P A′ P −1 , on obtient, pour tout k ∈ N, Ak = P A′ k P −1 , soit après calculs : 2 k +k+4 k 2 + 5k −4k 4k . Ak = (−2)k−2 −(k 2 + k) −(k 2 + 5k − 4) −(k 2 + 3k) −(k 2 + 7k) 4k + 4 À dire vrai, trigonaliser A pour calculer ses puissances n’est pas ici la méthode la plus simple. La raison est que, A ayant une seule valeur propre (triple), sa décomposition de Dunford (cf. la section 3.3 de la page 249) s’obtient immédiatement. Plus précisément, la matrice N := A+2I3 est nilpotente, en fait N 3 = 0 (Cayley-Hamilton). On peut alors appliquer directement la formule du binôme, en partant de l’égalité A = −2I3 + N . Les seules puissances utiles de N −1 −3 2 2 2 0 3 −2 et N 2 . On trouve N 2 = −2 −2 0 . Pour tout ensont N = 1 2 4 −2 −2 −2 0 c Dunod 2014 I.5 : Réduction des matrices 87 tier k > 0 , il vient alors : Ak = (−2I3 + N )k = (−2)k I3 + (−2)k−1 kN − (−2)k−3 k(k − 1)N 2 1 0 0 −1 −3 2 1 1 3 −2 + k(k − 1) −1 −1 (−2)k−2 4 0 1 0 − 2k 1 0 0 1 2 4 −2 −1 −1 2 2 k +k+4 k + 5k −4k 4k . = (−2)k−2 −(k 2 + k) −(k 2 + 5k − 4) −(k 2 + 3k) −(k 2 + 7k) 4k + 4 0 0 0 Nous avons retrouvé (plus rapidement) le résultat précédent. I.5.17 Le calcul de χA est immédiat : X −1 0 0 X −1 = (X−1)(X 2 −1) = (X−1)2 (X+1). χA = −1 X −1 = (X−1) −1 X 0 −1 X Il y a deux valeurs propres : 1 , qui est double, et −1 , qui est simple. La matrice A n’est pas diagonalisable : si elle l’était, son polynôme minimal serait X 2 − 1 (il divise χA , a les mêmes racines que lui, et il est à racines simples), ce qui impliquerait A2 = I3 . Ce n’est pas le 1 0 0 cas : A2 = 1 1 0 . 1 0 1 Pour calculer les puissances de A, le plus rapide est sans doute d’observer que le calcul des puissances de A2 est immédiat. En notant (Ei,j ) la base canonique de M3 (Q), on a en effet A2 = I2 + E2,1 + E3,1 , autrement dit la multiplication à gauche par A2 : M 7→ A2 M consiste à ajouter la première ligne de M à chacune des deux autres. Avec cette interprétation en termes d’opérations sur les matrices, il est clair que, pour tout k ∈ N, la multiplication à gauche par A2k : M 7→ A2k M consiste à ajouter k fois la première ligne de M à chacune des 1 0 0 deux autres. D’où (sans calcul) A2k = k 1 0 . On en déduit, en prenant k := 894 : k 0 1 1 0 0 1 0 0 1 0 0 A1789 = A(A2 )894 = 1 0 1 894 1 0 = 895 0 1 . 0 1 0 894 0 1 894 1 0 Une deuxième méthode, plus agréable pour un ordinateur que pour un humain, consiste à écrire 1789 en base 2 : 1789 = 110111111012 , ce qui traduit les égalités : 1789 = 1024 + 512 + 128 + 64 + 32 + 16 + 8 + 4 + 1 = 210 + 29 + 27 + 26 + 25 + 24 + 23 + 22 + 20 . j Il faut dix multiplications (élévations au carré) pour calculer les A2 , j = 1, . . . , 10 , puis huit autres pour les multiplier entre elles. Au total, dix-huit multiplications suffisent pour calculer A1789 . Nous ne détaillerons pas cette solution ! Indiquons une autre méthode, plus générale que la première, pour calculer les puissances de A. Cette méthode est basée sur les suites définies par une relation de récurrence linéaire. Le polynôme minimal de A est égal à P := χA = (X − 1)2 (X + 1) = X 3 − X 2 − X + 1 , car c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 88 sinon il serait égal à X 2 − 1 , ce que nous avons écarté. On en déduit que (I3 , A, A2 ) est une base de C[A]. En effet, le morphisme d’algèbres Q 7→ Q(A) de C[X] dans M3 (C) a pour image C[A] et pour noyau l’idéal (P ). L’espace C2 [X] des polynômes de degré au plus égal à 2 est un supplémentaire de (P ) dans C[X] (division euclidienne). L’image par ce morphisme de la base (1, X, X 2 ) de C2 [X] est (I3 , A, A2 ), d’où notre assertion. Pour tout k ∈ N, Ak appartient à C[X], donc il existe un unique triplet (ak , bk , ck ) ∈ C3 tel que Ak = ak A2 + bk A + ck I3 . Multiplions l’égalité A3 = A2 + A − I3 (Cayley-Hamilton) par Ak : Ak+3 = Ak+2 +Ak+1 −Ak . Par identification des coordonnées sur la base (I3 , A, A2 ) de C[A], on en déduit que chacune des suites (ak ), (bk ), (ck ) vérifie la relation de récurrence linéaire suivante : uk+3 = uk+2 + uk+1 − uk pour tout k ∈ N. (∗) La forme générale des suites satisfaisant cette relation de récurrence est connue (cf. la section 3.1 de la page 242. Le polynôme P ayant comme racines 1 , qui est double, et −1 , qui est simple, cette forme générale est : uk := (λk + µ) · 1k + ν(−1)k , où λ, µ, ν sont des constantes arbitraires. Les conditions initiales (a0 , a1 , a2 ) = (0, 0, 1) permettent de déterminer la suite (ak ) par résolution d’un système linéaire. On trouve : ak = 2k − 1 + (−1)k /4 pour tout k . On obtient de même : bk = 1 − (−1)k 2 et ck = −2k + 3 + (−1)k 4 pour tout k ∈ N. En reportant ces valeurs dans l’égalité Ak = ak A2 + bk A + ck I3 , il vient pour tout k : 4 0 0 1 Ak = 2k + 1 − (−1)k 2 + 2(−1)k 2 − 2(−1)k . 4 2k − 1 + (−1)k 2 − 2(−1)k 2 + 2(−1)k En prenant k = 1789 , on retrouve la valeur calculée précédemment. I.5.18 C’est une simple application de la trigonalisation. Donnons-nous un polynôme P ∈ C[X]. La matrice A est trigonalisable : il existe M ∈ GLn (C) telle que la matrice T := M −1 AM soit triangulaire supérieure. L’application B 7→ M −1 BM étant un automorphisme de l’algèbre B , on a M −1 P (A)M = P (T ), donc P (A) est semblable à P (T ). Ainsi A, T ont même polynôme caractéristique, et les matrices P (A), P (T ) également. Quitte à remplacer A par T , nous pouvons désormais supposer que A est triangulaire supérieure. n Q Écrivons A = (ai,j) . Puisque A est triangulaire, χA = (X − ai,i ). À l’ordre près, on i=1 peut donc supposer que λi := ai,i pour tout i . L’idée est alors simple. Nous savons que, pour tout k ∈ N, Ak est triangulaire avec pour termes diagonaux les λki (les autres termes ne se calculent pas simplement, en général). Pour tout polynôme Q , on en déduit, par linéarité en Q , que Q(A) est triangulaire, avec pour termes diagonaux les Q(λi ). Le polynôme caractéristique n Q de Q(A) est donc X − Q(λi ) . C’est vrai, en particulier, pour le polynôme P . i=1 I.5.19 Écrivons P := X n + an−1 X n−1 + · · · + a1 X + a0 . Soit π : K[X] → A la projection canonique, associant à tout polynôme Q sa classe modulo P . Cette projection c Dunod 2014 I.5 : Réduction des matrices 89 est un morphisme d’algèbres surjectif, de noyau (P ). Le sous-espace Kn−1 [X] de K[X] formé des polynômes de degré au plus n − 1 est un supplémentaire de (P ) (division euclidienne par P ). Puisque (1, X, . . . , X n−1 ) est une base de Kn−1 [X], son image par π est une base de A. Mais π est un morphisme d’algèbres, et π(X) = x par définition, donc π(Q) = Q(x) pour tout polynôme Q . En particulier, π(X k ) = xk pour tout k . Tout cela montre que B := (1, x, . . . , xn−1 ) est une base de A. Déterminons la matrice M = (ti,j ) de u dans la base B . Soit k ∈ [[1, n − 1]]. Les coeffi- cients de la k ème colonne sont les coordonnées (dans la base B ) de l’image par u du k ème vecteur de B , à savoir xk−1 . Cette image est bien sûr xk . Comme k + 1 6 n, xk est le (k + 1) ème vecteur de B . Tous les coefficients ti,k sont donc nuls, sauf tk+1,k , qui vaut 1 . Prenons maintenant k := n. Le n ème vecteur de B est xn−1 , son image par u est toujours xn , qui n’est plus un vecteur de B . Calculons donc les coordonnées de xn . Par définition de π , π(P ) = 0 , c’est-à-dire P (x) = 0 , soit xn + an−1 xn−1 + · · · + a1 x + a0 = 0 . Ainsi xn = −(a0 + a1 x + · · · + an−1 xn−1 ). On a donc ti,n = −ai−1 pour i = 1, . . . , n. D’où la matrice M : 0 0 ... 0 −a0 1 0 ... 0 −a1 .. . . 0 1 0 −a M = 2 .. .. . . . . . . . . . . . 0 0 . . . 1 −an−1 Cette matrice est bien la matrice compagnon CP du polynôme P , définie par la formule (10) de la page 228. Puisque CP est la matrice de u dans la base B , son polynôme minimal est égal à celui de u . Montrons que ce polynôme est P . Rappelons d’abord que u est la multiplication par x : y 7→ xy dans A. Pour tout k ∈ N, on en déduit que uk est la multiplication par xk : y 7→ xk y (récurrence immédiate sur k ). Ensuite, pour tout polynôme Q , on voit (par linéarité en Q ) que Q(u) est la multiplication par Q(x) : y 7→ Q(x)y . Soit Q ∈ K[X]. Supposons que Q annule u . Alors Q(u)(y) = Q(x)y = 0 pour tout y ∈ A. En prenant y := 1 , on obtient Q(x) = 0 , autrement dit π(Q) = 0 . D’où Q ∈ Ker π = (P ) : Q est un multiple de P . Inversement, il est clair que P annule u . En effet, P (x) = π(P ) = 0 , donc P (u)(y) = P (x)y = 0 pour tout y ∈ A. En conclusion, les polynômes annulant u sont exactement les multiples de P . Puisque P est unitaire, cette propriété caractérise le polynôme minimal µu de u . D’où µu = P . Conclusion : le polynôme minimal de la matrice compagnon CP de P est P lui-même. Nous avons ainsi obtenu une autre preuve de ce résultat (cf. la proposition 21 de la page 228). I.5.20 Rappelons d’abord qu’un endomorphisme ou une matrice carrée est trigonalisable si, et seulement si, son polynôme caractéristique est scindé (sur le corps de base K ), cf. le théorème 29 de la page 238. Si l’on considère les matrices des ui dans une même base (arbitraire) de E , on obtient l’énoncé matriciel suivant, équivalent à ce que nous voulons démontrer. Soient n ∈ N∗ et (Ai )i∈I une famille de matrices, appartenant à Mn (K) et commutant deux à deux. On suppose que chaque Ai est trigonalisable. Alors les Ai sont simultanément trigonalisables, i.e. il existe c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 90 une matrice P ∈ GLn (K) telle que, pour tout i ∈ I , la matrice P −1 Ai P soit triangulaire supérieure. Dans la suite, nous omettrons l’adjectif « supérieure », il sera sous-entendu. Commençons par nous ramener au cas où l’ensemble I est fini. Soit W le sous-espace vectoriel de L(E) engendré par les ui . Puisque E est de dimension finie, L(E) et W sont de dimension finie. Il existe donc une partie finie J de I telle que la famille (ui )i∈J soit une base de W . Supposons donc qu’il existe une base B de E telle que, pour tout j ∈ J , la matrice MatB (uj ) soit triangulaire. Pour tout i ∈ I , ui est une combinaison linéaire des uj , j ∈ J , donc MatB (ui ) est une combinaison linéaire des MatB (uj ), j ∈ J . Il en résulte que MatB (ui ) est triangulaire, car les matrices triangulaires forment un sous-espace vectoriel (et même une sousalgèbre) de Mn (K). Nous pouvons donc désormais supposer que l’ensemble I est fini, et même que I := [[1, p]], où p ∈ N. Raisonnons maintenant par récurrence sur l’entier n + p. Le cas où n + p := 2 est évident. En fait, la conclusion est évidente lorsque p := 1 . Supposons donc n + p > 2 et p > 2 , l’assertion à établir (sous forme « géométrique » ou matricielle) étant vraie à l’ordre k pour tout k ∈ [[2, n + p − 1]]. Il s’agit donc d’une récurrence forte. Soient alors u1 , . . . , up comme dans l’énoncé. Si up est une homothétie, la conclusion est claire. En effet, d’après l’hypothèse de récurrence, il existe une base de E dans laquelle les matrices de u1 , . . . , up−1 sont triangulaires. La matrice de up dans cette base est elle aussi triangulaire, et même mieux : elle est diagonale. Nous supposons désormais que up n’est pas une homothétie. Soit V un sous-espace propre de up . Un tel sous-espace existe, puisque le polynôme caractéristique de up est scindé. Puisque up n’est pas une homothétie, V 6= E , donc n′ := dim V ∈ [[1, n − 1]] . Pour tout j ∈ [[1, p]], uj commute avec up , par hypothèse, donc uj laisse V stable (proposition 11 de la page 224). Notons alors vj ∈ L(V ) l’endomorphisme de V induit par uj . Les endomorphismes v1 , . . . , vp de V commutent deux à deux. De plus, chaque vj est trigonalisable, car son polynôme caractéristique divise celui de uj (proposition 16 de la page 226), donc est scindé. Vu l’hypothèse de récurrence, n + p étant remplacé par n′ + p, il existe une base de V dans laquelle la matrice de chaque vj soit triangulaire. Complétons cette base en une base B := (e1 , . . . , en ) de E . Le point important est le suivant. Pour tout j , la matrice de vj dans la base (e1 , . . . , en′ ) de V est triangulaire, en particulier, e1 est un vecteur propre de vj , c’est-à-dire de uj . λj Wj La matrice Aj de uj dans la base B s’écrit donc par blocs : Aj := , 0 Mj avec λj ∈ K , Mj ∈ Mn−1 (K) et Wj ∈ K n−1 (c’est un vecteur ligne). Le calcul matriciel par blocs montre que les Mj commutent deux à deux, car c’est le cas pour les Aj . Chaque Mj est trigonalisable. En effet, le théorème 5 de la page 219 montre que χMj divise χAj = χuj , et ce dernier polynôme est scindé par hypothèse. Nous pouvons ainsi appliquer l’hypothèse de récurrence (sous forme matricielle) aux matrices M1 , . . . , Mp . Ici, n + p est remplacé par n − 1 + p. Il existe donc une matrice Q ∈ GLn−1 (K) telle que, pour j = 1, . . . , p, la matrice Tj := Q−1 Mj Q soit trian 1 0 gulaire. Posons alors P := ∈ Mn (K). Cette matrice est inversible, son inverse 0 Q c Dunod 2014 I.5 : Réduction des matrices est 1 0 0 Q−1 91 . Soit enfin j ∈ [[1, p]]. La règle de multiplicationpar blocs donne : P −1 Aj P = = = 1 0 0 Q−1 1 0 0 Q−1 λj 0 λj 0 Wj Mj 1 0 0 Q λj Wj Q 0 Mj Q Wj Q λj Wj Q = . Q−1 Mj Q 0 Tj Puisque la matrice Tj est triangulaire,la matrice P −1 Aj P l’est aussi. Ainsi, les matrices A1 , . . . , Ap sont simultanément trigonalisables, i.e. les endomorphismes u1 , . . . , up sont simultanément trigonalisables. Nous avons donc établi notre assertion à l’ordre n + p. I.5.21 Voici une solution rapide, utilisant l’exercice précédent. Puisque le corps de base est C, u et v sont trigonalisables. Comme ils commutent, ils sont simultanément trigonalisables. Soit B une base de E telle que A := MatB (u) et B := MatB (v) soient triangulaires supérieures. Notons λ1 , . . . , λn les termes diagonaux de A et µ1 , . . . , µn ceux de B . Puisque B est nilpotente, les µi sont tous nuls car, pour tout k ∈ N, B k est triangulaire avec comme termes diagonaux les µki . La matrice A + B est donc triangulaire, avec comme termes diagonaux les λi . D’où : Y det(u + v) = det(A + B) = λi = det(A) = det(u). i Indiquons une autre solution, le corps C étant remplacé par un corps de base K quelconque. Distinguons deux cas, suivant que u soit injectif ou non. Supposons d’abord que u ne soit pas injectif, de sorte que det u = 0 . Alors Ker u est un sous-espace vectoriel non nul de E , il est stable par v puisque u et v commutent (proposition 11 de la page 224). L’endomorphisme v ′ de Ker u induit par v est nilpotent puisque v l’est, en particulier v ′ n’est pas injectif. Soit donc x ∈ Ker u un vecteur non nul tel que v ′ (x) = 0 , c’est-à-dire v(x) = 0 . Alors (u+v)(x) = 0 , ce qui montre que u+v n’est pas injectif. D’où det(u+v) = 0 = det u . Supposons maintenant que u soit injectif, donc bijectif. Posons w := u−1 ◦ v . Les endomorphismes u−1 et v commutent, et v est nilpotent, donc w est nilpotent. Par ailleurs, on a det(u + v) = det u ◦ (IdE +w) = det(u) det(IdE +w). Il suffit donc de montrer que det(IdE +w) = 1 , ceci dès que w est nilpotent. L’idée est maintenant d’observer que w est de toutes façons trigonalisable, parce que son polynôme caractéristique est X n (cf. la proposition 38 de la page 247). Dans une base de E convenable, la matrice de w est triangulaire, et ses termes diagonaux sont nuls (comme ci-dessus). La matrice de IdE +w dans ladite base est alors triangulaire, et ses termes diagonaux valent tous 1 , donc det(IdE +w) = 1 . I.5.22 Supposons que AB − BA = In . En prenant les traces, on en déduit, à cause de la linéarité de la trace et de la propriété Tr(AB) = Tr(BA), que Tr(In ) = 0 , soit n = 0 , ce qui est absurde. Supposons désormais que AB − BA = B . Alors B 2 = B(AB − BA) = BAB − B 2 A, et aussi B 2 = (AB − BA)B = AB 2 − BAB d’où, en additionnant, AB 2 − B 2 A = 2B 2 . Plus généralement, montrons que AB k − B k A = kB k pour tout k ∈ N. C’est vrai c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 92 pour k = 0, 1, 2 . Supposons cette formule vraie pour un certain k . Comme ci-dessus, on en déduit kB k+1 = B(AB k −B k A) = BAB k −B k+1 A. D’un autre côté, l’égalité AB −BA = B implique B k+1 = BB k = (AB − BA)B k = AB k+1 − BAB k . En additionnant, on obtient (k + 1)B k+1 = AB k+1 − B k+1 A, d’où la formule au rang k + 1 . On a donc bien : AB k − B k A = kB k pour tout k ∈ N. (∗) ∗ Dans ces égalités, prenons les traces des deux membres. Pour tout k ∈ N , nous savons que Tr(AB k ) = Tr(B k A), donc Tr(kB k ) = k Tr(B k ) = 0 , d’où Tr(B k ) = 0 . L’exercice 11 de la page 247 montre alors que B est nilpotente. Si l’on ne veut pas utiliser cet exercice, on peut raisonner comme suit. Soient λ1 , . . . , λr les valeurs propres non nulles (deux à deux distinctes) de B , et notons mi la multiplicité de chaque λi . Pour tout k ∈ N∗ , la trace de B k r r P P vaut mi λki . Supposons alors r > 1 . Les égalités mi λki = 0 , pour k = 1, . . . , r , constii=1 i=1 tuent un système linéaire homogène de ce système est : λ1 λ2 . . . 2 λ1 λ22 . . . .. .. . . λr λr . . . 1 2 r équations à r inconnues (les mi ). Le déterminant de λ1 λ2 · · · λr V (λ1 , . . . , λr ), r λr λr λ2r .. . où V (λ1 , . . . , λr ) est le déterminant de Vandermonde de λ1 , . . . , λr . Ce déterminant Q vaut (λj − λi ), cf. [L1], module II.7, il n’est donc pas nul puisque les λi sont dis16i<j6n tincts. Comme les λi sont non nuls, le système ci-dessus ne possède que la solution triviale. Ainsi, tous les mi sont nuls, ce qui est absurde. La contradiction à laquelle nous arrivons montre que l’hypothèse r > 1 est absurde. Cela signifie que la seule valeur propre de B est 0 . Dans ces conditions, χB = X n , d’où B n = 0 en vertu du théorème de Cayley-Hamilton. I.5.23 Posons d’abord E := Cn . Le fait que B soit la base canonique de Cn ne jouera pas de rôle particulier. Ce qui suit est encore vrai pour une base B de E , quelconque mais fixée, ce qui permet de définir les us comme dans l’énoncé. 1. Montrons que s 7→ us est un morphisme de groupes de Sn dans GL(E). Soient s, t ∈ Sn . Pour tout j ∈ [[1, n]], on a : = us (et(j) ) = us ut (ej ) = (us ◦ ut )(ej ). us ◦ t (ej ) = e(s◦t)(j) = e s t(j) Puisque c’est vrai pour tout j , us ◦ t = us ◦ut . Par ailleurs, il est clair que us est l’identité de E lorsque s est la permutation identité. On en déduit que us ◦ us−1 = Id pour toute permutation s. Tout cela montre d’abord que us ∈ GL(E) pour toute permutation s, et ensuite que s 7→ us est un morphisme de groupes de Sn dans GL(E). Au niveau matriciel, il en résulte que s 7→ Ps est un morphisme de groupes de Sn dans GLn (C). Cela étant, soit s ∈ Sn . D’après le théorème de Lagrange (cf. le module II.2 de [L1]), l’ordre de s divise l’ordre (ou cardinal) du groupe Sn , c’est-à-dire n!. D’où sn! = Id, et par conséquent Psn! = In , d’après l’alinéa précédent. La matrice Ps est donc annulée par le polynôme X n! − 1 . Ce polynôme est (scindé et) à racines simples, ses racines étant les n! racines n! èmes de l’unité. La matrice Ps est donc diagonalisable (corollaire 27 de la page 235). c Dunod 2014 I.5 : Réduction des matrices 93 2. Notons d’abord que us (ej ) = ej+1 pour tout j ∈ [[1, n − 1]] et us (en ) = e1 . Posons ensuite z := exp(2iπ/n). C’est une racine n ème primitive de l’unité. Pour tout j ∈ [[1, n]], considérons le vecteur suivant : n X εj := e1 + z −j e2 + · · · + z −(n−1)j en = z −(h−1)j eh . (∗) h=1 Alors εj est un vecteur propre de us associé à la valeur propre z j . En effet : us (εj ) = n X z −(h−1)j u(eh ) = h=1 = z j "n−1 X n−1 X h=1 z −hj eh+1 + z h=1 −n e1 z −(h−1)j eh+1 + z −(n−1)j e1 # = z j n X z −(k−1)j ek = z j εj . k=1 Ce calcul montre que us a n valeurs propres distinctes, à savoir les n racines n èmes de l’unité z j ( j = 1, . . . , n) et que, pour tout j , εj est vecteur propre de us associé à la valeur propre z j . Il en résulte que C := (ε1 , . . . , εn ) est une base de E formée de vecteurs propres de us . Plus précisément, MatC (us ) = Diag(z, z 2 , . . . , z n ). Bien entendu, si Q est la matrice de passage de B à C , on a Q−1 Ps Q = Diag(z, z 2 , . . . , z n ). Nous avons ainsi diagonalisé Ps , dans ce cas particulier. Noter que le polynôme minimal et le polynôme caractéristique de us sont tous les deux égaux à X n − 1 . 3. Soit (I1 , . . . , Ir ) la partition de [[1, n]] formée des orbites sous l’action du sousgroupe hsi de Sn engendré par s. Si h ∈ [[1, r]], choisissons un indice ih ∈ Ih et posons dh := card Ih . Considérons le cycle ch (de longueur dh ) suivant : ch = ih s(ih ) · · · sdh −1 (ih ) ∈ Sn . Alors s = c1 ◦ c2 ◦ · · · ◦ cr est la décomposition (canonique) de s en produit de cycles à supports deux à deux disjoints (si besoin est, revoir à ce sujet le module II.2 de [L1]). Pour tout h, soit Eh le sous-espace vectoriel de E engendré par les vecteurs ei , i parcourant Ih . Puisque les Ih forment une partition de [[1, n]], E est somme directe des Eh , h = 1, . . . , r . Soit h ∈ [[1, r]] . Le sous-espace Eh est stable par us . En effet, si i ∈ Ih , s(i) ∈ Ih parce que Ih est stable par s (définition d’une orbite), donc us (ei ) = es(i) ∈ Eh . Notons alors vh l’endomorphisme de Eh induit par us . La question précédente montre que vh est diagonalisable et permet de le diagonaliser. Précisons ce point. Soit sh la permutation de Ih induite par s. En fait sh = ih s(ih ) · · · sdh −1 (ih ) est un cycle de longueur dh . À partir de sh ∈ S(Ih ) et de la base de Eh formée des ei pour i ∈ Ih , on peut définir l’endomorphisme ush de Eh comme dans l’énoncé, en remplaçant E par Eh . Il est alors clair que l’endomorphisme vh de Eh induit par us n’est autre que ush . Posons maintenant zh := exp(2iπ/dh ). D’après la question précédente, vh a dh valeurs propres distinctes : zh , zh2 , . . . , zhdh . De plus nous disposons d’une base Ch de Eh , à savoir Ch := εh,1 , . . . , εh,dh , avec : εh,j = dh X k=1 −(k−1)j zh esk−1 (ih ) pour tout j ∈ [[1, dh ]]. Chaque εh,j est vecteur propre de vh , donc de us , associé à la valeur propre zh . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 94 Il ne reste plus qu’à considérer la base C de E obtenue par juxtaposition des bases C1 , . . . , Cr . Cette base de E est formée de vecteurs propres de us , et nous avons donc ainsi diagonalisé us . Remarquons que la proposition 18 de la page 227 nous permet également de déterminer le polynôme minimal et le polynôme caractéristique de us , en fonction des cardinaux dh des orbites de [[1, n]] sous hsi, i.e. des longueurs des cycles ch constituant s : r Y χus = (X dh − 1) et µus = ppcm X d1 − 1, . . . , X dr − 1 . h=1 I.5.24 L’idée essentielle est que xq = x pour tout x ∈ K . Rappelons pourquoi. C’est clair si x = 0 . Sinon, x est un élément du groupe multiplicatif K ∗ , dont l’ordre est (fini et) égal à q − 1 . D’après le théorème de Lagrange, xq−1 = 1 , d’où xq = x, en multipliant par x. Supposons que u soit diagonalisable. Son polynôme minimal µu est alors scindé et à racines r Q simples, il s’écrit donc µu := (X − λi ), où les λi sont des éléments de K deux à deux i=1 distincts. Pour tout i , λqi = λi , donc X−λi divise X q −X dans K[X]. Le ppcm de ces X−λi étant µu , il divise X q − X , ce qui équivaut à dire que uq = u . Supposons inversement que uq = u . Le polynôme P := X q − X ∈ K[X] annule donc u . Pour montrer que u est diagonalisable, il suffit donc (théorème 25 de la page 235) de montrer que P est scindé et à racines simples. En fait, puisque xq = x pour tout x ∈ K , P est un Q multiple du polynôme (X − x). Ce polynôme est, comme P , unitaire et de degré q . On x∈K en déduit que ces deux polynômes sont égaux : P := X q − X = Y x∈K (X − x). Le polynôme figurant dans le membre de droite étant scindé et à racines simples, P a la même propriété, donc u est diagonalisable. I.5.25 Observons que, pour tout r ∈ Z, z r = 1 si, et seulement si, r est multiple de n. Nous utiliserons constamment cette observation. Considérons par exemple la somme définissant G(n). 2 L’application f : k 7→ e2iπk /n de Z dans C est n-périodique. Pour toute application de ce type et tout a ∈ Z, la somme des f (k) de k := a à k := a + n − 1 , ne dépend pas du choix P de a, on notera cette somme f (k). Justifions ensuite l’égalité G(n) = Tr(A). La trace k mod n 2 de la matrice A est la somme des termes diagonaux de A, c’est donc la somme des z (j−1) pour j = 1, . . . , n. Le changement d’indice j := k + 1 montre que Tr(A) est la somme 2 des z k pour k = 0, . . . , n − 1 , d’où Tr(A) = G(n). Remarquons enfin que la matrice A est symétrique. 1. La somme à calculer est la somme des termes de la progression géométrique à n termes, de raison z r et de premier terme z r . Si z r = 1 , i.e. si r est multiple de n, cette somme vaut évidemment n. Dans le cas contraire, elle vaut z r (z rn − 1)/(z r − 1), c’est-à-dire 0 puisque z n = 1 . Conclusion : pour tout entier r ∈ Z, on a : ( n X X n si r est multiple de n z kr = z kr = 0 si r n’est pas multiple de n. k=1 k mod n c Dunod 2014 I.5 : Réduction des matrices 95 2. Soient j, k ∈ [[1, n]]. Le coefficient d’indices (j, k) de la matrice A2 est : 2 (A )j,k = n X Aj,h Ah,k = h=1 n X z (j−1)(h−1) (h−1)(k−1) z h=1 = n X z (h−1)(j+k−2) h=1 D’après la question précédente, ce coefficient vaut n si j + k − 2 est multiple de n et 0 sinon. Puisque j et k appartiennent à [[1, n]], j + k − 2 n’est multiple de n que dans les cas suivants : j = k = 1 , ou bien j ∈ [[2, n]] et k = n+2−j . Dans ce dernier cas, noter que j 6= k , parce que n est impair. Ainsi le seul coefficient diagonal non nul de A2 est (A2 )1,1 = n : n 0 ... 0 0 0 0 ... 0 n . . . . ... A2 = .. .. . . 0 0 ... 0 0 0 n ... 0 0 On en déduit la trace de A2 : Tr(A2 ) = n. Passons à A4 . Soient j, k ∈ [[1, n]]. On a (A4 )j,k = (26) n P (A2 )j,h (A2 )h,k . pour tout h, le h=1 produit (A2 )j,h (A2 )h,k est non nul si, et seulement si, j + h − 2 et h + k − 2 sont tous deux multiples de n. Cela exige que j et k soient congrus modulo n, donc égaux, puisqu’ils appartiennent à [[1, n]]. Cela prouve déjà que A4 est diagonale. Pour tout j ∈ [[1, n]], nous n 2 P obtenons la formule (A4 )j,j = (A2 )j,h . Chaque ligne de A2 comporte un seul terme h=1 non nul, qui vaut n. On en déduit que (A4 )j,j = n2 pour tout j , d’où : A4 = n2 In . (27) 4 2 La matrice A est donc annulée par le polynôme X − n . Ce polynôme ayant quatre ra√ √ cines simples, à savoir ± n et ±i n, la matrice A4 est diagonalisable (corollaire 27 de la page 235). 3. C’est évident. Puisque X 4 − n2 annule A, il est multiple du polynôme minimal µA . On en √ √ √ √ déduit que sp A ⊂ n, − n, i n, −i n := S . Pour tout λ ∈ C, notons mλ l’exposant de X − λ dans χA , il est non nul si, et seulement si, λ est une valeur propre de A. On peut donc en tout cas écrire : Y Y χA = (X − λ)mλ = (X − λ)mλ . λ ∈ sp A λ∈S En posant a := m√n , b := m−√n , c := mi√n et d := m−i√n , on obtient l’égalité : √ √ √ √ χA = (X − n)a (X + n)b (X − i n)c (X + i n)d . (28) 4. Il faut remarquer que A est une matrice de Vandermonde. Pour tout j ∈ [[1, n]], la j ème ligne de A est en effet 1, z j−1 , z 2(j−1) , . . . , z (n−1)(j−1) , elle est donc formée des puissances successives de z j−1 . En d’autres termes, A est la matrice de Vandermonde des scalaires 1, z, z 2, . . . , z n−1 . Le déterminant de A est donné par la formule classique suivante c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 96 (cf. module II.7 de [L1]) : Y det A = V (1, z, . . . , z n−1 ) = (z k−1 − z j−1 ) = 16j <k6n Y = e 2kiπ/n 16j <k6n = Y 16j <k6n −e 2jiπ/n Y = e Y (z k − z j ) 0 6 j < k 6 n−1 (k+j)iπ/n 16j <k6n e(k−j)iπ/n − e−(k−j)iπ/n 2ie(k+j)iπ/n sin (k − j)π/n . Il y a n(n − 1)/2 couples d’entiers (j, k) tels que 1 6 j < k 6 n. Pour chacun d’eux, (k − j)π/n ∈ ]0, π[, donc tous les sinus intervenant ci-dessus sont strictement positifs. Par ailleurs, les termes e(k+j)iπ/n dans le dernier produit s’éliminent, plus exactement leur produit vaut 1 . En effet, un calcul immédiat (laissé au lecteur) montre que la somme P σ := (k + j) vaut n(n2 − 1)/2 . Puisque n est impair, cette somme est un entier 16j <k6n multiple de 4n (parce que n2 est congru à 1 modulo 8 ), donc eσiπ/n = 1 . On obtient une formule du type désiré : Y sin (k − j)π/n ∈ ]0, +∞[ . det A = in(n−1)/2 t, où t := 2n(n−1)/2 16j <k6n 5. Calculons donc le carré du module de G(n). D’abord, z = z −1 , d’où : ! ! ! X X X X 2 2 2 k −h k2 G(n)G(n) = z zh = z k mod n = n X h=1 = n−1 X j=0 h mod n h+n−1 X zk 2 −h2 k=h zj 2 n X z 2jh h=1 | {z } ! ! = n X h=1 h mod n n−1 X z (j+h) j=0 k mod n 2 −h2 = n X h=1 n−1 X j=0 zj 2 +2jh . = sj Lorsque j décrit [[0, n − 1]], la question 1 montre que la somme sj vaut n si 2j est multiple de n et 0 sinon. Puisque n est impair et 0 6 j 6 n − 1 , le premier cas se présente si, et 2 seulement si, j := 0 . Ainsi |G(n)| = z 0 s0 = n, ce qui donne la formule annoncée : 2 |G(n)| = n. (29) Déterminons alors (a, b, c, d). D’abord, la factorisation (28) donne, en considérant les degrés : a + b + c + d = n. (30) Ensuite, la trace de A étant la somme des racines du polynôme caractéristique, comptées avec leurs multiplicités, la factorisation (28) donne aussi : √ G(n) = Tr(A) = n (a − b) + i(c − d) , (31) ce qui explique l’intérêt du calcul de (a, b, c, d) ! Exploitons maintenant l’égalité (26). La matrice A est semblable à une matrice diagonale D . Parmi les coefficients diagonaux de D , a √ √ √ √ valent n, b valent − n, c valent i n et d valent −i n, à cause de l’égalité (28). c Dunod 2014 I.5 : Réduction des matrices 97 Puisque A2 est semblable à D2 , on en déduit le polynôme caractéristique de A2 : χA2 = (X − n)a (X − n)b (X + n)c (X + n)d = (X − n)a+b (X + n)c+d . On en déduit la trace de A2 . En comparant avec l’égalité (26), on obtient : (a + b) − (c + d) = 1. Compte tenu de l’égalité (29), il vient : n+1 n−1 et c + d = · (32) 2 2 Il nous faudrait encore deux relations entre a, b, c, d. L’une d’elles résulte immédiatement des égalités (31) et (29) : (a − b)2 + (c − d)2 = 1. (33) Cette égalité est très forte, car a, b, c, d sont des entiers. Ainsi, des deux entiers a − b et c − d, nécessairement l’un est nul et l’autre vaut ±1 . Bien entendu, une fois a − b et c − d connus, les égalités (32) donneront a, b, c, d, et par conséquent G(n). Si c = d, la deuxième égalité (32) donne n − 1 = 4c, donc n ≡ 1 mod 4 . Si a = b , la première égalité (32) donne n + 1 = 4a, donc n ≡ 3 mod 4 . Il reste un signe à déterminer. Pour cela, considérons det A. C’est le produit des racines du polynôme caractéristique, comptées avec leurs multiplicités. La factorisation (28) donne donc, compte tenu de l’égalité (30) : √ det A = ( n)a+b+c+d (−1)b+d i c+d = (−1)b+d nn/2 ic+d , a+b = et l’on en tire : det A = (−1)b+d i c+d . |det A| À la question 4, nous avons montré que det A = in(n−1)/2 t, où t est un nombre réel strictement positif. Vu l’égalité précédente, on en déduit que in(n−1)/2 = (−1)b+d i c+d , c’est-àdire in(n−1)/2 = i2b+c+3d . Comme i est une racine quatrième primitive de l’unité, l’égalité précédente équivaut à la congruence suivante : 2b + c + 3d ≡ n(n − 1)/2 mod 4, soit 2b + c − d ≡ n(n − 1)/2 mod 4. (34) C’est le renseignement précieux qui va nous permettre de terminer le calcul ! Distinguons deux cas, suivant le reste de la division de n par 4 . Supposons d’abord que n soit congru à 1 modulo 4 . Nous avons vu qu’alors nécessairement c = d et a − b = ε , avec ε = ±1 . Vu les égalités (32), on en tire : n + 1 + 2ε n + 1 − 2ε n−1 , b = et c = d = · 4 4 4 Maintenant, la congruence (34) s’écrit (n + 1 − 2ε)/2 ≡ n(n − 1)/2 mod 4 , ce qui équivaut à n+1−2ε ≡ n(n−1) mod 8 , ou encore à (n−1)2 ≡ 2(1−ε) mod 8 . Or n−1 est multiple de 4 , donc (n − 1)2 est multiple de 16 . D’où 2(1 − ε) ≡ 0 mod 8 , ce qui impose ε = 1 . √ √ √ L’égalité (31) s’écrit alors G(n) = n(a − b) = ε n, d’où G(n) = n. Supposons enfin que n soit congru à 3 modulo 4 . Nous avons vu qu’alors nécessairement a = b et c − d = ε , avec ε = ±1 . Vu les égalités (32), on en tire : a = n+1 n − 1 + 2ε n − 1 − 2ε , c = et d = · 4 4 4 Maintenant, la congruence (34) s’écrit (n + 1 + 2ε)/2 ≡ n(n − 1)/2 mod 4 , ce qui équivaut à n+1+2ε ≡ n(n−1) mod 8 , ou encore à (n−1)2 ≡ 2(1+ε) mod 8 . Cette fois, n−1 est a = b = c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 98 multiple de 2 mais pas de 4 , donc son carré est multiple de 4 mais pas de 8 . D’où 2(1+ε) 6≡ 0 √ √ mod 8 , ce qui impose encore ε = 1 . L’égalité (31) s’écrit alors G(n) = i n(c − d) = εi n, √ d’où G(n) = i n. Nous avons obtenu le résultat escompté. Si n est impair, on a : (√ n si n ≡ 1 mod 4 G(n) = √ i n si n ≡ 3 mod 4. Signalons que l’on peut aussi calculer la somme de Gauss G(n) lorsque n est pair, mais par √ d’autres méthodes. On trouve G(n) = n(1 + i) lorsque n ≡ 0 mod 4 et G(n) = 0 lorsque n ≡ 2 mod 4 . I.5.26 Le programme ci-après se déduit de la proposition 45 de la page 251 et de sa preuve. Il fait appel aux procédures auxiliaires suivantes : - dérive(P), qui rend la dérivée du polynôme P ; - subst(P,M), qui rend le résultat de la substitution de la matrice carrée M à X dans le polynôme P ; - pgcd(P,Q), qui rend le pgcd unitaire des deux polynômes non nuls P, Q ; - bézout(P,Q), qui rend le vecteur [U, V ], où U, V sont les polynômes vérifiant U P + V Q = pgcd(P, Q), deg U < deg Q et deg V < deg P , P et Q étant des polynômes non nuls ; - Faddeev(M), qui rend le polynôme caractéristique de la matrice carrée M (cf. l’exercice I.5.3 de la page 256) ; - ceil(x), qui rend le plus petit entier supérieur ou égal au nombre réel x. Dunford(M) n := taille(M); (*nombre de lignes et de colonnes de M*) m := ceil(ln(n)/ln(2));(*plus petit entier tel que 2^m >= n*) P := Faddeev(M); (*polynôme caractéristique de M*) T := P/pgcd(P,dérive(P)); T’ := dérive(T); b := bézout(T,T’); U := b[1]; V := b[2]; (*coefficients de Bézout de T et T’*) A := M; pour k de 1 à m A := A-subst(T,A)*inverse(subst(T’,A)); D:= A; N := M-D; rendre(D,N) I.5.27 Soit A := D + N la décomposition de Dunford de A. Montrons d’abord que D est inversible. C’est en fait une conséquence immédiate de l’exercice I.5.21 de la page 258, qui dit que det(D) = det(A). Raisonnons directement, en utilisant la partie facile de l’exercice en question. Identifions A à l’endomorphisme de K n qui lui est canoniquement associé, et de même pour D et N . Raisonnons par l’absurde, en supposant Ker D non nul. Puisque D et N commutent, N laisse stable Ker D . La restriction de N à Ker D est nilpotente, donc non injective. Le noyau de cette restriction n’est donc pas nul. C’est absurde, car ce noyau est inclus dans Ker A = {0} . Puisque D est inversible, A s’écrit A = D(In + D−1 N ). Posons N1 = D−1 N . C’est une matrice nilpotente, parce que N est nilpotente et commute avec D , donc aussi avec D−1 . Les c Dunod 2014 I.5 : Réduction des matrices 99 matrices D et N1 commutent, et A = D(In + N1 ). Le couple (D, In + N1 ) répond donc à la question. Pour l’unicité, soient D′ , N1′ deux matrices qui commutent, supposons que D′ soit diagonalisable, que N1′ soit nilpotente et que A = D′ (In + N1′ ). Puisque D′ et N1′ commutent, D′ N1′ est nilpotente et commute avec D′ . Ainsi les matrices D′ et D′ N1′ ont les propriétés suivantes : elles commutent, la première est diagonalisable, la deuxième est nilpotente, etleur somme est A. En vertu de l’unicité du couple (D, N ) (cf. le théorème 44 de la page 250), D′ = D et D′ N1′ = N = DN1 , d’où N1′ = N1 . I.5.28 Nous savons déjà que, si A et B sont semblables, elles ont même polynôme caractéristique et même polynôme minimal. Il s’agit d’établir la réciproque. Autrement dit, nous devons démontrer que la classe de similitude C de A est entièrement déterminée par χA et µA . Il faut remarquer que c’est vrai lorsque n 6 3 , mais faux dès que n > 4 , comme l’exemple de la page 249 le montre (si n > 5 , on « complète »avec des 0 ). D’après le théorème 47 de la page 254, nous pouvons supposer que A est un tableau diagonal de blocs de Jordan, comme dans le théorème : A := Diag Jr1 (λ1 ), . . . , Jrm (λm ) . (35) Rappelons que les ri sont des entiers strictement positifs, dont la somme doit être égale à n, et que les λi sont des éléments de K , non nécessairement distincts. L’idée est de calculer χA et µA à partir d’une telle écriture de A. Ce calcul est facile, à cause des deux points suivants. a) Le polynôme caractéristique et le polynôme minimal d’un bloc de Jordan Jr (λ) sont tous les deux égaux à (X − λ)r , comme nous l’avons démontré au début de la section 3.4 de la page 253. b) Compte tenu du point a), la proposition 19 de la page 227 donne ceci : b1) le polynôme caractéristique de A est le produit des (X − λi )ri ; b2) le polynôme minimal de A est le ppcm des (X − λi )ri . Voici ce que nous devons démontrer : si n vaut 1, 2 ou 3 , la suite (r1 , λ1 ), . . . , (rm , λm ) est entièrement déterminée, à l’ordre près, par les deux polynômes : χ := m Y i=1 (X − λi )ri et µ := ppcm (X − λ1 )r1 , . . . , (X − λm )rm . (36) Il suffit alors d’examiner les différents cas pour la suite ξ := (r1 , λ1 ), . . . , (rm , λm ) . Cas n = 1 . Il n’y a guère le choix : ξ := (1, λ1 ) , A := (λ1 ) et χA = µA = X − λ1 . La classe C est réduite à {A} , elle est caractérisée par λ1 . D’où la conclusion lorsque n := 1 . Cas n = 2 , ξ := (2, λ1 ) . Ici, χA = µA = (X − λ1 )2 . Cas n = 2 , ξ := (1, λ1 ), (1, λ1 ) . Alors A := λ1 I2 , χA = (X − λ1 )2 et µA = X − λ1 . Cas n = 2 , ξ := (1, λ1 ), (1, λ2 ) , avec λ1 6= λ2 . Ici, χA = µA = (X − λ1 )(X − λ2 ) a deux racines distinctes. Lorsque n = 2 , les trois cas obtenus montrent que le couple (χA , µA ) détermine la suite ξ . Cas n = 3 , ξ := (3, λ1 ) . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 100 Ici, χA = µA = (X − λ1 )3 . Cas n = 3 , ξ := (2, λ1 ), (1, λ1 ) . Alors χA = (X − λ1 )3 et µA = (X − λ1 )2 . Cas n = 3 , ξ := (1, λ1 ), (1, λ1 ), (1, λ1 ) . Alors A := λ1 I3 , χA = (X − λ1 )3 et µA = X − λ1 . Cas n = 3 , ξ := (1, λ1 ), (1, λ2 ), (1, λ3 ) , où λ1 , λ2 , λ3 sont distincts. Ici, χA = µA = (X − λ1 )(X − λ2 )(X − λ3 ) a trois racines distinctes. Cas n = 3 , ξ := (2, λ1 ), (1, λ2 ) , avec λ1 6= λ2 . Ici, χA = µA = (X − λ1 )2 (X − λ2 ) a une racine double et une racine simple. Cas n = 3 , ξ := (1, λ1 ), (1, λ1 ), (1, λ2 ) , avec λ1 6= λ2 . Alors χA = (X − λ1 )2 (X − λ2 ), mais µA = (X − λ1 )(X − λ2 ). Lorsque n = 3 , les six cas obtenus montrent encore que le couple (χA , µA ) détermine la suite ξ . I.5.29 Le calcul donne χA = X 4 − 2X 2 + 1 = (X 2 − 1)2 = (X − 1)2 (X + 1)2 . Pour le vérifier, soit on calcule effectivement un déterminant d’ordre 4 , soit on applique la méthode de Faddeev-Le Verrier (cf. la proposition 33 de la page 241). Il y a donc deux valeurs propres doubles : λ1 := 1 et λ2 := −1 . À ce stade, on ne sait pas si A est diagonalisable ou non. Notons B := (e1 , e2 , e3 , e4 ) la base canonique de E := C4 et u l’endomorphisme de C4 canoniquement associé à A. Déterminons les projecteurs spectraux π1 , π2 et les matrices spectrales Π1 , Π2 associées à λ1 , λ2 respectivement. Pour cela, appliquons la proposition 35 de la page 243 (comme dans l’exercice 10 de la page 244). On décompose χA en éléments simples. Le calcul donne : 1 1 1 1 1 1 = − + + (X − 1)2 (X + 1)2 4 (X − 1)2 X − 1 (X + 1)2 X +1 1 −X + 2 X +2 = + · 4 (X − 1)2 (X + 1)2 Avec les notations de la proposition citée, B1 := (−X + 2)/4 , T1 := (X + 1)2 , puis B2 := (X + 2)/4 , T2 := (X − 1)2 . D’où : 3 −2 2 −2 −2 1 5 −4 3 et Π1 = (A + I4 )2 (2I4 − A) = 1 3 −2 1 4 6 −4 4 −4 −2 2 −2 2 2 −4 1 4 −3 . Π2 = (A − I4 )2 (2I4 + A) = −1 −3 3 −1 4 −6 4 −4 5 Arrivés à ce point, la décomposition A = D + N de Dunford de A nous tend les bras. Compte tenu de la preuve du théorème 43 de la page 249, comme dans l’exercice 13 de la page 250, on c Dunod 2014 I.5 : Réduction des matrices a D = λ1 Π1 + λ2 Π2 = Π1 − Π2 = 2Π1 − I4 (car Π1 + Π2 = I4 ), soit : 3 −2 2 −2 5 −4 4 −4 −2 −4 5 −4 3 9 −8 6 − I4 = D = 2 1 2 3 −2 1 6 −5 2 6 −4 4 −4 12 −8 8 −9 −4 −1 0 1 8 2 0 −2 . N = A−D = 4 1 0 −1 −8 −2 0 2 101 , puis Puisque N 6= 0 , A n’est pas diagonalisable. Notons d et ν les endomorphismes de E canoniquement associés à D et N respectivement, de sorte que la décomposition de Dunford de u est donnée par u = d + ν . Il est visible sur la matrice N (dont les quatre colonnes sont proportionnelles) que l’image de ν est la droite Cε2 , où ε2 := e1 − 2e2 − e3 + 2e4 . Cette droite est stable par u , parce que u et ν commutent, c’est donc une droite propre de u . On vérifie que u(ε2 ) = ε2 . Que pouvons-nous en déduire ? Notons E1 et E 1 respectivement le sous-espace propre et le sous-espace caractéristique de u associés à la valeur propre 1 , de même pour E−1 et E −1 . Puisque E 1 et E −1 sont stables par ν , l’image de ν est somme directe des images des endomorphismes induits (par ν ) sur ces deux espaces. Comme Im ν ⊂ E1 ⊂ E 1 , nécessairement ν induit sur E −1 l’endomorphisme nul. Cela signifie que u et d coïncident sur E −1 , c’est-à-dire que E −1 = E−1 . Pour les mêmes raisons, E 1 6= E1 , donc E1 = Cε2 . Nous avons déterminé les espaces propres de u : ce sont Cε2 et E −1 . Une base de E −1 est (ε3 , ε4 ), en posant ε3 := e2 + 2e3 + e4 et ε4 := 2e1 −4e2 −3e3 +4e4 . Pour E 1 , il doit exister un vecteur ε1 ∈ E 1 tel que ν(ε1 ) = ε2 , soit u(ε1 ) = ε1 + ε2 . On peut prendre ε1 := −(e2 + e3 ). Alors (ε1 , ε2 ) est une base de E 1 , et C := (ε1 , ε2 , ε3 , ε4 ) est une base de E . Nous connaissons maintenant la matrice de u dans la base C . En effet, u(ε1 ) = ε1 + ε2 , u(ε2 ) = ε2 , u(ε3 ) = −ε3 et u(ε4 ) = −ε4 , d’où : 1 0 0 0 1 1 0 0 := M. MatC (u) = 0 0 −1 0 0 0 0 −1 Cette matrice est une réduite de Jordan de A, en fait M = J2 (1), J1 (−1), J1 (−1) . La matrice A est semblable à M , plus précisément, A = P M P −1 , où P est la matrice de passage de la base B à la base C . On a : −4 −1 0 1 0 1 0 2 3 −2 −1 −2 1 −4 2 −2 −1 . = P = −2 −1 −1 2 −3 et P 0 0 1 0 2 1 4 −1 1 −1 1 I.5.30 Le polynôme caractéristique et le polynôme minimal de A ont déjà été déterminés dans l’exercice I.5.28 de la page 259. Plus précisément, considérons une réduite de Jordan M de A : M := Diag Jr1 (λ1 ), . . . , Jrm (λm ) . (37) Rappelons que les ri sont des entiers strictement positifs, dont la somme doit être égale à n, et que les λi sont des éléments de C, non nécessairement distincts. Le polynôme caractéristique χ c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 102 et le polynôme minimal µ de A (ou de M , qui lui est semblable) sont donnés par les formules (36) de la page 99. Déterminons donc les dimensions des espaces propres de A. Notons u l’endomorphisme de E := Cn canoniquement associé à M . Le fait que M soit diagonale par blocs correspond à une décomposition de E en somme directe de sous-espaces vectoriels stables par u : E = E1 ⊕ E2 ⊕ · · · ⊕ Em . Ainsi, E1 est le sous-espace de E engendré par les r1 premiers vecteurs de la base canonique B de E , E2 est engendré par les r2 vecteurs suivants, et ainsi de suite. Pour chaque i , l’endomorphisme ui de Ei induit par u a pour matrice Jri (λi ) dans la base Bi correspondante ( B est obtenue par juxtaposition des Bi ). Soit maintenant t ∈ C. La décomposition en somme directe ci-dessus donne évidemment : Ker(u − t IdE ) = m M i=1 Ker(ui − t IdEi ). Au niveau des dimensions, on en déduit la formule suivante : dim Ker(u − t IdE ) = m X i=1 dim Ker(ui − t IdEi ). Il nous suffit donc, étant donnés un entier r > 1 et deux nombres complexes λ, t, de calculer la dimension d du noyau de Jr (λ) − tIr . Notons ici (e1 , . . . , er ) la base canonique de Cr et v l’endomorphisme de Cr canoniquement associé à Jr (λ). Si t 6= λ, t n’est pas valeur propre de v , car λ est la seule valeur propre de Jr (λ). Dans ce cas, d = 0 . Supposons que t := λ. Alors Jr (λ) − λIr est, par définition, la matrice Jr définie par la formule (27) de la page 248. Soit w := v − λ IdCr . Par définition, w(ej ) = ej+1 si j = 1, . . . , r − 1 et w(er ) = 0 . En fait, la forme même de la matrice Jr montre que son rang est r − 1 , donc le noyau de w est une droite vectorielle (théorème du rang), c’est-àdire Ker w = Cer . Dans ce cas, d = 1 . Compte tenu de la formule ci-dessus portant sur les dimensions, on obtient ceci : dim Ker(A − t In ) = card i ∈ [[1, m]] | λi = t . Autrement dit, pour toute valeur propre λ de A, la dimension de l’espace propre associé est le nombre de blocs correspondant à λ, i.e. le nombre d’indices i tels que λi = λ. I.5.31 Si A est semblable à la matrice compagnon CP d’un polynôme unitaire P de degré n > 1 , χA = χCP et µA = µCP . Or, la proposition 21 de la page 228 montre que χCP = P = µCP , donc χA = µA . Supposons inversement que χA = µA . Reprenons les notations de l’exercice précédent. Compte tenu des formules (36) de la page 99, l’égalité χA = µA se traduit ainsi : m Y i=1 (X − λi )ri = ppcm (X − λ1 )r1 , . . . , (X − λm )rm . Soit λ ∈ C. L’exposant de X − λ dans le premier membre de cette égalité est la somme des mi , pour tous les indices i tels que λi = λ. D’un autre côté, le calcul d’un ppcm montre que l’exposant de X − λ dans le deuxième membre est le maximum des mi , pour tous les indices i tels que λi = λ. L’égalité de ces deux entiers n’est possible, puisque les mi sont des réels (et même des entiers) strictement positifs, que s’il n’existe qu’un seul indice i tel que λi = λ. Cela revient évidemment à dire que les λi sont deux à deux distincts. c Dunod 2014 I.5 : Réduction des matrices Posons maintenant P := χA = 103 r Q (X − λi )mi . Dans l’exercice 16 de la page 255, nous avons i=1 montré que la matrice M définie par l’égalité (37) de la page 101 est précisément une réduite de Jordan de CP Le théorème 47 de la page 254 montre alors que A est semblable à CP . I.5.32 Considérons le polynôme P := X k − (ak−1 X k−1 + · · · + a1 X + a0 ) associé à la relation de récurrence linéaire (R) donnée. Soit E le sous-espace vectoriel de CN formé des suites complexes satisfaisant la relation (R). Nous savons que E est de dimension k . Plus précisément, rappelons les résultats obtenus dans la section 3.1 de la page 242. Commençons par factoriser P : P = (X − α1 )k1 (X − α2 )k2 · · · (X − αm )km , où α1 , . . . , αm ∈ C sont distincts et les ki appartiennent à N∗ . Une base de E est alors formée des suites (nj αni )n>0 , pour tous les couples (i, j) vérifiant les conditions 1 6 i 6 m et 0 6 j 6 mi − 1 . Pour un tel couple (i, j), la suite correspondante est bornée si, et seulement si, ou bien |αi | < 1 (auquel cas la suite converge vers 0 ), ou bien |αi | := 1 et j := 0 . Les suites en question formant une base de E , on obtient la conclusion ci-dessous. Conclusion : pour que toute suite satisfaisant la relation de récurrence (R) soit bornée, il faut, et il suffit, que : 1. toute racine du polynôme P soit de module au plus égal à 1 ; 2. toute racine de module 1 de P soit simple. I.5.33 Nous allons en fait montrer que les conditions suivantes (portant sur u ) sont équivalentes : 1. Il n’y a qu’un nombre fini de sous-espaces vectoriels de E stables par u . 2. Pour chaque valeur propre λ de u , l’espace propre Eλ (u) est de dimension 1 . 3. Si l’on applique le théorème de Jordan (théorème 46 de la page 253) à u , il n’y a qu’un seul bloc correspondant à une valeur propre donnée. 4. Dans une base convenable, la matrice de u est la matrice compagnon d’un polynôme unitaire non constant. 5. Il existe un vecteur x de E tel que la famille x, u(x), u2 (x), . . . , un−1 (x) soit une base de E . 6. Le polynôme caractéristique et le polynôme minimal de u sont égaux. Commençons par une remarque simple : tout sous-espace vectoriel d’un espace propre de u est stable par u . En effet, si λ ∈ sp u et si V est un sous-espace vectoriel de Eλ (u), u(x) = λx ∈ V pour tout x ∈ V , donc u(V ) ⊂ V . Il en découle que, si l’un des sous-espaces propres Eλ (u) de u est de dimension au moins égale à 2 , il y a une infinité de sous-espaces de E stables par u . En effet, Eλ (u) contient alors une infinité de droites, et chacune d’elles est stable par u . Par contraposition, cela prouve l’implication 1 =⇒ 2. L’équivalence 2 ⇐⇒ 3 découle du résultat de l’exercice I.5.30 de la page 259 disant que, pour toute valeur propre λ de u , la dimension de Eλ (u) est le nombre d’indices i ∈ [[1, m]] tels que λi = λ. Implication 3 =⇒ 4. Appliquons donc le théorème de Jordan (théorème 46 de la page 253), en en reprenant les notations. La matrice de u dans la base B est alors la matrice diagonale par blocs A := Diag Jr1 (λ1 ), . . . , Jrm (λm ) . Par hypothèse, les λi sont deux à deux distincts (ce qui, rappelons-le, n’est pas toujours le cas). Notons P le polynôme caractéristique c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 104 de A. La factorisation de P est donnée par la formule suivante (cf. par exemple l’exercice l’exercice I.5.28 de la page 259 ou l’exercice I.5.30 de la page 259) : P = (X − λ1 )r1 (X − λ2 )r2 · · · (X − λm )rm . Dans l’exercice 16 de la page 255, nous avons montré que la matrice A est précisément une réduite de Jordan de la matrice compagnon CP du polynôme P . Le théorème 47 de la page 254 montre alors que A est semblable à CP . L’équivalence 4 ⇐⇒ 6 a été établie dans l’exercice I.5.31 de la page 259. L’implication 4 =⇒ 5 est évidente. Soit en effet B := (e1 , . . . , en ) une base de E dans laquelle la matrice de u soit la matrice compagnon d’un polynôme unitaire P (de degré n). Par définition, u(ej ) = ej+1 pour tout j ∈ [[1, n − 1]], donc B = e1 , u(e1 ), . . . , un−1 (e1 ) . Il reste l’implication 5 =⇒ 1, partie substantielle de l’exercice. Soit donc x un vecteur de E tel que B := x, u(x), u2 (x), . . . , un−1 (x) soit une base de E . Soit f : C[X] → E l’application (linéaire) Q 7→ Q(u)(x). Elle est surjective, car uj (x) = f (X j ) pour tout j ∈ [[0, n − 1]]. Le point important est que, si V est un sous-espace vectoriel de E stable par u , son image réciproque f −1 (V ) est non seulement un sous-espace vectoriel, mais un idéal de C[X]. En effet, si Q ∈ C[X] et R ∈ f −1 (V ), on a : f (QR) = (QR)(u)(x) = Q(u) ◦ R(u) (x) = Q(u) R(u)(x) = Q(u) f (R) . Par hypothèse, f (R) ∈ V et V est stable par u , donc par Q(u), d’où f (QR) ∈ V , soit QR ∈ f −1 (V ). En particulier, le noyau de f est un idéal de C[X], et le lemme 20 de la page 228 montre qu’il existe un unique polynôme unitaire P tel que Ker f = (P ). De plus, P est de degré n car, avec les notations de ce lemme, Eu,x = E . Soit alors V un sous-espace de E stable par u . L’idéal f −1 (V ) de C[X] contient Ker f = (P ). Il existe donc un unique polynôme unitaire PV tel que f −1 (V ) = (PV ), et ce polynôme PV divise P . Nous pouvons maintenant conclure. Nous avons construit une application V 7→ PV de l’ensemble des sous-espaces de E stables par u dans l’ensemble des diviseurs unitaires de P . Cette application est injective. Soient en effet V, W deux sous-espaces de E stables par u tels que PW = PW , c’est-à-dire f −1 (V ) = f −1 (W ). Puisque f est surjective, V = f f −1 (V ) , de même W = f f −1 (W ) , donc V = W . Comme l’ensemble des diviseurs unitaires de P est fini, l’ensemble des sous-espaces de E stables par u est fini, ce qui achève la preuve de l’implication 5 =⇒ 1. I.5.34 Quitte à remplacer A par b−1 A (il est équivalent de diagonaliser l’une ou l’autre de ces matrices), nous pouvons supposer que b := 1 , ce qui allègera un peu les calculs. Il s’agit de prouver l’existence d’une base de Cn formée de vecteurs propres de A et d’expliciter une telle base. Nous allons voir que la matrice A possède n valeurs propres distinctes, ce qui montrera qu’elle est diagonalisable. Ce point pourrait être établi en calculant le polynôme caractéristique χA de A, mais il faudrait ensuite, de toutes façons, résoudre certains systèmes linéaires pour trouver effectivement les vecteurs propres de A. Le plus logique est donc d’étudier ces systèmes linéaires directement. Considérons donc un vecteur colonne X ∈ Cn et posons Y := AX . Les coordon- c Dunod 2014 I.5 : Réduction des matrices 105 nées y1 , . . . , yn de Y sont données en fonction des coordonnées x1 , . . . , xn par les formules : y1 = x2 y2 = ax1 + x3 . . . . . . . . . . . . . . . . . . . yk = axk−1 + xk+1 ................... y n−1 = axn−2 + xn yn = axn−1 . Soit maintenant λ un nombre complexe donné. L’égalité Y = λX équivaut au système : −λx1 + x2 = 0 ax1 − λx2 + x3 = 0 ........................ (Sλ ) : axk−1 − λxk + xk+1 = 0 ........................ axn−2 − λxn−1 + xn = 0 axn−1 − λxn = 0 . Par définition, ce système possède une solution non triviale si, et seulement si, λ est valeur propre de A. On remarquera aussi que, si X 6= 0 est solution de ce système, x1 n’est pas nul (sinon tous les xk seraient nuls). Si X et λ sont donnés, posons x0 := 0 et xn+1 := 0 . Les n équations constituant le système (Sλ ) s’écrivent alors de façon plus agréable : xk+2 − λxk+1 + axk = 0 (k = 0, 1, . . . , n − 1). Cela suggère, lorsque λ est donné, de s’intéresser aux suites (uk )k>0 vérifiant la relation de récurrence linéaire d’ordre 2 suivante : (Rλ ) : uk+2 = λuk+1 − auk pour tout k ∈ N. Le polynôme associé à cette relation de récurrence linéaire est P := X 2 − λX + a. Restreignons-nous (parce que cela suffira pour la suite) au cas où ce polynôme a deux racines distinctes r, s (non nulles parce que a 6= 0 ), autrement dit supposons λ2 6= 4a. La forme générale d’une suite (uk ) vérifiant la relation de récurrence (Rλ ) est alors donnée par la formule uk := αrk + βsk , où α, β ∈ C sont arbitraires. Par ailleurs, une telle suite (uk ) est entièrement déterminée par la donnée de u0 et u1 (conditions initiales). Vu le contexte, impo sons les conditions u0 := 0 et u1 6= 0 . On obtient les suites α(rk − sk ) k>0 , où α ∈ C∗ est arbitraire. Le contexte impose aussi la condition un+1 := 0 , c’est-à-dire rn+1 = sn+1 . Comme s 6= r , cela signifie que z := r/s doit être une racine (n + 1) ème de l’unité distincte de 1 . N’oublions pas que la somme et le produit de r et s sont connus : r + s = λ et rs = a, soit λ = s(1 + z) et zs2 = a. Arrivés à ce stade, nous pouvons déterminer les éléments propres (valeurs propres et vecteurs propres) de A. Pour simplifier, notons t l’une des deux racines carrées de a et posons θ := π/(n + 1). Considérons un entier p ∈ [[1, n]] fixé, et posons z := e2piθ , de sorte que z est une racine n + 1 ème de l’unité distincte de 1 . Posons ensuite s := te−piθ , r := zs = tepiθ , puis λp := r + s = 2t cos(pθ). Ainsi r 6= s, et r, s sont les deux racines de l’équation x2 − λp x + a = 0 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 106 La suite (rk −sk )k>0 , c’est-à-dire 2itk sin(kpθ) k>0 , vérifie la relation de récurrence (Rλp ), et ses termes d’indices 0 et n + 1 sont nuls. Autrement dit, le vecteur Xp ∈ Cn de coordonnées tk sin(kpθ) ( k = 1, . . . , n) est solution du système (Sλp ), ce qui signifie que λp est une valeur propre de A et que Xp et un vecteur propre de A associé à λp . Lorsque p décrit [[1, n]], les λp = 2t cos(pθ) sont deux à deux distincts. Nous aboutissons aux conclusions suivantes (rappelons que nous avons supposé que b := 1 et que t est une racine carrée de a) : 2. La matrice A possède n valeurs voir λp := 2t cos pπ/(n + 1) , p = 1, . . . , n. 3. La famille (X1 , . . . , Xn ) est une base de Cn . 1. propres distinctes, à sa- Pour p ∈ [[1, n]], soit Xp ∈ Cn le vecteur de coordonnées tk sin kpπ/(n + 1) ( k = 1, . . . , n). Alors Xp est un vecteur propre de A associé à la valeur propre λp . Nous avons ainsi diagonalisé la matrice A. Terminons par une remarque. Connaissant les valeurs propres de A, nous connaissons du même coup le polynôme caractéristique de A : n Y pπ χA = X − 2t cos = tn Un X/(2t) , n+1 p=1 où Un est le n ème polynôme de Tchebychev de deuxième espèce. Nous avons rencontré ces polynômes Un dans le module II.6 de [L1], ils interviendront dans le module « Polynômes orthogonaux » de [L2-L3]. D’autre part, faisons varier n et notons alors An la matrice donnée dans l’énoncé. Soit Dn le polynôme caractéristique de An . En développant le déterminant définissant Dn par rapport à une ligne, on obtient facilement (le vérifier) la relation de récurrence Dn = XDn−1 − abDn−2 (on pose D0 := 1 et D1 := X ). Cette relation de récurrence est équivalente à celle que vérifient les Un (cf. le module « Polynômes orthogonaux » de [L2-L3]) : Un = 2XUn−1 − Un−2 . I.5.35 La nécessité est évidente : si A et B sont semblables, il en est de même pour (A − λIn )k et (B − λIn )k , qui ont par conséquent même rang, ceci quel que soit le couple (λ, k). Pour la réciproque, supposons désormais que, pour tout couple (λ, k), (A−λIn )k et (B −λIn )k aient même rang. Il s’agit de montrer que A et B sont semblables. Dans cette situation, on peut bien sûr remplacer A par une matrice semblable, cela ne change pas les rangs concernés. En vertu du théorème de Jordan (théorème 47 de la page 254), nous pouvons donc supposer que A (et de même B ) est une matrice diagonale par blocs du type A := Diag Jr1 (λ1 ), . . . , Jrm (λm ) , comme dans l’énoncé du théorème. L’idée est de montrer deux choses : 1. 2. Pour chaque couple (λ, k), le rang de (A − λIn )k se calcule simplement en fonction de la suite ξ := (r1 , λ1 ), . . . , (rm , λm ) . La suite ξ , à l’ordre près, est bien déterminée par la connaissance de tous ces rangs. La conclusion résultera alors du théorème de Jordan cité, disant que la suite ξ caractérise la matrice A, à similitude près. Commençons par observer que, si M := Diag(M1 , . . . , Mm ) est une matrice diagonale par blocs, le rang de M est la somme des rangs des Mi . Nous laissons le lecteur vérifier ce point par un raisonnement purement matriciel. En termes d’endomorphismes, ce résultat se traduit ainsi. Soient E un espace vectoriel (de dimension finie) et u ∈ L(E). Supposons que E soit somme c Dunod 2014 I.5 : Réduction des matrices 107 directe de sous-espaces vectoriels E1 , . . . , Em stables par u . Pour chaque i , soit ui ∈ L(Ei ) l’endomorphisme induit par u . Alors le rang de u est la somme des rangs des ui . Sous cette forme, le résultat est évident, car Im u est la somme (directe) des Im ui pour i = 1, . . . , m. Pour prouver le point 1 (et expliciter son résultat), l’alinéa précédent ramène au cas d’un bloc de Jordan. Étant donnés un entier k > 1 et deux nombres λ, µ ∈ C, il s’agit de calculer k le rang de la matrice Jr (µ) − λIr . Si µ 6= λ, ce rang vaut r car, la seule valeur propre de Jr (µ) étant λ, Jr (µ) − λIr est inversible, par définition d’une valeur propre. Supposons que µ = λ, de sorte que Jr (λ) − λIr est la matrice Jr . Dans ce cas, le rang de Jrk est donné par l’exercice 12 de la page 248. D’après cet exercice, la dimension du noyau de la matrice Jrk (ou plutôt de l’endomorphisme de Cr qui lui est canoniquement associé) est min(k, r). En vertu du théorème du rang, le rang de Jrk est donc r − min(k, r) = max(0, r − k). Nous avons obtenu la formule générale : ( k r si λ 6= µ, rang Jr (µ) − λIr = max(0, r − k) si λ = µ. On peut écrire cette formule ainsi : r − rang Jr (µ) − λIr k = ( 0 si λ 6= µ, min(r, k) si λ = µ. Revenons à A. Puisque n est la somme des ri , l’alinéa précédent et la formule ci-dessus donnent : X n − rang(A − λIn )k = min(ri , k), λi = λ la somme portant sur tous les indices i ∈ [[1, m]] tels que λi = λ. Nous avons réalisé la partie 1 du programme. Comment maintenant récupérer la suite ξ à partir de tous ces rangs ? L’idée est simple. Fixons λ ∈ C. Pour tout k ∈ N, posons pour simplifier uk := n−rang(A−λIn )k . En fonction des uk , nous voulons déterminer à l’ordre près la famille formée des ri , indexée par l’ensemble des i ∈ [[1, m]] tels que λi = λ. À l’ordre près, nous supposerons que cet ensemble est [[1, p]], p P avec r1 > r2 > · · · > rp > 1 . Pour tout k , la formule ci-dessus s’écrit : uk = min(ri , k). i=1 Si k > 1 et i sont donnés, la différence min(ri , k) − min(ri , k − 1) vaut 1 si ri > k et 0 si ri < k . En sommant par rapport à i , il vient : uk − uk−1 = card i ∈ [[1, p]] | ri > k pour tout k > 1. Remplaçons encore k par k + 1 et soustrayons : 2uk − (uk+1 + uk−1 ) = card i ∈ [[1, p]] | ri > k − card i ∈ [[1, p]] | ri > k + 1 = card i ∈ [[1, p]] | ri = k pour tout k > 1. En revenant à la suite ξ , on voit qu’elle est entièrement déterminée par les divers rangs. Plus précisément, si λ ∈ C et k ∈ N∗ sont arbitrairement donnés, le nombre d’indices i ∈ [[1, m]] tels que λi = λ et ri = k est : rang(A − λIn )k+1 + rang(A − λIn )k−1 − 2 rang(A − λIn )k . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 108 I.5.36 Donnons deux solutions, l’une algébrique et l’autre « topologique ». Le fait que C(A) soit une sous-algèbre de Mn (C) est évident. C’est un sous-espace vectoriel de Mn (C) parce que l’application M 7→ AM − M A de Mn (C) dans Mn (C) est linéaire. Il est immédiat que le produit de deux matrices commutant avec A commute avec A, et enfin In ∈ C(A). Par ailleurs, A ∈ C(A), donc C(A) contient la sous-algèbre de Mn (C) engendrée par A, c’està-dire C[A]. Supposons ensuite que A, B ∈ Mn (C) soient semblables, et soit P ∈ GLn (C) telle que B := P AP −1 . L’application M 7→ P M P −1 est un automorphisme de l’algèbre Mn (C), elle applique donc C(A) sur C(B), ce qui fait que dim C(A) = dim C(B). La solution algébrique consiste à dire, vu ce qui précède et en vertu du théorème de Jordan, qu’il suffit de traiter le cas où A est une matrice diagonale par blocs A := Diag(A1 , . . . , Am ), chaque Ai étant un bloc de Jordan : Ai = Jri (λi ) ( ri ∈ N∗ , λi ∈ C). Si l’on considère pour tout i une matrice Mi ∈ C(Ai ), il est clair que la matrice M = Diag(M1 , . . . , Mn ) appartient à C(A). L’application (M1 , . . . , Mm ) 7→ M de C(A1 ) × C(A2 ) × · · · × C(Am ) étant linéaire et inm P jective, on en déduit l’inégalité dim C(A) > dim C(Ai ). Puisque n est la somme des ri , i=1 il suffit de prouver pour tout i l’inégalité dim C(Ai ) > ri . Nous sommes ainsi ramenés au cas où A := Jr (λ), avec r ∈ N∗ et λ ∈ C. Nous savons que le polynôme minimal de A est (X − λ)r (cf. la section 3.4 de la page 253). Nous savons aussi que, pour toute matrice carrée A, la dimension de C[A] est égale au degré du polynôme minimal de A (cf. la section 1.3 de la page 220). Dans le cas présent, on a donc dim C[A] = r , d’où dim C(A) > dim C[A] = r , comme désiré. En fait, il se trouve ici que C(A) = C[A], ce qui n’est pas toujours vrai, mais peu importe. La deuxième solution est la suivante (on se reportera au module II.1 pour les notions topologiques utilisées ici). L’assertion à démontrer est vraie lorsque A est une matrice diagonale, car C(A) contient alors toutes les matrices diagonales, lesquelles forment un sous-espace vectoriel de dimension n de Mn (C). L’assertion reste donc vraie lorsque A est diagonalisable, i.e. semblable à une matrice diagonale. Notons alors D l’ensemble des matrices diagonalisables de Mn (C). Si l’on munit Mn (C) d’une norme quelconque, D est dense dans Mn (C) : ce point sera établi dans le module I.6. L’idée est maintenant la suivante. Par définition, C(A) est l’espace des solutions de l’équation AM − M A = 0 , l’inconnue M appartenant à Mn (C). Par rapport aux n2 coefficients de M , cette équation se traduit par un système linéaire homogène de n2 équations à n2 inconnues. Notons SA ce système. La dimension de C(A) est donc n2 − rang(SA ). Il nous faut donc établir, pour toute matrice A, l’inégalité : rang(SA ) 6 n2 − n. (∗) Cette inégalité est vraie lorsque A ∈ D . Par ailleurs, les coefficients du système SA dépendent continûment (polynomialement) des coefficients de A. L’application ϕ de Mn (C) dans Mn2 (C) associant à toute matrice A la matrice du système SA est donc continue. Soit enfin T l’ensemble des matrices de rang inférieur ou égal à n2 − n appartenant à Mn2 (C). C’est un fermé de Mn2 (C), en vertu de l’exercice 7 de la page 412. Puisque ϕ est continue, ϕ−1 (T ) est un fermé de Mn (C). Explicitement, ϕ−1 (T ) est formé des matrices A ∈ Mn (C) telles que le système SA vérifie l’inégalité (∗). Ainsi ϕ−1 (T ) est une partie fermée de Mn (C) contenant la partie dense D , d’où ϕ−1 (T ) = Mn (C), ce qui signifie que l’inégalité (∗) est vraie c Dunod 2014 I.5 : Réduction des matrices 109 pour toute matrice A. I.5.37 Soit g : E → E l’application M 7→ AM . L’exercice I.5.9 de la page 257 montre que g est un endomorphisme de E , et que g est nilpotent (resp. diagonalisable) si, et seulement si, A a la même propriété. Soit de même d : E → E l’application M 7→ M A. De manière analogue (ou en transposant), on montre que d ∈ L(E), et que d est nilpotent (resp. diagonalisable) si, et seulement si, A a la même propriété. Manifestement, u := g − d, donc u ∈ L(E). Remarquons que g et d commutent. En effet, pour toute matrice M ∈ E , on a : (g ◦ d)(M ) = g d(M ) = g(M A) = A(M A) (d ◦ g)(M ) = d g(M ) = d(AM ) = (AM )A, d’où la conclusion, par associativité. Si donc A est nilpotente, g et d sont deux endomorphismes nilpotents qui commutent, leur différence u est donc nilpotente (cf. le début de la section 3.2 de la page 246. Si A est diagonalisable, g et d sont deux endomorphismes diagonalisables qui commutent, leur différence u est donc diagonalisable, car ils sont simultanément diagonalisables, en vertu de l’exercice 9 de la page 237. Pour toute matrice B ∈ E , notons uB l’endomorphisme M 7→ BM − M B de E . On a uB = gB − dB , où gB est défini par M 7→ BM et dB est défini par M 7→ M B . L’application B 7→ uB de E dans L(E) est évidemment linéaire. En supposant que uA est diagonalisable, il nous reste à démontrer que A est diagonalisable. Écrivons pour cela la décomposition de Dunford de A : A = D + N . Alors uA = uD + uN et, d’après ce qui précède, uD est diagonalisable alors que uN est nilpotent. Notons que uD et uN commutent, parce que DN = N D . En effet, par associativité, gD commute avec dN et dD commute avec gN . Par ailleurs, l’égalité DN = N D montre que gD commute avec gN et que dD commute avec dN . Ainsi uD = gD − dD commute avec uN = gN − dN . Puisque uD et uN commutent, l’égalité uA = uD + uN donne la décomposition de Dunford de A. Mais uA est diagonalisable, donc sa partie nilpotente uN est nulle. Cela signifie que N M = M N pour toute matrice M ∈ E . On sait alors que N est une matrice scalaire : N = λIn , λ ∈ C (cf. le module II.3 de [L1]). Une telle matrice scalaire n’est nilpotente que si λ = 0 . Finalement, N = 0 , et donc A = D est diagonalisable. I.5.38 Commençons par quelques remarques. Dans ce qui suit, pour deux matrices carrées A, B de même taille, on écrit A ∼ B lorsque A et B sont semblables. a) Le problème posé ne dépend en fait que de la classe de similitude de M . En effet, si M ′ ∈ Mn (C) est semblable à M , il est clair que aM ∼ aM ′ , et par conséquent (M ∼ aM ) ⇐⇒ (M ′ ∼ aM ′ ). ′ b) Soient T := Diag(T1 , . . . , Tm ) et T ′ := Diag(T1′ , . . . , Tm ) deux matrices diagonales par blocs (de même format). Si Ti ∼ Ti′ pour tout i , alors T ∼ T ′ . En effet, pour chaque i soit Pi une matrice carrée inversible de même taille que Ti telle que Pi Ti Pi−1 = Ti′ . Alors P := Diag(P1 , . . . , Pm ) est inversible, de même taille que T , et P T P −1 = T ′ . En particulier, si Ti ∼ aTi pour tout i , alors T ∼ aT . c) Si T := Diag(T1 , . . . , Tm ) ∈ Mn (C) est une matrice diagonale par blocs et si s ∈ Sm , la matrice T ′ := Diag(Ts(1) , . . . , Ts(m) ) est semblable à T . Cela peut se déduire de la proposition 4 de la page 218. En effet, notons ri la taille de chaque Ti . Soient u ∈ L(Cn ) l’endomorphisme canoniquement associé à T et B := (e1 , . . . , en ) la base canonique de Cn . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 110 Les r1 premiers ei forment une base B1 d’un sous-espace E1 de Cn , les r2 vecteurs suivants forment une base B2 d’un sous-espace E2 , et ainsi de suite. Pour tout i , le sous-espace Ei est stable par u , et Ti est la matrice dans la base Bi de l’endomorphisme ui de Ei induit par u . Enfin B est obtenue par juxtaposition des bases B1 , . . . , Bm . Changeons l’ordre. On a aussi Cn = Es(1) ⊕ Es(2) ⊕ · · · ⊕ Es(m) . La matrice T ′ est la matrice de u dans la base obtenue par juxtaposition des bases Bs(1) , . . . , Bs(m) , elle est donc semblable à T. d) Appliquons le théorème de Jordan (théorème 47 de la page 254). La matrice M est semblable à une matrice M ′ diagonale par blocs, les blocs étant des blocs de Jordan (cf. la formule (29) de la page 253) : M ′ = Diag Jr1 (λ1 ), . . . , Jrm (λm ) et aM ′ = Diag aJr1 (λ1 ), . . . , aJrm (λm ) , les λi étant des nombres complexes, non nécessairement distincts, et les ri des entiers strictement positifs. Rappelons que, d’après la remarque de la page 254, un scalaire α est valeur propre de M si, et seulement s’il est égal à l’un des λi . Le théorème de Jordan donne en outre une propriété d’unicité. Pour tout λ ∈ C et tout r ∈ N∗ , le nombre d’indices i ∈ [[1, m]] tels que (ri , λi ) = (r, λ) ne dépend que de M et non de la matrice M ′ semblable à M et de la forme ci-dessus. On peut donc noter ce nombre ν(M, r, λ). Alors : 1. Le spectre de M est formé des λ ∈ C tels que ν(M, λ, r) > 1 pour au moins un entier r > 1 ; 2. deux matrices M1 , M2 ∈ Mn (C) sont semblables si, et seulement si, pour tout couple (r, λ) ∈ N∗ × C, on a ν(M1 , r, λ) = ν(M2 , r, λ). En particulier, M ∼ aM si, et seulement si, ν(M, r, λ) = ν(aM, r, λ) pour tout couple (r, λ). Une application (pas évidente a priori) de cette équivalence est la propriété de « simplifica′ tion » suivante. Étant données deux matrices semblablesA′ et A et deux autres matrices car′ ′ ′ rées B, B , Diag(A, B) ∼ Diag(A , B ) ⇐⇒ (B ∼ B ). e) Soit (r, λ) ∈ N∗ × C. Posons Dr := Diag(1, a, a2 , . . . , ar−1 ). La matrice Dr−1 Jr (λ)Dr se déduit de Jr (λ) en multipliant chaque ligne d’indice i par a−(i−1) et chaque colonne d’indice j par aj−1 . Les termes λ de la diagonale ne changent pas, mais les termes égaux à 1 sont remplacés par a−1 . D’où la formule : aDr−1 Jr (λ)Dr = Jr (aλ). (∗) Ainsi, Jr (aλ) est semblable à aJr (λ). On en déduit l’égalité ν(aM, r, aλ) = ν(M, r, λ). Par ailleurs, pour le bloc de Jordan nilpotent Jr := Jr (0), on a Jr ∼ aJr . f) Si M est nilpotente, elle est semblable à aM . En effet, sp M = {0} donc, M ′ étant comme ci-dessus, les λi sont tous nuls. Pour tout i , Jri ∼ aJri d’après l’alinéa précédent, donc M ′ ∼ aM ′ en vertu de l’alinéa b). D’où M ∼ aM . g) Supposons que M soit semblable à aM mais ne soit pas nilpotente. D’abord le spectre de aM , c’est-à-dire a sp M , est égal à celui de M , i.e. le spectre de M est stable par multiplication par a : a sp M = sp M . On en déduit que ak sp M = sp M pour tout k ∈ N. Fixons une valeur propre non nulle µ1 de M . Alors ak µ1 ∈ sp M pour tout k ∈ N. Puisque sp M est fini, l’ensemble {ak | k ∈ N} est fini, ce qui équivaut à dire que a est une racine de l’unité. Soit p l’ordre (multiplicatif) de a, de sorte que a est une racine p ème primitive de l’unité. Noter que p > 2 , parce que a 6= 1 par hypothèse. c Dunod 2014 I.5 : Réduction des matrices 111 Puisque µ1 ∈ sp M , il existe un entier ρ1 > 1 tel que Jρ1 (µ1 ) soit l’un des blocs constituant M ′ , i.e. tel que ν(M, ρ1 , µ1 ) > 1 . Puisque M ∼ aM , les alinéas d) et e) montrent que ν(M, ρ1 , µ1 ) = ν(M, ρ1 , aµ1 ) = · · · = ν(M, ρ1 , ap−1 µ1 ). Pour tout k ∈ [[0, p − 1]], l’un au moins des blocs constituant M ′ est égal à Jρ1 (ak µ1 ). Quitte à permuter les blocs de M ′ , on peut donc supposer que M ′ est égale soit à M1 , soit à Diag(M1 , M ′′ ), en posant : M1 := Diag Jρ1 (µ1 ), Jρ1 (aµ1 ), . . . , Jρ1 (ap−1 µ1 ) . On observera que M1 est semblable à aM1 , d’après les alinéas c) et e) et l’égalité ap = 1 : aM1 ∼ Diag Jρ1 (aµ1 ), . . . , Jρ1 (ap−1 µ1 ), Jρ1 (ap µ1 ) = Diag Jρ1 (aµ1 ), . . . , Jρ1 (ap−1 µ1 ), Jρ1 (µ1 ) ∼ Diag Jρ1 (µ1 ), Jρ1 (aµ1 ), . . . , Jρ1 (ap−1 µ1 ) = M1 . Si M ′ 6= M1 , il faut noter que, d’après l’alinéa d), la matrice M ′′ est semblable àaM ′′ . On peut donc appliquer à M ′′ ce qui vient d’être fait pour M ′ . On en déduit aussitôt que, quitte à permuter les blocs de M ′ , on peut supposer que M ′ est de l’une des deux formes suivantes Diag(M1 , . . . , Ms ) ou Diag(M1 , . . . , Ms , N ), où N est nilpotente et, pour tout j ∈ [[1, s]], il existe un couple (ρj , µj ) ∈ N∗ × C∗ tel que : Mj := Diag Jρj (µj ), Jρj (aµj ), . . . , Jρj (ap−1 µj ) . Posons A := Diag Jρ1 (µ1 ), . . . , Jρs (µs ) . Alors A est inversible, et l’on a : M ∼ Diag(A, aA, . . . , ap−1 A) ou M ∼ Diag(A, aA, . . . , ap−1 A, N ). h) Voici ce que nous pouvons déduire de ce qui précède : Conclusion : considérons une matrice M ∈ Mn (C) et un nombre a ∈ C \ {0, 1} . Supposons que M soit semblable à aM . Alors : - ou bien M est nilpotente ; - ou bien a est une racine de l’unité, d’ordre p > 2 , et il existe une matrice inversible A telle que M soit semblable à la matrice Diag(A, aA, . . . , ap−1 A) ; - ou bien a est une racine de l’unité, d’ordre p > 2 , et il existe une matrice inversible A et une matrice nilpotente N telles que M soit semblable à la matrice Diag(A, aA, . . . , ap−1 A, N ). La réciproque est évidente. En effet, dans le premier cas, M est semblable à aM , ceci quel que soit a, d’après l’alinéa f). Dans le deuxième cas, le même raisonnement que ci-dessus montre que Diag(A, aA, . . . , ap−1 A) est semblable à a Diag(A, aA, . . . , ap−1 A) parce que ap = 1 . Enfin, dans le troisième cas, M est semblable à aM , à cause de l’alinéa b) et des deux cas précédents. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 112 Module I.6 : Groupes classiques I.6.1 (i) Si f, g se restreignent en l’identité sur H , il est immédiat que f g −1 aussi ; comme IdG ∈ Γ(E, H), c’est bien un sous-groupe de GL(E). Soient f, g ∈ Γ(E, H). Alors, par définition, pour tout x ∈ E : (g ◦ f ) x (mod H) = g f x (mod H) = g f (x) (mod H) = g f (x) (mod H) = (g ◦ f )(x) (mod H) = g ◦ f x (mod H) , d’où l’égalité g ◦ f = g ◦ f qui entraîne que f 7→ f est un morphisme de groupes. Pour voir qu’il est surjectif de Γ(E, H) sur GL(E/H), on choisit un supplémentaire D de H dans E , et l’on relève tout endomorphisme de E/H en un endomorphisme de D ≃ E/H , que l’on complète en l’endomorphisme de E qui est l’identité sur H . Puisque H est un hyperplan, E/H est une droite et GL(E/H) s’identifie canoniquement à K ∗ (il est constitué d’homothéties non triviales). (ii) Soit f une forme linéaire sur E de noyau H et soit u ∈ H . La transvection x 7→ x+f (x)u est évidemment dans Γ(E, H) (puisque f est nulle sur H ) et laisse stable x (mod H), donc induit l’identité sur E/H : c’est donc un élément de Θ(E, H). Soit réciproquement ϕ ∈ Θ(E, H). L’endomorphisme ϕ − IdE est nul sur H (car ϕ ∈ Γ(E, H)) et envoie E dans H (car ϕ ∈ Θ(E, H)). Il se factorise donc par un morphisme de la droite E/H dans H , qui est donc de la forme y 7→ g(y)v . où v ∈ H et où g est une forme linéaire sur E/H . Par composition avec la projection E → E/H , on obtient une forme linéaire sur E nulle sur H , donc de la forme αf . L’endomorphisme ϕ − IdE est alors égal à x 7→ f (x)u , où u := αv , et ϕ est bien une transvection d’hyperplan H . Notons Tu cette transvection. On a : (Tv ◦ Tu )(x) = (x + f (x)u) + f x + f (x)u v = x + f (x)u + f (x)v + f f (x)u v = x + f (x)u + f (x)v = Tu+v (x). Ainsi, u 7→ Tu est un isomorphisme de H sur Θ(E, H) (on vient de voir que c’est une surjection, et il est clair que c’est une injection). (iii) Si u ∈ / H , la dilatation x 7→ x + f (x)u est encore dans Γ(E, H) et ne laisse pas stable x (mod H), donc n’induit pas l’identité sur E/H : c’est donc un élément de Γ(E, H) \ Θ(E, H). Soit ϕ ∈ Γ(E, H) \ Θ(E, H). Comme précédemment, on met l’endomorphisme ϕ − IdE sous la forme x 7→ f (x)u , mais le fait que son image n’est pas dans H signifie que u ∈ / H , donc que ϕ est une dilatation d’hyperplan H . I.6.2 Ces transvections sont toutes éléments de Tsun (K), donc le groupe qu’elles engendrent est contenu dans Tsun (K). Réciproquement, pour toute matrice de Tsun (K), la version suivante de l’algorithme du pivot ramène à l’identité : on annule toute la première ligne (sauf son premier coefficient) par des opérations Cj ← Cj − a1,j C1 ( j > 2 ) ; puis on annule toute la deuxième ligne (sauf son coefficient diagonal) par des opérations Cj ← Cj − a2,j C2 ( j > 3 ) ; etc. Pour engendrer Tsrn (K), on a besoin des mêmes transvections, et aussi des Di (λ). Comme Ti,j (α) = In + αEi,j , un élément de Tsun (K) est dans le centre si, et seulement s’il c Dunod 2014 I.6 : Groupes classiques 113 commute aux Ei,j telles que i < j . Écrivons In + P ak,ℓ Ek,ℓ un tel élément. On doit avoir, k<ℓ pour tout i < j : X k<i ak,ℓ Ek,j = X aj,ℓ Ei,ℓ , j<ℓ ce qui implique que tous les éléments non diagonaux sont nuls. Le centre de Tsun (K) est donc réduit à {In } . Le même calcul montre que le centre de Tsrn (K) est formé de matrices diagonales, et même scalaires. C’est donc K ∗ In . I.6.3 Il s’agit de démontrer que, si A ∈ GLn (K) est telle que : ∀B ∈ GLn (K) , ∃λ ∈ K ∗ : AB = λBA, alors A est scalaire (et la même chose pour SLn (K)). On va démontrer l’assertion suivante, qui subsume les deux cas : si A ∈ GLn (K) est telle que ∀B ∈ SLn (K) , ∃λ ∈ K ∗ : AB = λBA, alors A est scalaire. Remarquons que l’égalité ci-dessus entraîne AB 2 = λBAB = λ2 B 2 A, et, par récurrence, AB m = λm B m A. En prenant les déterminants, on voit que λn = 1 . Si n est non nul dans K (i.e. non multiple de la caractéristique), la suite de l’argument s’applique immédiatement. Sinon, on écrit d’abord k n = pk m avec p := car K et m ∧ p = 1 , d’où (λm )p = 1 , d’où λm = 1 (puisque x 7→ xp est un endomorphisme injectif de K ∗ ). Finalement, partant de AB = λBA, on obtient une égalité AB m = B m A pour un m non nul P dans K . Si par exemple on prend B := In + Ek,ℓ , en écrivant A := ai,j Ei,j , l’équation devient, après division par m : X X aℓ,j Ek,j = ai,k Ei,ℓ . j i Le raisonnement s’achève comme dans le calcul du centre de GLn (K). I.6.4 (i) On sait que D(G) est bien un sous-groupe distingué de G. Dire que H est un sous-groupe distingué de G tel que le quotient est abélien, c’est dire que, dans G/H , on a identiquement [x, y] = 1 . Comme [g, g ′ ] = g, g ′ , c’est dire que [g, g ′ ] ∈ H pour tous g, g ′ ∈ G, c’est-àdire que H contient D(G). En particulier, pour tout morphisme de G vers un groupe commutatif, le noyau H contient D(G) (car G/H est isomorphe à l’image qui est commutative comme sous-groupe d’un groupe commutatif), d’où la possibilité de factoriser à travers G/D(G). (Pour cette raison, G/D(G) est appelé l’abélianisé de G.) (ii) En prenant G := GLn (K), on sait que (sous les hypothèses énoncées) D(G) = SLn (K) et det passe au quotient en un isomorphisme de G/D(G) sur K ∗ . La conclusion en découle. I.6.5 Il suffit encore de démontrer que toute matrice de transvection est un commutateur d’éléments de SLn (K). Vu le choix de K , il existe a ∈ K ∗ tel que a 6= a−1 . Soit λ ∈ K . On pose −1 λ a b a 0 b := · Le commutateur des matrices et est la matrice de 0 a−1 0 a a − a−1 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 114 transvection T1,2 (λ). Le cas de T2,1 (λ) est laissé aux soins du lecteur. Puisque dans F2 le seul déterminant non nul possible est 1 , on a bien GL2 (F2 ) = SL2 (F2 ). Le fait que le groupe dérivé est un sous-groupe strict découle de l’identification avec le groupe symétrique sur 3 éléments (exercice I.6.11). Mais on peut également le voir comme suit : SL2 (F2 ) permute les trois éléments non nuls de F22 , le noyau de l’action est trivial et ce groupe a 6 éléments. Comme le groupe dérivé du groupe symétrique est évidemment formé de 1 1 permutations paires, ce n’est pas le groupe entier. Par exemple agit par transposition 0 1 et ne peut appartenir au groupe dérivé. I.6.6 On a évidemment (In , Ip ).A = A et : −1 (P ′ , Q′ ). (P, Q).A = P ′ P AQ−1 Q′ = (P ′ P )A(Q′ Q)−1 = (P ′ P, Q′ Q).A. On a bien une action de groupe. Le lecteur consciencieux vérifiera que la formule (P, Q).A := P AQ n’aurait pas fonctionné. La première assertion sur les orbites est tautologiquement équivalente à la définition des matrices équivalentes, et la deuxième aux résultats prouvés dans [L1]. I.6.8 L’application de la méthode indiquée donne la formule : n Y card Lr (E) = q r(r−1)/2 (q k − 1). k=n−r+1 On peut retrouver cette égalité par un raisonnement combinatoire. Le choix de e1 dans (e1 , . . . , er ) ∈ Lr (E) se fait dans E \ {0} , donc avec q n − 1 possibilités ; le choix de e2 , une fois e1 choisi, se fait dans E \ Ke1 , donc avec q n − q possibilités ; etc. Finalement : card Lr (E) = r−1 Y i=0 (q n − q i ). En sortant les puissances de q , on retrouve la formule précédente. La description du stabilisateur Hr donne immédiatement : card Hr = card Mr,n−r (K) card GLn−r (K) = q r(n−r) q (n−r)(n−r−1)/2 n−r Y k=1 (q k − 1) = q (n−r)(n+r−1)/2 n−r Y k=1 (q k − 1). Le cardinal de l’orbite Lr (E) est le quotient du cardinal de GL(E) par le cardinal du stabilisateur, d’où : q n(n−1)/2 card Lr (E) = n Q (q k − 1) k=1 n−r Q k q (n−r)(n+r−1)/2 (q k=1 ce qui est cohérent avec les calculs précédents. c Dunod 2014 − 1) = q r(r−1)/2 n Y (q k − 1), k=n−r+1 I.6 : Groupes classiques 115 I.6.9 Après choix d’un supplémentaire de F et d’une base adaptée (obtenue par juxtaposition d’une base B de F et d’un base C de son supplémentaire), on voit que le stabilisateur de F est formé des éléments (dont la matrice est) de la forme : A X MA,X,B := avec A ∈ GLr (K), X ∈ Mr,n−r (K), B ∈ GLn−r (K). 0 B La loi est donnée par la formule : MA,X,B MA′ ,X ′ ,B ′ = MAA′ ,AX ′ +XB ′ ,BB ′ . On munit F de la base B indiquée ci-dessus. L’élément MA,X,B agit sur F via la matrice A. Le noyau de l’action correspondante est le sous-groupe formé des matrices MIr ,X,B . On munit E/F de la base C image de la base C indiquée ci-dessus. L’élément MA,X,B agit sur E/F via la matrice B . Le noyau de l’action correspondante est le sous-groupe formé des matrices MA,X,In−r . On munit F × E/F de la base obtenue par juxtaposition de B et de C . L’élément MA,X,B agit sur F × E/F via la matrice MA,0,B . Le noyau de l’action correspondante est le sous-groupe formé des matrices MIr ,X,In−r . Il est isomorphe au groupe additif Mr,n−r (K). I.6.10 (i) On construit d’abord une base (e1 , . . . , en ) adaptée à F : notant di := dim Fi , cela signifie que (e1 , . . . , edi ) est une base de Fi pour 1 6 i 6 k . On part pour cela d’une base de F1 , que l’on étend en une base de F2 , etc. Un élément ϕ du stabilisateur G de F est caractérisé par la propriété suivante : si 1 6 j 6 di , alors ϕ(ej ) est combinaison linéaire de ϕ(e1 ), . . . , ϕ(edi ). La matrice de ϕ dans une base adaptée est donc caractérisée par la description de l’énoncé. On munit F1 de sa base (e1 , . . . , ed1 ) et, pour 2 6 i 6 k , chaque Fi /Fi−1 de la base image de la famille des ej tels que di−1 < j 6 di . On munit enfin grF de la base obtenue par juxtaposition. Soit g un élément de G, et soit M sa matrice dans la base (e1 , . . . , en ) ; notons M1 , . . . , Mk les blocs diagonaux de M dans la description ci-dessus. L’action de g sur grF a pour matrice dans la base décrite la matrice diagonale par blocs Diag(M1 , . . . , Mk ). L’élément g est dans le noyau de l’action si, et seulement si, ses blocs diagonaux sont les matrices identités de tailles d1 , d2 − d1 , . . . , dk − dk−1 , n − dk . (ii) Dans le cas d’un drapeau maximal, on a k = n et di = i , les blocs diagonaux décrits sont de taille 1 . Les stabilisateurs ont la forme matricielle Tsrn (K) et les noyaux des actions sur les gradués la forme Tsun (K). I.6.11 (i) Ici K ∗ = {1} , ce qui donne toutes les égalités d’un coup. (iii) Les trois vecteurs non nuls (1, 0), (0, 1) et (1, 1) sont deux à deux non liés, ils engendrent donc donc trois droites, dont les équations respectives sont y = 0 , x = 0 et x = y . Le groupe GL2 (F2 ) permute ces trois droites, d’où le morphisme indiqué. Ce morphisme est injectif, car un automorphisme qui fixe globalement une de ces droites fixe son unique élément non nul. Pour voir qu’il est surjectif, on peut comparer les cardinaux (formule de la proposition 24 de la page 85), ou bien exhiber un antécédent pour chaque transposition ; par 1 1 exemple, la matrice transpose (0, 1) et (1, 1). (La recherche des deux autres est 0 1 laissée au plaisir du lecteur.) c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 116 (ii) Tout commutateur d’éléments de Sn a pour signature 1 . Le groupe dérivé de Sn est donc inclus dans le groupe alterné. Le groupe dérivé de GL2 (F2 ) n’est donc pas SL2 (F2 ). t I.6.12 (i) L’application f 7→ f −1 est un morphisme de GL(E) dans GL(E ∗ ). L’application g 7→ ρ′ (g) est la composée de ce morphisme et du morphisme ρ de G dans GL(E). C’est donc bien un morphisme de G dans GL(E). (ii) C’est l’intersection des noyaux des ρ(g) − IdE , donc un sous–espace vectoriel ; il est stable puisque chacun de ces éléments est fixé. 1 P On suppose que N n’est pas nul dans K , et l’on note p := ρ(g). C’est un endomorN g∈G phisme de E , et, pour tout g0 ∈ G : 1 X 1 X 1 X ρ(g0 ) ◦ ρ(g) = ρ(g0 g) = ρ(g) = p, ρ(g0 ) ◦ p = N N N g∈G g∈G g∈G puisque g 7→ g0 g permute G. On en déduit, pour tout x ∈ E et pour tout g0 ∈ G, l’égalité ρ(g0 ) p(x) = p(x). Donc Im p ⊂ E G . De plus, si x ∈ E G , chacun des ρ(g)(x) est égal à x, donc p(x) = x et la restriction de p à E G est l’identité. C’est donc bien un projecteur sur EG . Pour le calcul de la dimension, il faut pouvoir identifier un entier à un élément de K . On doit donc supposer que K est de caractéristique nulle. Dans ce cas, la trace d’un projecteur est égale à la dimension de son image ([L1]). Alors, par linéarité de la trace : 1 X dim E G = Tr p = Tr ρ(g). N g∈G I.6.13 L’hypothèse sur ϕ est qu’il commute à chaque ρ(g). On sait alors que Ker ϕ et Im ϕ sont stables par chaque ρ(g), donc par G. Par hypothèse, chacun de ces deux sous–espaces vectoriels est nul ou égal à E . Donc ϕ est nul ou inversible. Pour tout λ ∈ K , l’endomorphisme ϕ − λ IdE vérifie les mêmes hypothèses. On prend pour λ une valeur propre (il y en a puisque le corps de base algébriquement clos) : alors ϕ − λ IdE est non inversible, donc nul. I.6.14 (i) Un sous-espace affine X ′ ⊂ X de direction E ′ ⊂ E contient Y si, et seulement s’il contient y0 et si E ′ contient les vecteurs y − y0 ( y ∈ Y ). L’équivalence demandée en découle. Dans le cas indiqué, les vecteurs y − y0 tels que y ∈ Y \ {y0 } engendrent E , d’où card Y − 1 = card (Y \ {y0 }) > dim E . (ii) Le groupe décrit est formé des transformations affines qui laissent invariant y0 et dont l’automorphisme vectoriel sous-jacent laisse invariant tous les vecteurs y−y0 ( y ∈ Y ), c’est-à-dire le sous–espace vectoriel E ′ qu’ils engendrent. On est donc conduit à démontrer l’équivalence suivante au sujet d’un sous–espace vectoriel E ′ ⊂ E : le sous-groupe de GL(E) formé des automorphismes triviaux sur E ′ est trivial si, et seulement si, E ′ = E . Mais c’est très facile. (Prendre un supplémentaire de E ′ .) c Dunod 2014 I.6 : Groupes classiques 117 A B Y et X = (blocs selon les tailles n et 1 ), la condition C D 1 nécessaire et suffisante pour que MA,B ∈ G est que, pour tout Y , CY + D = 1 . Cela équivaut à C = 0 ∈ M1,n (K) et D = 1 ∈ K . On a : MA,B MA′ ,B ′ = MAA′ ,AB ′ +B . Y AY + B (ii) On a : MA,B = . L’action de G sur K n est donc décrite par 1 1 MA,B .Y = AY + B : on reconnait bien GA(K n ). (Naturellement, les deux lois de composition coïncident.) (iii) est une simple traduction intrisèque de (ii) : choisir les coordonnées affines de telle sorte que H soit défini par l’équation xn+1 = 1 . I.6.15 (i) Écrivant MA,B = I.6.16 (1) On a : (y1 , . . . , yn−1 ) = x1 xi−1 xi+1 xn ,..., , ,..., xi xi xi xi , x1 xj−1 xj+1 xn (z1 , . . . , zn−1 ) = ,..., , ,..., . xj xj xj xj Pour relier ces deux égalités, on supposera que i < j (le cas i > j est symétrique, le cas i = j est trivial). Si 1 6 k 6 i − 1 : xk /xj zk xk yk = = = · xi xi /xj zi Si i 6 k 6 j − 2 : xk+1 xk+1 /xj zk+1 yk = = = · xi xi /xj zi Si k = j − 1 : xk+1 xk+1 /xj 1 yk = = = · xi xi /xj zi Si j − 1 6 k 6 n − 1 : xk+1 xk+1 /xj zk yk = = = · xi xi /xj zi Le lecteur trouvera de même l’expression de (z1 , . . . , zn−1 ) en fonction de (y1 , . . . , yn−1 ). (ii) Supposons que la carte Ui contienne x = [x1 : · : xn ] et x′ := [A]x = [x′1 : · : x′n ] et P soient y, y ′ leurs images dans K n−1 . On a x′j = aj,k xk . Si j < i : yj′ = x′j x′i i−1 n P P aj,k yk + aj,i + aj,k yk−1 P P aj,k xk aj,k xk /xi k=1 k=i+1 = P = P = i−1 · n P P ai,k xk ai,k xk /xi ai,k yk + ai,i + ai,k yk−1 k=1 Si j > i : yj′ = x′j+1 x′i P P aj+1,k xk aj+1,k xk /xi = P = P = ai,k xk ai,k xk /xi i−1 P k=i+1 aj+1,k yk + aj+1,i + k=1 i−1 P k=1 ai,k yk + ai,i + n P aj+1,k yk−1 k=i+1 n P ai,k yk−1 · k=i+1 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 118 I.6.17 (i) Si SLn (K) était ouvert, toutes les matrices (1 + ε)In pour ε assez petit seraient de déterminant 1 , ce qui est faux. Ce groupe n’est donc pas ouvert. Comme le déterminant est continu, la condition det M > 0 définit un ouvert de Mn (R), et c’est GL+ n (R). (ii) Le groupe GLn (K) n’est pas borné car il contient toutes les matrices aIn avec a ∈ K ∗ . (iii) Le sous-ensemble Tsrn (K) de l’espace vectoriel Tn (K) est défini par la condition det 6= 0 , il est donc ouvert dans Tn (K). Il est dense car il suffit de perturber un tout petit peu la diagonale d’un élément pour le rendre inversible. Il n’est donc pas fermé puisqu’il n’est 1 pas égal à Tn (K) tout entier. (Autre argument : car il contient les In , p > 1 et pas leur limite p 0 ). Il n’est pas borné car il contient toutes les aIn avec a ∈ K ∗ . Il n’est pas d’intérieur vide, car il contient toutes les matrices de Tn (K) suffisamment proches de In . Il est non connexe pour K := R (signe du déterminant), et connexe pour K := C, ce que le lecteur prouvera par les mêmes méthodes que dans le cours. Le sous-ensemble Tsun (K) de Tn (K) est fermé car défini par les équations ai,i = 1 . Comme il n’est pas égal à Tn (K) tout entier, il n’est donc pas dense. Il est pas d’intérieur vide (donc pas ouvert) car il ne contient aucune matrice (1 + ε)In pour ε assez petit. Il n’est pas borné car les coefficients au dessus de la diagonale sont arbitraires. Il est connexe, car c’est un espace affine. I.6.18 La condition à réaliser est : ∀p > 1 , ∀i 6= j ∈ [[1, n]] , ai − aj 6= p(λj − λi ). On fixe a1 arbitrairement ; puis a2 arbitrairement dans le complémentaire d’un ensemble dénombrable ; etc. I.6.19 On écrit : (A + H)(B + K) − AB − (AK + HB) = HK = o(H, K), et l’on voit que l’application produit est différentiable et que sa différentielle en (A, B) est l’application linéaire (H, K) 7→ AK + HB de Mn (K) × Mn (K) dans Mn (K). On écrit : (A + H)2 − A2 − (AH + HA) = H 2 = o(H), et l’on voit que l’application carré est différentiable et que sa différentielle en A est l’application linéaire H 7→ AH + HA de Mn (K) dans Mn (K). I.6.20 On écrit le théorème de Cayley-Hamilton sous la forme : Dn + a1 Dn−1 + · · · + an In = 0 , 1 avec an = (−1)n det D 6= 0 . Alors D−1 = − (Dn−1 + a1 Dn−2 + · · · + an−1 In ) est un an polynôme en D , donc en B . I.6.21 (i) Le morphisme det : On (R) → {+1, −1} , resp. det : Un (C) → U est surjectif (le vérifier avec des matrices diagonales) et de noyau SOn (R), resp. SUn (C). c Dunod 2014 I.6 : Groupes classiques 119 (ii) Toute matrice orthogonale est de la forme ±A, où A ∈ SOn (R) (car n impair) et l’application (A, ε) 7→ εA est un isomorphisme de SOn (R) × {+1, −1} dans On (R). Si n est pair, cette application n’est ni injective ni surjective, mais cela prouve seulement que l’argument précédent ne s’applique pas, ce qui ne suffit pas à mettre en défaut la conclusion. Cependant, on a en général Z(G × H) = Z(G) × Z(H) (vérification facile laissée au lecteur). Le centre de On (R) a toujours 2 éléments, alors que le centre de SOn (R) × {+1, −1} a ici 4 éléments. I.6.22 Soit U une matrice de Un (C) diagonalisable dans une base orthonormale et dont toutes les valeurs propres sont distinctes. Si U ′ ∈ Un (C) commute avec U , il est diagonalisables dans la même base. Un élément du centre est donc diagonalisable dans toute base orthonormale, donc toutes les directions lui sont propres, c’est donc une matrice scalaire, et, bien sûr, son rapport doit être dans U. L’argument s’applique de même à SUn (C), et la conclusion est que le centre est formé des matrices scalaires dont le rapport est dans µn (racines n èmes de l’unité). Le centre U de Un (C) n’est pas isomorphe au centre µn × U de SUn (C) × U car le sousgroupe des éléments tels que xn = 1 est µn dans le premier et µn × µn dans le second. Donc Un (C) n’est pas isomorphe à SUn (C) × U. I.6.23 La première assertion découle de l’algorithme de Gram-Schmidt modifié pour les espaces préhilbertiens complexes. Pour la seconde, on est ramené à prouver que, si Q ∈ Un (C) est triangulaire supérieure à éléments diagonaux réels positifs, alors Q = In : comme dans le cas réel, cela se prouve colonne après colonne (de 1 à n). I.6.24 Une fois connue la factorisation QR réelle, il suffit de prouver que toute matrice R réelle triangulaire supérieure à éléments diagonaux positifs admet une unique décomposition R = DT , où D est diagonale à coefficients strictement positifs et où T ∈ Tsun (R). Mais c’est évident (et D est la diagonale de R ). I.6.25 Il est clair que l’application A 7→ A2 envoie bien Hn++ (C) dans lui-même. Si B ∈ Hn++ (C) est de la forme A2 avec A ∈ Hn++ (C), les matrices A et B commutent donc sont codiagonalisables dans une base orthonormale : B = P DP −1 , A = P CP −1 , avec P unitaire, D = Diag(µ1 , . . . , µn ), les µi ∈ R∗+ et C = Diag(λ1 , . . . , λn ), les λi ∈ R∗+ . √ Comme A2 = B ⇔ C 2 = D , il y a une unique possibilité qui consiste à prendre λi := µi . On a donc établi que l’application A 7→ A2 est une bijection de Hn++ (C) dans lui-même. Soit M ∈ GLn (C). On applique ce qui précède à B := M ∗ M qui est bien dans Hn++ (C). On écrit donc M ∗ M = H 2 , avec H ∈ Hn++ (C), puis U := M H −1 . Il est immédiat que U ∈ Un (C), d’où l’existence de la décomposition. La preuve de l’unicité se ramène à vérifier que Un (C) ∩ Hn++ (C) = {In } . Or, toute matrice de l’intersection est orthodiagonalisable avec valeurs propres dans U ∩ R∗+ = {1} . I.6.26 On supposera que dim E > 2 , le cas où dim E 6 1 étant laissé à la patience du lecteur. Pour que l’ensemble Ta,b,c (E) soit non vide, il est nécessaire, en vertu de l’inégalité du triangle, c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 120 que l’on ait les trois inégalités : a 6 b + c, b 6 a + c et c 6 a + b . Ces trois inégalités sont équivalentes à l’encadrement : |a − b| 6 c 6 a + b (la minoration correspond aux deux premières inégalités). Si réciproquement les réels a, b, c satisfont ces inégalités, on peut se placer dans le plan complexe et chercher z ∈ U (i.e. de norme 1 ) tel que |a + bz| = c, ce qui équivaut à 2ab Re(z) = c2 − a2 − b2 . Selon l’hypothèse, le membre droit est compris entre 2ab et −2ab et donc de la forme 2ab cos z , et u := eit convient. Alors les vecteurs u := a et v := bz conviennent. Le triangle de côtés a, b, c est donc réalisable dans tout plan euclidien, donc dans E . Pour la question de la transitivité, on suppose d’abord que dim E = 2 et l’on identifie E au plan complexe muni de sa structure euclidienne (tous les plans euclidiens sont isomorphes entre eux). On fixe le triangle déterminé ci-dessus. On ne fera le raisonnement que dans le cas “générique” ab 6= 0 , laissant à la patience du lecteur les cas particuliers manquants. Soit alors un autre triangle u′ , v ′ , u′ + v ′ de longueurs a, b, c. On a donc u′ = aα et v ′ = bzβ , où α, β ∈ U. La troisième condition de longueur donne : |aα + bzβ| = c, d’où |a + bzγ| = c, en notant γ := βα−1 , d’où encore a2 + 2ab Re(zγ) + b2 = c2 . Puisque ab 6= 0 , on a Re(zγ) = Re(z). Comme il s’agit de complexes de module 1 , cela implique que zγ = z ou zγ = z . Dans le premier cas, le triangle u′ , v ′ , u′ + v ′ est obtenu à partir du triangle u, v, u + v par la rotation de complexe α ; dans le second cas, par la même rotation suivie d’une symétrie. De plus, sauf pour des valeurs particulières, on ne peut pas choisir : l’action de O(E) est donc transitive, mais pas celle de SO(E). Lorsque dim E > 3 , deux triangles étant donnés, chacun est contenu dans un plan de E . De plus, deux plans étant donnés, il existe un élément de SO(E) amenant l’un sur l’autre, et aussi un élément de O(E) \ SO(E). On déduit donc du premier cas examiné que l’action de SO(E) sur Ta,b,c (E) est transitive. I.6.27 (i) En généralisant le cas de S 2 , on trouve facilement : (cos t1 · · · cos tn−1 , cos t1 · · · cos tn−2 sin tn−1 , cos t1 · · · cos tn−3 sin tn−2 , . . . , cos t1 sin t2 , sin t1 ). (ii) Écrivons (λ, µ) la première ligne d’un élément A de GL2 (C). Pour que la deuxième ligne lui soit orthogonale (pour le produit hermitien canonique de C2 ), il faut, et il suffit, qu’elle soit de la forme u(−µ, λ) avec u ∈ C. Pour que les deux lignes soient de norme 1 (i.e. pour que A soit unitaire), il faut, et il suffit, que u ∈ U et |λ|2 + |µ2 | = 1 . Pour que A soit spéciale unitaire, il faut, et il suffit, que l’on ait de plus u = 1 : on a donc bien la description demandée de SU2 (C). L’application qui à A associe sa première ligne est un homéomorphisme de SU2 (C) sur {(λ, µ) ∈ C2 | |λ|2 + |µ2 | = 1} . L’appplication (λ, µ) 7→ (Re λ, Re µ, Im λ, Im µ) est un homéomorphisme de ce dernier ensemble sur S 3 . Enfin, toutes les sphères S n (pour n > 1 ) sont connexes par arcs : en effet, le point (cos t1 · · · cos tn−1 , cos t1 · · · cos tn−2 sin tn−1 , cos t1 · · · cos tn−3 sin tn−2 , . . . , cos t1 sin t2 , sin t1 ) peut être relié au point (1, 0, . . . , 0) par le chemin : t 7→ (cos tt1 · · · cos ttn−1 , cos tt1 · · · cos ttn−2 sin ttn−1 , cos tt1 · · · cos ttn−3 sin ttn−2 , . . . , cos tt1 sin tt2 , sin tt1 ). c Dunod 2014 I.6 : Groupes classiques 121 I.6.28 1) Le fait que (Ok )k∈N admet une sous-suite convergente est conséquence directe de la compacité de On (R). Toute sous-suite convergente de (Ok )k∈N converge vers un élément O′ de On (R), et la sous-suite correspondante de (Sk )k∈N conversge alors vers un élément S ′ −1 de Sn+ (R), qui est égal à O′ A ∈ GLn (R), donc appartient en fait à Sn++ (R). L’égalité A = O′ S ′ est donc la décomposition polaire de A, et, par unicité d’icelle, on a bien O′ = O et S ′ = S . 2) Si une suite (un ) d’un espace vectoriel normé admet une sous-suite convergente et si toute sous-suite convergente admet la même limite u , alors la suite (un ) converge vers u , ce qui justifie la première assertion. L’application A 7→ (O, S) est donc continue, ce qui constitue la partie manquante de la preuve de la proposition 28 de la page 287. I.6.29 Notons J := l’égalité : 0 1 −1 0 . C’est une matrice diagonalisable de valeurs propres ±i, d’où J = P DP −1 , On en déduit immédiatement : où D := Diag(i, −i). exp(aJ) = P Diag(eia , e−ia )P −1 = P (cos aI2 + sin aD)P −1 cos a − sin a = cos aI2 + sin aJ = . sin a cos a I.6.30 La première assertion découle du théorème 21 de la page 281 et de l’exercice I.6.29 de la page 310. De même, les deux autres assertions découlent du théorème 113 de la page 204 et du fait que la matrice P Diag(iθ1 , . . . , iθn )P −1 , où P est unitaire et les θi réels, est dans un (C), et même P dans sun (C) si θi = 0 . I.6.31 (i) Soit ϕ un tel automorphisme. On identifie E à R4 avec q(x, y, z, t) = x2 +y 2 +z 2 −t2 . p L’hypothèse dit que q ′ := q ◦ ϕ s’annule pour t = ± x2 + y 2 + z 2 . Mais q ′ est un polynôme homogène du second degré, que l’on peut écrire : q ′ (x, y, z, t) = αt2 + β(x, y, z)t + γ(x, y, z), où α ∈ R, où β est une forme linéaire et où γ est est un polynôme homogène du second degré p p en x, y, z . On remplace successivement t par x2 + y 2 + z 2 puis par − x2 + y 2 + z 2 , et l’on conclut que β est nulle, puis que γ(x, y, z) = −α(x2 +y 2 +z 2 ), d’où enfin : q◦ϕ = −αq . Notons F le sous–espace vectoriel (t = 0) de E . Le sous–espace vectoriel F ∩ ϕ−1 (F ) est au moins de dimension 2 . Tout u 6= 0 de ce sous–espace vectoriel est tel que q(u) > 0 et √ q ′ (u) > 0 : on a donc −α > 0 . Posant a := −α et ψ := a−1 ϕ, on voit que ϕ = aψ et que q ◦ ψ = ψ , autrement dit, ψ est q -orthogonal. (ii) La condition q(u) < 0 entraîne q(λu) = λ2 q(u) < 0 , d’où la première assertion (on ne considère que les homothéties non triviales). Sur C , on a t2 > x2 + y 2 + z 2 , donc t 6= 0 , et C + et C − ne peuvent être inclus dans la même composante connexe. On va montrer que C + est convexe, donc C − = −C + également, ce qui entrainera leur connexité par arcs et la c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 122 conclusion. Soient maintenant u := (x, y, z, t) et u′ := (x′ , y ′ , z ′ , t′ ) deux éléments de C + et α, α′ > 0 tels que α + α′ = 1 . Alors : 2 q(αu + α′ u′ ) = α2 q(u) + α′ q(u′ ) + 2αα′ (xx′ + yy ′ + zz ′ − tt′ ). On applique l’inégalité de Cauchy-Schwarz : 2 2 2 2 (xx′ + yy ′ + zz ′ )2 6 (x2 + y 2 + z 2 )(x′ + y ′ + z ′ ) < t2 t′ =⇒ xx′ + yy ′ + zz ′ < tt′ , puisque t, t′ > 0 . On a donc bien q(αu + α′ u′ ) < 0 . (iii) Notons plutôt s ∈ [0, 1] la variable, et γ ′ (s) = x(s), y(s), z(s), t(s) . Il s’agit de démontrer : Z 1 Z 1 . ∀s ∈ [0, 1] , t(s) > x(s), y(s), z(s) 2 =⇒ t(s) ds > t(s) x(s), y(s), z(s) ds 0 0 2 3 Mais cela découle de l’inégalité des accroissements finis pour les fonctions à valeurs dans R . 2 2 I.6.32 Soit A ∈ SO1,1 (R). Ses lignes sont de normes respectives z 2 − t2 = 1 et z ′ − t′ = −1 , donc respectivement de la forme (cosh a, sinh a) et (sinh b, cosh b). L’orthogonalité des lignes dit que zz ′ −tt′ = 0 , c’est-à-dire cosh a sinh b−sinh a cosh b = 0 , d’où, en vertu des formules d’addition, sinh(b − a) = 0 , donc a = b . On a les formules : ( z = (cosh a)z ′ + (sinh a)t′ , t = (sinh a)z ′ + (cosh a)t′ . z L’origine du second repère vérifie z ′ = 0 , donc, vue du premier repère, U := = tanh a. t Un point mobile z ′ = V t′ du second repère vérifie alors : z (cosh a)V t′ + (sinh a)t′ (cosh a)V + (sinh a) V + (tanh a) U +V = = = = · t (sinh a)V t′ + (cosh a)t′ (sinh a)V + (cosh a) (tanh a)V + 1 1 + UV (Cette loi d’addition est écrite en posant c := 1 .) I.6.33 Il suffit d’interpréter les transvections et les dilatations de GL2 (K) en termes d’homographies. La dilatation D1 (λ) correspond à x 7→ λx, ainsi que D2 (λ−1 ). La transvection T1,2 (1) correspond à x 7→ x + 1 , et T1,2 (α) lui est conjuguée par une dilatation. La transvection T2,1 (1) correspond à x 7→ 1/(x + 1), qui est composée de x 7→ 1/x par x 7→ x + 1 , et T2,1 (α) lui est conjuguée par une dilatation. ax + b . cx + d Si ∞ est point fixe, on a c = 0 et a 6= 0 . Si a = d, on a une translation et ( g étant supposée b non triviale), ∞ est le seul point fixe ; sinon, le seul autre point fixe est · d−a Si c 6= 0 , les points fixes de sont les racines complexes de cx2 + (d − a)x − b = 0 : il y en a une ou deux. Si l’homographie a un seul point fixe, à conjugaison près, on peut supposer que c’est ∞. On a vu que l’on a alors une translation x 7→ x+α non triviale, et celle-ci est conjuguée à x 7→ x+1 I.6.34 Notons g l’homographie x 7→ c Dunod 2014 I.6 : Groupes classiques 123 par une homothétie. Si l’homographie a deux points fixes, à conjugaison près, on peut supposer que ce sont 0 et ∞. On a donc c = b = 0 et c’est bien la forme x 7→ qx, avec q 6= 0 (ce ne serait pas une homographie) et q 6= 1 (elle serait triviale). Le lecteur démontrera que x 7→ qx et x 7→ q ′ x sont conjuguées si, et seulement si, q ′ = q ou q ′ = q −1 . (Étudier l’effet de la conjugante sur 0 et ∞.) I.6.35 Sur tout corps, les points 0, 1, ∞ sont distincts. Sur le corps à deux éléments, ce sont les seuls. I.6.36 L’orbite de 0 et de 1 est {0, 1, ∞} . Si x 6= 0, 1 , son orbite est {x, 1/x, 1−x, x/(x−1), 1/(1−x), 1−1/x} ; c’est une partie de K . Elle a en général six éléments. Les seules exceptions sont l’orbite {−1, 2, 1/2} (si K n’est pas de caractéristique 2 ) et, si K contient une racine cubique non triviale j de l’unité, {−j, −j 2 } . Notons d’ailleurs que, si K est de caractéristique 3 , l’orbite {−1, 2, 1/2} n’a qu’un élément ! I.6.37 Il s’agit de combiner les trois transpositions du texte. On trouve : [α, β, γ, δ] = [α, β, γ, δ] , [α, β, δ, γ] = 1/ [α, β, γ, δ] , [α, γ, β, δ] = 1 − [α, β, γ, δ] , [α, γ, δ, β] = 1/(1 − [α, β, γ, δ]), [α, δ, β, γ] = 1 − 1/ [α, β, γ, δ] , [α, δ, γ, β] = [α, β, γ, δ] /([α, β, γ, δ] − 1), [β, α, γ, δ] = 1/ [α, β, γ, δ] , [β, α, δ, γ] = [α, β, γ, δ] , [β, γ, α, δ] = 1 − 1/ [α, β, γ, δ] , [β, γ, δ, α] = [α, β, γ, δ] /([α, β, γ, δ] − 1), [β, δ, α, γ] = 1 − [α, β, γ, δ] , [β, δ, γ, α] = 1/(1 − [α, β, γ, δ]), [γ, α, β, δ] = 1/(1 − [α, β, γ, δ]), [γ, α, δ, β] = 1 − [α, β, γ, δ] , [γ, β, α, δ] = [α, β, γ, δ] /([α, β, γ, δ] − 1), [γ, β, δ, α] = 1 − 1/ [α, β, γ, δ] , [γ, δ, α, β] = [α, β, γ, δ] , [γ, δ, β, α] = 1/ [α, β, γ, δ] , [δ, α, β, γ] = [α, β, γ, δ] /([α, β, γ, δ] − 1), [δ, α, γ, β] = 1 − 1/ [α, β, γ, δ] , [δ, β, α, γ] = 1/(1 − [α, β, γ, δ]), [δ, β, γ, α] = 1 − [α, β, γ, δ] , [δ, γ, α, β] = 1/ [α, β, γ, δ] , [δ, γ, β, α] = [α, β, γ, δ] . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 124 Pour simplifier la lecture, on peut poser x := [α, β, γ, δ] et écrire plutôt : [α, β, γ, δ] = x, [α, β, δ, γ] = 1/x, [α, γ, β, δ] = 1 − x, [α, γ, δ, β] = 1/(1 − x), [α, δ, β, γ] = 1 − 1/x, [α, δ, γ, β] = x/(x − 1), [β, α, γ, δ] = 1/x, [β, α, δ, γ] = x, [β, γ, α, δ] = 1 − 1/x, [β, γ, δ, α] = x/(x − 1), [β, δ, α, γ] = 1 − x, [β, δ, γ, α] = 1/(1 − x), [γ, α, β, δ] = 1/(1 − x), [γ, α, δ, β] = 1 − x, [γ, β, α, δ] = x/(x − 1), [γ, β, δ, α] = 1 − 1/x, [γ, δ, α, β] = x, [γ, δ, β, α] = 1/x, [δ, α, β, γ] = x/(x − 1), [δ, α, γ, β] = 1 − 1/x, [δ, β, α, γ] = 1/(1 − x), [δ, β, γ, α] = 1 − x, [δ, γ, α, β] = 1/x, [δ, γ, β, α] = x. Les permutations qui ne modifient pas le birapport sont donc : (α, β, γ, δ), (β, α, δ, γ), (γ, δ, α, β) et (δ, γ, β, α). I.6.38 Le groupe des six homographies qui apparaissent ci-dessus a été identifié à S3 via son action sur {0, 1, ∞} . On obtient donc un morphisme de S4 dans S3 . Ce morphisme est surjectif (les six homographies apparaissent) et son noyau est constitué de l’identité et des produits de deux transpositions à support disjoint, qui forment donc un sous-groupe distingué de S4 . I.6.40 Puisque le groupe des homographies qui laissent invariant H est PSL2 (R) (loc. cit.), le ◦ groupe des homographies qui laissent invariant D(0, 1) est son conjugué g0 PSL2 (R)g0−1 par z−i 1 −i l’homographie g0 : z 7→ . Le conjugué G0 SL2 (R)G−1 par G := est le 0 0 1 i z+i groupe formé des matrices : a b u v −1 G0 G0 = , c d v u c Dunod 2014 I.6 : Groupes classiques 125 a+d b−c a−d b+c + i et v := − i sont tels que |u|2 − |v|2 = ad − bc = 1 . 2 2 2 2 z−α u L’homographie correspondante est bien z 7→ θ , avec θ := ∈ U et 1 − αz u ◦ v α := − ∈ D(0, 1) . On laisse le soin au lecteur de montrer réciproquement qu’un tel couple u (θ, α) provient bien d’un tel couple (u, v). où u := ◦ I.6.41 Il s’agit en fait de déterminer les « droites hyperboliques de D(0, 1) ». Dans tous les cas, l’image par une homographie d’une droite ou d’un cercle est une droite ou un cercle ; les angles sont préservés ; la frontière R est envoyée bijectivement sur la frontière (le cercle unité) privé de 1 , qui est l’image du point à l’infini. Si l’on part d’une demi-droite verticale d’abcisse x, on obtient donc un arc de cercle orthogonal x−i et 1 . Cas particulier : si x = 0 , au cercle unité et de points limites (sur le cercle unité) x+i c’est le diamètre horizontal. Si l’on part d’un demi-cercle de points limites x, y , on obtient un arc de cercle orthogonal x−i y−i au cercle unité et de points limites (sur le cercle unité) et . Cas particulier : si x+i y+i xy = −1 , ces points limites sont opposés et l’on a encore un diamètre. Remarquons que les diamètres, qui passent par 0 , sont les images des droites hyperboliques passant par i. I.6.42 (i) La longueur minimum d(z, z ′ ) est bien définie d’après le cours. On peut même affiner la définition en autorisant les chemins de classe C 1 par morceaux ; le raisonnement du texte se transpose et l’on voit que l’on obtient la même chose qu’avec des chemins C 1 . Cela permet de démontrer l’inégalité triangulaire pour d : le plus court chemin de z à z ′′ est évidemment plus court que la juxtaposition du plus court chemin de z à z ′ et du plus court chemin de z ′ à z ′′ . Les deux autres propriétés d’une distance (positivité, symétrie) sont évidentes. (ii) D’après le premier exemple de la page 304, il suffit de démontrer qu’un tel couple peut être amené sur (i, el i), mais cela découle des arguments du paragraphe 3.2.3. I.6.43 Supposons d’abord que ∆ est une demi-droite verticale d’abcisse a. On trouve alors la demi-droite verticale passant par M , et tous les demi-cercles de centre réel passant par M et dont un point limite sur R est compris entre a et l’abcisse de M . Noter que la valeur a est autorisée. Si ∆ est un demi-cercle dont les points limites sur R sont a < b , et si l’abcisse de M est c, il faut distinguer deux cas : si c 6∈ [a, b], la demi-droite verticale passant par M est une telle parallèle, sinon, elle ne l’est pas. Pour le reste, il s’agit de déterminer les demi-cercles de centre réel passant par M et ne coupant pas le demi-cercle ∆, ce qui est un joli exercice de géométrie élémentaire et laissé au lecteur. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 126 Module I.7 : Polynômes à plusieurs indéterminées I.7.1 Si n = 1 , il est nul et, si n = 2 , il est engendré par X2 − X1 ; dans ces deux cas, il est donc principal. Si n > 3 , il contient X3 − X2 et X2 − X1 qui sont premiers entre eux. S’il était principal, il serait égal à K[X1 , . . . , Xn ], ce qui n’est point (car il est inclus dans l’idéal maximal engendré par les Xi ). En conclusion, l’idéal <(Xi − Xj )16i,j6n > de K[X1 , . . . , Xn ] est principal si, et seulement si, n 6 2 . I.7.2 (i) On observe d’abord que tout P ∈ K[X1 , . . . , Xn ] admet une unique écriture : P = (X1k − X1 )Q1 + · · · + (Xnk − Xn )Qn + Qn+1 , où le degré de chaque Qi en chaque Xj avec j < i est strictement inférieur à k . En effet, il suffit d’effectuer la division euclidienne de P (considéré comme polynôme en X1 ) par le polynôme unitaire X1k − X1 ∈ K[X2 , . . . , Xn ][X1 ], ce qui donne comme quotient Q1 et comme reste P1 , puis d’effectuer la division euclidienne de P1 (considéré comme polynôme en X2 ) par le polynôme unitaire X2k − X2 ∈ K[X1 , X3 , . . . , Xn ][X2 ], ce qui donne comme quotient Q2 et comme reste P2 , etc. Les conditions sur les degrés viennent en remarquant que, si degXj Pi < k pour j 6 i , alors degXj Qi+1 < k et degXj Pi+1 < k pour j 6 i , la condition degXi+1 Pi+1 < k découlant de plus de la division euclidienne. Ce résultat étant acquis, on voit de plus que P ∈ Ek si, et seulement si, Q1 = · · · = Qn = 0 . Par ailleurs, tout polynôme P ∈ Ik s’écrit a priori P = (X1k − X1 )Q1 + · · · + (Xnk − Xn )Qn sans condition sur les Qi . En effectuant la division euclidienne de Q2 , . . . , Qn par X1k − X1 , on peut leur imposer d’avoir un degré en X1 strictement inférieur à k (pour cela, on incorpore les quotients dans Q1 ) ; de même, en effectuant la division euclidienne de Q3 , . . . , Qn par X2k − X2 , on peut leur imposer d’avoir un degré en X2 strictement inférieur à k (pour cela, on incorpore les quotients dans Q2 ) ; etc. On retrouve alors la forme vue plus haut, mais avec Qn+1 = 0 . On en conclut donc qu’un polynôme P écrit sous cette forme est dans Ik si, et seulement si, Qn+1 = 0 . Jointe à l’équivalence déjà obtenue, cette dernière entraîne que Ik et Ek sont des sous–espaces vectoriels supplémentaires de K[X1 , . . . , Xn ]. Une base de K[X1 , . . . , Xn ]/Ik est donc formée des monômes xα tels que α1 , . . . , αn ∈ [[0, k − 1]] . On note bien entendu xi := Xi (mod Ik ) les classes des Xi dans A := K[X1 , . . . , Xn ]/Ik . La dimension de K[X1 , . . . , Xn ]/Ik est donc le nombre de n-uplets d’entiers de [[0, k − 1]], soit k n . (ii) Dans le cas où k = 2 , chaque monôme xα de cette base est de la forme xE , où E := {i ∈ [[1, n]] | αi = 1} . Les xE forment donc bien une base de A. Puisque x2i = xi , la règle de multiplication dans cette base est la suivante : ∀E, F ∈ P [[1, n]] , xE xF = xE∪F . I.7.3 (i) Chaque xi étant idempotent, il en est de même de 1 − xi (si x2 = x, alors (1 − x)2 = 1 − 2x + x2 = 1 − 2x + x = 1 − x). Les produits d’idempotents étant évidemment idempotents, les uE sont des idempotents de A. n Q En développant l’identité xi + (1 − xi ) = 1 , on obtient la relation désirée : i=1 X E∈P [[1,n]] c Dunod 2014 uE = 1. I.7 : Polynômes à plusieurs indéterminées 127 Si E 6= F , il y a par exemple un indice i ∈ E \ F . Alors xi est un facteur de uE et 1 − xi un facteur de uF . Comme xi (1 − xi ) = 0 , on a bien uE uF = 0 . Notons d’abord que les uE ne sont pas nuls : de la définition, il ressort en effet que uE = xE + ′ une combinaison linéaire de xE tels que E ′ contient strictement E . Puisque la famille des uE a le même nombre d’éléments que la base des xE , il suffit, pour prouver que c’est une base, de P vérifier qu’elle est libre. Mais, si λE uE = 0 , en multipliant par un uE particulier, on trouve λE uE = 0 , donc λE = 0 (puisque l’on a vu que uE 6= 0 ). P Tout a ∈ A s’écrit donc a = λE uE , et, multipliant encore par un uE particulier, on voit que la composante de a dans KuE est λE uE = auE . Fixons E ⊂ [[1, n]]. Si E ⊂ F , on a xE uF = uF car tous les facteurs xi de xE sont facteurs de uF et idempotents. Si E 6⊂ F , il existe un facteur xi de xE tel que 1 − xi est facteur de P uF (prendre i ∈ E \ F ), donc xE uF = 0 . Partant de la relation uF = 1 , on calcule alors : X X xE = xE uF = uF . F ∈P [[1,n]] F ∈P [[1,n]] F ⊃E Réciproquement, il suffit de développer la formule définissant uE pour obtenir la formule : X uE = (−1)card F −card E xF . F ∈P [[1,n]] F ⊃E L’écriture de de xi = x{i} dans la base des uE est : xi = P E∋i Alors : auE = n X X uF uE = i=1 F ∋i d’où : n X X uE . Notons a := x1 + · · · + xn . uE = (card E)uE , i=1 E∋i a= X (card E)uE . E Les uE étant des idempotents orthogonaux, on en tire : X ak = (card E)k uE . E Enfin, l’écriture dans la base de départ s’obtient en combinant les égalités précédentes : X X ak = (card E)k (−1)card F −card E xF E = X F ⊃E card F (−1) F = X F X (−1) E⊂F card F (−1) card E card XF m=0 k (card E) ! xF ! card F mk xF (−1) m m (ii) Le jeu consiste à tirer au hasard des entiers (coupons) dans [[1, n]] ; après k tirages, combien d’entiers distincts a-t’on tiré ? L’ensemble des entiers qui ont été tirés après k tirages est la (k) valeur prise par une certaine variable aléatoire. Notons pE la probabilité que cet ensemble c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 128 (k) (k+1) soit un certain E ⊂ [[1, n]]. Les relations qui relient les pE et les pE une égalité dans A : X (k+1) x1 + · · · + xn X (k) E pE xE = pE x . n E sont résumées par E On en déduit qu’après k tirages : X (k) pE xE E = x1 + · · · + xn n k = 1 k a . nk On peut à partir de la retrouver tous les résultats déjà obtenus, et bien d’autres. Par exemple, on a: X (k) X card E k E pE x = uE , n E d’où l’on déduit que P E (k) pE xE E tend vers u[[1,n]] = x[[1,n]] lorsque k → +∞, c’est à dire que la probabilité que l’on ait tiré tous les entiers tend vers 1 , avec une erreur en O n−1 n k . I.7.4 La preuve se fait par récurrence sur n. Pour n = 1 , le déterminant est X1,1 et l’irréductibilité est évidente. Soit n > 2 . Le développement du déterminant le long de la dernière ligne ou de la dernière colonne donne une égalité de la forme Detn = aXn,n + b , où a, b sont des éléments de l’anneau A des polynômes en tous les Xi,j tels que (i, j) 6= (n, n). De plus, a = Detn−1 , qui est irréductible dans A (hypothèse de récurrence). Or, sur un anneau intègre A, les seules réductions possibles de aX + b ont la forme c(a′ X + b′ ), où c ∈ A est un diviseur commun de a et b . Dans notre cas, pour que la réduction soit non triviale, il faut, et il suffit, que a divise b , ou encore que Detn divise Detn−1 . Mais cela entrainerait que, pour toute matrice M dont le premier mineur principal a un déterminant nul, on a det M = 0 . Un contre-exemple est donné, P par exemple, par la matrice Ei,n+1−i ayant des 1 sur la diagonale non principale et des 0 ailleurs. I.7.5 Notons Cn le déterminant de Cauchy. C’est une fraction rationnelle de dénominateur Q Bn := (Xi + Yj ) et dont le numérateur est un polynôme homogène An de degré 16i,j6n 1 a deux lignes ou deux colonnes égales dès que Xi + Yj l’on substitue Xi := Xi′ avec i 6= i′ ou Yj := Yj ′ avec j 6= j ′ , le déterminant s’annule sous les mêmes conditions, donc aussi An , qui est nécessairement divisible par tous les Xi − Xi′ et Yj − Yj ′ , donc par leur produit : Y Y An = cA′n , où A′n := (Xi − Xi′ ) (Yj − Yj ′ ). total n2 − n. Comme la matrice des 16i<i′ 6n 16j<j ′ 6n Par comparaison des degrés, on voit de plus que c ∈ K . Il reste à déterminer cette constante. Pour cela, on substitue 1/2 + i/T à Xi et 1/2 − j/T à Yj . La matrice obtenue est de la forme In + M , où M ∈ Mn K(T ) à tous ses coefficients nuls en T = 0 . La fraction rationnelle c Dunod 2014 I.7 : Polynômes à plusieurs indéterminées 129 F (T ) obtenue par la substitution précédente au déterminant de Cauchy vaut donc 1 en T = 0 . Par ailleurs : Y Y (1/2 + i/T )− (1/2 + i′/T ) (1/2 − j/T )− (1/2 − j ′/T ) = aT −n(n−1) , 16i<i′ 6n où a := 16j<j ′ 6n Q (i − i′ ) 16i<i′ 6n Y Q (1/2+i/T +1/2−j/T ) = 16i,j6n où b0 := (j ′ − j) et : 16j<j ′ 6n Y 16i6=j6n Q 16i6=j6n (T +i−j) T −n(n−1) = (b0 +b1 T +· · · )T −n(n−1) , (i − j). La valeur prise en T = 0 par la fraction rationnelle obtenue par les mêmes substitutions dans A′n a est donc = 1 , et c = 1 . Bn′ b0 I.7.6 Une relation différentielle algébrique d’ordre 0 satisfaite par sin est un polynôme P ∈ R[X0 ] tel que P (sin) = 0 , autrement dit, ∀x ∈ R , P (sin x) = 0 , ce qui entraîne P = 0 (l’image de sin étant infinie). L’idéal des relations différentielles algébriques d’ordre 0 satisfaites par sin est donc l’idéal nul de R[X0 ]. Une relation différentielle algébrique d’ordre 1 satisfaite par sin est un polynôme P ∈ R[X0 , X1 ] tel que P (sin, cos) = 0 , c’est-à-dire une relation algébrique entre sin et cos. On a vu en exercice (paragraphe 1.2.1) que l’idéal de ces relations est <X02 + X12 − 1> (à l’ordre près des deux éléments, mais ceux-ci jouent ici un rôle symétrique). L’idéal des relations différentielles algébriques d’ordre 1 satisfaites par sin est donc l’idéal <X02 + X12 − 1> de R[X0 , X1 ]. Une relation différentielle algébrique d’ordre 2 satisfaite par sin est un polynôme P ∈ R[X0 , X1 , X2 ] tel que P (sin, cos, − sin) = 0 . Outre les multiples de X02 + X12 − 1 , il y a la relation X0 + X2 , traduisant l’équation différentielle sin +(sin)′′ = 0 . Soit P (X0 , X1 , X2 ) une relation arbitraire. La division euclidienne par le polynôme X2 + X0 , qui est unitaire en X2 , donne P (X0 , X1 , X2 ) = (X2 + X0 )Q(X0 , X1 , X2 ) + R(X0 , X1 ), où R est une relation différentielle algébrique d’ordre 1 satisfaite par sin , donc un multiple de X02 + X12 − 1 dans R[X0 , X1 ]. L’idéal des relations différentielles algébriques d’ordre 2 satisfaites par sin est donc l’idéal <X02 + X12 − 1, X0 + X2 > de R[X0 , X1 , X2 ]. 2 I.7.7 On a f ′ (x) = 2xex . Une relation de dépendance algébrique entre f et f ′ est donc un 2 2 polynôme P ∈ R[X, Y ] tel que ∀x ∈ R , P (ex , 2xex ) = 0 . Soient Pi les composantes homogènes de P . On a donc : X 2 ∀x ∈ R , eix Pi (1, 2x) = 0. i La comparaison des ordres de croissance montre que toutes les fonctions polynômiales Pi (1, 2x) s’annulent à l’infini, donc que tous les Pi sont nuls, donc que P = 0 . 2 2 On a f ′′ (x) = (4x2 + 2)ex , d’où l’équation différentielle f (f ′′ − 2f ) = 2f ′ , et P0 est bien une relation différentielle algébrique d’ordre 2 satisfaite par f . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 130 I.7.8 Soit P un élément quelconque de I . On a vu en exercice (module « Polynômes » du [L1]) que l’on peut effectuer une division euclidienne de P par le polynôme P0 non unitaire en X2 , sous la forme : X2d P (X0 , X1 , X2 ) = P0 (X0 , X1 , X2 )Q(X0 , X1 , X2 ) + R(X0 , X1 ). Puisque R est une relation entre f et f ′ , il découle de l’exercice précédent que R = 0 . Puisque P0 divise X2d P et qu’il est premier avec X2 , il divise P , d’où la conclusion voulue, I.7.9 Notons Pi les composantes homogènes de P . L’égalité ∀t ∈ K ∗ , P (tX) = tk P (X) entraîne, pour chaque degré i , l’égalité ∀t ∈ K ∗ , (tk − ti )Pi (X) = 0 , donc, pour chaque i tel que Pi 6= 0 , l’égalité ∀t ∈ K ∗ , tk − ti = 0 . Si K est un corps infini, cela n’est possible que si i = k et le polynôme P est en effet homogène de degré k . Si K est un corps fini à q éléments, la relation ∀t ∈ K ∗ , tk − ti = 0 est équivalente à i ≡ k (mod q − 1), et l’on n’a pas nécessairement P ∈ Sk . Par exemple, un polynôme dont les composantes homogènes sont de degrés des puissances de q se comporte comme une forme linéaire : il vérifie ∀t ∈ K ∗ , P (tX) = tP (X). I.7.10 Écrivons P = P d6i6d′ Pi et Q = P Qj les décompositions respectives de P et Q en e6j6e′ sommes de polynômes homogènes, avec Pd et Qe non nuls (ce sont donc les composantes de plus bas degrés) et Pd′ et Qe′ non nuls (ce sont donc les composantes de plus hauts degrés). La composante homogène de plus bas degré de P Q est Pd Qe , de degré d + e , et sa composante homogène de plus haut degré est Pd′ Qe′ , de degré d′ + e′ (en effet, ces polynômes sont non nuls). Si P Q est homogène, on a donc d + e = d′ + e′ , donc (puisque d 6 d′ et e 6 e′ ) d = d′ et e = e′ : les polynômes P et Q sont donc homogènes. I.7.11 Les fractions rationnelles homogènes de degré 0 sont les P/Q où P et Q sont homogènes de même degré. Pour obtenir un corps, il faut naturellement convenir que 0 est également une fraction rationnelles homogène de degré 0 , ce qui est un abus, mais simplifie le langage. Les égalités (P1 /Q1 ) − (P2 /Q2 ) = (P1 Q2 − P2 Q1 )/(Q1 Q2 ), 1 = 1/1 , (P1 /Q1 )(P2 /Q2 ) = (P1 P2 )/(Q1 Q2 ) et (P1 /Q1 )−1 = Q1 /P1 montrent que l’on a bien un sous-corps, et il est clair qu’il contient K et les Xi /Xj . Enfin, si P et Q sont homogènes de degré d, on calcule : P (X1 , . . . , Xn ) X d P (1, X2 /X1 , . . . , Xn /X1 ) P (1, X2 /X1 , . . . , Xn /X1 ) = 1d , = Q(X1 , . . . , Xn ) Q(1, X2 /X1 , . . . , Xn /X1 ) X1 Q(1, X2 /X1 , . . . , Xn /X1 ) ce qui entraîne que P/Q appartient au corps engendré sur K par les Xi /X1 , et, a fortiori, au corps engendré sur K par les Xi /Xj . I.7.12 Puisque L1 , . . . , Lr sont des éléments linéairement indépendants du K -espace vectoriel S1 , ils peuvent être complétés en une base, et il existe ϕ ∈ GL(S1 ) tel que ϕ(Li ) = Xi c Dunod 2014 I.7 : Polynômes à plusieurs indéterminées 131 pour i = 1, . . . , r . Soit ψ := ϕ−1 . Notons Φ (resp. Ψ ) l’unique endomorphisme de la K algèbre K[X1 , . . . , Xn ] tel que Xi 7→ ϕ(Xi ) (resp. tel que Xi 7→ ψ(Xi )) pour i = 1, . . . , n. Alors Φ et Ψ sont en particulier K -linéaires, donc se restreignent en ϕ et en ψ sur S1 , donc Ψ ◦ Φ et Φ ◦ Ψ se restreignent en IdS1 , donc sont égaux à IdK[X1 ,...,Xn ] : ce sont donc des automorphismes de K[X1 , . . . , Xn ]. Enfin, si F est un polynôme en r indéterminées, alors ϕ F (L1 , . . . , Lr ) = F (X1 , . . . , Xr ), d’où la conclusion. On notera que, bien que ce soit la principale application, la restriction au cas où F est homogène de degré k est inutile. I.7.13 (i) Dans le cas où F := Y1α1 · · · Yrαr , est un monôme de degré k := α1 + · · · + αr , l’expression F (P1 + Q1 , . . . , Pr + Qr ) − F (P1 , . . . , Pr ) est une combinaison linéaire de termes de la forme P1β1 Qγ11 · · · Prβr Qγr r , où βi + γi = αi pour i = 1, . . . , r et où l’un au moins des γi est non nul. L’ordre de chacun de ces termes est donc strictement plus grand que k . Si F est homogène de degré l > k , la conclusion demeure a fortiori. Si F est de valuation k , pour chaque monôme G de F − In(F ), de degré l , l’expression G(P1 , . . . , Pr ) est d’ordre l > k (ou bien nulle). Finalement, on voit que F (P1 + Q1 , . . . , Pr + Qr ) − F (P1 , . . . , Pr ) et F (P1 , . . . , Pr ) − In(F )(P1 , . . . , Pr ) sont bien de valuations strictement plus grandes que k . Si F (P1 + Q1 , . . . , Pr + Qr ) = 0 , on en conclut que In(F )(P1 , . . . , Pr ) = 0 , donc In(F ) = 0 d’après l’exercice précédent, ce qui contredit la définition de la forme initiale : on a donc nécessairement F = 0 . (ii) Les mêmes calculs montrent que, si F (P1 , . . . , Pn ) = Xi , alors F est d’ordre 1 et In(F ) In(P1 , . . . , In(Pn ) = Xi , autrement dit, que chaque Xi est combinaison linéaire des formes homogènes In(Pi ) : cela n’est possible que si ces dernières sont linéaires et engendrent S1 , donc en forment une base. I.7.14 L’indication conduit immédiatement à une solution. En voici une autre. Le polynôme ci (A) est une combinaison linéaire de déterminants de sous-matrices carrées d’ordre i de A ; chacun de ces déterminants est un polynôme homogène de degré i en les coefficients de A. I.7.15 Si P est homogène de degré k , on a, dans le corps des fractions rationnelles, P (X, Y, Z) = Z k P (X/Z, Y /Z, 1). Si P (X, Y, 1) = 0 , alors P (X/Z, Y /Z, 1) = 0 et P = 0 . I.7.16 On a bien entendu P h (1, X1 , . . . , Xn ) = P , comme cela est du reste indiqué dans le cours. Mais il n’est pas toujours vrai que, si P (X1 , . . . , Xn ) := Q(1, X1 , . . . , Xn ), on ait P h = Q . Par exemple, si Q(X0 , X1 ) = X0 , alors P = 1 , donc P h = 1 . Le lecteur vérifiera sans peine (en tout cas, avec interêt) que, si X0 ne divise pas Q , alors (avec les notations précédentes) P h = Q . Plus généralement, si Q = X0r Q1 , où X0 ne divise pas Q1 , alors P h = Q1 . I.7.17 Rappelons que l’on note pk le projecteur de K[X1 , . . . , Xn ] sur Sk qui, à chaque polynôme P , associe sa composante homogène de degré k , pk (P ). On a vu dans le cours que, si P est homogène de degré d, pk (P Q) = P pk−d (Q) (ou 0 si d > k ). Supposons (i) vérifiée, et soit (Pi ) une famille génératrice formée de polynômes homogènes ; c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 132 P notons di le degré de Pi . Soit P = Pi Qi ∈ I . Alors, d’après la formule rappelée ci-dessus, P pk (P ) = Pi pk−di (Qi ). La composante homogène pk (P ) est donc dans I : on a prouvé di >k que (i) implique (ii). Supposons (ii) vérifiée, et soit (Pi ) une famille génératrice arbitraire de I . Alors les composantes homogènes des Pi sont dans I et en forment donc une famille génératrice : on a prouvé que (ii) implique (i). Il est immédiat que la troisième condition implique (ii). Réciproquement, (ii) implique P L I= (I ∩ Sk ), et le fait que la somme soit directe est conséquence de S = Sk . k∈N k∈N I.7.18 On le montre par récurrence sur |α|. Pour |α| = 0 , c’est trivial ( Dα est l’identité). Pour |α| > 1 , on le montre par récurrence sur k . Pour k = 0 , il n’y a rien à prouver (par convention, I l = K[X1 , . . . , Xn ] pour l 6 0 ). Un élément de I k+1 est une somme de termes de la forme P Q , où P ∈ I et Q ∈ I k . Il suffit donc de montrer que, pour un tel terme, on a Dα (P Q) ∈ I k+1−|α| . On écrit la formule de Leibniz : X α! Dα (P Q) = P Dα (Q) + (Dβ P )(Dγ Q). β! γ! β+γ=α β6=0 Le terme P Dα (Q) est dans II k−|α| = I k+1−|α| (hypothèse de récurrence sur k ). Chacun des facteurs Dγ Q des termes (Dβ P )(Dγ Q) est dans I k+1−|α| , car Dγ Q ∈ I k−|γ| ⊂ I k+1−|α| (hypothèse de récurrence sur |α|, jointe au fait que β 6= 0 ⇒ |γ| < |α|). Voici une autre preuve, qui ne fait pas appel à la formule de Leibniz. Il suffit de montrer que, pour chacune des dérivations Di , on a l’inclusion Di (I k ) ⊂ I k−1 (le cas général s’en déduit en itérant cette relation, comme, par exemple, dans la preuve de la relation (5), page 327). Pour k = 0 , c’est trivial (cf. convention ci-dessus). Pour k > 1 , un élément de I k est une somme de termes de la forme P := P1 · · · Pk , où P1 , . . . , Pk ∈ I . Il suffit de prouver que, pour un tel terme, Di (P ) ∈ I k−1 . Mais : Di (P ) = k X j=1 Di (Pj )P1 · · · Pˆj · · · Pk , où le facteur Pˆj est, par convention, absent. Les k termes de cette somme sont bien éléments de I k−1 . ∂σ1 ∂σ1 = 1 . Si n > 2 et k = 1 , on trouve de même =1 ∂X1 ∂Xi (pour i = 1, . . . , n). Si n, k > 2 , un calcul immédiat donne : I.7.19 (i) Si n = 1 , on a simplement ∂σk = σk−1 (X1 , . . . , X̂i , . . . , Xn ), ∂Xi où l’argument X̂i est, par convention, absent. Si l’on convient que σ0 = 1 , ce cas recouvre les précédents. On en déduit : n ∂σk (Q1 , . . . , Qn ) X ∂Qi = σk−1 (Q1 , . . . , Q̂i , . . . , Qn ) · ∂Yj ∂Yj i=1 c Dunod 2014 I.7 : Polynômes à plusieurs indéterminées 133 (ii) Par application de la proposition 10 de la page 326, on trouve : n X d P Q1 (T ), . . . , Qn (T ) = (Di P ) Q1 (T ), . . . , Qn (T ) Q′i (T ). dT i=1 (iii) De même : n n X ∂ P (T X1 , . . . , T Xn ) ∂(T Xi ) X = (Di P )(T X1 , . . . , T Xn ) = Xi (Di P )(T X1 , . . . , T Xn ). ∂T ∂T i=1 i=1 En substituant 1 à T , on retrouve la formule d’Euler. I.7.20 Il s’agit de démontrer l’égalité : n ∂(P ◦ Q) X ∂Qj ∂P = (Q1 , . . . , Qn ). ∂Yi ∂Yi ∂Xj j=1 Mais c’est une conséquence de la 10 de la page 326. I.7.21 Si P 7→ P ◦ Q est un automorphisme, les Xi sont dans l’image, donc leurs gradients sont ∂(Q1 , . . . , Qn ) dans l’image de la matrice (exercice précédent). En évaluant en (0, . . . , 0), on ∂(X1 , . . . , Xn ) obtient la condition voulue. P Dα P (0, . . . , 0) α X . C’est un polynôme homogène de degré k . α! |α|=k P Pk . On a donc bien Pk = pk (P ). D’après l’une des formules de Taylor, P = I.7.22 Notons Pk := k>0 Prenant k := ω(P ), on sait que pk (P ) = In(P ), d’où la deuxième formule. I.7.23 Comme dans la preuve de la formule de Taylor (théorème 12 de la page 328), on a a priori une relation de la forme : X P (X1 + Y1 , . . . , Xn + Yn ) = pα X α , pα ∈ L := K(Y1 , . . . , Yn ). et l’on note ∆α P (Y1 , . . . , Yn ) le coefficient pα . En posant B := K[Y1 , . . . , Yn ] et en raisonnant dans l’anneau K[X1 , . . . , Xn , Y1 , . . . , Yn = B[X1 , . . . , Xn ], on voit que ∆α P ∈ K[Y1 , . . . , Yn ]. Soient λ, µ ∈ K . Le coefficient en X α du polynôme : (λP + µQ)(X1 + Y1 , . . . , Xn + Yn ) ∈ B[X1 , . . . , Xn ] est la combinaison linéaire correspondante des coefficients en X α des polynômes : P (X1 + Y1 , . . . , Xn + Yn ), Q(X1 + Y1 , . . . , Xn + Yn ) ∈ B[X1 , . . . , Xn ], i.e. ∆α (λP + µQ) = λ∆α P + µ∆α Q : on a donc bien une application linéaire. De l’égalité P (X1 +Y1 , . . . , Xn +Yn )Q(X1 +Y1 , . . . , Xn +Yn ) = (P Q)(X1 +Y1 , . . . , Xn +Yn ), on tire : X X X ∆γ P (Y1 , . . . , Yn )X γ = ∆α (P Q)(Y1 , . . . , Yn )X α . ∆β P (Y1 , . . . , Yn )X β β γ α c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 134 En identifiant les coefficients de X α , on en déduit la formule : X ∆α (P Q) = ∆β (P )∆γ (Q). β+γ=α Pour prouver la dernière assertion, nous allons introduire de nouvelles indéterminées Z1 , . . . , Zn ; nous laissons au lecteur le soin d’identifier les anneaux dans lesquels ont lieu les égalités qui suivent : X P (X1 + Y1 + Z1 , . . . , Xn + Yn + Zn ) = (∆α P )(Y1 + Z1 , . . . , Yn + Zn )X α X = ∆β (∆α P )(Z1 , . . . , Zn )X α Y β . Par ailleurs : P (X1 + Y1 + Z1 , . . . , Xn + Yn + Zn ) = = = P (X1 + Y1 ) + Z1 , . . . , (Xn + Yn ) + Zn X (∆α P )(Z1 , . . . , Zn )(X + Y )α X X (β + γ)! (∆α P )(Z1 , . . . , Zn ) XβY γ . β! γ! β+γ=α En identifiant les coefficients de X β Y γ dans les deux polynômes, on obtient bien la formule (β + γ)! ∆β+γ = ∆β ◦ ∆γ . β! γ! 1 α Lorsque K est de caractéristique nulle, la formule de Taylor nous dit que ∆α = D . α! La première formule est donc la formule de Leibniz et la deuxième formule est simplement Dβ+γ = Dβ ◦ Dγ . Q (Xσ(j) − Xσ(i) ) s’annule si, et seulement si, Xσ(i) = Xσ(j) , pour un Q (Xj − Xi ). Vus les degrés, il est de la forme i 6= j , c’est donc un multiple de ∆n := I.7.26 Le produit 16i<j6n 16i<j6n ε(σ)∆n avec ε(σ) ∈ C∗ . Il est de plus évident que ε est un morphisme de groupes qui prend la valeur −1 pour les transpositions. Enfin, dans le passage de ∆n au produit ci-dessus, chaque facteur est multiplié par −1 si, et seulement si, il correspond à une inversion de σ . I.7.27 (i) Si P 6= 0 et Φσ (P ) = λσ P pour tout σ , en composant on trouve que Φστ (P ) = λσ λτ P = λστ P , d’où λσ λτ P = λστ : c’est donc bien un morphisme de groupes de Sn dans C∗ , il est donc trivial, dans lequel cas P est un polynôme symétrique, ou égal au morphisme signature. (ii) est immédiat. (iii) Si P est alterné, en faisant Xi = Xj (avec i 6= j ) on obtient un polynôme égal à son opposé, donc nul ; donc chaque Xi − Xj divise P , donc ∆n divise P et l’on a P = ∆n P1 , où P1 est symétrique puisque P est alterné. Dans le cas d’une fraction irréductible symétrique R = P/Q , soit P et Q sont symétriques ; soit ils sont tous deux alternés, donc divisibles par ∆n , ce qui contredirait l’irréductibilité de R . I.7.31 Le cas de la caractéristique nulle est immédiat avec l’indication. Si la caractéristique est p > 0 , prendre n = p et tous les αi := 1 . c Dunod 2014 I.7 : Polynômes à plusieurs indéterminées 135 I.7.32 (i) Soient Q un facteur irréductible de P , K ′ := K[X]/<Q> et x la classe de X dans K ′ . Alors K ′ est un corps, une extension de K , et l’on y a P (x) = classe de P (X) = 0 puisque Q|P . (ii) Dans K ′ [X] on a P = Q1 P1 , où Q1 est non constant et scindé, et l’on recommence avec P1 . (iii) Il suffit de remplacer le corps algébriquement clos de la démonstration par une extension dans lequel le polynôme concerné est scindé (« corps de décomposition », voir [MPA1]). I.7.33 (i) On a T n P (1/T ) = n Q (T − λi ) : on reconnaît le polynôme caractéristique i=1 χA (T ) := det(T In − A). P′ est la somme des développeP ′ P k k P ments des −T i avec Pi := 1 − λi T et chacun de ces derniers est égal à λi T . Comme Pi k>1 (ii) Le développement en série formelle (ou entière) de −T Tr(Ak ) est la somme des λki pour i = 1, . . . , n, la formule vient. Le rayon de convergence de cette série est en général (c’est-à-dire sauf s’il y a des annulations) l’inverse du maximum des modules des valeurs propres. Le calcul des sommes de Newton se ramène donc à un développement en série. I.7.36 L’algorithme de Newton permet d’écrire les coefficients de Pk comme polynômes à coefficients entiers en les fonctions symétriques élémentaires des xi , donc en les coefficients de P . On en déduit que Pk (X) ∈ Z[X]. Comme conséquence de l’hypothèse, les coefficients de tous les Pk sont uniformément majorés en module par 2n . Il n’y a donc qu’un nombre fini de polynômes Pk différents, donc, pour chaque xi , un nombre fini de puissances xki différentes. Tous les xi sont donc des racines de l’unité. I.7.40 À l’indication il suffit d’ajouter que si la fonction polynomiale (continue et nulle sur une partie dense donc nulle partout) est nulle, le polynôme l’est également puisque le corps est infini. I.7.41 (i) Toute matrice A telle que Sep(A) 6= 0 admet n valeurs propres distinctes donc est diagonalisable. L’ensemble des matrices diagonalisables contient donc le complémentaire du lieu d’annulation de Sep, et il suffit de vérifier que ce polynôme n’est pas nul pour conclure à la Zariski-densité. Mais le corps étant infini (puisqu’algébriquement clos) on peut former une matrice diagonale dont les éléments diagonaux sont deux à deux distincts, et elle n’annule pas Sep. (ii) Soit A = P DP −1 , où D est diagonale. Alors χA = χD et : χA (A) = χD (A) = χD (P DP −1 ) = P χD (D)P −1 = 0, puisque χD (D) est la matrice diagonale formée des χD (λi ) = 0 , les λi désignant les valeurs propres de A, donc les coefficients diagonaux de D . (iii) Notons di,j (A) les coefficients de la matrice χA (A). Chaque di,j est un polynôme sur c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 136 Mn (K) qui s’annule sur le sous-ensemble Zariski-dense des matrices diagonalisables, donc qui est nul. Pour étendre ce résultat à un corps arbitraire, il suffit de considérer les matrices qui sont diagonalisables dans un corps de décomposition de leur polynôme caractéristique (exercice I.7.32). I.7.43 On a Res(A, B) = Resp,1 (A, B) = det Sp,1 (A, B), où : a0 µ 0 ... 0 a1 λ µ . . . 0 .. .. . . .. . .. Sp,1 (A, B) = . . . . . ap−1 0 . . . λ µ ap 0 ... 0 λ En développant par rapport à la première colonne, on trouve un terme a0 λp , puis des termes ai multipliés par (−1)i det Mi où Mi est une matrice diagonale par blocs avec deux blocs : • Un bloc Ai carré de taille i avec des µ sur la diagonale, des λ juste au dessous et des 0 ailleurs, d’où det Ai = µi ; • un bloc Bi carré de taille p − i avec des λ sur la diagonale, des µ juste au dessus et des 0 ailleurs, d’où det Bi = λp−i . On a donc det Mi = µi λp−i , d’où la formule demandée. On peut également utiliser des opérations sur les lignes et les colonnes : L0 ← L0 − (µ/λ)L1 + (µ2 /λ2 )L2 − . . . donne une matrice triangulaire, le reste du calcul étant laissé au lecteur. I.7.44 Si l’on note x0 , . . . , xq−1 les coefficients de P et y0 , . . . , yp−1 ceux de Q , la condition AP + BQ = 0 se traduit par un système de p + q équations à p + q inconnues : a0 x0 + b0 y0 = 0 a1 x0 + a0 x1 + b1 y0 + b0 y1 = 0 ··· = ··· ap xq−1 + bq yp−1 = 0. La matrice carrée de taille p + q de ce système est exactement Sp,q (A, B) et l’annulation de son déterminant équivaut à l’existence de solutions non triviales. I.7.46 Le calcul de Resp,q (λA, µB) comporte deg B colonnes multipliées par λ et deg A colonnes multipliées par µ, d’où, par multilinéarité du déterminant, la formule : Resp,q (λA, µB) = λdeg B µdeg A Resp,q (A, B), autrement dit, Resp,q est bihomogène de bidegré (deg B, deg A). I.7.49 Pour projeter sur le plan des y, z , on élimine x, d’où l’annulation du déterminant : 2 y + z 2 − 1 0 y2 0 0 y 2 + z 2 − 1 −1 y 2 , 1 0 1 −1 0 1 0 1 c Dunod 2014 I.7 : Polynômes à plusieurs indéterminées 137 ce qui donne l’équation y 2 + z 2 (z 2 − 1) = 0 . Le relèvement est garanti, puisque l’on a deux polynômes unitaires en x. Le lecteur vérifiera que les équations des deux autres projections sont (x + z 2 − 1)2 = 0 (parabole comptée avec « multiplicité » 2 ) et x2 − x + y 2 = 0 (cercle). Noter que ces équations concernent des coubes dans C2 , nous éludons les questions de réalité : faites appel à Maple pour voir ce qu’il en est ! (Des dessins figurent dans [MPA1].) I.7.50 Nous laissons le lecteur trouver l’équation x2 −y 2 z = 0 . Mais ici le théorème de relèvement ne s’applique pas car uv − x n’est unitaire ni en u ni en v . Si l’on s’en tient aux solutions réelles, noter que l’équation cartésienne x2 − y 2 z = 0 permet x = y = 0 avec z arbitraire, alors que le paramétrage emplique z > 0 . I.7.51 Le plus simple est d’invoquer le théorème 24 de la page 341 avec A = tn −x et B = tp −y , d’où, en notant µp l’ensemble des racines p èmes de l’unité dans C, η une racine p ème de y , Q d’où B = (t − jη) ; et d := n ∧ p, n = dn′ , p = dp′ : j∈µp Res(A, B) = Y j∈µp ((jη)n − x) = (−1)p y n Y j∈µp (x/η n − j n ). Lorsque j parcourt µp , j n parcourt d fois µp′ , et : ′ ′ ′ Res(A, B) = (−1)p y n ((x/η n )p − 1)d = (−1)p (xp − y n )d . I.7.54 On doit calculer le déterminant : −Y 0 0 −2(X − 1) 0 0 0 −2(X − 1) −Y 0 0 −2(X − 1) 0 0 0 −2(X − 1) −Y −6(X + 1) 0 −2(X − 1) 0 −2(X + 1) 0 −2(X − 1) 4Y −6(X + 1) 0 −2(X − 1) Y −2(X + 1) 0 0 4Y −6(X + 1) 0 0 Y −2(X + 1) 0 0 4Y −6(X + 1) 0 0 Y −2(X + 1) 0 0 4Y I.7.55 Posant t := tan(θ/2), on sait que sin 2θ = t2 2t t2 − 1 et cos θ = 2 . Pour exprimer +1 t +1 tan 2θ , on fait appel à Maple c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 138 Module I.8 : Structures discrètes et récursivité I.8.2 Les deux premières égalités sont triviales. On a alors : f = ũũ ˜ = uũ, uũ qui est donc un palindrome. Mais par exemple le mot aba, qui est un palindrome, n’est pas de cette forme. En fait, les uũ sont exactement les palindromes de longueur paire (prouvez-le !) et ceux de longueur impaire sont exactement les uxũ , où x est une lettre. I.8.3 Si w = u1 vu2 et w′ = u1 ṽu2 , alors xw = (xu1 )vu2 et xw′ = (xu1 )ṽu2 ; ainsi on a bien l’implication w R w′ ⇒ xw R xw′ . Supposons réciproquement que xw R xw′ , i.e. xw = u1 vu2 et xw′ = u1 ṽu2 . Si u1 est non vide, on a donc u1 = xu′1 , d’où w = u′1 vu2 et w′ = u′1 ṽu2 , et l’on conclut que w R w′ . Si u1 est le mot vide, on a xw = vu2 et xw′ = ṽu2 . Si v est le mot vide, w = w′ et l’on a fini. Si v est de longueur 1 , on a v = x et à nouveau w = w′ . Si |v| > 2 , on a v = xv ′ puis w = v ′ u′2 et w′ = v˜′ u′2 avec u′2 := xu2 , d’où encore une fois la conclusion w R w′ . Le cas de l’hypothèse wx R w′ x se traite de même. Les programmes CAML qui suivent prennent en compte deux mots u, v et comparent le sousmot de u formé des lettres de rang i à j au sous-mot de v formé des lettres de rang k à l . let miroir u v = let rec aux i j k l = ((l-k) == (j-i)) && ((j < i) || ((u.[i] == v.[l]) && (aux (i+1) j k (l-1)))) in aux;; let recombine u v = let rec aux i j k l = ((l-k) == (j-i)) && ((j < i) || ((u.[i] == v.[k]) && (aux (i+1) j (k+1) l)) || ((u.[j] == v.[l]) && (aux i (j-1) k (l-1))) || (miroir u v i j k l)) in aux;; Pour comparer u et v en entier, il suffit d’écrire : let n = String.length u and p = String.length v in recombine u v 0 (n-1) 0 (p-1);; I.8.5 Pour chacune des trois relations, temporairement notées ≺ , on vérifie sans peine les propriétés suivantes : u ≺ v =⇒ |u| 6 |v| , u ≺ v et |u| = |v| =⇒ u = v. Pour toute suite (un ) décroissante (pour l’une quelconque de ces relations), la suite d’entiers (|un |) décroît également, donc stationne, et la suite (un ) stationne au même rang. Si v = ab , les facteurs a et b de v ne sont pas comparables. c Dunod 2014 I.8 : Structures discrètes et récursivité 139 I.8.6 Puisque wk wl = wk+l = wl wk , il est clair que si u, v ∈ w∗ , alors uv = vu . Pour la réciproque, on va raisonner par récurrence forte sur |u| + |v|. Si cet entier est nul, les deux mots sont vides et on a terminé. Sinon, u et v jouant un rôle symétrique, on peut supposer que |u| 6 |v| . d’après le lemme indiqué, on a donc v = uv ′ et v = v ′ u , d’où uv ′ = v ′ u . Soit u est vide et la conclusion est immédiate, soit |u| + |v ′ | < |u| + |v| et l’hypothèse de récurrence entraîne que u, v ′ ∈ w∗ , d’où v = uv ′ ∈ w∗ . Pour la deuxième équivalence, on a encore une implication facile : si u, v ∈ w∗ , par exemple u = wa et v = wb , alors soit a ou b est nul et le lecteur trouvera sans peine la conclusion, soit ab 6= 0 et l’on peut prendre (k, l) := (b, a). Supposons donc réciproquement que uk = v l , avec l 6= 0 . Plutôt que de suivre l’indication (voie que le lecteur mènera facilement à bien), nous allons esquisser une méthode entièrement différente. Encore une fois on peut supposer u et v non vides (sinon c’est très facile). L’égalité des longueurs permet d’introduire N := k |u| = l |v| . Le mot uk = v l est une fonction de {0, . . . , N − 1} dans l’alphabet X concerné. On peut donc l’étendre en une (unique) fonction N -périodique W de Z dans X . Cette fonction est en fait |u|-périodique (car elle étend uk ) et |v| -périodique (car elle étend v l ). Soit n le pgcd des longueurs |u| et |v|. La fonction W est n-périodique puisque, d’après le théorème de Bézout, n appartient au groupe engendré par les périodes |u| et |v| . Soit w la restriction de W à {0, . . . , n − 1} . Alors W est l’unique extension n-périodique de w et l’on voit facilement que u, v ∈ w∗ . I.8.7 (i) Si w = uv et w′ = vu , alors vw = vuv = w′ v . Supposons réciproquement qu’il existe un mot v tel que vw = w′ v ; donc w et w′ ont même longueur ℓ . On raisonne par récurrence forte sur ℓ . Si ℓ = 0 , la conclusion est immédiate. Sinon, on invoque le lemme suggéré en indication. Deux cas sont possibles. Si |v| > ℓ , le lemme dit que v = v1 w = w′ v1 avec |v1 | = |v| − ℓ < |v|, qui est une relation similaire ; on peut donc réitérer, jusqu’à arriver au deuxième cas du lemme. Autrement dit, on peut supposer que |v| < ℓ . Alors le lemme donne directement la conclusion voulue. (ii) Soit w un mot de longueur n et soit t ∈ Z/nZ. Pour tout i ∈ {0, . . . , n − 1} on peut définir i+t ∈ {0, . . . , n−1} comme l’unique représentant de i+t ∈ Z/nZ dans cet intervalle. Alors en posant w′ (i) := w(i + t), on définit un mot w′ de longueur n, que l’on peut noter t.w : on a bien une action de Z/nZ sur X n (la vérification des deux axiomes 0.w = w et (t + t′ ).w = t.(t′ .w) est laissée au lecteur). Si w = uv et si t est la classe de |u|, alors t.w = vu , ce qui montre que l’orbite de w est l’ensemble de ses conjugués. Le plus petit entier d > 0 dont la classe fixe w est sa période s’il en a une : alors w = un/d , où u est le préfixe de w de longueur d. C’est le plus petit mot u tel que w ∈ u∗ . I.8.9 Dans la première série d’égalités, il y a une faute typographique . . . Il faut lire (a∗ b)∗ a∗ = a∗ (ba∗ )∗ = (a + b)∗ . Tous les langages indiqués sont inclus dans {a, b}∗ . Il suffit donc de prendre w ∈ {a, b}∗ arbitraire et de montrer qu’il appartient à chacun de ces langages. Nous montrerons que w ∈ (a∗ b)∗ a∗ , l’autre cas se traitant de manière analogue. On raisonne (brièvement) par récurrence forte sur la longueur de w . Si elle est nulle, w est vide et c’est immédiat. Soit ak le plus long préfixe de w dans a∗ et notons w = ak w′ . Si w′ est vide, w ∈ a∗ , donc w ∈ (a∗ b)∗ a∗ . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 140 Sinon, w′ = bw′′ (maximalité de k ) et l’hypothèse de récurrence appliquée à w′′ (qui est strictement plus court que w ) montre que w′′ ∈ (a∗ b)∗ a∗ , donc qu’il en est de même de w = ak bw′′ . Par des arguments du même genre, on montre que (ab)∗ a et a(ba)∗ décrivent tous deux le langage des mots où a et b alternent, et qui de plus commencent et finissent par a. S S I.8.11 On a en général L Li = LLi (une forme généralisée de distributivité puisque l’on autorise des familles infinies), d’où : [ [ [ LL∗ = L Ln = LLn = Ln = L+ . n>0 n>0 n>1 La relation L+ = L∗ L se démontre de la même manière. Par ailleurs : [ [ L∗ = Ln = L0 ∪ Ln = {ε} ∪ L+ , n>0 ∗ n>1 + autrement dit L = ε + L . L’égalité (ε + L)+ = L∗ s’obtient facilement par double inclusion, on laisse cette tâche au lecteur. I.8.12 On utilise de l’exercice précédent le fait que ε + L1 .L∗1 = L∗1 . En multipliant à droite par L2 + L3 , il vient L2 + L3 + L1 L = L . Mais L3 ⊂ L ⇒ L3 ⊂ L1 L (puisque ε ∈ L1 ), donc L3 + L1 L = L1 L et l’on obtient la formule désirée. I.8.13 Notant Φ(X) := L1 X + L2 , nous laissons au lecteur le soin de prouver que l’application Φ S S est croissante (pour l’inclusion) et vérifie Φ( Xi ) = Φ(Xi ). On définit alors une suite (Xn ) de langages par X0 := ∅ et Xn+1 := Φ(Xn ), puis on pose S X := Xn . Des propriétés de Φ, on déduit immédiatement que la suite (Xn ) est croissante n>0 pour l’inclusion et que X en est un point fixe, i.e. il est solution de l’équation d’Arden. Si L est une autre solution, on a d’une part L = Φ(L), d’autre part X0 ⊂ L . Par application itérée de Φ et invocation de ses propriétés, on montre par récurrence quz Xn ⊂ L pour tout n, donc que X ⊂ L , et X est bien le plus petit point fixe de Φ (et la plus petite solution). I.8.14 Avec les notations de la proposition, on introduit deux vecteurs et une matrice carrée de langages : L1 B1 A1,1 . . . A1,n .. . .. L := ... , B := ... , A := ... . . Ln Bn An,1 . . . An,n Avec des définitions naturelles pour la somme et le produit de vecteurs et matrices, le système étudié se ramèe à l’équation vectorielle L = AL + B . En itérant cette relation, vue sous la forme d’équation au point fixe pour l’opérateur X 7→ B + AX (sur les vecteurs de langages), on trouve : L = B + AB + · · · + Ak−1 B + Ak L. c Dunod 2014 I.8 : Structures discrètes et récursivité 141 Ceci suggère la solution : L= [ Ak B = A∗ B, où A∗ := k>0 [ Ak , k>0 la réunion de ces vecteurs de langages étant définie coefficient par coefficient. On peut justifier cette égalité comme suit : puisque les langages Ai,j sont tous propres, les n langages qui composent le vecteur Ak B ne contiennent que des mots de longueur > k . Si l’on note Lk := B + AB + · · · + Ak−1 B , on voit donc que les langages composant le vecteur L \ Lk (différence ensembliste appliquée coefficient par coefficient) ne contiennent que des mots de longueur > k . Comme l’inclusion Lk ⊂ L est évidente (inclusion définie coefficient par coefficient), la conclusion vient. I.8.15 On a toujours u−1 (uL) = L car uw ∈ uL ⇔ w ∈ L . Si w ∈ u−1 L , on a évidemment uw ∈ L , d’où l’inclusion u(u−1 L) ⊂ L . Mais si un mot de L n’est pas de la forme uw , il ne peut appartenir à u(u−1 L) et l’inclusion est dans ce cas stricte. En fait, notant X l’alphabet, on a de manière générale la relation : u(u−1 L) = L∩uX ∗ (preuve facile et laissée au lecteur). I.8.17 Pour étudier le premier langage, considérons, pour i, j ∈ {0, 1} : Li,j := {u ∈ {a, b}∗ | |u|a ≡ i (mod 2) et |u|b ≡ j (mod 2)}. Le langage qui nous intéresse est L0,0 . On vérifie immédiatement les formules suivantes pour les résiduels : a−1 Li,j = L1−i,j et b−1 Li,j = Li,1−j . Notre langage a donc exactement quatre résiduels, il est rationnel. Pour étudier le second langage, on introduit pour tout n ∈ Z : L′n := {u ∈ {a, b}∗ | |u|a = |u|b + n}. Comme, pour tout n ∈ N, le mot an n’appartient qu’à L′n et le mot bn qu’à L′−n , ces langages sont deux à deux distincts. Le langage qui nous intéresse est L′0 . On vérifie immédiatement les formules suivantes pour les résiduels : a−1 L′n = L′n−1 et b−1 L′n = L′n+1 . Notre langage a donc une infinité de résiduels, il n’est pas rationnel. I.8.18 On sait que ε ∈ P . Si u ∈ P n’est pas vide, il a au moins deux lettres puisque |u| = |u|a + |u|b est pair. Si ces deux lettres sont aa ou bb , le suffixe correspondant est dans P , et réciproquement ; si ces deux lettres sont ab ou ba, le suffixe correspondant est dans I , et réciproquement. On a ainsi prouvé que P = (aa + bb)P + (ab + ba)I + ε . La preuve de la deuxième égalité est analogue, à ceci près que tout u ∈ I a au moins deux lettres puisque |u| est somme de deux nombres impairs. On résoud la dernière égalité vue comme une équation en I , ce qui donne : I = (aa + bb)∗ (ab + ba)P. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 142 On reporte cette relation dans la première égalité, ce qui donne : d’où la solution : P = (aa + bb)P + (ab + ba)(aa + bb)∗ (ab + ba)P + ε = (aa + bb) + (ab + ba)(aa + bb)∗ (ab + ba) P + ε, ∗ P = (aa + bb) + (ab + ba)(aa + bb)∗ (ab + ba) . Nous laissons au lecteur le soin de vérifier l’unicité de ces solutions (le langage que l’on doit affecter d’une étoile est chaque fois propre) et d’en tirer une formule explicite pour I . Noter que, selon les notations de l’exercice précédent, P = L0,0 et I = L1,1 , cequi permettrait de donner d’autres formules. I.8.19 Supposons que le mot x ∈ X ∗ code l’entier n et y l’entier p. Alors la relation x = y0 signifie que n = 2p et la relation x = y1 que n = 2p + 1 . De plus, on a les équivalences suivantes entre congruences ; si n = 2p : n≡0 (mod 3) ⇐⇒ p ≡ 0 (mod 3), n≡1 (mod 3) ⇐⇒ p ≡ 2 (mod 3), n≡2 (mod 3) ⇐⇒ p ≡ 1 (mod 3); n≡0 (mod 3) ⇐⇒ p ≡ 1 (mod 3), n≡1 (mod 3) ⇐⇒ p ≡ 0 (mod 3), n≡2 (mod 3) ⇐⇒ p ≡ 2 (mod 3); si n = 2p + 1 : Comme ε appartient à L0 mais ni à L1 ni à L2 , on en tire immédiatement les égalités L0 = L0 .0 + L1 .1 + ε , L1 = L2 .0 + L0 .1 et L2 = L1 .0 + L2 .1 . La résolution se fait alors à l’aide de la proposition 7 de la page 359. I.8.20 Pour simplifier le codage, on considérera les mots comme des listes de caractères. Dans la fonction resid, x désigne un caractère ; dans la fonction residuel, u désigne un mot (une liste de caractères). type expreg = Vide | Epsilon | Sing of char | Plus of expreg * expreg | Conc of expreg * expreg | Star of expreg ;; let rec propre e = match e with Vide -> true | Epsilon -> false | Sing _ -> true | Plus(e1,e2) -> (propre e1) && (propre e2) | Conc(e1,e2) -> (propre e1) || (propre e2) c Dunod 2014 I.8 : Structures discrètes et récursivité 143 | Star _ -> false ;; let rec resid x e = match e with Vide -> Vide | Epsilon -> Vide | Sing(a) -> if a = x then Epsilon else Vide | Plus(e1,e2) -> Plus(resid x e1,resid x e2) | Conc(e1,e2) -> let e3 = Conc(resid x e1, e2) in if (propre e1) then e3 else Plus(e3,resid x e2) | Star(e1) -> Conc(resid x e1, e);; let rec residuel u e = match u with | [] -> e | x :: q -> residuel q (resid x e) ;; let appartient u e = not (propre (residuel u e)) ;; ∗ Pour tester sur un exemple, prenons le langage P := (aa+bb)+(ab+ba)(aa+bb)∗(ab+ba) des mots ayant un nombre pair de a et un nombre pair de b , et les mots u0 := abbbaa et ses suffixes u1 , . . . , u6 : let let let let let let let let let let let e1 = Plus(Conc(Sing(’a’),Sing(’a’)),Conc(Sing(’b’),Sing(’b’))) ;; e2 = Plus(Conc(Sing(’a’),Sing(’b’)),Conc(Sing(’b’),Sing(’a’))) ;; e3 = Conc(e2,Conc(Star(e1),e2)) ;; e = Star(Plus(e1,e3)) ;; u0 = [’a’;’b’;’b’;’b’;’a’;’a’] ;; u1 = List.tl u0 ;; u2 = List.tl u1 ;; u3 = List.tl u2 ;; u4 = List.tl u3 ;; u5 = List.tl u4 ;; u6 = List.tl u5 ;; CAML répond alors : # # # # # # # - appartient u0 e : bool = false appartient u1 e : bool = false appartient u2 e : bool = true appartient u3 e : bool = false appartient u4 e : bool = true appartient u5 e : bool = false appartient u6 e : bool = true ;; ;; ;; ;; ;; ;; ;; I.8.21 On a D ∩ a∗ b∗ = {an bn | n ∈ N} , qui n’est pas rationnel ; donc D ne l’est pas non plus. Puisque D0 = ε , on a |D0 | = 1 . La bijection indiquée donne la relation de récurrence c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 144 P |Dn | = i+j=n−1 |Di ||Dj |, d’où l’on déduit par récurrence que les |Dn | sont les nombres de Catalan (page 42). Pour une étude approfondie du langage D , voir par exemple le livre de J.-M. Autebert « Langages algébriques », Masson 1987. I.8.22 On a L′ = {an ban | n ∈ N} = L ∩ a∗ ba∗ (immédiat), donc, si L était rationnel, L′ le serait. Montrons que les mots de L′ n’ont pas de facteur itérant. Si an ban = uvw avec v non vide, on doit distinguer les trois cas : v est entièrement à gauche de b , v contient b , v est entièrement à droite de b . Dans le deuxième cas, « pomper » v (c’est-à-dire calculer les uv k w ) modifierait le nombre de b ; dans le premier et le troisième cas, cela déséquilibrerait les nombres de a à gauche et à droite. Dans tous les cas, cela ferait sortir de L′ , qui n’est donc pas rationnel. I.8.23 Si n := card S , l’ensemble des paires d’éléments de S (donc de potentielles arêtes) a n(n − 1)/2 éléments, il y a donc 2n(n−1)/2 possibilités pour A (cas d’un graphe non orienté) ; et l’ensemble des couples d’éléments de S (donc de potentiels arcs) a n2 éléments, il y a 2 donc 2n possibilités pour A (cas d’un graphe orienté). I.8.25 (i) Xm est l’ensemble des sommets accessibles depuis E par un chemin de longueur au plus m, d’où les deux premières assertions. Comme les inclusions X0 ⊂ · · · ⊂ Xm sont strictes, on a les inégalités : m 6 card (Xm \ X0 ) 6 card S − card E =⇒ m 6 card S − card E. (ii) Yk est l’ensemble des sommets accessibles depuis E par un chemin de longueur k mais pas par un chemin plus court. (iii) est immédiat avec l’indication. I.8.26 Puisque l’on a trois boucles « pour » imbriquées, l’exécution de l’algorithme comprend exactement n3 étapes, chacune ayant un coût essentiellement constant (addition, multiplication et affectation booléennes) d’où un coût en O(n3 ). (k) Pour vérifier que le résultat est bien la matrice de descendance, considérons les booléens Yi,j (k) définis par Yi,j := 1 s’il existe un chemin de xi à xj tel que tous les sommets intermédiaires soient des xl avec l 6 k (et bien entendu 0 sinon). Pour k = 0 , la condition signifie qu’il n’y a pas de sommets intermédiaires, donc que le chemin est vide ( xi = xj ) ou un arc (0) ( (xi , xj ) ∈ A). Donc Yi,j est le coefficients d’indices (i, j) de In + M . De manière générale, un chemin de xi à xj tel que tous les sommets intermédiaires soient des xl avec l 6 k est soit un chemin qui ne passe que par des xl avec l 6 k − 1 , soit un chemin de xi à xk qui ne passe que par des xl avec l 6 k − 1 , suivi par une éventuelle boucle, suivi par un chemin de xk à xj qui ne passe que par des xl avec l 6 k − 1 . On a donc : (k) (k−1) Yi,j = Yi,j (k−1) + Yi,k (k−1) .Yk,j . On en déduit par récurrence qu’après l’étape k de l’algorithme, X est la matrice (k) (Yi,j )16i,j6n ∈ Mn ({0, 1}). Pour k = n (fin de l’algorithme), il est clair que c’est bien c Dunod 2014 I.8 : Structures discrètes et récursivité 145 la matrice de descendance. (0) Attention : la définition donnée de la matrice Yi,j exige que ses coefficients diagonaux soient égaux à 1 . Si l’on note M la matrice d’adjacence, l’initialisation de la variable X se fait donc à la valeur In + M et non M comme semble le suggérer l’énoncé. I.8.27 L’indication fournit la solution, mais voici un commentaire sur l’usage de ce résultat. Bien que le calcul formel du déterminant ait une complexité exponentielle (il n’y a pas d’algorithme de Gauß pour cela), son calcul numérique pour des valeurs substituées aux indéterminées a un coût en O(n3 ). Si un tel calcul numérique donne un résultat non nul, on est certain que le déterminant est non nul. Si « beaucoup » de tels calculs numériques donnent un résultat nul, il est « probable » que le déterminant est nul. L’estimation quantitative de la valeur de ce test probabiliste est abordée dans l’exercice I.7.38 de la page 350 du module sur les polynômes à plusieurs indéterminées. Remarque. En réalité, il est possible d’implémenter un algorithme de type pivot de Gauß en opérant dans le corps des fractions rationnelles en les Xi,j ; mais on constate alors que la taille des coefficients (c’est-à-dire de leurs représentations informatiques) croît de manière rapide et ralentit les calculs, d’où encore une complexité insupportable. N I.8.30 Le coefficient d’indices s, t de M G vaut vrai si, et seulement si, il y a un chemin de s à t de longueur au plus N . S’il existe un tel chemin, il en existe un sans boucle et ce dernier est de lonngueur majorée par card A et par card S − 1 . I.8.31 Notons n := card X et m := card Q . 2 Sans déterminisme : on doit compter les parties de X ×Q×Q , qui a m2 n éléments, d’où 2m n m m telles parties ; les 2 parties de Q formées des états de départ ; et les 2 parties de Q formées 2 des états d’arrivée : d’où le compte final 22m+m n . Avec déterminisme : on doit compter les mmn applications de X × Q dans Q , les m possibles états de départ et les 2m ensembles possibles d’états d’arrivée, d’où le compte final m2m mmn . I.8.32 L’indication rend la solution évidente, mais noter qu’elle n’est valable que sous l’hypothèse que l’automate est déterministe complet. I.8.37 Si L := a∗ b∗ , on calcule a−1 L = L , b−1 L = b∗ =: L′ , puis b−1 L′ = L′ et a−1 L′ = ∅ = L′′ , puis bien entendu a−1 L′′ = b−1 L′′ = L′′ ; et on voit facilement que L, L′ , L′′ sont deux à deux distincts. On obtient l’automate fini déterministe complet minimal : a /L a,b b b / L′ a / L′′ L’état de départ est L , les états acceptants sont L et L′ (seul L′′ est un langage propre). Pour reconnaître le complémentaire M de L , on introduit les complémentaires M ′ , M ′′ de L′ , L′′ . On reprend le même graphe en remplaçant L, L′ , L′′ par M, M ′ , M ′′ ; l’état de départ est M , le seul état acceptant est M ′′ . Le lecteur pourra démontrer (et même de différentes manières) que M = X ∗ baX ∗ . De plus, l’automate ci-dessus est son automate minimal. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 146 I.8.38 L’algorithme de Mc Naughton-Yamada est étudié en grand détail dans le livre de J.-M. Autebert « Langages algébriques », Masson 1987. I.8.39 Aucun mot de L n’a de facteur itérant dans {an bn | n ∈ N} donc a fortiori dans L . Du lemme de l’étoile, on déduit que les mots de L sont de longueurs bornées, ce qui implique la finitude de L . I.8.40 Soit u un mot non vide de ce langage. Si u ∈ a∗ ou u ∈ b∗ , l’existence d’un facteur itérant est triviale. Sinon, u contient un facteur ab ou un facteur ba ; par exemple (les deux cas étant symétriques) : u = vabv ′ . Alors le facteur ab de u est itérant. On a déjà vu que ce langage n’est pas rationnel ; mais tous ses mots non vides admettent un facteur itérant : il satisfait donc à la conclusion mais pas à l’hypothèse du lemme d’itération, dont la réciproque est par conséquent fausse. I.8.44 La relation η(t) 6 |t| est vraie pour t = F car ses deux membres sont nuls. Supposons-la vérifiée par t1 et t2 et soit t := N (t1 , t2 ). Alors : η(t) = 1 + max(η(t1 ), η(t2 ) 6 1 + max(|t1 |, |t2 |) 6 1 + |t1 | + |t2 | = |t|, ce qui achève la preuve par induction structurelle de la première inégalité. La relation |t| 6 2η(t) − 1 est vraie pour t = F car ses deux membres sont nuls. Supposons-la vérifiée par t1 et t2 et soit t := N (t1 , t2 ). Alors : |t| = 1 + |t1 | + |t2 | 6 1 + 2η(t1 ) − 1 + 2η(t)2 − 1 = 2η(t1 ) + 2η(t)2 − 1 6 2.2max(η(t1 )η(t)2 ) − 1 = 21+max(η(t1 )η(t)2 ) − 1 = 2η(t) − 1, ce qui achève la preuve par induction structurelle de la deuxième inégalité. Pour les autres questions, se reporter à l’indication. I.8.45 Outre le livre de J.-M. Autebert « Langages algébriques », Masson 1987, le lecteur peut consulter le livre de R. Sedgewick et P. Flajolet « Introduction à l’analyse d’algorithmes », Thompson Publishing 1996. I.8.47 Voici un programme en CAML : let rec fib n = match n with 0 -> 0 | 1 -> 1 | _ -> (fib (n-1)) + (fib (n-2)) ;; c Dunod 2014 I.8 : Structures discrètes et récursivité 147 Le nombre Cn d’appels récursifs vérifie C0 = C1 = 0 et Cn = 2 + Cn−1 + Cn−2 . On en déduit par récurrence que Cn = 2Fn+1 − 1 : donc une croissance exponentielle ! I.8.48 Voici un programme naturel : let rec pasc(n,p) = match (n,p) with (_,0) -> 1 | (0,_) -> 0 | _ -> (pasc(n-1,p) + (pasc(n-1,p-1)) ;; Le nombre an,p d’appels récursifs vérifie an,0 = a0,p = 0 et an,p = 2 + an−1,p + an−1,p−1 . Sans résoudre complètement cette récurrence, on voit par exemple que an,n = 2n+1 − 1 , ce qui indique un coût exponentiel. Si l’on introduit les listes : n n Ln := ,..., , 0 n on voit que le passage de Ln à Ln+1 se fait en n additions. Mais bien entendu, on consomme beaucoup plus d’espace ! Voici un programme qui réalise cela : let rec accroit a l = match l with [] -> [a] | x :: q -> (a + x) :: (accroit x q) ;; let rec pascqueue n = match n with 0 -> [] | _ -> accroit 1 (pascqueue (n - 1)) ;; let pasclist n = 1 :: (pascqueue n) ;; # pasclist 5 ;; - : int list = [1; 5; 10; 10; 5; 1] Pour une consommation d’espace en O(n), on a un coût en temps en O(n2 ). I.8.49 Voici le programme : let rec pair_impair n = match n with 0 -> (true,false) | _ -> let (a,b) = pair_impair (n-1) in (not a,not b) ;; I.8.51 Voici le programme : let rec hanoi(n,s,b,g) = match n with 0 -> [] | _ -> hanoi(n-1,s,g,b) @ ((s,b) :: hanoi(n-1,g,b,s)) ;; # hanoi(1,1,2,3) ;; - : (int * int) list = [(1, 2)] # hanoi(2,1,2,3) ;; - : (int * int) list = [(1, 3); (1, 2); (3, 2)] # hanoi(3,1,2,3) ;; - : (int * int) list = c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 148 [(1, 2); (1, 3); (2, 3); (1, 2); (3, 1); (3, 2); (1, 2)] # hanoi(4,1,2,3) ;; - : (int * int) list = [(1, 3); (1, 2); (3, 2); (1, 3); (2, 1); (2, 3); (1, 3); (1, 2); (3, 2); (3, 1); (2, 1); (3, 2); (1, 3); (1, 2); (3, 2)] # List.length(hanoi(10,1,2,3)) ;; - : int = 1023 Il est clair que la longueur Ln de hanoi(n,s,b,g) vérifie L0 = 0 et Ln+1 = 2Ln + 1 , d’où Ln = 2n − 1 . I.8.52 Supposons que la fonction termine prenne un argument de type ’a -> ’b et retourne un booléen : type ’a -> ’b -> bool. Définissons alors : let rec test x = if (termine test) then test x else true ;; On voit que test est de type ’a -> bool et peut donc être passée en argument à termine qui doit alors rendre un booléen. • Si le résultat est true, l’exécution de test x bouclera toujours, contredisant la définition de termine. • Si le résultat est false, l’exécution de test x ne bouclera jamais, contredisant la définition de termine. L’existence d’une fonction ayant les propriétés de termine conduirait donc à une contradiction. Ce raisonnement qui peut sembler artificiel dans le cadre étroit de CAML est en fait le squelette de celui qui conduit à un résultat très général et de plus rigoureusement défini et démontré : il n’existe pas de programme (quel que soit le sens raisonnable donné au mot « programme ») qui permette de décider quels programmes se terminent ou non : c’est le « problème de l’arrêt » (ou “halting problem”). I.8.53 L’appel sur (n, p) donne lieu à un appel récursif sur (n, p − 1) et un sur (n − 1, q), qui sont tous deux strictement inférieurs à (n, p) pour l’ordre lexicographique, même si q = AP (n, p − 1) est très grand (ce qui d’ailleurs sera souvent le cas). Comme N × N muni de l’ordre lexicographique est bien ordonné (voir le module « Fondements » de [L1]), la terminaison est assurée dans tous les cas. On calcule successivement : AP (1, 0) = AP (0, 1) = 2, AP (1, p) = AP (0, AP (1, p − 1)) = AP (1, p − 1) + 1 ⇒ AP (1, p) = p + 2, AP (2, 0) = AP (1, 1) = 3, AP (2, p) = AP (1, AP (2, p − 1)) = AP (2, p − 1) + 2 ⇒ AP (2, p) = 2p + 3, AP (3, 0) = AP (2, 1) = 5, AP (3, p) = AP (2, AP (3, p − 1)) = 2AP (3, p − 1) + 3 ⇒ AP (3, p) = 2p+3 − 3. On laisse au lecteur le soin de trouver la chaîne de calcul qui conduit à l’égalité AP (4, 1) = AP (3, 13) = 216 − 3 = 65533 . c Dunod 2014 I.8 : Structures discrètes et récursivité 149 De même, AP (4, 2) = AP (3, 3, 65533) = 265536 − 3 , etc. Voici le programme et quelques expériences : let rec ackerman_peter (n,p) = match (n,p) with (0,_) -> p + 1 | (_,0) -> ackerman_peter (n-1,1) | _ -> ackerman_peter(n-1,ackerman_peter(n,p-1)) ;; # ackerman_peter(1,0) ;; - : int = 2 # ackerman_peter(1,100) ;; - : int = 102 # ackerman_peter(2,0) ;; - : int = 3 # ackerman_peter(2,100) ;; - : int = 203 # ackerman_peter(3,0) ;; - : int = 5 # ackerman_peter(3,5) ;; - : int = 253 # ackerman_peter(3,10);; - : int = 8189 # ackerman_peter(4,0) ;; - : int = 13 # ackerman_peter(4,1) ;; - : int = 65533 # ackerman_peter(4,2) ;; Stack overflow during evaluation (looping recursion?). Notons que l’évaluation de ackerman_peter(4,1) a pris trois minutes pleines en ocaml sur un portable de puissance raisonnable tournant sous Linux Ubuntu ; et celle de ackerman_peter(4,2) a pris un plein quart d’heure pour échouer à cause d’un trop grand nombre d’appels récursifs. (Bien entendu, le diagnostic de « looping recursion » proposé par ocaml est ici erroné.) I.8.54 L’appel de la fonction sur l’argument (1, 0) boucle clairement ! let rec morris (n,p) = match n with 0 -> 1 | _ -> morris(n-1,morris(n,p)) ;; # morris(1,0) ;; Stack overflow during evaluation (looping recursion?). La saturation de la pile est d’ailleurs presque instantanée. I.8.55 Voici le programme (avec la nécessaire déclaration de type) : type arbrebinaire = F | N of arbrebinaire * arbrebinaire ;; let rec hauteur t = match t with F -> 0 | N(t1,t2) -> 1 + max (hauteur t1) (hauteur t2) ;; c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 150 I.8.57 On a déjà construit ces fonctions pour un exercice analogue : type expreg = Vide | Epsilon | Sing of char | Plus of expreg * expreg | Conc of expreg * expreg | Star of expreg ;; let rec propre e = match e with Vide -> true | Epsilon -> false | Sing _ -> true | Plus(e1,e2) -> (propre e1) && (propre e2) | Conc(e1,e2) -> (propre e1) || (propre e2) | Star _ -> false ;; let rec resid x e = match e with Vide -> Vide | Epsilon -> Vide | Sing(a) -> if a = x then Epsilon else Vide | Plus(e1,e2) -> Plus(resid x e1,resid x e2) | Conc(e1,e2) -> let e3 = Conc(resid x e1, e2) in if (propre e1) then e3 else Plus(e3,resid x e2) | Star(e1) -> Conc(resid x e1, e);; I.8.58 Cet exemple sera étudié de plus près dans le chapitre de combinatoire de [MPA]. c Dunod 2014 II.1 : Espaces vectoriels normés 151 Module II.1 : Espaces vectoriels normés II.1.1 Soit x ∈ X . Supposons que x soit une valeur d’adhérence de la suite (un ). Montrons que x ∈ A . D’après la proposition 3 de la page 402 de la page 402, x est limite d’une sous-suite (unk )k>0 de (un ). Par définition de A, la suite (unk )k>0 est à valeurs dans A, donc x ∈ A (théorème 8 de la page 405). Supposons inversement que x ∈ A \ A, et montrons que x est valeur d’adhérence de (un ). Puisque x ∈ A , toute boule de centre x rencontre A. Comme x 6= un pour tout n ∈ N, on en déduit que, pour tout réel r > 0 , l’ensemble n ∈ N | un ∈ B(x, r) est infini. D’après la propriété suivant la définition 7 de la page 402 de la page 402, x est valeur d’adhérence de la suite (un ). II.1.2 Posons u := x/kxk , a := kxk , v := y/kyk et b := kyk . L’inégalité à démontrer s’écrit alors : 1 kau − bvk > max(a, b)ku − vk. (∗) 2 Quitte à échanger x et y , on peut supposer que a > b . L’inégalité triangulaire donne : kau − bvk > |kauk − kbvk| = |a − b| = a − b. L’inégalité (∗) est donc vraie si par hasard a − b > aku − vk/2 . Si a − b < aku − vk/2 , on change de tactique : kau − bvk = ka(u − v) + (a − b)vk > ka(u − v)k − k(a − b)vk 1 = aku − vk − (a − b) > aku − vk/2 = max(a, b)ku − vk. 2 L’inégalité (∗) est donc vraie dans tous les cas. Montrons maintenant que 1/2 est la meilleure constante possible. Considérons donc un réel C ayant la propriété suivante : pour tout e.v. n. E et tous vecteurs non nuls x, y de E , on a : kau − bvk > C max(a, b)ku − vk. (∗∗) Il s’agit de montrer que C 6 1/2 . Prenons E := R (avec comme norme la valeur absolue), x := n ∈ N∗ et y := −1 . Avec les notations ci-dessus, u := 1 , v := −1 , a := n et b := 1 . L’inégalité (∗∗) s’écrit n + 1 > 2Cn, soit C 6 1/2 + 1/(2n). Cette inégalité étant vraie pour tout n ∈ N∗ , on en déduit C 6 1/2 , en faisant tendre n vers +∞. II.1.3 Voyons à quelles conditions k·kA est une norme sur R[X]. D’abord, pour tout polynôme P , la borne supérieure sup |P (x)| doit être un réel, i.e. elle doit être finie. En prenant P := X , x∈A il en résulte que A est bornée. Inversement, si A est bornée et si P ∈ R[X], la fonction x 7→ |P (x)| est bornée sur A, donc la borne supérieure en question est finie. Supposons désormais que A soit bornée, de sorte que P 7→ kP kA est bien une application de R[X] dans R+ . La propriété de séparation est vérifiée si, et seulement si, le seul polynôme s’annulant sur A est le polynôme nul. Cela revient à dire que A est infinie. En effet, si A est finie, le polynôme Q (X − a) est un polynôme non nul s’annulant sur A. Si au contraire A est infinie et si P a∈A c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 152 est un polynôme nul sur A, P possède une infinité de racines, donc P = 0 . En conclusion, la propriété de séparation est vraie si, et seulement si, A est infinie. La propriété d’homogénéité est vérifiée trivialement. Quant à l’inégalité triangulaire, soient P, Q ∈ R[X]. Pour tout x ∈ A, |P (x) + Q(x)| 6 |P (x)| + |Q(x)| 6 kP kA + kQkA , d’où kP + QkA = sup |P (x) + Q(x)| 6 kP kA + kQkA . L’inégalité triangulaire est donc toujours x∈A vérifiée. Conclusion : k·kA est une norme si, et seulement si, la partie A est bornée et infinie. II.1.4 Soit (x, y) ∈ R2 un vecteur fixé. La fonction f : t 7→ (x + ty)/(1 + t2 ) est continue sur R et a pour limite 0 en ±∞. Il en résulte que f est bornée. Calculons k(x, y)k = kf k∞ . La fonction f est dérivable, et : f ′ (t) = y(1 + t2 ) − 2t(x + ty) −(yt2 + 2tx − y) = · 2 2 (1 + t ) (1 + t2 )2 Si y = 0 , il est clair que k(x, y)k = |x| . Supposons y 6= 0 . En posant r := s’annule en t1 = (−x + r)/y et t2 = (−x − r)/y . Le calcul donne : p x2 + y 2 , f ′ x+r x−r et f (t2 ) = · 2 2 Si x > 0 , |f | atteint son maximum absolu, à savoir (r + x)/2 , en t1 . Si x < 0 , |f | atteint son maximum absolu, à savoir (r − x)/2 , en t2 . Dans tous les cas (y compris le cas y = 0 ), on obtient : p r + |x| |x| + x2 + y 2 = · (∗) k(x, y)k = sup |f (t)| = 2 2 t∈R f (t1 ) = Sur la formule (∗), ou directement sur la définition, il est clair que l’application k·k vérifie les propriétés d’homogénéité et de séparation. L’inégalité triangulaire se démontre comme dans l’exercice précédent. Soient (x, y), (x′ , y ′ ) ∈ R2 . Pour tout t ∈ R, on a : ′ ′ (x + x′ ) + t(y + y ′ ) 6 x + ty + x + ty 6 k(x, y)k + k(x′ , y ′ )k, 1 + t2 1 + t2 1 + t2 et l’inégalité triangulaire s’en déduit en passant à la borne supérieure pour t ∈ R. Compte tenu de la formule (∗), la boule-unité fermée B(0, 1) est formée des (x, y) ∈ R2 vérifiant les inégalités suivantes : |x| 6 2 et x2 + y 2 6 (2 − |x|)2 , c’est-à-dire : |x| 6 2 et y 2 6 4(1 − |x|). Il s’agit de la région limitée par deux portions de paraboles d’axe Ox, symétriques par rapport à Oy : P , définie par les conditions x2 + y 2 6 4(1 − x) et x > 0 , et P ′ , définie par les conditions y 2 6 4(1 + x) et x 6 0 . II.1.5 1. La fonction d : K[X] × K[X] → R+ est symétrique, car ω(−R) = ω(R) pour tout polynôme non nul R . La propriété de séparation est vérifiée : dès que P, Q ∈ K[X] sont distincts, d(P, Q) := exp −ω(P − Q) > 0 . Il reste à vérifier l’inégalité triangulaire. Soit P un polynôme non nul. Par définition, ω(P ) est le seul entier m > 0 tel que P puisse s’écrire P := aX m P1 , où a ∈ K ∗ , P1 ∈ K[X] et P1 (0) = 1 . Autrement dit, ω est la c Dunod 2014 II.1 : Espaces vectoriels normés 153 y 2 y 2 = 4(1 + x) y 2 = 4(1 − x) −1 1 x −2 multiplicité de 0 dans P . Étant donné un entier p > 0 , l’inégalité ω(P ) > p est donc satisfaite si, et seulement si, X p divise P . Soit Q un autre polynôme non nul. On écrit de même Q := bX n Q1 , où b ∈ K ∗ , Q1 ∈ K[X], Q1 (0) = 1 et n := ω(Q). Démontrons l’inégalité : ω(P + Q) > min ω(P ), ω(Q) si P + Q 6= 0. (∗) Supposons donc P + Q 6= 0 . Soit p := min(m, n). Puisque p 6 ω(P ) et p 6 ω(Q), X p divise P et Q , donc X p divise P + Q , c’est-à-dire p 6 ω(P + Q), ce qui établit l’inégalité (∗). Soient maintenant P, Q, R trois polynômes deux à deux distincts. Puisque P − R = (P − Q) + (Q − R), l’inégalité (∗) donne : ω(P − R) > min ω(P − Q), ω(Q − R) . En appliquant la fonction t 7→ e−t (qui est décroissante) aux deux membres de cette inégalité, il vient : d(P, R) 6 max d(P, Q), d(Q, R) . (∗∗) L’inégalité (∗∗) reste vraie lorsque P = R , car d(P, Q) > 0 et d(Q, R) > 0 . Elle est trivialement vraie si P = Q 6= R ou Q = R 6= P . Cette inégalité ultramétrique est donc vraie pour tous P, Q, R ∈ K[X]. Pour deux réels positifs a, b , on a bien sûr max(a, b) 6 a + b . Il en résulte que l’inégalité ultramétrique (∗∗) implique l’inégalité triangulaire. 2. Le résultat de l’exercice cité dans l’énoncé est faux pour deux raisons. Soit d’abord r ∈ ]0, 1]. La boule fermée B(0, r) est formée de 0 et des polynômes non nuls P tels que e−ω(P ) 6 r , ce qui équivaut à ω(P ) > − ln r . Soit alors p := E(− ln r), de sorte que p 6 − ln r < p + 1 , c’est-à-dire e−(p+1) < r 6 e−p . Étant donné un autre réel r′ ∈ e−(p+1 , e−p , il en résulte que B(0, r) = B(0, r′ ). La boule B(0, r) ne change donc pas lorsque son rayon est modifié « raisonnablement ». La deuxième raison est plus surprenante : tout point d’une boule est « centre » de cette boule. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 154 Soient par exemple P ∈ K[X], r ∈ ]0, 1] et B := B(P, r). Considérons un point Q de B . On a donc d(P, Q) 6 r . Si maintenant R ∈ B(Q, r), il vient d(Q, R) 6 r , d’où d(P, R) 6 r à cause de l’inégalité ultramétrique. Ainsi B(Q, r) ⊂ B(P, r), et par conséquent B(Q, r) = B(P, r) vu la symétrie de la fonction d. Le point Q est donc aussi « centre » de B (le rayon étant toujours r ). Dans l’espace métrique K[X], d , « tout triangle est isocèle ». Plus précisément, si P, Q, R ∈ K[X], deux au moins des distances d(P, Q), d(Q, R), d(P, R) sont égales. C’est en fait une conséquence de l’inégalité ultramétrique. Supposons par exemple que d(P, Q) 6= d(Q, R), disons d(P, Q) > d(Q, R) pour fixer les idées. Dans ce cas, l’in égalité ultramétrique d(P, Q) 6 max d(P, R), d(Q, R) implique d(P, R) > d(Q, R) et donc d(P, Q) 6 d(P, R). De même, l’inégalité d(P, R) 6 max d(P, Q), d(Q, R) entraîne d(P, R) 6 d(P, Q), d’où d(P, R) = d(P, Q) comme annoncé. L’inégalité ultramétrique (∗∗) est donc une égalité lorsque les deux distances figurant dans le second membre sont inégales. Soit enfin S la sphère de centre 0 et de rayon 1 . Elle est formée des polynômes P tels que d(P, 0) = 1 , i.e. P 6= 0 et ω(P ) = 0 . Autrement dit, S = P ∈ K[X] | P (0) 6= 0 . Montrons que cette sphère est ouverte (son intérieur est donc S elle-même). Soit P ∈ S . Pour tout Q ∈ B(P, 1), on a d(P, Q) < 1 = d(0, P ), d’où d(0, Q) = 1 , en vertu de l’alinéa précédent. Cela prouve l’inclusion B(P, 1) ⊂ S . Tout point de S est donc intérieur à S , d’où notre assertion. II.1.6 1. Soit P ∈ C[X]. Notons an les coefficients de P (ils sont presque tous nuls). Par définition, on a donc : kP k = sup |an | | n ∈ N . En particulier, |an | 6 kP k pour tout n ∈ N. La propriété de séparation est évidente : on a toujours kP k > 0 , avec égalité si, et seulement si, tous les an sont nuls. Autrement dit, kP k = 0 ⇐⇒ (P = 0). La propriété d’homogénéité est évidente elle aussi. En effet, si P λ ∈ C, on a λP = (λan )X n , d’où : n kλP k = sup |λan | | n ∈ N = |λ| sup |an | | n ∈ N = λkP k. P P Prouvons l’inégalité triangulaire. Soient P := an X n et Q := bn X n deux polynômes et n n P P + Q := (an + bn )X n leur somme. Pour tout n, |an + bn | 6 |an | + |bn | 6 kP k + kQk . n Ainsi le réel kP k + kQk majore tous les |an + bn |, il majore donc leur borne supérieure kP + Qk . 2. L’application L : C[X] → C (morphisme d’évaluation en t) est linéaire, c’est en fait un morphisme de C-algèbres, cf. le module I.1. Supposons d’abord que L soit continue. Il existe donc un réel C tel que |L(P )| 6 CkP k , c’est-à-dire |P (t)| 6 CkP k , et cela pour tout P ∈ C[X]. En particulier, soit n ∈ N. Puisque kX n k = 1 , on a |tn | 6 C . La suite géométrique (tn ) est donc bornée, ce qui est vrai si, et seulement si, |t| 6 1 . Supposons ensuite que l’on ait |t| < 1 . Considérons un polynôme P , de degré d, écrivons d P P := an X n . Puisque |an | 6 kP k pour tout n, l’inégalité triangulaire donne : n=0 |L(P )| := |P (t)| 6 c Dunod 2014 d X n=0 |an | |t| n 6 kP k d X n=0 n |t| = kP k(1 − |t| 1 − |t| d+1 ) 6 kP k · 1 − |t| II.1 : Espaces vectoriels normés 155 Il en résulte que L est continue : prendre C := (1 − |t|)−1 . Supposons enfin que |t| = 1 . Il existe donc un réel x tel que t := eix . Pour tout n ∈ N, posons an := e−inx , de sorte que |an | = 1 . Considérons alors un entier d ∈ N arbitraire, et d P posons P := an X n . Tous les coefficients de P sont de module 1 , donc kP k = 1 . D’un n=0 autre côté, calculons P (t) : L(P ) = P (t) = d X a n tn = n=0 d X e−inx einx = d + 1. n=0 L’application L n’est donc pas bornée sur la sphère unité de C[X], i.e. L n’est pas continue. Conclusion : L est continue si, et seulement si, |t| < 1 . II.1.7 Remarquons d’abord que L(P ) = P (1) pour tout polynôme P : c’est vrai par définition lorsque P = X n pour un certain n ∈ N, et notre assertion en résulte par linéarité, puisque n X | n ∈ N est une base de R[X]. Par ailleurs, pour tout P ∈ R[X], on a : Z b kP k2 = P (x)2 d x. a Nous allons montrer que L n’est pas continue. Raisonnons par l’absurde, en supposant que L est continue. Il existe donc un réel C tel que |L(P )| 6 CkP k pour tout polynôme P , c’est-à-dire : Z b P (x)2 d x. (∗) P (1)2 6 C 2 a Choisissons un réel t > 1 tel que [a, b] soit inclus dans le segment J := [1 − t, 1 + t]. L’inégalité précédente donne a fortiori : Z 1+t 2 2 P (1) 6 C P (x)2 d x pour tout P ∈ R[X]. 1−t Pour tout P ∈ R[X], posons Q(X) := P (tX + 1). Ainsi P (x) = Q (x − 1)/t pour tout x ∈ R, en particulier P (1) = Q(0). On a donc : Z 1+t Z 1 2 Q(0)2 6 C 2 Q (x − 1)/t d x = tC 2 Q(u)2 d u. 1−t −1 2 n Appliquons cette inégalité avec Q := (1 − X ) , où n ∈ N. Il vient : Z 1 Z 1 (1 − u2 )2n d u = 2tC 2 (1 − u2 )2n d u. 1 6 tC 2 −1 0 Pour aboutir à une contradiction, il suffit d’observer que l’intégrale Kn := Z 0 1 (1 − u2 )2n d u tend vers 0 lorsque n tend vers +∞. Le changement de variable u := sin x donne en effet Z π/2 Kn = cos4n+1 x d x . Autrement dit, Kn est l’intégrale de Wallis I4n+1 étudiée dans le 0 module II.8 (section portant sur la formule de Stirling). En se reportant à ce module, on voit que Kn tend vers 0 lorsque n tend vers +∞. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 156 Indiquons une autre solution, utilisant le théorème d’approximation de Weierstraß (cf. le module suivant). Choisissons un réel t > 1 tel que [a, b] soit inclus dans le segment J := [−t, t]. L’inégalité (∗) donne ici a fortiori : Z t P (1)2 6 C 2 P (x)2 d x pour tout P ∈ R[X]. −t On en déduit l’inégalité suivante, valable pour toute fonction continue f : J → R : Z t f (1)2 6 C 2 f (x)2 d x. (∗∗) −t Considérons en effet une telle fonction continue f , et soit ε > 0 . D’après le théorème de Weierstraß, il existe un polynôme P tel que |f (x) − P (x)| 6 ε pour tout x ∈ J . On en déduit |P (x)| − ε 6 |f (x)| 6 |P (x)| + ε pour tout x ∈ J , d’où par intégration : 2 f (1)2 6 |P (1)| + ε = P (1)2 + 2ε |P (1)| + ε2 6 P (1)2 + 2ε |f (1)| + ε + ε2 Z t Z t 2 6 C2 P (x)2 d x + 2ε |f (1)| + 3ε2 6 C 2 |f (x)| + ε d x + 2ε |f (1)| + 3ε2 6 C2 Z −t t f (x)2 d x + 2εC 2 −t Z t −t −t |f (x)| d x + 2tC 2 ε2 + 2ε |f (1)| + 3ε2 . L’inégalité (∗∗) s’en déduit, en faisant tendre ε vers 0 . Considérons maintenant un réel α ∈ ]0, t − 1[. Soit f : J → R la fonction affine par morceaux dont le graphe est représenté ci-dessus. y (1, 1) 1 x 0 −t t 1−α 1 1+α Ainsi f (x) := 0 si x ∈ J \ [1 − α, 1 + α], f (x) := (x + α − 1)/α si x ∈ [1 − α, 1] et f (x) := (α + 1 − x)/α si x ∈ [1, 1 + α] . On a : Z t Z 1+α 2 f (x) d x = f (x)2 d x −t 1−α 1 = 2 α 1 = 2 α c Dunod 2014 Z 1 2 1−α Z α (x + α − 1) d x + u2 d u + 0 Z 0 α Z 1 1+α (α + 1 − x) d x 2α (α − u)2 d u = · 3 2 II.1 : Espaces vectoriels normés 157 Puisque f (1) = 1 , l’inégalité (∗∗) donne 1 6 2αC 2 /3 . Cette inégalité doit être vraie pour tout α ∈ ]0, t − 1[, et l’on aboutit à une contradiction en faisant tendre α vers 0 . La forme linéaire L n’est donc pas continue. II.1.8 Soit T un fermé de X . Montrons que A ∩ T est fermé dans A. Soit (un ) une suite de A ∩ T , convergeant vers un point a de A. Puisque T est fermé dans X et un ∈ T pour tout n, a appartient à T , donc à A ∩ T , d’où notre assertion. Soit inversement F un fermé de A. Notons F l’adhérence de F dans X . Évidemment F ⊂ F , donc F ⊂ A ∩ F . Prouvons l’inclusion inverse A ∩ F ⊂ F . Soit donc x ∈ A ∩ F . Il existe une suite (vn ) de F (donc de A) convergeant vers x dans X , donc dans A. Puisque F est fermé dans A, x appartient à F . Ainsi F = A ∩ F est l’intersection de A avec un fermé de X . En conclusion, les fermés de A sont exactement les intersections A ∩ T , où T est un fermé arbitraire de X . Pour les ouverts, passons aux complémentaires. Les ouverts de A sont exactement les A \ (A ∩ T ) = A ∩ (X \ T ), où T est un fermé arbitraire de X . Ce sont donc exactement les intersections A ∩ S , où S est un ouvert arbitraire de X (poser S := X \ T ). II.1.9 Rappelons que, si Y est une partie de X , Y est, au sens de l’inclusion, le plus petit fermé de X contenant Y , en particulier Y ⊂ Y . On en déduit que, pour deux parties quelconques Y, Z de X , (Y ⊂ Z) =⇒ (Y ⊂ Z). Revenons à A et B . Puisque A ⊂ A ∪ B et B ⊂ A ∪ B , ce qui précède montre que A ∪ B contient A et B , i.e. A ∪ B ⊂ A ∪ B . D’un autre côté, A ∪ B est fermé (comme réunion de deux fermés) et contient A ∪ B , d’où A ∪ B ⊃ A ∪ B . Ainsi A ∪ B = A ∪ B . Ensuite, A ∩ B ⊂ A, d’où A ∩ B ⊂ A et de même A ∩ B ⊂ B . On en déduit l’inclusion A ∩ B ⊂ A ∩ B. Prenons X := R, A := ]−∞, 0[ et B := ]0, +∞[. On a A := ]−∞, 0] et B := [0, +∞[, d’où A ∩ B = {0} , alors que A ∩ B = ∅ = ∅ . L’inclusion A ∩ B ⊂ A ∩ B est donc stricte en général. II.1.10 Ce n’est pas tout à fait évident : en effet, l’intérieur de U est en général plus gros que U , de même l’intérieur de V est en général plus gros que V , donc ces deux intérieurs pourraient a priori ne plus être disjoints. Il va falloir utiliser le fait que U et V sont des ouverts de X . Raisonnons par l’absurde, en supposant que les intérieurs de U et V ne soient pas disjoints. Soit donc a ∈ Int(U ) ∩ Int(V ). Le point a étant intérieur à la fois à U et à V , il existe un réel r > 0 tel que B(a, r) ⊂ U ∩ V . Puisque a ∈ U , tout voisinage de a rencontre U , en particulier U ∩ B(a, r) n’est pas vide. Soit donc b ∈ U ∩ B(a, r). Puisque U ∩ B(a, r) est ouvert, il existe ρ > 0 tel que B(b, ρ) ⊂ U ∩ B(a, r). Ainsi B(b, ρ) ⊂ B(a, r) ⊂ V , donc B(b, ρ) rencontre V . Mais B(b, ρ) ⊂ U , et par suite U ∩V 6= ∅ , contrairement à l’hypothèse. II.1.11 Raisonnons par l’absurde, en supposant que u ◦ v − v ◦ u = IdE . Composons les deux membres de cette égalité par u à gauche (en omettant le signe de composition) : u = u(uv − vu) = u2 v − (uv)u = u2 v − (vu + IdE )u = u2 v − vu2 − u, c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 158 d’où 2u = u2 v − vu2 . Démontrons alors pour tout k ∈ N∗ la formule suivante : uk v − vuk = kuk−1 . (∗) Cette formule est vraie si k vaut 1 ou 2 . Supposons la formule (∗) vraie pour un certain k ∈ N∗ . Comme ci-dessus, on compose à gauche par u : kuk = u(uk v − vuk ) = uk+1 v − (uv)uk = uk+1 v − (vu + IdE )uk = uk+1 v − vuk+1 − uk , d’où l’égalité (∗) au rang k + 1 : (k + 1)uk = uk+1 v − vuk+1 . L’égalité (∗) est donc vraie pour tout k ∈ N∗ . Rappelons que l’on a |||f ◦ g||| 6 |||f ||| · |||g||| pour tous f, g ∈ Lc (E). Soit k ∈ N∗ . L’égalité (∗) implique donc : k|||uk−1 ||| = |||uk v−vuk ||| 6 |||uk v|||+|||vuk ||| 6 |||uk−1 ||| |||uv|||+|||vu||| 6 2|||u|||·|||v|||·|||uk−1 |||. En choisissant k > 2|||u||| · |||v||| , on en déduit que |||uk−1 ||| 6 0 , c’est-à-dire uk−1 = 0 . Nous avons ainsi montré que u est nilpotent. Soit maintenant k le plus petit entier strictement positif tel que uk = 0 . Bien entendu k > 2 , car l’égalité uv − vu = IdE implique u 6= 0 ( E est non nul). L’égalité (∗) au rang k montre que kuk−1 = 0 , d’où uk−1 = 0 (le corps de base est R ou C). La minimalité de k se trouve contredite. L’égalité uv − vu = IdE est donc impossible. II.1.12 Pour tout i , notons ui l’injection canonique x 7→ x de Fi dans X . Cette application est continue, c’est en fait une isométrie de Fi dans X , car la distance sur Fi est la restriction à Fi × Fi de la distance sur X . Soit alors f : X → Y une application. Pour tout i , la restriction f|Fi : Fi → Y de f à Fi est la composée f ◦ ui . Si donc f est continue, chaque f|Fi est continue, comme composée d’applications continues. On remarquera que, jusqu’à présent, le fait que les Fi soient fermés ne nous a pas servi. Supposons inversement que chaque f|Fi soit continue. Pour montrer que f est continue, il suffit de vérifier que, pour tout fermé Z de Y , f −1 (Z) est un fermé de X (théorème 16 de la page 411 de la page 411). Pour tout i ∈ [[1, n]], (f|Fi )−1 (Z) = Fi ∩ f −1 (Z) est un fermé de Fi , parce que f|Fi est continue (même théorème). Ainsi Fi ∩ f −1 (Z) est un fermé de Fi , qui est lui-même un fermé de X , donc Fi ∩ f −1 (Z) est un fermé de X (cf. par exemple l’exercice II.1.8 de la page 469). Dans ces conditions, on a : f −1 (Z) = f −1 (Z) ∩ X = f −1 (Z) ∩ n [ i=1 Fi = n [ i=1 f −1 (Z) ∩ Fi . Cela montre que f −1 (Z) est fermé dans X , comme réunion finie de fermés de X . D’où la continuité de f . II.1.13 Explicitons donc la norme |||·|||1 subordonnée à la norme k·k1 sur K n , donnée par n P kXk1 := |xi | si X := (x1 , . . . , xn ) ∈ K n . Soit A := (ai,j ) ∈ Mn (K). Commeni=1 çons par majorer |||A|||1 . c Dunod 2014 II.1 : Espaces vectoriels normés 159 Soit X := (x1 , . . . , xn ) ∈ K n , posons Y := AX := (y1 , . . . , yn ). Pour tout i ∈ [[1, n]], n n P P l’égalité yi = ai,j xj implique |yi | 6 |ai,j | |xj |. D’où : j=1 kY k1 = j=1 n X i=1 |yi | 6 n X i=1 n X j=1 |ai,j | |xj | = n X j=1 |xj | n X i=1 ! |ai,j | . n P Pour tout j , notons Cj la colonne d’indice j de A, de sorte que la somme i=1 norme kCj k1 de Cj . On obtient ainsi : kY k1 6 |ai,j | est la n n X X kCj k |xj | 6 max kC1 k1 , . . . , kCn k1 |xj | = max kC1 k1 , . . . , kCn k1 kXk1 . j=1 j=1 Pour tout X ∈ K , on a donc kAXk1 6 max kC1 k1 , . . . , kCn k1 kXk1 , d’où : |||A|||1 6 max kC1 k1 , . . . , kCn k1 . n En fait il y a égalité : |||A|||1 = max(kC1 k1 , . . . kCn k1 ). (∗) En effet, soit j un indice tel que kCj k1 soit maximum. Notons Ej le j ème vecteur de la base canonique de K n . Alors kEj k1 = 1 et AEj = Cj , d’où : |||A|||1 > kAEj k1 = kCj k1 = max kC1 k1 , . . . , kCn k1 . L’égalité (∗) est donc établie. On comparera avec l’égalité (28) de la page 443. II.1.14 Soient V un espace vectoriel de dimension finie et f un endomorphisme de V . Il n’est pas vrai, en général, que V soit somme directe de l’image et du noyau de f . Par exemple, l’endomorphisme (x, y) 7→ (y, 0) de R2 a pour image et pour noyau l’axe des abscisses. Ce qui est toujours vrai, par contre, est que dim V = dim(Ker f ) + dim(Im f ) (théorème du rang). Venons-en à l’exercice lui-même. Posons f := u − IdE . Comme nous l’avons rappelé, dim(Ker f ) + dim(Im f ) = dim E . Il en résulte que E est somme directe de Ker f et Im f si, et seulement si, Ker f ∩ Im f = {0} . Raisonnons alors par l’absurde, en supposant que Ker f ∩ Im f n’est pas nul, et soit x ∈ Ker f ∩ Im f un vecteur non nul. D’une part u(x) = x, et d’autre part il existe un vecteur y ∈ E tel que x = f (y) = u(y) − y , d’où u(y) = y + x. On en déduit : u2 (y) = u(y + x) = u(y) + x = y + 2x. Démontrons plus généralement la formule suivante pour tout k ∈ N : uk (y) = y + kx. (∗) Cette formule est vraie si k ∈ {0, 1, 2} . Si elle est vraie pour un certain k . il vient : uk+1 (y) = u uk (y) = u(y + kx) = (y + x) + kx = y + (k + 1)x, d’où la formule au rang k + 1 . Jusqu’à présent, nous n’avons utilisé ni le fait que E est un k e.v. n. ni l’hypothèse |||u||| 6 1 . Cette dernière hypothèse entraîne |||uk ||| 6 |||u||| 6 1 pour tout k ∈ N. Soit alors k ∈ N∗ . De l’égalité (∗), on tire : kkxk = kkxk = k(uk − IdE )(y)k 6 |||uk − IdE ||| · kyk 6 |||uk ||| + |||IdE ||| · kyk 6 2kyk, c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 160 soit kxk 6 2k −1 kyk . En faisant tendre k vers +∞, on en déduit que kxk = 0 , c’est-à-dire x = 0 , c’est la contradiction souhaitée. II.1.15 Observons d’abord que l’hyperplan H est fermé, parce que la forme linéaire f est continue. Il en résulte qu’un vecteur y de E appartient à H , i.e. vérifie f (y) = 0 , si, et seulement si, d(y, H) = 0 . L’égalité à établir est donc vraie pour tout y ∈ H . Soit désormais x un vecteur de E fixé n’appartenant pas à H : f (x) 6= 0 . L’espace E est donc somme directe de H et de la droite Kx. Par définition de la norme fonctionnelle, on a : |||f ||| = sup y6=0 |f (y)| = kyk sup y∈E\H |f (y)| · kyk L’application (λ, h) 7→ λx + h étant une bijection de K ∗ × H sur E \ H , on en déduit : |f (λx + h)| |λ| |f (x)| |f (x)| = sup = sup · kλx + hk kλx + hk kx + λ−1 hk (λ,h) (λ,h) (λ,h) |||f ||| = sup Lorsque (λ, h) décrit K ∗ × H , le vecteur u := −λ−1 h décrit évidemment H . D’où : −1 |f (x)| |||f ||| = sup = |f (x)| sup kx − uk−1 = |f (x)| inf kx − uk) u∈H u∈H kx − uk u∈H −1 = |f (x)| inf d(x, u) = |f (x)| d(x, H)−1 , u∈H d’où l’égalité annoncée. II.1.16 La fonction d : R × R → R est bien à valeurs dans R+ . La symétrie de la fonction d est évidente. L’inégalité triangulaire aussi, car, pour tous x, y, z ∈ R, l’inégalité triangulaire usuelle dans R donne : d(x, z) = |f (x) − f (z)| = f (x) − f (y) + f (y) − f (z) 6 |f (x) − f (y)| + |f (y) − f (z)| = d(x, y) + d(y, z). La propriété de séparation signifie ceci : pour tous x, y ∈ R, l’égalité f (x) = f (y) est vraie si, et seulement si, x = y . Cela revient à dire que f est injective. Mais, puisque f est continue, elle est injective si, et seulement si, elle est strictement monotone (cf. le cours de [L1]). Conclusion : d est une distance si, et seulement si, f est strictement monotone, ce que nous supposons. Quitte à remplacer f par −f , ce qui ne change pas d, nous pouvons supposer que f est strictement croissante. Notons δ la distance usuelle (x, y) 7→ |x − y| sur R et J := f (R) l’image de f . La définition de d montre que f est une isométrie de (R, d) sur (J, δ). Il en résulte que l’espace métrique (R, d) est complet si et seulement si J est une partie complète, c’est-à-dire fermée de R au sens usuel. C’est évidemment le cas lorsque J = R, i.e. lorsque f est bijective. Montrons que cette condition suffisante est aussi nécessaire. Supposons donc que J soit fermée dans R. Il faut d’abord se rappeler que J est un intervalle de R, simplement parce que f est continue. Ainsi, ou bien J = R, ou bien J est de l’une des formes suivantes : [−∞, a] ou [a, +∞[ (avec a ∈ R) ou [a, b] (avec a, b ∈ R et a < b ). Pour conclure, il suffit de montrer que la borne supérieure de J ne peut pas être un réel (on raisonne c Dunod 2014 II.1 : Espaces vectoriels normés 161 de manière analogue pour la borne inférieure). Supposons au contraire que b := sup J ∈ R. Il existe donc un réel β tel que b = f (β). Pour tout x > β , on a f (x) > f (β) = b puisque f est strictement croissante. C’est absurde, car f (x) ∈ J , d’où f (x) 6 sup J = b . Conclusion : l’espace métrique (R, d) est complet si, et seulement si, f est une bijection strictement monotone de R sur lui-même. II.1.17 Reprenons les notations de l’exercice II.1.5 de la page 469. Pour tout n ∈ N, posons Pn := 1 + X + X 2 + · · · + X n . Soient n, p ∈ N tels que, par exemple, n < p. Alors Pp − Pn = X n+1 + · · · + X p , donc ω(Pp − Pn ) = n + 1 et par conséquent d(Pn , Pp ) = e−(n+1) . Il en résulte que (Pn ) est une suite de Cauchy de K[X]. Pour montrer que l’espace métrique K[X], d n’est pas complet, il suffit de prouver que la suite (Pn ) ne converge pas. +∞ P n Moralement, la limite de la suite (Pn ) ne peut être que X = (1 + X)−1 , qui n’est n=0 malheureusement pas un polynôme. Ce n’est là qu’un argument heuristique. Raisonnons donc par l’absurde, en supposant que la suite (Pn ) a une limite P . Bien entendu, P est un polynôme, notons an ses coefficients. Considérons un entier d ∈ N. Pour tout n ∈ N assez grand, on a d(P, Pn ) 6 e−(d+1) , ce qui signifie que P = Pn ou bien P 6= Pn et ω(P − Pn ) > d + 1 . Autrement dit, dès que n est assez grand (en tout cas n > d), X d+1 divise P − Pn ; en particulier le coefficient de X d dans P − Pn est nul, i.e. ad = 1 . Ainsi ad = 1 pour tout d ∈ N assez grand, ce qui est absurde : un polynôme n’a qu’un nombre fini de coefficients non nuls (comparer avec l’argument heuristique). II.1.18 Nous utilisons ici librement le module II.5. La fonction F est de classe C 1 , car ses composantes (x, y) 7→ x + f (y) et (x, y) 7→ y + g(x) le sont. Comme galop d’essai, il n’est pas difficile de voir que F est injective (mais cela sera insuffisant). Observons que, pour tous a, b ∈ R, l’inégalité des accroissements finis donne : |f (a) − f (b)| 6 k |a − b| et |g(a) − g(b)| 6 k |a − b|. Considérons alors deux points Mi = (xi , yi ) ∈ R2 ( i = 1, 2 ) tels que F (M1 ) = F (M2 ). On a donc x1 + f (y1 ) = x2 + f (y2 ) et y1 + g(x1 ) = y2 + g(x2 ). De la première égalité, on tire : |x1 − x2 | = |f (y2 ) − f (y1 )| 6 k |y2 − y1 | . De la deuxième, on tire de même |y1 − y2 | = |g(x2 ) − g(x1 )| 6 k |x2 − x1 | . D’où |x1 − x2 | 6 k 2 |x1 − x2 | et donc x1 = x2 parce que k 2 < 1 . De la même manière, on voit que y1 = y2 . Pour établir que F est un C 1 -difféomorphisme de R2 sur lui-même, il suffit (et il faut) prouver les deux assertions suivantes : 1. en tout point M de R2 , la différentielle de F est un automorphisme linéaire de R2 , i.e. le jacobien (déterminant de la matrice jacobienne) de F en M est non nul ; 2. l’application F est une bijection de R2 sur lui-même. L’assertion 1 utilise le calcul différentiel, l’assertion 2 utilise la topologie. 1. Soit M := (a, b) ∈ R2 . En notant u, v : R2 → R les deux composantes de F , on a : ∂u (M ) ∂u (M ) 1 f ′ (y) ∂x ∂y det JM (F ) = ∂v = ∂v g ′ (x) 1 (M ) ∂x (M ) ∂y = 1 − f ′ (y)g ′ (x) > 1 − |f ′ (y)| |g ′ (x)| > 1 − k 2 > 0. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 162 La matrice jacobienne JM (F ) est donc inversible. L’assertion 1 est établie. À ce stade, nous savons déjà que F est un C 1 -difféomorphisme local : tout point M ∈ R2 est centre d’une boule ouverte B telle que la restriction de F à B soit un C 1 -difféomorphisme de B sur un ouvert de R2 , à savoir F (B). 2. Soit A = (a, b) un point de R2 fixé. Il s’agit de prouver que A possède un unique antécédent par F . Autrement dit, l’équation F (M ) = A doit avoir dans R2 une solution unique M . Avec M := (x, y), l’égalité F (M ) = A s’écrit x + f (y), y + g(x) = (a, b), ou encore a−f (y), b−g(x) = (x, y). Nous voulons donc montrer que l’application ϕ : R2 → R2 défi nie par (x, y) 7→ a−f (y), b−g(x) possède un unique point fixe. Pour cela, R2 étant complet, il suffit de vérifier que ϕ est contractante (théorème du point fixe). Soient donc M1 := (x1 , y1 ) et M2 = (x2 , y2 ) deux points de R2 . On a : 2 2 d ϕ(M1 ), ϕ(M2 ) = f (y2 ) − f (y1 ), g(x2 ) − g(x1 ) 2 2 = f (y2 ) − f (y1 ) + g(x2 ) − g(x1 ) 6 k 2 (y2 − y1 )2 + (x2 − x1 )2 = k 2 d(M1 , M2 )2 , ce qui montre que ϕ est k -lipschitzienne, donc contractante puisque k ∈ [0, 1[. II.1.19 a) Montrons que f (Rn ) est un fermé de Rn . Soit (yk )k>0 une suite de f (Rn ) convergeant vers un point y de Rn . Il s’agit de voir que y ∈ f (Rn ). Pour tout k ∈ N, choisissons xk ∈ Rn tel que f (xk ) = yk . Pour tous indices h, k , l’hypothèse faite sur f donne kxh − xk k 6 kf (xh ) − f (xk )k = kyh − yk k . La suite (yh ) étant de Cauchy (parce qu’elle converge), il en résulte que la suite (xk ) est de Cauchy. Puisque Rn est complet, la suite (xk ) converge, notons x sa limite. La fonction f étant continue, f (x) est limite de la suite f (xk ) = (yk ), donc f (x) = y . D’où y ∈ f (Rn ), comme annoncé. b) Soit a ∈ Rn . Montrons que la différentielle Da (f ) de f en a est inversible. Raisonnons par l’absurde, en supposant que h est un vecteur non nul appartenant au noyau de Da (f ). Lorsque t ∈ R tend vers 0 , la définition de Da (f ) donne : f (a + th) = f (a) + Da (f )(th) + o kthk = f (a) + o(t). En d’autres termes, kf (a + th) − f (a)k est négligeable devant t lorsque t tend vers 0 . C’est absurde car, vu l’hypothèse faite sur f , kf (a + th) − f (a)k > |t| khk pour tout t. En tout point a ∈ Rn , la différentielle Da (f ) est donc inversible, et il en résulte (théorème d’inversion locale) que f est un C 1 -difféomorphisme local en a (cf. l’exercice précédent). En particulier f est alors une application ouverte : pour tout ouvert U de Rn , f (U ) est un ouvert de Rn . Soit en effet b ∈ f (U ). Il existe a ∈ U tel que b = f (a). D’après le théorème d’inversion locale, il existe un ouvert U ′ contenant a et un ouvert V ′ contenant b tel que la restriction f|U ′ soit un C 1 -difféomorphisme de U ′ sur V ′ . Cette restriction est a fortiori un homéomorphisme de U ′ sur V ′ . Puisque U ∩ U ′ est un ouvert de U ′ , son image est alors un ouvert de V ′ , donc de Rn , contenu dans f (U ) et contenant b . Ainsi f (U ) est un voisinage de chacun de ses points, donc est un ouvert. c) L’application f étant ouverte, f (Rn ) est un ouvert de Rn . D’après l’alinéa a), c’est aussi un fermé. Mais Rn est connexe et f (Rn ) n’est pas vide, donc f (Rn ) = Rn : f est surjective. c Dunod 2014 II.1 : Espaces vectoriels normés 163 L’injectivité est évidente : si x, y ∈ Rn sont tels que f (x) = f (y), l’hypothèse sur f implique : kx − yk 6 kf (x) − f (y)k = 0 , d’où x = y . Conclusion : f est une bijection de Rn sur lui-même et la différentielle de f en tout point est inversible (i.e. f est un C 1 -difféomorphisme local en tout point), donc f est un C 1 difféomorphisme (global) de Rn sur lui-même. Précisons ce point. D’abord f est bijective et ouverte. Pour tout ouvert U de Rn , f (U ) est ouvert, ce qui montre que f −1 est continue. Ainsi f est déjà un homéomorphisme de Rn sur lui-même. Il reste à montrer que f −1 est de classe C 1 au voisinage de tout point b ∈ Rn . Soit a := f −1 (b). D’après le théorème d’inversion locale, il existe un ouvert U contenant a et un ouvert V contenant b tel que la restriction f|U soit un C 1 -difféomorphisme de U sur V . Le difféomorphisme réciproque de f|U est évidemment f|−1 . Ainsi f −1 est de classe C 1 sur V V , qui est un voisinage de b , d’où notre assertion. II.1.20 L’unicité résulte de la proposition 12 de la page 410 de la page 410. Soient en effet g, g ′ : X → Y deux applications continues prolongeant f . Alors g et g ′ coïncident sur A, qui est une partie dense de X , donc g = g ′ . Il reste à construire un prolongement continu de f à X . Soit x ∈ X . Puisque A est dense dans X , il existe une suite (an ) de A convergeant vers x. Nous avons envie de poser : g(x) := lim f (an ). n→+∞ (∗) Encore faut-il que la suite figurant dans le second membre converge ! Puisque Y est complet, il suffit pour cela que f (an ) soit une suite de Cauchy. Soit donc ε > 0 . L’application f étant uniformément continue, il existe un réel α tel que, pour tous a, b ∈ A, la condition d(a, b) 6 α implique d f (a), f (b) 6 ε . La suite (an ) étant de Cauchy (parce qu’elle converge), il existe de plus un entier N > 0 tel que d(an , ap ) 6 α dès que n > N et p > N . Dès que n > N et p > N , on a donc d f (an ), f (ap ) 6 ε , ce qui montre que la suite f (an ) est une suite de Cauchy. Cette suite converge donc, i.e. le second membre de la formule (∗) est défini. Cela ne suffit pas. Il faut montrer que le second membre de ladite formule ne dépend que de x, i.e. ne dépend pas du choix de la suite (an ) de A convergeant vers x. Soit donc (bn ) une autre suite de A convergeant vers x. Soient ε > 0 et α comme ci-dessus. Il existe un rang M à partir duquel d(an , x) 6 α/2 et d(bn , x) 6 α/2 . Pour tout n > M , il en résulte que d(an , bn ) 6 α , d’où d f (an ), f (bn ) 6 ε . Les deux suites f (an ) et f (an ) ont donc même limite, de sorte que la formule (∗) définit effectivement une application g : X → Y . Il est clair que g prolonge f : dans ce qui précède, si x ∈ A, on peut poser an := x pour tout n, et alors g(x) = f (x). Il reste à voir que g est uniformément continue. Soient encore ε > 0 et α comme ci-dessus. Il suffit de montrer que, pour tous x, x′ ∈ X , la condition d(x, x′ ) 6 α/2 implique d f (x), f (x′ ) 6 3ε . Soient donc x, x′ ∈ X tels que d(x, x′ ) 6 α/2 . Choisissons une suite (an ) de A convergeant vers x et une suite (a′n ) de A convergeant vers x′ . Par défini tion, la suite f (an ) converge vers g(x), et la suite f (a′n ) converge vers g(x′ ). Pour tout entier n suffisamment grand, - d’une part d g(x), f (an ) 6 ε et d g(x′ ), f (a′n ) 6 ε ; - d’autre part d(x, an ) 6 α/4 et d(x′ , a′n ) 6 α/4 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 164 Pour un tel n, d(an , a′n ) 6 d(an , x) + d(x, x′ ) + d(x′ , a′n ) 6 α/4 + α/2 + α/4 = α , d’où d f (an ), f (a′n ) 6 ε , en vertu de la définition de α en fonction de ε . Un tel n étant fixé, on a bien : d g(x), g(x′ ) 6 d g(x), f (an ) + d f (an ), f (a′n ) + d f (a′n ), g(x′ ) 6 ε + ε + ε = 3ε, ce qui établit l’uniforme continuité de g . II.1.21 1. Rappelons que toute suite de Cauchy est bornée. Si donc u := (un ) ∈ A, la borne supérieure kuk∞ := sup |un | est finie, i.e. est un réel. Cela étant, soient u := (un ) et n v := (vn ) deux éléments de A. Soit ε > 0 . Il existe un entier N tel que, pour tous entiers n, p > N , on ait |un − up | 6 ε et |vn − vp | 6 ε . Dès que n, p > N , on en déduit d’abord |(un + vn ) − (up + vp )| 6 2ε , ce qui montre que la suite u + v est de Cauchy. Ensuite : |un vn − up vp | = |un (vn − vp ) + vp (un − up )| 6 |un (vn − vp )| + |vp (un − up )| 6 ε |un | + |vp | 6 ε kuk∞ + kvk∞ . Il en résulte que la suite uv est de Cauchy. Comme A contient l’élément neutre multiplicatif de la Q -algèbre S , à savoir la suite constante égale à 1 , A est une sous- Q -algèbre de S . Toute suite de Cauchy u := (un ) de Q est aussi une suite de Cauchy de R, elle possède donc une (unique) limite dans R, notons-la f (u). On définit ainsi une application f : A → R. Les opérations classiques sur les suites réelles convergentes montrent que f est un morphisme de Q -algèbres. Ce morphisme est surjectif, parce que tout réel x est limite d’une suite (un ) de Q : prendre par exemple pour un la valeur approchée de x à 10−n près par défaut. Le noyau de f est formé des suites u de Q convergeant vers 0 dans R, donc dans Q , autrement dit Ker f = I . D’après le théorème d’isomorphisme, f induit un isomorphisme de A/I sur R, et par suite A/I est un corps. Cela signifie que I est un idéal maximal de A. 2. Dans le cours de [L1], R a été défini à partir de Q à l’aide des développements décimaux. Une façon différente de définir R à partir de Q est suggérée par ce qui précède : il n’y a qu’à poser R := A/I . Où est l’erreur ? D’abord A est formée des suites u = (un ) de Q qui sont de Cauchy. Qu’est-ce que cela veut dire ? Voici la réponse : pour tout réel ε > 0 , il existe etc. C’est un cercle vicieux : pour définir R, nous utilisons déjà les réels. Il suffit de modifier la définition d’une suite de Cauchy de Q : pour tout rationnel ε > 0 , il existe etc. On procède de même pour expliquer qu’une suite de Q converge vers 0 , d’où la définition de I . Il reste un point plus subtil : pour prouver que I était un idéal maximal de A, nous avons invoqué ci-dessus le fait que R (supposé connu là encore) était un corps. Il faut donc démontrer directement que I est un idéal maximal de A. C’est une vérification mécanique ne présentant pas de difficulté, nous la laissons au lecteur. II.1.22 D’après le théorème du point fixe, f n possède un unique point fixe a. Montrons que a est un point fixe de f . Posons b := f (a). Alors : f n (b) = f n f (a) = f n+1 (a) = f f n (a) = f (a) = b, donc b est un point fixe de f n . Par unicité de a, b = a, c’est-à-dire f (a) = a : a est un point fixe de f . L’unicité est évidente : si a′ est un point fixe de f , c’est clairement un point fixe de f n , et donc a′ = a. c Dunod 2014 II.1 : Espaces vectoriels normés 165 II.1.23 Supposons que X soit fini, écrivons X := {x1 , . . . , xn } . Chaque singleton {xi } est compact (c’est un point), donc X est compact comme réunion finie de parties compactes. Par ailleurs chaque point est fermé, mais aussi ouvert, comme complémentaire de la réunion (finie) des autres points). Il en résulte que X est discret. Supposons inversement que X soit compact et discret. Pour tout x ∈ X , {x} est donc un ouvert de X . Les singletons formant un recouvrement (en fait une partition) de X , la propriété de Borel-Lebesgue montre que X est réunion finie de singletons, autrement dit X est fini. Donnons une autre preuve (la propriété de Borel-Lebesgue a été admise dans ce volume). Raisonnons par l’absurde, en supposant que X est infini. Il existe alors une application injective s de N dans X . Posons un := s(n) pour tout n ∈ N. Puisque X est compact, la suite (un ) possède une valeur d’adhérence ℓ . Puisque X est discret, il existe un réel r > 0 tel que B(ℓ, r) = {ℓ} . Cela contredit le fait que ℓ soit valeur d’adhérence de (un ) : d’après la propriété suivant la définition 7 de la page 402 de la page 402, n ∈ N | un ∈ B(ℓ, r) doit être infini, ce qui est absurde puisque les un sont distincts et B(ℓ, r) = {ℓ} . II.1.24 Cet exercice est complètement trivial (et sans intérêt) lorsque n = 1 . Supposons donc n > 2. 1. Il suffit de montrer que X est fermé et borné (parce que l’on travaille dans Rn ). Pour tout P x := (x1 , . . . , xn ) ∈ X , on a xi > 0 , mais aussi xi = 1 − xj 6 1 . Ainsi 0 6 xi 6 1 pour tout i , d’où évidemment kxk = P i x2i 1/2 j6=i 6 √ n. La partie X est donc bornée. Elle est fermée, parce que c’est une intersection de n + 1 demi-espaces fermés : les demi-espaces définis par les conditions xi > 0 ( i = 1, . . . , n) et le demi-espace défini par la condition x1 + x2 + · · · + xn 6 1 . Bien entendu, ces demi-espaces sont fermés parce que l’on est en dimension finie. 2. L’application (x1 , . . . , xn ) 7→ x1 x2 · · · xn de Rn dans R est n-linéaire, elle est donc continue parce que l’on est en dimension finie. Puisque la fonction f est la restriction de cette application à X , elle est continue. Puisque X est compact et f : X → R est continue, f est bornée et atteint son maximum absolu M . Le point a = (1/n, 1/n, . . . , 1/n) appartient à X , et f (a) = n−n 6 M , en particulier M > 0 . Soit alors x := (x1 , . . . , xn ) ∈ X tel que f (x) = M . D’abord les xi sont non nuls, donc 0 < xi < 1 pour tout i (parce que n > 2 ). Supposons par l’absurde qu’il existe deux indices i, j distincts tels que xi 6= xj , par exemple xi > xj . Considérons un réel ε vérifiant 0 < ε < xi − xj . Posons ensuite yi := xi − ε ∈ ]0, 1[, yj := xj + ε ∈ ]0, 1[ et yk := xk pour tout indice k distinct de i et j . Il est clair que y := (y1 , . . . , yn ) appartient à X . De plus f (y) > f (x) = M , d’où la contradiction désirée. En effet : yi yj = (xi − ε)(xj + ε) = xi xj + ε(xi − xj − ε) > xi xj . En conclusion, tous les xi sont égaux. Leur somme valant 1 , chacun d’eux vaut 1/n, d’où M = n−n . 3. Étant donnés des réels positifs t1 , . . . , tn , il s’agit de prouver l’inégalité suivante : √ n t1 t2 · · · tn 6 t1 + t2 + · · · + tn · n (∗) c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 166 Si tous les ti sont nuls, le résultat est trivial. Dans le cas contraire, s := P ti > 0 . Posons i pour tout i : xi := ti /s. Les xi sont positifs et de somme 1 , donc x := (x1 , . . . , xn ) ∈ X . D’après la question 2, f (x) 6 M = n−n . D’où : n t1 + t2 + · · · + tn n −n n t1 t2 · · · tn = s (x1 x2 · · · xn ) 6 n s = . n L’inégalité arithmético-géométrique (∗) en résulte, en prenant les racines n èmes des deux membres. II.1.25 En premier lieu l’hypothèse de compacité est nécessaire, comme le montre l’exemple de la √ fonction x 7→ x2 + 1 de R dans R, traité dans la section 2.2 de la page 427. Ensuite f est continue, car elle est 1 -lipschitzienne. Par ailleurs, la partie unicité de l’exercice est évidente. Raisonnons en effet par l’absurde, en supposant que f possède deux points fixes distincts a et b . Par hypothèse a 6= b , donc d(a, b) = d f (a), f (b) < d(a, b), ce qui est absurde. Il reste à montrer que f possède au moins un point fixe. La fonction g : x 7→ d f (x), x de X dans R est continue, car la fonction distance est continue sur X × X et f est continue. Puisque X est compact, g est bornée et atteint, en particulier sa borne inférieure m. Soit donc a ∈ X tel que g(a) = m. Montrons que a est un point fixe de f . Raisonnons par l’absurde, en supposant f (a) 6= a, c’est-à-dire m > 0 . Vu l’hypothèse faite sur f , la condition f (a) 6= a implique : g f (a) = d f 2 (a), f (a) < d f (a), a) = g(a) = m, ce qui contredit la définition de m. En conclusion, f (a) = a. II.1.26 a) Il faut montrer en premier lieu que F appartient à K , c’est-à-dire que F est compact et non vide. La suite (Fk )k>0 est évidemment décroissante. En vertu de la proposition 49 de la page 435 de la page 435, il suffit donc de montrer que chaque Fk est un compact ( Fk contient Ak qui n’est pas vide) ; comme Fk est par définition fermé, il s’agit en fait de montrer que c’est une partie bornée de Rn . La suite (Ak )k>0 est bornée, car c’est une suite de Cauchy. Il existe donc un réel C > 0 tel que δ(A0 , Ak ) 6 C pour tout k . Fixons un point a ∈ A0 . Soit k ∈ N. La définition de δ (formule (25) de la page 439) montre que d(a, Ak ) 6 δ(A0 , Ak ) 6 C . Soit x ∈ Ak . Puisque A0 est compact non vide, il existe y ∈ A0 tel que d(x, y) = d(x, A0 ) 6 C . Alors d(a, y) 6 Diam(A0 ), d’où d(x, a) 6 d(x, y) + d(y, a) 6 C + Diam(A0 ). La boule fermée de centre a et de rayon C + Diam(A0 ) contient donc Ak , ceci pour tout k . Si k est fixé, cette boule contient chaque Ap , elle contient donc la réunion des Ap pour p > k , et par suite elle contient Fk , qui est l’adhérence de ladite réunion. Il en résulte que Fk est bornée. En conclusion, F appartient à K . b) Il reste à montrer que F est limite (dans K ) de la suite (Fk ). Soit donc ε > 0 . Il existe un entier N > 0 tel que δ(Ah , Ak ) 6 ε dès que h > N et k > N . Il suffit de vérifier que δ(F, Ak ) 6 ε pour tout k > N . Fixons donc un entier k > N . Pour tout entier p > k et tout x ∈ Ap , on a d(x, Ak ) 6 δ(Ap , Ak ) 6 ε . L’inégalité d(x, Ak ) 6 ε est donc vraie pour tout x appartenant à la réunion des Ap pour p > k . La fonction x 7→ d(x, Ak ) étant continue sur Rn , l’inégalité d(x, Ak ) 6 ε reste vraie pour tout x ∈ Fk , et a fortiori pour tout x ∈ F . Ainsi : sup d(x, Ak ) 6 ε. (∗) x∈F c Dunod 2014 II.1 : Espaces vectoriels normés 167 Soit y ∈ Ak . Considérons un entier p > k . Puisque d(y, Ap ) 6 δ(Ak , Ap ) 6 ε , il existe zp ∈ Ap ⊂ Fk tel que d(y, zp ) 6 ε . Puisque Fk est compact, la suite (zp )p>k possède une valeur d’adhérence z ∈ Fk . Si p > k est fixé, z est encore valeur d’adhérence de la suite (zm )m>p à valeurs dans Fp , donc z ∈ Fp (car Fp est fermé). Ainsi z appartient à tous les Fp , p > k , donc z ∈ F . Enfin d(y, z) 6 ε puisque d(y, zp ) 6 ε pour tout p > k . Nous avons donc établi l’inégalité d(y, F ) 6 ε , ceci pour tout y ∈ Ak , d’où : sup d(y, F ) 6 ε. y∈Ak En rapprochant cette inégalité de l’inégalité (∗), il vient : δ(F, Ak ) 6 ε , comme désiré. II.1.27 Nous allons appliquer le résultat de l’exercice précédent, en prenant n := 1 . Ainsi K est l’ensemble des compacts non vides de R, muni de la distance de Haussdorf δ définie par la formule (25) de la page 439. Observons d’abord que f est bien une application de K dans lui-même car, si A ∈ K , h(A) est un compact non vide de R (parce que h est un homéomorphisme de R sur lui-même), de même h′ (A) est compact non vide, et enfin f (A) := h(A) ∪ h′ (A) est compact non vide. Remarquons également que les fonctions h et h′ sont 1/3 -lipschitziennes. 1. Soient A, B ∈ K et t := δ(A, B). Il s’agit de prouver l’inégalité δ f (A), f (B) 6 t/3 . Vu la définition de δ , il suffit (par symétrie) de montrer que d y, f (B) 6 t/3 pour tout y ∈ f (A). Soit donc y ∈ f (A). Si y ∈ h(A), a := 3y ∈ A, et : d y, f (B) = d y, h(B) ∪ h′ (B) 6 d y, h(B) = d h(a), h(B) = d(a, B)/3 6 δ(A, B)/3 = t/3. De même, si y ∈ h′ (A), a′ := 3y − 2 ∈ A, et : d y, f (B) = d y, h(B) ∪ h′ (B) 6 d y, h′ (B) = d h′ (a′ ), h′ (B) = d(a′ , B)/3 6 δ(A, B)/3 = t/3. L’application f : K → K est donc 1/3 -lipschitzienne. 2. L’exercice précédent montre que l’espace métrique (K, δ) est complet. D’après la question 1, f est contractante. Le théorème du point fixe montre donc que f possède un unique point fixe F . Il reste à montrer que F est l’ensemble triadique de Cantor K3 défini dans la proposition 53 de la page 436 de la page 436 et sa preuve. Toujours d’après le théorème du point fixe, F est limite de la suite (Ak )k>0 de K définie par son premier terme A0 := [0, 1] ∈ K et la relation de récurrence Ak+1 := f (Ak ). Puisque f (A0 ) ⊂ A0 , on a f (Ak ) ⊂ Ak pour tout k (récurrence immédiate), autrement dit la suite (Ak )k>0 est décroissante pour l’inclusion. Avec les notations de l’exercice précédent, il en résulte que Fk = Ak pour tout k , d’où : \ F = Ak . k>0 Il suffit maintenant d’expliciter les Ak . Reprenons les notations de la preuve de la proposition 53 de la page 436 de la page 436. Pour tout k ∈ N, Tk est donc l’ensemble des entiers de k−1 P j [[0, 3k − 1]] dont l’écriture en base 3 ne comporte pas le chiffre 1 , i.e. l’ensemble des 3 aj , j=0 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 168 chaque aj valant 0 ou 2 . Compte tenu de la preuve en question, tout revient à établir pour tout k ∈ N l’égalité suivante : [ Ak = 3−k t, 3−k (t + 1) . (∗) t∈Tk Cette formule est vraie pour k := 0 , car T0 = {0} et A0 = [0, 1]. Supposons qu’elle soit vraie pour un certain k . Observons d’abord que Tk+1 est la réunion disjointe de Tk et de 2 · 3k + Tk := t + 2 · 3k | t ∈ Tk . Soit t ∈ Tk . L’image de 3−k t, 3−k (t + 1) par l’homo thétie h est 3−(k+1) t, 3−(k+1) (t + 1) . L’image de 3−k t, 3−k (t + 1) par l’homothétie h′ est 3−(k+1) t′ , 3−(k+1) (t′ + 1) , où t′ := t + 2 · 3k . Lorsque t décrit Tk , t′ décrit 2 · 3k + Tk , d’où : i h io [ nh Ak+1 = f (Ak ) = 3−(k+1) t, 3−(k+1) (t + 1) ∪ 3−(k+1) t′ , 3−(k+1) (t′ + 1) t∈Tk = i [ h 3−(k+1) τ, 3−(k+1) (τ + 1) , τ ∈Tk+1 ce qui établit la formule (∗) au rang k + 1 . Cette formule est donc vraie pour tout k , et par conséquent F = K3 . En conclusion, K3 est bien l’unique point fixe de f . II.1.28 Pour j = 1, 2, 3 , notons rj le rayon du cercle Cj , puis écrivons Oj = (aj , bj ) et Mj := (xj , yj ). Un point variable M de C1 s’écrit M := M (t) := x(t), y(t) ), avec x := x(t) := a1 + r1 cos t et y := y(t) := b1 + r1 sin t, où t décrit R. Considérons la fonction f : R → R définie par : f (t) = M (t)M2 + M (t)M3 + M2 M3 . Le triangle M1 M2 M3 étant un triangle de périmètre minimum, la fonction f atteint a fortiori son maximum absolu en un réel t1 tel que M1 = M (t1 ). À partir de là, l’idée est de montrer que la fonction f est de classe C ∞ , puis de vérifier que la condition géométrique de l’énoncé traduit l’égalité f ′ (t1 ) = 0 . Soit A := (a, b) un point de R2 fixé. À tout point M := (x, y), associons le réel g(M ) := M A2 = (x − a)2 + (y − b)2 . La fonction g : R2 → R est de classe C ∞ (elle est polynomiale), et sa différentielle en un point P := (c, d) est donnée par la formule : → − → → − −→ − DP (g)( h ) = 2 u(c − a) + v(d − b) = 2( AP | h ) pour tout h := (u, v) ∈ R2 . √ √ La fonction x 7→ x est de classe C ∞ sur ]0, +∞[, sa dérivée étant x 7→ 1/(2 x). La √ fonction g : M 7→ M A est donc de classe C ∞ sur R2 \ {A} , et sa différentielle en un point P := (c, d) distinct de A est donnée par la formule : → −→ − → → − √ − ( AP | h ) DP g ( h ) = pour tout h ∈ R2 . PA On en déduit que la fonction ϕ : M 7→ M M2 + M M3 + M2 M3 est de classe C ∞ sur R2 \ {M2 , M3 } , sa différentielle en un point M étant donnée par la formule : −−−→ −−−→ ! − → → M2 M − → − M3 M DM ϕ ( h ) = h + pour tout h ∈ R2 . M M2 M M3 c Dunod 2014 II.1 : Espaces vectoriels normés 169 La fonction t 7→ M (t) de R dans R2 est de classe C ∞ sur R, et sa dérivée en un point t est −−−−→ → − w := (−r1 sin t, r1 cos t), c’est le vecteur de longueur r1 directement orthogonal à OM (t) . Par composition, la fonction f : R → R est de classe C ∞ , et sa dérivée est donnée par la formule : −−−−−→ −−−−−→ ! M M (t) M M (t) 2 3 → − ′ + . f (t) = w M (t)M2 M (t)M3 → Appliquons cette formule avec t := t1 . Pour j = 2, 3 , soit − τj le vecteur unitaire dirigé par −−−−→ → → ′ M1 Mj . Puisque f atteint en t1 son maximum absolu, f (t1 ) = 0 . Ainsi − τ2 + − τ3 est orthogonal − − − → → − → − → − à w := (−r1 sin t1 , r1 cos t1 ), autrement dit τ2 + τ3 est colinéaire à O1 M1 . Considérons les −−−→ → −−−→ − −−−→ → → → → points P, P2 , P3 tels que − τ2 = M1 P2 , − τ3 = M1 P3 et → τ2 + − τ3 = M1 P . Puisque − τ2 et − τ3 sont unitaires, le parallélogramme M1 P2 P M3 est un losange, donc la droite M1 P est la bissectrice → → intérieure du triangle M1 M2 M3 en M1 . D’où la conclusion : en effet, − τ2 + − τ3 est colinéaire −−−→ à O1 M1 , donc P appartient à la droite O1 M1 . P2 → τ2 O1 M1 → → P τ2 + τ3 → τ3 P3 II.1.29 On peut se limiter au cas où le corps de base est R, car tout e.v. n. complexe est aussi un e.v. n. réel, la fonction distance étant la même, que l’on considère cet espace comme espace vectoriel sur C ou comme espace vectoriel sur R. Rappelons la définition du diamètre de A : Diam(A) := sup d(x, y) | (x, y) ∈ A × A . Cette borne supérieure est finie parce que A est bornée. Il est clair que, si A1 , A2 sont deux parties bornées non vides de E , (A1 ⊂ A2 ) implique Diam(A1 ) 6 Diam(A2 ) . L’in- clusion A ⊂ A entraîne donc Diam(A) 6 Diam(A). Inversement, soient x, y ∈ A. Il existe deux suites (xn ) et (yn ) de A convergeant vers x et y respectivement. Pour tout n, d(xn , yn ) 6 Diam(A). La fonction distance étant continue, d(x, y) est la limite de d(xn , yn ) lorsque n tend vers +∞, d’où d(x, y) 6 Diam(A). Cette inégalité étant vraie pour tout (x, y) ∈ A × A , on en déduit (en passant à la borne supérieure) Diam(A) 6 Diam(A), d’où Diam(A) = Diam(A). Rappelons ensuite la définition de la frontière ∂(A) de A : ∂(A) := A \ Int(A). Remarquons que cette frontière n’est pas vide : si elle l’était, A = Int(A) serait fermé et ouvert, donc égal à E puisque E est connexe et même convexe. C’est absurde, puisque A est bornée et E ne l’est pas. Par ailleurs, Diam ∂(A) 6 Diam(A) = Diam(A) à cause de l’inclusion ∂(A) ⊂ A . Il c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 170 nous suffit donc de prouver l’inégalité suivante : Diam(A) 6 Diam ∂(A) . (∗) Notons que A ⊂ A entraîne Int(A) ⊂ Int(A) puis ∂(A) ⊃ ∂(A), puisque A et A ont même adhérence A . Il en résulte que l’inégalité (∗) sera une conséquence de la suivante : Diam(A) 6 Diam ∂(A) . Autrement dit, quitte à remplacer A par A , qui est compacte, il suffit d’établir l’inégalité (∗) lorsque A est un compact non vide de E , ce que nous supposons désormais. Remarquer alors que ∂(A) = A \ Int(A). Examinons d’abord le cas où E := R (avec comme norme la valeur absolue). Soient a := inf A et b := sup A. Puisque A est compact, a et b appartiennent à A. Par contre, il est clair que a et b n’appartiennent pas à Int(A), car A ⊂ [a, b]. Ainsi a, b ∈ ∂(A), d’où : Diam(A) 6 Diam [a, b] = Diam {a, b} 6 Diam ∂(A) . L’inégalité (∗) est donc vraie dans ce cas particulier. En fait, les normes sur R sont exactement les k |·|, k > 0 étant fixé, donc l’inégalité (∗) est vraie lorsque E := R est muni d’une norme arbitraire. On en déduit facilement que cette inégalité est vraie dès que E est un e.v. n. de dimension 1 . Passons au cas général. Vu la définition de Diam(A) comme borne supérieure, tout revient à démontrer que, si x, y ∈ A sont fixés, on a d(x, y) = kx − yk 6 Diam ∂(A) . La distance d étant invariante par translation, on peut supposer que y := 0 , quitte à remplacer A par A − y . Ainsi A contient 0 et x, et l’inégalité à établir devient : kxk 6 Diam ∂(A) . C’est évident si x := 0 , supposons donc x 6= 0 . L’idée est alors d’appliquer le cas particulier précédent à la droite D := Rx. Soit B := A ∩ D . C’est un compact non vide de D , contenant 0 et x. Puisque D ∩ Int(A) est un ouvert de D , l’intérieur de B dans D contient D ∩ Int(A), donc la frontière ∂(B) de B dans D est contenue dans (D ∩ A) \ D ∩ Int(A) = D ∩ ∂(A). D’après le cas particulier précédent, on a Diam(B) 6 Diam ∂(B) , d’où : kxk 6 Diam(B) 6 Diam ∂(B) 6 Diam ∂(A) . II.1.30 Observons d’abord que f (λx) = λf (x) pour tout (λ, x) ∈ K × E , vu la définition de f et la propriété d’homogénéité des normes. Cela étant, définissons g : E → E comme f , mais en échangeant les rôles des deux normes : g(0) := 0 et g(x) := (kxk′ /kxk)x si x 6= 0 . Pour tout x non nul, il vient : kxk kxk x = g(x) = x. g f (x) = g ′ kxk kxk′ De même f g(x) = x, donc f et g sont deux bijections réciproques l’une de l’autre. Remarquons que, pour tout x non nul, kg(x)k = (kxk′ /kxk)kxk = kxk′ et de même ′ kf (x)k′ = kxk . On en déduit les inclusions f B(0, 1) ⊂ B (0, 1), f S(0, 1) ⊂ S ′ (0, 1) ′ ′ et de même g B (0, 1) ⊂ B(0, 1), g S ′ (0, 1) ⊂ S(0, 1). Ainsi f B(0, 1) = B (0, 1) et f S(0, 1) = S ′ (0, 1). Il nous reste à démontrer la continuité de f . La continuité de g = f −1 en résultera, en échangeant les deux normes, et alors f sera un homéomorphisme de E sur lui-même. c Dunod 2014 II.1 : Espaces vectoriels normés 171 Jusqu’à présent, le fait que E soit de dimension finie n’est pas intervenu. Cette hypothèse est nécessaire pour donner un sens à la phrase « f est continue ». Cela signifie que f : E → E est continue, quel que soit le choix des normes sur E , au départ et à l’arrivée, ce choix étant d’ailleurs indifférent puisque E est de dimension finie. Montrons par exemple que f : E, k·k → E, k·k′ est continue. La continuité en 0 résulte de l’égalité kf (x)k′ = kxk . Soit x un vecteur non nul. Étant donnée une suite (xn ) de E convergeant vers x dans E, k·k , il s’agit de montrer que la suite f (xn ) converge vers f (x) dans E, k·k′ . On peut supposer que les xn sont tous non nuls (c’est vrai en tout cas dès que n est assez grand). La norme k·k étant continue, kxn k tend vers kxk quand n tend vers +∞. La suite (xn ) converge aussi vers x dans E, k·k′ (parce que les deux normes sont équivalentes), donc kxn k′ tend vers kxk′ quand n tend vers +∞. Comme la suite (xn ) converge aussi vers x dans E, k·k′ , il en résulte que f (xn ) = kxn k/kxn k′ xn tend vers kxk/kxk′ x = f (x) quand n tend vers +∞. D’où la continuité de f en x. II.1.31 Soit donc E un e.v. n. de dimension finie n > 1 . Il s’agit de démontrer que E contient une partie dense dénombrable (une partie dense ne peut évidemment pas être finie). Comme toujours, on peut se limiter au cas où le corps de base est R. La notion de partie dense étant topologique, on se ramène immédiatement au cas où E est l’espace Rn muni de sa norme euclidienne usuelle. Ce cas est évident, car Qn est une partie dénombrable dense de Rn . D’abord Q est dénombrable, donc Qn l’est aussi (cf. le cours de [L1]). Ensuite Q est dense dans R. Soit alors x := (x1 , . . . , xn ) ∈ Rn . Étant donné un réel ε > 0 , il s’agit de montrer que la boule B(x, ε) √ √ rencontre Qn . Pour tout j ∈ [[1, n]], le segment [xj − ε/ n, xj + ε/ n] contient (au moins) un nombre rationnel yj . Alors y := (y1 , . . . , yn ) ∈ Qn , et l’on a : kx − yk2 = n X j=1 (xj − yj )2 6 n X (ε2 /n) = ε2 . j=1 n Il en résulte que y ∈ Q ∩ B(x, ε). II.1.32 1. Rappelons qu’une norme matricielle est une norme k·k sur Mn (C) possédant la propriété suivante : kM N k 6 kM kkN k pour toutes matrices M, N ∈ Mn (C). Considérons une telle norme matricielle k·k . Soient λ une valeur propre de A et X un vecteur propre de A associé à λ. Soit M := [0; 0; . . . ; 0, X] ∈ Mn (C) la matrice dont toutes les colonnes sont nulles, sauf la dernière qui est égale à X . Il est clair que AM = λM , d’où l’on déduit : |λ| kM k = kλM k = kAM k 6 kAkkM k . Comme kM k > 0 , il en résulte que |λ| 6 kAk . Cette inégalité étant vraie pour toute valeur propre de A, l’inégalité ρ(A) 6 kAk s’ensuit. 2. Observons d’abord que deux matrices semblables ont même rayon spectral (elles ont mêmes valeurs propres). Cela étant, la matrice A est trigonalisable (parce que C est algébriquement clos), il existe donc une matrice P ∈ GLn (C) telle que T := P AP −1 soit triangulaire supérieure. Notons ti,j les coefficients de T , et posons λj := tj,j pour tout j . Ainsi ρ(A) = max(|λj |). Par ailleurs ti,j = 0 dès que i > j . 2 Commençons par choisir un réel α assez petit pour avoir ρ(A)2 + (n − 1)α2 6 ρ(A) + ε . Considérons ensuite un réel a > 1 et posons D := Diag(1, a, a2 , . . . , an−1 ). La matrice c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 172 DT D−1 se déduit de T en multipliant chaque ligne d’indice i par ai−1 puis en divisant chaque colonne d’indice j par aj−1 . Cette matrice a mêmes termes diagonaux que T . Pour tous indices i, j tels que 1 6 i < j 6 n, le coefficient d’indices (i, j) de DT D−1 est ai−j ti,j . Si l’on choisit le réel a suffisamment grand, on aura ai−j ti,j 6 α dès que i < j . Quitte à remplacer P par DP et donc T par DT D−1 , nous pouvons supposer que tous les coefficients non diagonaux de T sont en module majorés par α . Notons (E1 , . . . , En ) la base canonique de Cn . Munissons Cn de sa norme hermitienne usuelle. Soit j ∈ [[1, n]]. L’une des composantes du vecteur T Ej vaut λj , chacune des autres composantes étant majorée en module par α . D’où : 2 kT Ej k2 6 |λj | + (n − 1)α2 6 ρ(T )2 + (n − 1)α2 = ρ(A)2 + (n − 1)α2 . Pour tout vecteur X := (x1 , . . . , xn ) ∈ Cn , on a donc : 2 X X 2 kT Xk2 = xj T Ej 6 |xj | kT Ej k j j X 2 6 ρ(A)2 + (n − 1)α2 |xj | = ρ(A)2 + (n − 1)α2 kXk2 j 2 6 ρ(A) + ε kXk2, d’où kT Xk 6 ρ(A) + ε kXk. Ainsi |||T ||| 6 ρ(A) + ε , en désignant par |||·||| la norme matricielle subordonnée à la norme hermitienne de Cn . Il ne reste plus qu’à transporter la norme hermitienne par P . Plus précisément, définissons une norme k·k′ sur Cn par la formule kY k′ := kP Y k . Pour tout vecteur Y , il vient : kAY k′ = kP AY k = k(P AP −1 )P Y k = kT (P Y )k 6 ρ(A) + ε kP Y k = ρ(A) + ε kY k′ . ′ ′ D’où |||A||| 6 ρ(A) + ε , en désignant par |||·||| la norme matricielle subordonnée à la norme k·k′ sur Cn . 3. Observons d’abord que ρ(Ak ) = ρ(A)k pour tout k ∈ N. C’est évident lorsque A est triangulaire. Dans le cas général, on écrit comme ci-dessus A = P −1 T P , où P ∈ GLn (C) et où T est triangulaire. Alors, pour tout k , il vient : ρ(Ak ) = ρ P −1 Ak P = ρ(T k ) = ρ(T )k = ρ(P AP −1 )k = ρ(A)k . Implication a) =⇒ b) Soit k·k une norme matricielle quelconque. Par hypothèse, la suite réelle kAk k converge vers 0 . D’après la question 1, ρ(Ak ) 6 kAk k pour tout k , donc la suite ρ(Ak ) , qui n’est autre que la suite géométrique ρ(A)k , converge vers 0 . D’où ρ(A) < 1 . Implication b) =⇒ c) Choisissons ε > 0 tel que ρ(A) + ε < 1 . D’après la question 2, il existe une norme matricielle subordonnée |||·||| telle que |||A||| 6 ρ(A) + ε , d’où |||A||| < 1 . Implication c) =⇒ d) Soit k·k une norme sur Cn telle que |||A||| < 1 , en notant |||·||| la norme subordonnée à k·k . Étant donné un vecteur C ∈ Cn , notons f l’application affine X 7→ AX + C de Cn dans lui-même. Pour tous X, Y ∈ Cn , on a, par définition de la norme fonctionnelle |||A||| : d f (X), f (Y ) = kf (X) − f (Y )k = kA(X − Y )k 6 |||A|||kX − Y k = |||A|||d(X, Y ). c Dunod 2014 II.1 : Espaces vectoriels normés 173 Ainsi f est |||A||| -lipschitzienne, donc contractante puisque |||A||| < 1 . D’après le théorème du point fixe, f possède un point fixe unique X . Ce vecteur est donc l’unique solution de l’équation linéaire AX + C = X . Il en résulte que la matrice In − A est inversible et que X = (In − A)−1 C . Implication d) =⇒ a) Soit j ∈ [[1, n]]. Prenons X0 := 0 et C := Ej . On montre facilement par récurrence que k−1 P i Xk := A Ej pour tout k . Par hypothèse, la suite formée par les j èmes colonnes des matrices général i=0 k−1 P i=0 k−1 P Ai , k décrivant N, converge, ceci pour tout j . Il en résulte que la suite de terme Ai converge, autrement dit la série i=0 P Ak converge. Le terme général de cette k>0 série tend donc vers 0 , i.e. la suite (Ak ) converge vers 0 . 4. D’après la question 1, ρ(A)k = ρ(Ak ) 6 kAk k , c’est-à-dire kAk k1/k > ρ(A), ceci pour tout k ∈ N∗ . Soit maintenant ε > 0 . D’après la question 2, il existe une norme subordonnée |||·||| telle que |||A||| 6 ρ(A) + ε . Cette norme étant équivalente à la norme k·k , il existe en particulier un réel t > 0 tel que kM k 6 t|||M ||| pour toute matrice M . Soit alors k ∈ N∗ . La k norme |||·||| est une norme matricielle, donc |||Ak ||| 6 |||A||| . D’où : k k kAk k 6 t|||Ak ||| 6 t|||A||| 6 t ρ(A) + ε , soit kAk k1/k 6 t1/k ρ(A) + ε . Lorsque k tend vers +∞, t1/k tend vers 1 , donc t1/k ρ(A) + ε 6 ρ(A) + 2ε dès que k est assez grand. La suite de terme général kAk k1/k converge donc vers ρ(A) puisque, pour tout entier k assez grand (en fonction de ε ), on a ρ(A) 6 kAk k1/k 6 ρ(A) + 2ε . II.1.33 Considérons deux points y, y ′ de λ1 C1 + λ2 C2 et un réel t ∈ [0, 1]. Il existe x1 , x′1 ∈ C1 et x2 , x′2 ∈ C2 tels que y := λ1 x1 + λ2 x2 et y ′ := λ1 x′1 + λ2 x′2 . Alors : (1 − t)y + ty ′ = λ1 (1 − t)x1 + tx′1 + λ2 (1 − t)x2 + tx′2 ∈ λ1 C1 + λ2 C2 . En effet, puisque C1 et C2 sont convexes, (1 − t)x1 + tx′1 ∈ C1 et (1 − t)x2 + tx′2 ∈ C2 . II.1.34 Rappelons ce que signifie l’hypothèse de concavité de f . Pour tous réels x, y > 0 et tout λ ∈ [0, 1], on doit avoir : f 1 − λ)x + λy > (1 − λ)f (x) + λf (y). (∗) Montrons que f est croissante. Soient A, B, M trois points du graphe de f , d’abscisses respectives a, b, x, avec 0 6 a < b < x. Puisque f est concave, pente(AB) > pente(AM ). De plus, pente(AM ) = f (x) − f (a) /(x − a) > −f (a)/(x − a). Fixons A, B et faisons tendre x vers +∞. On en déduit l’inégalité pente(AB) > 0 , autrement dit f (b) > f (a), ce qui montre que f est croissante. Étant donnés a, b ∈ R+ , prouvons l’inégalité f (a + b) 6 f (a) + f (b). C’est évident si a et b sont nuls. Dans le cas contraire, a+b > 0 . En appliquant l’inégalité (∗) avec x := 0 , y := a+b et λ := a/(a + b), il vient f (a) > af (a + b)/(a + b). De même f (b) > bf (a + b)/(a + b). En additionnant ces inégalités membre à membre, on obtient l’inégalité annoncée. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 174 Considérons un espace métrique (X, d), et montrons que δ := f ◦ d : X × X → R est une distance sur X . La fonction δ est symétrique parce que d l’est. Pour tous x, y ∈ X , δ(x, y) := f d(x, y) > 0 , avec égalité si, et seulement si, d(x, y) = 0 , c’est-à-dire x = y , et cela parce que f (0) = 0 et f (t) > 0 pour tout t > 0 . Soient enfin x, y, z ∈ X . Alors : δ(x, z) = f d(x, z) 6 f d(x, y) + d(y, z) 6 f d(x, y) + f d(y, z) = δ(x, y) + δ(y, z). La première inégalité résulte de l’inégalité triangulaire dans (X, d) et du fait que f soit croissante, la deuxième vient de l’inégalité établie dans l’alinéa précédent. Ainsi la fonction δ vérifie l’inégalité triangulaire, et c’est donc une distance sur X . La fonction t 7→ min(1, t) est concave. Plus généralement, si f1 , f2 sont deux fonctions concaves (sur un espace vectoriel réel E ), la fonction f := min(f1 , f2 ) est concave. Soient en effet x, y ∈ E et λ ∈ [0, 1]. Pour i = 1, 2 , la concavité de fi donne : fi (1 − λ)x + λy > (1 − λ)fi (x) + λfi (y) > (1 − λ)f (x) + λf (y), d’où f (1 − λ)x + λy > (1 − λ)f (x) + λf (y), ce qui prouve la concavité de f . La fonction g : t 7→ t/(1 + t) est strictement concave, car elle est de classe C ∞ et sa dérivée seconde est strictement négative : cette dérivée seconde est t 7→ −2/(1 + t)3 . Voici la conclusion obtenue : soit (X, d) un espace métrique. Chacune des fonctions (x, y) 7→ min 1, d(x, y) et (x, y) 7→ d(x, y)/ 1 + d(x, y) est encore une distance sur X . Remarquer que ces deux nouvelles distances sont bornées par 1 . II.1.35 Rappelons que le corps de base doit être R lorsqu’il s’agit de convexité. La condition de l’énoncé est nécessaire, que la partie C soit fermée ou non. En effet, supposons C convexe et soient x, y ∈ C . Pour tout λ ∈ [0, 1], le point (1 − λ)x + λy appartient à C . Lorsque λ := 1/2 , on obtient le milieu du segment joignant x et y . Supposons réciproquement que C soit fermée et que (x + y)/2 ∈ C dès que x ∈ C et y ∈ C . Notons T l’ensemble des réels λ ∈ [0, 1] tels que (1 − λ)x + λy ∈ C pour tous x, y ∈ C . Ainsi 1/2 ∈ T , et bien sûr 0, 1 ∈ T . Il s’agit de prouver que T = [0, 1]. Montrons d’abord que, si a, b ∈ T , alors (a + b)/2 ∈ T . Soient x, y deux éléments arbitraires de C . Appliquons la propriété d’associativité des barycentres (cf. le module III.1 du cours de [L1]). Considérons d’une part le barycentre u de (x, 1 − a) et (y, a), et d’autre part le barycentre v de (x, 1 − b) et (y, b). Puisque a et b appartiennent à T , u et v appartiennent à C , donc le milieu w du segment les joignant appartient à C . Ce milieu est le barycentre de (u, 1/2) et (v, 1/2) c’est à-dire, par associativité, le barycentre de x, (1 − a)/2 , (y, a/2), x, (1 − b)/2 et (y, b/2). Toujours par associativité, le point w est barycentre de x affecté du coefficient 1 − (a + b)/2 et de y affecté du coefficient (a + b)/2 , ce qui montre que (a + b)/2 ∈ T . Soit D l’ensemble des nombres dyadiques de [0, 1], i.e. l’ensemble des rationnels de la forme a/2k , où k ∈ N et a ∈ 0, 2k . Prouvons l’inclusion D ⊂ T . Il suffit de montrer, par récurrence sur k , que si q := a/2k avec k ∈ N et a ∈ [[0, 2k ]] , alors q ∈ T . C’est vrai si k := 0 , car 0, 1 ∈ T . Supposons que notre assertion soit vraie au rang k − 1 ( k > 1 ) et que q := a/2k comme ci-dessus. Si a := 2b est pair, q = b/2k−1 ∈ T , d’après l’hypothèse de récurrence. Si a := 2b + 1 est impair, l’inégalité 2b + 1 < 2k implique b + 1 6 2k−1 . Alors q = (q ′ + q ′′ )/2 , où q ′ := b/2k−1 et q ′′ := (b + 1)/2k−1 . D’après l’hypothèse de récurrence, q ′ et q ′′ appartiennent à T . L’alinéa précédent montre donc que q = (q ′ + q ′′ )/2 appartient aussi à T . D’où l’inclusion D ⊂ T . c Dunod 2014 II.1 : Espaces vectoriels normés 175 L’ensemble D est dense dans [0, 1]. Soient en effet x ∈ [0, 1] et ε > 0 . Choisissons un entier n > 0 tel que 2n > 1/ε . Soit a := E(2n x) la partie entière de 2n x. Ainsi a 6 2n x < a + 1 , donc a/2n 6 x < (a + 1)/2n . Alors q := a/2n ∈ D , et |x − q| 6 1/2n 6 ε , ce qui établit la densité de D dans [0, 1]. Montrons maintenant que T est fermé dans [0, 1]. Si x, y ∈ C sont fixés, notons Tx,y l’ensemble des λ ∈ [0, 1] tels que (1 − λ)x + λy ∈ C . L’application λ 7→ (1 − λ)x + λy de [0, 1] dans E est continue, et Tx,y est l’image réciproque de C par cette application, donc Tx,y est fermée puisque C est un fermé de E . Enfin, T est l’intersection des Tx,y lorsque (x, y) décrit C × C , donc T est fermé. Concluons : puisque T contient D qui est dense dans [0, 1], T est dense dans [0, 1]. Mais T est aussi fermé dans [0, 1], donc T = [0, 1]. Cela veut dire que, pour tous x, y ∈ C et tout λ ∈ [0, 1], le point (1 − λ)x + λy appartient à C . Autrement dit, C est convexe. II.1.36 Soient U un ouvert de Rn et C une composante connexe de U . Soit A ∈ U . Il existe un réel r > 0 tel que la boule B(A, r) soit contenue dans U . Cette boule est connexe par arcs, a fortiori connexe. Elle est donc contenue dans C , ce qui montre que C est un voisinage de chacun de ses points. Autrement dit, C est un ouvert de Rn . Supposons maintenant que n soit égal à 1 . Notons Ci les composantes connexes de U , i décrivant un certain ensemble I . Pour tout i ∈ I , l’alinéa précédent montre que Ci est un ouvert de R. Comme Ci est connexe, c’est un intervalle de R (théorème 66 de la page 448 de la page 448), autrement dit Ci est un intervalle ouvert. Il reste à montrer que l’ensemble I est fini ou dénombrable. Pour tout i ∈ I , l’intervalle Ci contient un nombre rationnel qi . Si i, j ∈ I sont distincts, les composantes connexes Ci et Cj sont disjointes, donc qi 6= qj . Il en résulte que i 7→ qi est une application injective de I dans Q . D’où la conclusion, puisque Q est dénombrable. II.1.37 La partie E \ {(0, 0)} est réunion disjointe des quatre parties suivantes : ]0, +∞[ × {0} , ]−∞, 0[ × {0} , {0} × ]0, +∞[ , {0} × ]−∞, 0[ . Soit par exemple E1 := ]0, +∞[ × {0} . C’est l’intersection de E avec le demi-plan ouvert (x, y) ∈ R2 | x > 0 , donc E1 est un ouvert de E \ {(0, 0)} . De plus E1 est convexe, donc connexe, comme intersection du demi-plan en question avec l’axe Ox. Pour les mêmes raisons, les trois autres parties ci-dessus sont des ouverts connexes de E \ {(0, 0)} . Il en résulte que E \ {(0, 0)} a quatre composantes connexes, à savoir les quatre parties ci-dessus. Raisonnons par l’absurde, en supposant qu’il existe un homéomorphisme f de E sur R. Po sons a := f (0, 0) . Alors f induit un homéomorphisme de E \ {(0, 0)} sur R \ {a} . La connexité étant une notion topologique, R \ {a} doit avoir quatre composantes connexes, à savoir les images par f des composantes connexes de E \ {(0, 0)} . C’est absurde, car R \ {a} a deux composantes connexes : ]−∞, a[ et ]a, +∞[. Conclusion : E n’est pas homéomorphe à R. II.1.38 Soient A, B deux points de X := R2 \ (0, 0) distincts. Il suffit de montrer qu’il existe une partie de X connexe par arcs et contenant A, B . Si l’origine O n’appartient pas au segment [A, B], ce segment convient. Si O ∈ [A, B], on peut prendre n’importe quel cercle passant par c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 176 A et B . En conclusion deux points arbitraires de X ont même composante connexe par arcs, donc X est connexe par arcs. Montrons alors que R2 et R ne sont pas homéomorphes. Raisonnons par l’absurde, en supposant qu’il existe un homéomorphisme f de R2 sur R. Soit a := f (O). D’abord, f induit un homéomorphisme de X sur R \ {a} . La connexité par arcs étant une propriété topologique, R\{a} est connexe par arcs puisque X l’est. En particulier, R\{a} est connexe. C’est absurde, car en fait R \ {a} a deux composantes connexes, à savoir ]−∞, a[ et ]a, +∞[. II.1.39 Traitons d’abord le cas n := 2 . Soient P := (a, b) et Q := (c, d) deux points de X . Notons C la composante connexe par arcs de P . Il s’agit de montrer que Q ∈ C . Puisque la partie S est finie, X est un ouvert de R2 . Si donc b′ ∈ R est assez voisin de b et M := (a, b′ ), le segment P M est inclus dans X . Comme ce segment est connexe par arcs et contient P , il est inclus dans C , en particulier M ∈ C . On peut ci-dessus choisir b′ de telle sorte qu’aucun point de S n’ait pour ordonnée b′ . La droite horizontale d’équation y = b′ est alors contenue dans X , donc dans C , puisque cette droite est connexe par arcs et passe par M . Raisonnons de même avec les verticales. On peut choisir un réel c′ assez voisin de c pour que d’une part X contienne le segment QN où N := (c′ , d), et d’autre part aucun point de S n’ait pour abscisse c′ . La droite verticale d’équation x = c′ est alors contenue dans X . Cette droite passe par le point (c′ , b′ ), qui appartient à C vu le choix de b′ , donc la verticale en question est contenue dans C . Enfin le segment QN est contenu dans X et contient le point N qui appartient à C ( N est sur la verticale ci-dessus). En conclusion, Q ∈ C , donc les points P et Q appartiennent à une même composante connexe par arcs de X . Cela étant vrai pour tous P, Q ∈ X , X est connexe par arcs. On aurait pu obtenir ce résultat en considérant tous les cercles passant par P et Q et en remarquant qu’il n’y a qu’un nombre fini de tels cercles contenant un point de S . Nous laissons au lecteur le soin de détailler cette autre méthode. Q = (c, d) M = (a, b′ ) N = (c′ , d) (c′ , b′ ) P = (a, b) Dans le plan, le complémentaire d’une partie finie est connexe par arcs La propriété (P) annoncée est donc vraie pour l’espace R2 usuel. La connexité par arcs étant une propriété topologique, (P) est vraie pour tout espace métrique homéomorphe à R2 . Passons alors au cas où n > 2 est quelconque. Soient donc S une partie finie de Rn et X := Rn \ S . Considérons deux points quelconques A et B de X . Choisissons arbitrairement un plan affine Π de Rn passant par A et B . Ce plan, muni de la restriction de la distance usuelle de Rn , est homéomorphe à R2 . En effet, soient A0 , A1 , A2 trois points non alignés de Π. L’application de R2 dans Rn associant à tout (x, y) le point M tel que c Dunod 2014 II.1 : Espaces vectoriels normés 177 −−−→ −−−→ −−−→ A0 M = xA0 A1 + y A0 A2 est une bijection affine, donc un homéomorphisme puisque l’on est en dimension finie, de R2 sur Π. Ce qui précède montre que la propriété (P) est vraie pour Π. Soient alors T := S ∩ Π et Y := Π \ T = X ∩ Π. Puisque T est finie, Y est connexe par arcs. Les points A et B appartenant à Π, donc à Y , il existe un chemin continu γ : [0, 1] → Y joignant A à B . Enfin Y ⊂ X , donc γ est aussi un chemin continu de X joignant A à B . Les points A et B de X étant arbitraires, X est connexe par arcs. II.1.40 Reprenons les notations de l’exemple 6 de la page 410. L’application x 7→ Rx de S dans Pn−1 (R) est donc continue. Cette application est surjective, car chaque droite vectorielle contient un vecteur unitaire (elle en contient exactement deux). Puisque la sphère S est compacte, le théorème 51 de la page 435 de la page 435 montre que Pn−1 (R) est compact. Le même argument montre que Pn−1 (R) est connexe par arcs lorsque n > 2 parce que S est connexe par arcs (cf. la proposition 72 de la page 451 de la page 451 et la proposition 73 de la page 452 de la page 452). Si n := 1 , P0 (R) est un point (il n’y a qu’une seule droite dans R !), donc P0 (R) est encore connexe par arcs. II.1.41 1. Soit (x, y) un point de C . Il existe une suite (xn , yn ) de points de C convergeant vers (x, y), autrement dit telle que x := lim xn et y := lim yn . Pour tout n, xn appartient n→+∞ à I := ]0, +∞[, et yn = f (xn ), d’où y = n→+∞ lim f (xn ). Si x > 0 , la continuité de f en n→+∞ x montre que y = f (x), donc (x, y) ∈ C . Si x = 0 , on observe que y ∈ [−1, 1], puisque yn = sin(1/xn ) ∈ [−1, 1] pour tout n. Dans ce cas, (x, y) = (0, y) ∈ T , d’où l’inclusion C ⊂ C ∪T. Pour établir l’égalité C = C ∪ T , il reste à prouver l’inclusion T ⊂ C (de toutes façons, C ⊂ C ). Soit donc t ∈ [−1, 1]. Posons θ := arcsin t ∈ [−π/2, π/2]. Pour tout entier n > |θ/(2π)| , on a θ + 2nπ > 0 , donc xn := 1/(θ + 2nπ) > 0 , et f (xn ) = sin(θ + 2nπ) = sin θ = t. Le point (xn , t) appartient donc à C . Lorsque n tend vers +∞, xn tend vers 0 , donc (xn , t) tend vers (0, t). On en déduit que (0, t) ∈ C , ceci pour tout t ∈ [−1, 1], d’où T ⊂ C . En fait, cette preuve montre que, pour tout β > 0 , T est contenu dans l’adhérence du graphe Cβ de la restriction de f à ]0, β[. 2. Le graphe C de f est connexe et même connexe par arcs, comme image de I , qui est connexe par arcs, par l’application continue x 7→ x, f (x) de I dans R2 . Il en résulte que C est connexe (voir l’application suivant la proposition 67 de la page 449 de la page 449). Montrons par contre que C n’est pas connexe par arcs. Raisonnons par l’absurde, en supposant que C est connexe par arcs. Il existe alors un chemin continu γ : [0, 1] → C joignant un point A de T à un point B de C . Puisque T est compact, γ −1 (T ) est un fermé de [0, 1], donc ω := sup γ −1 (T ) appartient à γ −1 (T ). En particulier ω < 1 , puisque γ(1) = B appartient à C , qui est disjoint de T . La restriction de γ à J := ]ω, 1] est ainsi à valeurs dans C . Cette restriction s’écrit donc t 7→ δ(t), f δ(t) , où δ est une application continue de J dans I . L’image de J par δ est un sous-intervalle de I . Lorsque t tend vers ω + , γ(t) tend vers le point γ(ω) ∈ T , donc δ(t) tend vers 0 . Il en résulte que inf δ(J) = 0 , et par suite il existe un réel β > 0 tel que δ(J) contienne ]0, β[. Dans ces conditions, γ(J) contient Cβ . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 178 Considérons γ [ω, 1] . C’est un compact, comme image continue du compact [ω, 1]. Ensuite, γ [ω, 1] = γ(J) ∪ γ(ω) , donc T ∩ γ [ω, 1] = γ(ω) parce que γ(J) ⊂ C . Par ailleurs, J est dense dans [ω, 1], donc γ(J) est dense dans γ [ω, 1] . D’où : T ⊂ T ∩ Cβ ⊂ T ∩ γ(J) = T ∩ γ [ω, 1] = γ(ω) , ce qui est absurde. Cette contradiction prouve que C n’est pas connexe par arcs. II.1.42 1. Soit n ∈ N∗ . Pour tout t ∈ [0, 1], fn (t) vaut t−α si t > n−(p+1) et n si t 6 n−(p+1) . Considérons alors deux entiers m, n tels que n > m > 1 . Pour tout t ∈ [0, 1], fn (t) − fm (t) vaut n − m sur 0, n−(p+1) , t−α − m sur n−(p+1) , m−(p+1) et 0 sur m−(p+1) , 1 . D’où : Z n−(p+1) Z m−(p+1) p p kfn − fm kp = (n − m) d t + (t−α − m)p d t. n−(p+1) 0 p −(p+1) La première intégrale est majorée par (n − m) n , donc par 1/n et a fortiori par 1/m. Dans la deuxième intégrale J , effectuons le changement de variable t := u−(p+1) , de sorte que t−α = u . Cette intégrale devient : Z m Z n p −(p+2) J = −(p + 1) (u − m) u d u = (p + 1) (u − m)p u−(p+2) d u 6 (p + 1) Z n n up u−(p+2) d u = (p + 1) m m 1 1 − m n 6 p+1 · m Ainsi kfn − fm kpp 6 (p + 2)/m. Lorsque m et n tendent vers +∞, kfn − fm k tend donc vers 0 , i.e. la suite (fn ) est une suite de Cauchy de E . 2. Pour tout n ∈ N∗ , définissons une fonction gn : I := ]0, 1] → R par la formule p gn (t) := t−α − fn (t) . Cette fonction est positive et continue sur I . Lorsque t tend vers 0+ , gn (t) ∼ t−p/(p+1) , donc gn est intégrable sur I . Si 1 6 m 6 n, le calcul fait dans la question 1 montre que fm 6 fn , donc gn 6 gm . Soit t ∈ I . Dès que n > t−α , fn (t) = t−α , donc gn (t) = 0 . La suite de fonctions (gn ) converge donc simplement sur I vers la fonction nulle. D’après le théorème de convergence monotone, on en déduit ceci : Z 1 −α p lim t − fn (t) d t = 0. n→+∞ 0 Fixons un réel ε ∈ ]0, 1[ et posons Iε := [ε, 1]. À plus forte raison, on a : Z 1 −α p lim t − fn (t) d t = 0. n→+∞ ε Cela signifie que, si l’espace C Iε , R est muni de la norme k·kp , la suite de terme général (fn )|Iε converge vers la restriction de la fonction t 7→ t−α à Iε . D’un autre côté, par hypothèse, cette suite converge vers la restriction de f à Iε . Il en résulte que f (t) = t−α pour tout t ∈ Iε . C’est vrai pour tout ε ∈ ]0, 1[, donc f (t) = t−α pour tout t ∈ ]0, 1]. Cela contredit évidemment le fait que f est une fonction continue sur [0, 1]. Cette contradiction provient de l’hypothèse que nous avons faite, à savoir que la suite (fn ) converge dans E, k·kp . Conclusion : (fn ) est une suite de Cauchy de E, k·kp , mais elle ne converge pas dans E, k·kp . Muni de la norme k·kp , l’espace E n’est donc pas complet. c Dunod 2014 II.1 : Espaces vectoriels normés 179 II.1.43 1. Soient X et Y deux ensembles. Rappelons que, s’il existe une injection de X dans Y et une injection de Y dans X , le théorème de Cantor-Schröder-Bernstein (cf. le module I.1 du cours de [L1]) affirme que X et Y sont équipotents : il existe une bijection de X sur Y ). En d’autres termes, les conditions (card X 6 card Y ) et (card Y 6 card X) impliquent (card X = card Y ). Le segment [0, 1] a la puissance du continu. En effet, ce segment est une partie de R, donc card [0, 1] 6 card R. D’un autre côté, R est en bijection avec ]0, 1[, par exemple par la fonction x 7→ (tanh +1)/2 , donc card R 6 card ]0, 1[ 6 card [0, 1]. On conclut grâce au rappel ci-dessus. De plus : card [0, 1[ 6 card R = card ]0, 1[ 6 card [0, 1[ , ce qui montre que [0, 1[ a lui aussi la puissance du continu. Par définition, K3 ⊂ [0, 1], donc card K3 6 card [0, 1] = card R. Par ailleurs, la proposition 53 de la page 436 de la page 436 montre que K3 est en bijection avec {0, 1}N . Soit maintenant x ∈ [0, 1[. On sait que x possède un unique développement propre en base 2 : +∞ P x = un /2n+1 , chacun des un valant 0 ou 1 et les un n’étant pas tous égaux à 1 n=0 à partir d’un certain rang. On définit ainsi une application injective x 7→ (un ) de [0, 1[ dans {0, 1}N , d’où card R = card [0, 1[ 6 card K3 . Finalement, card K3 6 card R et card R 6 card K3 , donc card K3 = card R, d’après le rappel ci-dessus. 2. Si n ∈ N, soit χn : R → R la fonction caractéristique de la partie Fn définie dans la preuve de la proposition 53 de la page 436 de la page 436. Puisque Fn est réunion disjointe de 2n segments de longueur 3−n chacun, χn est une fonction en escaliers, nulle en dehors-de [0, 1]. Il en résulte que χn est intégrable sur R et que son intégrale sur R vaut (2/3)n . La suite (Fn ) étant décroissante au sens de l’inclusion, la suite (χn ) est décroissante. De plus, K3 étant l’intersection des Fn , la fonction χ est limite simple de la suite (χn ). Le théorème de convergence monotone montre alors que χ est intégrable sur R et donne : Z Z χ(t) d t = lim χn (t) d t = lim (2/3)n = 0. R n→+∞ R n→+∞ 3. Raisonnons par l’absurde, en supposant que K3 contient un intervalle I := ]a, b[, avec a < b . Pour tout n ∈ N, I est contenu dans Fn , qui est réunion disjointe de 2n segments de longueur 3−n chacun. Ces segments sont donc les composantes connexes de Fn . Puisque I est connexe, il est contenu dans l’un des segments en question, d’où b − a 6 3−n . Cela est vrai pour tout n, d’où b − a 6 0 (faire tendre n vers +∞), ce qui est absurde. En conclusion, K3 ne contient aucun intervalle ouvert non vide. Il en résulte en particulier que l’intérieur de K3 dans R ou dans [0, 1], cela revient au même est vide. Soient C une composante connexe de K3 et a un point de C . Puisque C est connexe, c’est un intervalle contenant a. Les extrémités de cet intervalle ne peuvent pas être distinctes, compte tenu de l’alinéa précédent. Il en résulte que C = {a} . II.1.44 Pour chaque x ∈ E , x⊥ est un sous-espace vectoriel fermé de E (cf. l’exemple 2 de la page 417). Si F est un sous-espace vectoriel de E , F ⊥ est l’intersection des x⊥ lorsque x décrit F , donc F ⊥ est un sous-espace vectoriel fermé de E . Supposons de plus que F c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 180 soit fermé. Le théorème 87 de la page 462 de la page 462 montre alors que E est somme directe (orthogonale) de F et de son orthogonal F ⊥ . Puisque F ⊥ est fermé, le même théorème montre que E est somme directe orthogonale de F ⊥ et de son orthogonal F ⊥⊥ . Comme F est évidemment inclus dans F ⊥⊥ (c’est une lapalissade !), les conditions E = F ⊕ F ⊥ et E = F ⊥⊥ ⊕ F ⊥ entraînent l’égalité F ⊥⊥ = F (c’est un exercice trivial sur les sommes directes). Venons-en au sous-espace vectoriel V , qui n’est pas nécessairement fermé dans E . Posons F := V . L’inclusion V ⊂ F donne V ⊥ ⊃ F ⊥ . Soit inversement x ∈ V ⊥ . Alors x⊥ est un sous-espace vectoriel fermé, contenant V donc aussi son adhérence F . Ainsi x ∈ F ⊥ . D’où V ⊥ ⊂ F ⊥ et par conséquent V ⊥ = F ⊥ . Puisque F est fermé, l’alinéa précédent donne : V ⊥⊥ = (V ⊥ )⊥ = (F ⊥ )⊥ = F ⊥⊥ = F = V . II.1.45 Soit donc E un espace de Hilbert possédant une base hilbertienne dénombrable (en )n∈N . Supposons d’abord que le corps de base soit R. Le sous-espace vectoriel V de E engendré par les en est donc dense dans E , par définition. Si n ∈ N, posons Vn := Vect(e0 , . . . , en ). n P L’application (x0 , . . . , xn ) 7−→ xj ej est un isomorphisme de Rn+1 sur Vn . Comme Qn+1 j=0 est une partie dénombrable dense de Rn+1 , son image par la bijection précédente est une partie dénombrable Sn de Vn dense dans Vn . Soit S la réunion des Sn pour n ∈ N. C’est une réunion dénombrable de parties dénombrables, donc S est dénombrable (cf. le cours de [L1]). Montrons que S est dense dans E . Si n ∈ N, Vn = Sn car d’une part Sn est dense dans Vn , et d’autre part Vn est fermé (parce que c’est un sous-espace vectoriel de dimension finie). Comme Sn ⊂ S , on en déduit l’inclusion Vn ⊂ S . Maintenant, V est évidemment la réunion des Vn , donc V ⊂ S . D’un autre côté, V est dense dans E , i.e. V = E . Puisque S est fermé et contient V , il contient V = E , d’où S = E . Finalement S est une partie dénombrable dense de E , donc E est séparable. Supposons que le corps de base soit C. Il suffit alors de modifier la preuve ci-dessus en dén P finissant Sn comme l’image de Qn+1 + iQn+1 par la bijection (x0 , . . . , xn ) 7−→ xj ej , j=0 en remarquant que Q isomorphe à Q2n+2 . n+1 + iQ n+1 est encore dénombrable, car c’est un Q -espace vectoriel II.1.46 1. C’est une conséquence immédiate du théorème de Riesz (théorème 88 de la page 463 de la page 463). 2. Soit x un vecteur de E fixé. L’application y 7→ f (x, y) de E dans R est linéaire car f est bilinéaire. Cette application est continue, comme composée de f , qui est continue, avec l’application y 7→ (x, y), qui est une isométrie de E dans E×E . En effet, pour tous y, y ′ ∈ E , k(x, y)−(x, y ′ )k = k(0, y−y ′)k = ky−y ′ k . Ainsi y 7→ f (x, y) est une forme linéaire continue sur E . D’après la question 1, appliquée à y 7→ f (x, y), il existe un unique vecteur u(x) ∈ E tel que f (x, y) = ( u(x) | y ) pour tout y ∈ E . Soient x, x′ ∈ E et λ, λ′ ∈ R. Pour tout y ∈ E , on a : f (λx + λ′ x′ , y) = λf (x, y) + λ′ f (x′ , y) = λ( u(x) | y ) + λ′ ( u(x′ ) | y ) = ( λu(x) + λ′ u(x′ ) | y ). c Dunod 2014 II.1 : Espaces vectoriels normés 181 Par définition de u(λx + λ′ x′ ), on a donc u(λx + λ′ x′ ) = λu(x) + λ′ u(x′ ), ce qui montre que u : E → E est linéaire. Puisque f est continue, il existe un réel C > 0 tel que |f (x, y)| 6 Ckxkkyk pour tous x, y ∈ E . Pour tout x ∈ E , on a : ku(x)k2 = ( u(x) | u(x) ) = f x, u(x) 6 Ckxkku(x)k. Si u(x) 6= 0 , on en déduit ku(x)k 6 Ckxk en simplifiant, et cette inégalité reste vraie si u(x) = 0 . Cela montre que u est continu, et de plus |||u||| 6 C . 3. Soit r un nombre réel strictement positif fixé ; nous en préciserons le choix plus loin. Défi nissons g : E → E par g(x) := x + r b − u(x) . Pour tous x, y ∈ E , il vient, en posant z := x − y et en tenant compte de la caractérisation de u de la question 2 : kg(x) − g(y)k2 = kz − ru(z)k2 = z − ru(z) z − ru(z) = kzk2 − 2r u(z) z + r2 ku(z)k2 = kzk2 − 2rf (z, z) + r2 ku(z)k2 6 kzk2 1 − 2kr + r2 C 2 = kzk2 1 − r(2k − rC 2 ) . Nous avons utilisé ici les inégalités f (z, z) > kkzk2 et ku(z)k 6 |||u|||kzk 6 Ckzk . Im posons maintenant au nombre r de vérifier les inégalités 0 < r < min 1/(2k), 2k/C 2 , et posons ω = 1 − r(2k − rC 2 ). Alors ω < 1 parce que 2k − rC 2 > 0 , et ω > 0 puisque √ ω > 1 − 2kr > 0 . Les inégalités ci-dessus montrent que g est ω -lipschitzienne, donc contractante puisque ω ∈ ]0, 1[. Puisque E est un espace de Hilbert, c’est un espace métrique complet. Le théorème du point fixe montre alors que l’application g , qui est contractante, possède un unique point fixe a. Vu la définition de g , cela signifie que a est l’unique antécédent de b par u . En passant, on en déduit que u est un automorphisme linéaire de E . D’autre part, par définition de u , l’égalité u(a) = b est équivalente aux égalités f (a, y) = ( b | y ) , c’est-à-dire ϕ(y) = f (a, y) pour tout y ∈ E . Le théorème de Lax-Milgram est ainsi démontré. 4. Supposons que f soit symétrique. Pour tout vecteur x non nul de E , les inégalités f (x, x) > kkxk2 > 0 montrent que f est un produit scalaire sur E . Notons k·k′ la norme associée à ce produit scalaire. Pour tout x ∈ E , on a kkxk2 6 (kxk′ )2 = f (x, x) 6 Ckxk2 , donc les normes k·k et k·k′ sur E sont équivalentes. En particulier, E, k·k′ est encore un espace de Hilbert. Par ailleurs, ϕ : E, k·k′ → R est encore une forme linéaire continue. D’après le théorème de Riesz (théorème 88 de la page 463 de la page 463), il existe un unique a ∈ E tel que ϕ(x) = f (a, x) pour tout x ∈ E . On obtient ainsi, dans le cas particulier où la forme coercive f est symétrique, une preuve plus simple du théorème de Lax-Milgram. Dans le cas général, remarquons que u est un automorphisme de l’e.v. n. E : non seulement u est linéaire bijective et continue, mais u−1 est aussi continu. Soit en effet x un vecteur non nul de E . L’inégalité de Cauchy-Schwarz donne : kkxk2 6 f (x, x) = u(x) x 6 ku(x)kkxk, d’où ku(x)k > kkxk, cette dernière inégalité restant vraie lorsque x = 0 . Le changement de variable x := u−1 (y) montre que kyk > kku−1 (y)k pour tout y ∈ E , d’où la continuité de u−1 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 182 Module II.2 : Suites et séries de fonctions II.2.1 Si x ∈ R est fixé et si l’entier n tend vers +∞, x/n tend vers 0 , donc arctan(x/n) tend vers 0 . La suite de fonctions (fn ) converge donc simplement vers la fonction nulle. Ensuite, la suite (fn′ ) converge vers 0 uniformément (sur R), à cause des majorations suivantes, n ∈ N∗ et x ∈ R étant quelconques : 0 6 fn′ (x) = 1 1 1 · 6 · n 1 + x2 /n2 n Montrons par contre que la suite (fn ) ne converge pas uniformément sur R (nécessairement vers 0 ). Comme chaque fn est bornée (par π/2 ), cela revient à dire que kfn k+∞ ne tend pas vers 0 lorsque n tend vers +∞. Or, si n ∈ N∗ , on a |fn (x)| < π/2 pour tout x ∈ R et, par ailleurs, lim arctan(x/n) = π/2 . Il en résulte que kfn k∞ = π/2 , d’où la conclusion. x→+∞ Commentaire : nous pouvons appliquer le théorème 14 de la page 483. Mais ce théorème montre seulement que la suite (fn ) converge vers 0 uniformément sur tout intervalle borné de R, il ne dit pas qu’il y a convergence uniforme sur R tout entier. II.2.2 Soit n ∈ N∗ . La fonction fn est continue, puisque (1 − x/n)n tend vers 0 lorsque x tend vers n− . Cette fonction est manifestement décroissante. La suite de fonctions (fn ) converge simplement vers la fonction f : x 7→ e−x . Soit en effet x ∈ R+ un point fixé. Pour tout entier n > x, on a fn (x) = (1 − x/n)n = exp n ln(1 − x/n) . Or, lorsque n tend vers +∞, ln(1 − x/n) ∼ −x/n, donc n ln(1 − x/n) ∼ −x, i.e. n ln(1 − x/n) tend vers −x. En prenant les exponentielles, on en déduit que (1 − x/n)n tend vers e−x . Puisque la fonction f : x 7→ e−x est continue, on peut penser à appliquer le deuxième théorème de Dini (théorème 10 de la page 481). Il y a un premier problème, c’est que, dans ce théorème, chaque fn est supposée croissante. Ce problème est mineur : il suffit évidemment de remplacer la suite (fn ) par la suite (−fn ). Un deuxième problème plus sérieux est que le théorème de Dini porte sur des fonctions définies sur un segment. Nous allons nous ramener à cette situation, en remarquant que chacune des fonctions fn ( n ∈ N∗ ) et f a pour limite 0 en +∞. Pour tout n ∈ N∗ , définissons une fonction gn : [0, 1] → R par gn (0) := 0 et gn (x) = fn (− ln x) si x > 0 . La fonction gn est continue (comme fonction composée) sur ]0, 1]. Lorsque x tend vers 0+ , − ln x tend vers +∞, donc gn (x) tend vers 0 . Ainsi, gn est continue sur [0, 1]. Par ailleurs, gn est croissante, puisque la fonction x 7→ − ln x est décroissante (ne pas oublier que la composée de deux fonctions décroissantes est croissante). Pour tout x ∈ ]0, 1], la suite gn (x) converge vers f (− ln x) = x, et c’est encore vrai pour x := 0 . Ainsi la suite (gn ) converge simplement vers la fonction g : x 7→ x de [0, 1] dans R. Maintenant, le théorème de Dini s’applique : la suite (gn ) converge vers g uniformément sur [0, 1]. Il en résulte que la suite (fn ) converge vers f uniformément sur R+ . En effet, pour tout n ∈ N∗ , le changement de variable y := − ln x (ou x := e−y ) donne : sup |fn (y) − f (y)| = sup fn − ln x) − f − ln x) = sup |gn (x) − g(x)| , y ∈ R+ x ∈ ]0,1] x ∈ [0,1] et la dernière borne supérieure tend vers 0 lorsque n tend vers +∞. c Dunod 2014 II.2 : Suites et séries de fonctions 183 II.2.3 Nous allons calculer explicitement kfn k∞ et montrer que cette norme tend vers 0 lorsque n tend vers +∞. Fixons un entier n > 1 et posons α := (n+ 1)a /na . Lorsque x décrit [0, 1], a a a y := xn fait de même, et x(n+1) = (xn )α = y α . D’où : kfn k∞ = a a sup (xn − x(n+1) ) = x ∈ [0,1] sup (y − y α ). y ∈ [0,1] La fonction y 7→ y − y α a pour dérivée y 7→ 1 − αy α−1 . Sur [0, 1], elle atteint donc son maximum absolu lorsque y α−1 = 1/α , soit y = α−1/(α−1) , et alors 1 − y α−1 = 1 − 1/α . D’où : kfn k∞ = (1 − 1/α)α−1/(α−1) . Dans cette formule, α dépend de n et, lorsque n tend vers +∞, α = (n + 1)a /na tend vers 1+ . Or kfn k∞ est majorée par 1 − 1/α , qui tend vers 0 lorsque n tend vers +∞, donc lim kfn k∞ = 0 , ce qui signifie que la suite de fonctions (fn ) converge uniformément n→+∞ vers 0 . II.2.4 Étudions d’abord la convergence simple. Soit x ∈ [0, 1]. Si x = 0 , fn (x) = 0 pour tout n, donc lim fn (0) = 0 . Si x = 1 , fn (x) = 1 pour tout n, donc lim fn (1) = 1 . Supposons n→+∞ n→+∞ que x ∈ ]0, 1[. La relation de Chasles donne : Z 1 −1 Z 1 Z x 2 n 2 n 2 n 1 − fn (x) = (1 − t ) dt (1 − t ) dt − (1 − t ) dt 0 = Z 0 1 x (1 − t2 )n dt Z 0 1 (1 − t2 )n dt 0 −1 . Majorons l’intégrale sur [x, 1] et minorons l’intégrale sur [0, 1]. Sur l’intervalle [x, 1], (1−t2 )n Z 1 2 n est majoré par (1 − x ) , donc (1 − t2 )n d t 6 (1 − x)(1 − x2 )n . Pour tout t ∈ [0, 1], x Z 1 Z 1 2 n 2 1 − t > 1 − t, donc (1 − t ) d t > (1 − t)n d t = 1/(n + 1). D’où : 0 0 0 6 1 − fn (x) 6 (n + 1) (1 − x)(1 − x2 )n . Puisque 1 − x2 ∈ ]0, 1[, l’expression (n + 1)(1 − x2 )n tend vers 0 lorsque n tend vers +∞, ce qui montre que fn (x) tend vers 1 . Conclusion : la suite de fonctions (fn ) converge simplement vers la fonction f de [0, 1] dans R valant 0 en 0 et 1 ailleurs. Puisque cette fonction f n’est pas continue, alors que chaque fn est continue, le théorème 5 de la page 480 montre que la suite (fn ) ne converge pas uniformément. II.2.5 On se ramène aussitôt au cas où a := 0 et b := 1 , à l’aide d’une transformation affine convenable x 7→ αx + β sur la variable ( α 6= 0 ). Soit f : [0, 1] → R la limite simple de la suite (fn ). D’abord f est évidemment k -lipschitzienne, en particulier continue. En effet, soient x, y ∈ [0, 1]. Pour tout n ∈ N, |fn (x) − fn (y)| 6 k |x − y|, et l’on en déduit |f (x) − f (y)| 6 k |x − y|, en faisant tendre n vers +∞. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 184 Soit ε > 0 . Considérons un entier p tel que p > 2k/ε . Pour chaque j ∈ [[0, p]], la suite fn (j/p) n>0 converge vers f (j/p). Il existe donc un entier N ∈ N tel que |f (j/p) − fn (j/p)| 6 ε/2 pour tout n > N et tout j ∈ [[0, p]]. Considérons un entier n > N , et soit x ∈ [0, 1]. Il existe j ∈ [[0, p]] tel que |x − j/p| 6 1/(2p). Par inégalité triangulaire, il vient : |f (x) − fn (x)| = f (x) − f (j/p) + f (j/p) − fn (j/p) + fn (j/p) − fn (x) 6 k |x − j/p| + ε/2 + k |x − j/p| 6 ε/2 + k/p 6 ε/2 + ε/2 = ε. Ainsi kf − fn k∞ 6 ε pour tout n > N , ce qui montre que la suite (fn ) converge uniformément vers f . II.2.6 Soit f : I → R la limite simple de la suite (fn ). Remarquons que f est convexe, même si nous n’utiliserons pas ce fait. Soient en effet x, y ∈ I et λ ∈ [0, 1]. Pour tout n, la convexité de fn impliqe l’inégalité fn (1 − λ)x + λy 6 (1 − λ)fn (x) + λfn (y). Les suites fn (x) et fn (y) convergent vers f (x) et f (y) respectivement, et l’on en déduit l’inégalité f (1 − λ)x + λy 6 (1 − λ)f (x) + λf (y), par passage à la limite dans l’inégalité ci-dessus. Soit maintenant J := [a, b] un segment inclus dans I ( a < b ). Compte tenu de l’exercice précédent, il suffit de prouver l’existence d’un réel k > 0 tel que la restriction de chaque fn à J soit k -lipschitzienne. Puisque I est ouvert, nous pouvons choisir deux réels c, d ∈ I tels que c < a < b < d. Soient alors n ∈ N et x, y ∈ ]a, b[ tels que x < y . Puisque la fonction fn est convexe, les inégalités (31) de la page 453 donnent : fn (a) − fn (c) fn (x) − fn (a) fn (y) − fn (x) fn (b) − fn (y) fn (d) − fn (b) 6 6 6 6 · a−c x−a y−x b−y d−b Les suites de termes généraux fn (a) − fn (c) /(a − c) et fn (d) − fn (b) /(d − b) sont convergentes, donc bornées. Il existe donc un réel k > 0 tel que, pour tout n ∈ N, on ait fn (a) − fn (c) /(a − c) 6 k et fn (d) − fn (b) /(d − b) 6 k . Alors, compte tenu des inégalités ci-dessus, |fn (y) − fn (x)| 6 k |x − y|, pour tout n ∈ N et tous x, y ∈ ]a, b[. Ces inégalités sont en fait vraies pour x, y ∈ [a, b], par continuité de fn . Il en résulte que chaque fn est k -lipschitzienne. D’après l’exercice précédent, la convergence de (fn ) vers f est uniforme sur J . II.2.7 Définissons une fonction g : [0, 1] → R par g(0) := ℓ et g(x) := f (− ln x) si x > 0 . Lorsque le réel x ∈ ]0, 1] tend vers 0+ , − ln x tend vers +∞, donc g(x) tend vers ℓ . Ainsi g est continue en 0 , d’où g ∈ C 0, 1], R . Soit ε > 0 . D’après le théorème d’approximation de Weierstraß (théorème 17 de la page 487), il existe un polynôme P ∈ R[X] tel que |g(x) − P (x)| 6 ε pour tout x ∈ [0, 1]. Écrivons P := an X n + · · · + a1 X + a0 . Soit y ∈ R+ , posons x := e−y . Alors − ln x = y , d’où : f (y) − (an e−ny + · · · + a1 e−y + a0 ) = |g(x) − P (x)| 6 ε. Ainsi, pour tout ε > 0 , nous avons réussi à approcher f uniformément, à ε près, par une combinaison linéaire de fonctions du type y 7→ e−ky , k ∈ N. D’où la conclusion : pour avoir f comme limite uniforme, prendre ensuite ε = 1/p, p ∈ N∗ . c Dunod 2014 II.2 : Suites et séries de fonctions 185 II.2.8 1. Soit donc k un entier impair assez grand, nous préciserons plus loin. Puisque k est impair, x 7→ xk est un homéomorphisme de I sur J := −ak , ak , l’homéomorphisme réciproque √ étant t 7→ k t. Attention, la fonction t 7→ t1/k = exp(ln t/k) n’est définie que pour t > 0 . La √ fonction composée g : t 7→ f ( k t) est continue sur J . D’après le théorème d’approximation de Weierstraß (théorème 17 de la page 487), il existe un polynôme Q tel que |g(t) − Q(t)| 6 ε/4 pour tout t ∈ J . Autrement dit : f (x) − Q(xk ) 6 ε/4 pour tout x ∈ I. En particulier, puisque f (0) = 0 , on a |Q(0)| 6 ε/4 . Posons R := Q − Q(0). Alors R ∈ R[X], R(0) = 0 , et l’on a : f (x) − R(xk ) 6 ε/2 pour tout x ∈ I. (∗) Écrivons R := a1 X + · · · + an X n , où les aj sont des réels. Le polynôme P que nous cherchons doit être à coefficients entiers. Posons donc bj := E(aj ) pour tout j , puis S := b1 X + · · · + bn X n . Cette fois, S ∈ Z[X]. Pour tout x ∈ I , le fait que a appartienne à ]0, 1[ entraîne, avec l’inégalité triangulaire, les majorations suivantes : X n n X R(xk ) − S(xk ) = (aj − bj )xjk 6 |aj − bj | |x|jk j=1 j=1 6 n X j=1 |x| jk 6 n X j=1 ajk 6 +∞ X j=1 ajk = ak · 1 − ak Imposons maintenant à l’entier (impair) k la condition ak /(1−ak ) 6 ε/2 . Compte tenu des in égalités (∗), on voit alors que le polynôme S vérifie la propriété suivante : f (x) − S(xk ) 6 ε pour tout x ∈ I . Il suffit de poser P := S(X k ) = b1 X k +· · ·+bn X nk pour avoir les propriétés demandées : P ∈ Z[X] et |f (x) − P (x)| 6 ε pour tout x ∈ I. (∗∗) 2. Soit A l’ensemble des fonctions polynomiales à coefficients entiers sur I . C’est un sous anneau de C(I, R). Il en résulte que l’adhérence A de A dans C(I, R), k·k∞ est aussi un sous-anneau de C(I, R) (pour ce point, cf. l’exercice suivant). Posons maintenant : E := f ∈ C(I, R) | f (0) ∈ Z . Nous allons montrer que A = E . D’abord, E est fermé dans C(I, R). En effet, f 7→ f (0) est une forme linéaire continue L sur C(I, R), et E est l’image réciproque par L de Z, qui est un fermé de R. Ensuite, il est clair que A est inclus dans E : si T ∈ Z[X], T (0) ∈ Z. D’où l’inclusion A ⊂ E . Soit inversement ϕ ∈ E , de sorte que p := ϕ(0) ∈ Z. Pour voir que ϕ ∈ A, il suffit de montrer que A rencontre toute boule de centre ϕ. Soit donc ε > 0 . Appliquons la question précédente à f := ϕ − p et ε . Soit P un polynôme vérifiant les conditions (∗∗). Notons abusivement P + p ∈ A la fonction polynomiale sur I définie par le polynôme P + p. Alors kϕ − (P + p)k∞ = kf − P k∞ 6 ε , donc P + p appartient à l’intersection de A avec la boule de C(I, R), k·k∞ de centre ϕ et de rayon ε . Nous avons ainsi établi l’inclusion E ⊂ A. Conclusion : l’adhérence de A dans C(I, R), k·k∞ est formé des fonctions polynomiales (à coefficients réels) sur I prenant en 0 une valeur entière. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 186 II.2.9 D’abord, A est un sous-anneau de C(J, R), comme image de l’unique morphisme d’anneaux de Z[X] dans C(J, R) appliquant X sur la fonction h : x 7→ x de J dans R. Il en résulte que l’adhérence A de A dans C(J, R) est elle aussi un sous-anneau de C(J, R), et nous voulons montrer que A = C(J, R). Soient par exemple f, g ∈ A. Il existe deux suites (fn ) et (gn ) de A convergeant vers f et g respectivement. Pour tout n, fn gn ∈ A, et la suite (fn gn ) converge vers f g , donc f g ∈ A . On montre de même que f ± g ∈ A . L’idée est de prouver que, pour tout réel t, la fonction constante égale à t, que nous noterons t par abus, appartient à A . Supposons ce point établi. Soit P ∈ R[X] un polynôme, P := an X n + · · · + a1 X + a0 . Les fonctions h et a0 , . . . , an appartiennent à A . Puisque A est un sous-anneau de C(J, R), la fonction polynôme P (h) : x 7→ an xn + · · · + a1 x + a0 appartient à A. Ainsi A contient toute fonction polynomiale (à coefficients réels) sur J . D’après le théorème d’approximation de Weierstraß (théorème 17 de la page 487), l’ensemble de ces fonctions polynomiales est dense dans C(J, R), k·k∞ , et il en résulte que A = C(J, R). Soit maintenant p un nombre premier. Montrons que la fonction polynôme Qp définie dans l’énoncé est à coefficients entiers. Si p > 3 , la formule du binôme donne, puisque (−1)p = −1 : p pQp (x) := 1 − x − p X p−1 X p k k+1 p (−1) x = (−1) xk . k k k=0 k k=1 p Pour tout k ∈ [[1, p − 1]], on sait que le coefficient est multiple de p (cf. un exercice du k module II.1 de [L1]), donc Qp est bien à coefficients entiers. C’est vrai également si p = 2 , car Q2 = x(1 − x). Écrivons maintenant J := [a, b]. Par hypothèse, 0 < a 6 b < 1 . Pour tout x ∈ J , on a : p p p p 1 − Qp (x) = x + (1 − x) 6 b + (1 − a) , d’où : p p p p p 1 − Qp 6 b + (1 − a) := ωp . p p ∞ (∗) Noter que cette quantité ωp est définie en fait pour tout réel p > 0 . Soit t ∈ R et ε > 0 . Pour conclure, il suffit de montrer qu’il existe une fonction f ∈ A telle que kt − f k∞ 6 ε . Posons m := E(t). Lorsque le réel p tend vers +∞, pωp tend vers 0 , parce que b et 1 − a appartiennent à ]0, 1[. Puisque l’ensemble des nombres premiers est infini, il existe un nombre premier p tel que 1/p 6 ε/2 et pωp 6 ε/2 . Subdivisons ensuite le segment [m, m + 1], qui contient t, en p segments de longueur 1/p. Il existe un unique k ∈ [[0, p − 1]] tel que m + k/p 6 t < m + (k + 1)/p. Posons alors f := m + kQp ∈ A. Compte tenu de l’inégalité (∗) et de l’inégalité triangulaire, il vient : kt − f k∞ = kt − m − kQp k∞ = kt − m − k/p + (k/p − kQp )k∞ 6 kt − m − k/pk∞ + kk1/p − Qp k∞ 6 1/p + pωp 6 ε. D’où la conclusion. On notera que la conclusion est très différente de celle de l’exercice précédent. Cela tient essentiellement au fait qu’ici le segment J ne contient aucun entier. c Dunod 2014 II.2 : Suites et séries de fonctions 187 II.2.10 1. Pour tout x ∈ I := [a, b], f 7→ f (x) est une forme linéaire sur E , notons-la ϕx . Soit V le sous-espace vectoriel de E ∗ engendré par les ϕx lorsque x parcourt I . Utilisons librement les sections du module I.3 portant sur la dualité et l’orthogonalité. L’orthogonal V ◦ de V est formé des fonctions f ∈ E telles que ϕx (f ) = 0 , c’est-à-dire f (x) = 0 , ceci pour tout x ∈ I . Ainsi V ◦ = {0} . Puisque E est de dimension finie, nous savons que V = (V ◦ )⊥ , donc V = {0}⊥ = E ∗ . Nous avons ainsi établi que (ϕx )x∈I est une famille génératrice de E ∗ . Puisque dim E ∗ = dim E = n, il existe des points x1 , . . . , xn de I tels que ϕx1 , . . . , ϕxn soit une base de E ∗ . Noter que les xi sont évidemment deux à deux distincts, puisque les formes linéaires ϕxi sont deux à deux distinctes. Dans ce qui suit, les points x1 , . . . , xn sont fixés. 2. Notons k·k∞ la restriction à E de la norme de la convergence uniforme. Nous allons construire une autre norme k·k sur E . À toute fonction f ∈ E , associons le n-uplet f (x1 ), . . . , f (xn ) ∈ Rn . Nous définissons ainsi une application θ , manifestement linéaire, de E dans Rn . Montrons que θ est un isomorphisme. Puisque dim E = dim Rn , il suffit de montrer que le noyau de θ est nul. Soit donc f ∈ Ker θ . Pour i = 1, . . . , n, on a f (xi ) = 0 , c’est-à-dire ϕxi (f ) = 0 . Comme les ϕxi forment une base de E ∗ , α(f ) = 0 pour toute forme α ∈ E ∗ . Autrement dit, f appartient à (E ∗ )◦ = {0} , d’où f = 0 . Munissons Rn de la norme k·k′ , définie par (t1 , . . . , tn ) 7→ max |t1 | , . . . , |tn | . À l’aide de l’isomorphisme θ , « transportons » ensuite cette norme vers E . Nous obtenons une norme k·k sur E , définie explicitement ainsi : kf k := max |f (x1 )| , . . . , |f (xn )| pour toute f ∈ E. Alors θ est, par construction, une isométrie de E, k·k sur Rn , k·k′ . Soit maintenant (fp )p>0 une suite de E . Supposons que cette suite de fonctions (sur I ) converge simplement vers une fonction f : I → R. Pour chaque k ∈ [[1, n]], la suite fp (xk ) p>0 converge donc vers f (xk ). Il en résulte que la suite fp (x1 ), . . . , fp (xn ) p>0 de Rn converge vers f (x1 ), . . . , f (xn ) . Or, la suite fp (x1 ), . . . , fp (xn ) p>0 est l’image par θ de la suite (fp )p>0 de E . Puisque θ est une isométrie, (fp )p>0 est une suite convergente de E, k·k , notons g ∈ E sa limite. Puisque E est de dimension finie, les deux normes k·k∞ et k·k sur E sont équivalentes. La suite (fp )p>0 converge donc vers g dans E, k·k∞ . Par définition de la norme k·k∞ , la suite de fonctions (fp )p>0 converge alors uniformément vers g . La convergence uniforme impliquant la convergence simple, on en déduit (unicité de la limite) que g = f . Conclusion : d’une part la suite (fp )p>0 converge uniformément vers f , et d’autre part f ∈ E (en particulier, f est continue sur I ). II.2.11 Soit E l’ensemble des fonctions en escalier de [a, b] dans R. C’est évidemment un sous espace vectoriel de B [a, b], R , espace vectoriel des applications bornées de [a, b] dans R. Munissons B [a, b], R de la norme k·k∞ . Par ailleurs, soit V l’ensemble des applications f de [a, b] dans R possédant en tout point x de [a, b] une limite à droite finie (lorsque x 6= b ) notée f (x+0) et une limite à gauche finie (lorsque x 6= a) notée f (x−0). C’est un sous-espace vectoriel de l’espace de toutes les applications de [a, b] dans R, et il contient évidemment E . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 188 Nous allons montrer d’abord que V est inclus dans B [a, b], R , puis que V est égal à E , adhérence de E dans B [a, b], R . Supposons ces deux points établis, et soit f une fonction de [a, b] dans R. Si f possède en chaque point (où cela a un sens) une limite à gauche et une limite à droite finies, f appartient à V = E , par définition. Il existe donc une suite (fn ) de E convergeant vers f au sens de la norme k·k∞ , ce qui veut dire, puisque f et les fn sont bornées, que la suite (fn ) converge uniformément vers f . Supposons inversement que f soit limite uniforme d’une suite (gn ) de E . Puisque les fn sont bornées, f l’est aussi. Ainsi f est limite de la suite (gn ) au sens de la norme k·k∞ , donc f ∈ E = V . Il reste donc à établir les deux points ci-dessus. Soit f ∈ V . Montrons que f est bornée. Supposons que ce ne soit pas le cas. Il existe alors une suite (xn ) de [a, b] telle que |f (xn )| tende vers +∞ quand n tend vers +∞. Puisque [a, b] est compact, on peut supposer, quitte à remplacer la suite (xn ) par une sous-suite, que (xn ) converge vers un point c ∈ [a, b]. Puisque f possède en c une limite à gauche et une limite à droite finies (si c := a ou c := b , on adapte le raisonnement), elle est bornée dans un voisinage U de c dans [a, b]. C’est absurde car, dès que n est assez grand, xn ∈ U , et |f (xn )| est aussi grand que l’on veut. Soit ensuite f ∈ E : f est bornée, et f est limite uniforme d’une suite (fn ) de E . Montrons par exemple que, si c ∈ [a, b[ est fixé, f possède une limite à droite finie en c. Pour chaque n, fn (x) tend vers fn (c + 0) lorsque x tend vers c+ . Puisque la suite formée par les restrictions des fn à ]c, b] converge uniformément vers la restriction de f à ]c, b], le théorème de la double limite (théorème 12 de la page 482) montre que f a une limite à droite finie en c, avec en outre f (c + 0) = lim fn (c + 0). Le raisonnement est le même pour les limites à gauche, donc n→+∞ f ∈ V , ce qui prouve l’inclusion E ⊂ V . L’inclusion V ⊂ E est plus délicate. Il suffit de démontrer que, si l’on se donne une fonction f ∈ V et un réel ε > 0 , il existe une fonction en escalier g telle que kf − gk∞ < ε . Cela revient, dans l’e.v. n. B [a, b], R , k·k∞ , à établir l’inégalité d(f, E) < ε . Pour tout x ∈ [a, b], on peut envisager l’inégalité analogue à d(f, E) 6 ε portant sur les restrictions à [a, x]. Plus précisément, posons : ! dx (f, E) = inf g∈E sup |f (y) − g(y)| . y ∈ [a,x] La fonction x 7→ dx (f, E) de [a, b] dans R est croissante, comme borne inférieure d’une famille de fonctions croissantes, à savoir les fonctions x 7→ sup |f (y) − g(y)|, où g déy ∈ [a,x] crit E . Par ailleurs, il est clair que da (f, E) = 0 prendre pour g la fonction constante f (a) , et que db (f, E) = d(f, E). Puisque x 7→ dx (f, E) est croissante, l’ensemble A := x ∈ [a, b] | dx (f, E) < ε est un sous-intervalle de [a, b] contenant a. Soit c l’extrémité droite de A. Il nous suffit désormais de montrer que c = b . Montrons d’abord que c ∈ A. C’est vrai si c = a. Supposons c > a. Il existe un réel α vérifiant 0 < α < c − a et tel que sup |f − f (c − 0)| < ε (définition de la limite à gauche). ]c−α,c[ Ensuite, c− α ∈ A, donc il existe g ∈ E telle que |f (x) − g(x)| < ε pour tout x ∈ [a, c − α] . Soit h : [a, b] → R la fonction en escalier coïncidant avec g sur [a, c − α], prenant la valeur f (c) en c et la valeur f (c − 0) sur ]c − α, c[ ∪ ]c, b]. On vérifie immédiatement l’inégalité c Dunod 2014 II.2 : Suites et séries de fonctions 189 sup |f − h| < ε , ce qui montre que c ∈ A. [a,c] Pour conclure, il suffit de montrer que c = b . Raisonnons par l’absurde, en supposant c < b . Par définition de la limite à droite, il existe un réel β vérifiant 0 < β < b − c et tel que sup |f − f (c + 0)| < ε . soit alors u : [a, b] → R la fonction en escalier coïncidant avec h ]c,c+β] sur [a, c] et prenant la valeur f (c + 0) sur ]c, b]. On a clairement sup |f − u| < ε , d’où [a,c+β] c + β ∈ A, ce qui contredit la définition de c comme extrémité droite de A. II.2.12 Notons fn le terme général de la série de fonctions donnée. C’est une fonction de classe C ∞ , comme composée de deux fonctions de classe C ∞ . Appliquons le théorème 24 de la P page 492. La série fn (0) converge, et sa somme est nulle. Il nous suffit donc de monn>1 P ′ trer que, pour tout réel a > 0 fixé, la série fn converge uniformément sur le segment n>1 A := [−a, a]. Pour tout n ∈ N∗ et tout réel x, le calcul donne : (−1)n fn′ (x) = x2 2x(1 + n) 2x 2x · − = 2 2 2 2 + n(1 + x ) 1 + x (1 + x ) x + n(1 + x2 ) Le critère spécial uniforme des séries alternées (corollaire 20 de la page 490) montre que la P ′ série de fonctions fn converge uniformément sur A, pourvu que deux conditions soient n>1 vérifiées. La première est que la suite de fonctions |fn′ | n>1 converge vers 0 uniformément sur A. C’est vrai, à cause des majorations uniformes évidentes : 2a 2x 6 · n (1 + x2 ) x2 + n(1 + x2 ) La deuxième condition à vérifier est que, si x ∈ A est fixé, la suite |fn′ (x)| sante. C’est évident, vu l’égalité : n>1 est décrois- 2 |x| · (1 + x2 + n(1 + x2 ) P En conclusion, nous savons que la série de fonctions fn converge uniformément sur A |fn′ (x)| = x2 ) n>1 (ceci quel que soit a > 0 ), que la somme f de cette série de fonctions est de classe C 1 sur +∞ P ′ R, et que f ′ x) = fn (x) pour tout réel x. Un point important est à signaler. Il n’y a pas n=1 P P convergence normale de fn , même sur A. En effet, si x ∈ R∗ est fixé, la série |fn (x)| n>1 n>1 2 diverge, puisque son terme général est équivalent à x /n lorsque n tend vers +∞. Or, il faut s’en souvenir, la convergence normale implique la convergence absolue en tout point. II.2.13 Soit I := ]0, +∞[. Pour tout n ∈ N∗ et tout s ∈ I , posons fn (s) := (−1)n /ns . Soit n ∈ N∗ . Pour tout s, n−s = exp(−s ln n). Il en résulte que fn est de classe C ∞ sur I . Pour tout p ∈ N et tout s ∈ I , on a de plus : fn(p) (s) = (−1)n+p (ln n)p n−s . (∗) c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 190 La fonction f est la somme de la série de fonctions P fn . Pour montrer que f est de classe n>1 C ∞ sur I , appliquons le théorème 28 de la page 495. Soient p ∈ N et A un compact de I . P (p) P (p) Il nous suffit de montrer que la série de fonctions fn , ou (−1)p fn , cela revient au n>1 n>1 même, converge uniformément sur A. Il suffit même, étant donné un entier m > 1 dont nous P (p) préciserons le choix plus loin, de montrer que la série de fonctions (−1)p fn converge n>m uniformément sur A. Il existe deux réels a, b tels que 0 < a < b et A ⊂ [a, b]. Il suffit d’établir la convergence uniforme sur J := [a, +∞[. Pour cela, appliquons le critère spécial uniforme des séries alternées (corollaire 20 de la page 490). Nous avons deux choses à vérifier. La première est que la suite de fonctions de terme général s 7→ (ln n)p n−s converge vers 0 uniformément sur J . Ce terme général est positif et majoré uniformément par (ln n)p n−a . D’où la conclusion car, lorsque n tend vers +∞, ln n est négligeable devant na/p , donc (ln n)p est négligeable devant na . La deuxième condition à vérifier est que, si s ∈ J est fixé, la suite (ln n)p n−s n>m est décroissante. C’est évident si p := 0 , supposons donc p > 1 . Notons g la fonction x 7→ (ln x)p x−s . Sa dérivée est donnée par la formule : g ′ (x) = p(ln x)p−1 x−1−s − s(ln x)p x−1−s = (ln x)p−1 x−1−s (p − s ln x). Imposons maintenant à l’entier m la condition p − a ln m < 0 , soit m > ep/a . Pour tout réel x > m, on a p − s ln x 6 p − s ln m 6 p − a ln m < 0 , donc la fonction g décroît sur [m, +∞[ . D’où la conclusion : la suite (ln n)p n−s n>m est décroissante. II.2.14 Lorsque x tend vers 0+ , x ln x tend vers 0 . La fonction f : [0, 1] → R définie par f (0) := 0 et f (x) := −x ln x si x > 0 est donc continue, et par suite elle est bornée. En Z 1 fait, le maximum absolu de |f | est 1/e . L’intégrale I := d x/xx est alors simplement 0 l’intégrale sur [0, 1] de la fonction composée exp f . P n Puisque |f | est bornée, exp f est la somme de la série de fonctions f /n!, série qui n>0 converge normalement sur [0, 1]. D’après le théorème 23 de la page 492, on peut intervertir les Z P signes et : I = Z 1 exp f = 0 Pour tout n ∈ N, Z 0 Z 1 1 +∞ n X f n! n=0 ! = Z 1 +∞ X (−1)n xn (ln x)n d x . n! 0 n=0 xn (ln x)n d x = (−1)n n!/(n + 1)n+1 en vertu de l’exercice II.2.30 de 0 la page 540. D’où : I = +∞ +∞ +∞ X X X (−1)n (−1)n n! 1 1 · = = · n+1 n+1 p n! (n + 1) (n + 1) p n=0 n=0 p=1 II.2.15 La fonction qu’on doit intégrer ne possède pas de primitive « simple », c’est-à-dire s’exprimant à partir des fonctions usuelles. Nous allons en calculer de façon exacte l’intégrale sur c Dunod 2014 II.2 : Suites et séries de fonctions 191 [0, 2π], mais on ne pourrait pas faire de même sur un segment quelconque. L’idée de départ est simple : pour tout réel u , cos u = Re eiu . D’où : Z 2π Z 2π I := ecos t cos(sin t − nt) d t = Re ecos t ei(sin t−nt) d t 0 = Re Z 2π e cos t+i sin t−int d t = Re 0 La fonction t 7→ e Z 0 2π e eit −nit d t = Re 0 eit Z 2π it ee e−nit d t. 0 étant un peu compliquée, on la développe en série : it ee = +∞ +∞ kit X X (eit )k e = , k! k! k=0 (∗) k=0 avec convergence normale, en particulier uniforme, sur [0, 2π]. La convergence normale est P conservée si l’on multiplie par e−nit . On peut donc calculer I par interversion des signes Z et : ! Z 2π Z 2π X +∞ +∞ (k−n)it X 1 e (k−n)it I = Re d t = Re e dt . k! k! 0 0 k=0 k=0 Pour tout p ∈ Z, l’intégrale de t 7→ epit sur [0, 2π] vaut 2π si p := 0 et 0 sinon. D’où aussitôt la valeur de I : ( 2π/n! si n > 0 I = 0 si n < 0. On peut interpréter ce résultat en termes de séries de Fourier (se reporter au module II.4). En efit fet, I/2π est la partie réelle de cn , coefficient de Fourier d’indice n de la fonction g : t 7→ ee , qui est continue (de classe C ∞ , en fait) et 2π -périodique sur R. Or, le développement de g est fourni par l’égalité (∗) (nous laissons le lecteur justifier ce point), ce qui montre que ck = 1/k! lorsque k ∈ N et ck = 0 lorsque k < 0 . II.2.16 Rappelons que ζ(s) := +∞ P 1/ns pour tout réel s > 1 . La première série à étudier s’écrit n=1 donc : X k>2 +∞ X 1 nk n=2 ! . L’idée est alors évidemment d’appliquer le théorème de Fubini (théorème 15 de la page 485). Pour tout couple d’entiers (n, k) tel que n > 2 et k > 2 , posons an,k := 1/nk . Si n est fixé, P P la série an,k = 1/nk est une série géométrique, de raison 1/n et de premier terme k>2 k>2 1/n2 . Puisque n > 2 , cette série converge, et sa somme sn vaut : +∞ X 1 1 1 1 1 1 = 2· = = − · nk n 1 − 1/n n(n − 1) n−1 n k=2 P Il est alors évident que la série sn converge et a pour somme 1 . Les hypothèses du théorème sn := n>2 de Fubini sont donc vérifiées, et ce théorème entraîne les égalités suivantes, avec convergence c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 192 de toutes les séries qui interviennent : ∞ X k=2 ζ(k) − 1 = +∞ X +∞ X k=2 an,k n=2 ! = +∞ X n=2 La deuxième série à étudier s’écrit : +∞ X 1 knk n=2 X k>2 +∞ X ! k=2 an,k ! = +∞ X sn = 1. n=2 . On raisonne comme précédemment, en posant ici an,k = 1/(knk ) pour tous n, k . ConsiP P dérons un entier n > 2 fixé. La série an,k = 1/(knk ) n’est plus une série géomék>2 k>2 trique, mais elle converge (par comparaison avec le cas précédent). Considérons la série entière P (−1)k−1 xk /k . Son rayon de convergence est 1 , et sa somme est la fonction x 7→ ln(1+x), k>1 sur l’intervalle ]−1, 1[. En prenant x := −1/n, on obtient donc : sn := +∞ +∞ X −1 X 1 1 = + = −1/n − ln(1 − 1/n). knk n knk k=1 k=2 Lorsque n tend vers +∞, ln(1 − 1/n) = −1/n + O(1/n2), d’où sn = O(1/n2 ). Il en résulte P que la série sn converge. Le théorème de Fubini peut à nouveau être appliqué, et il donne n>2 les égalités suivantes, avec convergence de toutes les séries qui interviennent : ! ! ∞ +∞ X +∞ +∞ X +∞ +∞ X X X X ζ(k) − 1 = an,k = an,k = sn k n=2 k=2 n=2 k=2 k=2 n=2 ! ! N N X X 1 = lim sn = − lim + ln (n − 1)/n N →+∞ N →+∞ n n=2 n=2 ! N X 1 = lim ln n − ln(n − 1) − N →+∞ n n=2 ! ! N N X X 1 1 = lim ln N − = lim 1 + ln N − = 1 − C. N →+∞ N →+∞ n n n=2 n=1 II.2.17 Il suffit d’appliquer la formule (16) de la page 498 en prenant x := 1 : +∞ X 1 1 Γ′ (1) = −C − 1 + − pour tout x > 0.· Γ(1) k 1+k k=1 En effet, d’une part Γ(1) = 1 , et d’autre part la série figurant dans le membre de droite a pour somme 1 , à cause des égalités : n X 1 1 1 − = 1− pour tout n ∈ N∗ . k k+1 n+1 k=1 Conclusion : Γ′ (1) = −C , comme annoncé. c Dunod 2014 II.2 : Suites et séries de fonctions 193 II.2.18 Posons D := R \ {0, −1, −2, . . .} . Pour tout (n, x) ∈ N × D , posons aussi P fn (x) := (−1)n /(n + x). La convergence simple de la série de fonctions fn sur D est n>0 P évidente. En effet, si x ∈ D est fixé, la série (−1)n /(n + x) converge, en vertu du critère n>|x| spécial des séries alternées. Notons alors f : D → R la somme de la série de fonctions P fn . n>0 Chaque fn est de classe C ∞ sur D . Pour montrer que la fonction f est de classe C ∞ sur D , il suffit de montrer qu’elle est de classe C ∞ sur chacun des intervalles I composant D : I := ]0, +∞[ ou I := ]−m, −m + 1[ avec m ∈ N∗ (ces intervalles sont les composantes connexes de D ). Commençons par l’intervalle ]0, +∞[. Le fait pour une fonction d’être de classe C ∞ étant de nature locale, il suffit de montrer que, si a est un réel strictement positif fixé, f est de classe C ∞ sur I := [a, +∞[. Pour cela, appliquons le théorème 28 de la page 495. Soit p ∈ N un P (p) entier fixé. Il suffit de montrer que la série de fonctions fn converge uniformément sur I . n>0 Notons d’abord la formule (évidente par récurrence sur p) : fn(p) (x) = (−1)n+p p! (n + x)p+1 pour tout x ∈ D. (p) Sur l’intervalle I , la fonction fn est majorée par p!/(n + a)p+1 . Si p > 1 , la série numéP rique p!/(n + a)p+1 converge (c’est une série de Riemann, et p + 1 > 1 ), donc la série de n>0 P (p) converge en fait normalement sur I . Il reste le cas p = 0 . La convergence P uniforme de la série de fonctions fn est ici une conséquence immédiate du critère spéfonctions fn n>0 n>0 cial uniforme des séries alternées (corollaire 20 de la page 490). Puisque la série de fonctions P fn converge simplement, on peut aussi se dispenser du cas p := 0 , en appliquant cette fois n>0 le théorème 27 de la page 494. Soient enfin m ∈ N∗ et I := ]−m, −m + 1[. Chacune des fonctions f0 , . . . , fm−1 étant de P classe C ∞ sur I , il suffit de montrer que la fonction x 7→ (−1)n /(n + x) est de classe n>m C ∞ sur I . Via le changement de variable x := y − m, nous sommes ramenés à voir que la P fonction y 7→ (−1)n /(n − m + y) est de classe C ∞ sur ]0, 1[. Via le changement d’indice n>m n := m + k , cette fonction s’écrit y 7→ P (−1)m+k /(k + y) = (−1)m f (y), elle est donc de k>0 classe C ∞ sur ]0, 1[, d’après l’alinéa précédent. II.2.19 Pour tout (n, x) ∈ N∗ × R, posons fn (x) := 2−n E(nx). La série de fonctions P fn n>1 converge normalement, donc uniformément, sur tout compact de R. Il suffit en effet de voir que, si m ∈ N∗ est fixé, il y a convergence normale sur le segment [−m, m]. Pour tout point x de ce segment et tout n ∈ N∗ , l’inégalité |nx| 6 nm implique |E(nx)| 6 nm, d’où c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 194 |fn (x)| 6 nm2−n . La conclusion en résulte, puisque la série numérique P n2−n converge n>1 (on peut, par exemple, appliquer la règle de d’Alembert). Notons f la fonction +∞ P fn (x). n=1 Soit x0 ∈ R. La fonction partie entière est continue à droite en x0 . Elle est continue en x0 si, et seulement si, x0 ∈ / Z. On en déduit d’abord, par composition, que chaque fn est continue en tout point de R \ Q car, si a ∈ R \ Q et n ∈ N∗ , na n’est pas entier. La convergence normale sur tout compact suffit donc pour assurer la continuité de f en tout point de R \ Q , d’après le théorème 5 de la page 480. Soit maintenant x0 ∈ Q . Montrons que f n’est pas continue en x0 . Écrivons x0 := a/b , où b ∈ N∗ , a ∈ Z et a ∧ b = 1 . Soit n ∈ N∗ . Le théorème de Gauß (cf. le module II.1 de [L1]) montre que nx0 ∈ Z, i.e. b divise na, si, et seulement si, n est multiple de b . Définissons deux fonctions gn , hn : R → R comme suit. Si n est multiple de b , nous posons gn := fn et hn := 0 . Si n n’est pas multiple de b , nous posons au contraire gn := 0 et hn := fn . P P Ainsi fn = gn + hn pour tout n. Les deux séries de fonctions gn et hn convergent n>1 n>1 encore normalement sur tout compact de R. Notons g et h leurs sommes respectives. Alors f = g + h, et l’argument de l’alinéa précédent montre que h est continue au point x0 . Tout revient ainsi à montrer que g n’est pas continue à gauche en x0 . P On notera d’abord que g est la somme de la séries de fonctions fkb . En particulier, puisque k>1 kbx0 = ka pour tout k , on a : g(x0 ) = a +∞ X k2−kb . (∗) k=1 Soit maintenant x ∈ ]−∞, x0 [. Pour tout k ∈ N∗ , on a kbx < kbx0 = ka, donc E(kbx) 6 ka − 1 . D’où : g(x) = +∞ X 2−kb E(kbx) 6 k=1 = g(x0 ) − +∞ X k=1 +∞ X k=1 2−kb (ka − 1) 2−kb = g(x0 ) − 1 · 2b − 1 Pour tout réel x < x0 , on a donc |g(x) − g(x0 )| > 1/(2b − 1), ce qui montre que g n’est pas continue à gauche en x0 . En conclusion, les nombres réels en lesquels f est continue sont exactement les nombres irrationnels. II.2.20 L’intégrale donnée diverge évidemment. En effet, la fonction de x qu’on intègre est la dérivée de la fonction x 7→ sin(t ln x)/t, fonction qui n’a pas de limite finie lorsque x tend P P −(1+it) vers +∞. Par ailleurs, la série cos(t ln n)/n est la partie réelle de la série n . n>1 n>1 En effet, pour tout n ∈ N∗ , on a : n−(1+it) = n−it /n = exp −it ln n /n = cos(t ln n) − i sin(t ln n) /n. P Il suffit de montrer maintenant que la série cos(t ln n)/n diverge. Nous allons pour cela comparer cette série avec l’intégrale Z 1 c Dunod 2014 n>1 +∞ cos(t ln x)/x d x . Notons f la fonction II.2 : Suites et séries de fonctions 195 x 7→ cos(t ln x)/x sur ]0, +∞[. Étant donné un entier n > 1 , partons de l’égalité : Z n+1 Z n+1 f (x) d x − f (n) = f (x) − f (n) d x. n n ′ Majorons |f | sur le segment [n, n + 1]. Pour tout point y de ce segment, on a : cos(t ln y) t sin(t ln y) ′ 6 1 + |t| 6 1 + |t| · |f (y)| = − − y2 y2 y2 n2 Pour tout x ∈ [n, n + 1], l’inégalité des accroissements finis appliquée à f donne donc |f (x) − f (n)| 6 1 + |t| /n2 . Par intégration de n à n + 1 , on en déduit : Z n+1 1 + |t| f (x) d x − f (n) 6 · n2 n X Z n+1 P Il en résulte que la série f (n) et la série f (x) d x sont de même nature. Pour n>1 n>1 n conclure, il suffit de montrer que la deuxième de ces séries diverge. Raisonnons par l’absurde, Z p en supposant que cette série converge. D’après la relation de Chasles, f (x) d x a donc une 1 limite finie ℓ lorsque p tend vers = ∞. Considérons maintenant un réel b > 1 et soit p := E(b). La relation de Chasles donne : Z p Z b Z b ! f −ℓ = f −ℓ + f. 1 1 p Faisons tendre b vers +∞. Le termes entre accolades tend vers 0 , par hypothèse. Par ailleurs, comme |f (x)| 6 1/x pour tout x > 0 , on a : Z Z b Z p+1 Z p+1 b dx f 6 |f | 6 |f | 6 = ln(1 + 1/p), p x p p p Z b f tend vers 0 . Il en résulte finalement que l’intégrale Z +∞ f converge (vers ℓ ), ce P qui est faux, comme nous l’avons dit. Cette contradiction montre que la série f (n) diverge. donc p 1 n>1 En examinant le raisonnement ci-dessus, le lecteur constatera aisément qu’on a un résultat plus général. Considérons une fonction réelle f de classe C 1 sur un intervalle I := [a, +∞[. Faisons les deux hypothèses suivantes : 1. la fonction f a pour limite 0 en +∞ ; Z +∞ 2. l’intégrale |f ′ | converge. a Alors l’intégrale Z +∞ f et la série a deux ou divergent toutes deux. P f (n) sont de même nature : elles convergent toutes n>a II.2.21 Pour tout n, posons bn := an n−z0 . Effectuons la translation z := z0 + y . La P P série an n−z est transformée en bn n−y . Par ailleurs, lorsque y décrit le secteur n>1 n>1 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 196 S0 := {reiθ | r > 0, −α 6 θ 6 α} , z décrit le secteur S défini dans l’énoncé. Quitte à remplacer les an par les bn , nous sommes ramenés au cas où z0 := 0 , ce que nous supposons désormais. P L’hypothèse est maintenant que la série an converge. Notons (Rn ) la suite des restes de n>1 cette série. Pour tout n ∈ N, rappelons que Rn := +∞ P ak . La suite (Rn ) converge vers 0 , k=n+1 en particulier elle est bornée. Pour tout n ∈ N, posons encore : ωn := sup |Rk |. Lorsque n k>n tend vers +∞, ωn tend vers 0 . Pour montrer que la série de fonctions donnée converge uniformément sur S , l’idée générale est d’appliquer le critère de Cauchy uniforme (théorème 21 de la page 490). Étant donnés deux entiers p, q tels que 1 6 p < q et un point z du secteur S , posons : Sp,q (z) : q X an · nz n=p Tout ce que nous avons à faire est de majorer |Sp,q (z)|, indépendamment de q et de z , par une quantité tendant vers 0 lorsque p tend vers +∞. Pour cela, effectuons une transformation d’Abel (cf. la preuve de l’égalité (11) de la page 491), en partant de la remarque que an = Rn−1 − Rn pour tout n > 1 . Pour tous p, q, z comme ci-dessus, on a : Sp,q (z) = q X n=p an n−z = q X (Rn−1 − Rn )n−z = n=p = p−z Rp−1 − q −z Rq + q−1 X n=p q−1 X n=p−1 Rn (n + 1)−z − q X Rn n−z n=p Rn (n + 1)−z − n−z . Puisque z ∈ S , Re z > 0 , donc |p−z | < 1 et de même |q −z | < 1 . Par inégalité triangulaire et par définition des ωn , on obtient la majoration : q−1 X (n + 1)−z − n−z 6 ωp−1 |Sp,q (z)| 6 ωp−1 + ωq + ωp n=p ! q−1 X −z −z (n + 1) − n . 2+ n=p Par hypothèse, z = reiθ , où r est un réel strictement positif et θ ∈ [−α, α] . On observera que |z| = r et cos θ > cos α > 0 . En outre, pour tout réel t > 0 , |t−z | = t− Re z = t−r cos θ . Cela étant, soit n ∈ N∗ . La dérivée de t 7→ t−z étant t 7→ −zt−1−z , il vient : Z (n + 1)−z − n−z = z n+1 n Z t−z−1 dt 6 r n+1 n t−1−r cos θ dt 1 1 1 = − cos θ nr cos θ (n + 1)r cos θ 1 1 1 6 − · cos α nr cos θ (n + 1)r cos θ c Dunod 2014 II.2 : Suites et séries de fonctions 197 On en déduit la majoration suivante : ! q−1 1 X 1 1 |Sp,q (z)| 6 ωp−1 2 + − cos α n=p nr cos θ (n + 1)r cos θ 1 1 1 1 6 ωp−1 2 + − 6 ω 2 + . p−1 cos α pr cos θ q r cos θ cos α En effet, le dernier terme entre crochets est majoré par 1 . Nous avons ainsi obtenu une majoration de |Sp,q (z)| , indépendante de l’entier q > p et du point z ∈ S , par une quantité qui tend vers 0 lorsque p tend vers +∞, puisque c’est le cas pour ωp−1 . Le critère de Cauchy uniforme peut donc être appliqué, ce qui établit la convergence uniforme de la série de fonctions donnée sur le secteur S . P −s Venons-en à la divergence de la série n , avec les notations de l’énoncé. Raisonnons par n>1 l’absurde, en supposant que cette série converge. On applique ce qui précède, avec an := 1 pour tout n et z0 := s. Pour tout α ∈ ]0, π/2[, notons Sα le secteur formé des points s + reiθ P −z lorsque r décrit ]0, +∞] et θ décrit [−α, α] . Pour tout z ∈ Sα , la série n converge n>1 donc. C’est vrai pour tout α ∈ ]0, π/2[. Or il est clair que la réunion des secteurs Sα lorsque α décrit ]0, π/2[ est le demi-plan ouvert z ∈ C | Re z > u = Re s (faire un dessin). Pour tout P −z point z de ce demi-plan, la série n converge donc. Mais u ∈ ]0, 1[, donc 1 appartient au n>1 P demi-plan en question. Conclusion : la série harmonique 1/n converge, ce qui est absurde. n>1 II.2.22 1. Notons fn (x) le terme général de la série. Chacune des fonctions fn est de classe C ∞ sur D et ses dérivées sont données par la formule : fn(p) (x) = (−1)n+p p! n!(x + n)p+1 pour tout p ∈ N. Pour montrer que f est de classe C ∞ sur D il suffit, en vertu du théorème 28 de la page 495, de P (p) montrer que si A est un compact de D et si p ∈ N, la série fn converge uniformément n>0 (par exemple normalement) sur A. On se ramène immédiatement au cas où A est un segment de la forme [m + a, m + 1 − a], où m ∈ Z et a ∈ [0, 1/2[, avec a > 0 lorsque m 6 0 . Pour tout entier n > |m| et tout x ∈ A, on a x + n > n + m + a > n − |m| + a, d’où la majoration : p! (p) fn (x) 6 p+1 · n! n − |m| + a La convergence normale sur A est alors évidente, puisque déjà la série de terme général 1/n! converge. −1 2. Considérons un entier n > 0 fixé. La fraction rationnelle X(X + 1) · · · (X + n) a n + 1 pôles simples, à savoir les points −k , pour k = 0, 1, . . . , n. Il existe des coefficients ck (uniques) tels que la décomposition en éléments simples de cette fraction soit : n X 1 ck = · X(X + 1) · · · (X + n) X +k k=0 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 198 Soit k ∈ [[0, n]]. Pour calculer le coefficient ck (qui dépend aussi de n, mais peu importe), remplaçons dans cette égalité X par un réel x tendant vers −k . En multipliant l’égalité obtenue par x + k , on obtient : ck = 1 (−1)k = · (−k)(−k + 1) · · · (−1)(1)(2) · · · (n − k) k!(n − k)! D’où : n X 1 (−1)k = · x(x + 1) · · · (x + n) k!(n − k)!(x + k) k=0 2 Pour tout couple (n, k) ∈ N , définissons un nombre réel an,k comme suit. Si n < k , posons −1 an,k := 0 . Si n > k , posons an,k := (−1)k k!(n − k)!(x + k) . Nous obtenons : n +∞ X X 1 = an,k = an,k . x(x + 1) · · · (x + n) k=0 k=0 Appliquons maintenant le théorème de Fubini (théorème 15 de la page 485) à la série double P P an,k . Fixons d’abord k ∈ N. Le changement d’indice n := k + p transforme la série k>0 n>0 −1 ap+k,k . À la constante (−1)k k!(x + k) près, on obtient la série de terme n>0 p>0 P général 1/p!, qui converge et a pour somme e . La série |an,k | converge donc, et l’on a : P an,k en P n>0 +∞ X e |an,k | = k! |x + k| n=0 Puisque la série et +∞ X an,k = n=0 (−1)k e · k!(x + k) −1 P e k! |x + k| converge manifestement, nous pouvons effectivement ap- k>0 pliquer le théorème de Fubini. Ce théorème donne l’égalité suivante, avec convergence de toutes +∞ +∞ +∞ P P P P +∞ an,k , soit : les séries qui apparaissent : an,k = k=0 ef (x) := n=0 n=0 k=0 +∞ +∞ X X (−1)k e 1 = · k!(x + k) x(x + 1) · · · (x + n) n=0 (∗) k=0 On en déduit (avec le changement d’indice n := k + 1 ) : exf (x) = 1 + +∞ X +∞ X 1 1 = 1+ (x + 1) · · · (x + n) (x + 1) · · · (x + 1) + k n=1 k=0 = 1 + ef (x + 1). D’où xf (x) − f (x + 1) = 1/e pour tout x ∈ D . 3. Soit donc x un réel strictement positif fixé. Pour tous n ∈ N et t ∈ ]0, 1], posons gn (t) := (−1)n tn+x−1 /n!. Chaque gn est intégrable sur ]0, 1], et son intégrale sur ]0, 1] P vaut (−1)n / n!(x + n) . La série de fonctions gn converge simplement avec pour somme n>0 Z P x−1 −t la fonction g : t 7→ t e . À condition de justifier l’interversion des signes et que c Dunod 2014 II.2 : Suites et séries de fonctions nous allons effectuer, on a : Z 1 Z 1 tx−1 e−t d t = 0 0 +∞ X 199 +∞ X (−1)n tn+x−1 n! n=0 ! dt = Z 1 +∞ X (−1)n tn+x−1 d t n! 0 n=0 (−1)n = f (x). n!(x + n) n=0 N P Pour tout entier N > 0 , la fonction gn est majorée par la fonction t → 7 etx−1 , qui est = n=0 intégrable sur ]0, 1]. L’interversion est alors justifiée par le théorème de convergence dominée (cf. le module II.3). II.2.23 1. Pour tout n ∈ N∗ et tout x ∈ R \ Z, posons fn (x) := (n − x)−2 + (n + x)−2 . P La convergence simple de la série de fonctions fn est évidente car, si x est fixé et si n n>1 2 tend vers +∞, fn (x) ∼ 2/n . D’où une fonction f : R \ Z → R, définie par la formule de l’énoncé, c’est-à-dire : +∞ X 1 f (x) = 2 + fn (x). (∗) x n=1 P Soit x ∈ R \ Z. Dans la formule f (x + 1) := (n − x − 1)−2 , effectuons le changement n∈Z P d’indice n := m + 1 . Il vient : f (x + 1) = (m − x)−2 = f (x), ce qui montre que f m∈Z est 1 -périodique. Si l’on n’est pas convaincu par ce raisonnement utilisant les sommes du type P , on procède comme suit. Soit N ∈ N∗ . Évaluons les sommes partielles suivantes, à l’aide n∈Z de changements d’indices évidents : N SN = N N −1 X 1 1 = + + (x + 1)2 (k − x)2 k=0 TN = = N X X X 1 1 1 1 + fn (x + 1) = + + 2 2 2 (x + 1) (x + 1) (n − x − 1) (n + x + 1)2 n=1 n=1 n=1 N X −2 X k=−N −1 N X 1 = (k − x)2 N −1 X k=−N −1 1 , (k − x)2 N X 1 1 1 1 + fn (x) = 2 + + 2 2 x x (n − x) (n + x)2 n=1 n=1 n=1 N −1 X X 1 1 1 + + = x2 (k − x)2 (k − x)2 k=1 k=−N N X k=−N 1 · (k − x)2 Ainsi SN − TN = (x + N + 1)−2 − (x − N )−2 tend vers 0 lorsque N tend vers +∞, d’où l’égalité f (x + 1) = f (x), par passage à la limite. P Pour la continuité de f il suffit de montrer que la série de fonctions fn converge uniforn>1 mément sur tout compact de R \ Z. Vu la 1 -périodicité de f , il suffit de montrer qu’il y a convergence normale sur tout segment du type I := [a, 1 − a], où a est fixé, 0 < a < 1/2 . Pour tout entier n > 2 et tout x ∈ I , on a n− x > n+ a− 1 , donc (n− x)−2 6 (n+ a− 1)−2 , c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 200 et de même n + x > n + a, donc (n + x)−2 6 (n + a)−2 . D’où la convergence normale sur I , car la série numérique de terme général (n + a − 1)−2 + (n + a)−2 converge. 2. La fonction g est la différence de deux fonctions continues et 1 -périodiques sur R \ Z. Il suffit donc de montrer que g(x) a une limite finie lorsque x tend vers 0 . Un calcul analogue P à celui fait plus haut montre que la série de fonctions fn converge normalement sur tout n>1 segment [−a, a], où a ∈ ]0, 1[ est fixé. Il en résulte que la différence f (x) − 1/x2 a une limite finie lorsque x tend vers 0 , plus précisément : lim x→0 1 f (x) − 2 x = 2 +∞ X 1 · 2 n n=1 (∗∗) Pour conclure, il suffit donc de montrer que π 2 / sin2 (πx) − 1/x2 a une limite finie lorsque x tend vers 0 . Effectuons pour cela un développement limité en 0 : 2 π 2 x2 − πx − π 3 x3 /6 + O(x5 ) 1 π 2 x2 − sin2 (πx) π2 − = = sin2 (πx) x2 x2 sin2 (πx) x2 sin2 (πx) ( 2 ) π2 π 2 x2 = 1− 1− + O(x4 ) 6 sin2 (πx) 2 2 π2 π x 4 = + O(x ) . 3 sin2 (πx) Lorsque x tend vers 0 , sin(πx) ∼ πx, donc sin2 (πx) ∼ π 2 x2 . On en déduit alors que π 2 / sin2 (πx) − 1/x2 tend vers π 2 /3 . 3. Puisque g est continue sur R, il suffit de prouver l’égalité de l’énoncé lorsque x ∈ / Z. Notons h la fonction x 7→ 1/ sin2 (πx) sur R \ Z. Il suffit de montrer que, si ϕ est l’une des fonctions h ou f , et si x ∈ R \ Z est fixé, on a ϕ(x/2) + ϕ (x + 1)/2 = 4ϕ(x). Pour la fonction h, c’est un petit calcul trigonométrique : h(x/2) + h (x + 1)/2 = 1 1 + sin2 (πx/2) sin2 (π(x + 1)/2) 1 1 sin2 (πx/2) + cos2 (πx/2) + = 2 sin (πx/2) cos (πx/2) sin2 (πx/2) cos2 (πx/2) 1 4 = = 4h(x). = 2 2 2 sin (πx/2) cos (πx/2) sin (πx) P P Pour la fonction f , on a f (x/2) = (n − x/2)−2 = 4 (2n − x)−2 . De la même façon, = f (x + 1)/2 = P n∈Z 2 n∈Z −2 n − (x + 1)/2 = 4 P n∈Z (2n − x − 1)−2 . La conclusion est alors n∈Z évidente, en séparant les entiers pairs et les entiers impairs. La fonction |g| : R → R est continue et 1 -périodique. En considérant sa restriction à [0, 1], on en déduit qu’elle est bornée et atteint ses bornes. Elle atteint en particulier son maximum absolu M > 0 en un point x ∈ [0, 1]. Alors : 4M = 4 |g(x)| = g(x/2) + g (x + 1)/2 6 |g(x/2)| + g (x + 1)/2 6 2M, c Dunod 2014 II.2 : Suites et séries de fonctions 201 d’où M = 0 . La fonction g est donc nulle. Autrement dit, pour tout x ∈ R \ Z, on a : X π2 1 · = 2 (n − x)2 sin πx n∈Z Par ailleurs, g(0) = 0 . Or g(0) est la limite, lorsque x tend vers 0 , de f (x) − π 2 / sin2 (πx). Dans la question précédente, nous avons montré que π 2 / sin2 (πx) − 1/x2 tend vers π 2 /3 . +∞ P Compte tenu de la formule (∗∗), on obtient, comme souhaité, l’égalité 1/n2 = π 2 /6 . n=1 II.2.24 Notons un le terme général de la série. Lorsque n tend vers +∞, n1/n tend vers 1 √ (regarder le logarithme), donc n un = a(n + 1)/n n−1/n tend vers a. La règle de Cauchy montre donc que la série converge si a < 1 et diverge si a > 1 . Si a := 1 , cette règle ne s’applique pas, mais un raisonnement direct permet de conclure. En effet, lorsque n tend vers +∞, on a : n (n + 1)n 1 1 e un = = 1 + · ∼ , n+1 n n n n donc la série diverge. Appliquons ensuite la règle de d’Alembert. Pour tout n > 2 , il vient : n n 1/n (n + 1)a un (n − 1)n (n − 1)(n + 1) 1 = · = a = a 1− 2 · un−1 nn+1 (na)n−1 n2 n On en déduit que un /un−1 tend vers a (passer là encore par le logarithme), et l’on peut conclure, comme précédemment. II.2.25 1. Rappelons le « Lemme de Cesàro » , dans le cas réel. Soit (un ) une suite réelle ayant une limite ℓ . Pour tout n ∈ N∗ , posons sn := (u0 + u1 + · · · + un−1 )/n. Alors la suite (sn ) a aussi comme limite ℓ . Ce résultat reste vrai dans le cas d’une « limite infinie », avec ℓ := +∞ ou ℓ := −∞. Par commodité, donnons une preuve de ce lemme. Supposons d’abord que ℓ soit un réel. Par linéarité, on se ramène au cas où ℓ := 0 . Soit ε > 0 . NP −1 Il existe N ∈ N∗ tel que, pour tout entier n, (n > N ) =⇒ |un | 6 ε . Posons C := |uk |. k=0 Pour tout entier n > N , l’inégalité triangulaire donne : |nsn | 6 n−1 X k=0 |uk | 6 C + (n − N )ε 6 C + nε, d’où |sn | 6 ε + C/n. Il en résulte que |sn | 6 2ε dès que n est assez grand, donc la suite (sn ) converge vers 0 . Supposons que ℓ := +∞ (si ℓ := −∞, on remplace la suite donnée par son opposée). La démarche est alors analogue. Considérons un réel A > 0 . Il existe N ∈ N∗ tel que, pour tout NP −1 entier n, (n > N ) =⇒ un > A . Posons C := |uk |. Pour tout entier n > N , les k=0 inégalités uk > A pour k = N, . . . , n − 1 donnent : nsn > −C + (n − N )A, d’où sn > A − (C + N A)/n. Il en résulte que sn > A/2 dès que n est assez grand, donc la suite (sn ) tend vers +∞. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 202 Revenons à la suite (an ). Nous supposons donc que la suite (an+1 /an ) a une limite ℓ , éventuellement +∞. Bien entendu, ℓ > 0 . Pour tout n ∈ N, posons un := ln(an+1 /an ). Si ℓ := +∞, la suite (un ) tend vers +∞, si ℓ := 0 , elle tend vers −∞, et, si ℓ est un réel strictement positif, (un ) converge vers ln ℓ . Dans tous les cas, (un ) tend vers λ := ln ℓ , avec la convention que λ := +∞ si ℓ := +∞ et λ := −∞ si ℓ = 0 . Cela étant, soit (sn )n>1 la suite formée des moyennes arithmétiques des un , comme ci-dessus. D’après le lemme de Cesàro, (sn ) tend vers λ. Or, pour tout n ∈ N∗ , on a : sn = n−1 √ ln a0 1X ln an − ln a0 ln(ak+1 /ak ) = = ln n an − · n n n k=0 √ Il en résulte que la suite de terme général ln n an tend vers λ donc, compte tenu de nos √ conventions sur λ, la suite de terme général n an tend vers ℓ . P Supposons que la règle de d’Alembert permette de déterminer la nature de la série an . Cela n>0 veut dire que la suite (an+1 /an ) a une limite ℓ , finie ou non mais distincte de 1 . Puisque la √ suite n an tend aussi vers ℓ , la règle de Cauchy permet également de conclure. 2. Soit p ∈ N. On a a2p = 2p ·3−2p , a2p+1 = 2p ·3−(2p+1) , et a2p+2 = 2p+1 ·3−(2p+2) . Ainsi a2p+1 /a2p = 1/3 et a2p+2 /a2p+1 = 2/3 . La suite de terme général an+1 /an ne possède donc pas de limite ; cette suite a deux valeurs d’adhérence, 1/3 et 2/3 . Dans ces conditions, la règle de d’Alembert ne s’applique pas, i.e. elle ne permet pas de déterminer la nature de la série P an . n>0 Pour tout n ∈ N, on a n/2 − 1 < E(n/2) 6 n/2 , d’où 2n/2−1 · 3−n 6 an < 2n/2 · 3−n , √ √ √ puis 2−1/n · 2/3 6 n an < 2/3 . Lorsque n tend vers +∞, 21/n tend vers 1 . D’après le √ √ théorème des gendarmes (cf. [L1]), la suite de terme général n an converge vers 2/3 < 1 . P La règle de Cauchy montre alors que la série an converge. n>0 II.2.26 Pour tout n, cos(na) = (enia + e−nia )/2 . La série est exp(xeia ). De même, la série P P xn enia /n! converge, et sa somme n>0 xn e−nia /n! converge, et sa somme est exp(xe−ia ). La n>0 série donnée converge donc, et sa somme vaut : +∞ n X x cos(na) 1 = exp(xeia ) + exp(xe−ia ) n! 2 n=0 1 exp(x cos a + ix sin a) + exp(x cos a − ix sin a) 2 ex cos a ix sin a = e + e−ix sin a = ex cos a cos(x sin a). 2 = p II.2.27 Notons f la fonction x 7→ (1 + x)/(1 − x) . Elle est définie et de classe C ∞ sur I := ]−1, 1[. Pour montrer que f est DSE sur I , et pour trouver son développement, il n’est c Dunod 2014 II.2 : Suites et séries de fonctions 203 pas très judicieux, par exemple, de faire un produit de Cauchy des développements de (1+x)1/2 et de (1 − x)−1/2 . L’astuce est plutôt de partir des égalités suivantes, valables pour tout x ∈ I : r r 1+x (1 + x)2 = = (1 + x)(1 − x2 )−1/2 . 1−x 1 − x2 Il n’y a plus qu’à utiliser le développement en série entière de x 7→ (1 − x2 )−1/2 , cf. la formule précédant la formule (33) de la page 525, puis à faire une somme de séries convergentes : r +∞ +∞ +∞ X X 1+x 1 2p 2p X 1 2p 2p+1 = x + x = an xn , 2p 2p 1−x 2 p 2 p p=0 p=0 n=0 les coefficients an étant définis par les formules suivantes (selon la parité de n) : 1 2p pour tout p ∈ N. a2p := a2p+1 := 2p 2 p P Le rayon de convergence R de la série entière an xn est au moins égal à 1 , puisque le n>0 rayon de convergence de la série entière donnant la fonction x 7→ (1 − x2 )−1/2 est 1 . En P fait R = 1 . En effet, soit g : ]−R, R[ la somme de la série entière an z n . Raisonnons n>0 par l’absurde, en supposant R > 1 . Lorsque x ∈ I tend vers 1− , g(x) tend alors vers g(1). C’est absurde, car d’une part g(x) = f (x) pour tout x ∈ I et d’autre part f (x) tend vers +∞ lorsque x tend vers 1− . On a donc bien R = 1 . II.2.28 Appliquons le théorème 22 de la page 491, dont nous reprenons les notations. Ici X = [0, 1], E := C et, pour tout n ∈ N∗ et tout x ∈ X , on pose fn (x) := xn /n et gn (x) := j n (de sorte que les gn sont des fonctions constantes). Si x ∈ X est fixé, la suite fn (x) n>1 est à valeurs réelles positives, elle est décroissante et tend vers 0 . Cette convergence est uniforme sur X à cause des inégalités fn (x) 6 1/n. Ensuite, pour tout n ∈ N∗ , on a: n X 1 − j n+1 2 2 k 6 j = = √ · 1−j |1 − j| 3 k=0 P Toutes les hypothèses du théorème étant satisfaites, la série de fonctions fn gn , c’est-à-dire n>1 P n n j x /n, converge uniformément sur X . Notons donc f : [0, 1] → C la somme de cette n>1 série de fonctions. Puisque tous les termes de cette série sont des fonctions continues sur X , f est continue sur X . Pour expliciter f sur [0, 1[, nous allons dériver. Chaque terme de la série définissant f est une P n n−1 fonction de classe C ∞ sur R. La série des dérivées est j x . Pour tout réel r ∈ ]0, 1[ n>1 fixé, cette série de fonctions converge normalement sur [0, r[, puisqu’il s’agit d’une série entière de rayon de convergence 1 (série géométrique). D’après le théorème 14 de la page 483, f est de classe C 1 sur [0, r[, et l’on a : f ′ (x) = +∞ X n=1 j n xn−1 = j 1 − jx pour tout x ∈ [0, 1[ . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 204 Ainsi f est la primitive de x 7→ j/(1 − jx) nulle en 0 . On pourrait en déduire que f (x) = − ln(1 − jx) pour tout x, mais il faudrait pour cela utiliser le logarithme complexe. Procédons différemment. Soit x ∈ [0, 1[. Les égalités 1 + j + j 2 = 0 et j 3 = 1 donnent (1 − jx)(1 − j 2 x) = 1 + x + x2 , d’où : f ′ (x) = j(1 − j 2 x) j−x = · 2 1+x+x 1 + x + x2 Z (2x + 1) d x = ln(1 + x + x2 ) + constante, puis : 1 + x + x2 Z Z dx 2x + 1 4dx 2 √ = = √ arctan + constante. 1 + x + x2 (2x + 1)2 + 3 3 3 √ Pour tout x ∈ [0, 1[, on en déduit, puisque arctan(1/ 3) = π/6 : t=x 1 2j + 1 2t + 1 2 √ f (x) = − ln(1 + t + t ) + √ arctan 2 3 3 t=0 t=x 1 2t + 1 √ = − ln(1 + t + t2 ) + i arctan 2 3 t=0 1 2x + 1 iπ √ = − ln(1 + x + x2 ) + i arctan − · 2 6 3 Un calcul élémentaire donne Puisque f est continue sur [0, 1], sa valeur en 1 , c’est-à-dire +∞ P j n /n, est la limite de f (x) n=1 quand x tend vers 1− . D’où aussitôt : +∞ n X √ 1 iπ 1 iπ iπ 1 iπ j = − ln 3 + i arctan( 3) − = − ln 3 + − = − ln 3 + · n 2 6 2 3 6 2 6 n=1 Indiquons comment retrouver les résultats précédents en utilisant la section du module II.6 portant sur le logarithme complexe. Les résultats de ladite section montrent que, pour tout x ∈ [0, 1[, on a : +∞ n n X j x = −Log(1 − jx). n n=1 √ Le module de 1 − jx est r := 1 + x + x2 . Calculons la détermination principale de Arg(1 − jx) : √ ! √ −1 i 3 1 + = x + 2 − ix 3 . 1 − jx = 1 − x 2 2 2 Par définition de la détermination principale de l’argument, on en déduit ceci : √ ! x 3 Arg(1 − jx) = − arctan , d’où x+2 1 Log(1 − jx) = ln(1 + x + x2 ) − i arctan 2 c Dunod 2014 √ ! x 3 . x+2 II.2 : Suites et séries de fonctions 205 On retrouve le résultat précédent, à condition de vérifier ceci, x ∈ [0, 1[ étant fixé : √ ! x 3 2x + 1 π √ arctan = arctan − · x+2 6 3 | {z } | {z } =a =b La formule d’addition de la fonction tangente donne : √ 2x+1 √ − √13 tan a − tan(π/6) x 3 3 tan(a − π/6) = = = = tan b. √ 1 + tan a tan(π/6) x+2 1 + 2x+1 · √13 3 Pour en déduire l’égalité b = a − π/6 , il suffit de vérifier que a − π/6 ∈ ]−π/2, π/2[. C’est évident, parce que x ∈ [0, 1[, donc a ∈ [π/6, π/3[. II.2.29 Soit f la fonction x 7→ arctan(x + 1). Comme fonction composée, elle est de classe C ∞ sur R. Mais le fait que la fonction arctan soit DSE sur ]−1, 1[ ne suffit pas pour conclure que f est DSE 0 , car la proposition 39 de la page 513 ne s’applique pas : la valeur de x 7→ x + 1 en 0 est 1 . L’idée est simple. La dérivée de f est une fraction rationnelle, sans pôle en 0 . Cette dérivée est donc développable en série entière au voisinage de 0 . Par intégration, nous en déduirons que f est DSE 0 . On obtient la dérivée de f à l’aide de la formule de dérivation d’une fonction composée : f ′ (x) = 1 1 = 2 · (x + 1)2 + 1 x + 2x + 2 C’est là une fraction rationnelle, ayant deux pôles simples, à savoir −1 + i et −1 − i . Cette fraction rationnelle étant de degré −2 , sa partie entière est nulle. La théorie de la décomposition en éléments simples nous dit qu’il existe un unique couple (a, b) ∈ C2 tel que l’égalité cidessous soit vraie pour tout z ∈ C distinct des deux pôles : 1 a b = + · z 2 + 2z + 2 z+1−i z+1+i Le calcul donne a = −i/2 et b = i/2 . Par exemple, en multipliant l’égalité ci-dessus par z + 1 − i puis en faisant tendre z vers −1 + i , on voit que a est l’inverse de la dérivée de z 2 + 2z + 2 en −1 + i , d’où la valeur de a indiquée. √ Soit ε ∈ {−1, 1} . Puisque |εi − 1| = 2 , on obtient le développement suivant (série géomé√ trique), valable pour tout z ∈ C tel que |z| < 2 : −1 +∞ X 1 1 z (−1)n z n = 1+ = · z + 1 + εi 1 + εi 1 + εi (1 + εi)n+1 n=0 Noter que (1 + εi)−1 = (1 − εi)/2 . On en déduit le développement suivant, valable pour tout √ z ∈ C tel que |z| < 2 : +∞ +∞ 1 −i X (−1)n (1 + i)n+1 z n i X (−1)n (1 − i)n+1 z n = + z 2 + 2z + 2 2 n=0 2n+1 2 n=0 2n+1 = +∞ X n=0 an z n , où an := (−1)n+1 i (1 + i)n+1 − (1 − i)n+1 . n+2 2 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 206 √ √ 2 exp(iπ/4) et 1 − i = 2 exp(−iπ/4), il vient : √ (1 + i)n+1 − (1 − i)n+1 = ( 2)n+1 exp (n + 1)iπ/4 − exp −(n + 1)iπ/4 √ = i( 2)n+3 sin (n + 1)π/4 , d’où Soit n ∈ N. Puisque 1 + i = (−1)n sin (n + 1)π/4 . (n+1)/2 2 Pour simplifier l’expression de an , effectuons la division de n par 4 : n := 4p + r , où p ∈ N et r ∈ {0, 1, 2, 3} . On obtient ceci : an = (−1)p (−1)p+1 (−1)p , a4p+1 = , a4p+2 = 2p+2 , a4p+3 = 0. 2p+1 2p+1 2 2 2 Observons que les an sont rationnels (sauriez-vous dire pourquoi c’était prévisible ?). Le rayon √ P de convergence de la série entière an z n est 2 , en vertu de la proposition 38 de la a4p = n>0 page 511. En particulier, on a donc : f ′ (x) = +∞ X an xn n=0 Le théorème 42 de la page f (0) = arctan 1 = π/4 , on obtient : +∞ arctan(x + 1) = i √ √ h pour tout x ∈ − 2, 2 . 516 permet d’intégrer +∞ π X an−1 xn π X an xn+1 + = + 4 n=0 n + 1 4 n=1 n cette égalité. Puisque i √ √ h pour tout x ∈ − 2, 2 . √ Le rayon de convergence de la série entière obtenue est encore 2 (proposition 40 de la page 515). On peut écrire le développement précédent de façon plus explicite : +∞ π X (−1)p x4p 2x 2x2 x3 arctan(x + 1) = + − + . 4 p=0 22p+2 4p + 1 4p + 2 4p + 3 Terminons par une remarque. Soit x ∈ R. Posons a := arctan(x + 1) et b := a − π/4 . En général, la formule d’addition pour la fonction tangente donne : tan b = tan a − tan(π/4) / 1 + tan a tan(π/4) = (x + 1 − 1)/(1 + x + 1) = x/(x + 2). Cette formule est valable pourvu que tan a 6= −1 , c’est-à-dire x 6= −2 . Il est alors logique de comparer les fonctions x 7→ arctan(x + 1) et x 7→ arctan x/(x + 2) . On vérifie que ces deux fonctions ont même dérivée, elles diffèrent donc d’une constante. Mais cette constante dépend de l’intervalle sur lequel on se place. Le lecteur pourra vérifier que, pour tout x 6= −2 , on a : ( π/4 + arctan x/(x + 2) si x > −2 arctan(x + 1) = −3π/4 + arctan x/(x + 2) si x < −2. La proposition 39 de la page 513 montre que la fonction x 7→ arctan x/(x + 2) est DSE 0 , et l’on retrouve ainsi le fait que f soit DSE 0 , sans pouvoir obtenir directement, par cette méthode, √ le rayon de convergence 2 . 2 II.2.30 1. Pour tout couple (n, p) ∈ N , posons In,p := Z 0 1 tn (ln t)p d t . Soit (n, p) ∈ N2 . L’in- tégrale In,p est impropre si p > 1 (à cause du comportement de ln t en 0 ). Montrons que c Dunod 2014 II.2 : Suites et séries de fonctions 207 p cette intégrale est convergente (cf. le module II.3). Lorsque t tend vers 0+ , tn+1/2 |ln t| tend √ p vers 0 . Il existe donc un réel C tel que tn |ln t| 6 C/ t pour tout t ∈ ]0, 1]. D’où par Z 1 comparaison la convergence de In,p , car l’intégrale t−1/2 d t est convergente. 0 Il reste à calculer les In,p . Fixons l’entier n > 0 , et cherchons une relation de récurrence entre In,p−1 et In,p , p > 1 . Fixons un réel ε ∈ ]0, 1[. Intégrons par parties sur [ε, 1], en intégrant tn et en dérivant (ln t)p . La dérivée de (ln t)p étant p(ln t)p−1 /t, il vient : n+1 t=1 Z 1 Z 1 t p tn (ln t)p d t = · (ln t)p − tn (ln t)p−1 d t n+1 n + 1 ε ε t=ε Z 1 −εn+1 (ln ε)p p − tn (ln t)p−1 d t. = n+1 n+1 ε Lorsque ε tend vers 0 , le crochet tend vers 0 , d’où : In,p = La formule annoncée : In,p = −p In,p−1 . n+1 (−1)p p! (n + 1)p+1 (∗) s’en déduit aussitôt, par récurrence sur p (à n fixé). 2. Lorsque t tend vers 0+ , t ln t tend vers 0 . La fonction f : [0, 1] → R définie par f (0) := 0 et f (t) := t ln t si t > 0 est donc continue. Puisque f ′ (t) = 1 + ln t, la fonction f atteint son minimum absolu en 1/e , ce minimum valant −1/e . Ainsi |f | 6 1/e . Cela étant, considérons un réel x fixé. Pour tout t ∈ [0, 1], txt est par définition égal à exp(xt ln t), c’est-à-dire à exp xf (t) . D’où : +∞ n X x f (t)n txt = · n! n=0 La série de fonctions de t apparaissant ici converge normalement sur [0, 1], parce que |f | est Z P majorée par 1/e . Cela autorise une interversion des signes et : Z 1 txt d t = 0 D’après la question 1, on a donc : Z 1 +∞ n Z 1 +∞ n X X x x tn (ln t)n d t = In,n . n! 0 n! n=0 n=0 txt d t = 0 +∞ X (−1)n xn n+1 (n + 1) n=0 Cette égalité étant vraie pour tout réel x, c’est le développement en série entière demandé, et le rayon de convergence est +∞. En fait, la formule obtenue est valable pour tout nombre complexe x. II.2.31 Puisque |a| 6= 1 , la fonction f : x 7→ (eix − a)−1 est définie sur R, elle est 2π -périodique P et de classe C ∞ . La série de Fourier cn einx de f converge donc normalement vers f (cf. le n∈Z c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 208 module II.4). Rappelons la formule donnant les cn : Z 2π Z 2π −inx 1 1 e −inx cn = f (x)e dx = d x. 2π 0 2π 0 eix − a Plutôt que de calculer directement ces intégrales, utilisons une méthode indirecte. Distinguons deux cas, suivant que |a| < 1 ou |a| > 1 . Commençons par le cas |a| < 1 . Comme souvent, l’idée est de faire intervenir une série géométrique. Soit x ∈ R. Puisque ae−ix < 1 , il vient : f (x) = +∞ X 1 e−ix −ix = = e an e−inx eix − a 1 − ae−ix n=0 Puisque |a| < 1 , la dernière série de fonctions converge vers f normalement (donc uniformément) sur R. Cela permet de calculer les coefficients de Fourier de f par interversion des Z P signes et . Pour tout k ∈ Z, on a : 2πck = Z 2π e −kix 0 +∞ X n=0 n −(n+1)ix a e ! dx = +∞ X an n=0 Z 2π 0 e−(n+k+1)ix d x . Soit h ∈ Z. L’intégrale sur [0, 2π] de la fonction x 7→ ehix vaut 2π si h = 0 et 0 sinon. On en déduit les coefficients de Fourier de f , dans le cas |a| < 1 : ( 0 si k > 0 ck = a−(k+1) si k 6 −1. Passons au cas |a| > 1 . Soit x ∈ R. Puisque eix /a < 1 , il vient : f (x) = +∞ X −a−1 1 −1 = = −a a−n einx eix − a 1 − a−1 eix n=0 Soit k ∈ Z. Comme dans le cas précédent, on obtient : ! Z Z 2π +∞ +∞ X X −kix −(n+1) nix 2πck = e −a e dx = − a−(n+1) 0 n=0 n=0 0 2π e(n−k)ix d x . On en déduit les coefficients de Fourier de f , dans le cas |a| > 1 : ( −a−(k+1) si k > 0 ck = 0 si k 6 −1. II.2.32 La fonction θ 7→ f (reiθ ) est 2π -périodique et de classe C ∞ sur R. Pour tout θ ∈ [0, 2π], +∞ P on a f (reiθ ) = an rn eniθ . Il y a de plus convergence normale (en θ ) sur R, parce que le n=0 rayon de convergence de la série entière donnée est +∞. Comme dans l’exercice précédent, on en déduit (par intégration) que, pour tout p ∈ N, le coefficient de Fourier d’indice p de la fonction θ 7→ f (reiθ ) vaut ap rp . D’où : Z 2π 1 p ap r = e−ipθ f (reiθ ) d θ. 2π 0 c Dunod 2014 II.2 : Suites et séries de fonctions 209 Pour tout θ , l’hypothèse faite sur f montre que f (reiθ ) 6 Kra , d’où la majoration |ap rp | 6 Kra , soit |ap | 6 Kra−p . Fixons alors un entier p > a. La majoration précédente est vraie pour tout réel r > 0 , et l’on en déduit que ap = 0 , en faisant tendre r vers +∞. La série entière donnée n’a donc qu’un nombre fini de coefficients non nuls, autrement dit c’est un polynôme. √ √ II.2.33 Considérons un entier n > 1 , fixé pour l’instant. On sait que 3 est irrationnel, donc n 3 est irrationnel, en particulier n’est pas un demi-entier. Il existe donc un unique entier a tel que √ √ √ n 3 − a < 1/2 . En fait a est égal à E(n 3) ou 1 + E(n 3), en tous cas a > 1 . √ √ Pour la minoration visée, partons de l’égalité (a + n 3)(a − n 3) = a2 − 3n2 . √ Puisque a 6= ±n 3 , a2 − 3n2 est un entier non nul, il est au moins égal à 1 . D’où √ √ √ √ (a + n 3) a − n 3 > 1 , et par conséquent a − n 3 > (a + n 3)−1 . Puisque √ √ √ √ √ √ a 6 n 3 + 1/2 < n 3 + 1 , on a a + n 3 < 2n 3 + 1 , d’où a − n 3 > (2n 3 + 1)−1 . C’est l’inégalité annoncée. √ √ Posons t := a − n 3 , de sorte que |t| < 1/2 . Alors πn 3 = πa − πt, d’où l’on tire √ √ sin(πn 3) = (−1)a+1 sin(πt) et donc sin(πn 3) = |sin(πt)| . Cela étant, rappelons que, pour tout réel x ∈ [0, π/2], on dispose de l’encadrement 2x/π 6 sin x 6 x. Ici √ |πt| ∈ ]0, π/2], donc sin(πn 3) = |sin(πt)| = sin |πt| > 2 |t| . D’où : √ √ √ 2 1 2n 3 + 1 √ √ 6 , donc · sin(πn 3) > 2 a − n 3 > sin(πn 3) 2 2n 3 + 1 √ Pour tout entier n > 1 , posons an = sin(πn 3)−1 . Soit R le rayon de convergence de la P série entière an z n . Évidemment |an | > 1 pour tout n, et par conséquent R 6 1 . En sens n>1 inverse, les inégalités précédentes montrent que R est au moins égal au rayon de convergence P √ de la série entière n 3 + 1/2 z n , rayon de convergence qui est clairement égal à 1 . n>1 Conclusion : R = 1 . II.2.34 Notons ak ( k > 0 ) les coefficients et R le rayon de convergence de la série entière proposée. On a ak = 1/k lorsque k est premier, et ak = 0 lorsque k n’est pas premier. En tout cas, 0 6 ak 6 1/k pour tout k > 1 . On en déduit que R est au moins égal au rayon de P n convergence de la série entière z /n, autrement dit R > 1 . n>1 Considérons un réel r > 1 . Lorsque l’entier n tend vers +∞, rn /n tend vers +∞. En particulier, il existe un entier N > 1 tel que rn /n > 1 pour tout n > N . Puisque l’ensemble des nombres premiers est infini, il existe un entier h tel que pj > N pour tout j > h. Pour P pk tout j > h, on a rpj /pj > 1 , ce qui montre que le terme général de la série r /pk ne k>0 tend pas vers 0 . D’où r > R . Cette inégalité étant vraie pour tout réel r > 1 , on a R 6 1 , et par suite R = 1 . II.2.35 Notons fn (z) le terme général de la série. Pour chaque n > 1 , il faut déjà que fn (z) soit défini, c’est-à-dire que z soit distinct de −n. Posons D := C \ {−1, −2, . . .} . Nous allons c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 210 montrer que D est le domaine de convergence simple de la série de fonctions donnée. Soit P donc z ∈ D . Pour affirmer que la série (−1)n /(n + z), il ne faut pas appliquer le critère n>1 spécial des séries alternées, qui ne s’applique qu’à des séries à termes réels (avec les hypothèses adéquates). L’idée est de séparer parties réelles et parties imaginaires. Écrivons z := a + ib , avec a et b réels. Pour tout n > 1 , on a : (−1)n (−1)n (−1)n (n + a − ib) = = · n+z n + a + ib (n + a)2 + b2 Considérons donc les deux séries : X (−1)n (n + a) X (−1)n+1 b et · 2 2 (n + a) + b (n + a)2 + b2 n>1 n>1 La première converge : c’est cette fois une application immédiate du critère spécial des séries alternées. La deuxième série converge, et même absolument : si b 6= 0 , son terme général est P équivalent, en valeur absolue, à |b| /n2 . La série fn (z) converge donc (mais pas absolun>1 ment), et ceci pour tout z ∈ D . On ne peut espérer pouvoir développer f en série entière que dans le disque unité D(0, 1), puisque 1 ∈ / D . Fixons donc un point z de ce disque. Pour tout n > 1 , on a |z/n| < 1 , d’où (toujours les séries géométriques) : +∞ +∞ X (−1)n (−1)n X (−1)k z k (−1)n+k z k (−1)n = = = · n+z n(1 + z/n) n nk nk+1 k=0 k=0 P À condition de justifier l’interversion des signes que nous allons effectuer, il vient : ! ! +∞ +∞ +∞ +∞ n+k k X X (−1) X X z (−1)n k k f (z) = (−1) z = nk+1 nk+1 n=1 n=1 k=0 = +∞ X ak z k , k=0 en posant pour tout k > 0 : ak := (−1)k k=0 On peut en fait préciser les valeurs des ak : +∞ X (−1)n · nk+1 n=1 a0 = − ln 2 et ak = (−1)k+1 (1 − 2−k )ζ(k + 1) pour tout k > 1. (∗) La première égalité résulte du corollaire 44 de la page 516, les suivantes viennent de l’exercice 6 de la page 498. Justifions l’interversion. Pour cela, appliquons le théorème de Fubini (théorème 15 de la page 485), dont nous reprenons les notations. On ne peut pas appliquer brutalement ce théoP rème car, si on le pouvait, la série fn (z) convergerait absolument, ce qui est faux. Il faut n>1 en fait « écarter » la valeur k := 0 . Pour tout couple d’entiers (n, k) tels que n > 1 et k > 1 , P posons an,k := (−1)k+n z k /nk+1 . Pour tout n > 1 , la série |an,k | converge, car c’est une k>1 série géométrique de raison |z| /n < 1 . La somme de cette série est sn := |z| / n(n − |z|) . P Ainsi la série sn converge, ce qui nous permet d’appliquer le théorème de Fubini. On a n>1 donc (avec convergence de toutes les séries qui interviennent) : ! ! +∞ X +∞ +∞ X +∞ +∞ X X X (−1)n+k z k (−1)n+k z k = = ak z k , k+1 k+1 n n n=1 n=1 k=1 c Dunod 2014 k=1 k=1 II.2 : Suites et séries de fonctions 211 c’est-à-dire (penser à la valeur k := 0 ) : +∞ +∞ X X (−1)n (−1)n − = ak z k . n + z n n=1 k=1 Dans cette égalité, le membre de gauche vaut f (z) + ln 2 . Puisque a0 = − ln 2 , on obtient : f (z) = +∞ X ak z k k=0 = − ln 2 + +∞ X (−1)k+1 (1 − 2−k )ζ(k + 1)z k k=1 Soit R le convergence de la série entière P pour tout z ∈ D(0, 1). ak z k . D’abord R > 1 , en vertu de ce qui précède. k>0 En fait, R = 1 . Pour le voir, commençons par démontrer que ζ(s) tend vers 1 lorsque le réel s tend vers +∞. C’est une conséquence immédiate du théorème de la double limite. En effet, P fixons un réel b > 1 . La série de fonctions 1/ns converge normalement sur [b, +∞[. n>1 D’autre part, si l’entier N > 1 est fixé, la somme partielle N P 1/ns tend vers 1 lorsque s n=1 tend vers +∞. Notre assertion en résulte. Lorsque k tend vers +∞, ζ(k + 1) tend ainsi vers 1 , donc |ak | tend vers 1 . Il en résulte que P k R est égal au rayon de convergence de la série entière z , d’où R = 1 . k>0 II.2.36 Soit donc f : I := ]−1, 1[ → C la fonction x 7→ sin(a arcsin x). Rappelons que la fonction sinus, elle, est définie et de classe C ∞ sur C. Comme la fonction arcsin est de classe C ∞ sur I , la fonction f est (comme composée) de classe C ∞ sur I . Par contre, il n’est pas évident a priori que f soit DSE sur I . Tout ce que nous savons au départ, c’est que f est DSE 0 (cf. la première proposition de la section 3.4 de la page 521). Pour montrer que f est DSE sur I , nous allons procéder en trois étapes : 1. Montrer que f vérifie une certaine équation différentielle linéaire homogène d’ordre 2 . 2. Montrer que ladite équation différentielle possède, à une constante multiplicative près, une unique solution DSE sur I . 3. Grâce à la condition initiale en 0 , déterminer pour f un développement en série entière valable sur I . 1. Pour tout x ∈ I , on a : f ′ (x) = a cos(a arcsin x) √ , 1 − x2 Dérivons la dernière égalité : Multiplions par p soit f ′ (x) 1 − x2 = a cos(a arcsin x). p xf ′ (x) −a2 sin(a arcsin x) √ f ′′ (x) 1 − x2 − √ = · 2 1−x 1 − x2 √ 1 − x2 : (1 − x2 )f ′′ (x) − xf ′ (x) + a2 sin(a arcsin x) = 0. Ainsi, f est solution, sur I , de l’équation différentielle linéaire suivante : (E) : (1 − x2 )y ′′ − xy ′ + a2 y = 0. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 212 2. À ce stade, la démarche est la suivante. Soit G := P an z n une série entière. Voyons à n>0 quelles conditions G vérifie l’égalité suivante (entre séries entières) : (1 − z 2 )G′′ − zG′ + a2 G = 0. (∗) Notons H le premier membre. Alors la série entière H est nulle si, et seulement si, chacun de ses coefficients est nul, notons cn ces coefficients. Calculons : X X X H = (1 − z 2 ) n(n − 1)an z n−2 − z nan z n−1 + a2 an z n n>2 = = X n>1 n (n + 2)(n + 1)an+2 z − n>0 X X (n + 2)(n + 1)an+2 z n − X n>0 n>0 n n>0 n>0 = X n(n − 1)an z − X nan z n + a2 n>0 X an z n n>0 (n2 − a2 )an z n n>0 (n + 2)(n + 1)an+2 − (n2 − a2 )an z n . | {z } cn Ainsi H = 0 si, et seulement si, les cn vérifient la relation de récurrence suivante : (n + 2)(n + 1)an+2 = (n2 − a2 )an pour tout n ∈ N. (∗∗) Puisque f (0) = 0 et f ′ (0) = a, il est logique d’imposer les conditions initiales a0 := 0 et a1 := a. Avec ces conditions initiales, il y a une unique série entière vérifiant l’égalité (∗), notons-la encore G. Le calcul des an est simple : en premier lieu, an = 0 lorsque n est pair. Supposons n impair : n := 2p + 1 . Alors a1 = a, a3 = a(1 − a2 )/(3 · 2), a5 = a(1 − a2 )(32 − a2 )/(5 · 4 · 3 · 2). Par une récurrence immédiate, on trouve : a2p+1 p−1 Y a = (2k + 1)2 − a2 . (2p + 1)! k=0 3. Déterminons le rayon de convergence R de G. Il faut ici distinguer deux cas. Supposons d’abord que a soit un entier impair, de signe quelconque. La formule précédente montre alors que les an sont tous nuls à partir d’un certain rang, autrement dit G est un polynôme et R = +∞. Dans ce cas, f est en fait un polynôme en x. Si a := 3 , par exemple, en posant t := arcsin x, on a sin t = x puis f (x) = sin(3t) = 3 sin t − 4 sin3 t = 3x − 4x3 . Par √ contre, si par exemple a := 2 , f (x) = 2 sin t cos t = 2x 1 − x2 , avec un signe + puisque t ∈ ]−π/2, π/2[. Supposons désormais que a ne soit pas un entier impair. Les a2p+1 , p ∈ N, sont donc tous non nuls. Si z ∈ C∗ est donné, voyons si la série de terme général up := a2p+1 |z| Il suffit d’appliquer la règle de d’Alembert : 2 |z| (2p + 1)2 − a2 up+1 = · up (2p + 3)(2p + 2) 2 2p+1 converge. Ainsi up+1 /up tend vers |z| lorsque p tend vers +∞. Il en résulte que ladite série converge si |z| < 1 et diverge si |z| > 1 . En conclusion, R = 1 . 4. Soit g : I := ]−1, 1[ → C la somme de la série entière G. C’est une fonction de classe C ∞ . D’après le théorème 45 de la page 517, g est solution de l’équation différentielle (E), puisque G vérifie l’égalité (∗). En outre, g(0) = a0 = 0 et g ′ (0) = a1 = a. Les fonctions f et c Dunod 2014 II.2 : Suites et séries de fonctions 213 g vérifient toutes deux l’équation différentielle (E), avec mêmes conditions initiales en 0 . Le coefficient de y ′′ dans (E), à savoir 1 − x2 , ne s’annulant pas sur I , il résulte du théorème de Cauchy-Lipschitz (cf. le module II.7) que f = g . D’où le développement de f en série entière sur I : +∞ X (12 − a2 )(32 − a2 ) · · · (2p − 1)2 − a2 2p+1 sin(a arcsin x) = a x pour tout x ∈ I. (2p + 1)! p=0 5. Opérons de même à partir de la fonction f : x 7→ (arcsin x)2 , en abrégeant les calculs, semblables aux précédents. On a ici : 2 arcsin x f ′ (x) = √ , puis 1 − x2 p xf ′ (x) 2 f ′′ (x) 1 − x2 − √ −√ = 0. 1 − x2 1 − x2 L’équation (E) doit donc être remplacée par la suivante : (E) : (1 − x2 )y ′′ − xy ′ = 2. Cette équation est encore linéaire, mais n’est plus homogène. Avec les notations précédentes, on a ici pour tout n : cn = (n + 2)(n + 1)an+2 − n2 an . On doit avoir c0 = 2 , autrement dit a2 = 1 , et cn = 0 pour tout n > 1 . Par ailleurs, les conditions initiales sont a0 = a1 = 0 . On en déduit facilement que an = 0 lorsque n est impair, et, lorsque n := 2p est pair, an est donné par la formule : 2 22p−1 (p − 1)! 22 42 (2p − 2)2 a2p = × × ··· × = · 4·3 6·5 2p(2p − 1) (2p)! Le rayon de convergence est encore 1 et, par un raisonnement analogue au précédent, on aboutit au développement en série entière suivant : 2 +∞ 2p−1 X 2 (p − 1)! 2 (arcsin x) = x2p pour tout x ∈ I. (2p)! p=1 Dans le second membre, prenons x := 1 . La série obtenue converge car, en vertu de la for√ √ mule de Stirling (cf. le module II.8), son terme général est équivalent à π/(2p p). D’après le théorème d’Abel (théorème 34 de la page 506), on obtient la formule suivante, puisque arcsin 1 = π/2 : 2 +∞ 2p+1 +∞ 2p+1 X X 2 (p − 1)! 2 2 · π = = (2p)! p2 2p p p=1 p=1 II.2.37 Soit n ∈ N. Pour tout t ∈ [0, 1], on a t 6 (1 + t2 )/2 6 1 , d’où l’encadrement : n Z 1 Z 1 Z 1 1 1 + t2 n = t d t 6 an = dt 6 d t = 1. n+1 2 0 0 0 P n P n Chacune des séries entières z et z /(n + 1) ayant pour rayon de convergence 1 , le n>0 n>0 P rayon de convergence de la série entière F := an z n vaut 1 . Soit f : I := ]−1, 1[ → R n>0 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 214 la somme de la série entière F . Considérons un point x de I fixé. À condition de justifier Z P l’interversion des signes et ci-après, il vient : f (x) = +∞ Z X n=0 = Z 1 0 1 0 1 + t2 2 n dt x n +∞ X x(1 + t2 ) 2 n=0 n ! = +∞ Z X 0 n=0 dt = Z 1 0 1 x(1 + t2 ) 2 n dt = 1 − x(1 + t2 )/2 dt Z 0 1 2dt · (2 − x) − xt2 Justifions l’interversion effectuée. Le point x ∈ I étant toujours fixé, considérons la suite n de fonctions fn : [0, 1] → R définie par fn (t) = x(1 + t2 )/2 . Cette série de foncn tions converge normalement donc uniformément (en t), puisque |fn (t)| 6 |x| pour tout (n, t) ∈ N × [0, 1]. En vertu du théorème 13 de la page 483 de la page 483, on peut interZ P vertir les signes et : Z +∞ X 1 0 n=0 ! fn (t) d t = C’est la justification annoncée, puisque la série +∞ Z X n=0 P 1 0 fn (t) d t . fn (t) est une série géométrique de raison n>0 x(1 + t2 )/2 . Ainsi : f (x) = Z 0 1 2dt 2 = (2 − x) − xt2 2−x Z 0 1 dt · 1 − x(2 − x)−1 t2 (∗) Distinguons alors trois cas, suivant le signe de x. Il est clair que f (0) = 1 . Supposons ensuite p x < 0 . Posons a := −x/(2 − x) . Le changement de variable u := at donne : Z 1 Z a 2 dt 2 du f (x) = = 2 − x 0 1 + a 2 t2 a(2 − x) 0 1 + u2 p 2 arctan x/(x − 2) 2 arctan(a) p = = pour tout x ∈ ]−1, 0[ . a(2 − x) x(x − 2) p Supposons enfin x > 0 . Posons ici a := x/(2 − x) . Le changement de variable u := at donne : Z 1 Z a 2 dt 2 du f (x) = = 2 − x 0 1 − a 2 t2 a(2 − x) 0 1 − u2 p 2 argth x/(2 − x) 2 argth(a) p = = pour tout x ∈ ]0, 1[ . a(2 − x) x(2 − x) II.2.38 Reprenons les notations de l’exercice 15 de la page 526 et de sa solution. Par hypothèse, le rayon de convergence R de la série entière entière F est strictement positif. Choisissons un réel r ∈ ]0, R[. Par définition du rayon de convergence, la suite (an rn )n>0 est bornée, i.e. la borne supérieure M := sup |an | rn | n ∈ N est finie. Ainsi |an | 6 M r−n pour tout n ∈ N. c Dunod 2014 II.2 : Suites et séries de fonctions 215 Notre objectif est de montrer que la série entière G := P bn z n a un rayon de convergence R′ n>0 strictement positif. Rappelons que la suite (bn ) est définie par son premier terme b0 := 1 et la relation de récurrence : bn := − a1 bn−1 + a2 bn−2 + · · · + an b0 pour tout n > 1. (∗) Pour minorer R′ , il suffit de majorer convenablement les |bn | . Plus précisément, supposons que nous ayons trouvé un réel ω > 0 tel que les inégalités suivantes soient vérifiées : |bn | 6 ω n pour tout n ∈ N. Alors R′ sera au moins égal au rayon de convergence de la série entière (∗∗) P ω n z n , c’est-à-dire n>0 ω −1 . On aura donc bien R′ > ω −1 > 0 . Il reste à choisir ω de façon adéquate. Pour cela, essayons de démontrer les inégalités (∗∗) par récurrence sur n. L’inégalité (∗∗) est vraie pour n = 0 . Supposons que, pour un certain entier n > 1 , on ait |bk | 6 ω k pour k = 0, . . . , n − 1 . L’égalité (∗) donne alors, en imposant la condition ωr > 1 : n−1 n−1 X (ωr)n − 1 M ωn X |bn | = bk an−k 6 ω k (M rk−n ) = M r−n 6 · ωr − 1 ωr − 1 k=0 k=0 n L’inégalité |bn | 6 ω sera donc vérifiée pourvu que ωr > M + 1 , soit ω > (M + 1)/r . On peut choisir par exemple ω := (M + 1)/r . Alors, d’une part les inégalités (∗∗) sont vérifiées pour tout n, et d’autre part R′ > ω −1 , soit R′ > r/(M + 1) > 0 . II.2.39 Soit n ∈ N. Par définition, an est le nombre de triplets (a, b, c) ∈ N3 tels que a + 2b + 5c = n. En appliquant (deux fois) la définition 6 de la page 510 de la page 510, P n P 2n on voit que an est le coefficient d’indice n du produit des trois séries entières z , z n>0 n>0 P 5n et z , ayant chacune pour rayon de convergence 1 . Nous connaissons les sommes de n>0 ces séries entières (ce sont des séries géométriques). Pour tout z ∈ C tel que |z| < 1 , le théorème 36 de la page 510 de la page 510 donne donc : +∞ X n=0 an z n = 1 · (1 − z)(1 − z 2 )(1 − z 5 ) (∗) À partir de là, il ne reste plus qu’à développer la fraction rationnelle F figurant dans le second membre de cette égalité (à l’aide de la proposition 38 de la page 511 de la page 511 et de sa preuve). Les coefficients an s’obtiennent ensuite par identification, grâce au théorème 47 de la page 522 de la page 522. Posons ω := exp(2iπ/5), c’est une racine primitive 5 ème de l’unité. La fraction rationnelle F est de degré −8 , donc sa partie entière est nulle. Cette fraction a un pôle triple en 1 et cinq pôles simples : −1 et ω k pour k = 1, 2, 3, 4 . Il existe donc des nombres complexes uniques a, b, c, d, u1 , u2 , u3 , u4 tels que F s’écrive : 4 X uk 1 a b c d = + + + + · (∗∗) (1 − z)(1 − z 2 )(1 − z 5 ) (1 − z)3 (1 − z)2 1−z 1+z 1 − ωk z k=1 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 216 La formule (20) de la page 510 permet alors l’identification des an . Pour tout n ∈ N, on obtient : n+2 an = a + b(n + 1) + c + (−1)n d + u1 ω n + u2 ω 2n + u3 ω 3n + u4 ω 4n . (∗∗∗) 2 Le calcul de a est simple : en multipliant les deux membres de l’égalité (∗∗) par (1 − z)3 et −1 en remplaçant z par 1 , on voit que a est la valeur en 1 de (1 + z)(1 + z + z 2 + z 3 + z 4 ) : a = 1/10 . De même, en multipliant les deux membres de l’égalité (∗∗) par 1 + z et en −1 remplaçant z par −1 , on voit que d est la valeur en −1 de (1 − z)2 (1 − z 5 ) : d = 1/8 . Procédons de la même manière avec les pôles simples ω k . Soit k ∈ {1, 2, 3, 4} . Multiplions les deux membres de l’égalité (∗∗) par 1 − ω k z , puis faisons tendre z vers ω −k . Il vient : −1 1 − ωk z ωk z5 − 1 uk = lim = lim · (1 − ω −k )(1 − ω −2k ) z→ω−k z − ω −k z→ω −k (1 − z)(1 − z 2 )(1 − z 5 ) La dernière limite est la dérivée de z 5 − 1 en ω −k , c’est-à-dire 5ω −4k = 5ω k . D’où : uk = = 1 ω 3k = 5(1 − ω −k )(1 − ω −2k ) 5(1 − ω k )(1 − ω 2k ) ω 3k (1 − ω 3k )(1 − ω 4k ) · 5(1 − − ω 2k )(1 − ω 3k )(1 − ω 4k ) ω k )(1 Simplifions cette expression de uk . Puisque le polynôme X 5 − 1 est le produit des X − ω h pour h ∈ [[0, 4]], on a : X4 + X3 + X2 + X + 1 = 4 Y X5 − 1 (X − ω h ), = X −1 h=1 donc 4 Q (1 − ω h ) = 5 et h=1 4 P h=1 ω h = −1 . Ainsi : ω 3k (1 − ω 3k )(1 − ω 4k ) ω 3k − ω 6k − ω 7k + ω 10k = 25 25 3k k 2k ω −ω −ω +1 = · 25 En particulier, la somme des uk vaut 1/5 . Pour chaque n ∈ N, calculons la somme 4 P αn := uk ω kn figurant dans le second membre de l’égalité (∗∗∗). Pour tout m ∈ Z, la uk = k=1 somme sm := 4 P ω km vaut 5 si m est multiple de 5 et 0 sinon. D’où : k=0 25αn = 4 X k=1 ω kn (ω 3k − ω k − ω 2k + 1) = = sn+3 − sn+1 − sn+2 + sn . 4 X k=0 ω kn (ω 3k − ω k − ω 2k + 1) On en déduit aisément la valeur de αn , selon la valeur du reste de la division de n par 5 : 1/5 si ce reste est 0 ou 2 αn = 0 si ce reste est 1 −1/5 si ce reste est 3 ou 4. c Dunod 2014 II.2 : Suites et séries de fonctions 217 Calculons enfin les coefficients b et c figurant dans l’égalité (∗∗). Une première relation entre ces coefficients s’obtient en remplaçant z par 0 dans ladite égalité. Il vient : 1 = a+b+c+d+ 4 X k=1 uk , d’où b + c = 1 − 1 1 1 23 − − = · 10 8 5 40 On obtient une deuxième relation en multipliant les deux membres de l’égalité (∗∗) par z ∈ R, puis en faisant tendre z vers +∞. Il vient : 0 = −c + d − 4 X k=1 uk ω −k = −c + d − 4 X ω 2k − 1 − ω k + ω −k k=1 25 1 = −c + d + · 5 On en déduit c = 1/8+1/5 = 13/40 , puis b = 23/40−c = 23/40−13/40 = 1/4 . Reportons dans la formule (∗∗∗) : an = 1 n+2 n + 1 13 (−1)n + + + + αn , 10 2 4 40 8 c’est-à-dire finalement : an = 2n2 + 16n + 27 (−1)n + + αn . 40 8 Dans ce résultat, la valeur de αn est donnée par la formule ci-dessus, en fonction du reste de la division de n par 5 . Précisons encore plus, en fonction du reste r de la division de n par 10 : an (n2 + 8n + 20)/20 (n2 + 8n + 11)/20 (n2 + 8n + 20)/20 (n2 + 8n + 7)/20 (n2 + 8n + 12)/20 = (n2 + 8n + 15)/20 (n2 + 8n + 16)/20 (n2 + 8n + 15)/20 (n2 + 8n + 12)/20 (n2 + 8n + 7)/20 si r = 0 si r = 1 si r = 2 si r = 3 si r = 4 si r = 5 si r = 6 si r = 7 si r = 8 si r = 9. En fait, on peut retrouver ces formules simplement, sans utiliser de séries entières. Traitons par exemple le cas où n est multiple de 10 : n := 10p. Par définition, an est le nombre de triplets (a, b, c) d’entiers positifs tels que a + 2b + 5c = 10p. Pour tout entier c ∈ [[0, 2p]], notons γc le nombre de couples (a, b) d’entiers positifs tels que a + 2b = 10p − 5c. Alors 2p P an = γc . Soit maintenant c ∈ [[0, 2p]]. L’application b 7→ (10p − 5c − 2b, b) est une c=0 bijection de [[0, E (10p − 5c)/2 ]] sur l’ensemble des couples (a, b) d’entiers positifs tels que c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 218 a + 2b = 10p − 5c. Ainsi γc = 1 + E (10p − 5c)/2 . D’où : an = 2p X c=0 = p X h=0 1 + E (10p − 5c)/2 p−1 X 1 + (5p − 5h) + 1 + (5p − 5h − 3) h=0 = (p + 1) + 5 p X j=0 j − 2p + 5 p X j=1 j = 1 − p + 10 p X j j=1 = 1 − p + 5p(p + 1) = 5p2 + 4p + 1 = (n2 + 8n + 20)/20. II.2.40 Notons un le terme général de la série figurant dans l’énoncé. Le terme figurant entre cro chets dans un est positif et majoré par 4/(8n + 1), d’où 0 6 un 6 1/ 16n (2n) . Il en résulte P que la série un converge, notons S sa somme. Pour calculer S , il est naturel d’introduire n>0 des séries entières. Dans ce qui suit, k désigne l’un des entiers 1, 4, 5, 6 . Partons de la série P 8n+k−1 entière z . Son rayon de convergence est 1 , et sa somme est z 7−→ z k−1 /(1 − z 8 ), n>0 elle est définie pour |z| < 1 . Posons I := ]−1, 1[, et notons fk la primitive de la fonction x 7−→ xk−1 /(1 − x8 ) sur I nulle en 0 . Pour tout x ∈ I , f (x) peut être calculé par intégration terme à terme (théorème 42 de la page 516 de la page 516) : fk (x) = +∞ 8n+k X x · 8n + k n=0 √ Posons a = 1/ 2 , de sorte que a8 = 1/16 . Il vient : fk (a) = ak +∞ X 1 · n (8n + k) 16 n=0 On comprend l’intérêt d’avoir introduit les fonctions fk , car on en déduit : 4f1 (a) 2f4 (a) f5 (a) f6 (a) − − − a a4 a5 a6 √ = 4 2 f1 (a) − f5 (a) − 8 f4 (a) + f6 (a) . S= Revenant à la définition des fk comme primitives, on peut écrire : Z a √ 4 2(1 − x4 ) − 8(x3 + x5 ) d x. S = 1 − x8 0 Des égalités 1 − x8 = (1 + x4 )(1 − x4 ) = (1 + x4 )(1 + x2 )(1 − x2 ), on tire : Z a √ Z a dx x3 d x S = 4 2 − 8 · 4 4 2 0 1+x 0 (1 + x )(1 − x ) (∗) Il reste donc à calculer ces deux intégrales de fractions rationnelles. Pour cela, effectuons des décompositions en éléments simples. D’abord, l’égalité x4 + 1 = (x2 + 1)2 − 2x2 donne la c Dunod 2014 II.2 : Suites et séries de fonctions 219 √ √ factorisation x4 + 1 = (x2 + x 2 + 1)(x2 − x 2 + 1). La fraction à décomposer étant paire, la théorie nous dit qu’il existe deux réels α, β (uniques) tels que : √ 4 2 αx + β −αx + β √ √ = + · 4 2 2 1+x x +x 2+1 x −x 2+1 √ On trouve β := 2 2 (prendre x := 0 ), puis α := 2 . Déterminons une primitive de la première fraction : √ √ √ Z Z Z 2x + 2 2 2x + 2 2dx √ √ √ dx = dx + 2 2 2 x +x 2+1 x +x 2+1 x +x 2+1 √ Z √ 2dx 2 √ = ln x + x 2 + 1 + · 2 x +x 2+1 √ √ Ensuite, 2 x2 + x 2 + 1 = (x 2 + 1)2 + 1 , d’où : √ √ Z Z √ 2dx 2 2dx √ √ = = 2 arctan x 2 + 1 + constante. 2 2 x +x 2+1 (x 2 + 1) + 1 √ Puisque a = 1/ 2 , il vient : √ Z a h √ √ ix=a 2x + 2 2 √ d x = ln x2 + 2x + 1 + 2 arctan x 2 + 1 2 x=0 0 x +x 2+1 = ln(5/2) + 2 arctan(2) − 2 arctan(1). En changeant x en −x, on a de même : √ √ Z a Z 0 −2x + 2 2 2x + 2 2 √ √ dx = dx 2 2 0 x −x 2+1 −a x + x 2 + 1 h √ √ ix=0 = ln x2 + x 2 + 1 + 2 arctan x 2 + 1 x=−a = 2 arctan(1) − ln(1/2). On en déduit la première intégrale figurant dans la formule (∗) : √ Z a dx 4 2 = ln(5) + 2 arctan(2). 4 0 1+x Pour la deuxième intégrale, le changement de variable t := x2 donne : Z a Z 1/2 x3 d x tdt 8 = 4 · 4 )(1 − x2 ) 2 )(1 − t) (1 + x (1 + t 0 0 La décomposition en éléments simples est ici immédiate : 4t (1 + 4 Z 0 1/2 t2 )(1 − t) = 2t − 2 2 + , 2 1+t 1−t d’où : h it=1/2 tdt 2 = ln(1 + t ) − 2 arctan(t) − 2 ln(1 − t) (1 + t2 )(1 − t) t=0 = ln(5/4) − 2 arctan(1/2) − 2 ln(1/2) = ln(5) − 2 arctan(1/2). En revenant à la formule (*), on obtient : S = 2 arctan(2) + arctan(1/2 . Il est classique que, pour tout x ∈ R∗ , arctan(x) + arctan(1/x) vaut π/2 si x > 0 et −π/2 si x > 0 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 220 Rappelons pourquoi. Par imparité, on peut se limiter au cas x > 0 . Soit θ := arctan(x). Cet angle est caractérisé par les propriétés θ ∈ ]0, π/2[ et tan θ = x. L’angle π/2 − θ appartient aussi à ]0, π/2[, et sa tangente vaut tan(π/2 − θ) = cotan(θ) = 1/x ; ces deux propriétés caractérisent arctan(1/x), donc π/2 − θ = arctan(1/x), d’où la formule annoncée : π/2 − arctan(x) = arctan(1/x). Conclusion : la somme de la série figurant dans l’énoncé est effectivement : +∞ X 1 4 2 1 1 − − − = S = 2 arctan(2) + arctan(1/2 = π. n 16 8n + 1 8n + 4 8n + 5 8n + 6 n=0 II.2.41 1. Notons Jn l’intégrale à calculer. C’est une intégrale de Wallis d’indice impair, son calcul est moins rapide que pour les intégrales de Wallis d’indice pair (cf. l’exercice II.2.0 de la page 535). On effectue une intégration par parties. Soit n ∈ N. Z π/2 Z π/2 2n+1 Jn = cos xdx = cos2n+1 x(cos2 x + sin2 x) d x 0 = Jn+1 + Z 0 π/2 cos2n+1 x sin2 x d x = Jn+1 + 0 Z π/2 0 2n+1 (cos x) d x. {zx sin x})(sin |{z} | u′ v On pose donc pour tout x : u(x) := −1/(2n + 2) cos2n+2 x et v(x) := sin x. Le produit uv est nul en 0 et π/2 , d’où : Z π/2 Z π/2 Jn = Jn+1 − u(x)v ′ (x) d x = Jn+1 + 1/(2n + 2) cos2n+3 x d x 0 = Jn+1 + 1/(2n + 2) Jn+1 , d’où Jn+1 = 0 2n + 2 2n + 3 Jn . Nous avons ainsi obtenu une relation de récurrence sur les Jn . Démontrons alors la formule de Zπ/2 l’énoncé par récurrence sur n. D’abord J0 = cos x d x = sin(π/2) = 1 , et la formule est 0 vraie au rang 0 . Supposons la formule vraie pour un certain n. Alors : 2n + 2 2n + 2 22n 2n + 2 22n (n!)2 Jn+1 = Jn = · = 2n + 3 2n + 3 (2n + 1) 2n 2n + 3 (2n + 1)! n 2 22n+2 (n + 1)! 22n (2n + 2)2 (n!)2 22n+2 · = = = (2n + 3)! (2n + 3)! (2n + 3) 2n+2 n+1 La formule est donc vraie au rang n + 1 . 2. Supposons d’abord que la série donnée converge, et notons S sa somme. L’idée est de rem 2n placer le coefficient par sa valeur en fonction de Jn , tirée de la question 1 : n ! Z π/2 +∞ +∞ X X (2n + 1)J n(2n + 1) n S = (n2n ) = cos2n+1 x d x . 2n n 2 2 0 n=1 n=1 c Dunod 2014 II.2 : Suites et séries de fonctions 221 Supposons qu’on puisse intervertir les signes S = Z π/2 0 P et Z (cela sera justifié plus loin). Alors : X Z π/2 +∞ n(2n + 1) cos2n+1 x dx = f (x) d x. 2n 0 n=1 | {z } (∗) = f (x) Cela suggère d’introduire la série entière P n(2n + 1)z 2n+1 . On remplacera ensuite z par n>1 √ P 2n+1 cos x/ 2 . Partons de la série entière z . Son rayon de convergence est 1 et sa somme, n>0 pour |z| < 1 , est z/(1 − z 2 ) (c’est une série géométrique). En dérivant deux fois, ce qui ne change pas le rayon de convergence, le calcul donne : +∞ X d2 z 2z(3z 2 + z 4 ) 2n(2n + 1)z 2n+1 = z 2 2 = · 2 dz 1−z (1 − z 2 )3 n=1 Pour tout r ∈ [0, 1[, la série entière obtenue converge normalement, donc uniformément, sur le √ disque D(0, r). Remplaçons maintenant z par cos x/ 2 , où x décrit R. On obtient l’égalité suivante, avec convergence normale (sur R) de la série de fonctions qui apparaît : 2n+1 +∞ +∞ X 1 X n(2n + 1) cos2n+1 x cos x √ √ f (x) = = 2n(2n + 1) 2n 2 n=1 2 n=1 = cos x 2 cos x(6 cos2 x + cos4 x) 3(cos2 x)/2 + (cos4 x)/4 = · (1 − cos2 x/2)3 (2 − cos2 x)3 Puisque la série de fonctions définissant f converge normalement, donc uniformément, sur Z P R, on peut calculer l’intégrale de f sur [0, π/2] par interversion des signes et . Il en résulte d’une part que la série donnée dans l’énoncé converge (nous laissons le lecteur vérifier directement ce point, par exemple à l’aide de la formule de Stirling, cf. le module II.8), et d’autre part que la somme S de cette série est donnée par la formule (∗). Le calcul de S se ramène ainsi au calcul d’une intégrale : Z π/2 2 cos x(6 cos2 x + cos4 x) S = d x. (2 − cos2 x)3 0 Le changement de variable t := sin x s’impose : Z 1 Z 1 4 12(1 − t2 ) + 2(1 − t2 )2 2t − 16t2 + 14 S = d t = d t. (1 + t2 )3 (1 + t2 )3 0 0 Effectuons le changement de variable t := tan u , de sorte que d t/(1 + t2 ) = d u et (1 + t2 )−1 = cos2 u . Il vient : Z π/4 S= cos4 u 2 tan4 u − 16 tan2 u + 14 d u 0 = Z 0 π/4 (2 sin4 u − 16 sin2 u cos2 u + 14 cos4 u) d u. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 222 La fonction u 7→ ϕ(u) à intégrer s’écrit : ϕ(u) = 8(cos2 u − sin2 u)2 + 6(cos4 u − sin4 u) = 8(cos2 u − sin2 u)2 + 6(cos2 u − sin2 u) On en déduit S : = 8 cos2 (2u) + 6 cos(2u) = 4 1 + cos(4u) + 6 cos(2u). S = h sin(4u) + 3 sin(2u) + 4u iu=π/4 u=0 = 3 + π. II.2.42 Il est évident que A2 = 02 = B 2 (calcul direct, ou via les endomorphismes cano 1 0 A niquement associés). Il en résulte que e = I2 + A = . De façon analogue, 1 1 1 1 1 0 1 1 1 1 eB = I2 + B = , puis eA eB = = . 0 1 1 1 0 1 1 2 0 1 La matrice C := A + B = est la matrice, dans la base canonique, de l’endo1 0 morphisme (x, y) 7→ (y, x) de R2 , qui est la symétrie orthogonale par rapport à la première bissectrice de R2 . Il en résulte que C 2 = I2 . On en déduit que C 2p = I2 et C 2p+1 = C pour tout p ∈ N. Calculons alors eC : +∞ +∞ +∞ X X X 1 1 1 n C = I2 + C n! (2p)! (2p + 1)! n=0 p=0 p=0 cosh(1) sinh(1) 1 = cosh(1)I2 + sinh(1)C = 6= sinh(1) cosh(1) 1 eA+B = 1 2 = eA eB . II.2.43 Posons T := Tr(A) et D := det(A). Supposons d’abord que la trace T soit nulle. Le polynôme caractéristique de A est alors X 2 + D , donc A2 = −DI2 , en vertu du théorème de Cayley-Hamilton. On en déduit que, pour tout p ∈ N, A2p = (−D)p I2 et A2p+1 = (−D)p A. D’où : +∞ +∞ +∞ X X X 1 n (−D)p (−D)p eA = A = I2 + A. n! (2p)! (2p + 1)! n=0 p=0 p=0 Distinguons trois cas, suivant le signe de D : √ √ sin D e = cos D I2 + √ A si D > 0, D √ √ sinh −D A √ e = cosh −D I2 + A si D < 0, −D A eA = I2 + A si D = 0. Dans le cas général, soit ∆ le discriminant du polynôme caractéristique χA de A. Ainsi χA = X 2 − (a + d)X + (ad − bc), d’où ∆ = (a + d)2 − 4(ad − bc) = T 2 − 4 det A. Posons ensuite B := A − (T /2)I2 , de sorte que Tr(B) = 0 et A = B + (T /2)I2 . Puisque c Dunod 2014 II.2 : Suites et séries de fonctions 223 B et (T /2)I2 commutent, nous savons que eA = e(T /2)I2 eB = eT /2 eB . Mais Tr(B) = 0 , donc le cas particulier traité ci-dessus donne eB , en fonction de D := det(B). En fait, puisque T = a + d, on a : 2 a − T /2 b = T − 2(a + d)T + 4(ad − bc) = −∆ · D := c d − T /2 4 4 D’où les formules générales suivantes : " √ √ # ! √ T sinh ∆/2 2 sinh ∆/2 A T /2 √ √ e = e cosh ∆/2 − I2 + A si ∆ > 0, ∆ ∆ " # ! √ √ √ T sin −∆/2 2 sin −∆/2 A T /2 √ √ e = e cos −∆/2 − I2 + A si ∆ < 0, −∆ −∆ eA = eT /2 (1 − T /2)I2 + A si ∆ = 0. Bien entendu, puisque ∆ est le discriminant du polynôme caractéristique de A, la matrice A possède deux valeurs propres réelles distinctes lorsque ∆ > 0 , une valeur propre double réelle lorsque ∆ = 0 et deux valeurs propres complexes non réelles conjuguées lorsque ∆ < 0 . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 224 Module II.3 : Intégration II.3.1 Il suffit en fait de supposer que f est continue, avec f (x) 6 1 pour tout x ∈ [a, b] et Z b f = b − a. a On a Z b f 6 a Z b a 1 = b − a − (b − a) = 0 , donc Z b a (1 − f ) = 0 . Puisque 1 − f > 0 et que la fonction 1 − f est continue, ceci implique 1 − f = 0 , donc f = 1 . II.3.3 Soit f : [a, b] → R une fonction bornée. Montrons que l’on a la relation de Chasles pour l’intégrale inférieure : Z b Z c Z b f. f+ f= ∀ c, tel que : a < c < b, ∗ c ∗ a ∗ a Z b Z b f= sup ψ, On a ψ6f,ψ∈E([a,b]) a ∗ a A tout couple (ψ1 , ψ2 ) ∈ E([a, c]) × E([c, b]) on associe une fonction ψ ∈ E([a, b]) définie par : ( ψ1 (x), si x ∈ [a, c[ ψ : x 7→ . ψ2 (x), si x ∈ [c, b] Z b Z c Z b On a ψ= ψ1 + ψ2 , d’où : a a Z ∗ c b f> sup ψ1 6f,ψ1 ∈E([a,c]) a Z c ψ1 + sup ψ2 6f,ψ2 ∈E([c,b]) a Z b ψ2 = c Z ∗ a c f+ Z ∗ b f. c Montrons l’inégalité opposée. À ψ ∈ E([a, b]) on associe ses restrictions ψ1 := ψ|[a,c] et ψ2 := ψ|[c,b] , ce sont des fonctions en escalier et l’on a : Z b Z Z c c ∗ a Z b ψ= Z a c ψ1 + Z c b ψ2 6 Z ∗ a c f+ Z ∗ b f, c f. f+ ∗ c ∗ a ∗ a On traiterait le cas des intégrales supérieures de façon similaire. donc f6 II.3.5 Le sous-ensemble U ⊂ [0, 1] contient ]0, 1[ ∩ Q , il est donc dense dans [0, 1]. Ainsi toute fonction en escalier ϕ sur [0, 1] majorant 1U est minorée par 1 sauf éventuellement sur un Z 1 Z∗ 1 ensemble fini de points et l’on a 1 6 ϕ, donc 1 6 1U . On a par ailleurs 1U 6 1 , donc 0 0 Z∗ 1 1U = 1 . 0 c Dunod 2014 II.3 : Intégration 225 Z 1 1U est la borne supérieure des longueurs ∗ 0 des ouverts élémentaires contenus dans U (un ensemble élémentaire contient un ouvert éléZ 1 X 1 1 1U 6 long U 6 mentaire de même longueur). On en déduit = . n+1 2 2 ∗ 0 n∈N∗ Z∗ 1 Z 1 1U , la fonction 1U n’est pas R -intégrable sur [0, 1]. Puisque 1U 6= 0 ∗ 0 D’après la proposition 25, l’intégrale inférieure II.3.6 1. Pour tout n ∈ N, Fn est compact. La famille (Fn )n∈N est décroissante, donc K est un compact non vide. On a, pour tous n ∈ N et k ∈ [[1, 2n ]] , long(In,k ) < 1/2n . Si a ∈ K , la borne inférieure des longueurs des In,k contenant a est donc nulle. Si J est un intervalle contenu dans K et contenant a, il est contenu dans tous les In,k contenant a, il est donc de longueur nulle, c’est-à-dire J = {a} . Donc K est d’intérieur vide. S 2. On a U = (Fn \ Fn+1 ). Cette réunion est disjointe et chaque Fn \ Fn+1 est une n∈N réunion finie d’intervalles ouverts. Pour tout n ∈ N on a long(Fn \ Fn+1 ) = P 1 1 1 en déduit long U = 2n+2 = 2 , puis long K = 2 . 1 2n+2 . On n∈N Le compact K n’est pas négligeable (sinon sa longueur serait nulle). Par ailleurs, ce compact K étant d’intérieur vide, il est égal à sa frontière. L’ensemble des points de discontinuité de 1K n’est donc pas négligeable et 1K n’est pas R -intégrable. 3. Si K était dénombrable, il serait négligeable. Ce n’est pas le cas. 4. Soit V ⊂ [0, 1] un ouvert de longueur strictement plus grande que 1/2 . S’il ne rencontrait pas K , il serait contenu dans U et l’on aurait 12 = long U > long V > 12 , d’où une contradiction. II.3.7 Si les An ne sont pas fermés on les « corrige un peu ». Soit ε > 0 , en « approchant par l’intérieur » chaque sous-intervalle maximal de longueur non nulle contenu dans An par un segment, on obtient un sous-ensemble élémentaire compact Kn ⊂ An tel que long Kn > long An − 2−n ε . Deux cas sont alors possibles : a) Ou bien la suite (Kn )n∈N ∗ est décroissante et l’on est ramené au cas traité dans le cours : il existe N ∈ N tel que, pour tout n > N , Kn = ∅ et, par suite, long Kn = 0 . On en déduit que, pour tout n > N , long An 6 2−n ε 6 ε . Par suite lim long An = 0 . n→+∞ b) Ou bien la suite (Kn )n∈N n’est pas décroissante et on la « corrige » pour qu’elle le devienne. On procède de la façon suivante. On note Ln := K1 ∩ . . . ∩ Kn ⊂ An . Les Ln sont des sous-ensembles élémentaires compacts et la suite (Ln )n∈N ∗ est décroissante. Admettons provisoirement le résultat suivant : long Ln > long An − ε/2 − · · · − ε/2n . (38) On applique alors le résultat de a) à la suite (Ln )n∈N . Il existe N ∈ N tel que, pour tout n > N , Ln = ∅ et, par suite, long Ln = 0 . Donc, d’après (38), pour tout n > N , long An 6 ε/2 + · · · + ε/2n < ε . Par suite lim long An = 0 . n→+∞ Il reste à montrer (38). Nous allons utiliser une récurrence sur n. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 226 On a L1 = K1 , donc long L1 > long An − ε/2 . Supposons (38) vraie pour n > 1 . On a Ln+1 = Ln ∩ Kn+1 , donc Ln ∪ Kn+1 = (Ln \ Ln+1 ) ∪ (Kn+1 \ Ln+1 ) ∪ Ln+1 (la réunion étant disjointe) et : long Ln+1 + long(Ln ∪ Kn+1 ) = long Ln + long Kn+1 > long An − ε/2 − . . . − ε/2n + long An+1 − ε/2n+1 . On a Kn+1 ⊂ An+1 ⊂ An et Ln long An − long(Ln ∪ Kn+1 ) > 0 et : ⊂ An , donc Ln ∪ Kn+1 ⊂ An , d’où long Ln+1 > long An − long(Ln ∪ Kn+1 ) + long An+1 − ε/2 − . . . − ε/2n − ε/2n+1 > long An+1 − ε/2 − . . . − ε/2n − ε/2n+1 . II.3.8 Supposons x > 0 . Z i) Posons I(x) := Z xb θ(xt)dt, on a xI(x) = θ(u)du . Puisque θ admet T pour péa xa Z α+T Z T riode, on sait que pour tout réel α, θ(u)du = θ(u)du . Soit nx := E(x b−a T ), α 0 Z T Z xb on a xI(x) = nx θ(u)du + θ(u)du . La fonction θ est intégrable sur [0, T ] b 0 xa+nx T et périodique, elle est donc bornée sur R, soit K := sup|θ(u)|. On a : u∈R Z xb xa+nx T nx x→+∞ x D’autre part, lim ii) θ(u)du 6 T K et = b−a T , 1 lim x→+∞ x Z xb θ(u)du = 0. xa+nx T d’où le résultat. On vérifie aisément le résultat lorsque f est en escalier sur [a, b], il suffit d’appliquer le résultat de i) à chacun des intervalles où f est constante. Supposons f intégrable sur [a, b] ; pour tout ε > 0 il existe deux fonctions en escalier ϕε : [a, b] 7→ C et ψε : [a, b] 7→ R+ telles que : Z ∀t ∈ [a, b], |f (t) − ϕε (t)| 6 ψε (t), et Posons 1 T Z T θ(t)dt := M et ∆(x) := 0 Z a ∆(x) = Z a b b ψε (t) 6 ε. a b (θ(xt) − M )f (t)dt, on a : (θ(xt) − M ) f (t) − ϕε (t) dt + Z b a (θ(xt)dt − M )ϕε (t)dt. Z b ∀x > 0, (θ(xt) − M ) f (t) − ϕε (t) dt 6 (K + M )ε. a On sait : lim x→+∞ c Dunod 2014 Z a b θ(xt)ϕε (t)dt = M Z b ϕε (t)dt. a II.3 : Intégration 227 Z b Il existe donc A > 0 tel que ∀x > A, (θ(xt)dt − M )ϕε (t)dt 6 ε, d’où le résultat. a iii) On a : 1+2 n X cos kt = k=1 +n X eikt = k=−n sin(n + 12 )t e−int − ei(n+1)t = · 1 − eit sin( 2t ) On peut appliquer les résultats de (ii) si f : t ∈ [0, π] → Par suite 4π t(t−2π) sin( 2t ) et θ : u ∈ R → sin u. Z π +∞ X 1 2 = − t(t − 2π)dt = π 3 , 2 k 3 0 k=1 d’où le résultat. II.3.9 Soit u := (xk )k∈[[0,n]] une subdivision de [a, b]. Pour tout k ∈ [[0, n − 1]] : Z xk+1 Z xk+1 f ′ (t)dt donc |f (xk+1 ) − f (xk )| 6 |f ′ (t)|dt. f (xk+1 ) − f (xk ) = xk Par suite V (f, u) 6 Montrons V (f ) = Z Z b a a xk b |f ′ (t)|dt, ainsi f est variation bornée et V (f ) 6 Z a b |f ′ (t)|dt. |f ′ (t)|dt. Pour tout k ∈ [[0, n − 1]], il existe ck ∈ ]xk , xk+1 [ tel que f (xk+1 )−f (xk ) = (xk+1 −xk )f ′ (ck ), ainsi V (f, u) = n−1 P (xk+1 −xk )|f ′ (ck )|, on reconnait n o la somme de Riemann de |f | pour la subdivision pointée D := [xk , xk+1 ], ck . k∈[[0,n−1]] Z b Pour tout ε > 0 , il existe une subdivision pointée D telle que V (f, u) > |f ′ (t)|dt − ε , k=0 a d’où le résultat. II.3.10 Nous avons vu (cf. (11)) que, pour tous f, g ∈ BV ([a, b] , E) et tout λ ∈ R on a V (λf ) = |λ| V (f ) On en déduit : et V (f + g) 6 V (f ) + V (g), (39) N (λf ) = |λ| N (f ) et N (f + g) 6 N (f ) + N (g), ν(λf ) = |λ| ν(f ) et ν(f + g) 6 ν(f ) + ν(g). Si ν(f ) = 0 , sup f (x) = 0 , donc f = 0 . ainsi ν est une norme sur BV ([a, b] , E). x∈[a,b] On a, pour tout x ∈ [a, b], f (x) − f (a) 6 f (x) − f (a) + f (b) − f (x) 6 V (f ), donc f (x) 6 f (x) − f (a) + f (a) 6 V (f ) + f (a) et sup f (x) 6 V (f ) + f (a) . x∈[a,b] On en déduit : V (f ) + f (a) 6 V (f ) + sup f (x) 6 2 V (f ) + f (a) , x∈[a,b] soit : N (f ) 6 ν(f ) 6 2N (f ). Ainsi N est aussi une norme sur BV ([a, b] , E) et elle est équivalente à ν . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 228 II.3.12 En utilisant le changement de variable : t = a+(b−a)u , on se ramène au cas a = 0, b = 1 . On a alors : Z 1 n−1 n−1 Z k+1 n 1 X k X k Rn (f ) = f (t)dt − f = f (t) − f dt k n n n 0 n k=0 1 n = n−1 XZ 1 0 k=0 k=0 x + k k −f dx n n f (i) Pour tout k ∈ [[0, n − 1]], |f (t) − f ( nk )| 6 K(t − nk ), donc : | Z k+1 n k n Z k+1 n k k 1 f (t) − f (t − )dt = K 2 , dt| 6 K k n n 2n n d’où le résultat. (ii) Pour tout k ∈ [[0, n − 1]] , avec mk := x + k k x − f( ) = mk 6 f n n n f ′ (u) et Mk = inf k k+1 u∈[ n , n ] Z sup Z x+k n k n 1 f n−1 1 X ′ f (ck ) et 2n nRn (f ) = k=0 iii) Pour tout k ∈ [[0, n − 1]], f m′k := inf k k+1 t∈[ n , n ] x n f ′ (u). k k+1 u∈[ n , n ] x + k k − f ( ) dx, on a n n 0 1 ′ ck ∈ [ nk , k+1 ] tel que δ = f (c ). Ainsi : n,k k n 2n Posons δn,k = f ′ (t)dt 6 Mk x+k n f ′′ (t) et Mk′ = m′k x2 6 2n2 Z mk 2n 6 δn,k 6 lim nRn (f ) = n→+∞ − f ( nk ) sup = x ′ k nf (n)+ f ′′ (t), on a : Z Il existe donc 1 (f (1) − f (0) . 2 x+k n k n Mk 2n . ( x+k − t)f ′′ (t)dt. Posons n k k+1 t∈[ n , n ] x+k n ( k n x+k x2 − t)f ′′ (t)dt 6 Mk′ 2 · n 2n Il existe donc dk ∈ [ nk , k+1 n ] tel que : Z 1 Z 0 Z ( k n x+k 1 − t)f ′′ (t)dt dx = 2 f ′′ (dk ) n 6n x + k k 1 ′ k 1 − f ( ) dx = f ( ) + 2 f ′′ (dk ). n n 2n n 6n 0 n−1 P 1 ′ k 1 ′′ Ainsi nRn (f ) = 2n f ( n ) + 6n2 f (dk ). D’après la question (ii), on a et 1 x+k n f k=0 Rn (f ′ ) = Z 0 c Dunod 2014 1 f′ − n−1 X k=0 1 1 ′ k 1 ′ f ( )= f (1) − f ′ (0) + εn avec n n 2n n lim εn = 0, n→+∞ II.3 : Intégration par suite 229 n−1 P k=0 1 ′ k nf (n) n−1 X k=0 = f (1) − f (0) − 1 2n f ′ (1) − f ′ (0) + n1 εn . De plus : 1 ′′ f (dk ) = f ′ (1) − f ′ (0) + δn avec n lim δn = 0. n→+∞ En regroupant ces résultats, on obtient : 1 1 ′ 1 ′ 1 f (1) − f ′ (0) + f (1) − f ′ (0) + o( ) nRn (f ) = f (1) − f (0) − 2 4n 6n n 1 1 1 = f (1) − f (0) − f ′ (1) − f ′ (0) + o( )· 2 12n n II.3.14 1. On raisonnera de façon similaire au cas de ℓ2 en montrant que les suites des « coordonnées » convergent. 2. a) Pour tout n ∈ N, ken k = 1 , donc la fonction kf k est : ( 0 si t ∈ /Q kf k : t 7→ . 1 si t ∈ Q. Cette fonction n’est pas R -intégrable (cf. l’exercice 2 de la page 556). Si f était R -intégrable, kf k le serait (cf. la proposition 63 de la page 587) et l’on aboutirait à une contradiction. b) Soit n ∈ N. La fonction un ◦f est nulle en tout point de [0, 1] sauf au point rationnel ϕ(n) où elle prend la valeur 1 . Elle est donc R -intégrable et son intégrale est nulle : Z 1 un ◦ f = 0 . 0 n o c) Soit D = [ti , ti+1 ], ξi une subdivision pointée de pas inférieur à δ de i∈[[0,m−1]] P [0, 1]. Considérons la somme de Riemann SD (f ) := (ti+1 −ti )f (ξi ). Pour i∈[[0,m−1]] tout i ∈ [[0, m − 1]], on a f (ξi ) = 0 (si ξi ∈ / Q ) ou f (ξi ) = eni , pour un ni ∈ N convenable unique (si ξi ∈ Q ). De plus, si i 6= j , nj 6= nj , donc eni 6= enj . On en déduit que les termes de la suite SD (f ) = (sn )n∈N ∈ ℓ∞ sont nuls ou de la forme sn = ti+1 − ti (avec i tel que ni = n) et, par suite, que : SD (f ) 6 sup (ti+1 − ti ) 6 δ. i∈[[0,m−1]] Soit ε > 0 , si 0 < δ 6 ε , on a, pour toute subdivision pointée D de pas inférieur à δ , SD (f ) 6 ε . Ainsi les sommes de Riemann de f « tendent vers 0 quand le pas de la subdivision tend vers 0 », bien que f ne soit pas R -intégrable. II.3.15 On prolonge f en continuité en 0 en posant f (0) = 0 . Cette fonction est continue sur [0, 1], donc réglée. La fonction g est monotone sur R, donc réglée. On a g ◦ f (t) = 0 si t = 0 et g ◦ f (t) = sgn(t sin 1/t) si t 6= 0 . On considère les suites 1 1 tn := π/2+2nπ et un := 3π/2+2nπ . On a, pour tout n ∈ N, sin 1/tn = 1 et n∈N n∈N sin 1/un = −1 , donc g ◦ f (tn ) = 1 et g ◦ f (un ) = −1 . On a lim tn = lim un = 0 , donc n→∞ n→∞ g ◦ f n’a pas de limite à droite en 0 . Par suite elle n’est pas réglée. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 230 Z 1/e 1 dt, on obII.3.20 En faisant le changement de variables u := 1/t dans l’intégrale λ | ln t|µ t 0 Z +∞ Z +∞ 1 1 tient du . Nous allons étudier l’intégrale du , où ν := 2 − λ. 2−λ lnµ u ν lnµ u u u e e On note, pour u > e , f : u 7→ u−ν ln−µ u et g : u 7→ u 1. On suppose ν > 1 ( λ < 1 ). On a ν+1 2 f (u). ν+1 2 > 1 et lim g(u) = 0 , donc f = o u− ν+1 2 < 1 et u→+∞ l’intégrale converge. 2. On suppose ν < 1 ( λ > 1 ). On a ν+1 2 et lim g(u) = +∞. L’intégrale est donc u→+∞ divergente. 3. II.3.21 2. On suppose ν = 1 ( λ = 1 ). On introduit la fonction F définie, pour u > e , par Z u 1 F : u 7→ µ dv . en utilisant le changement de variables w = ln v , on obtient e v ln v Z ln u dw 1 F (u) := ln1−µ u − 1 si µ 6= 1 et F (u) = ln(ln u) si . Donc F (u) = 1−µ µ w 1 µ = 1 . Ainsi l’intégrale converge si, et seulement si, µ > 1 . 1. On suppose α > 1 . On a, pour tout t > 1 , |t−α cos t| 6 t−α et |t−α sin t| 6 t−α , les deux intégrales sont donc absolument convergentes. On suppose 0 < α 6 1 . On a vu dans les exercices 19 de la page 621 et 22 de la page 623 que les deux intégrales sont convergentes. Montrons qu’elles ne sont pas absolument convergentes. Z +∞ En utilisant un changement de variables, on montre que l’intégrale t−α cos 2t dt 1 Z +∞ −α est convergente. Par ailleurs l’intégrale t dt est divergente. En utilisant 1 cos2 t = 21 (1 + cos 2t) et sin2 t = 12 (1 − cos 2t), on en déduit que les intéZ +∞ Z +∞ grales t−α cos2 t dt et t−α sin2 t dt sont divergentes. On a, pour tout 1 1 Z +∞ 2 2 t > 1 , |cos t| > cos t et |sin t| > sin t, donc les intégrales t−α |cos t| dt et 1 Z +∞ t−α |sin t| dt sont divergentes. 1 3. On suppose α 6 0 . Alors les deux intégrales sont divergentes. Nous allons le montrer pour la seconde, la preuve pour la première est similaire. On note, pour tout n ∈ N∗ : Z (n+1)π Z π −α n un := t sin t dt = (−1) (u + nπ)−α sin u du. nπ 0 La fonction sin est positive sur [0, π], donc : Z π Z −α −α |un | = (u + nπ) sin u du > (nπ) 0 c Dunod 2014 0 π sin u du = 2(nπ)−α . II.3 : Intégration 231 Ceci montre que l’intégrale Z 1 +∞ t−α |sin t| dt ne satisfait pas la condition de conver- gence de Cauchy, elle est donc divergente. II.3.22 Soient x ∈ R et a > 0 tel que t2 + x > 0 si t > a. Soit A > a. Considérons : 3 3 Z A Z A t t dt + xt dt = (t2 + x) cos + xt cos 2 3 3 t +x a a 3 A 3 Z A 1 t t t = 2 sin + xt +2 sin + xt dt. 2 2 t +x 3 3 a (t + x) a 3 Z +∞ 3 t t t t t On a (t2 +x)2 sin 3 + xt 6 (t2 +x)2 , l’intégrale sin + xt dt est (t2 + x)2 3 a 3 donc convergente. Par ailleurs lim A21+x sin A3 + xA = 0 , on en déduit que l’intégrale A→+∞ 3 3 Z +∞ Z +∞ t t cos + xt dt converge. Par suite cos + xt dt converge. 3 3 a 0 Z +∞ 3 cos t + xt dt ne converge pas. Montrons que l’intégrale 3 0 Z A 3 cos t + xt dt et l’on utilise le changement de variables u := t3 + xt. On considère 3 3 a 2 3 = t + x, la fonction t 7→ t3 + xt est donc strictement croissante sur [a, +∞[ Z A 3 Z A33 +xA t du et l’on a |cos u| 2 · On a, au voisinage de +∞, cos 3 + xt dt = a3 t +x a 3 +xa On a du dt 3 t2 + x ∼ 32/3 u2 . Par suite, il existe b > a tel que t2 1+x > 12 32/31 u2 pour tout u > b3 + xb . On 3 Z A Z A33 +xA du t 1 1 |cos u| 2/3 . Nous en déduit, pour tout A > b , cos 3 + xt dt > 2 32/3 b3 u +xb b Z +∞ 3 du avons vu dans l’exercice précédent II.3.21 que l’intégrale |cos u| 2/3 est divergente, il u 1 Z +∞ 3 cos t + xt dt . en est donc de même de 3 0 II.3.23 Les signes o et ∼ sont implicitement au voisinage de +∞. |ln g| = o(ln x). On considère la fonction x 7→ x−ε /g(x) = e− ln g−ε ln x , on a : lim − ln g − ε ln x = −∞, donc x−ε = o(g). On en déduit que l’intégrale x→+∞ Z +∞ impropre g(x)dx est divergente. a b) Puisque xg ′ (x) = o g(x) , on a g(x) + xg ′ (x) ∼ g(x). c) Par intégration par parties on obtient : Z x Z x g(t)dt = xg(x) − ag(a) − tg ′ (t)dt, 1. a) a a c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 232 Z x g(t) + tg ′ (t) dt = xg(x) − ag(a). On en déduit, en utilisant a Z x ′ g(x) + xg (x) ∼ g(x), que g(t)dt ∼ xg(x). d’où a 1 ln x g (x) g(x) On pose, pour tout x > a > 1 , g(x) := 2. 1 classe C . On a la question 1. ′ g (x) g(x) = 1 − x ln x , donc ′ , c’est une fonction strictement positive, de = o( x1 ) et l’on peut utiliser les résultats de 1. On définit une fonction f : [1, +∞[ → R par : ( 1/x2 si x ∈ / N∗ f : x ∈ [1, +∞[ 7→ 1 si x ∈ N∗ II.3.24 . Z +∞ 1 est conver2 x 1 gente et, pour tout sous-segment I de [1, +∞[, I ∩ N∗ est fini, donc f est localement Z Z Z +∞ Z +∞ 1 1 . Donc f est convergente et est égale à = 1. intégrable et f= 2 2 x x 1 1 I I La fonction f n’admet pas de limite quand x → +∞. L’intégrale On définit une fonction f : [1, +∞[ → R par : 1 1 n ∗ 2 x − n + 2n si x ∈ n − 2n , n , n ∈ N , n > 1 f : x ∈ [1, +∞[ 7→ 2n n + 21n − x si x ∈ n, n + 21n , n ∈ N∗ , n > 1, 0 sinon. On a, pour tout n ∈ N∗ , n > 1 , f n ± 21n = 0 et f (n) = 1 . Ainsi f est continue et, Z n+ 21n 1 pour tout n ∈ N∗ , n > 1 : f = n . On en déduit que f n’admet pas de limite 2 n− 21n Z +∞ Z +∞ X 1 1 quand x → +∞ et que l’intégrale f est convergente : f= = · n 2 2 1 1 2. n>2 Z a Z E(a) Z a x − E(x) − 21 x − E(x) − 12 x − E(x) − 12 II.3.25 Soit a > 1 , = + . On x x x 1 1 E(a) Z Z a a x − E(x) − 1 x − E(x) − 12 1 2 a , ainsi lim = 0 . Soit n ∈ N∗ , 6 a→+∞ E(a) E(a) x 2E(a) x Z n+1 x − E(x) − 21 considérons In := . On a : x 1 Z n+1 n n X E(x) X = k ln(k + 1) − ln k = − ln k + n ln(n + 1) x 1 k=1 et Z 1 n+1 x− x c Dunod 2014 1 2 =n− k=2 1 ln(n + 1). Ainsi : 2 1 en n! In = n − (n + ) ln(n + 1) + ln n! = ln 1 . n+ 2 (n + 1) 2 II.3 : Intégration 233 D’après la formule de Stirling (qu’il faut rectifier dans l’énoncé) n! ∼ √ lim In = ln( 2π) − 1 . √ 2πn ( ne )n , et n→+∞ II.3.26 i) On a xn = n X k=0 f (a + k) − f (a + k) − Z Z a+k+1 a+k a+k+1 f (t)dt et f (t)dt = a+k Z a+k+1 a+k t − (a + k + 1) f ′ (t)dt (faire une intégration par parties). Z a+k+1 Z a+k+1 On en déduit f (a + k) − f (t)dt 6 |f ′ (t)|dt ; la suite (xn ) est donc a+k a+k convergente. Z +∞ P f (t)dt converge la série f (a + n) converge ; réciproquement si la série ii) Si a Z a+n+1 P f (a + n) converge alors la suite f (t)dt converge. Soit x > a + 1 , poa Z x Z x sons n := E(x − a − 1), on a f (t)dt 6 |f (a + n + 1)| + |f ′ (t)|dt, par a+n+1 a+n+1 Z x Z +∞ suite lim f (t)dt = 0 , f (t)dt est donc convergente. x→+∞ a+n+1 a P 1 iii) Posons un = n1s , si Re s = α on a |un | = n1α Si α > 1 , la serie ns est absolument n∈N∗ convergente. Si α < 0 , la série est divergente car un ne tend pas vers zéro. Supposons 0 < α 6 1 et s 6= 1 . Soit f : t ∈ [1, +∞[ → t−s = e−s ln t , f est de classe C 1 sur Z +∞ |s| s ; on a |f ′ (t)| = tα+1 , |f ′ (t)|dt est donc convergente. [1, +∞[ → et f ′ (t) = − ts+1 1 Z +∞ Z X 1 Étudions f (t)dt. Soit X > 1, f (t)dt = (X 1−s − 1), l’intégrale est donc 1−s 1 1 P 1 divergente, de même que la série ns . n∈N∗ II.3.27 i) Soit x lim e−t −e−xt t t→0 −t −xt 1 , l’application t ∈ ]0, +∞[→ e −e est continue et t Z +∞ = x − 1 l’intégrale f (x, t) dt est donc convergente. > 0 −xt Pour tous (x, t) ∈ [1, +∞[×]0, +∞[, on a ∂f < e−t , l’intégrale ∂x (x, t) = e Z +∞ e−t dt converge. D’après le théorème 129 de la page 644 la fonction F est de classe 0 Z +∞ 1 1 ′ C sur [1, +∞[ et F (x) = e−xt dt = ·, par suite F (x) = ln x + F (1) = ln x. x 0 Z +∞ −at e − e−bt iii) Il suffit de faire le changement de variable u := at dans l’intégrale dt t 0 Z +∞ −u b e − e− a u pour se ramener à du . u 0 ii) c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 234 II.3.28 Pour tout t ∈ ]0, 1[, +∞ X ln(1 − t) tn =− · t n+1 n=0 tn ln t. On a : n+1 Z 1 Z 1 n tn+1 1 t 1 tn ln tdt = ln t 0 − dt = − n + 1 n + 1 (n + 1)2 0 0 Pour tout n ∈ N, posons un := Z et 1 0 un = − 1 · (n + 1)3 D’après la proposition 124 de la page 638, I est convergente et I = ζ(3). II.3.29 En faisant le changement de variable t = xu on a : Z x1 Z 1 Z 1 1 (1 + uα )− α du = (1 + uα )− α du + f (x) = i) 0 0 1 α −α ii) 1 x 1 (1 + uα )− α du. 1 −1 Au voisinage de +∞, (1 + u ) ∼ u on a donc f (x) ∼0 − ln x (voir la partie 7.3). On peut écrire : Z x1 Z 1 1 1 1 f (x) + ln x = (1 + uα )− α du + (1 + uα )− α − du. u 0 1 Z x1 1 1 (1 + uα )− α − du, en faisant le changement de variable v = u1 Posons g(x) := u 1 on a : Z x 1 1 g(x) = − (1 + v α )− α − 1 dv. 1 v 1 La fonction v ∈ ]0, +∞[ → v1 (1 + v α )− α − 1 admet au voisinage de 0 un développen P ment limité à tout ordre n, soit ak v αk−1 + o v (n+1)α−2) un tel développement, on Z k=1 n X 1 1 1 a (1 + v α )− α − 1 dv = ak xαk + o(x(n+1)α−1 ). v αk 0 k=1 Z 1 n X 1 1 1 Par suite g(x) = (1 + v α )− α − 1 dv − ak xαk + o(x(n+1)α−1 ). αk 0 v x k=1 Si α = 3 , on a : et : 1 1 v2 2 14 (1 + v 3 )− 3 − 1 = − + v 5 − v 8 + o(v 10) ) v 3 9 81 f (x) + ln x = C + avec : C := Z 0 c Dunod 2014 1 1 x3 x6 14 x9 − + 3 + o(x11 ) 9 27 9 (1 + t3 )− 3 dt + Z 0 1 1 1 (1 + t3 )− 3 − 1 dt. t II.3 : Intégration 235 −(t2 +i)x2 1 i) Pour tous x ∈ R et t ∈ [0, +∞[ on a e t2 +i 6 √1+t , on sait que 4 Z +∞ 1 √ dt est convergente, d’où le résultat. 1 + t4 0 ii) Montrons que F est continue sur R. On applique le théorème 126 de la page 642 −(t2 +i)x2 1 et la convergence de l’intégrale en utilisant la majoration e t2 +i 6 √1+t 4 Z +∞ 1 √ dt. 1 + t4 0 Pour tous x ∈ R et t ∈ [0, +∞[, on a : −(t2 +i)x2 ∂ e t2 +i 2 2 = −2xe−(t +i)x . ∂x II.3.30 Montrons d’abord que la fonction F est de classe C 1 sur R∗ . La fonction F étant paire, 2 il suffit de traiter le cas x > 0 . Si 0 < a 6 x 6 b, |xe−(t 2 2 −t a +i)x2 2 2 | 6 be−t a . La fonction t ∈ [0, +∞[ → 7 be est intégrable sur [0, +∞[, donc, d’après le théorème 129 de la page 644, F est de classe C 1 sur [a, b]. On en déduit que F est de classe C 1 sur R∗ et Z +∞ 2 2 ′ que, pour tout x 6= 0 , F (x) = −2x e−(t +i)x dt. Si x 6= 0 , on peut effectuer le 0 changement de variable u = tx, on en déduit : Z +∞ √ 2 2 ′ −ix2 e−u du = − πe−ix . F (x) = −2e 0 √ Montrons, pour finir, que F est dérivable en 0 , de dérivée égale à − π . Pour tout x 6= 0 , la fonction F est continue sur [0, x] et dérivable sur ]0, x[. Donc, d’après le théorème des √ 2 (0) accroissements finis, il existe ξx ∈ ]0, x[ tel que F (x)−F = − πe−iξx . On en déduit x √ (0) = − π . Par suite F est de classe C 1 sur R. F ′ (0) = lim F (x)−F x x→0,x6=0 Z x √ −iu2 iii) Soit x > 0 . On a, pour tout x > 0 , F (x) − F (0) = − πe du . 0 Montrons que lim F (x) = 0 . x→+∞ Z +∞ Z +∞ 2 2 1 1√ −t2 x2 On a |F (x)| 6 e dt et, ∀x 6= 0, e−t x dt = π , d’où le résultat. x2 0 Z 0+∞ Z +∞ √ 2 1 On en déduit : du = F (0) = π e−iu du . On a : 2+i u 0 0 Z +∞ Z +∞ 2 Z +∞ 1 u −i u2 du = du = (1 − i) du, u2 + i 1 + u4 1 + u4 0 0 0 Z +∞ Z +∞ u2 1 car du = du . 4 1 + u 1 + u4 0 0 Z +∞ 2 Z +∞ u +1 u2 Calculons du = 2( )du . On a : 1 + u4 1 + u4 0 0 u2 + 1 1 1 1 √ √ = + ; 1 + u4 2 1 + u2 − 2u 1 + u2 + 2u c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 236 par suite : Z +∞ 2 Z Z u +1 1 +∞ 1 +∞ 1 1 1 √ √ du = du = du = π 2, 1 1 4 2 2 √ 1+u 2 −∞ 1 + u + 2u 2 −∞ (u + 2 ) +2 0 2 d’où le résultat. II.3.31 1. Si long(X) = 0 il suffit de prendre pour K un ensemble réduit à un point. Sinon il suffit de traiter le cas où X est une réunion finie d’intervalles ouverts disjoints : S X := Ii . Il existe des intervalles fermés Ki ⊂ Ii ( i ∈ [[1, m]]) tels que i∈[[1,m]] long Ki > long Ii − ε/m et, en posant K := 2. S i∈[[1,m]] Ki , on a long K > long X − ε . La suite (αn )n∈N∗ est évidemment décroissante. Nous allons raisonner par l’absurde, si elle ne tendait pas vers 0 il existerait δ > 0 tel que αn > δ pour tout n ∈ N. Supposons qu’il en soit ainsi. Pour tout n ∈ N on choisit (en utilisant 1.) un sous-ensemble T élémentaire fermé n Xn ⊂ An tel que long Xn > αn − δ/2 et l’on pose Hn := Xi ⊂ An . i∈[[1,n]] La suite de fermés (Hn )n∈N∗ de [a, b] est décroissante. Ces fermés sont compacts, si l’on montre que chacun est non vide nous aboutirons à une contradiction puisque ceci T T T T implique Hn 6= ∅ et, par suite, An 6= ∅ puisque Hn ⊂ An . n∈N∗ n∈N∗ n∈N∗ n∈N∗ Montrons que chaque Hn est non vide, ce qui terminera la preuve. Nous allons le faire en trois étapes. a) Soit X ⊂ An \ Xn un sous-ensemble élémentaire. Montrons que long X < δ/2n . Le sous-ensemble X ∪ Xn est élémentaire et contenu dans An , on a donc : long X + long Xn = long(X ∪ Xn ) 6 αn et, en utilisant long Xn > αn − δ/2n : long X − δ/2n + αn < long X + long Xn 6 αn et long X < δ/2n b) Soit Y ⊂ An \ Hn un sous-ensemble élémentaire. Montrons que long Y < δ . On écrit Y comme réunion de sous-ensembles élémentaires : Y = (Y \ X1 ) ∪ (Y \ X2 ) ∪ . . . ∪ (Y \ Xn ). P On en déduit long Y 6 long(Y \ Xi ). Puisque, pour tout i ∈ [[1, n]], i∈[[1,n]] Y \ Xi ⊂ Ai \ Xi est un sous-ensemble élémentaire, on a, en utilisant a), long(Y \ Xi ) < δ/2i , d’où long Y < δ . c) Puisque, d’après l’hypothèse faite plus haut, αn > δ , il existe un sous-ensemble élémentaire Z ⊂ An tel que long Z > δ . Si Hn était vide, l’on aurait Z ⊂ An = An \ Hn , d’où, d’après b), long Z < δ et une contradiction. II.3.32 1. Soit ε > 0 . On définit des sous-ensembles {An }n∈N de [a, b] par ε An := {x ∈ [a, b] ∃k > n, fk (x) > 2(b−a) } . La famille de parties {An }n∈N est déT croissante et, puisque fn converge simplement vers 0 , on a An = ∅ . En appliquant n∈N c Dunod 2014 II.3 : Intégration 237 le résultat de la question 2 de de l’exercice II.3.31, on montre qu’il existe N ∈ N tel que, ε pour tout n > N et tout sous-ensemble élémentaire X de An l’on ait long(X) 6 2K . Z b Montrons que, pour tout n > N , fn 6 ε (ce qui terminera la preuve, ε > 0 étant ara Z b fn 6 ε , c’est-à-dire que, bitraire). Puisque fn est intégrable, il suffit de montrer que ∗ a Z b pour toute fonction en escalier ψ telle que 0 6 ψ 6 fn , on a ψ 6 ε. a Soit ψ une fonction en escalier telle que 0 6 ψ 6 fn . On définit ε X := {x ∈ [a, b] ψ(x) > 2(b−a) } et Y := [a, b] \ X . Les sous-ensembles X et ε . Par suite : Y sont élémentaires et l’on a X ⊂ An , donc long(X) 6 2K Z b Z b Z b Z b Z b ε ψ= ψ 1X + ψ 1Y 6 K 1X + a a a a a 2(b − a) ε ε ε = K long(X) + (b − a) 6 + = ε. 2(b − a) 2 2 2. On se place dans les hypothèses du théorème d’Arzela. Soit (fn )nN une suite de fonctions R -intégrables sur [a, b] convergeant simplement vers une fonction f R -intégrable sur [a, b]. On suppose qu’il existe K > 0 tel que |fn | 6 K pour tout n ∈ N. En remplaçant fn par fn − f et K par une autre constante positive ( f est bornée), on peut supposer que f = 0 . On obtient le résultat en appliquant celui de la question 1 aux fonctions f + et f − . II.3.33 1 1. La fonction g : t 7→ est continue donc localement intégrable sur [0, +∞[ et 1 + t2 Z +∞ π dt l’on a = . Posons X := [0, +∞[, I = [0, +∞[ et soit f : X × I → R 2 1 + t 2 0 la fonction définie par : 2 e−x(1+t ) · 1 + t2 Alors, f est continue sur X × I et pour tout (x, t) ∈ X × I , on a 0 6 f (x, t) 6 g(t). Le théorème de continuité d’une fonction définie par une intégrale implique que F est définie et continue sur X . Z +∞ −xt2 Z +∞ e 1 π −x −x −x On a F (x) = e dt 6 e dt = e . Par suite 2 2 1 + t 1 + t 2 0 0 lim F (x) = 0 . f (x, t) := x→+∞ 2. Pour montrer que F est dérivable sur ]0, +∞[, observons que pour tout t ∈ I , la fonction x 7→ f (x, t) est dérivable et : 2 ∂f (x, t) = −e−x(1+t ) . ∂x Notons que pour tout r > 0 , on a : ∀x > r, 06− ∂f (x, t) 6 h(t) avec ∂x 2 h(t) := e−r(1+t ) . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 238 La fonction h est continue donc localement intégrable sur I = [0, +∞[ et l’on a Z +∞ Z e−r +∞ −u2 h(t)dt = √ e du < +∞. D’après le théorème de dérivation d’une r 0 0 fonction définie par une intégrale, F est dérivable sur ]r, +∞[ pour tout r > 0 , donc sur ]0, +∞[, et : Z +∞ Z +∞ Z 2 e−x +∞ −u2 ∂f (x, t) dt = − e−x(1+t ) dt = − √ e du. F ′ (x) = ∂x x 0 0 0 3. La fonction F ′ est continue sur ]0, +∞[. Donc, pour tous 0 < a < b < +∞, Z +∞ Z b π ′ F (x) dx = F (b) − F (a). Par suite F ′ (x) dx = − . Donc 2 a 0 Z Z +∞ −x +∞ 2 e π √ dx = e−u du · En utilisant le changement de variables x 2 0 0 Z +∞ 2 √ Z +∞ π π −u2 −u2 2 x = u , on en déduit e du = · Donc e du = · 4 2 0 0 II.3.34 On prolonge par continuité en 0 la fonction t 7→ sint t en lui donnant la valeur 1 . Z +∞ sin t Nous avons vu que l’intégrale dt est convergente. Par ailleurs, si x > 0 , t 0 Z +∞ sin t −tx e dt est évidemment (absolument) convergente. On en déduit que, pour tout t 1 Z +∞ sin t −tx x > 0, e dt est convergente et que la fonction f est bien définie. t 0 Z +∞ sin t La fonction F : y 7→ − dt est de classe C 1 sur [0, +∞[ et est une primitive de t y t 7→ sin t t . Soit ε > 0 . Il existe A > 0 tel que, pour tout y > A, l’on ait F (y) 6 ε . On fixe A dans toute la suite. On suppose x > 0 . Soient A 6 α 6 β , on a la formule d’intégration par parties : Z β Z β β sin t −tx e dt = e−tx F (t) α + x e−tx F (t) dt. t α α β On a [e−tx F (t)]α 6 F (α) + F (β) 6 2ε et : Z Z β Z +∞ β −tx e F (t) dt 6 εx e−tx 6 εx e−tx 6 ε. x α α 0 Z β sin t Par suite, pour tout x > 0 , e−tx dt 6 3ε . α t Montrons que la fonction f est continue à droite en x = 0 . On a, pour tout x > 0 : Z A Z +∞ Z +∞ sin t sin t −tx −tx sin t f (x) − f (0) = 1−e ) dt + dt − e dt. t t t 0 A A c Dunod 2014 II.3 : Intégration 239 Z +∞ sin t On a dt 6 ε , et, en choisissant α := A, et en faisant tendre β vers +∞ : t Z +∞ A sin t −tx e dt 6 3ε . Par ailleurs, |sin t/t| 6 1 sur [0, +∞], et, pour tout t ∈ [0, A], t A Z A −tx sin t −tx −Ax dt 6 A(1 − e−Ax ). En utilisant −e 6 −e , on a donc 1−e ) 0 t lim (1 − e−Ax ) = 0 ( A étant fixé), on en déduit qu’il existe η > 0 tel que, si 0 < x 6 η , on −tx sin t a 1−e ) dt 6 ε et, par suite |f (x) − f (0)| 6 5ε . Ainsi f est continue en 0 . 0 t ∂ sin t −tx Montrons que f est dérivable (donc continue) sur ]0, +∞[. On a ∂x = − sin t e−tx t e −tx −tx −tx et |sin t e | 6 e . Pour tout γ > 0 et tout x > γ , on a 0 < e 6 e−γx En appliquant le théorème de dérivation (théorème 129) on en déduit que f est dérivable et de dérivée Z +∞ x 7→ − sin t e−tx dt sur tout intervalle [γ, +∞[ ( γ > 0 ), donc sur ]0, +∞[. x→0+ Z A 0 On a : Z +∞ Z − sin t e−tx dt = − Im +∞ et(i−x) dt = Im 0 0 et(i−x) x−i +∞ 0 = − Im 1 1 =− . x−i 1 + x2 Par suite, il existe C > 0 , tel que, pour tout x > 0 , f (x) = C − arctan x. On a, pour tout Z +∞ 1 x > 0 , |f (x)| 6 e−tx dt = . On en déduit lim f (x) = 0 et C = π/2 . Par suite x→∞ x 0 f (0) = lim f (x) = π/2 . x→0+ x−1 II.3.35 Pour tout x ∈ R, l’application t 7→ t1+t est positive et continue sur ]0, +∞[. Au voisiZ 1 x−1 x−1 t nage de 0 , t1+t ∼ tx−1 , l’intégrale dt converge donc si, et seulement si, 1 − x < 1 , 0 1+t Z 1 x−1 x−1 t c’est-à-dire x > 0 . Au voisinage de +∞, t1+t ∼ tx−2 , l’intégrale dt converge 0 1+t donc si, et seulement si, 2 − x > 1 , c’est-à-dire 1 < x. On note : Z 1 x−1 Z +∞ x−1 t t g : x ∈ ]0, 1[ 7→ dt et h := x ∈ ]0, 1[ 7→ dt. 1 + t 1 +t 0 1 La fonction f est définie sur ]0, 1[ et l’on a f = g + h. Prouvons que g et h sont de classe C ∞ sur ]0, 1[, il en résultera que f est de classe C ∞ sur ]0, 1[. Pour tout t > 0 , l’application x ∈ ]0, 1[ 7→ tx−1 1+t est de classe C ∞ et, pour tout p ∈ N∗ : x−1 ∂ p tx−1 p t = (ln t) · ∂xp 1 + t 1+t Soient 0 < a < b < 1 et x ∈ ]a, b[. x−1 (i) Pour tous t ∈ ]0, 1] et p ∈ N∗ , on a |ln t|p t1+t 6 |ln t|p tx−1 6 |ln t|p ta−1 . D’après Z 1 l’exercice II.3.20, l’intégrale |ln t|p tx−1 dt converge. On en déduit, par récurrence sur 0 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 240 (ii) p, en utilisant le théorème 129 de la page 644, que g est de classe C ∞ sur ]a, b[ et que, Z 1 x−1 ∂ pg p t pour tout p ∈ N, (x) = (ln t) dt. ∂xp 1+t 0 x−1 Pour tous t ∈ [1, +∞[ et p ∈ N∗ , on a |ln t|p t1+t 6 |ln t|p tx−2 6 |ln t|p tb−2 . D’après Z +∞ l’exercice II.3.20, l’intégrale |ln t|p tx−2 dt converge. On en déduit, par récurrence 1 sur p, en utilisant le théorème 129, que h est de classe C ∞ sur ]a, b[ et que, pour tout Z 1 ∂ ph tx−1 p ∈ N, (x) = (ln t)p dt. p ∂x 1+t 0 Les choix de a et b étant arbitraires, sous la condition 0 < a < b < 1 , on en déduit que g et h sont de classe C ∞ sur ]0, 1[. II.3.36 1. On écrit U := S Ii ou les Ii sont des intervalles ouverts de [a, b] et où la réunion S est disjointe. On pose Un := Ii et on considère la suite (1Un )n∈N . Cette suite est i∈N i∈[[0,n]] uniformément majorée par 1 et elle converge simplement vers 1U . En effet : – – si x ∈ U , il existe m ∈ N tel que x ∈ Im , donc, pour tout n > m, 1Un (x) = 1 ; si x ∈ / U , alors, pour tout n ∈ N, x ∈ / Un et 1Un (x) = 0 . De ( ⋆ ) on déduit alors que IU est T -intégrable sur [0, 1] et que : Z 1 X 1U = lim 1Un = lim long Un = long Ii = long U . 0 n→+∞ n→+∞ i∈N Si K ⊂ [0, 1] est compact, U := [0, 1] \ K est ouvert dans [0, 1] et 1K = 1 − 1U . Donc 1K est intégrable. Si K est le compact de Smith-Cantor-Volterra, long U = 1/2 donc Z 1 1K = 1/2 . 0 2. Soient K est le compact de Smith-Cantor-Volterra. La fonction caractéristique 1K est T -intégrable mais n’est pas R -intégrable ( ∂K = K n’est pas négligeable, sinon, Z 1 d’après 1. appliqué aux ouverts contenant K , on aurait 1K = 0 6= 1/2 ). 0 3. Dans les hypothèses du théorème d’Arzela la limite simple f est supposée R -intégrable. Elle est donc T -intégrable et les deux intégrales coïncident, le résultat s’en déduit en utilisant la propriété ( ⋆ ). Il existe des théories T vérifiant ( ⋆ ), par exemple celles de Lebesgue et de HenstockKurzweil. Nous le montrerons dans le module Intégration du livre [L2-L3]. c Dunod 2014 II.4 : Séries de Fourier 241 Module II.4 : Séries de Fourier II.4.1 1. cn = 1 2π Z π 1 2π (−1−in)t π cosh(t)e−int dt = −π Z π e(1−in)t + e(−1−in)t dt −π 1 e(1−in)t e + 4π 1 − in −1 − in −π π n −π (−1) e −e e−π − eπ (−1)n sinh(π) + = . = 4π 1 − in −1 − in π(1 + n2 ) = De plus, an = cn + c−n = 2cn et bn = 0 car f est paire. Z π Z π 1 π2 2 −int 2. On a cn = t e dt et donc, c0 = t2 dt = . Si n 6= 0 , on fait des 2π −π 3 −π intégrations par parties : π Z π 1 2 e−int 1 e−int cn = t − 2t dt 2π −in −π 2π −π −in π Z π e−int 1 e−int 1 =0− 2t + 2 dt 2π (−in)2 −π 2π −π (−in)2 −iπnt π 1 (−1)n 4π 1 e 2 = = (−1)n 2 + 0. + 2 2 3 2π n 2π (−in) −π n De plus, an = cn + c−n = 2cn et bn = 0 car f est paire. 3. On a an = 0 car f est impaire. De plus bn = 2 2 Z 1 f (t) sin(πnt) dt = 2 −1 Z 0 1 t(1 − t) sin(πnt) dt 1 Z 1 − cos πnt cos πnt +2 (1 − 2t) = 2 t(1 − t) · dt πn πn 0 0 1 Z 1 sin πnt sin πnt = 0 + 2 (1 − 2t) · − 2 (−2) · dt (πn)2 0 (πn)2 0 1 cos πnt −4 =0−4 = (−1)n − 1 . (πn)3 0 (πn)3 8 si n est impair. Etant donné que (πn)3 −ibn −4i = , on voit que cn = 0 si n est pair et cn = si n est 2 (πn)3 Par conséquent, bn = 0 si n est pair et bn = an − ibn 2 impair. cn = c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 242 4. La fonction est périodique de période 1. On a Z 1 Z 1 iπt e − e−iπt −2iπnt −2πint cn = sin πte dt = e dt 2i 0 0 1 1 eiπ(1−2n)t eiπ(−1−2n)t 1 −1 − 1 −1 − 1 = − = − 2i iπ(1 − 2n) iπ(−1 − 2n) 0 2i iπ(1 − 2n) iπ(−1 − 2n) = 2 . π(1 − 4n2 ) De plus, an = cn + c−n = 2cn et bn = 0 car f est paire. 5. La fonction est périodique de période 2π . On a Z π/2 Z π/2 2 1 an = cos t cos nt dt = cos(n − 1)t + cos(n + 1)t dt 2π −π/2 2π −π/2 π/2 1 sin(n − 1)t sin(n + 1)t = + = 0 si n est impair. 2π n−1 n+1 −π/2 Si n = 2k , alors sin(n − 1)π/2 sin(n + 1)π/2 1 2 +2 an = 2π n−1 n+1 1 −(−1)k (−1)k −2 · (−1)k = + = . π n−1 n+1 π(n2 − 1) On fait le changement de variable t = u + T /2 : Z Z 1 T 2π · 2pt 1 T /2 T 2π · 2pu a2p (f ) = f (t) cos dt = f u+ cos + 2pπ du T 0 T T −T /2 2 T Z 1 T /2 2π2pu = −f (u) · cos du = −a2p (f ). T −T /2 T II.4.2 1. De même, b2p (f ) = 2. 1 T Z T f (t) sin 0 2π · 2pt T T 2π · 2pu u+ sin + 2pπ du 2 T −T /2 Z T /2 1 2π2pu = −f (u) · sin du = −b2p (f ). T −T /2 T dt = 1 T Z T /2 f On fait le changement de variable t = T /2 − u : Z 1 3T /4 2π(2p + 1)t a2p+1 (f ) = f (t) cos dt T −T /4 T Z T 2π(2p + 1)u 1 −T /4 = f − u cos (2p + 1)π − (−du) T 3T /4 2 T Z 1 3T /4 2π2pu = f (u) · − cos du = −a2p+1 (f ). T T /4 T c Dunod 2014 II.4 : Séries de Fourier 243 De même, II.4.3 On a 3 sin (x) = b2p (f ) = 1 T = 1 T = 1 T eix − e−ix 2i 2π · 2pt dt T −T /4 Z −T /4 T 2π(2p + 1)u f − u sin 2pπ − (−du) 2 T 3T /4 Z 3T /4 2π2pu f (u) · − sin du = −b2p (f ). T T /4 Z 3 3T /4 f (t) sin = = II.4.4 e3ix − 3e2ix e−ix + 3eix e−2ix + e−3ix −8i 1 e3ix − e−3ix 3 eix − e−ix 1 3 + = − sin(3x) + sin(x). 4 2i 4 2i 4 4 P 1. Pour tout x ∈ R, on a |einx /n3 | 6 1/n3 et la série 1/n3 converge. Par conséquent, la série de fonction est normalement convergente. La somme est donc continue. P inx 2 2. La série des dérivées ie /n est également normalement convergente étant donné X einx P que la série 1/n2 converge. Par conséquent, f est de classe C 1 et f ′ (x) = i 2 . n n>1 3. La série de fonctions étant normalement convergente, on peut échanger série et intégrale. On a donc cn (f ) = 0 si n 6 0 et cn (f ) = 1/n3 si n > 1 . II.4.5 1. Pour tout t ∈ R, on a 1 − 2r cos t + r2 > 1 − 2r + r2 = (1 − r)2 > 0 . Par conséquent, le dénominateur ne s’annule pas et la fonction f est de classe C ∞ sur R. Ses coefficients de Fourier sont donc à décroissance rapide : cn (f ) = o(1/nα ) pour tout α > 1 . La série de Fourier est donc normalement convergente. 2. La fonction f est une fonction paire. Donc, bn (f ) = 0 pour tout n > 1 . De plus, 1 = (1 − 2r cos t + r2 ) · f (t) = (1 − 2r cos t + r2 ) X a0 X + (1 + r2 )an cos(nt) − 2ran cos(t) cos(nt) 2 n>1 n>1 a0 = (1 − 2r cos t + r2 ) 2 X X X 2 + (1 + r )an cos(nt) − ran cos (n − 1)t − ran cos (n + 1)t n>1 n>1 n>1 a0 = (1 − 2r cos t + r2 ) 2 X X X 2 + (1 + r )an cos(nt) − ran−1 cos(nt) − ran+1 cos(nt) n>1 n>2 n>0 X a0 = (1 + r2 ) − ra1 + (1 + r2 )an − ran+1 − ran−1 cos(nt). 2 n>1 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 244 Par conséquent, (1 + r2 )a0 /2 − ra1 = 1 et pour n > 1 , (1 + r2 )an − ran+1 − ran−1 = 0. 3. Les racines de l’équation caractéristiques rx2 − (1 + r2 )x + r sont r et 1/r . Par conséβ quent, il existe α et β tels que pour tout n > 0 , on ait an = αrn + n . r La suite an étant à décroissance rapide, on a forcément β = 0 . Pour calculer a0 , on fait le changement de variable u = tan(t/2) et v = u(1 + r)/(1 − r) : Z Z 1 π 1 1 ∞ 1 2 du a0 = dt = π −π 1 − 2r cos t + r2 π −∞ 1 − 2r(1 − u2 )/(1 + u2) + r2 1 + u2 Z Z ∞ 1 ∞ 2 du 2 dv 2 = = = . π −∞ (1 − r)2 + u2 (1 + r)2 π(1 − r2 ) −∞ 1 + v 2 1 − r2 2rn . 1 − r2 Comme f est C ∞ , elle est somme de sa série de Fourier. On a donc, pour tout t ∈ R : On a donc, pour tout n > 0 , an = 4. (1 − r2 )f (t) = (1 − r2 ) 5. +∞ X a0 X + (1 − r2 )an cos(nt) = 1 + 2 rn cos nt. 2 n=1 n>1 On a : +∞ X n r cos nt = Re n=1 = Re +∞ X n int r e n=1 reit 1 − reit ! = Re reit (1 − re−it ) (1 − reit )(1 − re−it ) = r cos t − r2 . 1 − 2r cos t + r2 Par conséquent, 1+2 +∞ X rn cos nt = 1 + n=1 II.4.6 1. 2r cos t − 2r2 1 − r2 = . 2 1 − 2r cos t + r 1 − 2r cos t + r2 D’après l’inégalité triangulaire, on a : n 1X 1 |vn − ℓ| = (u1 + u2 + · · · + un ) − nℓ 6 |uk − ℓ|. n n k=1 Pour n > p, on peut majorer uk − ℓ par max |uk − ℓ|. On a alors, p<k6n 1 |vn − ℓ| 6 n p X k=1 p = |uk − ℓ| + p X k=n+1 max |uk − ℓ| p<k6n 1X n−p |uk − ℓ| + max |uk − ℓ| n n p<k6n k=1 p 6 1X |uk − ℓ| + max |uk − ℓ|. p<k6n n k=1 c Dunod 2014 ! II.4 : Séries de Fourier 245 2. Pour tout ε > 0 , il existe un entier p tel que pour tout k > p, |uk − ℓ| 6 ε/2 . Quand p 1X n → +∞, |uk − ℓ| tend vers 0 . Par conséquent, il existe un entier n0 tel que pour n k=1 tout n > n0 : p 1X ε |uk − ℓ| 6 . n 2 k=1 Posons n1 = max(p, n0 ). Alors, pour tout n > n1 , on a : p 1X ε ε |uk − ℓ| + max |uk − ℓ| 6 + = ε. p<k6n n 2 2 |vn − ℓ| 6 k=1 II.4.7 D’après l’exercice II.4.1, les coefficients de Fourier an de la fonction f qui est 2π périodique et coïncide avec t2 sur [−π, π] vérifient : c0 = π2 3 et cn = (−1)n 2 pour n 6= 0. n2 De plus, an = 2cn . La fonction étant continue et C 1 par morceaux sur R, le théorème de Dirichlet implique que f est somme de sa série de Fourier, donc que pour t ∈ [−π, π] : t2 = +∞ X π2 cos(nt) +4 (−1)n . 3 n2 n=1 La fonction f étant continue donc de carré intégrable, la formule de Parseval implique que Z π X X 4 π4 1 π4 |cn |2 = = t4 dt = +2 . 5 2π −π 9 n4 n∈Z Donc, n>1 X 1 1 π4 π4 π4 = − = . n4 8 5 9 90 n>1 On a alors X 1 X 1 X 1 = + , 4 4 n (2p) (2p + 1)4 n>1 ce qui implique que X p>0 II.4.8 1. On a : cn (h) = 1 T Z 0 T p>1 p>0 1 15 X 1 π4 = = · 4 4 (2p + 1) 16 n 96 f (t) · g(t)e−iωnt dt = n>1 1 T Z 0 T f (t) · g(t) · en (t) dt = ( g · en | f ). 2. Les fonctions étant continues, on peut appliquer la version polarisée de la formule de Parseval : +∞ X cn (h) = ( g · en | f ) = ck (f ) · ck (g · en ). k=−∞ c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 246 Or, ck (g · en ) = II.4.9 1. Z 1 T T g(t)eiωnt e−iωkt dt = 0 Pour n = 0 , on a c0 (f ) = Z cn (f ) = 1 te −2πint 0 Z T g(t)e−iω(n−k)t dt = cn−k (g). 0 1 t dt = 1/2 . Pour n 6= 0 , 0 Z 1 T −2πint 1 Z 1 −2πint e e 1 dt = t − dt = − . −2πin 0 −2πin 2πin |0 {z } =0 2. La fonction f est C 1 par morceaux. Elle est continue sur ]0, 1[. D’après le théorème de Dirichlet, pour tout x ∈ ]0, 1[, on a X 1 1 X 1 X sin(2πnx) − (e2πinx − e−2πinx ) = − . f (x) = cn (f )e2πinx = + 2 2πin 2 πn n>1 n∈Z 3. n>1 Pour x = 1/4 , on a sin(2πnx) = sin(nπ/2) = L’égalité précédente donne donc 1 1 1 = − 4 2 π 4. ( 0 (−1)k si n est pair si n = 2k + 1. 1 1 1 − + − ··· , 3 5 d’où le résultat. La formule de Parseval implique Z 1 X 1 X 1 1 cn (f )2 = +2 = t2 dt = · 4 4π 2 n2 3 0 n>1 Par conséquent, n∈Z X 1 1 1 π2 2 = 2π − = · 2 n 3 4 6 n>1 II.4.10 1. On a cn (f ) = = 2. 1 2π Z π eiat e−int dt = −π π 1 ei(a−n)t 2π i(a − n) −π sin π(a − n) 1 ei(a−n)π − e−i(a−n)π (−1)n sin(aπ) = = · π(a − n) 2i π(a − n) π(a − n) La formule de Parseval implique Z π X sin(aπ) 2 1 = |eiat |2 dt = 1. π(a − n) 2π −π n∈Z On en déduit immédiatement que c Dunod 2014 X 1 π2 = · 2 (a − n)2 sin (πa) n∈Z II.4 : Séries de Fourier II.4.11 247 1. On a (−1)n +∞ X cos(nt) cos(nt) 2 = O(1/n ). Par conséquent, la série = (−1)n 2 · 2 2 n +a n + a2 n=1 est normalement convergente. La somme f (t) définie donc une fonction continue sur R. 2. On a π Z π 1 1 e(a−in)t at −int e e dt = cn = 2π −π 2π a − in −π 1 e(a−in)π − e−(a−in)π (−1)n sinh(aπ) (−1)n sinh(aπ)(a + in) = = · π(a − in) 2 π(a − in) π(a2 + n2 ) Par conséquent, = an = cn + c−n = (−1)n 2a sinh(aπ) π(n2 + a2 ) et bn = icn − ic−n = −(−1)n 2n sinh(aπ) · π(n2 + a2 ) cos(nt) et observons que n2 + a2 n sin(nt) π fn′ (t) = −(−1)n 2 = bn sin(nt) n + a2 2 sinh(aπ) π = an cos(nt) + bn sin(nt) − afn (t). 2 sinh(aπ) 3. Posons fn (t) := (−1)n Par consqéquent, la série des dérivées +∞ X n=1 de la fonction t 7→ −(−1)n n sin(nt) est donc la série de Fourier n2 + a2 π πa0 π 1 eat − af (t) − = eat − af (t) − · 2 sinh(aπ) 4 sinh(aπ) 2 sinh(aπ) 2a Cette fonction étant continue sur ] − π, π[, la convergence est localement uniforme. Par conséquent, f est dérivable sur ] − π, π[ et π 1 f ′ (t) + af (t) = eat − · 2 sinh(aπ) 2a 4. Les solutions de l’équation homogène sont de la forme λe−at . La méthode de variation π 1 de la constante implique que f (t) = λ(t)e−at avec λ′ (t)e−at = eat − · 2 sinh(aπ) 2a On a donc π 1 λ(t) = e2at − 2 eat + C. 4a sinh(aπ) 2a On choisit la constante C de sorte que f (−π)− = f (π), c’est -à-dire π 1 π 1 e−aπ − 2 + Ceaπ = eaπ − 2 + Ce−aπ . 4a sinh(aπ) 2a 4a sinh(aπ) 2a π π cosh(at) 1 et f (t) = − 2· 4a sinh(aπ) 2a sinh(aπ) 2a 5. Pour finir, d’après le théorème de Dirichlet, On a donc C = +∞ X (−1)n π cosh(a · 0) 1 π 1 = f (0) = − 2 = − 2· 2 + a2 n 2a sinh(aπ) 2a 2a sinh(aπ) 2a n=1 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 248 Module II.5 : Fonctions de plusieurs variables II.5.1 La matrice jacobienne n’est pas carrée ( m 6= n), on ne peut donc pas l’inverser. 2xy x2 J = , donc det J = 2x2 est nul en (0, 1) : application non localement −2 0 inversible. 2x −1 J= , donc det J = 1 ne s’annule jamais : application localement inversible 1 0 en tout point. 1. 2. 3. (x + 1)yex xex , donc det J = ye2x est si, et seulement si, y = 0 : application yex ex localement inversible en tout point (x, y) tel que y 6= 0 . II.5.3 J = II.5.5 ∂F ∂F ∂F (x, y) = 3x2 − 3y et (x, y) = 3y 2 − 3x, d’où (0, 1) = −3 6= 0 et ∂x ∂y ∂x ∂F (0, 1) = 3 6= 0 ; on peut appliquer le théorème des fonctions implicites. On a alors ∂y ∂F ∂F (0, 1) + (0, 1)ϕ′ (0) = 0 , d’où ϕ′ (0) = 1 . ∂x ∂y −3 0 1 −2 et M0 := , on a bien G(M0 ) = N0 . 0 −3 2 −1 Pour calculer la différentielle en M0 , on isole la partie linéaire en H dans G(M0 +H) = N0 +M0 H +HM0 +H 2 : c’est l’application linéaire H 7→ M0 H +HM0 . Par calcul direct on constate que son noyau est nul ; elle est donc inversible et le théorème d’inversion locale s’applique. II.5.8 Notant N0 := II.5.10 1. Les dérivées partielles sont 3x2 + 3y et 3x, le seul point critique est (0, 0) 6∈ X ; donc X est lisse en tout point. 2. Le seul point critique est (0, 0). Si c 6= 0 , il n’est pas sur Yc qui est donc lisse. Si c = 0 , au voisinage de (0, 0) sur Yc on a x = ±y 3/2 , y > 0 (ce n’est pas localement un graphe) et y = x2/3 (c’est un graphe mais pas de classe C 1 ) : donc Y0 n’est pas lisse en (0, 0). 3. Les dérivées partielles sont x(y + 2) et pas sur Z qui est donc lisse. x2 2 + y 2 − 4 . Les points critiques (0, ±2) ne sont II.5.12 Son seul point critique est (0, 0, 0). En son voisinage, aucune des trois coordonnées n’est fonction C 1 des deux autres : le cône n’est donc pas lisse en ce point. II.5.13 1. (a) Le développement Q(x + h) = Q(x) + 2Φ(x, h) + Q(h) montre que la différentielle de Q en x est l’application linéaire h 7→ 2Φ(x, h). Cette dernière est de rang 1 puisque la forme quadratique est non dégénérée. c Dunod 2014 II.5 : Fonctions de plusieurs variables 249 (b) L’espace tangent en ce point a donc pour direction le noyau de cette application, c’est-à-dire l’orthogonal de x pour Φ. 2. (a) L’argument de non-dégénérescence s’applique tel quel. (b) Il s’agit d’examiner l’hypersurface d’équation x21 + · · · + x2p − y12 − · · · − yq2 = 0 au voisinage de l’origine. Aucine coordonnée ne s’y exprimant comme fonction C 1 des autres, cette hypersurface n’est pas lisse en ce point. II.5.15 p 1. Observons d’abord que si (x, y, z) appartient à ϕ(R2 ), alors x2 + y 2 2 = cos r p 2 x2 + y 2 − 2 + z 2 = 1 . et z = sin r , ce qui implique que p 2 Réciproquement, si x2 + y 2 − 2 + z 2 = 1 , alors il existe r ∈ R tel p x2 + y 2 − 2 = cos r et z = sin r , et comme x2 + y 2 = (2 + cos r)2 , que il existe s ∈ R tel que x = (2 + cos r) cos s et y = (2 + cos r) sin s. Par conséquent, ϕ(R2 ) est le sous-ensemble de R3 défini par l’équation F (x, y, z) = 0 2 p x2 + y 2 − 2 + z 2 − 1 . Les dérivées partielles de F par rapport avec F (x, y, z) = à x, y , et z , sont p 2x x2 + y 2 − 2 ∂F p = , ∂x x2 + y 2 p 2y x2 + y 2 − 2 ∂F p = ∂y x2 + y 2 et ∂F = 2z. ∂z La dérivée partielle par rapport à z ne s’annule que lorsque z = 0 . Dans ce p cas, x2 + y 2 − 2 = ±1 . Si l’on requiert que les dérivées partielles par rapport à x et y s’annulent également, cela force x = y = 0 et donc, F (x, y, z) = F (0, 0, 0) = 3 6= 0 . On voit donc que ϕ(R2 ) est une sous-variété lisse de R3 . 2. L’espace tangent est l’image de la différentielle du paramétrage, donc l’espace vectoriel engendré par les dérivées partielles de ϕ, c’est-à-dire : (− sin r cos s, − sin r sin s, cos r) et (−(2 + cos r) sin s, (2 + cos r) cos s, 0). Comme 2 + cos r 6= 0 , la deuxième peut être remplacée par (− sin s, cos s, 0). II.5.17 1. L’application étant polynomiale, il est clair qu’elle est de classe C ∞ . En développant F (M + H), on voit que sa différentielle au point M est l’application linéaire H 7→ tM · H + tH · M . 2. Un élément du noyau est une matrice H telle que tM · H est antisymétrique. Le noyau −1 est donc tM · Ea , qui est de dimension n(n − 1)/2 . Le rang de la différentielle est donc n(n + 1)/2 . 3. Par application du théorème des fonctions implicites, on en déduit que l’ensemble des matrices orthogonales est une sous-variété lisse de dimension n(n − 1)/2 . II.5.19 Nous emploierons les notations de Monge p, q, r, s, t (vues comme fonctions de x, y ). Si l’on note a la valeur de la fonction en (x0 , y0 ) et et p0 , q0 , r0 , s0 , t0 les valeurs de p, q, r, s, t en (x0 , y0 ), le polynôme de Taylor d’ordre 2 correspondant est donc c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 250 P (x, y) = a + p0 x + q0 y + 21 (r0 x2 + 2s0 xy + t0 y 2 ). Nous indiquons ci-dessous p, q, r, s, t, les valeurs données dans l’indication s’en déduisent immédiatement. 1. 2. p = cos(x + 2y), q = 2 cos(x + 2y), r = − sin(x + 2y), s = −2 sin(x + 2y), t = −4 sin(x + 2y). p= −2x (x2 +y 2 +1)2 −2y (x2 +y 2 +1)2 ,q= ,r= 6y 2 −2x2 −2 (x2 +y 2 +1)3 ,s= 8xy (x2 +y 2 +1)3 ,t= 6x2 −2y 2 −2 (x2 +y 2 +1)3 · 3. 2 +y 2 ex 2 +y 2 ex 2 +y 2 r = (4x2 − y 2 − 2) cos xy + 4xy sin xy, 2 +y 2 s = 3xy cos xy + (2x2 + 2y 2 − 1) sin xy, ex ex ex 4. 2 p = −2x cos xy − y sin xy, q = −2y cos xy − x sin xy, +y 2 t = (4y 2 − x2 − 2) cos xy + 4xy sin xy. Ici, nous utilisons un raccourci : sin xy = xy + O((xy)3 ) cos xy = 1 − (xy)2 /2 + O((xy)4 ), et d’où le résultat en additionnant et en tronquant. 5. 2 Encore un raccourci : e(x−1) = 1+(x−1)2 +O((x−1)4) et cos y = 1−y 2/2+O(y 4), d’où le résultat en multipliant et en tronquant. II.5.21 Nous employons ici les notations de Monge r, s, t pour les valeurs des dérivées partielles secondes au point critique considéré. 1. Les dérivées partielles sont 2x et −2y , le seul point critique est donc (0, 0). Comme (r, s, t) = (2, 0, −2), c’est un point selle. 2. Les dérivées partielles sont 4x3 et −4y 3 , le seul point critique est donc (0, 0). Comme (r, s, t) = (0, 0, 0), c’est un point critique dégénéré. Ce n’est ni un maximum local (faire y = 0 , laisser varier x), ni un minimum local (faire x = 0 , laisser varier y ). 3. Les dérivées partielles sont 3x2 − 3y et 3y 2 − 3x, les seuls points critiques sont donc (0, 0) et (1, 1). Pour le premier, (r, s, t) = (0, 6, 0), c’est donc un point selle. Pour le second, on pose x = 1 + u et y = 1 + v . En (u, v) = (0, 0), le forme initiale est 3(u2 − uv + v 2 ), forme quadratique définie positive, d’où un minimum local. 4. Les dérivées −(2x2 +3y 2 ) partielles 2 sont 2 e−(2x 2 +3y 2 ) (1 − 2(x2 + y 2 )) × 2x et e (1 − 3(x + y )) × 2y . Les points critiques sont donc (0, 0), les √ √ deux points (0, ± 3/3) et (± 2/2, 0). Pour le premier, le polynôme de Taylor d’ordre 2 est 1 + x2 + y 2 , on a un minimum local. Pour les deux suivants, posant √ y = 3/3 + v (par exemple ; le cas de l’autre signe est similaire), le polynôme de 1 Taylor d’ordre 2 est 3e (1 + x2 − 6v 2 ), on a un point selle. Pour les deux derniers, √ posant x = 2/2 + u (par exemple ; le cas de l’autre signe est similaire), le polynôme 1 de Taylor d’ordre 2 est 2e (1 − 4u2 − y 2 ), on a un maximum local. c Dunod 2014 II.5 : Fonctions de plusieurs variables 251 II.5.23 Dans les trois premiers cas, dω = 0 (calcul direct) et l’ouvert est convexe, donc étoilé : la forme est fermée, donc exacte. On précise : 1. C’est d(xey − y 2 ). 2. C’est d(xy + ln(xy)). 3. C’est d( x 2 +y 2 ). 2 4. Ici, dω = −2 dx dy 6= 0 . La forme est non fermée et a fortiori non exacte. II.5.25 Les relations de Cauchy-Riemann disent que, pour que f (x, y) soit une fonction C∂f ∂f ′ dérivable de x + iy , il faut, et il suffit, que ∂f ∂y = i ∂x . De plus, dans ce cas, f (z) = ∂x . 1. Écrivant f = P + iQ , la relation ci-dessus entraîne : df = 2. La relation ∂f ∂y ∂f ∂f ∂f ∂d ∂d dx + dy = (dx + i y) = f ′ (z)(dx + i y). ∂x ∂y ∂x ∂y ∂y = i ∂f ∂x dit que cette forme est fermée. L’ouvert étant étoilé, elle est exacte. 3. Si F est telle que dF = f (z)(dx + i dy), d’après la question 1 on a F ′ = f . c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 252 Module II.6 : Fonctions analytiques II.6.2 1. La série de Taylor est P n>0 n an (x − a)n , où an := f (n) (a) · n! On a donc |an | 6 M r et le rayon de convergence est supérieur ou égal à r−1 . 2. D’après la formule de Taylor-Lagrange, le reste RN (x) := f (x) − NP −1 n=0 an (x − a)n est f (N ) (a) (y − a)N pour un certain y compris entre a et x. Si |x − a| < ρ < r−1 , N! on en déduit la majoration |RN (x)| < M (ρr)N , d’où RN (x) → 0 . égal à II.6.4 1. Si f (z) = P bn z n = (z − α) b0 = −αa0 P an z n , alors : et ∀n > 1 , bn = an−1 − αan . Par réxurrence, ou par téléscopage, il s’ensuit immédiatement que b0 + · · · + bn αn = −αn+1 an . (On peut également obtenir cette formule en développant 1 −1 f (z).) Puisque b0 + · · · + bn αn → f (α) 6= 0 , le produit de séries entières α 1 − z/α f (α) on a an ∼ − n+1 , d’où la conclusion. α 2. Soit g(z) := 1 P (z+z0 ) , de sorte qu’avec les notations de l’indication on est bien dans les conditions de la question précédente. On prolonge f en z = α en posant 1 (c’est possible puisque la racine est simple) et l’on utilise le fait que f (α) := P ′ (α 0) 1 1 (n) an = n! P (z0 ). II.6.5 Il est immédiat que les fonctions y1 et y2 de l’indication sont bien des solutions de l’équation et que ce sont des fonctions entières. On peut de plus remarquer que w := y1 y2′ − y2 y1′ est tel que : w′ = y1 y2′′ − y2 y1′′ = −xy1 y2 + xy2 y1 = 0, donc que w est constant égal à w(0) = 1 . Pour en déduire quelque chose sur une solution arbitraire y , on résoud le système y = f1 y1 + f2 y2 , y ′ = f1 y1′ + f2 y2′ en les inconnues f1 , f2 ; c’est possible puisque le déterminant est 1 . En dérivant la première relation, on trouve : y ′ = f1′ y1 + f1 y1′ + f2′ y2 + f2 y2′ = f1′ y1 + f2′ y2 + y ′ =⇒ f1′ y1 + f2′ y2 = 0. De même, en dérivant la deuxième relation : y ′′ = f1 y1′′ + f2 y2′′ + f1′ y1′ + f2 y2′ =⇒ −xy = f1 (−xy1 ) + f2 (−xy2 ) + f1′ y1′ + f2 y2′ =⇒ f1′ y1′ + f2 y2′ = 0. Du système f1′ y1 + f2′ y2 = f1′ y1′ + f2 y2′ = 0 on déduit (le déterminant w étant non nul) que f1′ = f2′ = 0 . Donc y est combinaison linéaire à coefficients constants de y1 et y2 , donc c’est une fonction entière. c Dunod 2014 II.6 : Fonctions analytiques 253 P II.6.8 Si f (z) = an z n , on a par unicité du développement en série entière 2n an = an pour tout n ∈ N donc an = 0 pour tout n ∈ N∗ . II.6.9 1. Le sous-groupe mτ1 + nτ2 m, n ∈ Z de R engendré par τ1 et τ2 est un sousgroupe non trivial du groupe des périodes de R. Si G admet un plus petit élément τ0 > 0 , on voit que tout élément τ du groupe est un multiple entier de τ0 : en effet, on aurait sinon τ ∈ ]mτ0 , (m + 1)τ0 [ pour un m ∈ Z et donc 0 < τ − mτ0 < τ0 ; comme τ − mτ0 ∈ G, cela contredirait la minimalité de τ0 . En écrivant τ1 = m1 τ0 et τ2 = m2 τ0 , on en déduit que τ1 /τ2 = m1 /m2 ∈ Q , contredisant l’hypothèse. Puisque G n’admet pas de plus petit élément strictement positif, il existe une suite strictement décroissante (gn ) d’élements de G ∩ R∗+ de limite inf(G ∩ R∗+ ). La suite des hn := gn − gn+1 ∈ G ∩ R∗+ a pour limite 0 et chaque hn est une période de f . En appliquant le principe des zéros isolés à la fonction h 7→ f (x + h) − f (x), on en déduit que f est constante. Le même argument que celui concernant τ0 ci-dessus montre qu’en fait G est dense dans R. 2. Si τ1 /τ2 = m1 /m2 , posant τ0 := τ1 /m1 = τ2 /m2 , on voit que n’importe quelle fonction de période τ0 satisfait l’hypothèse ; par exemple la fonction analytique non constante e2iπx/τ0 . 1. Il est immédiat que la fonction f de l’énoncé est analytique sur U , que f (0) = 0 Z x 1 dt ′ et que f (z) = · Pour x ∈ ]−1, 1[, on en déduit que f (x) = et l’on 2 2 1−z 0 1−t reconnaît argth. 2. Le raisonnement est le même à ceci près que la fonction g de l’énoncé vériZ x 1 dt fie f ′ (z) = , donc, pour x réel, g(x) = et l’on reconnaît arctan. 2 2 1+z 0 1+t II.6.13 II.6.15 Puisque F est impaire, sa réciproque G l’est aussi : G = w + aw3 + bw5 + O(w7 ). Notant f et g les troncatures de degé 5 , on doit avoir g ◦f (z) ≡ z (mod z 7 ). Or f 3 ≡ z 3 −z 5 et f 5 ≡ z 5 , d’où les équations a − 1/3 = b − a + 1/5 = 0 , d’où a = 1/3 et b = 2/15 . 1 On peut également remarquer que F ′ = , donc que F est le développement en série 1 + z2 de arctan, donc G celui de tan . II.6.16 1. L’identité F n ◦ G = wn donne : X X X wn = am,n Gm = am,n am,n bk,m wk , m>n m>n k>m et l’on conclut par identification des coefficients. Le système obtenu entraîne bn,n = 1/an,n = 1/an1 puis, pour k > n : bk,n = − 1 an,n k−1 X bk,m , m=n ce qui détermine uniquement les bk,n , k > n, par récurrence. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 254 2. 3. 4. II.6.17 2. (F n )′ n est la dérivée de F n−p (pour n > p), donc son résidu en 0 Fp n−p est nul. Le développement en série correspondant n’a donc pas de terme en 1/z , et (F n )′ donc z p+1 = z(F n )′ H p n’a pas de terme en z p , ce qui donne exactement l’annuFp lation demandée. n ′ Si l’on pose b′k,n := ck−n,k , on voit que b′n,n = c0,n = a−n 1 = bn,n , puis que les bk,n k sont solutions du même système que les bk,n en vertu des relations obtenues à la question précédente. Par unicité, on a b′k,n = bk,n . La fonction La conclusion en découle en prenant k = 1 . 1. La fonction f : x 7→ 1/(1 + x2 ) est rationnelle et ne s’annule pas sur I = R, donc y admet un développement en série entière en tout point. Cependant elle a un maximum local en 0 mais n’est pas constante. En fait, sur un voisinage de 0 dans C on n’a plus un maximum local : prendre x = it, t réel. P Le développement en série entière (−1)n x2n n’est valide que pour |x| < 1 , donc n>0 pas sur le plus grand intervalle centré en x0 et contenu dans I = R (à savoir l’intervalle I lui même). En fait, la présence de pôles de f en ±i empêche cette série de converger pour |x| > 1 . II.6.19 2. 3. II.6.21 2. 3. 1. Si f = P an z n , on a a0 = 0 et l’on peut prendre g := P an+1 z n . Si g est constante, f = a1 z donc |a1 | 6 1 et la conclusion s’ensuit ainsi que la suite de l’exercice ; on supposera donc g non constante. Son maximum sur le compact D(0, r) ( 0 < r < 1 ) est donc pris sur la frontière (sinon g aurait un maximum local) donc majoré par 1/r (puisque |f | 6 1 ). En faisant r → 1 , on obtient la conclusion. On a f ′ (0) = g(0), d’où la première égalité en vertu de la question précédente ; la deuxième est conséquence immédiate de cette même question. 1. Puisque |f | → 1 au bord du disque, ses zéros sont inclus dans un disque compact D(0, r), r < 1 , et ils y sont isolés donc en nombre fini. Tous les facteurs sont analytiques et les dénominateurs ne s’annulent pas sur D(0, 1) puisque |aj | < 1 . On trouve la limite voulue en remarquant que : 2 2 z − a 2 |z| + |a| − 2 Re(az) 1 − az = 1 + |z|2 |a|2 − 2 Re(az) , qui tend vers 1 lorsque |z| → 1 . De manière générale, si ϕ est analytique et s’annule en a à l’ordre m, alors ϕ = (z−a)ψ où ψ est analytique et (si m > 2 ) s’annule en a à l’ordre m − 1 . En itérant ce processus on obtient f = g1 h1 , où g1 désigne le numérateur de g et h1 est analytique. La décomposition f = gh s’en déduit facilement. La limite de |h| au bord est 1 parce que c’est vrai de f et de g . c Dunod 2014 II.6 : Fonctions analytiques 255 4. En appliquant l’exercice 11 de la page 790, on voit alors que h est constante. II.6.22 Tout élément z ∈ C s’écrit λ1 τ1 + λ2 τ2 avec λ1 , λ2 ∈ R, donc z = u + τ avec u = u1 τ1 + u2 τ2 , u1 , u2 ∈ [0, 1] et τ = m1 τ1 + m2 τ2 , m1 , m2 ∈ Z (prendre pour mi la partie entière de λi ). On a donc f (z) = f (u), où u est élément du com pact {u1 τ1 + u2 τ2 0 6 u1 , u2 6 1} sur lequel la fonction continue f est bornée : f est donc bornée sur C. On peut donc appliquer le théorème de Liouville. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 256 Module II.7 : Équations différentielles √ II.7.1 Si ẋ ne s’annule pas sur I := ]a, b[, elle y garde un signe constant et x/ E0 réalise un difféomorphisme strictement monotone de classe C 1 de I sur un intervalle ouvert J ⊂ ]−1, +1[. √ Donc u := arcsin(x/ E0 ) réalise un difféomorphisme strictement monotone de classe C 1 √ de I sur un intervalle ouvert K ⊂ ]−π/2, +π/2[. En posant x = E0 sin u , on déduit de l’équation différentielle de départ cos2 u(u̇2 − 1) = 0 . Puisque cos u ne s’annule pas et que u̇ est continue, la conclusion vient. II.7.3 Puisque f et g sont proportionnelles sur chacune des demi-droites ouvertes R∗− et R∗+ , leur wronskien y est nul ; puisque f ′ et g ′ s’annulent en 0 , le wronskien est aussi nul en 0 . II.7.7 La constante y0 := −l/k est une solution bornée. Toute autre solution est de la forme y0 + λekt , λ constante, et ne peut être bornée que si λ = 0 . II.7.8 La méthode de variation des constantes appliquée à l’équation f + f ′ = g donne : Z x −x f (x) = e et g(t)dt + Ce−x , 0 avec C constante. Soit ε > 0 et soit x0 > 0 tel que |g(x)| < ε dès que x > x0 . Alors, pour Z x0 −x x > x0 , on a |f (x)| < M e + ε , où l’on a posé M := |C| + et |g(t)| dt. La conclusion 0 est alors facile. II.7.9 Si par exemple b et d ont un zéro isolé commun, on n’est dans aucun des cas envisagés. II.7.12 On calcule d’abord : Z t 0 X (t) := A(s) ds = 0 0 t2 /2 1 −it/2 0 = it 0 1 0 0 it −1 1 −it/2 0 1 donc : exp Z t A(s) ds 0 0 t2 /2 1 −it/2 1 0 1 = 0 it 0 1 0 eit 0 it 1 it(1 − e )/2 = . 0 eit = On vérifie ensuite que : AX = donc X (t) 6= R(t, 0). c Dunod 2014 0 0 teit ieit 6= X ′ = 0 i/2 + (−i)teit /2 , 0 ieit −1 −it/2 1 II.7 : Équations différentielles II.7.13 Soit B(t) := exp 257 Z t t0 A(s) ds . Alors B(t0 ) = In et B ′ = A. En écrivant B(t) comme une limite de sommes de Riemann, donc de combinaisons linéaires de valeurs A(ti ), on voit que B(t) commute avec toute valeur A(t′ ) (c’est en effet le cas de chaque A(ti )). Donc BB ′ = B ′ B , donc (eB )′ = eB B ′ = B ′ eB . La conclusion est alors immédiate. II.7.14 Puisque B ′ (t) est la limite des (B(t + h) − B(t))/h qui commutent toutes avec B(t), on a bien BB ′ = B ′ B . 0 g Si l’on prend B := , on voit que BB ′ = B ′ B équivaut à l’annulation du wronskien f 0 de f et g ; mais la commutation de toutes les valeurs de B équivaut à la colinéarité de f et g , qui est une condition strictement plus forte (voir par exemple l’exercice II.7.3 de la page 876). II.7.16 Si Z a +∞ kA(t)k dt < ε , alors, pour t1 , t2 > a, on a : kX (t2 ) − X (t1 )k 6 ε max kX k . [a,+∞[ On en déduit d’abord que X est bornée, ensuite (avec le critère de Cauchy) qu’elle admet une limite en +∞. Son déterminant W vérifie W ′ = Tr(A)W . Comme Z +∞ Tr(A(s)) ds 6= 0 (parce que Tr(A) est absolument intégrable), la limite en +∞ exp t0 de X est inversible. II.7.17 Le champ de vecteurs associé est V (x, y) = (y, −x). La condition sur E(x, ẋ) = E(x, y) est y∂E/∂x = −x∂E/∂y . Cela entraîne que E est constante sur toute courbe x2 − y 2 = c (ce sont en fait les courbes intégrales) donc fonction de x2 − y 2 . II.7.18 La solution générale est u = 1 + λex + µe−x . On doit alors résoudre λ + µ = λe + µe−1 = −1 , ce qui donne λ = −1/(1 + e) et µ = −e/(1 + e). II.7.19 On cherche I = α cos(ωt + ϕ) + β sin(ωt + ϕ). Alors : LI¨ + RI˙ + CI = (−αLω 2 + βRω + αC) cos(ωt + ϕ) + (−βLω 2 − αRω + βC) sin(ωt + ϕ), ( α(C − Lω 2 ) + βR = a, d’où le système Si Lω 2 ± Riω + C 6= 0 , ce système ad−αRω + β(C − Lω 2 ) = 0. met une unique solution (α, β) qui donne l’expression de I . Sinon, on doit avoir R = 0 et ω 2 = −C/L et l’on retrouve le phénomène de résonance de l’exercice 6 de la page 814. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 258 II.7.22 On cherche u 6= 0 . L’équation satisfaite par y est y ′′ + (p + 2u′ /u)y ′ + (q + (u′′ + pu′ )/u)y = 0 . On prend donc pour u une primitive logarithmique de −p/2 et l’on a y ′′ + ry = 0 avec r = q − p2 /4 − p′ /2 . 2 II.7.26 L’« énergie » E := f 2 + f′ 2 a pour dérivée −f ′ q ′ /q 2 < 0 , donc décroît strictement, q d’où la conclusion. II.7.27 En posant g(u) := f (eu ), on trouve l’équation g ′′ − g ′ + 5g/4 = 0 . Les racines de l’équation caractéristique sont 1/2 ± i, d’où des solutions de la forme g = eu/2 (a cos u + b sin u), √ d’où f (t) = t(a cos ln t + b sin ln t). Lorsque t → 0+ , la fonction ln t prend toutes les valeurs strictement négatives et en particulier une infinité de valeurs annulant le facteur trigonométrique. II.7.28 En posant Y = eAt Z , on trouve la quadrature Z ′ = e−At B . La condition de périodicité s’écrit Z(t) = eA Z(t + 1). On a : Z t Z t Z 1 −As −A −As Z(t) = Z0 + e B(s) ds =⇒ Z(t+1) = Z0 +e e B(s) ds+ e−As B(s) ds. 0 0 0 (On a pris en compte la périodicité de B .) La condition de périodicité s’écrit alors : Z 1 (In − eA )Z0 = eA e−As B(s) ds. 0 A Puisque 1 n’est pas valeur propre de e , cette équation admet une unique solution Z0 . Z t II.7.32 Soient G(t) := B(s)g(s) ds. On a donc par hypothèse G′ = Bg 6 BA + BG t0 Z t Soit C(t) := exp B(s) ds, de sorte que C ′ = BC et C(0) = 1 . On en déduit que t0 Z t C(t) −1 ′ −1 (C G) 6 C BA. Comme G(t0 ) = 0 , on a G(t) 6 A(s)B(s) ds, puis C(s) t0 g 6 A + G (par hypothèse) qui donne la conclusion. II.7.34 Dans le lemme de Gronwall, prendre ε1 = ε2 et δ > 0 arbitraire, puis faire tendre δ vers 0 . fi+1 = Φ(fi ), où l’on a introduit l’application Φ telle que Z t Φ(f ) : t 7→ 1 + f 2 (s) ds. On vérifie facilement que si 0 < f < g alors 0 < Φ(f ) < Φ(g). II.7.35 On a 0 1 est point fixe de Φ (calcul direct). Puisque f0 = 0 , f1 = 1 et 1−t 1 1 f0 < f1 < , d’où par récurrence fi < fi+1 < · On peut appliquer le théorème de 1−t 1−t convergence monotone pour en déduire que la suite des fn tend vers f tel que Φ(f ) = f . De plus, la fonction t 7→ c Dunod 2014 II.7 : Équations différentielles 259 II.7.37 Pour y − t > O , on a l’équation y ′ = y − t dont la solution générale est fc (t) := 1 + t + Cet . Pour y − t < 0 , on a l’équation y ′ = −y + t, dont la solution générale est gD (t) := t − 1 + De−t . Les fc , C > 0 et les gD , D 6 0 , sont des solutions de notre équations de départ définies sur R. Pour C < 0 et D > 0 , les fonctions fC et gD telles que CD = −1 se recollent au point t0 défini par et0 = D = −1/C pour fournir une solution globale (la solution est égale à fC à gauche et à gD à droite de t0 ). II.7.42 Si la solution n’est pas monotone, quitte à changer x en −x (ainsi que la fonction ϕ), on peut trouver t1 < t2 < t3 dans I tels que x(t1 ), x(t3 ) < x(t2 ). On peut même supposer (grâce au théorème des valeurs intermédiaires) que x(t1 ) = x(t3 ). Soit a compris strictement entre x(t1 ) = x(t3 ) et x(t2 ). Il existe donc t′ , t′′ tels que t1 < t′ < t2 < t′′ < t3 et x(t′ ) = x(t′′ ) = a. On va démontrer que ẋ(t′ ) = ẋ(t′′ ) = 0 . Il sera alors facile (et cette tâche sera laissée au lecteur) d’en déduire une contradiction avec le fait que x(t1 ), x(t3 ) < x(t2 ). Parmi les t′ < t2 tels que x(t′ ) = a, il y en a un plus grand (continuité), notons le u′ . Puisqu’entre u′ et t2 la fonction x ne reprend pas la valeur a, elle ne prend que des valeurs strictement supérieurs à a. Donc ẋ(u′ ) > 0 . Mais ẋ(u′ ) = ϕ(x(u′ )) = ϕ(a) = ϕ(x(t′ )) = ẋ(t′ ). On a donc démontré que ẋ(t′ ) > 0 . De même, en choisissant u′′ > t2 minimum tel que x(u′′ ) = a, on déduit que ẋ(t′′ ) 6 0 . Mais ẋ(t′ ) = ẋ(t′′ ) = ϕ(a). On a donc bien démontré que ẋ(t′ ) = ẋ(t′′ ) = 0 . II.7.43 Soit M un majorant de |ρ̈| sur [a, +∞[. Soient t0 > a et α < 0 tels que ρ̇(t0 ) 6 α . Alors pour t > a tel que |t − tO | 6 |α| /2M , on a |ρ̇(t) − ρ̇(t0 )| 6 |α| /2 , donc ρ̇(t) 6 α/2 < 0 . Cela entraîne en particulier l’inégalité : ρ (t + |α| /2M ) 6 ρ(t0 ) + α |α| /4M. Comme ρ est décroissante positive, elle admet en +∞ une limite l > 0 . Pour tout ε > 0 , il existe b > a tel que ρ(t) < l + ε pour t > b . Prenant en particulier le t0 ci-dessus > b , on déduit de ce qui précède que |α|2 6 4M ε . C’est vrai en particulier en choisissant α := ρ̇(t0 ), ce qui implique : √ ∀t0 > b , |ρ̇(t0 )| 6 4M ε. 1 II.7.44 La formule de Taylor à l’ordre 2 permet d’écrire U (x) = E0 + α(x−x0 )2 +o (x−x0 )2 2 avec α := U ′′ (x0 ) > 0 . Il existe donc une fonction u(x) de classe C 1 telle que √ u(x) = α(x − x0 ) + o(x − x0 ) et que u2 = 2(U − E0 ). Pour x assez proche de x0 , la fonction u est un difféomorphisme de classe C 1 (et tel que u′ (x0 ) = 1 ), donc un changement de variable licite dans le calcul de l’intégrale : Z +cE u′ (t) dt TE = 2 , √ p 2 2 −cE cE α 1 − t /cE r 2(E − E0 ) où cE := ·. Par un nouveau changement de variable (linéaire) : α Z +1 ′ 2 u (scE ) ds √ TE = √ · α −1 1 − s2 c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 260 Puisque u′ (scE ) → 1 uniformément quand E → E0 , la conclusion s’ensuit. L’exercice 38 de 1 la page 869 correspond au cas de base où U (x) = E0 + α(x − x0 )2 . 2 √ II.7.50 Soit f := ρ2 − λ, qui ne s’annule pas (sinon on aurait la solution constante ρ = λ comme conséquence de l’unicité dans le théorème de Cauchy-Lipschitz) donc garde un signe constant. On a f˙ = −2f (f + λ). Si f > 0 , on en déduit que f décroît strictement, donc admet une limite à l’infini pour laquelle la limite de f˙ est 0 (voir l’argument de l’exercice II.7.43). √ Donc ρ → λ, qui signifie un enroulement sur le cycle limite (cercle). Si f < 0 , comme f + λ > 0 , on voit que f croît et l’on a un argument analogue. c Dunod 2014 II.8 : Méthodes numériques 261 Module II.8 : Méthodes numériques II.8.1 On a P j>1 dj b−j 6 P j>1 (b − 1)b−j = 1 avec égalité si, et seulement si, les dj sont tous égaux à b − 1. P Soit y ∈ [0, 1[. L’égalité y = dj b−j équivaut pour tout p > 1 à : j>1 bp y = (d1 bp−1 + · · · + dp ) + X dp+j b−j . j>1 Si y 6∈ Z[1/b], c’est-à-dire si bp y 6∈ N pour tout p, ceci permet de définir d1 , . . . , dp comme les chiffres de l’écriture en base b de ⌊bp y⌋. Il faut vérifier la cohérence, autrement dit qu’en notant d′1 , . . . , d′p+1 les chiffres de l’écriture en base b de ⌊bp+1 y⌋, on a bien di = d′i pour i = 1, . . . , p : mais cela découle de l’encadrement 0 6 ⌊bz⌋ − b⌊z⌋ < b (dont la preuve est laissée au lecteur) appliqué à z := bp y . Si bp y = a ∈ N \ bN, on a deux possibiltés d’écriture : • a = d1 bp−1 +· · ·+dp et tous les dp+j = 0 pour j > 1 (exemple décimal : 1/20 = 0, 05 ). • a − 1 = d1 bp−1 + · · · + dp et tous les dp+j = b − 1 pour j > 1 (exemple décimal : 1/20 = 0, 04999 . . . ). Le programme CAML suivant affiche les n premiers chiffres après la virgule du développement en base b de y ∈ [0, 1[ : let mantisse u = u -. (floor u) ;; let ecrire y b n = let rec aux p u = if (p < n) then (print_int (int_of_float (b *. u)); aux (p+1) (mantisse (b *. u))) in aux 0 y ;; Exemple : # ecrire (sqrt 2. -. 1.) 10. 5;; 41421- : unit = () # ecrire (sqrt 3. -. 1.) 2. 10;; 1011101101- : unit = () # ecrire (1./.121.) 11. 10;; 0100000000- : unit = () II.8.3 1. Premier cas : on veut |c/n| < b−k , i.e. n > cbk . √ 2. Deuxième cas : on veut |c/ n| < b−k , i.e. n > (cbk )2 . k 3. Troisième cas : on veut |c/ ln nn| < b−k , i.e. n > ecb . Donc, convergence de plus en plus lente. II.8.4 On peut penser qu’il s’agit des premières décimales après la virgule lors de l’exécution d’un algorithme itératif et que le dernier nombre écrit a huit décimaes correctes. À chaque étape on c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 262 a gagné une décimale : convergence linéaire. Avec une convergence quadratique, on aurait vu par exemple : 30000000 32000000 32370000 32374658 II.8.6 L’identité mentionnée dans l’indication implique (2p + 1)I2p I2p+1 = π/2 , d’où, avec la formule pour I2p donnée dans la preuve de la proposition 3 de la page 892, la première égalité à démontrer. Comme I2p+1 /I2p → 1 quand p → +∞, on en déduit (toujours avec la même π 42p formule) : = lim et la fraction au membre droit vaut : n→+∞ 2p 2 2 (2p + 1) p 42p (p!)4 (2.4 · · · 2p)4 (2.4 · · · 2p)2 = = , 2 2 2 (2p!) (2p + 1) (2.4 · · · 2p) (1.3 · · · (2p − 1)) (2p + 1) (1.3 · · · (2p − 1))(1.3 · · · (2p + 1)) ce qui était demandé. II.8.7 Voici un programme qui suppose que f (a) < 0 < f (b) : let zero f a b epsilon = let rec aux u v = let w = (u+.v)/.2. in let y = f w in if (y == 0. || v -. u < epsilon) then w else if y < 0. then aux w v else aux u w in aux a b;; Exemple : # let f x = x *. x -. 2.;; val f : float -> float = <fun> # zero f 1. 2. 0.0001;; - : float = 1.414215087890625 √ √ √ II.8.8 On a ici f (0) = 3 > 0 , f ( 2) = −4 2 + 3 < 0 et f ′ = 3x2 − 6 < 0 sur 0, 2 , √ √ f ′′ = 6x > 0 sur 0, 2 . On peut donc poser x0 := 2 et prendre pour xi+1 l’abcisse de l’intersection de la droite reliant (0, f (0)) à (xi , f (xi )) avec l’axe des x : xi+1 := 0.f (xi ) − xi .f (0) 3 = · f (xi ) − f (0) 6 − x2i Voici une programmation de l’itération : let f x = x ** 3. -. 6. *. x +. 3.;; let phi x = 3./.(6. -. (x *. x));; let iter u x = let rec aux p = if p == 0 then x else u (aux (p-1)) in aux ;; c Dunod 2014 II.8 : Méthodes numériques 263 Et les calculs correspondants : # # # # # # # # # # - f : f : f : f : f : f : f : f : f : f : (iter float (iter float (iter float (iter float (iter float (iter float (iter float (iter float (iter float (iter float phi (sqrt 2.) 0) ;; = -2.65685424949238058 phi (sqrt 2.) 1) ;; = -1.07812500000000089 phi (sqrt 2.) 2) ;; = -0.142400262413382883 phi (sqrt 2.) 3) ;; = -0.0142020685584030026 phi (sqrt 2.) 4) ;; = -0.00136734779896441339 phi (sqrt 2.) 5) ;; = -0.000131185213370521581 phi (sqrt 2.) 6) ;; = -1.25818452447745699e-05 phi (sqrt 2.) 7) ;; = -1.20667341141356133e-06 phi (sqrt 2.) 8) ;; = -1.15726761507062292e-07 phi (sqrt 2.) 9) ;; = -1.10988436219372488e-08 √ αt II.8.9 D’abord, ϕ(β) = (1 − t)β + p−1 , ce qui, pour β := p α, donne ϕ(β) = β : on a donc β √ bien un point fixe en β := p α . On veut de plus ϕ′ (β) = 0 . Comme ϕ′ (x) = (1 − t) − (p − 1)αtx−p , on a sans condition ϕ′ (β) = 1 − pt : il faut donc prendre t := 1/p. Pour p = 2 , on retrouve l’algorithme de Babylone. Voici un programme CAML faisant appel à l’itération de ϕ déjà utilisée dans la solution de l’exercice II.8.7 : let racine p alpha n = let q = p -. 1. in let phi x = (q *. x +. (alpha/. (x ** q))) /. p in iter phi 1. n ;; √ Voici le calcul approché de 3 1728 = 12 : # # # # # # racine 3. : float = racine 3. : float = racine 3. : float = racine 3. : float = racine 3. : float = racine 3. 1728. 0 ;; 1. 1728. 1 ;; 576.666666666666629 1728. 2 ;; 384.446176543746105 1728. 3 ;; 256.30134821747555 1728. 4 ;; 170.87633388535582 1728. 5 ;; c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 264 # # # # # # # # # # - : float = 113.937282814706961 racine 3. 1728. 6 ;; : float = 76.0025586798763868 racine 3. 1728. 7 ;; : float = 50.7680887305636475 racine 3. 1728. 8 ;; : float = 34.0688736155918548 racine 3. 1728. 9 ;; : float = 23.2088397386703029 racine 3. 1728. 10 ;; : float = 16.5418993620347088 racine 3. 1728. 11 ;; : float = 13.1329311369366284 racine 3. 1728. 12 ;; : float = 12.0949235432840947 # racine 3. 1728. 13 ;; : float = 12.0007430313207593 racine 3. 1728. 14 ;; : float = 12.0000000460041658 racine 3. 1728. 15 ;; : float = 12. La convergence est lente au début, mais dès qu’on approche la racine exacte, elle est visiblement quadratique. II.8.12 Ici, n = 2 , 1 1 = et f (n+1) ∞ = k24xk∞ = 24 . (n + 1)! 6 Premier cas : ω = x3 − x, kωk∞ = 2 1 √ (atteint en ± √ , erreur théorique égale à 3 3 3 3 1 2 8 . √ .24 = √ ≃ 1, 54 . 6 3 3 3 3 1 1 2 On a L = x et x4 − x2 ∞ = (atteint en ± √ . 4 2 Deuxième cas : ω = x3 − 3x/4 , kωk∞ = 1 1 . .24 = 1 . 6 4 1 1 (atteint en ± , erreur théorique égale à 4 2 9 , correspondant à un maximum relatif atteint en On a L = 3x2 /4 et x4 − 3x2 4∞ = 64 r 3 ± . Mais le véritable maximum est 1/4 , atteint en ±1 . 8 Cependant, à la vue des graphes, globalement, x4 est mieux approché par 3x2 /4 que par x2 sur [−1, 1]. c Dunod 2014 II.8 : Méthodes numériques 265 II.8.14 (i) Par intégration par parties : Z 1 Z 1 ln(α2 + t2 ) dt = t ln(α2 + t2 ) 0 − 0 Z 1 0 1 2t2 dt + t2 α2 2α2 dt + t2 0 1 = ln(1 + α2 ) − 2 + 2α arctan · α Lorsque α → 0+ , la limite de cette expression est −2 , qui est < 2(ln 2 − 1) puisque ln 2 > 0 . (ii) L’encadrement permet d’appliquer le théorème, la conclusion est alors immédiate. = ln(α2 + 1) − 2 + α2 II.8.15 Dire que P (j) (a) = 0 pour j = 0, . . . , µ équivaut à dire que (X − a)µ divise P . Comme les (X − ai )µi sont premiers entre eux deux à deux, la conclusion s’ensuit. Puisque de manière générale la dimension du K -espace vectoriel K[X]/ < P > est deg P P (si P 6= 0 ), on a bien n = µi . L’extension indiquée du lemme 12 de la page 906 est celle-ci : si g (j) (ai ) = 0 pour i = 1, . . . , n et 0 6 j < µi , alors g (N −1) (ξ) = 0 pour un ξ appartenant au plus petit intervalle contenant les ai . La preuve par récurrence repose sur le principe suivant : à chaque dérivation, on gagne n − 1 points d’annulation par Rolle ; et l’on abaisse tous les µi > 0 de 1 . Donc N diminue au total de 1 . On a alors la formule étendant le théorème 7 de la page 906 avec pour ω le P0 ci-dessus, L obtenue par interpolation de Lagrange-Hermite. II.8.17 Le fait que l’ordre est au moins 3 découle de la proposition 22 de la page 924 avec n = 2 . Pour vérifier que l’ordre est exactement 3 , on applique la méthode à x4 avec un seul segment, par exemple [0, 1]. L’intégrale vaut 1/5 , l’approximation de Simpson est 2 1 1 f (0) + f (1/2) + f (1) = 5/24 , donc pas la valeur exacte (mais pas loin). 6 3 6 II.8.18 Avec les notations de la section 4.2.2, on doit calculer les wj := j = 0, . . . , 8 , où lj (s) = 1 8 Z 8 lj (s) ds, 0 \ (s − 0) · · · (s − j) · · · (s − 8) · (j − 0) · · · (j\ − j) · · · (j − 8) Avec l’aide de Maple, on trouve les valeurs suivantes : w0 = w8 = 989/28350, w1 = w7 = 2944/14175, w2 = w6 = −464/14175, w3 = w5 = 5248/14175, w4 = −454/2835. c Dunod 2014 Tout-en-un pour la licence • Niveau 2 • Solution des exercices 266 II.8.20 On veut choisir a0 , a1 , w0 , w1 de telle sorte que : Z b f (t) dt = w0 f (a0 ) + w1 f (a1 ) a pour tous les polynômes f de degré deg f 6 N , ou encore, de manière équivalente, pour tous les monômes f = xn , n 6 N . Prenant N = 3 , on obtient quatre équations en quatre inconnues, ce qui laisse croire à une chance raisonnable de résolution. Quitte à opérer un changement de variable affine, nous supposerons que a = 0 et b = 1 . On est ramené au système : w0 + w1 = 1, w0 a0 + w1 a1 = 1/2, w0 a20 + w1 a21 = 1/3, w0 a30 + w1 a31 = 1/4. p p 1 − 1/3 1 + 1/3 On trouve w0 = w1 = 1/2 , a0 = et a1 = (à transposition près, mais 2 2 nous choisissons naturellement a0 < a1 ). On ne peut pas faire mieux car au degré suivant on devrait avoir w0 a40 + w1 a41 = 1/5 alors que la véritable valeur 7/36 en diffère légèrement. II.8.22 Avec la définition du produit scalaire donnée dans l’indication, on voit que Hn est la matrice de Gram de la famille (1, x, x2 , . . . , xn−1 ). II.8.24 De l’exercice I.3.14 de la page 140 on déduit sue la suite (Dn ) des déterminants est donnée par les conditions initiales D0 = 1 , D1 = 2X et la relation de récurrence Dn = 2XDn−1 − Dn−2 . On a donc Dn = Un (polynômes de Tchebychev). Les valeurs propres λ sont racines de l’équation Un (1 + α−λ 2 ) = 0 , ce sont donc les λk := α + 2 − 2 cos kπ/(n + 1), 1 6 k 6 n. II.8.27 Il faut vérifier que, pour 0 6 r 6 1 , on a : √ 1 − 1 − r2 √ 6 r2 , 1 + 1 − r2 ce que par équivalences logiques évidentes on ramène à ce qui est facile à prouver. p 1 − r2 6 1 − r2 , 1 + r2 II.8.28 De l’identité cos(π − x) = − cos x, on déduit, avec les notations de l’exemple de la page 937, que λn+1−k = −λk . c Dunod 2014