INTRODUCTION À LA THÉORIE DES NOMBRES COURS DE M1 par Laurent Berger Table des matières 1. Corps de nombres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Entiers algébriques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Anneaux de Dedekind. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4. Corps finis et résidus quadratiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Groupes de classes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6. Le premier cas du théorème de Fermat. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7. Formes quadratiques binaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8. Géométrie des nombres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9. Unités. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10. Correspondance de Galois. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11. Corps cyclotomiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12. Lois de réciprocité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13. La fonction ζ de Dedekind. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14. Fonctions L. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Références. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 6 10 12 13 14 19 23 26 28 30 33 36 39 1. Corps de nombres Soit K un corps qui contient Q (par exemple K = R ou C). Un nombre α ∈ K est dit algébrique s’il est racine d’un polynôme à coefficients dans Q. Proposition 1.1. — Si α ∈ K, alors les propriétés suivantes sont équivalentes : 1. α est algébrique ; 2. Q[α] est de dimension finie sur Q ; 3. Q[α] = Q(α). 2 LAURENT BERGER Démonstration. — Montrons que (1) implique (2) ; si α est annulé par P (X), alors Q[α] est un quotient de Q[X]/P (X) et est donc de dimension finie sur Q. Montrons que (2) implique (3) ; si β ∈ Q[α] est non nul, alors la multiplication par β est un endomorphisme injectif de Q[α] qui est alors surjectif comme on est en dimension finie, ce qui fait que tout élément non nul de Q[α] a un inverse et que Q[α] est un corps. Montrons que (3) implique (1) ; on a 1/α ∈ Q[α] et il existe donc R(X) tel que 1/α = R(α) ce qui fait que α est annulé par le polynôme P (X) = XR(X) − 1. Le degré de α est alors défini par deg(α) = dimQ (Q[α]). On déduit de la proposition que si α, β ∈ K sont algébriques, alors α ± β et αβ et α/β le sont aussi. En effet, ils appartiennent tous à Q[α, β] qui est engendré par les αi β j avec 0 ≤ i ≤ deg(α) − 1 et 0 ≤ j ≤ deg(β) − 1. Si α est algébrique, alors Iα = {P (X) ∈ Q[X] tels que P (α) = 0} est un idéal de Q[X] dont on note Pmin,α le générateur unitaire, c’est le polynôme minimal de α. Ce polynôme est irréductible sur Q et il est scindé à racines simples sur C. Son degré est celui de α. L’ensemble des nombres algébriques de C est dénombrable. Le résultat suivant permet de construire des exemples d’éléments de R qui ne sont pas algébriques. Théorème 1.2. — Si α ∈ R est irrationel et algébrique de degré d, alors il existe c > 0 telle que α − p c ≥ d q q pour tous p, q ∈ Z (q 6= 0). Démonstration. — Soit P = m · Pmin,α où m ∈ Z≥1 est tel que P (X) ∈ Z[X]. Si α ∈ R et p, q ∈ Z (q 6= 0), il existe y ∈ [α; p/q] tel que P (α) − P (p/q) = (α − p/q) · P 0 (y). On a P (α) = 0 et P (p/q) ∈ 1/q d · Z \ {0} ce qui fait que |α − p/q| ≥ 1/q d · 1/|P 0 (y)|. Il suffit alors de prendre c = min(1, miny∈[α−1;α+1] 1/|P 0 (y)|). Par exemple, P k≥0 1/2k! n’est pas algébrique. Définition 1.3. — Un corps de nombres est une extension finie K de Q. Son degré noté [K : Q] est la dimension de K sur Q. Le résultat ci-dessous (le théorème de l’élément primitif) va nous simplifier la vie. Théorème 1.4. — Si K est un corps de nombres, alors il existe α ∈ K tel que K = Q(α). INTRODUCTION À LA THÉORIE DES NOMBRES 3 Démonstration. — Comme K est de dimension finie sur Q, il existe α1 , . . . , αk ∈ K tels que K = Q(α1 , . . . , αk ) et pour montrer le théorème, il suffit donc de montrer que si K = Q(x, y), alors il existe z ∈ K tel que K = Q(z). Pour cela, plaçons nous dans une extension de K qui contient les racines x1 = x, x2 , . . . , xr de Pmin,x (X) et les racines y1 = y, y2 , . . . , ys de Pmin,y (X). Comme Q est infini, il existe t ∈ Q tel que xi +tyj 6= x+ty pour tout (i, j) 6= (1, 1) et on pose z = x+ty. Si on pose Q(X) = (X −z +ty1 ) · · · (X −z +tys ), alors Q(X) = (−t)s Pmin,y ((X − z)/(−t)) est à coeffcients dans Q(z) et l’hypothèse faite sur t implique que le pgcd de Q(X) avec Pmin,x (X) est X − x ce qui fait que x ∈ Q(z). On a de même y ∈ Q(z) et donc on a bien Q(x, y) = Q(z). Si L/K est une extension de corps de nombres, alors il existe α ∈ L tel que L = Q(α) et donc a fortiori, L = K(α). Rappelons que C est algébriquement clos. Si K est un corps de nombres, alors un plongement de K dans C est un morphisme de corps σ : K → C. Par le théorème 1.4, il existe α ∈ K tel que K = Q[α] = Q[X]/(Pmin,α (X)) et il existe donc deg(α) plongements distincts de K dans C, donnés par σi (α) = αi où α1 , . . . , αd sont les racines de Pmin,α (X) dans C. Un plongement σ est dit réel si σ(K) ⊂ R et complexe sinon. Dans ce dernier cas, σ et σ sont distincts. Le corps K admet donc r1 plongements réels dans C et r2 paires de plongements complexes conjugués, avec d = r1 + 2r2 . Plus généralement, on a le résultat ci-dessous qui se démontre de la même manière. Proposition 1.5. — Si L/K est une extension de corps de nombres de degré d et si σ : K → C est un plongement, alors il existe d plongements distincts de L dans C dont la restriction à K est σ. Soit K un corps de nombres et x ∈ K et mx : K → K l’application de multiplication par x. C’est un endomorphisme Q-linéaire et on pose TrK/Q (x) = Tr(mx ) et NK/Q (x) = det(mx ). Proposition 1.6. — Si σ1 , . . . , σd sont les plongements de K dans C, alors TrK/Q (x) = σ1 (x) + · · · + σd (x) et NK/Q (x) = σ1 (x) · · · σd (x). Démonstration. — Remarquons que si R(X) ∈ Q[X], alors R(mx ) = mR(x) et donc que le polynôme minimal de l’endomorphisme mx est Pmin,x (X). On en déduit que si K = Q(x), alors mx est diagonalisable à valeurs propres σ1 (x), . . . , σd (x) chacune étant comptée avec multiplicité un ce qui montre la proposition dans ce cas. En général, K est une extension de Q(x) de degré e et K est la somme de e copies de Q(x) stables par mx ce qui fait que TrK/Q (x) = e · TrQ(x)/Q (x) et que NK/Q (x) = (NQ(x)/Q (x))e . Par ailleurs, chaque 4 LAURENT BERGER plongement σi de Q(x) dans C s’étend en e plongements distincts de K dans C, qui prennent la même valeur σi (x) sur x. On en déduit la proposition dans le cas général. On utilise la trace pour définir une forme bilinéaire h·, ·iK : K × K → Q donnée par hx, yiK = TrK/Q (xy). Cette forme est non dégénérée car hx, 1/xiK = [K : Q] 6= 0. Si α1 , . . . , αd sont d éléments de K, alors le discriminant de cette famille est disc(α1 , . . . , αd ) = det(hαi , αj iK ). On a alors : disc(α1 , . . . , αd ) = det(hαi , αj iK ) = det(t (σi (αj ))i,j · (σi (αj ))i,j ) = det((σi (αj ))i,j )2 . En particulier, si (αi ) = M · (βi ) avec M ∈ Md (Q), alors disc(αi ) = det(M )2 disc(βi ). Notons aussi que disc(α1 , . . . , αd ) = 0 si et seulement si α1 , . . . , αd sont liés sur Q. Enfin si K = Q(α), alors : 2 1 σ1 (α) σ1 (αd−1 ) . .. .. disc(1, α, . . . , αd−1 ) = det . ... . .. 1 σd (α) σd (αd−1 ) = Y (σi (α) − σj (α))2 i<j 0 = ± NK/Q Pmin,α (α). 2. Entiers algébriques Si K est un corps de nombres, alors on dit que α ∈ K est entier si Pmin,α (X) ∈ Z[X]. Proposition 2.1. — Si α ∈ K, alors les propriétés suivantes sont équivalentes : 1. α est entier ; 2. il existe P ∈ Z[X] unitaire tel que P (α) = 0 ; 3. Z[α] est un Z-module de type fini. Démonstration. — Le fait que (1) implique (2) est évident et le fait que (2) implique (1) suit du lemme de Gauss : si P (α) = 0, alors Pmin,α (X) divise P (X) et est donc unitaire à coefficients dans Z[X]. Montrons que (2) implique (3) : si P (α) = 0 et si d = deg(P ), alors αd ∈ Z + Zα + · · · + Zαd−1 et par récurrence, on trouve que Z[α] = Z + Zα + · · · + Zαd−1 ce qui montre que Z[α] est de type fini. Montrons enfin que (3) implique (2). Soit x1 , . . . , xn une famille génératrice de Z[α]. Il existe M ∈ Mn (Z) telle que (αxi ) = M · (xi ) ce qui fait que (α Id −M )(xi ) = (0) et donc det(α Id −M ) = 0 ce qui fait que P (α) = 0 avec P (X) = det(X Id −M ) qui est unitaire à coefficients entiers. 5 INTRODUCTION À LA THÉORIE DES NOMBRES En particulier, si α, β ∈ K sont entiers, alors α ± β et αβ le sont aussi. On note OK l’ensemble des entiers de K et c’est donc un anneau. Théorème 2.2. — Si K est un corps de nombres, alors OK est un Z-module libre de rang d = [K : Q]. Démonstration. — Commençons par remarquer que si α ∈ K, alors il existe m ∈ Z tel que mα ∈ OK . En effet, si αn + an−1 αn−1 + · · · + a0 = 0 avec ai ∈ Q, alors en mutlipliant cette relation par mn , on trouve (mα)n + man−1 (mα)n−1 + · · · + mn a0 = 0 et il suffit donc de prendre m tel que mai ∈ Z pour tout i. On déduit de cela qu’il existe des entiers α1 , . . . , αd qui forment une base de K/Q. Si α ∈ OK , on peut donc écrire α = di=1 xi αi avec xi ∈ Q. En appliquant les d plongements σ1 , . . . , σd à cette relation, on trouve : P σ1 (α) σ1 (α1 ) . . . σ1 (αd ) x1 . . .. . , . = . . . σd (α) σd (α1 ) . . . σd (αd ) xd et donc : −1 x1 σ1 (α1 ) . . . σ1 (αd ) . .. . = . . xd σd (α1 ) . . . σd (αd ) σ1 (α) . . . σd (α) σ1 (α1 ) . . . σ1 (αd ) σ1 (α) . . −1 t . . .. = disc(αi ) det((σi (αj ))ij ) · co . σd (α1 ) . . . σd (αd ) σd (α) On déduit de l’équation ci-dessus que disc(αi )xj appartient à OK quel que soit j et donc à Q ∩ OK = Z ce qui fait que l’on a : ⊕dj=1 Z · αj ⊂ OK ⊂ ⊕dj=1 Z · disc(αi )−1 αj et donc OK est bien libre de rang d. Une famille α1 , . . . , αd de OK telle que OK = ⊕di=1 Zαi s’appelle une base entière de K. Le discriminant de K est le discriminant d’une base entière de K. Si (αi ) et (βi ) sont deux bases entières de K, alors on a (αi ) = M · (βi ) avec M ∈ GLd (Z) ce qui fait que disc(αi ) = disc(βi ) et donc que le discriminant de K ne dépend pas du choix de la base entière. Lemme 2.3. — Si α1 , . . . , αd est une famille libre de OK et si disc(αi ) est sans facteur carré, alors α1 , . . . , αd est une base entière de K. 6 LAURENT BERGER Démonstration. — Si (βi ) est une base entière de K, alors il existe M ∈ Md (Z) telle que (αi ) = M · (βi ) et donc disc(αi ) = det(M )2 disc(βi ). Le fait que disc(αi ) est sans facteur carré implique que det(M ) = ±1 et donc que α1 , . . . , αd est une base entière de K. Exemple 2.4. — Si p ≥ 3 est premier, l’anneau des entiers de K = Q(ζp ) est Z[ζp ]. Démonstration. — Soit π = ζp − 1. Le polynôme P (X) = ((1 + X)p − 1)/X annule π et est irréductible par le critère d’Eisenstein ; c’est donc le polynôme minimal de π. On en déduit que [K : Q] = p − 1, que NK/Q (π) = p et que π p−1 ∈ pOK . On calcule NK/Q (P 0 (π)) en écrivant XP (X) = (1 + X)p − 1 et on trouve que disc(1, π, . . . , π p−2 ) = ±pp−2 . Ceci montre que Z[π] ⊂ OK ⊂ p−(p−2) Z[π]. Pour montrer que Z[π] = OK , il faut alors voir que si x ∈ OK vérifie px ∈ Z[π], alors x ∈ Z[π]. Écrivons px = y0 +y1 π+· · ·+yp−2 π p−2 . En multipliant par π p−2 et en utilisant le fait que π p−1 ∈ pOK , on trouve que y0 π p−2 ∈ pOK et en prenant la norme que y0p−1 ∈ pZ ce qui fait que y0 ∈ pZ. On traite les autres yi de la même manière. Lemme 2.5. — Si x ∈ OK est un entier non nul tel que |σ(x)| ≤ 1 pour tout plongement σ : K → C, alors x est une racine de l’unité. Démonstration. — On peut supposer que K = Q(x). Le polynôme Pmin,x (X) annule les Q {σ(x)}σ:K→C et donc σ:K→C (X − σ(x)) = Pmin,x (X) ∈ Z[X]. La théorie des polynômes symétriques implique que P (k) (X) = Q σ:K→C (X − σ(xk )) ∈ Z[X] pour tout k ≥ 1. (k) On a |σ(xk )| ≤ 1 quel que soit k ≥ 1 et les coefficients ai (k) vérifient donc |ai | ≤ d k du polynôme P (k) (X) avec d = [K : Q]. L’ensemble des σ(xk ) avec k ≥ 1 et σ : K → C est donc fini et il existe donc σ : K → C et i et j distincts tels que σ(xi ) = σ(xj ) ce qui fait que x est une racine (i − j)-ième de l’unité. 3. Anneaux de Dedekind Si K est un corps de nombres, alors on cherche à étendre à OK l’arithmétique usuelle sur Z. Cela nous amène à nous poser les questions suivantes : est-ce que OK est un anneau principal ? Que dire de la factorisation dans OK ? √ √ Si K = Q( −5), alors OK = Z[ −5] n’est pas factoriel car : √ √ 6 = 2 × 3 = (1 + −5) × (1 − −5), √ alors que 2 et 3 et 1 ± −5 sont irréductibles. L’idée de Dedekind a été de remplacer les √ éléments de OK par les idéaux de OK . Dans Z[ −5], on a alors : √ √ √ √ 6 = (2, 1 + −5) · (2, 1 − −5) · (3, 1 + −5) · (3, 1 − −5), INTRODUCTION À LA THÉORIE DES NOMBRES 7 et chacun des idéaux ci-dessus est un idéal premier. Un anneau de Dedekind est un anneau A qui satisfait les trois propriétés suivantes : 1. A est intègre et noethérien ; 2. si I est un idéal premier non nul de A, alors I est maximal ; 3. A est intégralement clos (si K = Frac(A) est un corps de nombres, alors A est l’anneau des entiers de K). Proposition 3.1. — Si K est un corps de nombres, alors OK est un anneau de Dedekind. Démonstration. — L’anneau OK est intègre car OK ⊂ K et il est noethérien car c’est un Z-module libre de rang d, ce qui montre le (1). Si I est un idéal, alors il existe m ∈ Z ∩ I non nul (si x ∈ I et P (x) = 0, alors P (0) ∈ Z ∩ I) ce qui fait que OK /I est fini puisque c’est un quotient de (Z/mZ)d . Si I est premier alors OK /I est intègre, et comme un anneau intègre fini est un corps, I est maximal ce qui montre le (2). Enfin le (3) suit de la définition de OK . Un idéal fractionnaire de A est un A-module I ⊂ K tel qu’il existe x ∈ A vérifiant x · I ⊂ A. Comme xI · yJ = xyIJ, le produit de deux idéaux fractionnaires est un idéal fractionnaire. Nous allons montrer que l’ensemble des idéaux fractionnaires non nuls de A forme un groupe. Lemme 3.2. — Si A est un anneau noethérien, alors tout idéal I de A contient un produit d’idéaux premiers. Démonstration. — Rappelons que dans un anneau noethérien A, tout ensemble non vide d’idéaux de A admet un élément maximal. S’il existe un idéal I qui ne contient pas un produit d’idéaux premiers, on peut donc supposer que I est maximal parmi ces idéauxlà ; en particulier, il n’est pas premier et il existe donc r, s ∈ A \ I tels que rs ∈ I. Les idéaux (I, r) et (I, s) contiennent tous les deux un produit d’idéaux premiers et comme (I, r) · (I, s) ⊂ I, on a une contradiction. Lemme 3.3. — Si I est un idéal propre de A, alors il existe λ ∈ K \ A tel que λI ⊂ A. Démonstration. — Soient a ∈ I et p un idéal premier tel que I ⊂ p. Par le lemme précedent appliqué à l’idéal (a), il existe des idéaux premiers p1 , . . . , pr tels que : p1 · · · pr ⊂ (a) ⊂ I ⊂ p 8 LAURENT BERGER et p est alors l’un des pi disons p1 . On peut supposer que r est minimal et donc que p2 · · · pr 6⊂ (a) ce qui fait qu’il existe b ∈ p2 · · · pr tel que b ∈ / (a), c’est-à-dire que λ = b/a ∈ K \ A. Si x ∈ I, alors x ∈ p = p1 et donc bx ∈ p1 · · · pr ⊂ (a) ce qui revient à λx ∈ A. Si I est un idéal fractionnaire de A, on pose I −1 = {x ∈ K tels que xI ⊂ A}. Proposition 3.4. — Si I est un idéal fractionnaire de A, alors I −1 est un idéal fractionnaire de A et I · I −1 = A. Démonstration. — Si y ∈ I ∩A, alors yI −1 ⊂ A et donc I −1 est bien un idéal fractionnaire de A. De plus, cela implique que I ·I −1 est un idéal de A, et il reste à montrer qu’il coïncide avec A. Si ce n’était pas le cas, alors le lemme précédent appliqué à I · I −1 nous fournirait λ ∈ K \ A tel que λI · I −1 ⊂ A et par définition de I −1 cela impliquerait que λI −1 ⊂ I −1 et donc que pour tout n ≥ 1 on aurait λn I −1 ⊂ I −1 . Si x ∈ I −1 , on a alors λn ∈ x−1 y −1 A et donc A[λ] est un A-module libre de type fini ce qui fait que λ ∈ A puisque A est intégralement clos, contradiction. Corollaire 3.5. — L’ensemble des idéaux fractionnaires non nuls de A forme un groupe pour la multiplication, de neutre I = A. Remarquons que si I et X sont deux idéaux de A, alors on peut écrire I = XY avec Y un idéal de A si et seulement si I ⊂ X. Un sens est trivial et si I ⊂ X, alors on pose Y = X −1 I et le fait que I ⊂ X implique que Y ⊂ A. Théorème 3.6. — Tout idéal de A s’écrit d’une et une seule manière comme un produit d’idéaux premiers. Démonstration. — Il faut montrer l’existence et l’unicité de la décomposition. Commençons par l’existence. L’ensemble des idéaux qui ne sont pas un produit d’idéaux premiers admet un élément maximal I ; cet idéal est inclus dans un idéal maximal p et comme I ⊂ p, on peut écrire I = pJ. Comme I ⊂ J, on peut écrire J comme produit d’idéaux premiers J = p1 · · · pr et donc I = pp1 · · · pr . Montrons maintenant l’unicité de la décomposition. Si l’on avait une égalité p1 · · · pr = q1 · · · qs alors p1 · · · pr ⊂ q1 et donc il existe i (disons i = 1 quitte à renuméroter) tel que −1 pi = q1 ce qui fait qu’en multipliant par p−1 1 = q1 on trouve que p2 · · · pr = q2 · · · qs . Ceci permet de conclure par récurrence que r = s et que quitte à réordonner, on a pi = qi pour tout i. 9 INTRODUCTION À LA THÉORIE DES NOMBRES Soit p un nombre premier de Z. Par le théorème 3.6, l’idéal (p) se décompose en un produit pe11 · · · perr où les pi sont des idéaux premiers distincts contenant p et ei ≥ 1. Les idéaux p1 , . . . , pr s’appellent les idéaux premiers de OK au-dessus de p. Comme pi est maximal, OK /pi est un corps de caractéristique p et donc de cardinal pfi où fi ≥ 1. On dit que ei est l’indice de ramification de pi et que fi est le degré d’inertie de pi . Réciproquement, si p est un idéal premier de OK alors p ∩ Z = pZ pour un nombre premier p. Lemme 3.7. — Si p est un idéal premier de OK et e ≥ 1, alors OK /pe est principal. On a card(OK /pe ) = card(OK /p)e . Démonstration. — Les idéaux de OK /pe sont en bijection avec les idéaux de OK qui contiennent pe et sont donc des puissances de p/pe . Soit π ∈ p \ p2 . On a (π) = p · q1 · · · qr avec qi 6= p pour tout i. Comme pe + qi = OK , on a bien (π) = p dans OK /pe . Ceci implique que pk /pk+1 est un OK /p-espace vectoriel de dimension 1, engendré par π k . Le cardinal de OK /pe en suit par dévissage. Corollaire 3.8. — Si pOK = pe11 · · · perr , alors Pr i=1 ei fi = d. Démonstration. — On a card(OK /pOK ) = pd . Par ailleurs, OK /pOK = donc pd = p P ei fi Qr i=1 OK /pei i et par le lemme précédent. La proposition suivante donne un moyen de calculer la décomposition des idéaux premiers si l’anneau des entiers de K est monogène. Proposition 3.9. — Soit K un corps de nombres et α ∈ OK tel que OK = Z[α] et Q(X) le polynôme minimal de α. Si p est un nombre premier, soit Q(X) = Q1 (X)e1 · · · Qr (X)er la décomposition de Q(X) dans Fp [X] où les Qi (X) sont unitaires irréductibles et distincts. Soit Qi (X) ∈ Z[X] unitaire qui se réduit sur Qi (X) et pi = (p, Qi (α)). L’idéal pi est alors premier dans OK , les pi sont distincts, et pOK = pe11 · · · perr . Démonstration. — On a OK /pi = Z[X]/(p, Q(X), Qi (X)) = Fp [X]/Qi (X) qui est un corps car Qi (X) est irréductible. Ceci montre que pi est premier. Par ailleurs pi + pj = (p, Qi (α), Qj (α)) = OK et donc les pi sont premiers entre eux. Enfin soit fi = Q Q card(OK /pi ) = deg(Qi (X)). On a Q(X) = Qi (X)ei +pR(X) ce qui fait que Qi (α)ei ∈ pOK et donc pe11 · · · perr ⊂ pOK . Comme Pr i=1 ei fi = d, cette inclusion est une égalité par le corollaire 3.8. Corollaire 3.10. — Si K est un corps de nombres tel que OK est monogène, et si p est premier, alors p est ramifié dans K si et seulement si p divise disc(K). 10 LAURENT BERGER 0 Démonstration. — On a disc(K) = ± NK/Q Pmin,α (α) = ±res(P, P 0 ) et donc p divise disc(K) si et seulement si Pmin,α (X) a une racine double dans Fp [X]. Ce corollaire est toujours vrai même si OK n’est pas monogène, mais la démonstration est plus technique. 4. Corps finis et résidus quadratiques La décomposition des nombres premiers dans les corps quadratiques demande de savoir quels entiers sont des carrés modulo un nombre premier donné, ce que nous étudions à présent. Dans tout ce chapitre, p est un nombre premier avec p 6= 2. Rappelons que F× p 2 × × est un groupe cyclique de cardinal p − 1. L’application x 7→ x de Fp → Fp a pour noyau {±1} et son image est donc de cardinal (p − 1)/2. Si a ∈ Z, on dit que a est un carré modulo p, ou encore un résidu quadratique modulo p, si l’image de a dans Fp est un carré. On définit une fonction, le symbole de Legendre p divise a, a p = 1 si a est un carré non nul modulo p et a p · p → {0, ±1} par a p = 0 si = −1 si a n’est pas un carré modulo p. Lemme 4.1. — On a a p ≡ a(p−1)/2 mod p. Démonstration. — On a manifestement Le polynôme X p−1 −1 est le produit de X a (p−1)/2 p ≡ a (p−1)/2 mod p si a est un carré modulo p. −1 par X (p−1)/2 +1 et est décomposé dans Fp [X]. Les racines de X (p−1)/2 − 1 sont les carrés non nuls et les racines de X (p−1)/2 + 1 sont donc les non-carrés. Ceci implique que ab p = Exemple 4.2. — On a Démonstration. — On a a p −1 p × b p . = 1 si p = 1 mod 4 et ≡ (−1)(p−1)/2 mod p. −1 p −1 p = −1 si p = 3 mod 4. Le théorème suivant est la célèbre loi de réciprocité quadratique, conjecturée par Euler et Legendre, et démontrée (six fois !) par Gauss (1801). Théorème 4.3. — Si p et q sont deux nombres premiers impairs, alors : p q = q p · (−1) (p−1)(q−1) 4 p2 −1 2 = (−1) 8 . p , et 11 INTRODUCTION À LA THÉORIE DES NOMBRES Démonstration. — Soit ζ = exp(2iπ/p) et a ∈ Z. On se place dans K = Q(ζ). On définit les sommes de Gauss par G(a) = p−1 X G(a)G(−a) = a=0 p−1 X p−1 X a G(1)q − que ∗ p q = k=0 p k p a=0 k,j=0 En particulier, si on pose p∗ = Pp−1 k ak ζ . q · G(1) ∈ qOK et p q p , ce qui implique On voit que G(a) = p−1 X k j ak−aj ζ = p p k,j=0 ! −1 p ! p−1 j X p a p G(1). Par ailleurs, ζ ak−aj = p(p − 1). a=0 p, alors G(1)2 = p∗ et donc (p∗ )(q−1)/2 = G(1)q−1 . On donc G(1) · (p∗ )(q−1)/2 − q p · G(1) ∈ qOK . Ceci montre la première formule puisque −1 p = (−1)(p−1)/2 . La deuxième se démontre de manière similaire : on pose G = ζ8 +ζ87 de sorte que G2 = 2 et 2(p−1)/2 = Gp−1 . On a donc G · 2(p−1)/2 ≡ ζ8p + ζ87p mod p et il sufit alors d’examiner les quatre possibilités pour p mod 8. Le théorème permet de calculer a p en écrivant a = q1 · · · qr et a p = Qr i=1 qi p . Par exemple, 3 19 73 73 16 57 = · = · =1· = 1. 73 73 3 19 19 73 Ce théorème implique aussi que la valeur de ap , quand p varie, p ne divisant pas a, ne dépend que de p modulo a ou 4a. Par exemple, p = 2, 3 mod 5. De même, 3 p 5 p = 1 si p = 1, 4 mod 5 et = 1 si p = 1, 11 mod 12 et 3 p 5 p = −1 si = −1 si p = 5, 7 mod 12. Les résidus quadratiques (et donc aussi les non-résidus) ne peuvent pas s’accumuler en de longues plages, comme le montre l’inégalité de Polya-Vinogradov ci-dessous. Théorème 4.4. — Si a ∈ Z et n ≥ 1, alors a+n X j j=a p < Démonstration. — Rappelons que si G(j) = √ p log(p). Pp−1 k jk ζ , k=1 p alors G(j) = j p G(1). On a p−1 p−1 a+n a+n X p−1 X k X X X k X k a+n j ζ k(n+1) − 1 = G(j) = ζ jk = . G(1) · ζ jk = ζ ka p p p j=a ζk − 1 j=a k=1 p j=a j=a k=1 k=1 √ Rappelons que |G(1)| = p. On a |ζ k(n+1) − 1| ≤ 2 et |ζ k − 1| = 2 sin(kπ/p). Si x ≤ π/2, alors sin(x) ≥ 2/π · x et donc a+n X a+n X j j=a p ! ! p−1 ! p−1 2 2 X k ζ k(n+1) − 1 1 p−1 2 X 1 1 √ √ X =√ ζ ka ≤ ≤ p < p log(p). √ k p k=1 p ζ −1 p k=1 2/π · kπ/p k=1 k ! Le théorème implique que dans tout intervalle [a; a + n] ⊂ [1; p − 1], les nombres R et √ N de résidus et de non-résidus vérifient |R − N | < p log(p). 12 LAURENT BERGER 5. Groupes de classes Notons IK le groupe des idéaux fractionnaires de K et PK le sous-groupe de IK constitué des idéaux fractionnaires principaux. Le groupe de classes de OK est le groupe Cl(OK ) = IK /PK . Le résultat principal de ce chapitre est le suivant : Théorème 5.1. — Le groupe Cl(OK ) est un groupe fini. Ce théorème sera démontré un peu plus tard. Avant cela, nous faisons quelques compléments sur les idéaux de OK . Si f : Zd → Zd est injective et si M est la matrice de f dans une base de Zd , alors Zd /f (Zd ) est fini de cardinal |det(M )|. En appliquant cela à l’endomorphimse mx de OK on trouve que si x ∈ OK alors |NK/Q (x)| = card(OK /(x)). Si I est un idéal de OK alors on pose N(I) = card(OK /I). Lemme 5.2. — Si I et J sont deux idéaux de OK alors N(IJ) = N(I) N(J). Démonstration. — Écrivons I = Q OK /psi i et OK /IJ = Q Q ri pi et J = Q si pi . On a OK /I = Q OK /pri i et OK /J = OK /pri i +si . Par le lemme 3.7, on a card(OK /pe ) = card(OK /p)e . Cela implique le lemme. Si I est un idéal et si a ∈ I vérifie |NK/Q (a)| = N(I), alors I = (a) et donc I est principal. Proposition 5.3. — Il existe une constante G (qui ne dépend que de K) telle que pour tout idéal I de OK , il existe α ∈ I vérifiant |NK/Q (α)| ≤ G · N(I). Démonstration. — Soit α1 , . . . , αd une base de OK et Gi = Pd j=1 |σi (αj )|. Si m ≥ 1, alors l’ensemble {m1 α1 + · · · + md αd } où 0 ≤ mi ≤ m est de cardinal (m + 1)d et si l’on choisit m de manière que md ≤ card(OK /I) < (m + 1)d , alors par le principe des tiroirs il existe α = n1 α1 + · · · + nd αd ∈ I non nul avec |ni | ≤ m. On a |σi (α)| ≤ Gi · m quel que soit i et donc |NK/Q (α)| ≤ G · N(I) avec G = G1 · · · Gd . Une classe d’idéaux est une classe à gauche de PK dans IK . Si C est une classe d’idéaux et I ∈ C −1 est un idéal de OK , alors par la proposition ci-dessus il existe α ∈ I tel que |NK/Q (α)| ≤ G · N(I). Comme (α) ⊂ I, on peut écrire (α) = IJ et donc J est un idéal de OK appartenant à C qui vérifie N(J) ≤ G. Démonstration du théorème 5.1. — Pour terminer la démonstration du théorème 5.1, il faut donc montrer qu’il n’existe qu’un nombre fini d’idéaux I de OK vérifiant N(I) ≤ G puisque les classes de ces idéaux recouvrent Cl(OK ). INTRODUCTION À LA THÉORIE DES NOMBRES 13 Si I est un tel idéal alors par le théorème 3.6, on peut écrire I = pn1 1 · · · pnr r et donc N(I) = N(p1 )n1 · · · N(pr )nr . Si pi est un idéal au-dessus de pi , alors N(pi ) ≥ pi . On a donc pi ≤ G et pour chacun de ces pi l’exposant ni de pi est borné par pni i ≤ G. Ceci achève la démonstration. 6. Le premier cas du théorème de Fermat Soit p un nombre premier impair. Le but de ce chapitre est de montrer le théorème suivant, le premier cas du théorème de Fermat, sous l’hypothèse que p est régulier, c’està-dire que p ne divise pas |Cl(OK )|. Ce théorème est dû à Kummer (1850), et s’inspire d’une démonstration incorrecte de Lamé (1847) (qui supposait implicitement que OK était principal, erreur relevée par Liouville). Théorème 6.1. — Si p ne divise pas |Cl(OK )|, alors l’équation xp + y p = z p n’a pas de solutions en nombres entiers avec p - xyz. Avant de montrer ce théorème, faisons quelques compléments sur le corps K = Q(ω) où ω = exp(2iπ/p). C’est une extension de Q de degré p − 1 et les p − 1 plongements de K dans C sont donnés par ω 7→ ω j avec j = 1, . . . , p − 1. Rappelons que OK = Z[ω] (cf. exemple 2.4). Par la proposition 3.9, le nombre premier p est totalement ramifié dans OK et on a (p) = (ω − 1)p−1 . Si i 6= 0 mod p, alors (ω i − 1)/(ω − 1) est une unité de OK . On note z 7→ z la conjugaison complexe sur C et on pose F = {x ∈ K tels que x = x}. On utilisera plusieurs fois l’observation que si α = α0 + · · · + αp−2 ω p−2 ∈ OK et p , alors αp − m ∈ pOK si m = α0p + · · · + αp−2 × Lemme 6.2. — Si u ∈ OK , alors il existe r ∈ Z et v ∈ OF× tels que u = ω r v. × Démonstration. — Si u ∈ OK , alors u/u est un élément de OK tel que pour tout plongement σ : K → C, on a |σ(u/u)| = 1 et c’est donc une racine de l’unité par le lemme de Kronecker. Par l’observation ci-dessus, il existe m ∈ Z tel que up − m ∈ pOK et donc (u/u)p ∈ 1 + pOK . Comme 1 + pOK est sans torsion, on a (u/u)p = 1 et il existe donc r ∈ Z tel que u/u = ω 2r = ω r /ω −r ce qui implique le lemme. Démonstration du théorème 6.1. — On suppose que p ≥ 5 (la démonstration du théorème de Fermat pour p = 3 est classique). On se donne x, y, z ∈ Z premiers entre eux tels que xp + y p = z p et on suppose que p - xyz. Quitte à remplacer (x, y, z) par (x, −z, −y), on peut de plus supposer que x 6= y mod p. On a (z)p = Qp−1 j=0 (x + yω j ). Montrons que les idéaux (x + yω j ) sont premiers entre eux deux à deux dans OK pour 0 ≤ j ≤ p − 1. On a x + yω j − (x + yω i+j ) = yω j (ω i − 1) et 14 LAURENT BERGER ω i (x + yω j ) − (x + yω i+j ) = x(ω i − 1). L’idéal I engendré par x + yω j et x + yω i+j contient donc x(ω − 1), y(ω − 1) et z p . Comme x, y et z p sont premiers entre eux, I contient ω − 1 et donc p. Comme p - z p , on a I = OK . j Les idéaux (x + yω j ) sont premiers entre eux et (z)p = p−1 j=0 (x + yω ) et donc chacun d’entre eux est une puissance pième. Soit Ij l’idéal tel que Ijp = (x+yω j ). Si p ne divise pas Q |Cl(OK )|, alors Ijp principal implique Ij principal, et on peut donc écrire x + yω j = uj αjp × avec uj ∈ OK et αj ∈ OK . En particulier, on a x + yω = uαp . Par le lemme 6.2, on peut écrire u = ω r v où v ∈ OF× . Par ailleurs, il existe m ∈ Z tel que αp − m ∈ pOK . Ceci implique que ω −r (x + yω) ∈ vm + pOK et en conjuguant que ω r (x + yω −1 ) ∈ vm + pOK aussi. On trouve que xω r + yω r−1 − xω −r − yω 1−r ∈ pOK . Il suffit alors d’examiner les cas, en utilisant le fait que si β = β0 + β1 ω + · · · + βp−1 ω p−1 avec l’un des βi = 0, alors β ∈ pOK si et seulement si p divise tous les βi . Si r 6= 0, 1/2 mod p, alors on trouve que p divise x. Si r = 0, alors p divise y. Si r = 1/2, alors p divise x − y. Les nombres premiers qui ne sont pas réguliers sont 37, 59, 67, 101, 103, 131, 149, . . . √ Siegel conjecture que 1/ e (soit à peu près 60,65%) des nombres premiers sont réguliers, mais on ne sait même pas s’il y en a une infinité. 7. Formes quadratiques binaires Une forme quadratique binaire est une fonction q : Z2 → Z qui est de la forme (x, y) 7→ ax2 + bxy + cy 2 avec a, b, c ∈ Z. Les entiers a, b et c sont alors déterminés par q et on note (a, b, c) pour la forme q. Si n ∈ Z, on dit que q représente n s’il existe (x, y) ∈ Z2 tels que q(x, y) = n (si n = 0, on demande en plus que (x, y) 6= (0, 0)). On dit que q représente n primitivement si en plus on peut prendre x et y premiers entre eux. Le discriminant de q = (a, b, c) est D = disc(q) = b2 − 4ac. On a D ≡ 0, 1 mod 4. Si D ≡ 0 ou 1 mod 4, alors la forme principale qD de discriminant D est (1, 0, −D/4) ou (1, 1, (1 − D)/4). Proposition 7.1. — Soit q une forme quadratique binaire. 1. La forme q représente 0 si et seulement si D est un carré. 2. Tous les entiers représentés par q sont de même signe si et seulement si D ≤ 0. Démonstration. — Si a = 0, alors D = b2 et q(x, y) = y(bx + cy). Le (1) et le (2) sont alors évidents. On suppose donc que a = 6 0. On a 4a · q(x, y) = (2ax + by)2 − y 2 D. Si q(x, y) = 0 avec (x, y) 6= (0, 0), alors y 6= 0 et D = (2ax + by)2 /y 2 est un carré. Si D = z 2 , alors q(x, y) = 0 si 2ax + by = yz. Ceci montre le (1). 15 INTRODUCTION À LA THÉORIE DES NOMBRES Si D ≤ 0, alors les valeurs de q(x, y) ont le même signe que a. Réciproquement, 4a · q(1, 0) = 4a2 > 0 et 4a · q(−b, 2a) = −4a2 D < 0. Ceci montre le (2). Si P ∈ M2 (Z) et x0 y0 = P · ( xy ), alors la fonction (x, y) 7→ q(x0 , y 0 ) est aussi une forme quadratique binaire, notée q ◦P . On a q ◦P R = (q ◦P )◦R et disc(q ◦P ) = disc(q) det(P )2 . On dit que deux formes q1 et q2 sont équivalentes, noté q1 ∼ q2 , s’il existe P ∈ GL2 (Z) + telle que q1 ◦ P = q2 et on dit que q1 et q2 sont proprement équivalentes, noté q1 ∼ q2 , s’il 1 k existe P ∈ SL2 (Z) telle que q1 ◦ P = q2 . Par exemple, via ( 10 −1 0 ) et ( 0 1 ) + + (a, b, c) ∼ (c, −b, a) ∼ (a, b + 2ka, ak 2 + bk + c). 0 Avec ( −1 0 1 ), on trouve que (a, b, c) ∼ (a, −b, c). Deux formes équivalentes représentent les mêmes entiers et ont le même discriminant. Les formes (2, 2, 3) et (1, 0, 5) ont le même discriminant −20 mais ne sont pas équivalentes car la première représente 2 mais pas la seconde. Le problème de savoir quels entiers sont représentés par quelles formes quadratiques a motivé le développement de la théorie, notamment par Lagrange. Rappelons par exemple que les nombres premiers impairs de la forme x2 + y 2 sont exactement ceux qui valent 1 mod 4, et que les entiers n de la forme x2 + y 2 sont donc ceux tels que si p ≡ 3 mod 4 divise n, alors vp (n) est pair. Proposition 7.2. — Si n ∈ Z, alors q représente n primitivement si et seulement s’il + existe b, c ∈ Z tels que q ∼ (n, b, c). Dans ce cas, on peut prendre −|n| < b ≤ |n| si n 6= 0. + Démonstration. — Si q = (n, b, c), alors q(1, 0) = n et donc si q ∼ (n, b, c), alors q représente n primitivement. Supposons à présent que q(x, y) = n avec x ∧ y = 1. Par 0 Bezout, il existe x0 , y 0 tels que xy 0 − x0 y = 1, c’est-à-dire que P = xy xy0 ∈ SL2 (Z). On a (q ◦ P )(1, 0) = q(x, y) = n et donc q ◦ P = (n, ∗, ∗). Le fait que pour tout k ∈ Z, on a + (n, b, c) ∼ (n, b + 2kn, nk 2 + bk + c) permet ensuite de transformer q ◦ P en une forme proprement équivalente avec −|n| < b ≤ |n| si n 6= 0. + Corollaire 7.3. — Une forme q de discriminant D représente 1 ssi q ∼ qD . Démonstration. — Il est immédiat que qD représente 1. Réciproquement, la proposition + 7.2 montre que si q représente 1, alors q ∼ (1, b, c) avec b ∈ {0, 1}. Comme D ≡ b mod 2, b est déterminé puis c = (b2 − D)/4. Corollaire 7.4. — Si n ∈ Z, alors il existe une forme q de discriminant D qui représente n primitivement si et seulement si D est un carré modulo 4n. 16 LAURENT BERGER + Démonstration. — On a q ∼ (n, b, c) et donc D = b2 − 4nc est un carré modulo 4n. Réciproquement, si D est un carré modulo 4n, alors il existe b et c tels que D = b2 −4nc et si q = (n, b, c), alors q(1, 0) = n. Il existe donc une forme quadratique q de discriminant D qui représente n primitivement. Théorème 7.5. — Si p est un nombre premier tel que D est un carré modulo 4p, alors à équivalence ∼ près, p est représenté par une unique forme de discriminant D. Démonstration. — On vient de voir l’existence, montrons l’unicité. Comme dans la preuve de la proposition 7.2, on peut remplacer q par une forme équivalente de telle sorte que |b| ≤ p, et on peut de plus supposer b ≥ 0 si on travaille avec ∼. Notons que b détermine c car c = (b2 − D)/4p. Il ne reste plus qu’à vérifier qu’il n’existe qu’un seul 0 ≤ b ≤ p tel que D ≡ b2 mod 4p. Ce théorème dû à Lagrange pose la question des classes d’équivalence de formes. Théorème 7.6. — Si D 6= 0, alors il n’y a qu’un nombre fini de formes de discriminant + D à équivalence ∼ près. Démonstration. — Supposons que D n’est pas un carré, de sorte que 0 n’est pas représenté par q par la proposition 7.1. Soit alors m > 0 le plus petit entier qui est de la forme |q(x, y)| avec (x, y) 6= (0, 0) et a = ±m la valeur correspondante de q(x, y). Par la + proposition 7.2, on a q ∼ (a, b, c) avec |b| ≤ |a|. Par ailleurs, q(0, 1) = c et donc |a| ≤ |c|. q On en déduit que 4|a|2 ≤ 4|ac| = |b2 − D| ≤ |a|2 + |D| et donc |a| ≤ |D|/3. Comme |b| ≤ |a| et que c est déterminé par a, b et D, le théorème suit. Si D = b2 est un carré avec b ≥ 1, alors on montre qu’il existe 0 ≤ c ≤ b − 1 tel que + q ∼ (0, b, c). Si D < 0, le théorème de Gauss ci-dessous permet de simplifier le calcul de l’ensemble + des classes d’équivalence pour ∼. Disons que la forme positive (a, b, c) est réduite si −a < b ≤ a ≤ c, avec b ≥ 0 si a = c. + Théorème 7.7. — Si D < 0, alors toute forme quadratique positive est ∼ à une unique forme réduite. Démonstration. — Soit a comme dans la démonstration du théorème de Lagrange. La + proposition 7.2, et le fait que (a, b, a) ∼ (a, −b, a), impliquent que toute forme positive de discriminant D < 0 est équivalente à une forme réduite (a, b, c). Il faut donc vérifier l’unicité. INTRODUCTION À LA THÉORIE DES NOMBRES 17 Lemme 7.8. — Si q = (a, b, c) est positive et réduite, alors a est le plus petit entier primitivement représenté par q. De plus, 1. si a < c, alors a = q(x, y) ssi (x, y) = (±1, 0) et c est le deuxième plus petit entier primitivement représenté par q. Dans ce cas, c = q(x, y) pour deux vecteurs primitifs (x, y), sauf si b = a auquel cas il y en a quatre ; 2. si a = c, alors a = q(x, y) pour quatre vecteurs primitifs (x, y), sauf si b = a auquel cas il y en a six. Démonstration. — Si q est réduite, alors |D| = 4ac−b2 ≥ 3ac. Rappelons que 4a·q(x, y) = (2ax + by)2 + y 2 |D|. 1. Si |y| ≥ 2, alors 4a · q(x, y) ≥ 4|D| ≥ 12ac et donc q(x, y) ≥ 3c. 2. Si y = ±1, alors |2ax + by| ≥ b car |b| ≤ |a| et donc 4a · q(x, y) ≥ b2 + 4ac − b2 ≥ 4ac et q(x, y) ≥ c, avec égalité pour x = 0 si a 6= b et pour x = 0 et x = −y si a = b. 3. Si y = 0, alors q(x, y) = ax2 et q(x, y) = a ssi x = ±1. On montre le lemme en examinant les cas ci-dessus. Revenons à la démonstration du théorème, en remarquant que deux formes équivalentes représentent primitivement les mêmes entiers le même nombre de fois. Si q = (a, b, c) et q 0 = (a0 , b0 , c0 ) sont positives réduites et équivalentes, alors a = a0 . Si a est représenté deux fois, alors c = c0 est le deuxième plus petit entier primitivement représenté par q. Sinon, a = c et donc a0 = c0 ce qui fait que c = c0 aussi. Comme D = D0 , on a b0 = ±b. Si a = c, alors b0 , b ≥ 0 et donc b0 = b. Si a 6= c, alors le (1) du lemme 7.8 montre que a = b si et seulement si a0 = b0 . Supposons donc que a 6= b et donc que a et c sont chacun représentés primitivement exactement deux fois, par (±1, 0) et par (0, ±1). La matrice P ∈ SL2 (Z) qui envoie q sur q 0 doit donc envoyer 0 {(±1, 0)} sur lui-même et {(0, ±1)} sur lui-même ce qui fait que P = ±1 et donc 0 ±1 P = ± Id puisque det(P ) = 1. + On note Cl(D) l’ensemble des classes de formes de discriminant D pour la relation ∼ (si D < 0, on ne considère que les formes positives, c’est à dire telles que q(Z2 ) ⊂ Z≥0 ). Si D < 0, le théorème 7.7 et la démonstration du théorème 7.6 donnent un moyen facile q de calculer Cl(D) : pour tout b ∈ Z, tel que |b| ≤ −D/3 et b ≡ D mod 2, on écrit les triplets (a, b, c) tels que 4ac = b2 − D avec |b| ≤ a ≤ c. L’ensemble des tels triplets (a, b, c) qui sont en plus réduits forme un système de représentants de Cl(D). Exemple 7.9. — Si D ∈ {−3, −4, −7, −8, −11, −12}, alors h(D) = 1 et h(−15) = 2. 18 LAURENT BERGER 1. La forme x2 + y 2 a pour discriminant −4 et c’est la seule à équivalence près. Le théorème de Lagrange nous dit que tout nombre premier tel que −4 est un carré modulo p est de la forme x2 + y 2 . 2. Si D = −20, alors il y a deux formes réduites (2, 2, 3) et (1, 0, 5). On trouve donc que tout nombre premier p tel que −20 est un carré modulo p est de la forme 2x2 + 2xy + 3y 2 ou (exclusif) x2 + 5y 2 . En fait, si p = x2 + 5y 2 , alors p est un carré modulo 5. Si p = 2x2 + 2xy + 3y 2 , alors 2p = 4x2 + 4xy + 6y 2 = (2x + y)2 + 5y 2 et donc p n’est pas un carré modulo 5. Ce phénomène est un cas particulier de la théorie du genre pour les formes quadratiques. Nous allons maintenant voir qu’il y a un lien fort avec la théorie des classes d’idéaux dans les corps quadratiques. Pour simplifier, nous considérons des corps quadratiques imaginaires. Soit donc K un corps quadratique imaginaire de discriminant D. On a OK = √ √ Z⊕Zα ⊂ C avec α = D/2 ou (1+ D)/2 selon que D ≡ 0 ou 1 mod 4. Si I est un idéal non nul de OK , alors c’est un Z-module libre de rang 2 et il admet donc une base u, v. Si l’on écrit u = u1 + αuα et v = v1 + αvα , on peut supposer (quitte à remplacer v par −v) que u, v est une base directe de I par rapport à 1, α, c’est-à-dire que u1 vα − uα v1 > 0. On définit alors une fonction qu,v sur Z2 par qu,v (x, y) = NK/Q (ux + vy)/ N(I). Le théorème ci-dessous est dû à Dedekind. Théorème 7.10. — La fonction qu,v est une forme quadratique binaire positive de discriminant D, la classe de qu,v dans Cl(D) ne dépend que de la classe de I dans Cl(OK ), et l’application I 7→ q u,v donne une bijection entre Cl(OK ) et Cl(D). Démonstration. — La fonction qu,v est de la forme ax2 + bxy + cy 2 avec a, b, c ∈ Q. Si x, y ∈ Z, alors z = ux + vy ∈ I et on peut écrire (z) = IJ. On a donc q(x, y) = N((z))/ N(I) = N(J) ∈ Z≥0 , et qu,v est donc une forme quadratique binaire positive. Notons que q1,α = qD et que cette forme est bien de discriminant D. Si (u, v) est une base de I et si P est la matrice de (u, v) dans la base (1, α), alors qu,v = (q1,α ◦ P )/N (I) et det(P ) = N (I) ce qui fait que disc(qu,v ) = D. Montrons que la classe de qu,v ne dépend que de la classe de I. Si s, t est une autre base directe de I, alors il existe P ∈ SL2 (Z) telle que ( st ) = P ( uv ) et alors qs,t = qu,v ◦ P . Enfin si I 0 = zI avec z ∈ K × est un idéal de OK , alors zu, zv est une base directe de I 0 et qzu,zv (x, y) = N(xzu + yzv)/ N(zI) = NK/Q (xu + yv)/ N(I) = qu,v (x, y) et donc en fait qzu,zv = qu,v . Définissons à présent une application de Cl(D) → Cl(OK ). Si q = (a, b, c) est une forme quadratique binaire positive de discriminant D, alors a > 0 car q est positive. On voit INTRODUCTION À LA THÉORIE DES NOMBRES que q(x, y) = a · NK/Q (x + τ y) où τ = (b + √ 19 D)/2a est déterminé par cette formule et le fait que 1, τ est directe. On a aτ ∈ α + Z de sorte que OK = Z ⊕ aτ Z. Posons Iq = aZ ⊕ aτ Z. Comme (aτ )2 = b(aτ ) − ac, Iq est un idéal de OK . On a OK /Iq = Z/aZ de sorte que N(Iq ) = a et donc q = qa,aτ . De plus, la base a, aτ est directe. Si q 0 = q ◦ P avec P = ge fh ∈ SL2 (Z), alors q 0 (x, y) = a · NK/Q ((ex + f y) + τ (gx + hy)) = a · NK/Q (x(e + τ g) + y(f + τ h)) = a0 · NK/Q (x + τ 0 y), où a0 = a · NK/Q (e + τ g) et τ 0 = (f + hτ )/(e + gτ ). On a alors Iq0 = a0 Z ⊕ a0 τ 0 Z, la base a0 , a0 τ 0 de Iq0 est directe, et (e + gτ )Iq0 = (e + gτ )a0 Z ⊕ a0 (e + gτ )τ 0 Z = (e + gτ )a0 Z ⊕ (f + hτ )a0 Z = a0 (Z ⊕ τ Z), ce qui fait que Iq et Iq0 ont même image dans Cl(OK ). L’application q 7→ Iq passe bien au quotient. Pour terminer la démonstration du théorème, il suffit de vérifier que I 7→ q u,v et q 7→ I q sont bien inverses l’une de l’autre. Corollaire 7.11. — Si K est un corps quadratique imaginaire de discriminant D, les √ idéaux a · Z ⊕ (b + D)/2 · Z, où (a, b, c) parcourt l’ensemble des formes réduites positives de discriminant D, sont un système de représentants de Cl(OK ). Remarquons que le théorème 7.10 implique que Cl(D) admet une structure naturelle de groupe. On peut définir la notion de composition de deux formes quadratiques, et retrouver ainsi cette structure sur Cl(D). Si l’on suppose à présent que K est un corps quadratique réel, alors on obtient presque le même résultat. Disons que deux idéaux I et J de OK sont strictement équivalents si I = αJ avec α ∈ K × vérifiant N(α) > 0 et soit Cl+ (OK ) l’ensemble des classes d’équivalence stricte d’idéaux. On a alors une surjection Cl+ (OK ) → Cl(OK ) dont le noyau est Z/2Z ou {1} et le théorème 7.10 devient une bijection entre Cl+ (OK ) et Cl(D). 8. Géométrie des nombres Afin de déterminer efficacement le groupe de classes d’un corps de nombres K, on a besoin de connaître la proposition 5.3 avec une constante G aussi petite que possible, c’est l’objet de la théorie de Minkowski. Si G est un sous-groupe de Rn , on dit que G est discret si quelle que soit la partie bornée B de Rn , l’ensemble G ∩ B est fini. Dans ce cas, il existe h1 , . . . , hr ∈ G linéairement 20 LAURENT BERGER indépendants dans Rn tels que G = ⊕ri=1 Zhi . Rappelons en passant que si G est un sousgroupe fermé de R, alors il existe un sous-espace vectoriel V de Rn et un sous-groupe discret H de Rn tels que G = V ⊕ H. Un réseau de Rn est un sous-groupe discret de Rn qui est de rang r = n. Dans la suite, on fixe la base canonique e1 , . . . , en de Rn . Si Λ = ⊕ni=1 Z`i est un réseau de Rn , le volume de Λ est vol(Λ) = |det(M )| où M est la matrice des (`i ) dans la base (ei ) ; cette définition ne dépend pas du choix de la base (`i ) et vol(Λ) est le volume d’un domaine fondamental de Λ. Lemme 8.1. — Si M est une partie mesurable de Rn telle que vol(M ) > vol(Λ), alors il existe deux points distincts m1 et m2 de M tels que m1 − m2 ∈ Λ. Démonstration. — Le tore Rn /Λ est muni d’une mesure de mesure totale vol(Λ) et si la projection naturelle π : Rn → Rn /Λ était injective sur M , on aurait vol(M ) ≤ vol(Λ). On déduit de cela le théorème de Minkowski ci-dessous. Théorème 8.2. — Si Λ est un réseau de Rn et si C ⊂ Rn est une partie convexe et symétrique par rapport à l’origine de volume vol(C) > 2n vol(Λ), alors il existe ` 6= 0 appartenant à C ∩ Λ. Si on suppose en plus que C est compact, alors il suffit que vol(C) ≥ 2n vol(Λ). Démonstration. — Le lemme 8.1 appliqué à M = 1/2 · C, nous donne c1 6= c2 ∈ C tels que 1/2 · (c1 − c2 ) ∈ Λ. Comme C est convexe et symétrique par rapport à l’origine, 1/2 · (c1 − c2 ) ∈ C ce qui montre le premier résultat. Le deuxième se déduit par compacité du premier appliqué à C + B(0, ε) avec ε → 0 (utiliser le fait que Λ \ {0} est fermé). Revenons à présent à un corps de nombres K, dont on note σ1 , . . . , σd les plongements dans C, ordonnés comme suit : les plongements réels sont σ1 , . . . , σr1 et les plongements complexes sont σr1 +1 , . . . , σr1 +r2 , σ r1 +1 , . . . , σ r1 +r2 . On identifie C à R2 et on définit une application σ : K → Rd par : σ(x) = (σ1 (x), . . . , σr1 (x), Re(σr1 +1 (x)), Im(σr1 +1 (x)), . . . , Re(σr1 +r2 (x)), Im(σr1 +r2 (x))) . C’est clairement une application injective. Lemme 8.3. — L’image de OK par l’application σ ci-dessus est un réseau de Rd dont le volume est : 1 q vol(σ(OK )) = r2 |disc(K)|. 2 21 INTRODUCTION À LA THÉORIE DES NOMBRES Démonstration. — L’image G de OK par σ est un sous-groupe et si x ∈ G ∩ B(0, 1/2), alors |σi (x)| < 1 pour tout i et donc |NK/Q (x)| < 1 ce qui fait que x = 0. On en déduit que G ∩ B est fini pour toute partie bornée B et donc que G est discret. Comme σ : OK → G est un isomorphisme, G est de rang d et est bien un réseau de Rd . Si α1 , . . . , αd est une base de OK sur Z, alors σ(OK ) a une base dont la matrice est : σ1 (α1 ) . . . . . . σ1 (αd ) . . . σr1 (α1 ) Re(σr1 +1 (α1 )) Im(σr1 +1 (α1 )) . . . .. .. .. . . . σr1 (αd ) Re(σr1 +1 (αd )) Im(σr1 +1 (αd )) . . . Im(σr1 +r2 (α1 )) .. , . Im(σr1 +r2 (αd )) et cette matrice s’obtient à partir de la matrice (σi (αj ))i,j en faisant r2 opérations du type (Cj , Ck ) 7→ (1/2 · (Cj + Ck ), 1/2i · (Cj − Ck )) ce qui montre la formule puisque det(σi (αj ))2i,j = disc(K). Corollaire 8.4. — Si I est un idéal de OK , alors σ(I) est un réseau de Rd dont le q volume est vol(σ(I)) = 2−r2 |disc(K)| N(I). Si v ∈ Rd , notons le v = (w1 , . . . , wr1 , x1 , y1 , . . . , xr2 , yr2 ) et notons par ailleurs N(v) = Qr1 i=1 |wi | · Qr2 2 2 i=1 (xi + yi ) ce qui fait que si x ∈ K, alors N(σ(x)) = |NK/Q (x)|. Considérons l’ensemble A défini par : A = {(w1 , . . . , wr1 , x1 , y1 , . . . , xr2 , yr2 ) ∈ Rd , q q |w1 | + · · · + |wr1 | + 2 x21 + y12 + · · · + 2 x2r2 + yr22 ≤ d}. Cet ensemble est manifestement un convexe compact symétrique par rapport à l’origine et si a ∈ A, alors l’inégalité de moyennes arithmétiques-géométriques nous donne que N(a) ≤ 1. Proposition 8.5. — Si A est l’ensemble défini ci-dessus, alors on a : dd r 1 π r2 ·2 · . d! 2 Démonstration. — La démonstration se fait par récurrence sur r1 et r2 . On note : vol(A) = Ar,s = {(w1 , . . . , wr , x1 , y1 , . . . , xs , ys ) ∈ Rr+2s , q q |w1 | + · · · + |wr | + 2 x21 + y12 + · · · + 2 x2s + ys2 ≤ 1}. Si l’on fixe t ∈ [−1; 1], alors Ar,s ∩ {w1 = t} = {(t, (1 − |t|)Ar−1,s )}. On en déduit que : Z 1 2 vol(Ar,s ) = 2 vol(Ar−1,s )(1 − t)r+2s−1 dt = vol(Ar−1,s ). r + 2s 0 De même si ρ ≤ 1, alors on a : ρ ρ 2 2 2 Ar,s ∩ {x1 + y1 = (ρ/2) } = cos(θ), sin(θ), (1 − ρ)Ar,s−1 , 2 2 22 LAURENT BERGER et donc : vol(Ar,s ) = Z 1Z 2π 0 0 ρ π vol(Ar,s−1 )(1 − ρ)r+2s−2 dθdρ = vol(Ar,s−1 ). 4 2(r + 2s)(r + 2s − 1) Ceci permet de montrer par récurrence que vol(Ar,s ) = 2r (π/2)s /(r+2s)! et la proposition suit alors du fait que A = d · Ar1 ,r2 . Ceci nous permet de préciser la proposition 5.3. Théorème 8.6. — Si K est un corps de nombres et si I est un idéal de OK , alors il existe α ∈ I vérifiant |NK/Q (α)| ≤ G · N(I) avec : G= d! dd r2 q 4 π |disc(K)|. Démonstration. — Posons : C= !1/d 2r1 +r2 q · |disc(K)| · N(I) · A, vol(A) ce qui fait que C est un convexe compact symétrique par rapport à l’origine qui vérifie vol(C) = 2d vol(σ(I)) par le corollaire 8.4. Le théorème 8.2 nous fournit alors x ∈ C ∩σ(I) non nul, c’est-à-dire un élément α = σ −1 (x) ∈ I tel que : N(α) ≤ 2r1 +r2 q · |disc(K)| · N(I) = G · N(I), vol(A) la dernière égalité résultant de la proposition 8.5. Corollaire 8.7. — Si K est un corps de nombres différent de Q, alors |disc(K)| ≥ 2. Démonstration. — On a forcément G ≥ 1 et donc : dd π r2 dd π d/2 . |disc(K)| ≥ ≥ d! 4 d! 4 Il reste à montrer que cette fonction est > 1 si d ≥ 2, c’est un exercice d’analyse réelle. q Application : le théorème de Rabinowitz (1913). Théorème 8.8. — Si q ≥ 2 et 4q −1 est sans facteurs carrés, alors a2 +a+q est premier √ pour tout 0 ≤ a ≤ q − 2 si et seulement si le corps K = Q( 1 − 4q) est de nombre de classes égal à 1 Démonstration. — Soit f (X) = X 2 + X + q. On pose θ = (1 + √ 1 − 4q)/2 de sorte que OK = Z ⊕ Z · θ. Commençons par deux observations : 1. Si x, y ∈ Q, alors N(x + θy) = x2 + xy + qy 2 = (x + y/2)2 + y 2 (q − 1/4). On en déduit que si z ∈ OK et p = N(z) est premier, alors p ≥ q. INTRODUCTION À LA THÉORIE DES NOMBRES 23 2. Soit 0 ≤ a ≤ q − 2 tel que f (a) est composé. On a f (a) ≤ (q − 1)2 + 1, et il existe donc p premier tel que p ≤ q − 1 et f (a) = 0 mod p. Montrons tout d’abord que si OK est principal, alors a2 + a + q est premier pour tout 0 ≤ a ≤ q − 2. Si ce n’est pas le cas, soit p ≤ q − 1 divisant f (a) = N(a + θ) comme ci-dessus. L’idéal (p, a + θ) de OK est principal, et donc engendré par π ∈ OK . L’idéal (p, a + θ) est propre (si 1 = px + (a + θ)y, alors en multipliant par a + θ, on voit que p divise a + θ) et il contient strictement (p) car on ne peut pas écrire a + θ = p(x + yθ), ce qui fait que N(π) = p. On a vu au (1) que N(π) ≥ q. C’est donc que a2 + a + q est premier pour tout 0 ≤ a ≤ q − 2. On suppose désormais que a2 +a+q est premier pour tout 0 ≤ a ≤ q−2. Si 2 ≤ p ≤ q−1 est un nombre premier et 0 ≤ a ≤ p − 1 ≤ q − 2, alors p ne peut pas diviser f (a) car sinon, comme f (a) est premier, on aurait p = f (a) ≥ q (par le (1)). L’image de f (X) dans Fp [X] est donc irréductible. On en déduit que p est inerte dans K pour tout p ≤ q − 1. √ Comme G = (2/π) · 4q − 1, on a bGc ≤ q − 1 si q ≥ 2 et OK est principal. Ceci se produit pour q ∈ {2, 3, 5, 11, 17, 41}. Ces nombres s’appellent les “nombres √ chanceux d’Euler”. Pour une discussion des d < 0 tels que h(Q( d)) = 1, voir le §20.6 de [IR]. 9. Unités Dans les chapitres précédents, on a donné une réponse à la question de la factorisation dans OK : tout idéal est un produit d’idéaux premiers et le groupe de classes de OK × est fini. Dans ce chapitre, nous déterminons OK . Si on note µK l’ensemble des racines de l’unité contenues dans K, alors µK est un groupe fini (cf. ci-dessous) qui est le sous× × groupe de torsion de OK et le théorème de Dirichlet dit que OK /µK ' Zr1 +r2 −1 . Afin × de montrer ce théorème, nous utilisons l’application Log : OK → Rr1 +r2 donnée par la formule : Log(x) = (log |σ1 (x)|, . . . , log |σr1 (x)|, 2 log |σr1 +1 (x)|, . . . , 2 log |σr1 +r2 (x)|), où les plongement σi sont rangés comme au chapitre précédent. Le lemme 2.5 implique immédiatement que le noyau de l’application Log est le groupe × µK . Si x ∈ OK , alors NK/Q (x) = ±1 et donc l’image de Log est contenue dans l’hyperplan 1 +r2 H de Rr1 +r2 constitué des vecteurs (xi )i tels que ri=1 xi = 0. Si c ≥ 0 et Log(x) ∈ H ∩ B(0, c), alors |σi (x)| ≤ C = exp(c) et donc il n’y a qu’un P nombre fini de possibilités pour x par le lemme 8.3 selon lequel σ(OK ) est un sous-groupe 24 LAURENT BERGER discret de Rd . En appliquant cela à c = 0, on trouve que µK est fini et avec c > 0 on × trouve que l’image de OK par Log est un sous-groupe discret de H. Lemme 9.1. — Si 1 ≤ k ≤ r1 + r2 et si α ∈ OK \ {0}, alors il existe β ∈ OK \ {0} tel que : |NK/Q (β)| ≤ r2 q 2 |disc(K)| π et tel que log |σi (β)| < log |σi (α)| quel que soit i 6= k. Démonstration. — Soit ai = log |σi (α)| et soit Rr1 +2r2 = {(wi , xi , yi )} comme au chapitre précédent et E l’ensemble des vecteurs de Rr1 +2r2 qui vérifient |wj | ≤ exp(aj )/2 et |x2j + yj2 | ≤ exp(aj )/2 pour tout j 6= k et en j = k la valeur absolue correspondante q est ≤ (2/π)r2 |disc(K)|/ j6=k (exp(aj )/2). L’ensemble E est un convexe compact symétrique de volume 2d vol(σ(OK )) et par le théorème 8.2 il existe β non nul appartenant à Q σ(OK ) ∩ E. Corollaire 9.2. — Si 1 ≤ k ≤ r1 + r2 alors il existe une unité uk telle que log |σi (uk )| < 0 pour tout i 6= k. Démonstration. — On choisit α0 ∈ OK \ {0} et on applique le lemme 9.1 à répétition pour trouver une suite {αi }i≥0 . Comme la norme des αj est bornée indépendamment de j, il n’y a qu’un nombre fini de possibilités pour les idéaux (αj ) et il existe donc j ≥ 0 et ` ≥ 1 tels que αj+` /αj est une unité. On peut alors prendre uk = αj+` /αj . × Théorème 9.3. — L’image de OK par l’application Log est un réseau de l’hyperplan H de Rr1 +r2 . × Démonstration. — On a déjà vu que l’image de OK par l’application Log est un sous- groupe discret de H. Le corollaire 9.2 nous fournit r1 + r2 unités u1 , . . . , ur1 +r2 telles que si l’on écrit la matrice des Log(ui ) on trouve les signes suivants : ⊕ ... ⊕ . . . . .. .. . . . . ... ⊕ De plus, les lignes de cette matrice sont toutes de somme nulle. C’est un exercice d’algèbre × linéaire de montrer qu’une telle matrice est de rang r1 + r2 − 1. Le groupe Log(OK ) est donc un sous-groupe discret de H qui en contient une base, c’est-à-dire un réseau. × Si u1 , . . . , ur1 +r2 −1 sont tels que les Log(ui ) forment une base de Log(OK ), alors le déterminant d’un mineur r1 + r2 − 1 × r1 + r2 − 1 de la matrice des Log(ui ) ne dépend INTRODUCTION À LA THÉORIE DES NOMBRES 25 pas du choix du mineur ni de celui de la base et sa valeur absolue s’appelle le régulateur de K noté RK . × Proposition 9.4. — On a vol(Log(OK )) = √ r1 + r2 · RK . Démonstration. — Les Log(ui ) sont r1 + r2 − 1 vecteurs de somme des composantes nulle √ √ dans Rr1 +r2 et le vecteur de composantes constantes v = (1/ r1 + r2 . . . 1/ r1 + r2 ) est de norme 1 et orthogonal aux Log(ui ) ce qui fait que : × vol(Log(OK )) = |det| v Log(u1 ) .. . . Log(ur1 +r2 −1 ) Il suffit alors de remplacer l’une des colonnes par la somme de toutes les colonnes. Application : l’équation de Pell-Fermat. Si d > 0 est sqf et d ≡ 2, 3 mod 4 et K = √ √ √ √ Q( d), alors OK = Z[ d]. On a NK/Q (x + y d) = x2 − dy 2 et si z = x + y d est une unité, alors NK/Q (z) = ±1. Le théorème 9.3 implique donc qu’il existe toujours une solution à l’équation x2 − dy 2 = 1, et ces solutions sont toutes de la forme (x, y) avec √ √ √ x + y d = (x0 + y0 d)n où x0 + y0 d est une unité fondamentale ou son carré (selon que sa norme est 1 ou −1). √ Pour trouver les unités fondamentales de Z[ d], on utilise les fractions continues. Si {ai }i≥0 est une suite de R≥0 , on pose 1 [a0 ; a1 ; . . . ; an ] = a0 + a1 + 1 ··· + 1 an Si on définit deux suites {pi }i≥0 et {qi }i≥0 par p0 = a0 et q0 = 1 et p1 = a0 a1 + 1 et q1 = a1 et pn = an pn−1 + pn−2 et qn = an qn−1 + qn−2 , alors [a0 ; a1 ; . . . ; an ] = pn /qn pour tout n. Si x ∈ R≥0 est irrationnel, on pose x0 = x et pour n ≥ 0, an = bxn c et yn = xn − an et xn+1 = 1/yn . La suite {ai }i≥0 est une suite de Z≥1 . La proposition suivante rassemble quelques propriétés des fractions continues. Proposition 9.5. — On a x = limn→+∞ [a0 ; a1 ; . . . ; an ]. De plus : 1. Si n ≥ 1 et si 1 ≤ q ≤ qn et p sont tels que |x−p/q| ≤ |x−pn /qn |, alors p/q = pn /qn . 2. Si p, q sont tels que |x − p/q| < 1/2q 2 , alors il existe n tel que p/q = pn /qn . 26 LAURENT BERGER √ Si d ≥ 5 est sqf et d ≡ 2, 3 mod 4 et K = Q( d), alors OK admet une unité fonda√ mentale, de la forme p + q d avec p, q ∈ Z≥1 . On a p2 − dq 2 = ±1 et donc √ 1 p 1 √ < 2. d− = q q(p + q d) 2q Par le (2) de la proposition ci-dessus, p/q est de la forme pn /qn et l’unité fondamentale √ de OK est donc égale à pn + dqn où n est le plus petit entier tel que p2n − dqn2 = ±1. Si d ≡ 1 mod 4, alors les unités de OK donnent des solutions de l’équation x2 − dy 2 = 4 avec x et y de même parité, et on adapte la méthode ci-dessus. 10. Correspondance de Galois Soit K un corps de nombres et K une clôture algébrique de K et L une extension finie de K ; on a vu au chapitre 1 qu’il existe y ∈ L tel que L = K[y]. Un automorphisme de L au-dessus de K est un morphisme de corps K-linéaire α : L → L. Un tel morphisme est déterminé par α(y) qui doit être l’une des racines de Pmin,y (X) et il y a donc au plus d = [L : K] automorphismes de L au-dessus de K. On dit que l’extension L/K est galoisienne s’il existe [L : K] automorphismes de L au-dessus de K. Remarque 10.1. — Il existe d plongements K-linéaires σ : L → K et un tel plongement est un automorphisme de L si et seulement si σ(L) = L. Si L/K est une extension de corps de nombres et si y ∈ L, alors un conjugué de y est une racine de Pmin,y (X) dans K. On voit donc que l’extension L/K est galoisienne si et seulement si les conjugués de tous les éléments de L sont dans toujours dans L et aussi si et seulement si L est engendrée par des éléments dont tous les conjugués sont dans L. Si l’extension L/K est galoisienne, alors on note Gal(L/K) le groupe des automorphismes de L au-dessus de K, et on l’appelle le groupe de Galois de L/K. Par exemple, si P (X) ∈ K[X] est un polynôme irréductible de degré d = deg(P ), alors le corps de décomposition de P est l’extension L de K engendrée par les racines de P dans K. C’est une extension galoisienne et le groupe de Galois Gal(L/K) permute les racines de P et on en déduit une injection Gal(L/K) ,→ Sd ce qui fait que [L : K] ≤ d!. En particulier, toute extension L/K de degré d est contenue dans un corps L ⊂ M galoisien sur K avec [M : K] ≤ d!. Le résultat suivant est le théorème d’Artin. Lemme 10.2. — Si K est un corps de nombres et si G est un groupe d’automorphismes de K, alors K/K G est galoisienne de groupe de Galois G. INTRODUCTION À LA THÉORIE DES NOMBRES 27 Démonstration. — Par le théorème de l’élément primitif, il existe y ∈ K tel que K = K G (y). Le polynôme P (X) = Q g∈G (X − g(y)) est à coefficients dans K G et annule y ce qui fait que [K : K G ] ≤ card(G). On en déduit que [K : K G ] = card(G) et donc que K/K G est galoisienne de groupe de Galois G. Le théorème principal de la théorie de Galois est le suivant. Théorème 10.3. — Si L/K est une extension galoisienne de groupe de Galois G = Gal(L/K), alors on a une « dualité » entre les sous-extensions K ⊂ F ⊂ L et les sousgroupes H de G, donnée par : F 7→ Gal(L/F ) et H 7→ LH , ces deux constructions étant réciproques l’une de l’autre. De plus, l’extension LH /K est galoisienne si et seulement si H est un sous-groupe distingué de G. Démonstration. — Commençons par montrer que les deux constructions sont inverses l’une de l’autre. Si H est un sous-groupe de G et si F = LH alors le théorème d’Artin nous dit que L/F est galoisienne de groupe de Galois H ce qui montre un sens. Si F ⊂ L et si H = Gal(L/F ), alors l’extension L/LH est de degré card(H) par le théorème d’Artin ; comme LH contient F on en déduit que LH = F ce qui montre l’autre sens. −1 Ensuite, observons que si g ∈ G, alors g(LH ) = LgHg et donc que LH est stable par tous les automorphismes K-linéaires de L si et seulement si H = gHg −1 pour tout g ∈ G (en appliquant la première partie du théorème). Avant de continuer, voyons ce qui se passe pour les corps finis. Un corps fini est toujours de cardinal q = pf et si l’on travaille dans une clôture algébrique fixée Fp de Fp et si k est de cardinal q, alors k = {x ∈ Fp tels que xq = x} = Fq : il n’existe donc qu’une extension de Fp de degré f . On a par ailleurs Fpf ⊂ Fpn si et seulement si f divise n. L’application σq : Fp → Fp donnée par σq (x) = xq est un automorphisme de corps qui est l’identité sur Fq et qui préserve Fqf ; l’extension Fqf /Fq admet donc f automorphismes distincts 1, σq , . . . , σqf −1 et est donc galoisienne de groupe Z/f Z. La théorie de Galois des corps finis est donc très simple : toutes les extensions sont galoisiennes et tous les groupes de Galois sont cycliques. Enfin, le théorème de l’élément primitif est vrai pour les corps finis car F× q est cyclique. 28 LAURENT BERGER 11. Corps cyclotomiques Une classe importante de corps de nombres est donnée par les corps cyclotomiques ; ce sont les corps K = Q(ζn ) où n ≥ 3. Le n-ième polynôme cyclotomique est : Φn (X) = (X − ζnk ). Y k∈(Z/nZ)× Lemme 11.1. — Le polynôme Φn (X) appartient à Z[X] est irréductible dans Q[X]. Démonstration. — Les conjugués de ζn sont de la forme ζna avec a ∧ n = 1 et comme x 7→ ax est une bijection de (Z/nZ)× on voit que les coefficients de Φn (X) appartiennent à Z. Soit à présent P (X) le polynôme minimal de ζn de telle sorte qu’on peut écrire X n − 1 = P (X)Q(X). Si p est un nombre premier qui ne divise pas n, montrons que P (ζnp ) = 0. Si ce n’est pas le cas, alors c’est que Q(ζnp ) = 0 et donc que P (X) divise Q(X p ). Dans Fp [X], le polynôme P (X) divise alors Q(X)p et donc X n − 1 admet des racines multiples. Ceci n’est pas possible car le discriminant de X n − 1 est non nul dans Fp si p ne divise pas n. On en déduit que P (ζnp ) = 0 pour tout p premier ne divisant pas n et donc que P (ζna ) = 0 pour tout a premier à n ce qui fait que P (X) = Φn (X) qui est donc irréductible. Le polynôme Φn (X) est donc le polynôme minimal de ζn et donc [Q(ζn ) : Q] = ϕ(n). ei −1 (pi − 1). Si g ∈ Gal(Q(ζn )/Q), i=1 pi ζnχ(g) et on en déduit un morphisme injectif Rappelons que si n = pe11 · · · perr , alors ϕ(n) = Qr alors il existe χ(g) ∈ (Z/nZ)× tel que g(ζn ) = qui est alors bijectif (comparer les cardinaux), le caractère cyclotomique : χ : Gal(Q(ζn )/Q) ' (Z/nZ)× . Les corps cyclotomiques sont des cas particuliers d’extensions abéliennes de Q, c’est-àdire de corps K tels que Gal(K/Q) est abélien. Un théorème de Kronecker et Weber dit que toute extension abélienne de Q est contenue dans un corps cyclotomique. C’est par √ exemple le cas pour les corps Q( d) comme nous allons le voir. Un caractère de Dirichlet mod n est un homomorphisme χ : (Z/nZ)× → C× . Il se peut qu’il existe m divisant n tel que χ se factorise par χ : (Z/nZ)× → (Z/mZ)× → C× et le plus petit m tel que χ se factorise par (Z/mZ)× est appelé le conducteur de χ noté fχ . On étend χ en une fonction χ : Z → C par χ(a) = χ(a mod fχ ) si a ∧ fχ = 1 et χ(a) = 0 sinon. Si m ∈ Z, alors on définit la somme de Gauss G(m, χ) = P a mod f χ(a)ζfam . Proposition 11.2. — On a G(m, χ) = χ(m)G(1, χ) et G(1, χ)G(1, χ) = χ(−1)f . 29 INTRODUCTION À LA THÉORIE DES NOMBRES Démonstration. — Si m ∧ f = 1 alors : χ(a)ζfam = χ(m) X G(m, χ) = X χ(am)ζfam = χ(m)G(1, χ). a mod f a mod f Si m ∧ f = d > 1, alors χ(m) = 0 et : G(m, χ) = am/d X χ(a)ζf /d = a mod f car P a=1 mod f /d bm/d X X ζf /d χ(a) = 0 a=b mod f /d b mod f /d χ(a) = 0. Ensuite : G(1, χ)G(1, χ) = G(1, χ) χ(b)ζfb = X b mod f G(b, χ)ζfb b mod f X = X χ(a)ζfab ζfb = a,b mod f X χ(a) a mod f X b(a+1) ζf = χ(−1)f. b mod f On dit que χ est un caractère quadratique si l’image de χ est incluse dans {±1}. On dit qu’un caractère χ est pair si χ(−1) = 1 et impair si χ(−1) = −1. Proposition 11.3. — Si K est un corps quadratique de discriminant D, alors on a K ⊂ Q(ζ|D| ). Démonstration. — Si χ est un caractère quadratique de conducteur f , alors on a G(1, χ) ∈ Q(ζf ) et la proposition 11.2 implique que G(1, χ)2 = χ(−1)f ce qui fait que q Q( χ(−1)f ) ⊂ Q(ζf ). Il faut donc construire un caractère quadratique ayant le bon conducteur et la bonne parité. Si p est un nombre premier impair, alors le symbole de Legendre (·/p) est un caractère quadratique χp de conducteur p. On peut de même construire χ4 de conducteur 4 et deux caractères χ± 8 de conducteur 8, l’un pair et l’autre √ impair. Si l’on écrit K = Q( d) où d = ±p1 · · · pr est sans facteur carré, alors D = 4d si d = 2, 3 mod 4 et D = d si d = 1 mod 4. Si D est impair, alors on pose χ = χp1 · · · χpr . Si D = 4d avec d impair, alors on pose χ = χ4 χp2 · · · χpr et sinon on pose χ = χ± 8 χp2 · · · χpr où le signe est choisi pour que χ ait la bonne parité. Dans tous les cas, on vérifie que χ est de conducteur |D| et a la bonne parité. Proposition 11.4. — Si K, D et χ sont comme ci-dessus, alors on a 0 si p est ramifié dans K, χ(p) = 1 si p est décomposé dans K, −1 si p est inerte dans K. Démonstration. — La proposition dit que χ(p) = D p . Il s’agit donc de vérifier cette formule en utilisant la construction de χ donnée dans la démonstration de la proposition 30 LAURENT BERGER 11.3. Si par exemple D est impair, alors D = ±p1 · · · pr et χ = χp1 · · · χpr . On a donc χ(p) = p p1 ··· p pr et la loi de réciprocité quadratique implique que p p1 ··· p pr = p 1 p Si D > 0, alors D ≡ 1 mod 4 et donc D < 0, alors pi −1 i=1 2 Pr ··· p r p pi −1 i=1 2 Pr · (−1) p−1 2 Pr i=1 pi −1 2 . est pair ce qui fait que χ(p) = D p . Si est impair et on trouve alors que ! p−1 |D| |D| (−1) 2 = χ(p) = p p ! ! −1 D = . p p Le cas où D est pair se traite de la même manière. Remarque 11.5. — On peut en fait donner une démonstration directe de la proposition 11.4, et en déduire ensuite la loi de réciprocité quadratique. 12. Lois de réciprocité Si l’extension L/K est galoisienne et si q est un idéal au-dessus de p, alors pour g ∈ Gal(L/K) l’idéal g(q) est un idéal au-dessus de g(p) = p. Proposition 12.1. — Si l’extension L/K est galoisienne, alors Gal(L/K) agit transitivement sur l’ensemble {q1 , . . . , qr } des idéaux au-dessus de p. Démonstration. — Supposons que q2 6= g(q1 ) quel que soit g ∈ Gal(L/K). Dans ce cas on a q2 + g(q1 ) = OL quel que soit g ∈ Gal(L/K) et par le théorème des restes, il existe x ∈ OL tel que x = 0 mod q2 et x = 1 mod g(q1 ) pour tout g. Comme x ∈ q2 on a NL/K (x) ∈ q2 ∩ OK = p et comme x = 1 mod g(q1 ) pour tout g, on a Q NL/K (x) = g∈Gal(L/K) g −1 (x) = 1 mod q1 et donc NL/K (x) = 1 mod p ce qui est une contradiction. Si L/K est galoisienne et si pOL = qe11 · · · qerr , on en déduit que e1 = · · · = er et que f1 = · · · = fr . Soit L/K une extension finie. Si q est un idéal premier de OL au-dessus de l’idéal premier p de OK , on note e(q/p) l’indice de ramification de q/p et f (q/p) = [kq : kp ] l’indice d’inertie de q/p. Si l’on a une tour d’extensions, alors e(r/p) = e(r/q)e(q/p) et f (r/p) = f (r/q)f (q/p). Proposition 12.2. — On a P q|p e(q/p)f (q/p) = [L : K]. INTRODUCTION À LA THÉORIE DES NOMBRES 31 Démonstration. — Cette proposition généralise le corollaire 3.8. La démonstration est essentiellement la même, mais algébriquement un peu plus pénible si p n’est pas principal. Si L/Q et K/Q sont toutes les deux galoisiennes, on peut s’en sortir de la manière suivante. La valeur des indices e et f ne dépend que de l’extension, et il s’agit donc de montrer que e(L/K)f (L/K)r(L/K) = [L : K]. Par le corollaire 3.8, on a e(L/Q)f (L/Q)r(L/Q) = [L : Q] et e(K/Q)f (K/Q)r(K/Q) = [K : Q]. On en déduit que e(L/K)f (L/K)r(L/K) = [L : K]. Soit L/K une extension galoisienne. Si q est un idéal premier de OL on note Dq le sous-groupe de Gal(L/K) constitué des g tels que g(q) = q : c’est le sous-groupe de décomposition de q. Par la proposition 12.1, c’est un sous groupe de Gal(L/K) de cardinal [L : K]/r = ef . Si q0 est un autre idéal au-dessus de p alors par la proposition 12.1, il existe g tel que q0 = g(q) et on a alors Dq0 = gDq g −1 . Par la correspondance de Galois, on a une tour d’extensions L ⊃ LDq ⊃ K. L’idéal q de L est au-dessus d’un idéal qD de LDq et comme Gal(L/LDq ) = Dq l’idéal q est le seul idéal de L au-dessus de qD . On a par ailleurs e(q/qD )f (q/qD ) = [L : LDq ] = card(Dq ) = e(q/p)f (q/p) et donc e(q/p) = e(q/qD ) et f (q/p) = f (q/qD ) et donc aussi e(qD /p) = f (qD /pD ) = 1. En particulier, kqD = kp . Le corps kq est une extension de kp de degré f et le groupe Dq agit sur kq d’où un morphisme Dq → Gal(kq /kp ) ' Z/f Z. Proposition 12.3. — Le morphisme Dq → Gal(kq /kp ) est surjectif. Démonstration. — Soit θ un élément de OL tel que kq = kp [θ] et A(X) ∈ kp [X] le polynôme minimal de θ et B(X) ∈ OLDq [X] celui de θ sur LDq ce qui fait que B(X) est scindé (à racines simples) dans OL et que A(X) | B(X). Si σ ∈ Gal(kq /kp ), alors σ(θ) est une racine de A(X) et donc de B(X) ce qui fait qu’il existe une racine θ0 ∈ OL de B(X) dont l’image dans kq est σ(θ). Si g est un élément de Gal(L/LDq ) = Dq tel que g(θ) = θ0 alors on voit que l’image de g dans Gal(kq /kp ) est σ. Le noyau Iq du morphisme Dq → Gal(kq /kp ) s’appelle le sous-groupe d’inertie de Dq et il est donc de cardinal e(q/p). Si q est non-ramifié, alors Iq = {1} et le groupe Gal(L/K) contient le sous-groupe cyclique Dq ' Gal(kq /kp ). Le groupe Gal(kq /kp ) est engendré par le morphisme de Frobenius [x 7→ xq ] où q = card(kp ) et on appelle le Frobenius de q l’élément σq ∈ Dq ⊂ Gal(L/K) dont l’image dans Gal(kq /kp ) est le Frobenius [x 7→ xq ]. Cet élément est aussi noté (q, L/K) ∈ Gal(L/K). Si g ∈ Gal(L/K), alors (g(q), L/K) = g(q, L/K)g −1 et donc si Gal(L/K) est abélien, alors (q, L/K) ne dépend que de p et on le note alors (p, L/K) ∈ Gal(L/K). Si I = 32 LAURENT BERGER αi i=1 pi est un idéal de OK tel qu’aucun pi n’est ramifié dans L, alors on note (I, L/K) = Qn αi i=1 (pi , L/K) , et l’objet des lois de réciprocité est de décrire explicitement ces éléments Qn en termes de I, ce que nous allons faire pour l’extension K = Q(ζn )/Q. L’anneau des entiers de Q(ζn ) est Z[ζn ] (nous ne démontrons pas ceci dans ce cours). Remarquons que ζn est annulé par X n − 1 dont le discriminant est ±nn ce qui fait que si p est un nombre premier qui ne divise pas n, alors p est non-ramifié dans Q(ζn ). Rappelons que l’on a construit un isomorphisme canonique Gal(K/Q) → (Z/nZ)× , donné par g 7→ χ(g) où g(ζn ) = ζnχ(g) . Théorème 12.4. — Si a ∈ Z≥1 est premier à n, alors χ((a), Q(ζn )/Q) = a. Démonstration. — Par multiplicativité, il suffit de vérifier cette formule pour un nombre premier p ne divisant pas n. Si σp = χ−1 (p) ∈ Gal(Q(ζn )/Q), alors σp (ζn ) = ζnp . Écrivons pZ[ζn ] = ri=1 qi . On a qi = (p, Qi (ζn )) où Qi (X) ∈ Z[X] et Qi (ζnp ) − Qi (ζn )p ∈ pZ[ζn ] ce qui fait que σp (qi ) ⊂ qi et donc σp (qi ) = qi . On a bien σp ∈ Dqi . Ensuite, σp agit par Q [x 7→ xp ] sur Z[ζn ]/p = Qr i=1 Z[ζn ]/qi où pZ[ζn ] = Qr i=1 qi et donc σp = ((p), Q(ζn )/Q). Cette loi de réciprocité nous donne en particulier des informations sur la décomposition d’un nombre premier p dans Q(ζn ). En effet ((p), Q(ζn )/Q) engendre un groupe isomorphe à Z/f Z et donc le théorème 12.4 implique que f est l’ordre de p modulo n. Corollaire 12.5. — Un nombre premier p - n est totalement décomposé dans Q(ζn ) si et seulement si p ≡ 1 mod n. Proposition 12.6. — Si L ⊃ K ⊃ Q est une tour d’extensions telle que L/Q est abélienne et si q est un idéal premier de L au-dessus de p de K et de p de Q, alors : 1. (p, K/Q) est l’image dans Gal(K/Q) de (p, L/Q) ∈ Gal(L/Q) ; 2. (p, L/K) = (p, L/Q)f (p/p) dans Gal(L/K) ⊂ Gal(L/Q). Démonstration. — L’image de (p, L/Q) dans Gal(kq /Fp ) est le Frobenius [x 7→ xp ] et donc sa restriction de (p, L/Q) à K est bien (p, K/Q). Par ailleurs, l’image de (p, L/Q)f (p/p) est l’application [x 7→ xq ] avec q = pf (p/p) et par le (1) son image dans Gal(K/Q) est triviale ce qui fait que (p, L/Q)f (p/p) ∈ Gal(L/K) vaut donc (p, L/K). Le théorème 12.4 permet de redémontrer la loi de réciprocité quadratique. Si p est √ un nombre premier impair, posons p∗ = (−1)(p−1)/2 p de telle manière que Q( p∗ ) ⊂ √ Q(ζp ). On a Gal(Q(ζp )/Q) = (Z/pZ)× et Gal(Q( p∗ )/Q) = {±1}. Comme (Z/pZ)× est INTRODUCTION À LA THÉORIE DES NOMBRES 33 cyclique, il n’existe qu’une seule application non triviale (Z/pZ)× → {±1} et c’est donc le symbole de Legendre : a √ p−1 (a, Q( p∗ )/Q) = =a 2 . p √ Si q est un nombre premier impair distinct de p, on a donc pq = (q, Q( p∗ )/Q). √ Par ailleurs, on a (q, Q( p∗ )/Q) = ±1 selon que q est décomposé ou pas dans √ Q( p∗ )/Q c’est-à-dire selon que p∗ est un carré modulo q ou pas, ce qui fait que : √ p∗ = (q, Q( p∗ )/Q) = p q q ! et donc que : q p p−1 q−1 = (−1) 2 · 2 p q C’est la partie la plus importante de la loi de réciprocité quadratique, démontrée par Gauss. Il faut lui rajouter la formule p2 = (−1)(p −1)/8 qui suit de la même manière du √ fait que 2 est décomposé dans Q( p∗ ) si et seulement si p∗ = 1 mod 8. 2 13. La fonction ζ de Dedekind Si s ∈ C vérifie Re(s) > 1, alors ζ(s) = P n≥1 1/ns converge et cela définit une fonction holomorphe. On a la décomposition en produit eulérien : ζ(s) = 1 −s p premier 1 − p Y qui permet de relier les propriétés de la fonction ζ à la distribution des nombres premiers de Z. Dans ce chapitre, nous allons généraliser la définition de cette fonction à un corps de nombres. Avant tout, nous avons besoin d’étendre son domaine de définition. Rappelons que la fonction Γ est définie par : Γ(s) = Z ∞ ts−1 exp(−t)dt si Re(s) > 0, 0 et que l’on a Γ(s + 1) = sΓ(s) et que Γ(s) 6= 0 pour tout s ∈ C tel que Re(s) > 0. Par ailleurs, on a Γ(s) = R ∞ s−1 s−1 n t exp(−nt)d(nt) 0 ce qui fait que : 1 1 Z ∞ s−1 = t exp(−nt)dt ns Γ(s) 0 et donc que : 1 Z ∞ s−1 X 1 Z∞ ts−1 ζ(s) = t exp(−nt) dt = dt Γ(s) 0 Γ(s) 0 exp(t) − 1 n≥1 34 LAURENT BERGER En écrivant : Γ(s)ζ(s) = Z 1 0 Z ∞ ts−1 1 1 1 − dt + + dt, exp(t) − 1 t s−1 exp(t) − 1 1 ! s−1 t on voit que la fonction ζ se prolonge en une fonction méromorphe sur {s ∈ C tels que Re(s) > 0} avec un pôle simple de résidu 1 en s = 1. On peut montrer que la fonction ζ se prolonge en une fonction méromorphe sur C tout entier avec pour seul pôle s = 1 et qu’elle vérifie l’équation fonctionnelle : ζ(1 − s) = 2(2π)−s Γ(s) cos(πs/2)ζ(s). Dans ce cours, nous généralisons plutôt la définition de la fonction ζ à un corps de nombres K afin d’étudier son résidu en s = 1. On pose donc, suivant Dedekind : X 1 . ζK (s) = s I idéal de OK N(I) Si K = Q, alors on retrouve bien la fonction ζ définie ci-dessus. Pour un corps de nombres K, on peut montrer que la série qui définit ζK (s) converge pour Re(s) > 1 et que ζK (s) se prolonge en une fonction méromorphe sur {s ∈ C tels que Re(s) > 1 − 1/[K : Q]} avec un pôle simple en s = 1 de résidu : 2r1 (2π)r2 hK RK q , κ= ωK |disc(K)| où hK = card Cl(K), RK est le régulateur et ωK est le nombre de racines de l’unité contenues dans K. P Si f (n) est le nombre d’idéaux I de OK tels que N(I) = n, alors ζK (s) = n≥1 f (n)n−s et la première étape est de comprendre comment f varie. Si C ∈ Cl(K) est une classe d’idéaux, soit iC (t) le nombre d’idéaux I non nuls tels que I ∈ C et tels que N(I) ≤ t. Proposition 13.1. — On a : iC (t) = 2r1 (2π)r2 RK q ωK |disc(K)| · t + O(t1−1/[K:Q] ). Démonstration. — Si K = Q, alors iC (t) = btc et la proposition est immédiate. Nous allons la démontrer pour [K : Q] = 2, le cas général étant similaire mais plus difficile à suivre. Remarquons que si J est un idéal dont la classe est C −1 , alors l’application « multiplication par J » donne une bijection entre {I de classe C tels que N(I) ≤ t} et {(α) ⊂ J tels que N((α)) ≤ t N(J)}. On se ramène donc à compter des idéaux principaux (α), c’est-à-dire des α à unité près. √ Premier cas : K = Q( −d) est un corps quadratique imaginaire. Le plongement σ : √ √ K → R2 défini au §8 est donné par σ(a + b −d) = (a, b d). Le nombre de α ∈ J 35 INTRODUCTION À LA THÉORIE DES NOMBRES tels que |NK/Q (α)| ≤ t N(J) est égal aux nombres de σ(α) = (x,q y) ∈ σ(J) tels que x2 + y 2 ≤ t N(J) et c’est donc le nombre de points dans σ(J) ∩ D(0, t N(J)). Si δ est le diamètre d’un domaine fondamental de σ(J), alors : π(r − δ)2 ≤ vol(J) · card(D(0, r) ∩ σ(J)) ≤ π(r + δ)2 , et donc card(D(0, r) ∩ σ(J)) = πr2 / vol(J) + O(r) ce qui fait que le nombre de σ(α) = (x, y) ∈ σ(J) tels que x2 + y 2 ≤ t N(J) vaut : √ √ 2πt πt N(J) + O( t) = q + O( t). vol(J) |disc(K)| puisque l’image de OK est un réseau de volume vol(OK ) = q |disc(K)|/2 et vol(J) = N(J) vol(OK ). Reste à constater que deux α qui diffèrent par une unité engendrent le même idéal, et donc que pour obtenir le nombre d’idéaux il faut diviser par ωK , et que RK = 1 car r1 + r2 − 1 = 0 (voir le chapitre 9). √ Deuxième cas : K = Q( d) est un corps quadratique réel. Le plongement σ : K → R2 √ √ √ est donné par σ(a + b −d) = (a + b d, a − b d) ce qui fait que si σ(α) = (x, y), alors N(α) = xy. Par ailleurs, si l’on appelle uK l’unité fondamentale de K, alors σ(αuK ) = (xuK , y · ±u−1 K ) et donc on peut toujours multiplier α par une puissance de uK pour que 1 ≤ |y/x| < u2K . Le volume de la région délimitée par les équations 1 ≤ |y/x| < u2K et |xy| ≤ t N(J) (cf le dessin page 168 du livre de Marcus) vaut 4t N(J) log(uK ) ce qui fait que comme ci-dessus, le nombre de α ∈ J qui vérifient 1 ≤ |y/x| < u2K et |N(α)| ≤ t N(J) est égal à : √ 4t N(J) log uK + O( t) vol(J) Deux tels α engendrent le même idéal si et seulementqsi ils diffèrent par ±1 ce qui fait que comme vol(J) = N(J) vol(OK ) avec vol(OK ) = RK = log uK on trouve la bonne formule. |disc(K)| et comme ωK = 2 et Lemme 13.2. — Si {ak }k≥1 est une suite de nombres complexes telle que r O(t ), alors P n≥1 P k≤t ak = s an /n converge si Re(s) > r et définit une fonction holomorphe sur {s ∈ C, Re(s) > r}. Démonstration. — Posons Ak = a1 + · · · + ak de telle sorte que |Ak | ≤ Ck r . On a : am am+` Am − Am−1 Am+` − Am+`−1 + ··· + = + ··· + = s s s m (m + `) m (m + `)s ! ! Am+` Am−1 1 1 1 1 − + Am − + · · · + Am+`−1 − (m + `)s ms ms (m + 1)s (m + ` − 1)s (m + `)s 36 LAURENT BERGER En utilisant le fait que |1/k s − 1/(k + 1)s | ≤ |s|/k Re(s)+1 on trouve que : a m s m am+` ≤ + ··· + (m + `)s ! C C 1 1 , + + |s|C + · · · + (m + `)Re(s)−r mRe(s)−r mRe(s)−r+1 (m + ` − 1)Re(s)−r+1 qui tend vers 0 uniformément quand m → ∞ si s est dans un compact fixé de {s ∈ C, Re(s) > r}. Par les propriétés usuelles des fonctions holomorphes, cela implique le lemme. On en déduit le théorème ci-dessous, dû à Hecke. Théorème 13.3. — Si K est un corps de nombres, alors ζK (s) se prolonge en une fonction méromorphe sur {s ∈ C tels que Re(s) > 1 − 1/[K : Q]} avec un pôle simple en s = 1 de résidu : κ= 2r1 (2π)r2 hK RK q ωK |disc(K)| . Démonstration. — Si f (n) est le nombre d’idéaux I de OK tels que N(I) = n, alors ζK (s) = P n≥1 f (n)n−s et par ailleurs f (1) + · · · + f (n) = P C iC (n) ce qui fait que si l’on pose an = f (n) − κ, alors la proposition 13.1 nous dit que a1 + · · · + an = O(n1−1/[K:Q] ) et P donc par le lemme 13.2 que la série n≥1 (f (n)−κ)n−s définit une fonction holomorphe sur {s ∈ C tels que Re(s) > 1 − 1/[K : Q]} ce qui fait que ζK (s) − κζ(s) y est holomorphe, et cela implique le théorème étant donnés les rappels qu’on a fait au début du chapitre. Enfin, on a toujours une décomposition de ζK (s) en produit eulérien qui reflète l’existence et l’unicité de la décomposition des idéaux en produit d’idéaux premiers : ζK (s) = 1 −s p premier 1 − N(p) Y si Re(s) > 1. 14. Fonctions L Si χ est un caractère de Dirichlet modulo n non trivial, alors χ(1) + · · · + χ(n) = 0 et P donc k≤t χ(k) = O(1) ce qui fait que par le lemme 13.2, la série : L(s, χ) = χ(n) s n≥1 n X 37 INTRODUCTION À LA THÉORIE DES NOMBRES converge pour Re(s) > 0 et définit une fonction holomorphe dans ce demi-plan. Cette fonction se décompose en produit Eulérien : L(s, χ) = 1 . −s p premier 1 − χ(p)p Y Une application classique de la théorie des fonctions L est la démonstration du théorème de Dirichlet : si n ≥ 3 et a ∈ Z est premier avec n, alors il existe une infinité de nombre premiers p avec p ≡ a mod n. Donnons le principe de la démonstration pour n = 4. Soit χ4 le caractère de conducteur 4, étendu à Z. Lemme 14.1. — Si χ est un caractère et s > 1, alors log L(s, χ) = P p χ(p)p−s + Rχ (s) où Rχ (s) est borné quand s → 1. Démonstration. — On a pour s > 1 : log L(s, χ) = − X log(1 − χ(p)p−s ) = X p χ(p)p−s + XX p m−1 χ(p)m p−ms . p m≥2 et donc |Rχ (s)| = X X −1 m −ms m χ(p) p p m≥2 ≤ XX p−ms ≤ p m≥2 X p−2s (1 − p−s )−1 ≤ 2ζ(2). p Théorème 14.2. — Il existe une infinité de nombres premiers p avec p ≡ 1 mod 4 et une infinité de nombres premiers p avec p ≡ 3 mod 4. Démonstration. — Si s > 1, alors par le lemme 14.1, on a log ζ(s) = p p−s + R1 (s) P et log L(s, χ4 ) = p χ4 (p)p−s + R4 (s) avec R1 (s) et R4 (s) bornés quand s → 1. Par P ailleurs, log L(s, χ4 ) est bornée quand s → 1 car L(s, χ4 ) est holomorphe si s > 0 et L(1, χ4 ) = π/4 6= 0. On a log ζ(s) + log L(s, χ4 ) = 2 X p−s + R1 (s) + R4 (s) + 2−s p≡1 mod 4 log ζ(s) − log L(s, χ4 ) = 2 X p−s + R1 (s) − R4 (s) + 2−s p≡3 mod 4 Comme ζ(s) → ∞ quand s → 1, on en déduit que P p≡1 mod 4 p−s et P p≡3 mod 4 p−s divergent quand s → 1, ce qui implique le théorème. La démonstration du théorème de Dirichlet pour n arbitraire est similaire. Une manière de faire consiste à montrer tout d’abord que ζQ(ζn ) (s) = ζ(s) · Q χ:(Z/nZ)× →C× ,χ6=1 d’en déduire que L(1, χ) 6= 0 pour tout χ 6= 1, puis à raisonner comme ci-dessus. L(s, χ), 38 LAURENT BERGER Passons à une autre application, les formules analytiques de nombre de classe. Soit K une extension quadratique de Q et f = |disc(K)|. Par la proposition 11.4, le caractère quadratique χ : (Z/f Z)× → {±1} associé à K s’étend en une fonction donnée par 0 si p est ramifié dans K, χ(p) = 1 si p est décomposé dans K, −1 si p est inerte dans K. Corollaire 14.3. — Si p est premier, alors −s p|(p) (1 − N(p) ) Q = (1 − p−s )(1 − χ(p)p−s ). Démonstration. — Si p est ramifié, alors (p) = p2 et N(p) = p et χ(p) = 0. Si (p) est décomposé, alors (p) = p1 p2 et N(pi ) = p et χ(p) = 1. Si p est inerte, alors (p) = p et N(p) = p2 et χ(p) = −1. Dans les trois cas, on vérifie la formule. Théorème 14.4. — Si K est un corps quadratique et si χ est le caractère quadratique qui lui est attaché, alors : L(1, χ) = 2πhK √ ωK f si K est imaginaire, 2hK log uK √ si K est réel. f Démonstration. — Par le corollaire 14.3, on a ζK (s) = ζ(s)L(s, χ). En particulier, le résidu en s = 1 de ζK (s) vaut L(1, χ) et le théorème suit du théorème 13.3. √ Par exemple, si K = Q( −1) alors χ = χ4 et donc χ(a) = (−1)(a−1)/2 si a est impair et 0 sinon ce qui fait que : L(1, χ) = 1 − 1 1 π + − ··· = 3 5 4 et donc que hK = 1. On peut trouver des formules closes générales pour L(1, χ). Remarquons que par le théorème 14.4, on a L(1, χ) ∈ R>0 . Proposition 14.5. — Si K est un corps quadratique et si χ est le caractère quadratique qui lui est attaché, alors : L(1, χ) = π √ f f 1 √f X χ(a)a a∧f =1 X χ(a) log sin a∧f =1 si K est imaginaire, aπ f ! si K est réel. 39 INTRODUCTION À LA THÉORIE DES NOMBRES Démonstration. — Rappelons qu’on a les sommes de Gauss G(n, χ) = P a mod f χ(a)ζfan et que χ = χ comme χ est quadratique. Comme G(n, χ) = χ(n)G(1, χ), on a : X G(n, χ) X X ζfan X G(1, χ)L(1, χ) = = χ(a) =− χ(a) log(1 − ζfa ), n n n≥1 n≥1 a mod f a mod f car P n≥1 z n /n = − log(1 − z) si |z| ≤ 1 et z 6= 1, où log(r exp(iθ)) = r + iθ avec −π/2 < θ < π/2. On a alors 1 − ζfa = − exp(iπa/f )(2i sin(πa/f )) et donc : ! log(1 − ζfa ) iπa iπ aπ = − + log(2) + log sin . f 2 f La proposition résulte alors du fait que P a mod f χ(a) = 0 car χ est non trivial et que P P χ(a) log sin(πa/f ) = 0 si χ est impair et que a mod f χ(a)πa/f = 0 si χ est pair √ ainsi que du fait que |G(1, χ)| = f par la proposition 11.2. a mod f Comme conséquence, on trouve des « formules analytiques de nombre de classe ». Corollaire 14.6. — Si K est un corps quadratique et si χ est le caractère quadratique qui lui est attaché, alors : hK = 1 f X χ(a)a a∧f =1 1 log(uK ) X χ(a) log sin a∧f =1 a<f /2 √ √ si K 6= Q( −1), Q( −3) est imaginaire, ! aπ f si K est réel. K La première formule permet de calculer hK et la deuxième u±h K . Références [Bou] N. Bourbaki – Eléments d’histoire des mathématiques [Cox] D. Cox – Primes of the form x2 + ny 2 [Gau] C.-F. Gauss – Disquisitiones Arithmeticae [IR] K. Ireland & M. Rosen – A classical introduction to modern number theory [Mar] D. Marcus – Number fields [Neu] J. Neukirch – Algebraic number theory Laurent Berger, UMPA, ENS de Lyon, UMR 5669 du CNRS, IUF E-mail : [email protected] • Url : http://perso.ens-lyon.fr/laurent.berger/