INTRODUCTION À LA THÉORIE DES NOMBRES

publicité
INTRODUCTION À LA THÉORIE DES NOMBRES
COURS DE M1
par
Laurent Berger
Table des matières
1. Corps de nombres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2. Entiers algébriques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3. Anneaux de Dedekind. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4. Corps finis et résidus quadratiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5. Groupes de classes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6. Le premier cas du théorème de Fermat. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7. Formes quadratiques binaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8. Géométrie des nombres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9. Unités. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10. Correspondance de Galois. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11. Corps cyclotomiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12. Lois de réciprocité. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13. La fonction ζ de Dedekind. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14. Fonctions L. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Références. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
4
6
10
12
13
14
19
23
26
28
30
33
36
39
1. Corps de nombres
Soit K un corps qui contient Q (par exemple K = R ou C). Un nombre α ∈ K est dit
algébrique s’il est racine d’un polynôme à coefficients dans Q.
Proposition 1.1. — Si α ∈ K, alors les propriétés suivantes sont équivalentes :
1. α est algébrique ;
2. Q[α] est de dimension finie sur Q ;
3. Q[α] = Q(α).
2
LAURENT BERGER
Démonstration. — Montrons que (1) implique (2) ; si α est annulé par P (X), alors Q[α]
est un quotient de Q[X]/P (X) et est donc de dimension finie sur Q.
Montrons que (2) implique (3) ; si β ∈ Q[α] est non nul, alors la multiplication par β
est un endomorphisme injectif de Q[α] qui est alors surjectif comme on est en dimension
finie, ce qui fait que tout élément non nul de Q[α] a un inverse et que Q[α] est un corps.
Montrons que (3) implique (1) ; on a 1/α ∈ Q[α] et il existe donc R(X) tel que
1/α = R(α) ce qui fait que α est annulé par le polynôme P (X) = XR(X) − 1.
Le degré de α est alors défini par deg(α) = dimQ (Q[α]). On déduit de la proposition
que si α, β ∈ K sont algébriques, alors α ± β et αβ et α/β le sont aussi. En effet, ils
appartiennent tous à Q[α, β] qui est engendré par les αi β j avec 0 ≤ i ≤ deg(α) − 1 et
0 ≤ j ≤ deg(β) − 1.
Si α est algébrique, alors Iα = {P (X) ∈ Q[X] tels que P (α) = 0} est un idéal de Q[X]
dont on note Pmin,α le générateur unitaire, c’est le polynôme minimal de α. Ce polynôme
est irréductible sur Q et il est scindé à racines simples sur C. Son degré est celui de α.
L’ensemble des nombres algébriques de C est dénombrable. Le résultat suivant permet
de construire des exemples d’éléments de R qui ne sont pas algébriques.
Théorème 1.2. — Si α ∈ R est irrationel et algébrique de degré d, alors il existe c > 0
telle que
α −
p c
≥ d
q q
pour tous p, q ∈ Z (q 6= 0).
Démonstration. — Soit P = m · Pmin,α où m ∈ Z≥1 est tel que P (X) ∈ Z[X]. Si α ∈ R
et p, q ∈ Z (q 6= 0), il existe y ∈ [α; p/q] tel que P (α) − P (p/q) = (α − p/q) · P 0 (y). On a
P (α) = 0 et P (p/q) ∈ 1/q d · Z \ {0} ce qui fait que |α − p/q| ≥ 1/q d · 1/|P 0 (y)|. Il suffit
alors de prendre c = min(1, miny∈[α−1;α+1] 1/|P 0 (y)|).
Par exemple,
P
k≥0
1/2k! n’est pas algébrique.
Définition 1.3. — Un corps de nombres est une extension finie K de Q. Son degré noté
[K : Q] est la dimension de K sur Q.
Le résultat ci-dessous (le théorème de l’élément primitif) va nous simplifier la vie.
Théorème 1.4. — Si K est un corps de nombres, alors il existe α ∈ K tel que K =
Q(α).
INTRODUCTION À LA THÉORIE DES NOMBRES
3
Démonstration. — Comme K est de dimension finie sur Q, il existe α1 , . . . , αk ∈ K tels
que K = Q(α1 , . . . , αk ) et pour montrer le théorème, il suffit donc de montrer que si
K = Q(x, y), alors il existe z ∈ K tel que K = Q(z). Pour cela, plaçons nous dans une
extension de K qui contient les racines x1 = x, x2 , . . . , xr de Pmin,x (X) et les racines y1 =
y, y2 , . . . , ys de Pmin,y (X). Comme Q est infini, il existe t ∈ Q tel que xi +tyj 6= x+ty pour
tout (i, j) 6= (1, 1) et on pose z = x+ty. Si on pose Q(X) = (X −z +ty1 ) · · · (X −z +tys ),
alors Q(X) = (−t)s Pmin,y ((X − z)/(−t)) est à coeffcients dans Q(z) et l’hypothèse faite
sur t implique que le pgcd de Q(X) avec Pmin,x (X) est X − x ce qui fait que x ∈ Q(z).
On a de même y ∈ Q(z) et donc on a bien Q(x, y) = Q(z).
Si L/K est une extension de corps de nombres, alors il existe α ∈ L tel que L = Q(α)
et donc a fortiori, L = K(α).
Rappelons que C est algébriquement clos. Si K est un corps de nombres, alors un
plongement de K dans C est un morphisme de corps σ : K → C. Par le théorème 1.4, il
existe α ∈ K tel que K = Q[α] = Q[X]/(Pmin,α (X)) et il existe donc deg(α) plongements
distincts de K dans C, donnés par σi (α) = αi où α1 , . . . , αd sont les racines de Pmin,α (X)
dans C. Un plongement σ est dit réel si σ(K) ⊂ R et complexe sinon. Dans ce dernier
cas, σ et σ sont distincts. Le corps K admet donc r1 plongements réels dans C et r2
paires de plongements complexes conjugués, avec d = r1 + 2r2 .
Plus généralement, on a le résultat ci-dessous qui se démontre de la même manière.
Proposition 1.5. — Si L/K est une extension de corps de nombres de degré d et si
σ : K → C est un plongement, alors il existe d plongements distincts de L dans C dont
la restriction à K est σ.
Soit K un corps de nombres et x ∈ K et mx : K → K l’application de multiplication
par x. C’est un endomorphisme Q-linéaire et on pose TrK/Q (x) = Tr(mx ) et NK/Q (x) =
det(mx ).
Proposition 1.6. — Si σ1 , . . . , σd sont les plongements de K dans C, alors TrK/Q (x) =
σ1 (x) + · · · + σd (x) et NK/Q (x) = σ1 (x) · · · σd (x).
Démonstration. — Remarquons que si R(X) ∈ Q[X], alors R(mx ) = mR(x) et donc que le
polynôme minimal de l’endomorphisme mx est Pmin,x (X). On en déduit que si K = Q(x),
alors mx est diagonalisable à valeurs propres σ1 (x), . . . , σd (x) chacune étant comptée avec
multiplicité un ce qui montre la proposition dans ce cas. En général, K est une extension
de Q(x) de degré e et K est la somme de e copies de Q(x) stables par mx ce qui fait
que TrK/Q (x) = e · TrQ(x)/Q (x) et que NK/Q (x) = (NQ(x)/Q (x))e . Par ailleurs, chaque
4
LAURENT BERGER
plongement σi de Q(x) dans C s’étend en e plongements distincts de K dans C, qui
prennent la même valeur σi (x) sur x. On en déduit la proposition dans le cas général.
On utilise la trace pour définir une forme bilinéaire h·, ·iK : K × K → Q donnée par hx, yiK = TrK/Q (xy). Cette forme est non dégénérée car hx, 1/xiK = [K :
Q] 6= 0. Si α1 , . . . , αd sont d éléments de K, alors le discriminant de cette famille est
disc(α1 , . . . , αd ) = det(hαi , αj iK ). On a alors :
disc(α1 , . . . , αd ) = det(hαi , αj iK ) = det(t (σi (αj ))i,j · (σi (αj ))i,j ) = det((σi (αj ))i,j )2 .
En particulier, si (αi ) = M · (βi ) avec M ∈ Md (Q), alors disc(αi ) = det(M )2 disc(βi ).
Notons aussi que disc(α1 , . . . , αd ) = 0 si et seulement si α1 , . . . , αd sont liés sur Q. Enfin
si K = Q(α), alors :

2
1 σ1 (α)
σ1 (αd−1 )


.
..
..

disc(1, α, . . . , αd−1 ) = det 
.
...
.

 ..
1 σd (α)
σd (αd−1 )
=
Y
(σi (α) − σj (α))2
i<j
0
= ± NK/Q Pmin,α
(α).
2. Entiers algébriques
Si K est un corps de nombres, alors on dit que α ∈ K est entier si Pmin,α (X) ∈ Z[X].
Proposition 2.1. — Si α ∈ K, alors les propriétés suivantes sont équivalentes :
1. α est entier ;
2. il existe P ∈ Z[X] unitaire tel que P (α) = 0 ;
3. Z[α] est un Z-module de type fini.
Démonstration. — Le fait que (1) implique (2) est évident et le fait que (2) implique (1)
suit du lemme de Gauss : si P (α) = 0, alors Pmin,α (X) divise P (X) et est donc unitaire
à coefficients dans Z[X].
Montrons que (2) implique (3) : si P (α) = 0 et si d = deg(P ), alors αd ∈ Z + Zα +
· · · + Zαd−1 et par récurrence, on trouve que Z[α] = Z + Zα + · · · + Zαd−1 ce qui montre
que Z[α] est de type fini.
Montrons enfin que (3) implique (2). Soit x1 , . . . , xn une famille génératrice de Z[α]. Il
existe M ∈ Mn (Z) telle que (αxi ) = M · (xi ) ce qui fait que (α Id −M )(xi ) = (0) et donc
det(α Id −M ) = 0 ce qui fait que P (α) = 0 avec P (X) = det(X Id −M ) qui est unitaire
à coefficients entiers.
5
INTRODUCTION À LA THÉORIE DES NOMBRES
En particulier, si α, β ∈ K sont entiers, alors α ± β et αβ le sont aussi. On note OK
l’ensemble des entiers de K et c’est donc un anneau.
Théorème 2.2. — Si K est un corps de nombres, alors OK est un Z-module libre de
rang d = [K : Q].
Démonstration. — Commençons par remarquer que si α ∈ K, alors il existe m ∈ Z tel
que mα ∈ OK . En effet, si αn + an−1 αn−1 + · · · + a0 = 0 avec ai ∈ Q, alors en mutlipliant
cette relation par mn , on trouve (mα)n + man−1 (mα)n−1 + · · · + mn a0 = 0 et il suffit
donc de prendre m tel que mai ∈ Z pour tout i. On déduit de cela qu’il existe des entiers
α1 , . . . , αd qui forment une base de K/Q. Si α ∈ OK , on peut donc écrire α = di=1 xi αi
avec xi ∈ Q. En appliquant les d plongements σ1 , . . . , σd à cette relation, on trouve :
P





σ1 (α)
σ1 (α1 ) . . . σ1 (αd )
x1
 . 

 . 
..
 . ,
 . =
.
 . 

 . 
σd (α)
σd (α1 ) . . . σd (αd )
xd
et donc :


−1 

x1
σ1 (α1 ) . . . σ1 (αd )
 . 


..

 . =
.
 . 


xd
σd (α1 ) . . . σd (αd )

σ1 (α)
 . 
 . 
 . 
σd (α)



σ1 (α1 ) . . . σ1 (αd )
σ1 (α)
 . 

.
−1
t
 . .
..
= disc(αi ) det((σi (αj ))ij ) · co 
 . 

σd (α1 ) . . . σd (αd )
σd (α)
On déduit de l’équation ci-dessus que disc(αi )xj appartient à OK quel que soit j et donc
à Q ∩ OK = Z ce qui fait que l’on a :
⊕dj=1 Z · αj ⊂ OK ⊂ ⊕dj=1 Z · disc(αi )−1 αj
et donc OK est bien libre de rang d.
Une famille α1 , . . . , αd de OK telle que OK = ⊕di=1 Zαi s’appelle une base entière de
K. Le discriminant de K est le discriminant d’une base entière de K. Si (αi ) et (βi ) sont
deux bases entières de K, alors on a (αi ) = M · (βi ) avec M ∈ GLd (Z) ce qui fait que
disc(αi ) = disc(βi ) et donc que le discriminant de K ne dépend pas du choix de la base
entière.
Lemme 2.3. — Si α1 , . . . , αd est une famille libre de OK et si disc(αi ) est sans facteur
carré, alors α1 , . . . , αd est une base entière de K.
6
LAURENT BERGER
Démonstration. — Si (βi ) est une base entière de K, alors il existe M ∈ Md (Z) telle que
(αi ) = M · (βi ) et donc disc(αi ) = det(M )2 disc(βi ). Le fait que disc(αi ) est sans facteur
carré implique que det(M ) = ±1 et donc que α1 , . . . , αd est une base entière de K.
Exemple 2.4. — Si p ≥ 3 est premier, l’anneau des entiers de K = Q(ζp ) est Z[ζp ].
Démonstration. — Soit π = ζp − 1. Le polynôme P (X) = ((1 + X)p − 1)/X annule π et
est irréductible par le critère d’Eisenstein ; c’est donc le polynôme minimal de π. On en
déduit que [K : Q] = p − 1, que NK/Q (π) = p et que π p−1 ∈ pOK .
On calcule NK/Q (P 0 (π)) en écrivant XP (X) = (1 + X)p − 1 et on trouve que
disc(1, π, . . . , π p−2 ) = ±pp−2 . Ceci montre que Z[π] ⊂ OK ⊂ p−(p−2) Z[π].
Pour montrer que Z[π] = OK , il faut alors voir que si x ∈ OK vérifie px ∈ Z[π], alors
x ∈ Z[π]. Écrivons px = y0 +y1 π+· · ·+yp−2 π p−2 . En multipliant par π p−2 et en utilisant le
fait que π p−1 ∈ pOK , on trouve que y0 π p−2 ∈ pOK et en prenant la norme que y0p−1 ∈ pZ
ce qui fait que y0 ∈ pZ. On traite les autres yi de la même manière.
Lemme 2.5. — Si x ∈ OK est un entier non nul tel que |σ(x)| ≤ 1 pour tout plongement
σ : K → C, alors x est une racine de l’unité.
Démonstration. — On peut supposer que K = Q(x). Le polynôme Pmin,x (X) annule les
Q
{σ(x)}σ:K→C et donc σ:K→C (X − σ(x)) = Pmin,x (X) ∈ Z[X]. La théorie des polynômes
symétriques implique que P (k) (X) =
Q
σ:K→C (X
− σ(xk )) ∈ Z[X] pour tout k ≥ 1.
(k)
On a |σ(xk )| ≤ 1 quel que soit k ≥ 1 et les coefficients ai
(k)
vérifient donc |ai | ≤
d
k
du polynôme P (k) (X)
avec d = [K : Q]. L’ensemble des σ(xk ) avec k ≥ 1 et
σ : K → C est donc fini et il existe donc σ : K → C et i et j distincts tels que
σ(xi ) = σ(xj ) ce qui fait que x est une racine (i − j)-ième de l’unité.
3. Anneaux de Dedekind
Si K est un corps de nombres, alors on cherche à étendre à OK l’arithmétique usuelle
sur Z. Cela nous amène à nous poser les questions suivantes : est-ce que OK est un anneau
principal ? Que dire de la factorisation dans OK ?
√
√
Si K = Q( −5), alors OK = Z[ −5] n’est pas factoriel car :
√
√
6 = 2 × 3 = (1 + −5) × (1 − −5),
√
alors que 2 et 3 et 1 ± −5 sont irréductibles. L’idée de Dedekind a été de remplacer les
√
éléments de OK par les idéaux de OK . Dans Z[ −5], on a alors :
√
√
√
√
6 = (2, 1 + −5) · (2, 1 − −5) · (3, 1 + −5) · (3, 1 − −5),
INTRODUCTION À LA THÉORIE DES NOMBRES
7
et chacun des idéaux ci-dessus est un idéal premier.
Un anneau de Dedekind est un anneau A qui satisfait les trois propriétés suivantes :
1. A est intègre et noethérien ;
2. si I est un idéal premier non nul de A, alors I est maximal ;
3. A est intégralement clos (si K = Frac(A) est un corps de nombres, alors A est
l’anneau des entiers de K).
Proposition 3.1. — Si K est un corps de nombres, alors OK est un anneau de Dedekind.
Démonstration. — L’anneau OK est intègre car OK ⊂ K et il est noethérien car c’est un
Z-module libre de rang d, ce qui montre le (1). Si I est un idéal, alors il existe m ∈ Z ∩ I
non nul (si x ∈ I et P (x) = 0, alors P (0) ∈ Z ∩ I) ce qui fait que OK /I est fini puisque
c’est un quotient de (Z/mZ)d . Si I est premier alors OK /I est intègre, et comme un
anneau intègre fini est un corps, I est maximal ce qui montre le (2). Enfin le (3) suit de
la définition de OK .
Un idéal fractionnaire de A est un A-module I ⊂ K tel qu’il existe x ∈ A vérifiant
x · I ⊂ A. Comme xI · yJ = xyIJ, le produit de deux idéaux fractionnaires est un idéal
fractionnaire. Nous allons montrer que l’ensemble des idéaux fractionnaires non nuls de
A forme un groupe.
Lemme 3.2. — Si A est un anneau noethérien, alors tout idéal I de A contient un
produit d’idéaux premiers.
Démonstration. — Rappelons que dans un anneau noethérien A, tout ensemble non vide
d’idéaux de A admet un élément maximal. S’il existe un idéal I qui ne contient pas un
produit d’idéaux premiers, on peut donc supposer que I est maximal parmi ces idéauxlà ; en particulier, il n’est pas premier et il existe donc r, s ∈ A \ I tels que rs ∈ I. Les
idéaux (I, r) et (I, s) contiennent tous les deux un produit d’idéaux premiers et comme
(I, r) · (I, s) ⊂ I, on a une contradiction.
Lemme 3.3. — Si I est un idéal propre de A, alors il existe λ ∈ K \ A tel que λI ⊂ A.
Démonstration. — Soient a ∈ I et p un idéal premier tel que I ⊂ p. Par le lemme
précedent appliqué à l’idéal (a), il existe des idéaux premiers p1 , . . . , pr tels que :
p1 · · · pr ⊂ (a) ⊂ I ⊂ p
8
LAURENT BERGER
et p est alors l’un des pi disons p1 . On peut supposer que r est minimal et donc que
p2 · · · pr 6⊂ (a) ce qui fait qu’il existe b ∈ p2 · · · pr tel que b ∈
/ (a), c’est-à-dire que
λ = b/a ∈ K \ A. Si x ∈ I, alors x ∈ p = p1 et donc bx ∈ p1 · · · pr ⊂ (a) ce qui revient à
λx ∈ A.
Si I est un idéal fractionnaire de A, on pose I −1 = {x ∈ K tels que xI ⊂ A}.
Proposition 3.4. — Si I est un idéal fractionnaire de A, alors I −1 est un idéal fractionnaire de A et I · I −1 = A.
Démonstration. — Si y ∈ I ∩A, alors yI −1 ⊂ A et donc I −1 est bien un idéal fractionnaire
de A. De plus, cela implique que I ·I −1 est un idéal de A, et il reste à montrer qu’il coïncide
avec A. Si ce n’était pas le cas, alors le lemme précédent appliqué à I · I −1 nous fournirait
λ ∈ K \ A tel que λI · I −1 ⊂ A et par définition de I −1 cela impliquerait que λI −1 ⊂ I −1
et donc que pour tout n ≥ 1 on aurait λn I −1 ⊂ I −1 . Si x ∈ I −1 , on a alors λn ∈ x−1 y −1 A
et donc A[λ] est un A-module libre de type fini ce qui fait que λ ∈ A puisque A est
intégralement clos, contradiction.
Corollaire 3.5. — L’ensemble des idéaux fractionnaires non nuls de A forme un groupe
pour la multiplication, de neutre I = A.
Remarquons que si I et X sont deux idéaux de A, alors on peut écrire I = XY avec
Y un idéal de A si et seulement si I ⊂ X. Un sens est trivial et si I ⊂ X, alors on pose
Y = X −1 I et le fait que I ⊂ X implique que Y ⊂ A.
Théorème 3.6. — Tout idéal de A s’écrit d’une et une seule manière comme un produit
d’idéaux premiers.
Démonstration. — Il faut montrer l’existence et l’unicité de la décomposition. Commençons par l’existence. L’ensemble des idéaux qui ne sont pas un produit d’idéaux premiers
admet un élément maximal I ; cet idéal est inclus dans un idéal maximal p et comme
I ⊂ p, on peut écrire I = pJ. Comme I ⊂ J, on peut écrire J comme produit d’idéaux
premiers J = p1 · · · pr et donc I = pp1 · · · pr .
Montrons maintenant l’unicité de la décomposition. Si l’on avait une égalité p1 · · · pr =
q1 · · · qs alors p1 · · · pr ⊂ q1 et donc il existe i (disons i = 1 quitte à renuméroter) tel que
−1
pi = q1 ce qui fait qu’en multipliant par p−1
1 = q1 on trouve que p2 · · · pr = q2 · · · qs .
Ceci permet de conclure par récurrence que r = s et que quitte à réordonner, on a pi = qi
pour tout i.
9
INTRODUCTION À LA THÉORIE DES NOMBRES
Soit p un nombre premier de Z. Par le théorème 3.6, l’idéal (p) se décompose en un
produit pe11 · · · perr où les pi sont des idéaux premiers distincts contenant p et ei ≥ 1. Les
idéaux p1 , . . . , pr s’appellent les idéaux premiers de OK au-dessus de p. Comme pi est
maximal, OK /pi est un corps de caractéristique p et donc de cardinal pfi où fi ≥ 1.
On dit que ei est l’indice de ramification de pi et que fi est le degré d’inertie de pi .
Réciproquement, si p est un idéal premier de OK alors p ∩ Z = pZ pour un nombre
premier p.
Lemme 3.7. — Si p est un idéal premier de OK et e ≥ 1, alors OK /pe est principal.
On a card(OK /pe ) = card(OK /p)e .
Démonstration. — Les idéaux de OK /pe sont en bijection avec les idéaux de OK qui
contiennent pe et sont donc des puissances de p/pe . Soit π ∈ p \ p2 . On a (π) = p · q1 · · · qr
avec qi 6= p pour tout i. Comme pe + qi = OK , on a bien (π) = p dans OK /pe . Ceci
implique que pk /pk+1 est un OK /p-espace vectoriel de dimension 1, engendré par π k . Le
cardinal de OK /pe en suit par dévissage.
Corollaire 3.8. — Si pOK = pe11 · · · perr , alors
Pr
i=1 ei fi
= d.
Démonstration. — On a card(OK /pOK ) = pd . Par ailleurs, OK /pOK =
donc pd = p
P
ei fi
Qr
i=1
OK /pei i et
par le lemme précédent.
La proposition suivante donne un moyen de calculer la décomposition des idéaux premiers si l’anneau des entiers de K est monogène.
Proposition 3.9. — Soit K un corps de nombres et α ∈ OK tel que OK = Z[α] et Q(X)
le polynôme minimal de α. Si p est un nombre premier, soit Q(X) = Q1 (X)e1 · · · Qr (X)er
la décomposition de Q(X) dans Fp [X] où les Qi (X) sont unitaires irréductibles et distincts. Soit Qi (X) ∈ Z[X] unitaire qui se réduit sur Qi (X) et pi = (p, Qi (α)).
L’idéal pi est alors premier dans OK , les pi sont distincts, et pOK = pe11 · · · perr .
Démonstration. — On a OK /pi = Z[X]/(p, Q(X), Qi (X)) = Fp [X]/Qi (X) qui est un
corps car Qi (X) est irréductible. Ceci montre que pi est premier. Par ailleurs pi +
pj = (p, Qi (α), Qj (α)) = OK et donc les pi sont premiers entre eux. Enfin soit fi =
Q
Q
card(OK /pi ) = deg(Qi (X)). On a Q(X) = Qi (X)ei +pR(X) ce qui fait que Qi (α)ei ∈
pOK et donc pe11 · · · perr ⊂ pOK . Comme
Pr
i=1 ei fi
= d, cette inclusion est une égalité par
le corollaire 3.8.
Corollaire 3.10. — Si K est un corps de nombres tel que OK est monogène, et si p est
premier, alors p est ramifié dans K si et seulement si p divise disc(K).
10
LAURENT BERGER
0
Démonstration. — On a disc(K) = ± NK/Q Pmin,α
(α) = ±res(P, P 0 ) et donc p divise
disc(K) si et seulement si Pmin,α (X) a une racine double dans Fp [X].
Ce corollaire est toujours vrai même si OK n’est pas monogène, mais la démonstration
est plus technique.
4. Corps finis et résidus quadratiques
La décomposition des nombres premiers dans les corps quadratiques demande de savoir
quels entiers sont des carrés modulo un nombre premier donné, ce que nous étudions à
présent. Dans tout ce chapitre, p est un nombre premier avec p 6= 2. Rappelons que F×
p
2
×
×
est un groupe cyclique de cardinal p − 1. L’application x 7→ x de Fp → Fp a pour
noyau {±1} et son image est donc de cardinal (p − 1)/2. Si a ∈ Z, on dit que a est un
carré modulo p, ou encore un résidu quadratique modulo p, si l’image de a dans Fp est
un carré. On définit une fonction, le symbole de Legendre
p divise a,
a
p
= 1 si a est un carré non nul modulo p et
a
p
·
p
→ {0, ±1} par
a
p
= 0 si
= −1 si a n’est pas un carré
modulo p.
Lemme 4.1. — On a
a
p
≡ a(p−1)/2 mod p.
Démonstration. — On a manifestement
Le polynôme X
p−1
−1 est le produit de X
a
(p−1)/2
p ≡ a
(p−1)/2
mod p si a est un carré modulo p.
−1 par X (p−1)/2 +1 et est décomposé dans
Fp [X]. Les racines de X (p−1)/2 − 1 sont les carrés non nuls et les racines de X (p−1)/2 + 1
sont donc les non-carrés.
Ceci implique que
ab
p
=
Exemple 4.2. — On a
Démonstration. — On a
a
p
−1
p
×
b
p
.
= 1 si p = 1 mod 4 et
≡ (−1)(p−1)/2 mod p.
−1
p
−1
p
= −1 si p = 3 mod 4.
Le théorème suivant est la célèbre loi de réciprocité quadratique, conjecturée par Euler
et Legendre, et démontrée (six fois !) par Gauss (1801).
Théorème 4.3. — Si p et q sont deux nombres premiers impairs, alors :
p
q
=
q p
· (−1)
(p−1)(q−1)
4
p2 −1
2
= (−1) 8 .
p
,
et
11
INTRODUCTION À LA THÉORIE DES NOMBRES
Démonstration. — Soit ζ = exp(2iπ/p) et a ∈ Z. On se place dans K = Q(ζ). On définit
les sommes de Gauss par G(a) =
p−1
X
G(a)G(−a) =
a=0
p−1
X p−1
X
a G(1)q −
que
∗
p
q
=
k=0 p
k
p
a=0 k,j=0
En particulier, si on pose p∗ =
Pp−1 k ak
ζ .
q
· G(1) ∈ qOK et
p q
p , ce qui implique
On voit que G(a) =
p−1
X k
j ak−aj
ζ
=
p
p
k,j=0
! −1
p
! p−1
j X
p
a
p
G(1). Par ailleurs,
ζ ak−aj = p(p − 1).
a=0
p, alors G(1)2 = p∗ et donc (p∗ )(q−1)/2 = G(1)q−1 . On
donc G(1) · (p∗ )(q−1)/2 −
q
p
· G(1) ∈ qOK . Ceci montre
la première formule puisque
−1
p
= (−1)(p−1)/2 .
La deuxième se démontre de manière similaire : on pose G = ζ8 +ζ87 de sorte que G2 = 2
et 2(p−1)/2 = Gp−1 . On a donc G · 2(p−1)/2 ≡ ζ8p + ζ87p mod p et il sufit alors d’examiner les
quatre possibilités pour p mod 8.
Le théorème permet de calculer
a
p
en écrivant a = q1 · · · qr et
a
p
=
Qr
i=1
qi
p
. Par
exemple,
3
19
73
73
16
57
=
·
=
·
=1·
= 1.
73
73
3 19
19
73
Ce théorème implique aussi que la valeur de ap , quand p varie, p ne divisant pas a, ne
dépend que de p modulo a ou 4a. Par exemple,
p = 2, 3 mod 5. De même,
3
p
5
p
= 1 si p = 1, 4 mod 5 et
= 1 si p = 1, 11 mod 12 et
3
p
5
p
= −1 si
= −1 si p = 5, 7 mod 12.
Les résidus quadratiques (et donc aussi les non-résidus) ne peuvent pas s’accumuler en
de longues plages, comme le montre l’inégalité de Polya-Vinogradov ci-dessous.
Théorème 4.4. — Si a ∈ Z et n ≥ 1, alors
a+n
X j j=a p <
Démonstration. — Rappelons que si G(j) =
√
p log(p).
Pp−1 k jk
ζ ,
k=1 p
alors G(j) =
j
p
G(1). On a
p−1
p−1
a+n
a+n
X p−1
X k
X
X
X k
X k a+n
j
ζ k(n+1) − 1
=
G(j) =
ζ jk =
.
G(1) ·
ζ jk =
ζ ka
p
p
p j=a
ζk − 1
j=a k=1 p
j=a
j=a
k=1
k=1
√
Rappelons que |G(1)| = p. On a |ζ k(n+1) − 1| ≤ 2 et |ζ k − 1| = 2 sin(kπ/p). Si x ≤ π/2,
alors sin(x) ≥ 2/π · x et donc
a+n
X
a+n
X j j=a p !
!
p−1
!
p−1
2
2
X k
ζ k(n+1) − 1 1 p−1
2 X
1
1 √
√ X
=√ ζ ka
≤
≤
p
< p log(p).
√
k
p k=1 p
ζ −1 p k=1 2/π · kπ/p
k=1 k
!
Le théorème implique que dans tout intervalle [a; a + n] ⊂ [1; p − 1], les nombres R et
√
N de résidus et de non-résidus vérifient |R − N | < p log(p).
12
LAURENT BERGER
5. Groupes de classes
Notons IK le groupe des idéaux fractionnaires de K et PK le sous-groupe de IK
constitué des idéaux fractionnaires principaux. Le groupe de classes de OK est le groupe
Cl(OK ) = IK /PK . Le résultat principal de ce chapitre est le suivant :
Théorème 5.1. — Le groupe Cl(OK ) est un groupe fini.
Ce théorème sera démontré un peu plus tard. Avant cela, nous faisons quelques compléments sur les idéaux de OK .
Si f : Zd → Zd est injective et si M est la matrice de f dans une base de Zd , alors
Zd /f (Zd ) est fini de cardinal |det(M )|. En appliquant cela à l’endomorphimse mx de OK
on trouve que si x ∈ OK alors |NK/Q (x)| = card(OK /(x)). Si I est un idéal de OK alors
on pose N(I) = card(OK /I).
Lemme 5.2. — Si I et J sont deux idéaux de OK alors N(IJ) = N(I) N(J).
Démonstration. — Écrivons I =
Q
OK /psi i et OK /IJ =
Q
Q ri
pi et J =
Q si
pi . On a OK /I =
Q
OK /pri i et OK /J =
OK /pri i +si . Par le lemme 3.7, on a card(OK /pe ) = card(OK /p)e .
Cela implique le lemme.
Si I est un idéal et si a ∈ I vérifie |NK/Q (a)| = N(I), alors I = (a) et donc I est
principal.
Proposition 5.3. — Il existe une constante G (qui ne dépend que de K) telle que pour
tout idéal I de OK , il existe α ∈ I vérifiant |NK/Q (α)| ≤ G · N(I).
Démonstration. — Soit α1 , . . . , αd une base de OK et Gi =
Pd
j=1
|σi (αj )|. Si m ≥ 1, alors
l’ensemble {m1 α1 + · · · + md αd } où 0 ≤ mi ≤ m est de cardinal (m + 1)d et si l’on choisit
m de manière que md ≤ card(OK /I) < (m + 1)d , alors par le principe des tiroirs il existe
α = n1 α1 + · · · + nd αd ∈ I non nul avec |ni | ≤ m. On a |σi (α)| ≤ Gi · m quel que soit i
et donc |NK/Q (α)| ≤ G · N(I) avec G = G1 · · · Gd .
Une classe d’idéaux est une classe à gauche de PK dans IK . Si C est une classe d’idéaux
et I ∈ C −1 est un idéal de OK , alors par la proposition ci-dessus il existe α ∈ I tel que
|NK/Q (α)| ≤ G · N(I). Comme (α) ⊂ I, on peut écrire (α) = IJ et donc J est un idéal
de OK appartenant à C qui vérifie N(J) ≤ G.
Démonstration du théorème 5.1. — Pour terminer la démonstration du théorème 5.1, il
faut donc montrer qu’il n’existe qu’un nombre fini d’idéaux I de OK vérifiant N(I) ≤ G
puisque les classes de ces idéaux recouvrent Cl(OK ).
INTRODUCTION À LA THÉORIE DES NOMBRES
13
Si I est un tel idéal alors par le théorème 3.6, on peut écrire I = pn1 1 · · · pnr r et donc
N(I) = N(p1 )n1 · · · N(pr )nr . Si pi est un idéal au-dessus de pi , alors N(pi ) ≥ pi . On a donc
pi ≤ G et pour chacun de ces pi l’exposant ni de pi est borné par pni i ≤ G. Ceci achève
la démonstration.
6. Le premier cas du théorème de Fermat
Soit p un nombre premier impair. Le but de ce chapitre est de montrer le théorème
suivant, le premier cas du théorème de Fermat, sous l’hypothèse que p est régulier, c’està-dire que p ne divise pas |Cl(OK )|. Ce théorème est dû à Kummer (1850), et s’inspire
d’une démonstration incorrecte de Lamé (1847) (qui supposait implicitement que OK
était principal, erreur relevée par Liouville).
Théorème 6.1. — Si p ne divise pas |Cl(OK )|, alors l’équation xp + y p = z p n’a pas de
solutions en nombres entiers avec p - xyz.
Avant de montrer ce théorème, faisons quelques compléments sur le corps K = Q(ω)
où ω = exp(2iπ/p). C’est une extension de Q de degré p − 1 et les p − 1 plongements
de K dans C sont donnés par ω 7→ ω j avec j = 1, . . . , p − 1. Rappelons que OK = Z[ω]
(cf. exemple 2.4). Par la proposition 3.9, le nombre premier p est totalement ramifié dans
OK et on a (p) = (ω − 1)p−1 . Si i 6= 0 mod p, alors (ω i − 1)/(ω − 1) est une unité de
OK . On note z 7→ z la conjugaison complexe sur C et on pose F = {x ∈ K tels que
x = x}. On utilisera plusieurs fois l’observation que si α = α0 + · · · + αp−2 ω p−2 ∈ OK et
p
, alors αp − m ∈ pOK
si m = α0p + · · · + αp−2
×
Lemme 6.2. — Si u ∈ OK
, alors il existe r ∈ Z et v ∈ OF× tels que u = ω r v.
×
Démonstration. — Si u ∈ OK
, alors u/u est un élément de OK tel que pour tout plongement σ : K → C, on a |σ(u/u)| = 1 et c’est donc une racine de l’unité par le lemme
de Kronecker. Par l’observation ci-dessus, il existe m ∈ Z tel que up − m ∈ pOK et donc
(u/u)p ∈ 1 + pOK . Comme 1 + pOK est sans torsion, on a (u/u)p = 1 et il existe donc
r ∈ Z tel que u/u = ω 2r = ω r /ω −r ce qui implique le lemme.
Démonstration du théorème 6.1. — On suppose que p ≥ 5 (la démonstration du théorème de Fermat pour p = 3 est classique). On se donne x, y, z ∈ Z premiers entre eux tels
que xp + y p = z p et on suppose que p - xyz. Quitte à remplacer (x, y, z) par (x, −z, −y),
on peut de plus supposer que x 6= y mod p.
On a (z)p =
Qp−1
j=0 (x + yω
j
). Montrons que les idéaux (x + yω j ) sont premiers entre eux
deux à deux dans OK pour 0 ≤ j ≤ p − 1. On a x + yω j − (x + yω i+j ) = yω j (ω i − 1) et
14
LAURENT BERGER
ω i (x + yω j ) − (x + yω i+j ) = x(ω i − 1). L’idéal I engendré par x + yω j et x + yω i+j contient
donc x(ω − 1), y(ω − 1) et z p . Comme x, y et z p sont premiers entre eux, I contient ω − 1
et donc p. Comme p - z p , on a I = OK .
j
Les idéaux (x + yω j ) sont premiers entre eux et (z)p = p−1
j=0 (x + yω ) et donc chacun
d’entre eux est une puissance pième. Soit Ij l’idéal tel que Ijp = (x+yω j ). Si p ne divise pas
Q
|Cl(OK )|, alors Ijp principal implique Ij principal, et on peut donc écrire x + yω j = uj αjp
×
avec uj ∈ OK
et αj ∈ OK . En particulier, on a x + yω = uαp .
Par le lemme 6.2, on peut écrire u = ω r v où v ∈ OF× . Par ailleurs, il existe m ∈ Z tel
que αp − m ∈ pOK . Ceci implique que ω −r (x + yω) ∈ vm + pOK et en conjuguant que
ω r (x + yω −1 ) ∈ vm + pOK aussi. On trouve que xω r + yω r−1 − xω −r − yω 1−r ∈ pOK .
Il suffit alors d’examiner les cas, en utilisant le fait que si β = β0 + β1 ω + · · · + βp−1 ω p−1
avec l’un des βi = 0, alors β ∈ pOK si et seulement si p divise tous les βi . Si r 6=
0, 1/2 mod p, alors on trouve que p divise x. Si r = 0, alors p divise y. Si r = 1/2, alors
p divise x − y.
Les nombres premiers qui ne sont pas réguliers sont 37, 59, 67, 101, 103, 131, 149, . . .
√
Siegel conjecture que 1/ e (soit à peu près 60,65%) des nombres premiers sont réguliers,
mais on ne sait même pas s’il y en a une infinité.
7. Formes quadratiques binaires
Une forme quadratique binaire est une fonction q : Z2 → Z qui est de la forme (x, y) 7→
ax2 + bxy + cy 2 avec a, b, c ∈ Z. Les entiers a, b et c sont alors déterminés par q et on note
(a, b, c) pour la forme q. Si n ∈ Z, on dit que q représente n s’il existe (x, y) ∈ Z2 tels que
q(x, y) = n (si n = 0, on demande en plus que (x, y) 6= (0, 0)). On dit que q représente n
primitivement si en plus on peut prendre x et y premiers entre eux. Le discriminant de
q = (a, b, c) est D = disc(q) = b2 − 4ac. On a D ≡ 0, 1 mod 4. Si D ≡ 0 ou 1 mod 4, alors
la forme principale qD de discriminant D est (1, 0, −D/4) ou (1, 1, (1 − D)/4).
Proposition 7.1. — Soit q une forme quadratique binaire.
1. La forme q représente 0 si et seulement si D est un carré.
2. Tous les entiers représentés par q sont de même signe si et seulement si D ≤ 0.
Démonstration. — Si a = 0, alors D = b2 et q(x, y) = y(bx + cy). Le (1) et le (2) sont
alors évidents. On suppose donc que a =
6 0. On a 4a · q(x, y) = (2ax + by)2 − y 2 D. Si
q(x, y) = 0 avec (x, y) 6= (0, 0), alors y 6= 0 et D = (2ax + by)2 /y 2 est un carré. Si D = z 2 ,
alors q(x, y) = 0 si 2ax + by = yz. Ceci montre le (1).
15
INTRODUCTION À LA THÉORIE DES NOMBRES
Si D ≤ 0, alors les valeurs de q(x, y) ont le même signe que a. Réciproquement, 4a ·
q(1, 0) = 4a2 > 0 et 4a · q(−b, 2a) = −4a2 D < 0. Ceci montre le (2).
Si P ∈ M2 (Z) et
x0
y0
= P · ( xy ), alors la fonction (x, y) 7→ q(x0 , y 0 ) est aussi une forme
quadratique binaire, notée q ◦P . On a q ◦P R = (q ◦P )◦R et disc(q ◦P ) = disc(q) det(P )2 .
On dit que deux formes q1 et q2 sont équivalentes, noté q1 ∼ q2 , s’il existe P ∈ GL2 (Z)
+
telle que q1 ◦ P = q2 et on dit que q1 et q2 sont proprement équivalentes, noté q1 ∼ q2 , s’il
1 k
existe P ∈ SL2 (Z) telle que q1 ◦ P = q2 . Par exemple, via ( 10 −1
0 ) et ( 0 1 )
+
+
(a, b, c) ∼ (c, −b, a) ∼ (a, b + 2ka, ak 2 + bk + c).
0
Avec ( −1
0 1 ), on trouve que (a, b, c) ∼ (a, −b, c). Deux formes équivalentes représentent les
mêmes entiers et ont le même discriminant. Les formes (2, 2, 3) et (1, 0, 5) ont le même
discriminant −20 mais ne sont pas équivalentes car la première représente 2 mais pas la
seconde.
Le problème de savoir quels entiers sont représentés par quelles formes quadratiques a
motivé le développement de la théorie, notamment par Lagrange. Rappelons par exemple
que les nombres premiers impairs de la forme x2 + y 2 sont exactement ceux qui valent
1 mod 4, et que les entiers n de la forme x2 + y 2 sont donc ceux tels que si p ≡ 3 mod 4
divise n, alors vp (n) est pair.
Proposition 7.2. — Si n ∈ Z, alors q représente n primitivement si et seulement s’il
+
existe b, c ∈ Z tels que q ∼ (n, b, c). Dans ce cas, on peut prendre −|n| < b ≤ |n| si n 6= 0.
+
Démonstration. — Si q = (n, b, c), alors q(1, 0) = n et donc si q ∼ (n, b, c), alors q
représente n primitivement. Supposons à présent que q(x, y) = n avec x ∧ y = 1. Par
0
Bezout, il existe x0 , y 0 tels que xy 0 − x0 y = 1, c’est-à-dire que P = xy xy0 ∈ SL2 (Z). On a
(q ◦ P )(1, 0) = q(x, y) = n et donc q ◦ P = (n, ∗, ∗). Le fait que pour tout k ∈ Z, on a
+
(n, b, c) ∼ (n, b + 2kn, nk 2 + bk + c)
permet ensuite de transformer q ◦ P en une forme proprement équivalente avec −|n| <
b ≤ |n| si n 6= 0.
+
Corollaire 7.3. — Une forme q de discriminant D représente 1 ssi q ∼ qD .
Démonstration. — Il est immédiat que qD représente 1. Réciproquement, la proposition
+
7.2 montre que si q représente 1, alors q ∼ (1, b, c) avec b ∈ {0, 1}. Comme D ≡ b mod 2,
b est déterminé puis c = (b2 − D)/4.
Corollaire 7.4. — Si n ∈ Z, alors il existe une forme q de discriminant D qui représente n primitivement si et seulement si D est un carré modulo 4n.
16
LAURENT BERGER
+
Démonstration. — On a q ∼ (n, b, c) et donc D = b2 − 4nc est un carré modulo 4n.
Réciproquement, si D est un carré modulo 4n, alors il existe b et c tels que D = b2 −4nc
et si q = (n, b, c), alors q(1, 0) = n. Il existe donc une forme quadratique q de discriminant
D qui représente n primitivement.
Théorème 7.5. — Si p est un nombre premier tel que D est un carré modulo 4p, alors
à équivalence ∼ près, p est représenté par une unique forme de discriminant D.
Démonstration. — On vient de voir l’existence, montrons l’unicité. Comme dans la
preuve de la proposition 7.2, on peut remplacer q par une forme équivalente de telle
sorte que |b| ≤ p, et on peut de plus supposer b ≥ 0 si on travaille avec ∼. Notons que
b détermine c car c = (b2 − D)/4p. Il ne reste plus qu’à vérifier qu’il n’existe qu’un seul
0 ≤ b ≤ p tel que D ≡ b2 mod 4p.
Ce théorème dû à Lagrange pose la question des classes d’équivalence de formes.
Théorème 7.6. — Si D 6= 0, alors il n’y a qu’un nombre fini de formes de discriminant
+
D à équivalence ∼ près.
Démonstration. — Supposons que D n’est pas un carré, de sorte que 0 n’est pas représenté par q par la proposition 7.1. Soit alors m > 0 le plus petit entier qui est de la
forme |q(x, y)| avec (x, y) 6= (0, 0) et a = ±m la valeur correspondante de q(x, y). Par la
+
proposition 7.2, on a q ∼ (a, b, c) avec |b| ≤ |a|. Par ailleurs, q(0, 1) = c et
donc |a| ≤ |c|.
q
On en déduit que 4|a|2 ≤ 4|ac| = |b2 − D| ≤ |a|2 + |D| et donc |a| ≤
|D|/3. Comme
|b| ≤ |a| et que c est déterminé par a, b et D, le théorème suit.
Si D = b2 est un carré avec b ≥ 1, alors on montre qu’il existe 0 ≤ c ≤ b − 1 tel que
+
q ∼ (0, b, c).
Si D < 0, le théorème de Gauss ci-dessous permet de simplifier le calcul de l’ensemble
+
des classes d’équivalence pour ∼. Disons que la forme positive (a, b, c) est réduite si
−a < b ≤ a ≤ c, avec b ≥ 0 si a = c.
+
Théorème 7.7. — Si D < 0, alors toute forme quadratique positive est ∼ à une unique
forme réduite.
Démonstration. — Soit a comme dans la démonstration du théorème de Lagrange. La
+
proposition 7.2, et le fait que (a, b, a) ∼ (a, −b, a), impliquent que toute forme positive
de discriminant D < 0 est équivalente à une forme réduite (a, b, c). Il faut donc vérifier
l’unicité.
INTRODUCTION À LA THÉORIE DES NOMBRES
17
Lemme 7.8. — Si q = (a, b, c) est positive et réduite, alors a est le plus petit entier
primitivement représenté par q. De plus,
1. si a < c, alors a = q(x, y) ssi (x, y) = (±1, 0) et c est le deuxième plus petit entier
primitivement représenté par q. Dans ce cas, c = q(x, y) pour deux vecteurs primitifs
(x, y), sauf si b = a auquel cas il y en a quatre ;
2. si a = c, alors a = q(x, y) pour quatre vecteurs primitifs (x, y), sauf si b = a auquel
cas il y en a six.
Démonstration. — Si q est réduite, alors |D| = 4ac−b2 ≥ 3ac. Rappelons que 4a·q(x, y) =
(2ax + by)2 + y 2 |D|.
1. Si |y| ≥ 2, alors 4a · q(x, y) ≥ 4|D| ≥ 12ac et donc q(x, y) ≥ 3c.
2. Si y = ±1, alors |2ax + by| ≥ b car |b| ≤ |a| et donc 4a · q(x, y) ≥ b2 + 4ac − b2 ≥ 4ac
et q(x, y) ≥ c, avec égalité pour x = 0 si a 6= b et pour x = 0 et x = −y si a = b.
3. Si y = 0, alors q(x, y) = ax2 et q(x, y) = a ssi x = ±1.
On montre le lemme en examinant les cas ci-dessus.
Revenons à la démonstration du théorème, en remarquant que deux formes équivalentes
représentent primitivement les mêmes entiers le même nombre de fois. Si q = (a, b, c) et
q 0 = (a0 , b0 , c0 ) sont positives réduites et équivalentes, alors a = a0 . Si a est représenté deux
fois, alors c = c0 est le deuxième plus petit entier primitivement représenté par q. Sinon,
a = c et donc a0 = c0 ce qui fait que c = c0 aussi.
Comme D = D0 , on a b0 = ±b. Si a = c, alors b0 , b ≥ 0 et donc b0 = b. Si a 6= c, alors
le (1) du lemme 7.8 montre que a = b si et seulement si a0 = b0 . Supposons donc que
a 6= b et donc que a et c sont chacun représentés primitivement exactement deux fois,
par (±1, 0) et par (0, ±1). La matrice P ∈ SL2 (Z) qui envoie q sur q 0 doit donc envoyer
0
{(±1, 0)} sur lui-même et {(0, ±1)} sur lui-même ce qui fait que P = ±1
et donc
0 ±1
P = ± Id puisque det(P ) = 1.
+
On note Cl(D) l’ensemble des classes de formes de discriminant D pour la relation ∼
(si D < 0, on ne considère que les formes positives, c’est à dire telles que q(Z2 ) ⊂ Z≥0 ).
Si D < 0, le théorème 7.7 et la démonstration du théorème
7.6 donnent un moyen facile
q
de calculer Cl(D) : pour tout b ∈ Z, tel que |b| ≤ −D/3 et b ≡ D mod 2, on écrit les
triplets (a, b, c) tels que 4ac = b2 − D avec |b| ≤ a ≤ c. L’ensemble des tels triplets (a, b, c)
qui sont en plus réduits forme un système de représentants de Cl(D).
Exemple 7.9. — Si D ∈ {−3, −4, −7, −8, −11, −12}, alors h(D) = 1 et h(−15) = 2.
18
LAURENT BERGER
1. La forme x2 + y 2 a pour discriminant −4 et c’est la seule à équivalence près. Le
théorème de Lagrange nous dit que tout nombre premier tel que −4 est un carré
modulo p est de la forme x2 + y 2 .
2. Si D = −20, alors il y a deux formes réduites (2, 2, 3) et (1, 0, 5). On trouve donc
que tout nombre premier p tel que −20 est un carré modulo p est de la forme
2x2 + 2xy + 3y 2 ou (exclusif) x2 + 5y 2 . En fait, si p = x2 + 5y 2 , alors p est un carré
modulo 5. Si p = 2x2 + 2xy + 3y 2 , alors 2p = 4x2 + 4xy + 6y 2 = (2x + y)2 + 5y 2
et donc p n’est pas un carré modulo 5. Ce phénomène est un cas particulier de la
théorie du genre pour les formes quadratiques.
Nous allons maintenant voir qu’il y a un lien fort avec la théorie des classes d’idéaux
dans les corps quadratiques. Pour simplifier, nous considérons des corps quadratiques
imaginaires. Soit donc K un corps quadratique imaginaire de discriminant D. On a OK =
√
√
Z⊕Zα ⊂ C avec α = D/2 ou (1+ D)/2 selon que D ≡ 0 ou 1 mod 4. Si I est un idéal
non nul de OK , alors c’est un Z-module libre de rang 2 et il admet donc une base u, v. Si
l’on écrit u = u1 + αuα et v = v1 + αvα , on peut supposer (quitte à remplacer v par −v)
que u, v est une base directe de I par rapport à 1, α, c’est-à-dire que u1 vα − uα v1 > 0. On
définit alors une fonction qu,v sur Z2 par qu,v (x, y) = NK/Q (ux + vy)/ N(I). Le théorème
ci-dessous est dû à Dedekind.
Théorème 7.10. — La fonction qu,v est une forme quadratique binaire positive de discriminant D, la classe de qu,v dans Cl(D) ne dépend que de la classe de I dans Cl(OK ),
et l’application I 7→ q u,v donne une bijection entre Cl(OK ) et Cl(D).
Démonstration. — La fonction qu,v est de la forme ax2 + bxy + cy 2 avec a, b, c ∈ Q.
Si x, y ∈ Z, alors z = ux + vy ∈ I et on peut écrire (z) = IJ. On a donc q(x, y) =
N((z))/ N(I) = N(J) ∈ Z≥0 , et qu,v est donc une forme quadratique binaire positive.
Notons que q1,α = qD et que cette forme est bien de discriminant D. Si (u, v) est une
base de I et si P est la matrice de (u, v) dans la base (1, α), alors qu,v = (q1,α ◦ P )/N (I)
et det(P ) = N (I) ce qui fait que disc(qu,v ) = D.
Montrons que la classe de qu,v ne dépend que de la classe de I. Si s, t est une autre
base directe de I, alors il existe P ∈ SL2 (Z) telle que ( st ) = P ( uv ) et alors qs,t = qu,v ◦ P .
Enfin si I 0 = zI avec z ∈ K × est un idéal de OK , alors zu, zv est une base directe de I 0
et qzu,zv (x, y) = N(xzu + yzv)/ N(zI) = NK/Q (xu + yv)/ N(I) = qu,v (x, y) et donc en fait
qzu,zv = qu,v .
Définissons à présent une application de Cl(D) → Cl(OK ). Si q = (a, b, c) est une forme
quadratique binaire positive de discriminant D, alors a > 0 car q est positive. On voit
INTRODUCTION À LA THÉORIE DES NOMBRES
que q(x, y) = a · NK/Q (x + τ y) où τ = (b +
√
19
D)/2a est déterminé par cette formule
et le fait que 1, τ est directe. On a aτ ∈ α + Z de sorte que OK = Z ⊕ aτ Z. Posons
Iq = aZ ⊕ aτ Z. Comme (aτ )2 = b(aτ ) − ac, Iq est un idéal de OK . On a OK /Iq = Z/aZ
de sorte que N(Iq ) = a et donc q = qa,aτ . De plus, la base a, aτ est directe. Si q 0 = q ◦ P
avec P = ge fh ∈ SL2 (Z), alors
q 0 (x, y) = a · NK/Q ((ex + f y) + τ (gx + hy))
= a · NK/Q (x(e + τ g) + y(f + τ h)) = a0 · NK/Q (x + τ 0 y),
où a0 = a · NK/Q (e + τ g) et τ 0 = (f + hτ )/(e + gτ ).
On a alors Iq0 = a0 Z ⊕ a0 τ 0 Z, la base a0 , a0 τ 0 de Iq0 est directe, et
(e + gτ )Iq0 = (e + gτ )a0 Z ⊕ a0 (e + gτ )τ 0 Z = (e + gτ )a0 Z ⊕ (f + hτ )a0 Z = a0 (Z ⊕ τ Z),
ce qui fait que Iq et Iq0 ont même image dans Cl(OK ). L’application q 7→ Iq passe bien au
quotient. Pour terminer la démonstration du théorème, il suffit de vérifier que I 7→ q u,v
et q 7→ I q sont bien inverses l’une de l’autre.
Corollaire 7.11. — Si K est un corps quadratique imaginaire de discriminant D, les
√
idéaux a · Z ⊕ (b + D)/2 · Z, où (a, b, c) parcourt l’ensemble des formes réduites positives
de discriminant D, sont un système de représentants de Cl(OK ).
Remarquons que le théorème 7.10 implique que Cl(D) admet une structure naturelle
de groupe. On peut définir la notion de composition de deux formes quadratiques, et
retrouver ainsi cette structure sur Cl(D).
Si l’on suppose à présent que K est un corps quadratique réel, alors on obtient presque
le même résultat. Disons que deux idéaux I et J de OK sont strictement équivalents
si I = αJ avec α ∈ K × vérifiant N(α) > 0 et soit Cl+ (OK ) l’ensemble des classes
d’équivalence stricte d’idéaux. On a alors une surjection Cl+ (OK ) → Cl(OK ) dont le
noyau est Z/2Z ou {1} et le théorème 7.10 devient une bijection entre Cl+ (OK ) et Cl(D).
8. Géométrie des nombres
Afin de déterminer efficacement le groupe de classes d’un corps de nombres K, on a
besoin de connaître la proposition 5.3 avec une constante G aussi petite que possible,
c’est l’objet de la théorie de Minkowski.
Si G est un sous-groupe de Rn , on dit que G est discret si quelle que soit la partie bornée
B de Rn , l’ensemble G ∩ B est fini. Dans ce cas, il existe h1 , . . . , hr ∈ G linéairement
20
LAURENT BERGER
indépendants dans Rn tels que G = ⊕ri=1 Zhi . Rappelons en passant que si G est un sousgroupe fermé de R, alors il existe un sous-espace vectoriel V de Rn et un sous-groupe
discret H de Rn tels que G = V ⊕ H.
Un réseau de Rn est un sous-groupe discret de Rn qui est de rang r = n. Dans la
suite, on fixe la base canonique e1 , . . . , en de Rn . Si Λ = ⊕ni=1 Z`i est un réseau de Rn , le
volume de Λ est vol(Λ) = |det(M )| où M est la matrice des (`i ) dans la base (ei ) ; cette
définition ne dépend pas du choix de la base (`i ) et vol(Λ) est le volume d’un domaine
fondamental de Λ.
Lemme 8.1. — Si M est une partie mesurable de Rn telle que vol(M ) > vol(Λ), alors
il existe deux points distincts m1 et m2 de M tels que m1 − m2 ∈ Λ.
Démonstration. — Le tore Rn /Λ est muni d’une mesure de mesure totale vol(Λ) et si la
projection naturelle π : Rn → Rn /Λ était injective sur M , on aurait vol(M ) ≤ vol(Λ).
On déduit de cela le théorème de Minkowski ci-dessous.
Théorème 8.2. — Si Λ est un réseau de Rn et si C ⊂ Rn est une partie convexe et
symétrique par rapport à l’origine de volume vol(C) > 2n vol(Λ), alors il existe ` 6= 0
appartenant à C ∩ Λ.
Si on suppose en plus que C est compact, alors il suffit que vol(C) ≥ 2n vol(Λ).
Démonstration. — Le lemme 8.1 appliqué à M = 1/2 · C, nous donne c1 6= c2 ∈ C tels
que 1/2 · (c1 − c2 ) ∈ Λ. Comme C est convexe et symétrique par rapport à l’origine,
1/2 · (c1 − c2 ) ∈ C ce qui montre le premier résultat. Le deuxième se déduit par compacité
du premier appliqué à C + B(0, ε) avec ε → 0 (utiliser le fait que Λ \ {0} est fermé).
Revenons à présent à un corps de nombres K, dont on note σ1 , . . . , σd les plongements
dans C, ordonnés comme suit : les plongements réels sont σ1 , . . . , σr1 et les plongements
complexes sont σr1 +1 , . . . , σr1 +r2 , σ r1 +1 , . . . , σ r1 +r2 . On identifie C à R2 et on définit une
application σ : K → Rd par :
σ(x) = (σ1 (x), . . . , σr1 (x), Re(σr1 +1 (x)), Im(σr1 +1 (x)), . . . , Re(σr1 +r2 (x)), Im(σr1 +r2 (x))) .
C’est clairement une application injective.
Lemme 8.3. — L’image de OK par l’application σ ci-dessus est un réseau de Rd dont
le volume est :
1 q
vol(σ(OK )) = r2 |disc(K)|.
2
21
INTRODUCTION À LA THÉORIE DES NOMBRES
Démonstration. — L’image G de OK par σ est un sous-groupe et si x ∈ G ∩ B(0, 1/2),
alors |σi (x)| < 1 pour tout i et donc |NK/Q (x)| < 1 ce qui fait que x = 0. On en déduit que
G ∩ B est fini pour toute partie bornée B et donc que G est discret. Comme σ : OK → G
est un isomorphisme, G est de rang d et est bien un réseau de Rd .
Si α1 , . . . , αd est une base de OK sur Z, alors σ(OK ) a une base dont la matrice est :

σ1 (α1 ) . . .
 .
 .
 .
σ1 (αd ) . . .
σr1 (α1 ) Re(σr1 +1 (α1 )) Im(σr1 +1 (α1 )) . . .
..
..
..
.
.
.
σr1 (αd ) Re(σr1 +1 (αd )) Im(σr1 +1 (αd )) . . .

Im(σr1 +r2 (α1 ))

..
,
.

Im(σr1 +r2 (αd ))
et cette matrice s’obtient à partir de la matrice (σi (αj ))i,j en faisant r2 opérations du
type (Cj , Ck ) 7→ (1/2 · (Cj + Ck ), 1/2i · (Cj − Ck )) ce qui montre la formule puisque
det(σi (αj ))2i,j = disc(K).
Corollaire 8.4. — Si I est
un idéal de OK , alors σ(I) est un réseau de Rd dont le
q
volume est vol(σ(I)) = 2−r2 |disc(K)| N(I).
Si v ∈ Rd , notons le v = (w1 , . . . , wr1 , x1 , y1 , . . . , xr2 , yr2 ) et notons par ailleurs N(v) =
Qr1
i=1
|wi | ·
Qr2
2
2
i=1 (xi + yi )
ce qui fait que si x ∈ K, alors N(σ(x)) = |NK/Q (x)|. Considérons
l’ensemble A défini par :
A = {(w1 , . . . , wr1 , x1 , y1 , . . . , xr2 , yr2 ) ∈ Rd ,
q
q
|w1 | + · · · + |wr1 | + 2 x21 + y12 + · · · + 2 x2r2 + yr22 ≤ d}.
Cet ensemble est manifestement un convexe compact symétrique par rapport à l’origine
et si a ∈ A, alors l’inégalité de moyennes arithmétiques-géométriques nous donne que
N(a) ≤ 1.
Proposition 8.5. — Si A est l’ensemble défini ci-dessus, alors on a :
dd r 1
π r2
·2 ·
.
d!
2
Démonstration. — La démonstration se fait par récurrence sur r1 et r2 . On note :
vol(A) =
Ar,s = {(w1 , . . . , wr , x1 , y1 , . . . , xs , ys ) ∈ Rr+2s ,
q
q
|w1 | + · · · + |wr | + 2 x21 + y12 + · · · + 2 x2s + ys2 ≤ 1}.
Si l’on fixe t ∈ [−1; 1], alors Ar,s ∩ {w1 = t} = {(t, (1 − |t|)Ar−1,s )}. On en déduit que :
Z 1
2
vol(Ar,s ) = 2
vol(Ar−1,s )(1 − t)r+2s−1 dt =
vol(Ar−1,s ).
r + 2s
0
De même si ρ ≤ 1, alors on a :
ρ
ρ
2
2
2
Ar,s ∩ {x1 + y1 = (ρ/2) } =
cos(θ), sin(θ), (1 − ρ)Ar,s−1 ,
2
2
22
LAURENT BERGER
et donc :
vol(Ar,s ) =
Z 1Z 2π
0 0
ρ
π
vol(Ar,s−1 )(1 − ρ)r+2s−2 dθdρ =
vol(Ar,s−1 ).
4
2(r + 2s)(r + 2s − 1)
Ceci permet de montrer par récurrence que vol(Ar,s ) = 2r (π/2)s /(r+2s)! et la proposition
suit alors du fait que A = d · Ar1 ,r2 .
Ceci nous permet de préciser la proposition 5.3.
Théorème 8.6. — Si K est un corps de nombres et si I est un idéal de OK , alors il
existe α ∈ I vérifiant |NK/Q (α)| ≤ G · N(I) avec :
G=
d!
dd
r2 q
4
π
|disc(K)|.
Démonstration. — Posons :
C=
!1/d
2r1 +r2 q
· |disc(K)| · N(I)
· A,
vol(A)
ce qui fait que C est un convexe compact symétrique par rapport à l’origine qui vérifie
vol(C) = 2d vol(σ(I)) par le corollaire 8.4. Le théorème 8.2 nous fournit alors x ∈ C ∩σ(I)
non nul, c’est-à-dire un élément α = σ −1 (x) ∈ I tel que :
N(α) ≤
2r1 +r2 q
· |disc(K)| · N(I) = G · N(I),
vol(A)
la dernière égalité résultant de la proposition 8.5.
Corollaire 8.7. — Si K est un corps de nombres différent de Q, alors |disc(K)| ≥ 2.
Démonstration. — On a forcément G ≥ 1 et donc :
dd π r2
dd π d/2
.
|disc(K)| ≥
≥
d! 4
d! 4
Il reste à montrer que cette fonction est > 1 si d ≥ 2, c’est un exercice d’analyse réelle.
q
Application : le théorème de Rabinowitz (1913).
Théorème 8.8. — Si q ≥ 2 et 4q −1 est sans facteurs carrés, alors a2 +a+q est premier
√
pour tout 0 ≤ a ≤ q − 2 si et seulement si le corps K = Q( 1 − 4q) est de nombre de
classes égal à 1
Démonstration. — Soit f (X) = X 2 + X + q. On pose θ = (1 +
√
1 − 4q)/2 de sorte que
OK = Z ⊕ Z · θ. Commençons par deux observations :
1. Si x, y ∈ Q, alors N(x + θy) = x2 + xy + qy 2 = (x + y/2)2 + y 2 (q − 1/4). On en
déduit que si z ∈ OK et p = N(z) est premier, alors p ≥ q.
INTRODUCTION À LA THÉORIE DES NOMBRES
23
2. Soit 0 ≤ a ≤ q − 2 tel que f (a) est composé. On a f (a) ≤ (q − 1)2 + 1, et il existe
donc p premier tel que p ≤ q − 1 et f (a) = 0 mod p.
Montrons tout d’abord que si OK est principal, alors a2 + a + q est premier pour tout
0 ≤ a ≤ q − 2. Si ce n’est pas le cas, soit p ≤ q − 1 divisant f (a) = N(a + θ) comme
ci-dessus. L’idéal (p, a + θ) de OK est principal, et donc engendré par π ∈ OK . L’idéal
(p, a + θ) est propre (si 1 = px + (a + θ)y, alors en multipliant par a + θ, on voit que p
divise a + θ) et il contient strictement (p) car on ne peut pas écrire a + θ = p(x + yθ),
ce qui fait que N(π) = p. On a vu au (1) que N(π) ≥ q. C’est donc que a2 + a + q est
premier pour tout 0 ≤ a ≤ q − 2.
On suppose désormais que a2 +a+q est premier pour tout 0 ≤ a ≤ q−2. Si 2 ≤ p ≤ q−1
est un nombre premier et 0 ≤ a ≤ p − 1 ≤ q − 2, alors p ne peut pas diviser f (a) car
sinon, comme f (a) est premier, on aurait p = f (a) ≥ q (par le (1)). L’image de f (X) dans
Fp [X] est donc irréductible. On en déduit que p est inerte dans K pour tout p ≤ q − 1.
√
Comme G = (2/π) · 4q − 1, on a bGc ≤ q − 1 si q ≥ 2 et OK est principal.
Ceci se produit pour q ∈ {2, 3, 5, 11, 17, 41}. Ces nombres s’appellent les “nombres
√
chanceux d’Euler”. Pour une discussion des d < 0 tels que h(Q( d)) = 1, voir le §20.6
de [IR].
9. Unités
Dans les chapitres précédents, on a donné une réponse à la question de la factorisation
dans OK : tout idéal est un produit d’idéaux premiers et le groupe de classes de OK
×
est fini. Dans ce chapitre, nous déterminons OK
. Si on note µK l’ensemble des racines
de l’unité contenues dans K, alors µK est un groupe fini (cf. ci-dessous) qui est le sous×
×
groupe de torsion de OK
et le théorème de Dirichlet dit que OK
/µK ' Zr1 +r2 −1 . Afin
×
de montrer ce théorème, nous utilisons l’application Log : OK
→ Rr1 +r2 donnée par la
formule :
Log(x) = (log |σ1 (x)|, . . . , log |σr1 (x)|, 2 log |σr1 +1 (x)|, . . . , 2 log |σr1 +r2 (x)|),
où les plongement σi sont rangés comme au chapitre précédent.
Le lemme 2.5 implique immédiatement que le noyau de l’application Log est le groupe
×
µK . Si x ∈ OK
, alors NK/Q (x) = ±1 et donc l’image de Log est contenue dans l’hyperplan
1 +r2
H de Rr1 +r2 constitué des vecteurs (xi )i tels que ri=1
xi = 0.
Si c ≥ 0 et Log(x) ∈ H ∩ B(0, c), alors |σi (x)| ≤ C = exp(c) et donc il n’y a qu’un
P
nombre fini de possibilités pour x par le lemme 8.3 selon lequel σ(OK ) est un sous-groupe
24
LAURENT BERGER
discret de Rd . En appliquant cela à c = 0, on trouve que µK est fini et avec c > 0 on
×
trouve que l’image de OK
par Log est un sous-groupe discret de H.
Lemme 9.1. — Si 1 ≤ k ≤ r1 + r2 et si α ∈ OK \ {0}, alors il existe β ∈ OK \ {0} tel
que :
|NK/Q (β)| ≤
r2 q
2
|disc(K)|
π
et tel que log |σi (β)| < log |σi (α)| quel que soit i 6= k.
Démonstration. — Soit ai = log |σi (α)| et soit Rr1 +2r2 = {(wi , xi , yi )} comme au chapitre précédent et E l’ensemble des vecteurs de Rr1 +2r2 qui vérifient |wj | ≤ exp(aj )/2
et |x2j + yj2 | ≤ exp(aj )/2 pour tout j 6= k et en j = k la valeur absolue correspondante
q
est ≤ (2/π)r2 |disc(K)|/ j6=k (exp(aj )/2). L’ensemble E est un convexe compact symétrique de volume 2d vol(σ(OK )) et par le théorème 8.2 il existe β non nul appartenant à
Q
σ(OK ) ∩ E.
Corollaire 9.2. — Si 1 ≤ k ≤ r1 + r2 alors il existe une unité uk telle que log |σi (uk )| <
0 pour tout i 6= k.
Démonstration. — On choisit α0 ∈ OK \ {0} et on applique le lemme 9.1 à répétition
pour trouver une suite {αi }i≥0 . Comme la norme des αj est bornée indépendamment de
j, il n’y a qu’un nombre fini de possibilités pour les idéaux (αj ) et il existe donc j ≥ 0 et
` ≥ 1 tels que αj+` /αj est une unité. On peut alors prendre uk = αj+` /αj .
×
Théorème 9.3. — L’image de OK
par l’application Log est un réseau de l’hyperplan H
de Rr1 +r2 .
×
Démonstration. — On a déjà vu que l’image de OK
par l’application Log est un sous-
groupe discret de H. Le corollaire 9.2 nous fournit r1 + r2 unités u1 , . . . , ur1 +r2 telles que
si l’on écrit la matrice des Log(ui ) on trouve les signes suivants :


⊕ ... 

 ⊕ . . . 
.
..
.. 
.

.
.
.
... ⊕
De plus, les lignes de cette matrice sont toutes de somme nulle. C’est un exercice d’algèbre
×
linéaire de montrer qu’une telle matrice est de rang r1 + r2 − 1. Le groupe Log(OK
) est
donc un sous-groupe discret de H qui en contient une base, c’est-à-dire un réseau.
×
Si u1 , . . . , ur1 +r2 −1 sont tels que les Log(ui ) forment une base de Log(OK
), alors le
déterminant d’un mineur r1 + r2 − 1 × r1 + r2 − 1 de la matrice des Log(ui ) ne dépend
INTRODUCTION À LA THÉORIE DES NOMBRES
25
pas du choix du mineur ni de celui de la base et sa valeur absolue s’appelle le régulateur
de K noté RK .
×
Proposition 9.4. — On a vol(Log(OK
)) =
√
r1 + r2 · RK .
Démonstration. — Les Log(ui ) sont r1 + r2 − 1 vecteurs de somme des composantes nulle
√
√
dans Rr1 +r2 et le vecteur de composantes constantes v = (1/ r1 + r2 . . . 1/ r1 + r2 ) est
de norme 1 et orthogonal aux Log(ui ) ce qui fait que :



×
vol(Log(OK
)) = |det| 


v
Log(u1 )
..
.



.


Log(ur1 +r2 −1 )
Il suffit alors de remplacer l’une des colonnes par la somme de toutes les colonnes.
Application : l’équation de Pell-Fermat. Si d > 0 est sqf et d ≡ 2, 3 mod 4 et K =
√
√
√
√
Q( d), alors OK = Z[ d]. On a NK/Q (x + y d) = x2 − dy 2 et si z = x + y d est
une unité, alors NK/Q (z) = ±1. Le théorème 9.3 implique donc qu’il existe toujours une
solution à l’équation x2 − dy 2 = 1, et ces solutions sont toutes de la forme (x, y) avec
√
√
√
x + y d = (x0 + y0 d)n où x0 + y0 d est une unité fondamentale ou son carré (selon
que sa norme est 1 ou −1).
√
Pour trouver les unités fondamentales de Z[ d], on utilise les fractions continues. Si
{ai }i≥0 est une suite de R≥0 , on pose
1
[a0 ; a1 ; . . . ; an ] = a0 +
a1 +
1
··· +
1
an
Si on définit deux suites {pi }i≥0 et {qi }i≥0 par p0 = a0 et q0 = 1 et p1 = a0 a1 + 1 et
q1 = a1 et pn = an pn−1 + pn−2 et qn = an qn−1 + qn−2 , alors [a0 ; a1 ; . . . ; an ] = pn /qn pour
tout n.
Si x ∈ R≥0 est irrationnel, on pose x0 = x et pour n ≥ 0, an = bxn c et yn = xn − an
et xn+1 = 1/yn . La suite {ai }i≥0 est une suite de Z≥1 . La proposition suivante rassemble
quelques propriétés des fractions continues.
Proposition 9.5. — On a x = limn→+∞ [a0 ; a1 ; . . . ; an ]. De plus :
1. Si n ≥ 1 et si 1 ≤ q ≤ qn et p sont tels que |x−p/q| ≤ |x−pn /qn |, alors p/q = pn /qn .
2. Si p, q sont tels que |x − p/q| < 1/2q 2 , alors il existe n tel que p/q = pn /qn .
26
LAURENT BERGER
√
Si d ≥ 5 est sqf et d ≡ 2, 3 mod 4 et K = Q( d), alors OK admet une unité fonda√
mentale, de la forme p + q d avec p, q ∈ Z≥1 . On a p2 − dq 2 = ±1 et donc
√
1
p 1
√ < 2.
d− =
q q(p + q d)
2q
Par le (2) de la proposition ci-dessus, p/q est de la forme pn /qn et l’unité fondamentale
√
de OK est donc égale à pn + dqn où n est le plus petit entier tel que p2n − dqn2 = ±1.
Si d ≡ 1 mod 4, alors les unités de OK donnent des solutions de l’équation x2 − dy 2 = 4
avec x et y de même parité, et on adapte la méthode ci-dessus.
10. Correspondance de Galois
Soit K un corps de nombres et K une clôture algébrique de K et L une extension finie
de K ; on a vu au chapitre 1 qu’il existe y ∈ L tel que L = K[y]. Un automorphisme de
L au-dessus de K est un morphisme de corps K-linéaire α : L → L. Un tel morphisme
est déterminé par α(y) qui doit être l’une des racines de Pmin,y (X) et il y a donc au
plus d = [L : K] automorphismes de L au-dessus de K. On dit que l’extension L/K est
galoisienne s’il existe [L : K] automorphismes de L au-dessus de K.
Remarque 10.1. — Il existe d plongements K-linéaires σ : L → K et un tel plongement
est un automorphisme de L si et seulement si σ(L) = L.
Si L/K est une extension de corps de nombres et si y ∈ L, alors un conjugué de y est
une racine de Pmin,y (X) dans K. On voit donc que l’extension L/K est galoisienne si et
seulement si les conjugués de tous les éléments de L sont dans toujours dans L et aussi
si et seulement si L est engendrée par des éléments dont tous les conjugués sont dans L.
Si l’extension L/K est galoisienne, alors on note Gal(L/K) le groupe des automorphismes de L au-dessus de K, et on l’appelle le groupe de Galois de L/K.
Par exemple, si P (X) ∈ K[X] est un polynôme irréductible de degré d = deg(P ), alors
le corps de décomposition de P est l’extension L de K engendrée par les racines de P dans
K. C’est une extension galoisienne et le groupe de Galois Gal(L/K) permute les racines
de P et on en déduit une injection Gal(L/K) ,→ Sd ce qui fait que [L : K] ≤ d!. En
particulier, toute extension L/K de degré d est contenue dans un corps L ⊂ M galoisien
sur K avec [M : K] ≤ d!.
Le résultat suivant est le théorème d’Artin.
Lemme 10.2. — Si K est un corps de nombres et si G est un groupe d’automorphismes
de K, alors K/K G est galoisienne de groupe de Galois G.
INTRODUCTION À LA THÉORIE DES NOMBRES
27
Démonstration. — Par le théorème de l’élément primitif, il existe y ∈ K tel que K =
K G (y). Le polynôme P (X) =
Q
g∈G (X
− g(y)) est à coefficients dans K G et annule y ce
qui fait que [K : K G ] ≤ card(G). On en déduit que [K : K G ] = card(G) et donc que
K/K G est galoisienne de groupe de Galois G.
Le théorème principal de la théorie de Galois est le suivant.
Théorème 10.3. — Si L/K est une extension galoisienne de groupe de Galois G =
Gal(L/K), alors on a une « dualité » entre les sous-extensions K ⊂ F ⊂ L et les sousgroupes H de G, donnée par :
F 7→ Gal(L/F )
et
H 7→ LH ,
ces deux constructions étant réciproques l’une de l’autre.
De plus, l’extension LH /K est galoisienne si et seulement si H est un sous-groupe
distingué de G.
Démonstration. — Commençons par montrer que les deux constructions sont inverses
l’une de l’autre. Si H est un sous-groupe de G et si F = LH alors le théorème d’Artin
nous dit que L/F est galoisienne de groupe de Galois H ce qui montre un sens. Si F ⊂ L et
si H = Gal(L/F ), alors l’extension L/LH est de degré card(H) par le théorème d’Artin ;
comme LH contient F on en déduit que LH = F ce qui montre l’autre sens.
−1
Ensuite, observons que si g ∈ G, alors g(LH ) = LgHg et donc que LH est stable par
tous les automorphismes K-linéaires de L si et seulement si H = gHg −1 pour tout g ∈ G
(en appliquant la première partie du théorème).
Avant de continuer, voyons ce qui se passe pour les corps finis. Un corps fini est toujours
de cardinal q = pf et si l’on travaille dans une clôture algébrique fixée Fp de Fp et si k est
de cardinal q, alors k = {x ∈ Fp tels que xq = x} = Fq : il n’existe donc qu’une extension
de Fp de degré f . On a par ailleurs Fpf ⊂ Fpn si et seulement si f divise n. L’application
σq : Fp → Fp donnée par σq (x) = xq est un automorphisme de corps qui est l’identité
sur Fq et qui préserve Fqf ; l’extension Fqf /Fq admet donc f automorphismes distincts
1, σq , . . . , σqf −1 et est donc galoisienne de groupe Z/f Z. La théorie de Galois des corps
finis est donc très simple : toutes les extensions sont galoisiennes et tous les groupes de
Galois sont cycliques. Enfin, le théorème de l’élément primitif est vrai pour les corps finis
car F×
q est cyclique.
28
LAURENT BERGER
11. Corps cyclotomiques
Une classe importante de corps de nombres est donnée par les corps cyclotomiques ; ce
sont les corps K = Q(ζn ) où n ≥ 3. Le n-ième polynôme cyclotomique est :
Φn (X) =
(X − ζnk ).
Y
k∈(Z/nZ)×
Lemme 11.1. — Le polynôme Φn (X) appartient à Z[X] est irréductible dans Q[X].
Démonstration. — Les conjugués de ζn sont de la forme ζna avec a ∧ n = 1 et comme
x 7→ ax est une bijection de (Z/nZ)× on voit que les coefficients de Φn (X) appartiennent
à Z. Soit à présent P (X) le polynôme minimal de ζn de telle sorte qu’on peut écrire
X n − 1 = P (X)Q(X). Si p est un nombre premier qui ne divise pas n, montrons que
P (ζnp ) = 0. Si ce n’est pas le cas, alors c’est que Q(ζnp ) = 0 et donc que P (X) divise
Q(X p ). Dans Fp [X], le polynôme P (X) divise alors Q(X)p et donc X n − 1 admet des
racines multiples. Ceci n’est pas possible car le discriminant de X n − 1 est non nul dans
Fp si p ne divise pas n. On en déduit que P (ζnp ) = 0 pour tout p premier ne divisant pas
n et donc que P (ζna ) = 0 pour tout a premier à n ce qui fait que P (X) = Φn (X) qui est
donc irréductible.
Le polynôme Φn (X) est donc le polynôme minimal de ζn et donc [Q(ζn ) : Q] = ϕ(n).
ei −1
(pi − 1). Si g ∈ Gal(Q(ζn )/Q),
i=1 pi
ζnχ(g) et on en déduit un morphisme injectif
Rappelons que si n = pe11 · · · perr , alors ϕ(n) =
Qr
alors il existe χ(g) ∈ (Z/nZ)× tel que g(ζn ) =
qui est alors bijectif (comparer les cardinaux), le caractère cyclotomique :
χ : Gal(Q(ζn )/Q) ' (Z/nZ)× .
Les corps cyclotomiques sont des cas particuliers d’extensions abéliennes de Q, c’est-àdire de corps K tels que Gal(K/Q) est abélien. Un théorème de Kronecker et Weber dit
que toute extension abélienne de Q est contenue dans un corps cyclotomique. C’est par
√
exemple le cas pour les corps Q( d) comme nous allons le voir.
Un caractère de Dirichlet mod n est un homomorphisme χ : (Z/nZ)× → C× . Il se peut
qu’il existe m divisant n tel que χ se factorise par χ : (Z/nZ)× → (Z/mZ)× → C× et le
plus petit m tel que χ se factorise par (Z/mZ)× est appelé le conducteur de χ noté fχ .
On étend χ en une fonction χ : Z → C par χ(a) = χ(a mod fχ ) si a ∧ fχ = 1 et χ(a) = 0
sinon. Si m ∈ Z, alors on définit la somme de Gauss G(m, χ) =
P
a mod f
χ(a)ζfam .
Proposition 11.2. — On a G(m, χ) = χ(m)G(1, χ) et G(1, χ)G(1, χ) = χ(−1)f .
29
INTRODUCTION À LA THÉORIE DES NOMBRES
Démonstration. — Si m ∧ f = 1 alors :
χ(a)ζfam = χ(m)
X
G(m, χ) =
X
χ(am)ζfam = χ(m)G(1, χ).
a mod f
a mod f
Si m ∧ f = d > 1, alors χ(m) = 0 et :
G(m, χ) =
am/d
X
χ(a)ζf /d =
a mod f
car
P
a=1 mod f /d
bm/d
X
X
ζf /d
χ(a) = 0
a=b mod f /d
b mod f /d
χ(a) = 0. Ensuite :
G(1, χ)G(1, χ) = G(1, χ)
χ(b)ζfb =
X
b mod f
G(b, χ)ζfb
b mod f
X
=
X
χ(a)ζfab ζfb =
a,b mod f
X
χ(a)
a mod f
X
b(a+1)
ζf
= χ(−1)f.
b mod f
On dit que χ est un caractère quadratique si l’image de χ est incluse dans {±1}. On
dit qu’un caractère χ est pair si χ(−1) = 1 et impair si χ(−1) = −1.
Proposition 11.3. — Si K est un corps quadratique de discriminant D, alors on a
K ⊂ Q(ζ|D| ).
Démonstration. — Si χ est un caractère quadratique de conducteur f , alors on a
G(1,
χ) ∈ Q(ζf ) et la proposition 11.2 implique que G(1, χ)2 = χ(−1)f ce qui fait que
q
Q( χ(−1)f ) ⊂ Q(ζf ). Il faut donc construire un caractère quadratique ayant le bon
conducteur et la bonne parité. Si p est un nombre premier impair, alors le symbole
de Legendre (·/p) est un caractère quadratique χp de conducteur p. On peut de même
construire χ4 de conducteur 4 et deux caractères χ±
8 de conducteur 8, l’un pair et l’autre
√
impair. Si l’on écrit K = Q( d) où d = ±p1 · · · pr est sans facteur carré, alors D = 4d si
d = 2, 3 mod 4 et D = d si d = 1 mod 4. Si D est impair, alors on pose χ = χp1 · · · χpr . Si
D = 4d avec d impair, alors on pose χ = χ4 χp2 · · · χpr et sinon on pose χ = χ±
8 χp2 · · · χpr
où le signe est choisi pour que χ ait la bonne parité. Dans tous les cas, on vérifie que χ
est de conducteur |D| et a la bonne parité.
Proposition 11.4. — Si K, D et χ sont comme ci-dessus, alors on a



0
si p est ramifié dans K,
χ(p) = 1
si p est décomposé dans K,



−1 si p est inerte dans K.
Démonstration. — La proposition dit que χ(p) =
D
p
. Il s’agit donc de vérifier cette
formule en utilisant la construction de χ donnée dans la démonstration de la proposition
30
LAURENT BERGER
11.3. Si par exemple D est impair, alors D = ±p1 · · · pr et χ = χp1 · · · χpr . On a donc
χ(p) =
p
p1
···
p
pr
et la loi de réciprocité quadratique implique que
p
p1
···
p
pr
=
p 1
p
Si D > 0, alors D ≡ 1 mod 4 et donc
D < 0, alors
pi −1
i=1 2
Pr
···
p r
p
pi −1
i=1 2
Pr
· (−1)
p−1
2
Pr
i=1
pi −1
2
.
est pair ce qui fait que χ(p) =
D
p
. Si
est impair et on trouve alors que
!
p−1
|D|
|D|
(−1) 2 =
χ(p) =
p
p
!
!
−1
D
=
.
p
p
Le cas où D est pair se traite de la même manière.
Remarque 11.5. — On peut en fait donner une démonstration directe de la proposition
11.4, et en déduire ensuite la loi de réciprocité quadratique.
12. Lois de réciprocité
Si l’extension L/K est galoisienne et si q est un idéal au-dessus de p, alors pour g ∈
Gal(L/K) l’idéal g(q) est un idéal au-dessus de g(p) = p.
Proposition 12.1. — Si l’extension L/K est galoisienne, alors Gal(L/K) agit transitivement sur l’ensemble {q1 , . . . , qr } des idéaux au-dessus de p.
Démonstration. — Supposons que q2 6= g(q1 ) quel que soit g ∈ Gal(L/K). Dans ce
cas on a q2 + g(q1 ) = OL quel que soit g ∈ Gal(L/K) et par le théorème des restes,
il existe x ∈ OL tel que x = 0 mod q2 et x = 1 mod g(q1 ) pour tout g. Comme
x ∈ q2 on a NL/K (x) ∈ q2 ∩ OK = p et comme x = 1 mod g(q1 ) pour tout g, on a
Q
NL/K (x) = g∈Gal(L/K) g −1 (x) = 1 mod q1 et donc NL/K (x) = 1 mod p ce qui est une
contradiction.
Si L/K est galoisienne et si pOL = qe11 · · · qerr , on en déduit que e1 = · · · = er et que
f1 = · · · = fr . Soit L/K une extension finie. Si q est un idéal premier de OL au-dessus de
l’idéal premier p de OK , on note e(q/p) l’indice de ramification de q/p et f (q/p) = [kq : kp ]
l’indice d’inertie de q/p. Si l’on a une tour d’extensions, alors e(r/p) = e(r/q)e(q/p) et
f (r/p) = f (r/q)f (q/p).
Proposition 12.2. — On a
P
q|p
e(q/p)f (q/p) = [L : K].
INTRODUCTION À LA THÉORIE DES NOMBRES
31
Démonstration. — Cette proposition généralise le corollaire 3.8. La démonstration est
essentiellement la même, mais algébriquement un peu plus pénible si p n’est pas principal. Si L/Q et K/Q sont toutes les deux galoisiennes, on peut s’en sortir de la manière suivante. La valeur des indices e et f ne dépend que de l’extension, et il s’agit
donc de montrer que e(L/K)f (L/K)r(L/K) = [L : K]. Par le corollaire 3.8, on a
e(L/Q)f (L/Q)r(L/Q) = [L : Q] et e(K/Q)f (K/Q)r(K/Q) = [K : Q]. On en déduit
que e(L/K)f (L/K)r(L/K) = [L : K].
Soit L/K une extension galoisienne. Si q est un idéal premier de OL on note Dq
le sous-groupe de Gal(L/K) constitué des g tels que g(q) = q : c’est le sous-groupe de
décomposition de q. Par la proposition 12.1, c’est un sous groupe de Gal(L/K) de cardinal
[L : K]/r = ef . Si q0 est un autre idéal au-dessus de p alors par la proposition 12.1, il
existe g tel que q0 = g(q) et on a alors Dq0 = gDq g −1 .
Par la correspondance de Galois, on a une tour d’extensions L ⊃ LDq ⊃ K. L’idéal
q de L est au-dessus d’un idéal qD de LDq et comme Gal(L/LDq ) = Dq l’idéal q est
le seul idéal de L au-dessus de qD . On a par ailleurs e(q/qD )f (q/qD ) = [L : LDq ] =
card(Dq ) = e(q/p)f (q/p) et donc e(q/p) = e(q/qD ) et f (q/p) = f (q/qD ) et donc aussi
e(qD /p) = f (qD /pD ) = 1. En particulier, kqD = kp .
Le corps kq est une extension de kp de degré f et le groupe Dq agit sur kq d’où un
morphisme Dq → Gal(kq /kp ) ' Z/f Z.
Proposition 12.3. — Le morphisme Dq → Gal(kq /kp ) est surjectif.
Démonstration. — Soit θ un élément de OL tel que kq = kp [θ] et A(X) ∈ kp [X] le
polynôme minimal de θ et B(X) ∈ OLDq [X] celui de θ sur LDq ce qui fait que B(X) est
scindé (à racines simples) dans OL et que A(X) | B(X). Si σ ∈ Gal(kq /kp ), alors σ(θ) est
une racine de A(X) et donc de B(X) ce qui fait qu’il existe une racine θ0 ∈ OL de B(X)
dont l’image dans kq est σ(θ). Si g est un élément de Gal(L/LDq ) = Dq tel que g(θ) = θ0
alors on voit que l’image de g dans Gal(kq /kp ) est σ.
Le noyau Iq du morphisme Dq → Gal(kq /kp ) s’appelle le sous-groupe d’inertie de Dq et
il est donc de cardinal e(q/p). Si q est non-ramifié, alors Iq = {1} et le groupe Gal(L/K)
contient le sous-groupe cyclique Dq ' Gal(kq /kp ). Le groupe Gal(kq /kp ) est engendré par
le morphisme de Frobenius [x 7→ xq ] où q = card(kp ) et on appelle le Frobenius de q
l’élément σq ∈ Dq ⊂ Gal(L/K) dont l’image dans Gal(kq /kp ) est le Frobenius [x 7→ xq ].
Cet élément est aussi noté (q, L/K) ∈ Gal(L/K).
Si g ∈ Gal(L/K), alors (g(q), L/K) = g(q, L/K)g −1 et donc si Gal(L/K) est abélien,
alors (q, L/K) ne dépend que de p et on le note alors (p, L/K) ∈ Gal(L/K). Si I =
32
LAURENT BERGER
αi
i=1 pi est un idéal de OK tel qu’aucun pi n’est ramifié dans L, alors on note (I, L/K) =
Qn
αi
i=1 (pi , L/K) , et l’objet des lois de réciprocité est de décrire explicitement ces éléments
Qn
en termes de I, ce que nous allons faire pour l’extension K = Q(ζn )/Q.
L’anneau des entiers de Q(ζn ) est Z[ζn ] (nous ne démontrons pas ceci dans ce cours).
Remarquons que ζn est annulé par X n − 1 dont le discriminant est ±nn ce qui fait
que si p est un nombre premier qui ne divise pas n, alors p est non-ramifié dans Q(ζn ).
Rappelons que l’on a construit un isomorphisme canonique Gal(K/Q) → (Z/nZ)× , donné
par g 7→ χ(g) où g(ζn ) = ζnχ(g) .
Théorème 12.4. — Si a ∈ Z≥1 est premier à n, alors χ((a), Q(ζn )/Q) = a.
Démonstration. — Par multiplicativité, il suffit de vérifier cette formule pour un nombre
premier p ne divisant pas n. Si σp = χ−1 (p) ∈ Gal(Q(ζn )/Q), alors σp (ζn ) = ζnp . Écrivons
pZ[ζn ] = ri=1 qi . On a qi = (p, Qi (ζn )) où Qi (X) ∈ Z[X] et Qi (ζnp ) − Qi (ζn )p ∈ pZ[ζn ]
ce qui fait que σp (qi ) ⊂ qi et donc σp (qi ) = qi . On a bien σp ∈ Dqi . Ensuite, σp agit par
Q
[x 7→ xp ] sur Z[ζn ]/p =
Qr
i=1
Z[ζn ]/qi où pZ[ζn ] =
Qr
i=1
qi et donc σp = ((p), Q(ζn )/Q).
Cette loi de réciprocité nous donne en particulier des informations sur la décomposition
d’un nombre premier p dans Q(ζn ). En effet ((p), Q(ζn )/Q) engendre un groupe isomorphe
à Z/f Z et donc le théorème 12.4 implique que f est l’ordre de p modulo n.
Corollaire 12.5. — Un nombre premier p - n est totalement décomposé dans Q(ζn ) si
et seulement si p ≡ 1 mod n.
Proposition 12.6. — Si L ⊃ K ⊃ Q est une tour d’extensions telle que L/Q est
abélienne et si q est un idéal premier de L au-dessus de p de K et de p de Q, alors :
1. (p, K/Q) est l’image dans Gal(K/Q) de (p, L/Q) ∈ Gal(L/Q) ;
2. (p, L/K) = (p, L/Q)f (p/p) dans Gal(L/K) ⊂ Gal(L/Q).
Démonstration. — L’image de (p, L/Q) dans Gal(kq /Fp ) est le Frobenius [x 7→ xp ]
et donc sa restriction de (p, L/Q) à K est bien (p, K/Q). Par ailleurs, l’image de
(p, L/Q)f (p/p) est l’application [x 7→ xq ] avec q = pf (p/p) et par le (1) son image dans
Gal(K/Q) est triviale ce qui fait que (p, L/Q)f (p/p) ∈ Gal(L/K) vaut donc (p, L/K).
Le théorème 12.4 permet de redémontrer la loi de réciprocité quadratique. Si p est
√
un nombre premier impair, posons p∗ = (−1)(p−1)/2 p de telle manière que Q( p∗ ) ⊂
√
Q(ζp ). On a Gal(Q(ζp )/Q) = (Z/pZ)× et Gal(Q( p∗ )/Q) = {±1}. Comme (Z/pZ)× est
INTRODUCTION À LA THÉORIE DES NOMBRES
33
cyclique, il n’existe qu’une seule application non triviale (Z/pZ)× → {±1} et c’est donc
le symbole de Legendre :
a
√
p−1
(a, Q( p∗ )/Q) =
=a 2 .
p
√
Si q est un nombre premier impair distinct de p, on a donc pq = (q, Q( p∗ )/Q).
√
Par ailleurs, on a (q, Q( p∗ )/Q) = ±1 selon que q est décomposé ou pas dans
√
Q( p∗ )/Q c’est-à-dire selon que p∗ est un carré modulo q ou pas, ce qui fait que :
√
p∗
= (q, Q( p∗ )/Q) =
p
q
q !
et donc que :
q p
p−1 q−1
= (−1) 2 · 2
p q
C’est la partie la plus importante de la loi de réciprocité quadratique, démontrée par
Gauss. Il faut lui rajouter la formule p2 = (−1)(p −1)/8 qui suit de la même manière du
√
fait que 2 est décomposé dans Q( p∗ ) si et seulement si p∗ = 1 mod 8.
2
13. La fonction ζ de Dedekind
Si s ∈ C vérifie Re(s) > 1, alors ζ(s) =
P
n≥1
1/ns converge et cela définit une fonction
holomorphe. On a la décomposition en produit eulérien :
ζ(s) =
1
−s
p premier 1 − p
Y
qui permet de relier les propriétés de la fonction ζ à la distribution des nombres premiers
de Z. Dans ce chapitre, nous allons généraliser la définition de cette fonction à un corps
de nombres. Avant tout, nous avons besoin d’étendre son domaine de définition.
Rappelons que la fonction Γ est définie par :
Γ(s) =
Z ∞
ts−1 exp(−t)dt si Re(s) > 0,
0
et que l’on a Γ(s + 1) = sΓ(s) et que Γ(s) 6= 0 pour tout s ∈ C tel que Re(s) > 0. Par
ailleurs, on a Γ(s) =
R ∞ s−1 s−1
n t exp(−nt)d(nt)
0
ce qui fait que :
1
1 Z ∞ s−1
=
t exp(−nt)dt
ns
Γ(s) 0
et donc que :


1 Z ∞ s−1  X
1 Z∞
ts−1
ζ(s) =
t
exp(−nt) dt =
dt
Γ(s) 0
Γ(s) 0 exp(t) − 1
n≥1
34
LAURENT BERGER
En écrivant :
Γ(s)ζ(s) =
Z 1
0
Z ∞
ts−1
1
1
1
−
dt +
+
dt,
exp(t) − 1 t
s−1
exp(t) − 1
1
!
s−1
t
on voit que la fonction ζ se prolonge en une fonction méromorphe sur {s ∈ C tels que
Re(s) > 0} avec un pôle simple de résidu 1 en s = 1.
On peut montrer que la fonction ζ se prolonge en une fonction méromorphe sur C tout
entier avec pour seul pôle s = 1 et qu’elle vérifie l’équation fonctionnelle :
ζ(1 − s) = 2(2π)−s Γ(s) cos(πs/2)ζ(s).
Dans ce cours, nous généralisons plutôt la définition de la fonction ζ à un corps de
nombres K afin d’étudier son résidu en s = 1. On pose donc, suivant Dedekind :
X
1
.
ζK (s) =
s
I idéal de OK N(I)
Si K = Q, alors on retrouve bien la fonction ζ définie ci-dessus. Pour un corps de nombres
K, on peut montrer que la série qui définit ζK (s) converge pour Re(s) > 1 et que ζK (s)
se prolonge en une fonction méromorphe sur {s ∈ C tels que Re(s) > 1 − 1/[K : Q]}
avec un pôle simple en s = 1 de résidu :
2r1 (2π)r2 hK RK
q
,
κ=
ωK |disc(K)|
où hK = card Cl(K), RK est le régulateur et ωK est le nombre de racines de l’unité
contenues dans K.
P
Si f (n) est le nombre d’idéaux I de OK tels que N(I) = n, alors ζK (s) = n≥1 f (n)n−s
et la première étape est de comprendre comment f varie. Si C ∈ Cl(K) est une classe
d’idéaux, soit iC (t) le nombre d’idéaux I non nuls tels que I ∈ C et tels que N(I) ≤ t.
Proposition 13.1. — On a :
iC (t) =
2r1 (2π)r2 RK
q
ωK |disc(K)|
· t + O(t1−1/[K:Q] ).
Démonstration. — Si K = Q, alors iC (t) = btc et la proposition est immédiate. Nous
allons la démontrer pour [K : Q] = 2, le cas général étant similaire mais plus difficile
à suivre. Remarquons que si J est un idéal dont la classe est C −1 , alors l’application
« multiplication par J » donne une bijection entre {I de classe C tels que N(I) ≤ t} et
{(α) ⊂ J tels que N((α)) ≤ t N(J)}. On se ramène donc à compter des idéaux principaux
(α), c’est-à-dire des α à unité près.
√
Premier cas : K = Q( −d) est un corps quadratique imaginaire. Le plongement σ :
√
√
K → R2 défini au §8 est donné par σ(a + b −d) = (a, b d). Le nombre de α ∈ J
35
INTRODUCTION À LA THÉORIE DES NOMBRES
tels que |NK/Q (α)| ≤ t N(J) est égal aux nombres de σ(α) = (x,q
y) ∈ σ(J) tels que
x2 + y 2 ≤ t N(J) et c’est donc le nombre de points dans σ(J) ∩ D(0, t N(J)). Si δ est le
diamètre d’un domaine fondamental de σ(J), alors :
π(r − δ)2 ≤ vol(J) · card(D(0, r) ∩ σ(J)) ≤ π(r + δ)2 ,
et donc card(D(0, r) ∩ σ(J)) = πr2 / vol(J) + O(r) ce qui fait que le nombre de σ(α) =
(x, y) ∈ σ(J) tels que x2 + y 2 ≤ t N(J) vaut :
√
√
2πt
πt N(J)
+ O( t) = q
+ O( t).
vol(J)
|disc(K)|
puisque l’image de OK est un réseau de volume vol(OK ) =
q
|disc(K)|/2 et vol(J) =
N(J) vol(OK ). Reste à constater que deux α qui diffèrent par une unité engendrent le
même idéal, et donc que pour obtenir le nombre d’idéaux il faut diviser par ωK , et que
RK = 1 car r1 + r2 − 1 = 0 (voir le chapitre 9).
√
Deuxième cas : K = Q( d) est un corps quadratique réel. Le plongement σ : K → R2
√
√
√
est donné par σ(a + b −d) = (a + b d, a − b d) ce qui fait que si σ(α) = (x, y), alors
N(α) = xy. Par ailleurs, si l’on appelle uK l’unité fondamentale de K, alors σ(αuK ) =
(xuK , y · ±u−1
K ) et donc on peut toujours multiplier α par une puissance de uK pour que
1 ≤ |y/x| < u2K . Le volume de la région délimitée par les équations 1 ≤ |y/x| < u2K et
|xy| ≤ t N(J) (cf le dessin page 168 du livre de Marcus) vaut 4t N(J) log(uK ) ce qui fait
que comme ci-dessus, le nombre de α ∈ J qui vérifient 1 ≤ |y/x| < u2K et |N(α)| ≤ t N(J)
est égal à :
√
4t N(J) log uK
+ O( t)
vol(J)
Deux tels α engendrent le même idéal si et seulementqsi ils diffèrent par ±1 ce qui fait
que comme vol(J) = N(J) vol(OK ) avec vol(OK ) =
RK = log uK on trouve la bonne formule.
|disc(K)| et comme ωK = 2 et
Lemme 13.2. — Si {ak }k≥1 est une suite de nombres complexes telle que
r
O(t ), alors
P
n≥1
P
k≤t
ak =
s
an /n converge si Re(s) > r et définit une fonction holomorphe sur
{s ∈ C, Re(s) > r}.
Démonstration. — Posons Ak = a1 + · · · + ak de telle sorte que |Ak | ≤ Ck r . On a :
am
am+`
Am − Am−1
Am+` − Am+`−1
+ ··· +
=
+ ··· +
=
s
s
s
m
(m + `)
m
(m + `)s
!
!
Am+`
Am−1
1
1
1
1
−
+ Am
−
+ · · · + Am+`−1
−
(m + `)s
ms
ms (m + 1)s
(m + ` − 1)s (m + `)s
36
LAURENT BERGER
En utilisant le fait que |1/k s − 1/(k + 1)s | ≤ |s|/k Re(s)+1 on trouve que :
a
m
s
m
am+` ≤
+ ··· +
(m + `)s !
C
C
1
1
,
+
+
|s|C
+
·
·
·
+
(m + `)Re(s)−r mRe(s)−r
mRe(s)−r+1
(m + ` − 1)Re(s)−r+1
qui tend vers 0 uniformément quand m → ∞ si s est dans un compact fixé de {s ∈
C, Re(s) > r}. Par les propriétés usuelles des fonctions holomorphes, cela implique le
lemme.
On en déduit le théorème ci-dessous, dû à Hecke.
Théorème 13.3. — Si K est un corps de nombres, alors ζK (s) se prolonge en une
fonction méromorphe sur {s ∈ C tels que Re(s) > 1 − 1/[K : Q]} avec un pôle simple en
s = 1 de résidu :
κ=
2r1 (2π)r2 hK RK
q
ωK |disc(K)|
.
Démonstration. — Si f (n) est le nombre d’idéaux I de OK tels que N(I) = n, alors
ζK (s) =
P
n≥1
f (n)n−s et par ailleurs f (1) + · · · + f (n) =
P
C iC (n)
ce qui fait que si l’on
pose an = f (n) − κ, alors la proposition 13.1 nous dit que a1 + · · · + an = O(n1−1/[K:Q] ) et
P
donc par le lemme 13.2 que la série n≥1 (f (n)−κ)n−s définit une fonction holomorphe sur
{s ∈ C tels que Re(s) > 1 − 1/[K : Q]} ce qui fait que ζK (s) − κζ(s) y est holomorphe, et
cela implique le théorème étant donnés les rappels qu’on a fait au début du chapitre.
Enfin, on a toujours une décomposition de ζK (s) en produit eulérien qui reflète l’existence et l’unicité de la décomposition des idéaux en produit d’idéaux premiers :
ζK (s) =
1
−s
p premier 1 − N(p)
Y
si Re(s) > 1.
14. Fonctions L
Si χ est un caractère de Dirichlet modulo n non trivial, alors χ(1) + · · · + χ(n) = 0 et
P
donc k≤t χ(k) = O(1) ce qui fait que par le lemme 13.2, la série :
L(s, χ) =
χ(n)
s
n≥1 n
X
37
INTRODUCTION À LA THÉORIE DES NOMBRES
converge pour Re(s) > 0 et définit une fonction holomorphe dans ce demi-plan. Cette
fonction se décompose en produit Eulérien :
L(s, χ) =
1
.
−s
p premier 1 − χ(p)p
Y
Une application classique de la théorie des fonctions L est la démonstration du théorème
de Dirichlet : si n ≥ 3 et a ∈ Z est premier avec n, alors il existe une infinité de nombre
premiers p avec p ≡ a mod n. Donnons le principe de la démonstration pour n = 4. Soit
χ4 le caractère de conducteur 4, étendu à Z.
Lemme 14.1. — Si χ est un caractère et s > 1, alors log L(s, χ) =
P
p
χ(p)p−s + Rχ (s)
où Rχ (s) est borné quand s → 1.
Démonstration. — On a pour s > 1 :
log L(s, χ) = −
X
log(1 − χ(p)p−s ) =
X
p
χ(p)p−s +
XX
p
m−1 χ(p)m p−ms .
p m≥2
et donc
|Rχ (s)| =
X X
−1
m −ms m
χ(p)
p
p m≥2
≤
XX
p−ms ≤
p m≥2
X
p−2s (1 − p−s )−1 ≤ 2ζ(2).
p
Théorème 14.2. — Il existe une infinité de nombres premiers p avec p ≡ 1 mod 4 et
une infinité de nombres premiers p avec p ≡ 3 mod 4.
Démonstration. — Si s > 1, alors par le lemme 14.1, on a log ζ(s) = p p−s + R1 (s)
P
et log L(s, χ4 ) = p χ4 (p)p−s + R4 (s) avec R1 (s) et R4 (s) bornés quand s → 1. Par
P
ailleurs, log L(s, χ4 ) est bornée quand s → 1 car L(s, χ4 ) est holomorphe si s > 0 et
L(1, χ4 ) = π/4 6= 0. On a
log ζ(s) + log L(s, χ4 ) = 2
X
p−s + R1 (s) + R4 (s) + 2−s
p≡1 mod 4
log ζ(s) − log L(s, χ4 ) = 2
X
p−s + R1 (s) − R4 (s) + 2−s
p≡3 mod 4
Comme ζ(s) → ∞ quand s → 1, on en déduit que
P
p≡1 mod 4
p−s et
P
p≡3 mod 4
p−s
divergent quand s → 1, ce qui implique le théorème.
La démonstration du théorème de Dirichlet pour n arbitraire est similaire. Une manière
de faire consiste à montrer tout d’abord que ζQ(ζn ) (s) = ζ(s) ·
Q
χ:(Z/nZ)× →C× ,χ6=1
d’en déduire que L(1, χ) 6= 0 pour tout χ 6= 1, puis à raisonner comme ci-dessus.
L(s, χ),
38
LAURENT BERGER
Passons à une autre application, les formules analytiques de nombre de classe. Soit K
une extension quadratique de Q et f = |disc(K)|. Par la proposition 11.4, le caractère
quadratique χ : (Z/f Z)× → {±1} associé à K s’étend en une fonction donnée par



0
si p est ramifié dans K,
χ(p) = 1
si p est décomposé dans K,



−1 si p est inerte dans K.
Corollaire 14.3. — Si p est premier, alors
−s
p|(p) (1 − N(p) )
Q
= (1 − p−s )(1 − χ(p)p−s ).
Démonstration. — Si p est ramifié, alors (p) = p2 et N(p) = p et χ(p) = 0. Si (p) est
décomposé, alors (p) = p1 p2 et N(pi ) = p et χ(p) = 1. Si p est inerte, alors (p) = p et
N(p) = p2 et χ(p) = −1. Dans les trois cas, on vérifie la formule.
Théorème 14.4. — Si K est un corps quadratique et si χ est le caractère quadratique
qui lui est attaché, alors :
L(1, χ) =

2πhK



√



 ωK f
si K est imaginaire,



2hK log uK



√

si K est réel.
f
Démonstration. — Par le corollaire 14.3, on a ζK (s) = ζ(s)L(s, χ). En particulier, le
résidu en s = 1 de ζK (s) vaut L(1, χ) et le théorème suit du théorème 13.3.
√
Par exemple, si K = Q( −1) alors χ = χ4 et donc χ(a) = (−1)(a−1)/2 si a est impair
et 0 sinon ce qui fait que :
L(1, χ) = 1 −
1 1
π
+ − ··· =
3 5
4
et donc que hK = 1. On peut trouver des formules closes générales pour L(1, χ). Remarquons que par le théorème 14.4, on a L(1, χ) ∈ R>0 .
Proposition 14.5. — Si K est un corps quadratique et si χ est le caractère quadratique
qui lui est attaché, alors :
L(1, χ) =


π


√



f f








1



 √f
X
χ(a)a
a∧f =1
X
χ(a) log sin
a∧f =1
si K est imaginaire,
aπ
f
!
si K est réel.
39
INTRODUCTION À LA THÉORIE DES NOMBRES
Démonstration. — Rappelons qu’on a les sommes de Gauss G(n, χ) =
P
a mod f
χ(a)ζfan
et que χ = χ comme χ est quadratique. Comme G(n, χ) = χ(n)G(1, χ), on a :
X G(n, χ)
X
X ζfan
X
G(1, χ)L(1, χ) =
=
χ(a)
=−
χ(a) log(1 − ζfa ),
n
n
n≥1
n≥1
a mod f
a mod f
car
P
n≥1
z n /n = − log(1 − z) si |z| ≤ 1 et z 6= 1, où log(r exp(iθ)) = r + iθ avec
−π/2 < θ < π/2. On a alors 1 − ζfa = − exp(iπa/f )(2i sin(πa/f )) et donc :
!
log(1 −
ζfa )
iπa iπ
aπ
=
−
+ log(2) + log sin
.
f
2
f
La proposition résulte alors du fait que
P
a mod f
χ(a) = 0 car χ est non trivial et que
P
P
χ(a) log sin(πa/f ) = 0 si χ est impair et que a mod f χ(a)πa/f = 0 si χ est pair
√
ainsi que du fait que |G(1, χ)| = f par la proposition 11.2.
a mod f
Comme conséquence, on trouve des « formules analytiques de nombre de classe ».
Corollaire 14.6. — Si K est un corps quadratique et si χ est le caractère quadratique
qui lui est attaché, alors :
hK =



1




f





X
χ(a)a
a∧f =1




1





 log(uK )


X
χ(a) log sin
a∧f =1
a<f /2
√
√
si K 6= Q( −1), Q( −3) est imaginaire,
!
aπ f si K est réel.
K
La première formule permet de calculer hK et la deuxième u±h
K .
Références
[Bou] N. Bourbaki – Eléments d’histoire des mathématiques
[Cox] D. Cox – Primes of the form x2 + ny 2
[Gau] C.-F. Gauss – Disquisitiones Arithmeticae
[IR]
K. Ireland & M. Rosen – A classical introduction to modern number theory
[Mar] D. Marcus – Number fields
[Neu] J. Neukirch – Algebraic number theory
Laurent Berger, UMPA, ENS de Lyon, UMR 5669 du CNRS, IUF
E-mail : [email protected] • Url : http://perso.ens-lyon.fr/laurent.berger/
Téléchargement