Moyenne de fonctions arithmétiques — Une introduction

publicité
AF
T
Moyenne de fonctions
arithmétiques
—
Une introduction
agrémentée d’exercices et
d’applications au crible
—
DR
Cours donnés à l’université de
Nouakchott
—
Nouakchott
25 Novembre / 6 Décembre 2012
—
Olivier Ramaré
25 novembre 2012
DR
AF
T
2
25 novembre 2012
Version 2
Introduction
AF
T
Ce cours portera surtout sur les valeurs moyennes de fonctions arithmétiques
et se poursuivra par une introduction au crible de Montgomery et des applications.
Les fonctions arithmétiques sont très souvent mal connues, et possèdent un
comportement qui semble irrégulier et sans cohérence. Regardons par exemple
la fonction
Y
(p − 2).
f0 (n) =
p|n
Si la suite de sesP
valeurs semble très erratique, régularité apparaı̂t lorsque l’on
considère (1/X) n≤X f0 (n). Nous allons en effet démontrer que
Théorème Soit X un réel positif. Nous avons
X
(1/X)
f0 (n) = C X + O(X 3/4 )
n≤X
3
p(p + 1)
DR
où la constante C est donnée par
Y
1
C = 2
1−
p≥2
= 0.14630 · · ·
Remarquons que dans cet énoncé et de façon systématique dans la suite, la
lettre p désigne un nombre premier.
L’ordre moyen a pour effet de dissimuler certaines valeurs aberrantes prises
par la fonction considérée.
Nous continuerons ce cours par des applications au crible et nous établirons
par exemple le théorème de Brun-Titchmarsh (sous une forme légèrement plus
faible) :
Théorème Pour M et N deux entiers ≥ 1, le nombre de nombres premiers
dans l’intervalle [M + 1, M + N ] est au plus 2N/ log N .
D’autres applications concerneront les nombres premiers jumeaux, la conjecture de Goldbach et bien d’autres problèmes concernant les nombres premiers.
Le lecteur pourra consulter les livres (Apostol, 1976) ou (Ellison, 1975).
Les livres (Bombieri, 1987/1974a) et (Halberstam & Richert, 1974) sont deux
autres références incontournables. D’autres très bons livres : (Vinogradov, 1954),
(Davenport, 2000), (Montgomery & Vaughan, 2006) et (Bordellès, 2012).
2
Un calendrier :
Dimanche 25/11 – 2h Introduction, bestiaire, produit de convolution et multiplicativité.
(a) Introduction : régularité en moyenne. Fonctions multiplicatives. Bestiaire.
(b) Multiplicativité de la fonction de diviseurs
(c) Convolution de fonctions multiplicatives
Après midi, 2h : fonction ζ de Riemann, abscisse de convergence absolue, unicité
des coefficients de Dirichlet, convolution arithmétique.
Lundi 26/11 – 2h
(a) Sommer des fonctions lisses
(b) Le principe de l’hyperbole de Dirichlet
AF
T
(c) Valeur moyenne de µ2 (n).
Après midi, 2h : Valeur moyenne du pgcd, suite des séries de Dirichlet : multiplicativité.
Mardi 27/11 – 2h Estimations de Mertens
(a) Nombres premiers,
(b) Estimation de Mertens, sommation par parties,
(c) Théorème de Tchebysheff.
Après midi, 2h : taille de la fonction de diviseurs. Exercices sur les applications
et le théorème de Hall en majoration.
Mercredi 28/11 Jour férié.
Jeudi 29/11 – 2h Méthode de convolution
(a) Via un exemple,
(b) Le lemme usuel. Des applications.
Après midi, 2h : Questions, corrections.
Vendredi 28/11 Jour férié.
Samedi 1/11 – 2h Théorème de Levin Fainleib
DR
(a) Le théorème,
(b) Des applications.
Pas d’exercice l’après midi
Dimanche 2/11 – 2h Introduction au crible, Le théorème de Brun Titchmarsh via l’inégalité de Selberg.
Après midi, 2h : l’inégalité du grand crible.
Lundi 3/12 – 2h Le crible de Montgomery, applications.
Après midi, 1h30 : Applications.
Mardi 4/12 – 2h Le groupe multiplicatif de
Z/qZ
(a) Les notions. Les caractères modulo 3 et 4, χ3 (−1) = −1 = χ4 (−1). Nonannulation de L(1, χ3 ) et L(1, χ4 ).
(b) Nombres premiers en progressions arithmétiques par la méthode de Mertens.
Après midi, 1h30 : equation fonctionnelle de la fonction θ, et celle de ζ. Exercice
sur le groupe multiplicatif modulo 5.
Mercredi 5/12 – 2h – Selon ce qui a été fait.
Après midi, 1h.
Jeudi 6/12 – 2h Devoir surveillé.
Au total : 32 heures
25 novembre 2012
Version 2
Table des matières
Introduction
1
AF
T
Table des matières
1 Convolution arithmétique
1.1 Bestiaire . . . . . . . . . . . . . . . . . .
1.2 Fonctions multiplicatives . . . . . . . . .
1.3 La fonction nombre de diviseurs . . . . .
1.4 Convolution et fonctions multiplicatives
1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
6
8
9
2 Initiation aux séries de Dirichlet
2.1 Abscisse de convergence absolue . . . . . . .
2.2 Séries de Dirichlet et produit de convolution
2.3 La fonction ζ de Riemann. . . . . . . . . . .
2.4 Série de Dirichlet et multiplicativité . . . .
2.5 Quelques digressions sans preuve . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
14
15
16
19
.
.
.
.
DR
3 Sommer des fonctions lisses
23
4 Le principe de l’hyperbole
4.1 Un premier terme d’erreur pour la moyenne
nombre de diviseurs . . . . . . . . . . . . . .
4.2 Le principe de l’hyperbole de Dirichlet . . . .
4.3 Un meilleur terme d’erreur pour le nombre de
de la fonction de
. . . . . . . . . . .
. . . . . . . . . . .
diviseurs . . . . .
27
27
28
5 Les estimations de Mertens
5.1 La fonction de von Mangoldt . . . . . . .
5.2 De la fonction log à la fonction Λ . . . . .
5.2.1 Une majoration à la Chebyshev . .
5.2.2 Un théorème à la Mertens . . . . .
5.3 Un résultat de type postulat de Bertrand
5.4 Le théorème des nombres premiers . . . .
.
.
.
.
.
.
33
33
34
35
37
37
39
6 Nombre de diviseurs
.
.
.
.
.
.
.
.
.
.
.
.
27
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
43
7 La méthode de convolution
47
7.1 Preuve du théorème 7.1 . . . . . . . . . . . . . . . . . . . . . . . 48
7.2 Un exercice de sommations par parties . . . . . . . . . . . . . . . 51
7.3 Être sans facteurs carrés . . . . . . . . . . . . . . . . . . . . . . . 52
TABLE DES MATIÈRES
4
8 Exemples et pratique
53
8.1 Trois exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
8.2 Un théorème général. . . . . . . . . . . . . . . . . . . . . . . . . . 56
8.3 Un quatrième exemple détaillé . . . . . . . . . . . . . . . . . . . 58
9 Le théorème de Levin-Fainleib
61
9.1 Une première borne supérieure . . . . . . . . . . . . . . . . . . . 61
9.2 Une formule asymptotique . . . . . . . . . . . . . . . . . . . . . . 63
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
69
69
70
71
72
73
74
75
76
77
11 L’inégalité du grand crible
11.1 Une inégalité de Parseval approchée . . . . . .
11.2 L’inégalité du grand crible . . . . . . . . . . . .
11.2.1 Une transformée de Fourier . . . . . . .
11.2.2 Preuve du théorème 11.3 (forme faible)
11.3 La suite de Farey . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
83
83
84
85
86
87
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
AF
T
10 Une approche moderne
10.1 Des nombres premiers . . . . . . . . . . .
10.2 Une approche “crible” . . . . . . . . . . .
10.3 L’inégalité de Brun-Titchmarsh . . . . . .
10.4 Considérations hermitiennes . . . . . . . .
10.5 Un peu d’arithmétique . . . . . . . . . . .
10.6 Preuve de l’inégalité de Brun-Titchmarsh
10.7 Compléments . . . . . . . . . . . . . . . .
10.8 Optimalité ? . . . . . . . . . . . . . . . . .
10.9 Des nombres premiers jumeaux . . . . . .
DR
12 Le crible de Montgomery
89
12.1 L’énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
12.2 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
13 Premiers dans les progressions
13.1 Le groupe multiplicatif de Z/q Z . . . . . . . . . .
13.2 Les caractères de Dirichlet modulo 3 et modulo 4
13.3 Les théorèmes de Mertens modulo 3 et 4 . . . . .
13.4 Un exemple . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
93
93
94
96
98
14 Exercices
101
Notations
107
References
109
Index
114
25 novembre 2012
Version 2
Chapitre 1
AF
T
Convolution arithmétique
Il s’agit ici d’une présentation des acteurs.
1.1
Bestiaire
1. La fonction de Moebius µ(n) vaut −1 sur chaque nombre premier et 0 sur
toutes leurs puissances.
2. ϕ(n) est l’indicateur d’Euler, c’est à dire le nombre d’entiers entre 1 et n
qui sont premiers à n.
3. d(n) est le nombre de diviseurs (positifs) de n.
4. σ(n) est la somme des diviseurs (positifs) de n.
5. La fonction de Liouville λ(n) = (−1)Ω(n) en est assez proche : en effet
cette dernière est la fonction multiplicative qui vaut (−1)α sur chaque pα .
DR
6. d(n2 ) est le nombre de diviseurs (positifs) de n2 . Il s’agit aussi d’une
fonction multiplicative de n.
7. ω(n) est le nombre de diviseurs premiers de n et par exemple ω(12) =
2 puisque 2 et 3 sont les deux seuls nombres premiers divisant 12. On
dit aussi “sans multiplicité” car, en fait, 22 divise aussi 12. Le nombre
de diviseurs avec multiplicité est Ω(n) qui vérifie Ω(12) = 3. Ces deux
fonctions sont additives, i.e. ω(nm) = ω(n) + ω(m) si (n, m) = 1 et de
même pour Ω. Cette notion est bien sûr le pendant additif de la notion de
fonction multiplicative introduite ci-après.
8. µ2 (n) vaut 1 si n est divisible par un carré > 1 et 0 sinon.
9. Λ(n) est a fonction de van Mangoldt
10. δn=1 ou δ1 est la fonction qui vaut 1 en n = 1 et 0 ailleurs, alors que 1 est
la fonction qui vaut uniformément 1 sur tous les entiers.
11. π(X) est le nombre de nombres premiers inférieurs à X, de sorte que
π(3) = 2 par exemple.
Nous pouvons aussi considérer
1. la fonction ϕ2 qui à chaque entier n associe le nombre d’entiers modulo n
qui sont premiers à n et tels que n + 2 qui le sont aussi,
2. la fonction qui à chaque entier n associe le nombre de carrés modulo n.
CHAPITRE 1. CONVOLUTION ARITHMÉTIQUE
6
1.2
Fonctions multiplicatives
Une fonction f : N \ {0} → C est dite multiplicative si
(
f (1) = 1,
f (mn) = f (m)f (n)
(1.1)
si n et m sont premiers entre eux.
De façon équivalente, nous pouvons écrire
Y
Y
f
pαp =
f pαp
p
(1.2)
p
AF
T
où le produit porte sur tous les nombres premiers et où les αp sont des entiers
positifs ou nuls, dont tous sauf un nombre fini sont nuls. Cette expression montre
clairement que la fonction f est complètement déterminée par sa valeur sur les
entiers qui sont des puissances de nombres premiers. Réciproquement la donnée
de telles valeurs détermine bien une fonction multiplicative, tout simplement en
la définissant à partir de l’égalité ci-dessus.
Exercice 1. Montrer que x, y et z sont trois entiers, et si x est premier à z,
alors le pgcd de xy et z est égal au pgcd de y et de z, i.e.
pgcd(xy, z) = pgcd(y, z).
Indication : Utiliser les décompositions en facteurs premiers.
Exercice 2. Soit a et b deux entiers premiers entre eux.
⋄ 1 ⋄ Montrer que pgcd(a + b, a − b) vaut 1 ou 2. Donner des exemples de
chacun des cas.
DR
⋄ 2 ⋄ Montrer que a + b et ab sont premiers entre eux.
Cette notion de multiplicativité va s’avérer fondamentale. Nous constaterons
en particulier que beaucoup de fonctions arithmétiques a priori mystérieuses se
comprennent beaucoup mieux lorsque l’on regarde leurs valeurs sur les puissances de nombres premiers. Avant d’examiner des exemples, notons le lemme
suivant que nous utiliserons très souvent :
Lemme 1.1
Soit f une fonction multiplicative et m et n deux entiers. Nous avons
f ([m, n])f ((m, n)) = f (m)f (n)
où [m, n] et (m, n) désigne respectivement le ppcm et le pgcd des entiers m et n.
Exercice 3. Démontrer le lemme précédent.
Indication : Utiliser les décompositions en facteurs premiers.
Exercice 4.
⋄ 1 ⋄ Montrer que la fonction somme de diviseurs σ est multiplicative.
⋄ 2 ⋄ Soit p un nombre premier et a ≥ 1 un entier. Montrer que
σ(pa ) =
pa+1 − 1
p−1
où σ(d) est la somme des diviseurs entiers positifs de d.
25 novembre 2012
Version 2
1.2 Fonctions multiplicatives
7
Exercice 5.
⋄ 1 ⋄ Montrer que si n et m sont sans facteurs carrés et distincts, alors
ϕ(n)
ϕ(m)
6=
.
m
n
⋄ 2 ⋄ Montrer que la fonction n 7→ σ(n)/n vérifie la même propriété (i.e. que
celle de n 7→ ϕ(n)/n exhibée à la question précédente).
AF
T
⋄ 3 ⋄ Que pensez-vous de la fonction n 7→ σ(n)/ϕ(n) vis à vis de cette propriété ?
⋄ 4 ⋄ Que pensez-vous de la fonction n 7→
cette propriété ?
Exercice 8.
Q
p|n (p
+ 2)/(p + 1) vis à vis de
⋄ 1 ⋄ Montrer que la fonction f qui à l’entier n associe n admet la fonction g
définie par
g(d) = dµ(d)
comme inverse de convolution.
⋄ 2 ⋄ Démontrer l’identité suivante
σ(n)2 = n
X
σ(d2 )/d.
DR
d|n
Exercice 10. Pour tout module r ≥ 1, nous posons
o
nu
, 1 ≤ u ≤ r, pgcd(u, r) = 1 .
Ξr =
r
Soit q et q ′ deux entiers premiers entre eux. Montrer que la fonction
Ξqq′
Ψ : Ξq × Ξq′ →
(a/q, a′ /q ′ ) 7→ (aq ′ + a′ q)/(qq ′ )
est une bijection.
Indication : On vérifiera que cette fonction est injective. Pour montrer la surjectivité, ou bien on prendra un argument de cardinalité, ou bien on emploiera
le théorème de Bezout : il existe deux entiers u et v tels que uq + vq ′ = 1. Le
point b/(qq ′ ) de Ξqq′ est alors égal à Ψ(bv/q mod 1, bu/q ′ mod 1).
Exercice 11. Soit P (X) un polynôme non constant à coefficients dans Z. Soit
ρ(q) le nombre de solutions de P (x) ≡ 0[q]. Montrer que la fonction q 7→ ρ(q)
est multiplicative.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 1. CONVOLUTION ARITHMÉTIQUE
8
1.3
La fonction nombre de diviseurs
Commençons par détailler ce pourquoi la fonction qui à n associe son nombre
de diviseurs est multiplicative. Ceci repose en fait sur la structure de l’ensemble
D(n) des diviseurs de n. Tout d’abord
D(pα ) = 1, p, p2 , · · · , pα−1 bigr}.
(1.3)
AF
T
Ensuite, si p1 et p2 sont deux nombres premiers distincts, chaque diviseur du
β1 β2
1 α2
produit pα
1 p2 est de la forme p1 p2 avec 0 ≤ β1 ≤ α1 et 0 ≤ β2 ≤ α2 . Par
1 α2
ailleurs, chaque entier de cette forme est bien un diviseur de pα
1 p2 . Ceci nous
donne
2
1
1 α2
(1.4)
· D pα
= D pα
D pα
2 .
1
1 p2
Nous montrons de la même façon que D(mn) = D(m) · D(n) si m et n sont
premiers entre eux. De façon explicite la fonction suivante est une bijection :
D(mn) → D(m) · D(n) d 7→ (d, m), (d, n) .
(1.5)
Il s’agit là d’une forme de multiplicativité au niveau des ensembles, et que nous
allons exploiter sous la forme suivante : pour toute fonction F , l’identité suivante
a lieu dès que m et n sont deux entiers premiers entre eux
XX
X
F (d1 d2 ).
(1.6)
F (d) =
d1 |m d2 |n
d|mn
Démonstration. Soit D(ℓ) l’ensemble des diviseurs positifs de ℓ. Étant donné
deux entiers premiers entre eux m et n, nous considérons
DR
f : D(m) × D(n) → D(mn)
(u, v) 7→ uv
,
g : D(mn) → D(m) × D(n)
w 7→ (pgcd(w, m), pgcd(w, n))
Nous montrons que g◦f = Id. En effet (g◦f )(u, v) = (pgcd(uv, m), pgcd(uv, n)).
Comme v divise n et que n est premier à m, les entiers v et m sont premiers
entre eux. L’exercice 1 nous donne alors pgcd(uv, m) = pgcd(u, m) = u et de
même pgcd(uv, n) = pgcd(v, n) = v. Ce qu’il fallait démontrer.
√
Exercice 12. Montrer que, pour tout n ≥ 1, nous avons d(n) ≤ 2 n.
√
Indication : La meilleure constante est 3.
Exercice 13. Montrer que, pour tout n ≥ 1, nous avons d(n) ≤ 3 n1/3 .
Indication : La meilleure constante est 181/3 .
Exercice 14. Montrer que, pour tout n ≥ 1, nous avons ϕ(n) ≥
p
n/2.
Exercice 15. Montrer que, pour tout n ≥ 1, nous avons ϕ(n) ≥ (9/2)1/3 n2/3 .
Exercice 16. Montrer que, pour tout n ≥ 1, nous avons σ(n)ϕ(n) ≤ n2 .
25 novembre 2012
Version 2
1.4 Convolution et fonctions multiplicatives
1.4
9
Convolution et fonctions multiplicatives
Nous définissons le produit de convolution arithmétique f ⋆ g par
X
f (n/d)g(d)
(f ⋆ g)(n) =
(1.7)
d|n
où la somme porte sur les diviseurs d de n. En notant 1 la fonction qui vaut 1
sur tous les entiers, nous avons d(n) = 1 ⋆ 1. La lectrice vérifiera que ce produit
est associatif et commutatif. La fonction δn=1 en est l’élément neutre, puisque
pour toute fonction arithmétique g, nous avons
X
(δ1 ⋆ g)(n) =
δ1 (ℓ)g(m) = g(n).
AF
T
ℓm=n
Ce produit est par ailleurs distributif vis-à-vis de l’addition de deux fonctions
arithmétiques et ces deux lois permettent de munir l’ensemble de fonctions
arithmétiques d’une structure d’algèbre commutative unitaire sur C. Nous pourrions aussi enrichir cette structure en considérant la dérivation
∂ : (f (n))n≥1 7→ (f (n) log n)n≥1
qui est linéaire et vérifie de surcroı̂t ∂(f ⋆ g) = (∂f ) ⋆ g + f ⋆ (∂g) mais nous
sortons ici de notre cadre. La lectrice trouvera une étude assez détaillée de cette
structure dans le livre de Bateman & Diamond (Bateman & Diamond, 2004).
Exercice 17. Montrer que, si D(f, s) converge absolument, il en est de même
de D(∂f, r) pour r > s. Que penser de la réciproque ? Peut-on affaiblir cette
condition à r ≥ s ?
Le théorème général suivant nous donne la multiplicativité de toute une
kyrielle de fonctions :
DR
Théorème 1.2
Si f et g sont deux fonctions multiplicatives, il en est de même de f ⋆ g.
Démonstration. La valeur en 1 est aisée : f ⋆ g(1) = f (1)g(1) = 1. Soit ensuite
deux entiers m et n premiers entre eux. Nous avons
X
f (mn/d)g(d)
(f ⋆ g)(mn) =
d|mn
et appliquons (1.6) :
X X mn g(d1 d2 )
f
(f ⋆ g)(mn) =
d1 d2
d1 |m d2 |n
X X m n f
=
f
g(d1 )g(d2 ) = (f ⋆ g)(m)(f ⋆ g)(n)
d1
d2
d1 |m d2 |n
comme requis.
Ceci nous donne d’un seul coup la multiplicativité de beaucoup de fonctions,
en partant des exemples simples que sont les fonctions 1 et plus généralement
X a : n 7→ na . En particulier, le lecteur vérifiera que
d(n) = (1 ⋆ 1)(n),
Le cours de Nouakchott
σ(n) = (1 ⋆ X)(n).
25 novembre 2012
CHAPITRE 1. CONVOLUTION ARITHMÉTIQUE
10
Cette convolution nous permet aussi d’exprimer simplement certaines relations,
comme
1. d(n2 ) = (1 ⋆ 2ω(X) )(n).
2. µ2 (n) = (1 ⋆ 1X 2 )(n) où 1X 2 est la fonction caractéristique des carrés.
Exercice 18. Montrer que d(n2 ) =
X
2ω(d) .
d|n
AF
T
Exercice 19. Soit F l’espace vectoriel sur C des fonctions de N \ {0} dans
C. Si f et g sont dans F , rappelons que f ⋆ g est défini par
X
f (d)g(n/d).
f ⋆ g(n) =
d|n
Alors
1. Montrer que f ⋆ (g ⋆ h) = (f ⋆ g) ⋆ h.
2. Montrer que (F , +, ⋆) est une algèbre commutative sur C.
3. Déterminer une unité δ pour ⋆.
4. Montrer que 1 (la suite constante égale à 1) et µ sont inverses l’un de
l’autre.
Exercice 20.
⋄ 1 ⋄ Montrer que pour tout entier d sans facteurs carrés, le nombre de solutions en d1 et d2 de [d1 , d2 ] = d est 3ω(d) .
DR
⋄ 2 ⋄ Soit q un entier. Nous notons f (q) le nombre de solutions en q1 et q2 de
[q1 , q2 ] = q. Montrer que f est multiplicative.
⋄ 3 ⋄ Montrer que 1 ⋆ f (n) est le nombre de couples (q1 , q2 ) tels que [q1 , q2 ]|n.
Exercice 21. On rappelle que f est complètement multiplicative si et seulement si f (mn) = f (m)f (n) pour tout couple d’entiers m et n.
⋄ 1 ⋄ Déterminer toutes les fonctions complètement multiplicatives f qui sont
telles que 1 ⋆ f est encore complètement multiplicatif.
⋄ 2 ⋄ Déterminer l’inverse de la fonction complètement multiplicative f .
⋄ 3 ⋄ Montrer que l’inverse de l’inverse de convolution de la fonction 1 ⋆ f
n’est en général pas µ · (1 ⋆ f ), même si nous nous restreignons aux fonctions
complètement multiplicatives f .
Exercice 24. Montrer que la fonction qui à l’entier n > 1 associe le double
de la somme des entiers entre 1 et n qui lui sont premiers, et qui à 1 associe
1, est multiplicative.
25 novembre 2012
Version 2
1.4 Convolution et fonctions multiplicatives
11
Indication : On pourra calculer cette somme directement en utilisant le fait
que la fonction caractéristique des entiers m premiers à n s’écrit aussi
X
µ(d),
d|n,
d|m
AF
T
ce que l’on prendra soin de démontrer.
Exercice 25. Nous posons σk (n) =
P
k
d|n d .
Montrer que
σk (n) ≤ nk ζ(k)
dès que k > 1.
Exercice 26. Nous souhaitons montrer le lemme de Thue qui dit : soit a ≥ 1
un entier et p ≥ 3 un nombre premier tel que p ∤ a. L’équation au ≡ v[p] admet
une solution (u, v) ∈ Z2 telle que
1 ≤ |u| <
√
1 ≤ |v| <
p,
√
p.
√
⋄ 1 ⋄ Considérons S = {0, · · · , [ p]} et l’application
DR
f : S 2 → {0, · · · , p − 1},
(u, v) 7→ f (u, v) ≡ au − v[p].
Montrer que f n’est pas injective.
⋄ 2 ⋄ Soit deux paires (u1 , v1 ) et (u2 , v2 ) telles que f (u1 , v1 ) = f (u2 , v2 ). Nous
√
posons u = u1 − u2 et v = v1 − v2 . Montrer que au ≡ v[p], puis que |u| < p
√
et |v| < p, et enfin que ni u ni v n’est nul.
Exercice 27. Montrer que
X
m|n
Exercice 28. Montrer que
X
d(m)3 =
X
m|n
2
d(m) .
µ2 (d)k ω(d) = (k + 1)ω(d) .
d|n
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 1. CONVOLUTION ARITHMÉTIQUE
12
Exercice 29.
⋄ 1 ⋄ Montrer que, pour tout entier n ≥ 1, on a
nn+1
≤ ϕ(n)σ(nn ) ≤ nn+1 .
ζ(n + 1)
⋄ 2 ⋄ Déterminer si la série
X n
σ(nn ) −
ϕ(n)
nn
n≥1
DR
AF
T
est convergente ou non.
25 novembre 2012
Version 2
Chapitre 2
AF
T
Initiation aux séries de
Dirichlet
Le lecteur peut ici se restreindre aux séries de Dirichlet d’argument réel. Nous
nous bornerons de plus à rester dans des domaines de convergence absolue, ce
qui nous suffira ici. Pour une étude plus complète, voir (Tenenbaum, 1995) ou
(Ellison, 1975).
2.1
Abscisse de convergence absolue
Lorsque nous disposons d’une fonction arithmétique, disons f , nous pouvons
former sa série de Dirichlet qui est, pour tout argument réel s :
X
D(f, s) =
f (n)/ns .
(2.1)
DR
n≥1
Cette définition est a priori formelle, puisqu’il n’est pas toujours vrai qu’il existe
au moins un s pour lequel cette série converge (il n’en existe d’ailleurs pas quand
f (n) = en ).
Lemme 2.1 Soit f une fonction arithmétique telle que sa série de Dirichlet
converge absolument pour un certain nombre complexe s. Alors, pour tout nombre
réel r > ℜs, la série D(f, r) converge absolument, et donc, pour tout nombre
complexe s′ tel que ℜs′ > ℜs, la série D(f, s′ ) converge absolument.
Démonstration. Nous avons
D(f, r) =
X f (n) ns
.
ns nr
n≥1
Or r > s donc ns /nr < 1, d’où D(|f |, r) < D(|f |, s), i.e. la série de Dirichlet de
f converge pour tout r > s.
Cette propriété nous donne accès à la notion d’abscisse de convergence.
Définition 2.2 On appelle abscisse de convergence de la fonction f , le plus
petit réel s tel que la série de Dirichlet D(f, s) converge. Si D(f, s) converge
pour tout s, on dit alors que l’abscisse de convergence est −∞.
CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET
14
AF
T
Notons qu’il n’est pas acquis que la série en question converge en son abscisse
de convergence. D’après un théorème de Landau, voir (Dress, 1983/84), cette
situation n’arrive même jamais dès que cette abscisse est finie et que que f est
positive ou nulle. Notons ici que l’abscisse de convergence peut valoir −∞ et la
fonction f être positive ou nulle, sans que cela n’implique que f soit à support
borné, i.e. qu’elle s’annule partout sauf sur un nombre fini de valeurs. Le cas
f (n) = e−n fournit un contre-exemple.
Nous pouvons associer à chaque fonction arithmétique f une série de Dirichlet, et cette série convergera au moins en un point si la fonction f croı̂t raisonnablement. Une telle série de Dirichlet définit en fait parfaitement la fonction
dont elle est issue comme le montre la propriété suivante. Nous ne l’utiliserons
pas dans la suite.
Lemme 2.3 Soit f et g deux fonctions arithmétiques telles que leurs séries
de Dirichlet respectives convergent absolument pour un certain s. Supposons en
outre que D(f, r) = D(g, r) pour tout r > s. Alors f = g.
Démonstration. En posant h1 = f − g, nous avons D(h1 , r) = 0 pour tout
r > s. Comme cette série converge en r = s + 1, nous en déduisons que h2 (n) =
h1 (n)/nr+1 est bornée en valeur absolue et vérifie D(h2 , r) = 0 pour tout r > −1
et il nous faut établir que h2 = 0. Supposons que ce ne soit pas le cas, et
nommons n0 le plus petit entier n tel que h2 (n) 6= 0. Une comparaison à une
intégrale nous donne directement, pour r > 1 :
|nr0 D(h2 , r) − h2 (n0 )| ≤ max |h2 (n)|
n
≤
X
nr0
nr
n≥n0 +1
Z ∞
dt
r
max |h2 (n)|n0
r
n
n0 t
≤ max |h2 (n)|/(r − 1),
n
DR
quantité qui tend vers 0 quand r tend vers l’infini. Mais D(h2 , r) = 0, ce qui
nous garantit que h2 (n0 ) = 0 contrairement à notre hypothèse. Le lecteur pourra
modifier cette démonstration de deux façons : tout d’abord remplacer le recours
à un raisonnement par l’absurde par une démonstration par récurrence. Ensuite,
−r
une petite modification donne nr0 D(h2 , r) − h2 (n0 ) = O((1 + n−1
) alors que
0 )
la preuve ci-dessus ne donne que O(1/r).
2.2
Séries de Dirichlet et produit de convolution
Les deux lois internes sur les fonctions arithmétiques se traduisent agréablement en termes de séries de Dirichlet :
– Concernant l’addition (+) : étant donné deux fonctions f et g dont les
séries de Dirichlet convergent absolument pour s, nous avons
D(f + g; s) = D(f ; s) + D(g; s).
– Concernant la multiplication (⋆) : étant donné deux fonctions f et g dont
les séries de Dirichlet convergent absolument pour s, alors celle de f ⋆ g
est également absolument convergente, et nous avons
D(f ⋆ g; s) = D(f ; s)D(g; s).
25 novembre 2012
Version 2
2.3 La fonction ζ de Riemann.
15
Cette dernière égalité est facile à vérifier de ce que les séries convergent absolument, ce qui nous permet d’en déplacer les termes comme bon nous semble.
Elle montre en particulier que l’opérateur qui, à une fonction arithmétique, lui
associe sa série de Dirichlet trivialise le produit de convolution arithmétique, de
la même façon que la transformée de Fourier trivialise le produit de convolution
des fonctions de la droite réelle.
Il est clair que l’abscisse de convergence de la série de Dirichlet de f ⋆ g
est majorée par le maximum des abscisses de convergence absolue des séries de
Dirichlet associées à de f et g. Cette majoration est souvent une égalité lorsque
ces deux abscisses ne sont pas égales ... et qu’aucun des facteurs n’est nul !
Exercice 30. Montrer que
AF
T
1. D(ϕ, s) = ζ(s − 1)/ζ(s),
2. D(λ, s) = ζ(2s)/ζ(s),
3. D(µ2 , s) = ζ(s)/ζ(2s).
Exercice 31. Montrer que la série de Dirichlet associée à la fonction de Moebius µ est 1/ζ(s) et en déduire un exemple montrant que l’abscisse de convergence absolue d’un produit peut être strictement inférieure à la plus grande des
deux abscisses des deux facteurs (considérer 1 ⋆ µ).
Exercice 32. Exprimer la série de Dirichlet de la fonction qui à n associe
2ω(n) en fonction de la fonction ζ de Riemann. Ici ω(n) est le nombre de
facteurs premiers de n comptés sans multiplicité.
Exercice 33. Exprimer la série de Dirichlet de la fonction qui à n associe
2ω(n) λ(n) en fonction de la fonction ζ de Riemann. Ici, λ est la fonction
de Liouville définie par λ(n) = (−1)Ω(n) où Ω(n) est le nombre de facteurs
premiers de n comptés avec multiplicité.
DR
Exercice 34. Dans cet exercice, d(n) désigne le nombre de diviseurs de n, et
si n = pν11 pν22 · · · pνkk , nous posons κ(n) = ν1 ν2 · · · νk . Montrer que
X
⋄1⋄
κ(n)/ns = ζ(s)ζ(2s)ζ(3s)/ζ(6s),
n≥1
⋄2⋄
X
3ω(n) κ(n)/ns = ζ 3 (s)/ζ(3s).
n≥1
Indication : Toutes ces fonctions étant multiplicatives (à montrer), il suffit
de calculer chaque facteur eulérien.
2.3
La fonction ζ de Riemann.
La fonction ζ est très importante en arithmétique puisqu’elle intervient dans
la formule d’Euler, elle fait donc un lien entre les entiers naturels et les nombres
premiers. C’est aussi la série de Dirichlet la plus simple puisqu’elle est associée
à la fonction constante 1 (fonction que nous avons notée 1 dans notre bestiaire).
Elle est définie pour s > 1 par
X
ζ(s) =
n−s .
n≥1
Le cours de Nouakchott
25 novembre 2012
16
CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET
Si il s’agit de la série de Dirichlet la plus simple et la plus célèbre, cependant
elle reste assez mal connue. Pour une étude approfondie de cette fonction, le
lecteur pourra se référer à (Tenenbaum, 1995) et (Ellison, 1975).
Exercice 35. Montrer que la série qui définit ζ(s) est absolument convergente
pour ℜs > 1.
Indication : On pourra utiliser une comparaison à une intégrale.
Exercice 36. Montrer que l’on a
Z
∞
1
{t}
dt
ts+1
AF
T
1
−s
ζ(s) =
s−1
et en déduire un équivalent de ζ(1 + u) lorsque u tend vers 0.
Indication : On pourra écrire, pour n ≥ 1,
Z ∞
dt
1
=
s
s+1
ns
t
n
(technique dite de sommation par parties).
Exercice 37.
P
⋄ 1 ⋄ Nous posons L(s) = n≥1 (−1)n n−s . Montrer que L(s) est convergente
pour ℜs > 0, puis que L(1) < 0 et enfin que L′ (1) < 0.
⋄ 2 ⋄ Montrer que −ζ ′ (s)/ζ(s) < 1/(s − 1) lorsque s est réel et > 1.
Indication : On pourra utiliser ζ(s) = L(s)/(21−s − 1), que l’on démontrera.
DR
Exercice 38. Montrer que, pour σ > 1, nous avons 1/(σ − 1) < ζ(σ) <
σ/(σ − 1).
Exercice 39. Montrer que, pour σ > 1, nous avons ζ(σ) = (σ − 1)−1 + γ +
O(σ − 1).
2.4
Série de Dirichlet et multiplicativité
Théorème 2.4 Supposons que la série de Dirichlet de la fonction multiplicative
f converge absolument pour un certain s. Alors, D(f, s) est développable en
produit eulérien :
Y X f (pk )
D(f, s) =
.
pks
p≥2 k≥0
Le reste de cette section est dédiée à établir cette propriété.
Nous nous donnons ici une fonction arithmétique multiplicative f que nous
supposerons bornée en valeur absolue par 1. Nous pouvons dans tous les cas
pratiques nous ramener à ce cas, quitte à considérer une fonction auxiliaire de
la forme f (n)/na qui est, elle aussi, multiplicative (dès lors que f l’est).
25 novembre 2012
Version 2
2.4 Série de Dirichlet et multiplicativité
17
Soit y ≥ 1 un paramètre réel. Nous considérons la fonction multiplicative fy
définie par

 ∀p ≤ y, ∀α ≥ 1, fy (pa ) = f (pa ),
(2.2)
 ∀p > y, ∀α ≥ 1, f (pa ) = 0,
y
(p est ici un nombre premier) et, de façon symétrique,

 ∀p ≤ y, ∀α ≥ 1, f y (pa ) = 0,
(2.3)
 ∀p > y, ∀α ≥ 1, f y (pa ) = f (pa ).
Lemme 2.5
AF
T
Notons que nous avons l’équation
f = fy ⋆ f y
(2.4)
Démonstration. En effet, les sommants de la somme
X
fy (d1 )f y (d2 )
d1 d2 =n
sont presque tous nuls puisque l’entier n admet une unique écriture sous la forme
n = ℓm où tous les facteurs premiers de ℓ sont inférieurs y et tous ceux de m
sont strictement supérieurs à y. La somme ci-dessus se réduit donc à fy (ℓ)f y (m)
qui vaut bien f (n).
Nous posons alors
Dy♯ (f, s) = D(f y , s)
(2.5)
DR
Dy♭ (f, s) = D(fy , s),
de telle sorte que D(f, y) = Dy♭ (f, s)Dy♯ (f, s). La série de Dirichlet Dy♭ (f, s) se
réduit à un produit, pour ℜs > 1 :
Dy♭ (f, s) =
Y
f (p) f (p2 ) f (p3 )
1 + s + 2s + 3s + · · · .
p
p
p
(2.6)
p≤y
La série Dy♯ (f, s) tend à devenir petite lorsque y tend vers l’infini. En effet, avec
σ = ℜs,
Z ∞
X
σ
.
(2.7)
|Dy♯ (f, s) − 1| ≤
1/nσ ≤ y −σ +
dt/tσ ≤
(σ − 1)y σ−1
y
n>y
En laissant y tendre vers l’infini, nous obtenons donc l’expression de D(f, s)
sous forme d’un produit dit eulérien
D(f, s) =
Y
1+
p≥2
f (p) f (p2 ) f (p3 )
+
+
+
·
·
·
,
ps
p2s
p3s
(ℜs > 1),
(2.8)
où chaque facteur est dit le facteur local, ou eulérien, en p.
Le cours de Nouakchott
25 novembre 2012
18
CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET
Convergence et produit convergent
Nous ouvrons ici une parenthèse sur la signification de (2.8). La suite 1/2,
(1/2) × (1/2), (1/2) × (1/2) × (1/2), et de terme général (1/2)n , est convergente,
et de limite 0. Ici, rien de neuf. Toutefois, par une maladresse terminologique,
on dit qu’un produit (formel) infini
Y
an
n≥1
est convergent si et seulement
AF
T
1. La suite des produits partiels converge vers une limite, disons P ;
2. P 6= 0.
L’equation (2.8) donne donc une écriture sous forme de produit, c’est à dire
comme la limite d’une suite de produits partiels qui converge vers une limite,
mais il faut en général vérifier la condition 2 ci-dessus. Parfois on dit que le
produit converge strictement lorsque cette condition est vérifiée.
Convergence et produit convergent : le point de vue de Godement
Hervé Queffelec propose d’adopter leQpoint de vue suivant, qui est efficace
et limpide. Godement
P dit que le produit n≥1 an est absolument convergent en
tant que produit si n≥1 |an − 1| = M < ∞. Ceci à cause du théorème suivant :
P
Théorème 2.6 Supposons que n≥1 |un | = M < ∞. Alors
Q
1. Pn = 1≤j≤n (1 + uj ) → P ∈ C.
DR
2. Si 1 + uj 6= 0 pour tout j alors P 6= 0.
Démonstration. Nous avons Pn − Pn−1 = un Pn−1 et donc
|Pn − Pn−1 | ≤ |un ||Pn−1 | ≤ |un |
Y
1≤j≤n−1
e|uj | ≤ |un |eM .
P
Il en résulte que la série n (Pn − Pn−1 ) est absolument convergente, et donc
la suite Pn converge, disons vers P ∈ C.
Pour montrer que P 6= 0, on exhibe Q tel que P Q = 1. Quoi de
Qplus naturel
que de
chercher
Q
sous
la
forme
d’un
autre
produit
infini
Q
=
j≥1 (1 + vj ),
P
avec j≥1 |vj | < ∞ ? L’idéal serait d’ajuster vj pour avoir (1 + uj )(1 + vj ) = 1
pour tout j. Or c’est possible car 1 + uj 6= 0. Et ça donne
vj =
−uj
1
−1=
,
1 + uj
1 + uj
d’où |vj | ∼ |uj |
et tout est dit.
Les logarithmes sont cachés dans les majorations 1 + x ≤ ex et Pn−1 ≤ eM .
Mais leur présence reste discrète.
25 novembre 2012
Version 2
2.5 Quelques digressions sans preuve
19
Un détour historique
AF
T
La décomposition (2.4) a été beaucoup exploitée, notamment par (Daboussi,
1984) (voir aussi (Daboussi, 1996) et (Daboussi & Rivat, 2001)) et permet dans
l’article cité de donner une preuve élémentaire du théorème des nombres premiers. Cette décomposition est au cœur du travail récent (Granville & Soundararajan, 2001) où les auteurs développent la philosophie suivante : le comportement de la fonction fy est très bien décrit par son produit eulérien alors que le
comportement de f y est lui décrit par des équations fonctionnelles (ce que nous
ne décrivons pas ici). Essayer de réduire la compréhension d’une fonction multiplicative f à la composante fy est l’essence des méthode dites probabilistes,
notoirement développées par Kubilius.
P
Exercice 40. Soit a un réel ≥ 0. Nous posons λa (n) = d|n da λ(d) où λ(d)
est la fonction de Liouville. Montrer que
X λa (n)
ζ(s)ζ(2s − 2a)
=
ns
ζ(s − a)
n≥1
pour ℜs > 1 + a.
et
X λ(n)λa (n)
ζ(2s)ζ(s − a)
=
ns
ζ(s)
n≥1
Exercice 41. Montrer que l’on a, pour ℜs > 1,
ζ(s) =
1
1
1
−
ps
p≥2
Y
où le produit est convergent au sens de Godement.
Quelques digressions sans preuve
DR
2.5
Les séries des Dirichlet ont été introduites dans (Dirichlet, 1937) par P.G.
Lejeune-Dirichlet en 1937 pour montrer de l’existence d’une infinité de nombres
premiers dans les progressions arithmétiques (de type a + nq avec a et q premiers entre eux). Dedekind, d’abord un élève puis un ami de Dirichlet, a établi
plusieurs propriétés de ces séries enrichissant ainsi le livre (Lejeune-Dirichlet,
1871). L’étape de structuration suivante est due à un mémoire de Cahen (Cahen, 1894), qui est notamment célèbre pour . . . l’inexactitude de ses preuves !
L’élaboration de la théorie est allée bon train à cette période, et en 1915 parut
la splendide petite monographie (Hardy & Riesz, 1964) de Hardy & Riesz qui
reste à ce jour l’ouvrage de base sur la question. La lectrice pourra retrouver
dans (Tenenbaum, 1995) une partie de ce matériel.
Nous nous intéressons ici à deux points :
1. Dans quelle mesure l’ordre moyen et l’abscisse de convergence sont-ils liés ?
2. L’écriture D(f, s) = D(h, s)D(g, s) nous permet-elle de conclure que l’abscisse de convergence absolue de D(f, s) est le maximum de celle de D(h, s)
et de celle de D(g, s) ?
En ce qui concerne le premier point, nous avons vu dans la section 7.1 que la
connaissance de l’ordre moyen de la fonction f permettait d’en déduire l’abscisse
de convergence de D(f, s). La réciproque est fausse, tout simplement parce qu’il
Le cours de Nouakchott
25 novembre 2012
20
CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET
est tout à fait possible que f n’admette pas d’ordre moyen. Ces deux notions
sont tout de même liées par le théorème suivant (dû à Cahen (Cahen, 1894)) :
Théorème 2.7 Si l’abscisse de convergence absolue σ0 de D(f, s) est strictement positive, elle est donnée par
P
log 1≤n≤N |f (n)|
σ0 = lim sup
.
log N
n→∞
AF
T
Il existe un théorème analogue pour déterminer l’abscisse de convergence
(mais nous n’avons pas établi son existence !), et il est aussi possible de traiter
le cas où σ0 est négative ou nulle (mais la formule est différente). La lectrice
remarquera que cette formule est l’exact pendant de la formule de Hadamard
donnant le rayon de convergence d’une série entière, moyennant de rappeler
l’identité que nous avons (presque !) démontrée en (7.4) :
Z ∞ X
|f (n)| dt/ts+1 .
D(|f |, s) = s
1
n≤t
DR
Tournons-nous à présent vers la seconde question. Nous supposons ici que
nous disposons d’une décomposition de la forme D(f, s) = D(h, s)D(g, s), où
nous connaissons l’abscisse de convergence absolue, disons σ0 , de D(g, s) et
où celle de D(h, s) est strictement plus petite. Pouvons-nous en conclure que
σ0 est encore l’abscisse de convergence absolue σ0′ de D(f, s) ? Il est clair que
σ0′ ≤ σ0 , mais peut-elle être plus petite ? C’est évidemment le cas si h = 0, amis
qu’en est-il si h 6= 0 ? Les auteurs de cet article ne savent pas répondre à cette
question générale, mais il est loisible dans notre cas d’application d’ajouter une
hypothèse : nous supposons que, pour tout δ > 0, le module de D(h, s) est
minoré lorsque s décrit le demi-plan complexe ℜs ≥ σ0 + δ. Cette hypothèse
ne nous coûte rien en pratique puisque nous obtenons D(h, s) sous la forme
d’un produit eulérien, qui en tant que produit convergent, n’est ni infini, ni nul.
Mais il nous faut maintenant considérer les s du domaine complexe, ce que nous
avions réussi à éviter jusqu’à présent ! Voici le théorème (Hewitt & Williamson,
1957) de Hewitt & Williamson qui nous intéresse :
Théorème 2.8 Soit D(h, s) une série de Dirichlet absolument convergente pour
ℜs ≥ σ et minorée en module par une constante > 0, alors 1/D(h, s) est encore
une série de Dirichlet absolument convergente pour ℜs ≥ σ.
Ce résultat nous permet d’écrire D(g, s) = D(h, s)−1 D(f, s) et d’en conclure
que σ0′ ≥ σ0 , ce qui nous donne bien σ0 = σ0′ .
De nombreux travaux comparent les abscisses de convergence simple, absolue ou uniforme des trois constituants de l’égalité D(f, s) = D(h, s)D(g, s) ;
la lectrice en trouvera un exposé ainsi que leurs extensions au cas de plusieurs
facteurs et les dernières améliorations (optimales) dans (Kahane & Queffélec,
1997).
Exercice 42. Montrer que 1 ⋆ λ est la fonction caractéristique des carrés et
en déduire la série de Dirichlet de λ. Ici, λ est la fonction de Liouville, définie
par λ(n) = (−1)Ω(n) où Ω(n) est le nombre de facteurs premiers de n comptés
avec multiplicité.
Exercice 43. Exprimer la série de Dirichlet de la fonction qui à n associe
ϕ(n) en fonction de la fonction ζ de Riemann.
25 novembre 2012
Version 2
2.5 Quelques digressions sans preuve
21
Exercice 44.
⋄ 1 ⋄ Déterminer la série de Dirichlet de d(n2 ).
⋄ 2 ⋄ Déterminer la série de Dirichlet de d(n)2 .
⋄ 3 ⋄ En utilisant les deux questions précédentes, montrer que
X
d(m2 ).
d(n)2 =
DR
AF
T
m|n
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET
DR
AF
T
22
25 novembre 2012
Version 2
Chapitre 3
AF
T
Sommer des fonctions lisses
The main objects in analytic number theory often look like
X
a(n)
n≤X
for some function of ”arithmetical” nature a(n), where the adjective ”arithmetical” needs to be defined. This is the case when a is C1 . A hidden hypothesis
we will comment later on is that a′ is bounded. A first example of this situation
is
X 1
= log X + γ + O(1/X), (X ≥ 1).
(3.1)
n
n≤X
DR
An even simpler example is given by
X
1 = X + O(1),
n≤X
(X ≥ 1).
(3.2)
Preuve de (3.1) : Commençons par rappeler que, pour tout t ∈ R, nous avons
X
n≤t
1 = t + O(1).
Supposons à présent que nous souhaitions obtenir une approximation de
Et bien il nous suffit de remarquer que :
1
1
=
+
n
X
Z
X
n
dt
.
t2
Il vient alors :
X 1
=
n
n≤X
We prove here that
P
n≤X
X
1
+
Z
1
X
X dt
1 2 = log X + O(1).
t
n≤t
P
n≤X
1/n.
(3.3)
CHAPITRE 3. SOMMER DES FONCTIONS LISSES
24
Lemme 3.1
X log n
=
n
n≤X
1
2
log2 X + γ1 + O(log(2X)/X),
(X ≥ 1)
for some constant γ1 that is called the Laurent-Stieltjes constant of index 1.
AF
T
A preliminary remark on uniformity : In all three previous estimates, we have
written “X ≥ 1” while the estimate is most interesting when X is large. However, we need an estimate that is uniform in some range, and, for instance here,
there exists a constant C such that, for any X ≥ 1, we have
X log n 1
2
−
log
X
−
γ
1 ≤ C log(2X)/X.
2
n
n≤X
This would be false if we had written +O((log X)/X) in (3.1), for it cannot hold
when X = 1. Such problems are usually trivial to sort, but a slip at this level
may lead to mighty mistakes later on. There is nothing magic in the “log(2X)”
and we may as well have written “1 + log X” or “log(3X)”.
Démonstration. We simply write
log X
log n
=
+
n
X
Z
X
n
log t − 1
dt.
t2
This gives us
DR
X Z X log t − 1
X log n
log X
dt
= [X]
+
n
X
t2
n≤X n
n≤X
Z X X log X
log t − 1
= [X]
1
dt
+
X
t2
1
n≤t
where [X] denotes the integer part of X. We continue by using (3.2) in the form
[t] = t − {t} ({t} being the fractionnal part of t) :
Z ∞
log(2X) X log n Z X log t − 1
log t − 1
.
dt
+
O
=
dt + log X −
{t}
n
t
t2
X
1
1
n≤X
and (3.1) follows readily.
The technique we have developped in the above proof is known as summation
by parts. The reader will find different versions of this, usually more intricate
than the one above, relying either on Abel summation process or on Stieltjes
integration. We have relied on (3.2), but see exercise 128 for a more general
usage. We recommend to the reader the following two exercises ?? and 47. This
case is thus well-understood. If we want to gain precision in the error term,
then we appeal to the Euler-MacLaurin summation formula, but as the reader
will see by analysing the example we treated, there is no way one can avoid
fractionnal parts in the development. Note
P however that
– We do not know how to evaluate n≤X nit with enough precision when t
is large with respect to X.
25 novembre 2012
Version 2
25
– The error term in (3.2) (i.e. the fractionnal part) is much more important
than it looks. In our proofs, we want very often to show that the resulting
error term is very small but, if it simply did not exist, then we would
have ζ(s) ”=” 1/(s − 1). This implies that this error term is responsible
for the functionnal equation of the Riemann zeta function as well as for
its Euler-product !
Exercice 47. Montrer que
X
X 2
log
≪ X,
n
n≤X
(X → ∞).
AF
T
Exercice 48. Montrer que, pour tout entier k ≥ 1,
X
log
n≤X
X k
≪ X,
n
(X → ∞).
Exercice 49. Nous définissons
X
T (N ) =
y≤(N/2)1/3 /2
⋄ 1 ⋄ Montrer que
log(N − 8y 3 ).
T (N ) = 21 (N/2)1/3 log N + c0 N 1/3 + O(log N )
pour une certaine constante c0 .
⋄ 2 ⋄ Montrer que
DR
T (N ) = 16 (N/2)1/3 log N +
X
(N/2)1/3 <m≤N,
∃y≤(N/2)1/3 /2,m|N −8y 3
Λ(m) + O(N 1/3 )
⋄ 3 ⋄ En déduire qu’il existe une infinité d’entiers de la forme n = N − 8y 3
où y est un entier qui vérifie 8y 3 ≤ N/2 qui admettent un facteur premier
p ≥ n1/6 .
Exercice 52. Montrer que
X
√
{x/n} = (1 − γ)x + O( x)
n≤x
où {y} est la partie fractionnaire de y.
Exercice 53. Pour des entiers N ≥ 1 et d ≥ 1, nous avons
(1/d)
X
n,m≤N
d|n−m
Le cours de Nouakchott
1=
2
N2 + N/d − N/d .
2
d
25 novembre 2012
CHAPITRE 3. SOMMER DES FONCTIONS LISSES
26
Indication : Le cas N < d est facile. Dans le cas N ≥ d, soit b l’entier
dans [1, d] qui est congruent à N modulo d. On trouve que d fois la somme en
question vaut
2
X N − a b − a
−
+1 +
d
d
b+1≤a≤d
N −a b−a
−
d
d
2
.
DR
AF
T
1≤a≤b
X
25 novembre 2012
Version 2
Chapitre 4
4.1
AF
T
Le principe de l’hyperbole
de Dirichlet
Un premier terme d’erreur pour la moyenne
de la fonction de nombre de diviseurs
Théorème 4.1 Nous avons
X
n≤x
d(n) = x log x + O∗ (2x).
Démonstration. La preuve est sans surprise :
X x
X
X X
1=
+ O∗ (1)
d(n) =
ℓ
n≤x
ℓ≤x
ℓ≤x m≤x/ℓ
∗
DR
= x log x + O (2x).
en utilisant
X1
= log L + O∗ (1)
ℓ
ℓ≤L
que l’on obtient par comparaison à une intégrale.
Le terme d’erreur est très proche du terme principal. Et par exemple, lorsque
x = 106 , nous calculons
X
d(n) = 13 970 034
n≤x
6
6
alors que 10 log(10 ) = 13 815 510.557 · · ·. Peut-on faire mieux ?
4.2
Le principe de l’hyperbole de Dirichlet
Soit f et g deux fonctions définies sur les entiers. Nous rappelons que f ⋆ g
est la fonction h définie sur les entiers par
X
h(ℓ) =
f (m)g(n)
m,n≥1,
mn=ℓ
CHAPITRE 4. LE PRINCIPE DE L’HYPERBOLE
28
où m (et n) parcourt l’ensemble des diviseurs positifs de ℓ. Nous notons 1 la
fonction définie sur les entiers par 1(n) = 1 pour tout n.
Lemme 4.2 Soit L, M et N trois paramètres réels positifs tels que L = M N .
Nous avons
X
h(ℓ) =
ℓ≤L
X
f (m)
m≤M
X
g(n) +
X
n≤N
n≤L/m
X
g(n)
−
ℓ≤L
X
m≤M
X
f (m)
g(n)
n≤N
AF
T
Démonstration. Nous écrivons
X
X
X
h(ℓ) =
f (m)g(n) =
f (m)
m≤L/n
mn≤L
X
X
X
X
f (m)g(n)
M<m≤L n≤L/m
m≤M n≤L/m
=
X
f (m)g(n) +
f (m)g(n) +
X
X
f (m)g(n)
n≤N M<m≤L/n
m≤M n≤L/m
d’où l’on conclut aisément. Quand on utilise cette formule, on dit que l’on utilise
la méthode de l’hyperbole de Dirichlet.
4.3
Un meilleur terme d’erreur pour le nombre
de diviseurs
Théorème 4.3 Nous avons
X
√
d(n) = x log x + (2γ − 1)x + O∗ (2 x).
DR
n≤x
Pour x = 106 , nous vérifions que 106 log(106 )+(2γ−1)106 √
= 13 969 941.887 · · ·
qui ne différe que de 92.112 · · · de la vraie valeur ! Comme 2 106 = 2000, nous
constatons sur cet exemple que le terme d’erreur est peut être même d’ordre
plus petit que ce que nous démontrons. C’est vrai.
Nous avons déjà introduit la méthode de l’hyperbole de Dirichlet. Elle√nous
conduit
ici à la formule suivante, en notant S(x) la somme en question et x =
√
x:
X
X
√
S(x) =
1=2
[x/ℓ] − [ x]2
√
ℓ≤ x
ℓm≤x
où [y] désigne la partie entière du réel y. En utilisant
[y] = y −
1
2
− {y} +
1
2
(4.1)
il vient
S(x) = 2x
X
√
ℓ≤ x
X √
√
x/ℓ − 12 .
1/ℓ − [ x] − [ x]2 − 2
√
ℓ≤ x
(4.2)
Nous allons montrer que la dernière somme est petite, mais il nous faut d’abord
traiter les premiers termes. Ce n’est pas difficile, mais il est utile de signaler au
25 novembre 2012
Version 2
4.3 Un meilleur terme d’erreur pour le nombre de diviseurs
29
lecteur qu’un peu de doigté est nécessaire
et qu’il n’est a priori absolument pas
√
évident qu’un terme de la forme x{ x} n’apparaisse pas, puisque
√
√
√ √
√
√
[ x] + [ x]2 = x + x − 2 x{ x} + { x}2
√
√
√
en écrivant [ x] = x − { x}. Par ailleurs, en utilisant la formule d’Euler
Maclaurin, nous obtenons
X
et par conséquent
2x
X
√
ℓ≤ x
√ 2
1
√ + O(1/ x )
2[ x]
AF
T
√
ℓ≤ x
√
1/ℓ = log[ x] + γ +
√
√ 2
x
1/ℓ = 2x log[ x] + 2γx + √ + O(x/ x )
[ x]
√
√
√ x
√
√ + O(1)
= x log x + 2γx + 2x log 1 − { x}/ x +
1 − { x}/ x
√ √
√
= x log x + 2γx − x{ x} + x + O(1)
Exercice 54. Soit q ≥ 2 un entier que l’on suppose premier dans cette partie.
⋄ 1 ⋄ Exprimer
Tq (L) =
X
d(ℓ)
ℓ≤L
q|ℓ
en fonction T1 et en déduire que, si L ≥ q, nous avons
p
2q − 1
q−1
2q − 1
L log L − 2 2 L log q +
(2γ − 1)L + O( L/q).
2
2
q
q
q
DR
Tq (L) =
⋄ 2 ⋄ Montrer que l’estimation de la question précédente est en fait valable
pour L > 0.
Exercice 56. Soit X un paramètre réel positif. Soit f une fonction. Nous
supposons qu’il existe trois constantes M (f ), M + (f ) et δ > 0 (qui peuvent
toutes dépendre de X, tout comme f d’ailleurs), telles que
X
f (d) = M (f )y + O(y 1−δ )
(1 ≤ y ≤ X)
d≤y
et
X
1
1
|f (d)| ≪ (M + (f ) + δ −1 ) X 1+δ .
d≤X 1+δ
Nous supposons aussi que |M (f )| ≪ M + (f ).
⋄ 1 ⋄ Montrer que nous pouvons prendre Λ ou µ comme fonction f , avec
δ = 10(log log X)/ log X.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 4. LE PRINCIPE DE L’HYPERBOLE
30
⋄ 2 ⋄ Pour λ > 0, nous définissons
Z
c1 (λ) = λ
∞
λ
{t}
dt
t2
de telle sorte que c1 (1) = 1 − γ. Montrer que c1 est dérivable sauf aux points
entiers et que l’on a |c1 (λ) − 21 | ≤ 1/(4λ).
⋄ 3 ⋄ Montrer que
X 1
1
=
λ
Z
λ
[t]
1
dt
= log λ −
t2
Z
λ
1
{t}
dt
.
t2
AF
T
ℓ≤λ
ℓ
−
⋄ 4 ⋄ Montrer que, pour λ > 0, nous avons
X
f (d){X/d} = c1 (λ)M (f )
d≤X/λ
1 X
+ O (M + (f ) + δ −1 )X 1+δ .
λ
Indication : Le principe de l’hyperbole de Dirichlet nous donne
X
f (d)[X/d ] =
d≤X/λ
X
f (d)
d≤D
X
1
ℓ≤X/d
+
X
X
DR
ℓ≤L d≤min(X/λ,X/ℓ)
f (d) −
X
ℓ≤L
1
X
f (d).
d≤D
Ensuite, il faut atteindre
X
f (d)[X/d ] = X(M (f ) log X + C(f ))
d≤X/λ
X 1 1 − M (f )X 1 − γ +
−
+ O(R)
ℓ
λ
ℓ≤λ
où R est un terme d’erreur.
⋄ 5 ⋄ Nous définissons
c2 (λ) = λ
Z
∞
λ
{t} log t
dt
.
t2
Montrer que pour λ ≥ 1, nous avons
X
f (d){X/d} log
d≤X/λ
25 novembre 2012
1
X
X
= c2 (λ)M (f ) + O (M + (f ) + δ −1 )X 1+δ log X .
d
λ
Version 2
4.3 Un meilleur terme d’erreur pour le nombre de diviseurs
31
⋄ 6 ⋄ Montrer que, pour λ ≥ 1, nous avons
X
d≤X/λ
µ2 (d) {X/d} =
X
6
c1 (λ) + O(X 2/3 ).
π2
λ
⋄ 7 ⋄ Montrer que nous avons
X
X
X
6
2
µ (d)
log
= 2 c2 (1)X + O(X 2/3 log X).
d
d
π
d≤X
DR
AF
T
Indication : Il faut aller voir la section 7.3.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 4. LE PRINCIPE DE L’HYPERBOLE
DR
AF
T
32
25 novembre 2012
Version 2
Chapitre 5
AF
T
Les estimations de Mertens
sur les nombres premiers
Nous allons évidemment avoir besoin de quantifier le nombre de nombres
premiers dans un intervalle. De telles estimations existent depuis longtemps, et le
travail consistant à les rendre explicite numériquement a débuté dans les années
quarante. Nous disposons maintenant de bonnes estimations pour les quantités
simples. Nous en profitons aussi pour introduire deux techniques simples et
efficaces.
5.1
La fonction de von Mangoldt
DR
Nous avons besoin ici d’une fonction nommée d’après Hans von Mangoldt.
Celui-ci a publié en 1894 un mémoire important sur les nombres premiers où il
introduit notamment cette fonction sous la notation L(n). Nous la notons Λ(n)
comme il est usuel à l’heure actuelle. Elle est définie par :
Λ(n) =
(
log p
0
si n = pa avec a ≥ 1,
sinon.
(5.1)
Par exemple Λ(2) = Λ(4) = log 2 et Λ(15) = 0. Notons explicitement que
Λ(1) = 0. L’apparition de cette fonction n’est pas du tout mystérieuse si l’on
raisonne en termes de séries de Dirichlet mais nous évitons ce point de vue
ici. Du coup, la justification de son introduction vient de deux aspects. Tout
d’abord, elle permet d’isoler les puissances des nombres premiers des autres
entiers tout en leur attribuant un poids assez peu fluctuant log p, et nous verrons
au lemme 5.5 que la contribution des p2 , p3 , . . . est négligeable devant celle des
nombres premiers p.
Cela étant, son intérêt véritable résulte de l’identité :
∀n (entier) ≥ 1,
X
Λ(d) = log n,
d|n
où la somme porte sur tous les diviseurs d ≥ 1 de n.
(5.2)
CHAPITRE 5. LES ESTIMATIONS DE MERTENS
34
Démonstration. Pour n = 1, cette identité est évidente. Pour n plus grand,
nous le décomposons en facteurs premiers n = pa1 1 pa2 2 · · · paKK où les pi sont des
nombres premiers distincts et les ai des entiers ≥ 1. Il vient alors
log n = a1 log p1 + a2 log p2 + · · · + aK log pK
et les diviseurs d de n pour lesquels Λ(d) 6= 0 sont les pb11 avec 1 ≤ b1 ≤ a1
(il y en a a1 de cette forme), puis les pb22Pavec 1 ≤ b2 ≤ a2 (il y en a a2 de
cette forme), etc. Et bien sûr, a1 log p1 = b1 log p1 , ce qui permet de clore la
preuve.
De la fonction log à la fonction Λ
AF
T
5.2
Commençons par un lemme classique d’analyse :
Lemme 5.1 Pour x ≥ 1, nous avons
X
log n = x log x − x + O∗ (log(2x)).
1≤n≤x
Démonstration. Soit N la partie entière de x. Nous procédons par comparaison
à une intégrale, c’est à dire que nous utilisons les inégalités
Z
n
n−1
log t dt ≤ log n ≤
n+1
Z
log t dt
n
qui sont une simple conséquence du caractère croissant du logarithme. En les
sommant, nous obtenons
N
log t dt ≤
DR
Z
1
X
2≤n≤N
log n ≤
Z
N +1
log t dt
(5.3)
2
et un peu de travail permet de conclure, moyennant de se souvenir que x 7→
x log x − x est une primitive de x 7→ log x.
Voici une interprétation graphique de l’encadrement :
log(x − 1)
log x
log 3
log 9
log 8
log 7
log 6
log 5
log 4
log 2
0
1
2
3
4
5
6
7
8
9
10
La somme cumulée de l’aire des petits rectangles est la quantité qui nous interesse. Nous constatons graphiquement qu’elle est majorée par l’intégrale de
la fonction ce qui est le membre de droite de 5.3 et minorée par l’intégrale de
cette fonction translatée d’une unité vers la gauche, soit le membre de gauche
de 5.3.
25 novembre 2012
Version 2
5.2.1 Une majoration à la Chebyshev
Nous écrivons alors
X
log n =
n≤x
XX
Λ(d) =
n≤x d|n
35
X
Λ(d)[x/d]
d≤x
et l’idée de tout ce qui suit est basée sur l’égalité :
X
Λ(d)[x/d] = x log x − x + O∗ (log(2x)).
(5.4)
d≤x
Exercice 61.
X Λ(n)
ζ′
.
(s) =
ζ
ns
n≥1
AF
T
⋄ 1 ⋄ Montrer que, pour ℜs > 1, nous avons −
X Λ(n)
⋄ 2 ⋄ Montrer que, pour s > 1, nous avons log ζ(s) =
.
ns log n
n≥2
5.2.1
Une majoration à la Chebyshev
Théorème 5.2 Nous avons pour tout x ≥ 1,
X
Λ(d) ≤ 7x/10.
x/2<d≤x
Démonstration. Une utilisation directe de 5.4 donne
X
Λ(d) [x/d] − 2[x/(2d)] = x log 2 + O∗ (2 log(2x)).
d≤x
DR
Nous remarquons maintenant que [x] − 2[x/2] ≥ 0 pour tout x réel : en effet,
cette quantité vaut 0 si x est dans [0, 1[, puis 1 si x est dans [1, 2[ et enfin est
périodique de période 2. Par conséquent, l’équation ci-dessus implique
X
Λ(d) [x/d] − 2[x/(2d)] ≤ x log 2 + 2 log(2x).
x/2<d≤x
Pour les d entre x/2 et x, nous avons [x/d] − 2[x/(2d)] = 1 ce qui aboutit à
X
Λ(d) ≤ x log 2 + 2 log(2x).
x/2<d≤x
Cette inégalité permet de prouver le théorème si x ≥ 1150 et une vérification
numérique permet d’étendre ce résultat à tout x réel ≥ 1.
En découpant l’intervalle [1, x] entre ]x/2, x] union ]x/4, x/2] union etc, nous
obtenons le corollaire classique :
P
Corollaire 5.3 Nous avons d≤x Λ(d) ≤ 7x/5 pour tout x ≥ 1.
Pafnouty Chebyshev est le premier à avoir établi en 1848 une telle estimation,
par une méthode d’ailleurs proche de celle que nous avons développée.
P Notons ici
que John Rosser a montré en 1941 que le maximum de la fonction d≤x Λ(d)/x
était atteint en x = 113 et était un peu inférieur à 1.04.
Ceci nous donne aussi une majoration du nombre de nombres premiers
inférieurs à une borne donnée :
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 5. LES ESTIMATIONS DE MERTENS
36
Corollaire 5.4 Pour tout x ≥ 1, le nombre de nombres premiers inférieurs à
x est au plus 3x/(2 log x).
P
P
Signalons les notations traditionnelles π(x) = p≤x 1 et ψ(x) = d≤x Λ(d).
AF
T
Démonstration.
P Remarquons tout d’abord que ce nombre de nombres premiers
s’écrit
aussi
p≤x 1. Or, nous tirons du corollaire précédent la majoration :
P
log
p
≤
7x/5.
Nous nous débarrassons alors du poids log p par une techp≤x
nique que l’on appelle la sommation par parties du fait que, dans le formalisme
de l’intégrale de Stieltjes, il s’agit effectivement de l’extension de la technique
du même nom standard au niveau du calcul intégral. Une version souple et
élémentaire s’obtient en écrivant :
Z x
1
1
dt
=
+
2
log p
log x
p t log t
ce qui nous donne
Z x
X log p
7x
7dt
≤
+
2 .
log p
5 log x
2 5 log t
p≤x
Pour la dernière intégrale, nous commençons par remarquer qu’une intégration
par parties (classique !) implique, pour k ≥ 0, que :
Z x
Z x
x
k dt
dt
≤
+
Jk =
k
k
k+1
log x
t
2 log
2 log t
d’où nous déduisons que (log x − 3)(log2 x)J3 ≤ x et J2 ≤ x/ log2 x + J3 . Ce qui
à termes nous donne le résultat annoncé si x ≥ exp(5). Un calcul finit.
P
Exercice 62. Montrer que la série p 1/(p log p) est convergente.
DR
La fonction Λ donne aussi un poids non nul à des entiers qui ne sont pas
de nombres premiers mais des puissances de ceux-ci. Leur contribution est la
plupart du temps négligeable grâce au lemme suivant :
Lemme 5.5 Pour x ≥ 1, nous avons
X
d≤x
d non premier
√
Λ(d) ≤ 3 x/2.
√
Démonstration. En effet, les d comptés s’écrivent pa avec a ≥ 2 et p ≤ x.
2
a
Un nombre premier va apparaı̂tre en p, puis p , et caetera jusqu’à p où a ≤
(log x)/ log p. Le corollaire précédent conclut.
Exercice 63. Montrer qu’il existe une infinité de nombres premiers de la
forme 4m + 3.
Indication : On pourra montrer que l’entier 4 · m! + 3 admet au moins un
facteur premier ≡ 3[4].
Exercice 64. Montrer qu’il existe une infinité de nombres premiers de la
forme 6m + 5.
Indication : On pourra montrer que l’entier 6 · m! + 5 admet au moins un
facteur premier ≡ 5[6].
25 novembre 2012
Version 2
5.2.2 Un théorème à la Mertens
5.2.2
37
Un théorème à la Mertens
Nous en arrivons à un théorème dans l’esprit d’un résultat de Franz Mertens issu d’un mémoire de 1874. Il contient en essence une minoration du nombre
de nombres premiers comme nous le montrons ci-après.
Théorème 5.6 Pour x ≥ 2, l’égalité suivante a lieu
X
Λ(d)/d = log x − 32 + O∗ ( 21 )
d≤x
AF
T
Démonstration. Nous partons toujours de (5.4) et écrivons cette fois-ci [x] =
x − {x} où nous majorons la partie fractionnaire par 1 et la minorons par 0. Il
vient
X
7
Λ(d)/d − log x + 1 ≥ − log(2x)/x.
10 + log(2x)/x ≥
d≤x
4
Pour x ≥ 120, cela donne la borne supérieure log x − 15
et la borne inférieure
21
log x − 20 , ce qui est meilleur que le résultat annoncé. Pour x plus petit, une
vérification numérique conclut.
Exercice 65.
⋄ 1 ⋄ (A. Selberg) Montrer que Λ ⋆ Λ + Λ log = µ ⋆ log2 où Λ log est la fonction
qui à n, associe Λ(n) log n.
⋄ 2 ⋄ Montrer que Λ ⋆ Λ − Λ log = µ log2 où µ log2 est la fonction qui à n,
associe µ(n)(log n)2 .
5.3
Un résultat de type postulat de Bertrand
DR
Le mathématicien français Joseph Bertrand conjecturait en 1845 qu’il y a
toujours un nombre premier dans l’intervalle [n, 2n − 3] si n est un entier ≥
4, conjecture qui devait être démontrée par Chebyshev en 1850. Les résultats
que nous avons montrés sont un peu plus faibles que ceux dont disposaient
Chebyshev mais nous permettent de démontrer un résultat du même genre, à
savoir :
Théorème 5.7 Pour x ≥ 2, nous avons
X
1 ≥ 2x/(25 log x).
C(x) =
x/4<p≤x
Il existe donc un nombre premier dans l’intervalle ]x/4, x] pour tout x ≥
2. Pour arriver au postulat de Bertrand, nous pourrions rechercher une autre
inégalité sur les parties entières, ce qui est le chemin suivi par Chebyshev. Ou
inclure dans le théorème 5.2 la contribution des entiers entre x/4 et x/8 et
modifier conséquemment le théorème 5.6.
Démonstration. En appliquant le théorème 5.6 en x et x/4, nous obtenons
X
Λ(d)/d ≥ log 4 − 1
(5.5)
x/4<d≤x
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 5. LES ESTIMATIONS DE MERTENS
38
P
et par conséquent x/4<d≤x Λ(d) ≥ x(log 4 − 1)/4 ≥ x/11 pour x ≥ 16. Nous
étendons cette inégalité à x ≥ 2 par le calcul et il s’agit ensuite de passer de
Λ(d) à une somme sur les nombres premiers, ce que nous effectuons à l’aide du
lemme 5.5, obtenant
X
x/4<p≤x
log p ≥
√
x
3 x
−
≥ 2x/25
11
2
AF
T
si x ≥ 19 000 d’où le théorème dans ce cas. Un calcul numérique permet
d’étendre ce résultat.
Concernant de bonnes approximations de la somme des nombre premiers
≤ x, signalons ici que dans la continuité des travaux de Rosser, Pierre Dusart a
établi en 1999 que, pour x ≥ 598
1+
0.992
log x X
1.2762
<
.
1<1+
log x
x
log x
(5.6)
p≤x
Nous aurons encore besoin à la fin de ce livre d’un dernier résultat que voici.
Lemme 5.8 Pour x ≥ 2, nous avons
X
p≤x
1/p = log log x −
1
5
+ O∗ (7/5).
DR
Démonstration. Le théorème de Mertens implique que
− 67 −
X
k≥2,p≥2
log p X log p
≤
− log x ≤ − 61 .
pk
p
p≤x
En sommant d’abord sur k et en utilisant un peu de calcul numérique, nous
montrons que la somme sur k et p qui apparaı̂t vaut au plus 0.8. Pour obtenir le
lemme, nous utilisons une sommation par parties comme page 36. Il en résulte
la majoration
X
1
− log log 2
1/p ≤ log log x + 1 −
6 log 2
p≤x
et la minoration log log x + 1 −
59
30 log 2
− log log 2.
Exercice 66. Montrer que
X
ω(n) = X log log X + O(X)
n≤X
où ω(n) est le nombre de facteurs premiers de n.
25 novembre 2012
Version 2
5.4 Le théorème des nombres premiers
39
Exercice 67.
⋄ 1 ⋄ Montrer qu’il existe une constante b telle que
X
1/p = log log x + b + O(1/ log x)
p≤x
et telle que
−
X
p≤x
1
= log log x + c + O(1/ log x)
log 1 −
p
où la constante c est donnée par
XX 1
.
kpk
AF
T
c=b+
p≥2 k≥2
⋄ 2 ⋄ Montrer que, pour x ≥ 1,
X
2≤n≤x
X 1
Λ(n)
=
+ c − γ + O(1/ log(2x)).
n log n
n
n≤log x
⋄ 3 ⋄ Montrer que, pour δ > 0,
Z ∞ X
Λ(n) dx
= log ζ(1 + δ) = − log δ + O(δ).
δ
n
log n x1+δ
1
2≤n≤x
⋄ 4 ⋄ Montrer que, pour δ > 0,
Z ∞ X
1 dx
δ
= log(1 − e−δ )1 = − log δ + O(δ)
1+δ
n
x
1
DR
1≤n≤x
et en conclure que c = γ.
5.4
Le théorème des nombres premiers
En 1896, Hadamard d’un côté et De la Vallée-Poussin de l’autre (de la ValléePoussin, 1899) démontraient le théorème suivant :
Théorème 5.9 (Théorème des nombres premiers)
Nous avons, pour tout constante A ≥ 1,
X
p≤X
log p = X + O(X/(log X)A ).
La constante impliquée dans le symbole O dépend bien sûr du choix de A.
Nous ne le démontrerons pas ici. Sa preuve est assez simple mais demande
du matériel théorique dont nous ne disposons pas ici.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 5. LES ESTIMATIONS DE MERTENS
40
Exercice 71.
⋄ 1 ⋄ Montrer que
⋄ 2 ⋄ Montrer que
X
1 ∼ X/ log X.
X
1 − X/ log X = O X/(log X)2 .
p≤X
p≤X
⋄ 3 ⋄ Montrer que
X
p≤X
1 − X/ log X = X/(log X)2 + O X/(log X)3 . Ceci
montre que le terme d’erreur de la question précédente ne peut pas être
amélioré.
AF
T
Exercice 72. Montrer que
X
Λ(n) = X + O X/(log X)10
n≤X
Exercice 73. Montrer que
X
n 1
= 2 X + O(X/ log2 X).
Λ(n) 1 −
X
n≤X
Indication : Une sommation par parties résoud le problème, c’est à dire que
R1
l’on utilise 1 − u = u dt.
Exercice 74. Montrer que
X
Λ(n)Λ(m) = 12 X 2 + O(X 2 / log2 X).
n+m≤X
DR
Indication : L’exercice 73 peut aider.
Exercice 75. (Théorème de Mertens)
⋄ 1 ⋄ Montrer qu’il existe une constante B > 0 telle que
Y
1
∼ B/ log X
1−
p
p≤X
⋄ 2 ⋄ Montrer que
Y
1
π2
1+
∼
/ log X.
p
6B
p≤X
Voir l’exercice 67 pour la valeur B = e−γ .
Exercice
76. Nous définissons m(D) =
P
µ(d).
Montrer que
d≤D
m(D) =
M (D)
1
+
D
D
Z
1
D
D
t
P
d≤D
µ(d)/d et M (D) =
M (t)dt log D
+
t
D
pour D ≥ 1.
25 novembre 2012
Version 2
5.4 Le théorème des nombres premiers
41
Indication : On pourra démontrer l’identité annexe :
Z D D M (t)dt
= log D.
t
t
1
Exercice 77. Montrer que
−
X µ(d) log d
d
d|q
≥0
AF
T
en utilisant log = Λ ⋆ 1.
Exercice 78. Montrer que
ψ(x) = ϑ(x) + ϑ(x1/2 ) + ϑ(x1/3 ) + ϑ(x1/4 ) + · · ·
où Θ(y) =
P
p≤y
log p.
Exercice 79. En notant M (z) =
P
d≤z
µ(d), montrer que
M (x) + M (x/2) + M (x/3) + M (x/4) + · · · = 1
pour tout réel x ≥ 1.
Exercice 80. (Iseki & Tatuzawa) Soit F une fonction de la variable réelle.
Nous définissons
X
G(x) = (log x)
F (x/n).
DR
n≤x
Montrer que
F (x) log x +
X
F (x/n)Λ(n) =
n≤x
X
µ(d)G(x/d).
d≤x
Indication : On pourra partir de
X
X
x
µ(d) log
F (x) log x =
F (x/n)
n
n≤x
et utiliser
X
d|n
µ(d) log
d|n
n
= Λ(n).
d
Exercice 81.
⋄ 1 ⋄ Utiliser la formule d’Iseki & Tatuzawa de l’exercice précédent avec
F1 (x) = ψ(x) et F2 (x) = x − γ − 1 pour montrer la formule de Selberg :
X
ψ(x) log x +
Λ(n)ψ(x/n) = 2x log x + O(x).
n≤x
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 5. LES ESTIMATIONS DE MERTENS
42
⋄ 2 ⋄ Utiliser la formule d’Iseki & Tatuzawa de l’exercice précédent pour montrer :
X
M (x) log x +
Λ(n)M (x/n) = O(x).
DR
AF
T
n≤x
25 novembre 2012
Version 2
Chapitre 6
AF
T
Taille de la fonction nombre
de diviseurs
Commençons par l’expression explicite de la fonction (nombre) de diviseurs :
Y
Y
i
(αi + 1).
(6.1)
(pi 6= pj si i 6= j), d(n) =
pα
n=
i ,
i
i
Théorème 6.1
log d(n) ≪ log(3n)/ log log(3n)
Démonstration. Nous écrivons
X
X
X
log d(n) =
αi .
log(αi + 1) + 2
log(αi + 1) ≤
α
α
pi i kn
pi i kn,
pi ≤P
α
pi i kn,
pi ≥P
DR
i
Posons qi = pα
i . Les qi sont premiers entre eux. Par conséquent, la deuxième
somme, disons R, vérifie P R ≤ n, i.e.
X
αi ≤ (log n)/ log P.
α
pi i kn,
pi ≥P
Concernant la première somme, nous écrivons simplement
X
X
P
log(αi + 1) ≤ log log(3n)
1 ≪ log log(3n)
.
log
P
αi
pi kn,
pi ≤P
Le choix
P =
p≤P
log(3n)
(log log(3n))2
donne le résultat.
Exercice 83. Montrer qu’il existe une suite (nk ) tendant vers l’infini et telle
que
d(nk ) log log nk
> 0.
lim inf
log nk
Quelle est la meilleure minoration possible ?
CHAPITRE 6. NOMBRE DE DIVISEURS
44
Exercice 84. Montrer qu’il existe une constante c1 > 0 telle que, pour tout
entier q, on a
q/ϕ(q) ≤ c1 log log 3q.
P
Indication : On peut partir de log(q/ϕ(q)) = − p|q log(1−1/p) puis séparer
le traitement des p ≤ P = log q de ceux qui sont plus grands. Ces derniers sont
peu nombreux.
Exercice 85. Montrer qu’il existe une constante c2 > 0 telle que, pour tout
entier q, on a
X1
≤ c2 log log log 9q.
p
p|q
AF
T
Indication : On pourra utiliser un procédé similaire à celui de l’exercice 84.
Exercice 86. Montrer pour tout entier q, on a σ(q) ≤ q(1 + log q) Montrer
en outre qu’il existe une constante c3 > 0 telle que, pour tout entier q, on a
X
d ≤ c3 q log log(9q).
σ(q) =
d|q
Montrer que cette majoration est la meilleure possible à la constante multiplicative c3 près.
Indication : On pourra d’abord montrer que σ est multiplicative, en déduire
une expression explicite et enfin considérer log(σ(n)/n). On pourra utiliser un
procédé similaire à celui de l’exercice 84 ou utiliser l’exercice 85.
Exercice 87.
DR
⋄ 1 ⋄ Soit D l’ensemble des entiers n’ayant que des facteurs premiers ≤ D où
D est un paramètre ≥ 1. Montrer que
X
1/d ≪ log(2D).
d∈D
⋄ 2 ⋄ Montrer que, pour tout q ≥ 1, nous avons
X
τ (m)q ≤
τ (d)q−1 τ (k)q−1
dk=m
⋄ 3 ⋄ Soit D l’ensemble des entiers n’ayant que des facteurs premiers ≤ D où
D est un paramètre ≥ 1. Montrer que, pour tout q paramètre entier ≥ 1, nous
avons
X
q
τ (m)q /m ≪ (log(2D))2 .
m∈D
Indication : On pourra procéder par récurrence sur q.
⋄ 4 ⋄ Soit D est un paramètre ≥ 1 fixé et soit τD (n) le nombre de diviseurs
de n qui sont ≤ D. Soit q ≥ 1 un paramètre. Montrer que
X
q
τD (n)q ≪ X(log(2D))2 .
n≤X
25 novembre 2012
Version 2
45
Indication : On pourra noter k(n), pour tout entier n, le plus grand diviseur
de n dans D.
Exercice 91. Nous notons ici τr (n) le nombre r-uplets d’entiers
(n1 , n2 , · · · , nr ) tels que n1 n2 · · · nr = n.
⋄ 1 ⋄ Calculer τr (pa ) lorsque p est un nombre premier.
⋄ 2 ⋄ Montrer que
τr (n)2 /n ≤ (log N + 1)r
2
AF
T
X
n≤N
Indication : On pourra utiliser τr (n1 n2 · · · nr ) ≤ τr (n1 )τr (n2 ) · · · τr (nr ) que
l’on prendra soin de démontrer.
⋄ 3 ⋄ Montrer que
X
n≤N
τr (n)2 ≪r N (log N + 1)r
2
−1
où le symbole ≪r signifie que la valeur absolue du membre de gauche est
inférieure au membre de droite multiplié par une constante qui peut dépendre
de r.
DR
Exercice 94. Montrer que la série
X µ(n) r
n≥1
ϕ(n)
est convergente pour tout entier r ≥ 2.
Exercice 95. Montrer que
d(n) ≤ 2
X
1.
δ|n,
√
δ≤ n
Exercice 96. (B. Landreau sur une idée de van der Corput) Montrer que
pour tout entier k ≥ 1, et tout réel s > 0, nous avons
X
dks (δ).
ds (n) ≤ k k(k−1)s
δ|n,
δ≤n1/k
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 6. NOMBRE DE DIVISEURS
46
Indication : On définira la fonction auxiliaire
X
dks (δ)
G(n) =
δ|n,
δ≤n1/k
et on montrera d’abord que cette fonction est sur-multiplicative, i.e. que
G(n1 n2 ) ≥ G(n1 )G(n2 ) si pgcd(n1 , n2 ) = 1. On établira ensuite que ds (pν ) ≤
dks (p[ν/k] ) ≤ G(pν ) lorsque ν ≥ k et que ds ((p1 · · · pr )ν ) ≤ k ks G((p1 · · · pr )ν )
lorsque ν < k, car, si r < k, nous avons ds (n) ≤ k ks et si r ≥ k,
ds (n) ≤ k ks dks ((p1 · · · p[r/k] )ν ) (et en rangeant p1 < p2 < · · · < pr , on a
(p1 · · · p[r/k] )ν ≤ n1/k ).
DR
AF
T
Voir (Bordellès, 2006) pour une application.
25 novembre 2012
Version 2
Chapitre 7
AF
T
La méthode de convolution
Nous présentons ici une méthode classique sur un exemple qui concerne la
fonction
Y
(p − 2).
(7.1)
f0 (n) =
p|n
La suite de ses valeurs sur les entiers entre 1 et 54, que voici
1, 0, 1, 0, 3, 0, 5, 0, 1, 0, 9, 0, 11, 0, 3, 0, 15, 0, 17, 0, 5, 0, 21, 0, 3, 0, 1, 0, 27,
0, 29, 0, 9, 0, 15, 0, 35, 0, 11, 0, 39, 0, 41, 0, 3, 0, 45, 0, 5, 0, 15, 0, 51, 0,
ne nous informe que peu, même si nous nous contentons de cette suite sur les
entiers impairs de ce même intervalle :
1, 1, 3, 5, 1, 9, 11, 3, 15, 17, 5, 21, 3, 1, 27, 29, 9, 15, 35, 11, 39, 41, 3, 45, 5, 15, 51.
DR
Pour obtenir plus d’informations, nous pouvons
P chercher à déterminer son ordre
moyen, soit une approximation de (1/X) n≤X f0 (n). Et une régularité apparaı̂t ici. Nous allons en effet démontrer que
Théorème 7.1 Soit X un réel positif. Pour tout σ réel dans ]1/2, 1], nous
avons
X
(1/X)
f0 (n) = C X + O(X σ )
n≤X
où la constante impliquée dans le symbole O dépend de σ et où
Y
3
C = 21
1−
= 0.14630 · · ·
p(p + 1)
p≥2
Remarquons que comme cela est le cas pour les équivalents, nous choisissons
comme ordre moyen une fonction “bien comprise” et “assez simple”, qui permette de surcroı̂t d’avoir un terme d’erreur assez petit. Quant à savoir ce qu’est
une fonction “assez simple”, cela dépend évidemment des auteurs !
Dans cet énoncé et de façon systématique dans la suite, la lettre p désigne
un nombre premier.
La méthode que nous proposons appartient au folklore et n’a fait lieu d’aucune exposition systématique, pour autant que nous sachions. Elle est très
CHAPITRE 7. LA MÉTHODE DE CONVOLUTION
48
DR
AF
T
souple dans son utilisation et donne accès à de très bons termes d’erreur.
Il s’est développé depuis les années 50 une théorie complète pour évaluer les
ordres moyens de fonctions multiplicatives (voir plus loin pour une définition),
mais celle-ci s’est surtout orientée vers une extension maximale de la classe
considérée plutôt que vers la qualité du terme d’erreur. Citons les théorèmes de
Ikehara généralisé par Delange (Delange, 1954), le théorème de Wirsing (Wirsing, 1961), un autre résultat de Delange (Delange, 1961), et le travail exceptionnel de (Halász, 1968). Le lecteur trouvera dans les livres de Ellison & Mendès
France (Ellison, 1975) et de Tenenbaum (Tenenbaum, 1995) des expositions
pédagogiques de ce matériel.
Signalons encore qu’il nous serait très facile de remplacer le O dans ce
théorème par une inégalité effective. Il est un peu plus difficile de certifier la
valeur numérique de C que nous avançons, mais nous laissons ici ce problème
de côté.
Présentons à présent les grandes lignes de la méthode de convolution. Il s’agit
de déterminer l’ordre moyen d’une fonction arithmétique f . Pour cela, nous
prenons une fonction “modèle” g, qui ressemble à f et dont nous connaissons
l’ordre moyen. Le modèle pour f0 sera la fonction qui à n associe n, dont nous
connaissons évidemment un ordre moyen. Comment qualifier le fait que g soit
un modèle pour f ? Nous allons définir un produit de convolution ⋆ et montrer
qu’il existe une fonction h vérifiant f = h ⋆ g, et où h sera “plus petite” que f .
L’ordre moyen de f s’obtiendra alors en déterminant celui de h ⋆ g, lequel sera
essentiellement gouverné par celui de g.
Glissons ici un mot à propos du choix de la fonction f0 . Cette fonction n’a a
priori aucune interprétation géométrique ; ce n’est pas tout à fait vrai puisque
sa valeur sur un entier sans facteurs carrés, disons q, est le nombre de caractères
de Dirichlet primitifs modulo q. Nous avons précisément choisi f0 pour son côté
“quelconque” ; sa forme particulière nous permet aussi de simplifier certaines
parties de l’exposition.
La preuve en elle-même est très courte et fait l’objet de la section 7.1, mais
nous détaillons avant les notions utilisées.
Nous tenons ici à remercier chaleureusement Hervé Queffelec pour ses indications et ses remarques qui nous ont été essentielles pour rédiger cet article.
7.1
Preuve du théorème 7.1
Première étape
Commençons par expliciter la série de Dirichlet de f0 , et notamment son
expression sous forme de produit eulérien. Nous avons, par définition :
Q
Y X ℓ|pk (ℓ − 2)
D(f0 , s) =
.
pks
p≥2 k≥0
Regardons de plus près chaque facteur. Dans la somme portant sur k, la contribution correspondant à k = 0 est exceptionnelle et vaut 1 ; le facteur eulérien
en p devient :
Q
X ℓ|pk (ℓ − 2)
1+
.
pks
k≥1
25 novembre 2012
Version 2
7.1 Preuve du théorème 7.1
49
Or ℓ et p sont des nombres premiers, ce qui implique que ℓ = p. Il nous reste
X
k≥1
(p − 2)/pks =
p−2
.
ps − 1
Voici donc la série de Dirichlet associée à f0 :
Y
p−2
D(f0 , s) =
1+ s
.
p −1
(7.2)
p≥2
p≥2
AF
T
Q
Nous remarquons que ce produit ressemble à p≥2 1 + ps−11 −1 qui, lui, correspond à ζ(s − 1). Entreprenons par conséquent de sortir ce facteur de notre
produit. Nous écrivons
Y
Y
2ps−1 + p − 3
1
p−2
=
1− s
D(f0 , s) =
1+ s
p −1
(p − 1)ps−1
1 − 1/ps−1
p≥2
= H(s)ζ(s − 1).
(7.3)
DR
Le produit définissant H(s) converge absolument pour les s pour lesquels
P 2ps−1 +p−3
la série
(ps −1)ps−1 converge absolument, ce qui a lieu au moins, en étendant
cette somme à tous les entiers, pour s > 3/2. L’abscisse de convergence absolue
de ζ(s − 1) est égale à 2, c’est aussi probablement celle de D(f0 , s), tant et si
bien que la série H converge effectivement dans un domaine plus large. Si nous
réalisons la série H comme la série de Dirichlet d’une fonction, alors celle-ci sera
bel et bien plus petite que f0 , au sens que nous avons donné à cette expression
au paragraphe 2.2. Commentons plus avant le terme probablement ci-dessus.
Remarquons tout d’abord que nous n’utilisons cette notion de taille que pour
nous guider dans les calculs et qu’un contrôle heuristique nous suffit. Mais nous
pouvons aussi montrer à posteriori que l’abscisse de convergence (et donc de
convergence absolue ici puisque f0 est positive ou nulle) est effectivement égale
à 2. En effet, supposons le théorème 7.1 démontré. Une sommation par parties
nous donne
Z N
1
X
X
dt s
+
s
f0 (n)/n =
f0 (n)
s+1
Ns
n t
1≤n≤N
1≤n≤N
P
Z N X
dt
1≤n≤N f0 (n)
+
s
f0 (n) s+1
(7.4)
=
Ns
t
n 1≤n≤t
Z N
Z N
dt
1+σ−s
s−σ
2−s
+
O(N
)
+
O
.
dt/t
= CN
+ sC
ts−1
1
1
En prenant σ = 0.6 par exemple, nous constatons bien que la série définissant
D(f0 , s) converge pour s > 2 et diverge pour s < 2. Nous poursuivons cette
discussion dans la dernière section de cet article.
Deuxième étape
Il faut maintenant transformer les deux fonctions obtenue H(s) et G(s) =
ζ(s − 1) en série de Dirichlet. Le cas de G est facile puisque G(s) = D(θ1 , s).
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 7. LA MÉTHODE DE CONVOLUTION
50
Tournons-nous à présent vers H. Nous cherchons une fonction h telle que
X
H(s) =
h(n)/ns
(7.5)
n≥1
et nous limitons notre recherche à des fonctions multiplicatives. Nous cherchons
donc h telle que :
X h(pk )
2ps−1 + p − 3
=1− s
.
(7.6)
ks
p
(p − 1)ps−1
k≥0
−
AF
T
La condition h(1) = 1 permet de régler le cas k = 0. Il nous reste à nous occuper
de la somme correspondant à k ≥ 1. Nous posons z = 1/ps , et obtenons pour le
membre de droite de (7.6) la fraction rationnelle en z suivante :
2
pz
( 1z
+p−3
−
1
1) pz
=
X
X
2z + p2 z 2 − 3pz 2
= −2
z k − (p2 − 3p)
zk.
z−1
k≥1
k≥2
En identifiant termes à termes, nous constatons alors que la fonction multiplicative h définie par
h(p) = −2,
(7.7)
h(pk ) = −(p2 − 3p + 2) pour k ≥ 2,
résout notre problème.
Troisième étape
DR
Comme D(f0 , s) = H(s)ζ(s − 1), et que l’on sait développer en série de
Dirichlet H(s) et ζ(s − 1), on a un produit de deux séries de Dirichlet, qui
correspond donc à un produit de convolution arithmétique. La propriété 3 nous
permet d’identifier termes à termes et de conclure que f0 = θ1 ⋆ h.
Nous présentons ici une autre méthode plus pédestre. Considérons la fonction
multiplicative h définie par (7.7) et rappelons que θ1 est la fonction n 7→ n.
Nous remarquons que : θ1 ⋆ h est encore une fonction multiplicative, qui est par
conséquent définie par ses valeurs prises sur les puissances des nombres premiers.
Or, pour p nombre premier et k entier naturel ≥ 1 :
(θ1 ⋆ h)(pk ) =
X
θ1 (
ℓ/pk
X pk
pk
)h(ℓ) =
h(ℓ)
ℓ
ℓ
k
ℓ/p
X p2 − 3p + 2 2
k
= f (pk ).
=p 1− −
p
pt
2≤t≤k
Par multiplicativité, cela implique bien f0 (n) = (θ1 ⋆ h)(n). Nous écrivons cette
identité sous forme déployée pour la suite :
X
X
f0 (n) =
h(ℓ)θ1 (m) =
h(ℓ)m.
ℓm=n
ℓm=n
Amorçons maintenant le calcul de l’ordre moyen de f0 . L’égalité ci-dessus nous
donne
X
X
X
X
m.
(7.8)
f0 (n) =
h(ℓ)m =
h(ℓ)
n≤X
25 novembre 2012
ℓm≤X
ℓ≤X
m≤X/ℓ
Version 2
7.2 Un exercice de sommations par parties
51
Or, nous savons que, pour tout entier naturel N :
X
n = N (N + 1)/2,
n≤N
ce qui implique que, pour M ≥ 1 que nous prenons cette fois-ci réel :
X
m = 12 M (M + 1) + O(M ) = 12 M 2 + O(M ).
(7.9)
m≤M
AF
T
Remarquons tout d’abord que cette estimée est valable dès que M est positif ou
nul. Il se trouve que la méthode que nous proposons se simplifie beaucoup si nous
nous contentons d’un terme d’erreur moins fort. L’estimation (7.9) implique en
effet aussi que
X
m = 21 M 2 + O(M σ )
(7.10)
m≤M
pour tout σ ∈ [1, 2] et tout M ≥ 0.
Nous disposons alors de tous les outils pour conclure. Nous reprenons la
preuve à l’équation (7.8) et constatons que la condition ℓ ≤ X est superflue. Il
vient alors directement
X
X |h(ℓ)| X 2 X h(ℓ)
σ
f0 (n) =
+
O
X
.
2
ℓ2
ℓσ
n≤X
ℓ≥1
ℓ≥1
P
Comme H(s) converge absolument pour s > 3/2, la somme ℓ≤1 |h(ℓ)|/ℓσ est
finie pour tout σ > 3/2. La preuve du théorème 7.1 est terminée, quitte à
renommer σ.
Pour le même prix . . .
DR
Le lecteur pourra, en suivant une méthode identique à celle proposée dans
la démonstration du théorème 7.1, trouver l’ordre moyen de la fonction ϕ.
7.2
Un exercice de sommations par parties
Afin d’illustrer plus avant cette technique, anticipons sur la preuve du théorème 7.1
et démontrons dès à présent le corollaire suivant du théorème 7.1 :
Théorème P
7.2
Nous avons n≤X f0 (n)/n = 2C X + O(X σ ) pour tout σ réel dans ]1/2, 1].
Voici une façon plus usuelle d’énoncer le théorème précédent :
Théorème 7.3
P
1
Pour tout ε > 0, nous avons n≤X f0 (n)/n = 2C X + O(X 2 +ε ).
Démonstration. En effet, nous utilisons (3.3) pour obtenir :
Z X P
Z XX
1
X
X
dt
dt
n≤X f0 (n)
=
+
+
f0 (n) 2
f0 (n)/n =
f0 (n)
2
X
X
t
n t
1 n≤t
n≤X
n≤X
Z X
Z
X
= C X + O(X σ ) + C
dt + O
tσ−1 dt
1
1
ce qui nous donne bien le résultat annoncé.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 7. LA MÉTHODE DE CONVOLUTION
52
7.3
Être sans facteurs carrés
Dans le même ordre d’idées, la condition ”être sans facteurs carrés” est elle
aussi souvent assez simple à traiter grâce à l’identité
(
X
1 si µ2 (n) = 1
µ(d) =
(7.11)
0 sinon.
2
d |n
AF
T
P
Démonstration. La fonction qui à n associe d2 |n µ(d) et la fonction caractéristique
des entiers sans facteurs carrés sont toutes les deux multiplicatives. Il suffit dès
lors d’établir leur égalité sur les puissances de nombres premiers, mais c’est
évident.
L’identité (7.11) est intéressante en ce que d est beaucoup plus petit que n.
Voici une utilisation :
X
X
X X
X
µ(d)
1
µ2 (n) =
µ(d) =
√
d≤ N
n≤N d2 |n
n≤N
=
X
√
d≤ N
n≤N,
d2 |n
N
µ(d) 2 + O∗ (1) .
d
P
Maintenant, comme |µ(d)| ≤ 1, nous avons d’une part d≤√N µ(d)O∗ (1) =
√
O∗ ( N ) et d’autre part
X
X µ(d) X µ(d)
2
∗
1/d
=
+
O
d2
d2
√
√
d≥1
d≤ N
d> N
DR
et une
√ comparaison à une intégrale nous garantit que le dernier O est au plus
1/( N − 1). En définitive
X
µ2 (n) =
n≤N
car
X µ(d)
d≥1
d2
=
Y
√
6
N + O( N )
2
π
(7.12)
(1 − p−2 ) = 1/ζ(2) = 6/π 2 .
(7.13)
p≥2
Exercice 97. Montrer qu’il existe une constante C telle que l’on ait
X µ2 (n)
√
6
= 2 log X + C + O((log X)/ X).
n
π
n≤X
Exercice 98. Donner un asympotique pour
X µ2 (n)
n
n≤X,
(n,d)=1
où d est un paramètre entier.
25 novembre 2012
Version 2
Chapitre 8
AF
T
Exemples et pratique
Ce chapitre commence par expliciter la méthode de convolution sur trois
exemples, et ce parce que les mécanismes de manipulation des expressions
arithmétiques en jeu sont fondamentaux pour comprendre les développements
subséquents.
8.1
Trois exemples
Nous partons d’une fonction multiplicative f : N \ {0} → C pour laquelle
nous définissons
Y X f (pk ) X f (n)
.
(8.1)
=
D(f, s) =
ns
pks
p≥2
n≥1
k≥0
DR
Souvent, la fonction f est assez “proche” d’une fonction connue, et c’est cette
idée que nous mettons ici en pratique sur trois exemples.
Approximation des séries de Dirichlet
Q
Exemple 1. f1 (n) = p|n (p − 2). Il vient
Y
Y
2ps−1 + p − 3
1
p−2
=
1− s
D(f1 , s) =
1+ s
s−1
p −1
(p − 1)p
1 − 1/ps−1
p≥2
p≥2
= C1 (s)ζ(s − 1)
où C1 (s) est holomorphe pour ℜs > 32 . Cette écriture montre que D(f1 , s) est
méromorphe pour ℜs > 23 et admet un pôle simple en s = 2. —
Exemple 2. f2 (n) = µ2 (n)/ϕ(n). Il vient
Y
1
D(f2 , s) =
1+
(p − 1)ps
p≥2
Y
1
1
1
−
=
1−
(p − 1)ps+1
(p − 1)p2s+1 1 − 1/ps+1
p≥2
= C2 (s)ζ(s + 1)
CHAPITRE 8. EXEMPLES ET PRATIQUE
54
où C2 (s) est holomorphe pour ℜs > − 12 . Cette écriture montre que D(f2 , s) est
méromorphe pour ℜs > − 21 et admet un pôle simple en s = 0. —
Exemple 3. f3 (n) = 2Ω(n) . Il vient
D(f3 , s) =
Y
1
1
=
1
+
ζ 2 (s)
2
2s − 2ps
p
1
−
ps
p≥2
p≥2
Y
= C3 (s)ζ 2 (s)
AF
T
où C3 (s) est holomorphe pour ℜs > 21 . Cette écriture montre que D(f3 , s) est
méromorphe pour ℜs > 21 et admet un pôle double en s = 1. —
Nous développons alors les Ci en séries de Dirichlet :
X gi (n)
ns
Ci (s) =
(8.2)
n≥1
où les fonctions gi sont bien sûr multiplicatives. Pour obtenir leurs valeurs
exactes, il suffit d’identifier les coefficients dans le développement du facteur
local en série de p−s . Nous obtenons ainsi

(
1
 g2 (p) = g2 (p2 ) = −
g1 (p) = −2
p(p − 1)

g1 (pk ) = −(p2 − 3p + 2), (k ≥ 2)
g2 (pk ) = 0, (k ≥ 3)
ainsi que
(
g3 (p) = 0
g3 (pk ) = 2k−2 ,
(k ≥ 2)
DR
Nous posons aussi
Ci (s) =
X |gi (n)|
n
(8.3)
ns
et il se trouve que ces séries convergent encore là où nous avons montré que
chaque Ci existait, c’est à dire respectivement pour ℜs > 3/2, ℜs > −1/2 et
ℜs > 1/2.
Ordre moyen de f1
Occupons-nous à présent des ordres moyens. La traduction sur les coefficients
de D(f1 , s) = C1 (s)ζ(s − 1) nous donne
X
f1 (n) =
g1 (ℓ)m
ℓm=n
et par conséquent
X
2
X
1 X
+O
g1 (ℓ)
2 ℓ
ℓ
ℓm≤X
ℓ≤X
X |g1 (ℓ)|
X 2 X g1 (ℓ)
+
O
X
=
2
ℓ2
ℓ
f1 (n) =
n≤X
X
g1 (ℓ)m =
ℓ≤X
25 novembre 2012
X
ℓ≤X
Version 2
8.1 Trois exemples
55
Nous utilisons alors la méthode de Rankin : Il s’agit de remplacer la fonction
indicatrice des ℓ > X, qui n’est évidemment pas multiplicative, par (ℓ/X)a où
a > 0 est à choisir. En l’occurrence, ici, nous prenons a = 21 − ε pour un ε > 0
qui va tendre vers 0.
X
X g1 (ℓ) X g1 (ℓ)
|g1 (ℓ)|
=
+O
ℓ2
ℓ2
ℓ2
ℓ≥1
ℓ>X
ℓ≤X
X
|g1 (ℓ)| 1
= C1 (2) + O
3
1
ℓ 2 +ε X 2 −ε
ℓ>X
AF
T
P
3
pour tout ε > 0. Ensuite nous nous contentons de majorer ℓ>X |g1 (ℓ)|/ℓ 2 +ε
P
par la somme complète, soit C1 (3/2 + ε). ce qui nous donne ℓ≤X g1 (ℓ)/ℓ2 =
1
C1 (2) + Oε X − 2 +ε . Le O dépend bien sûr de ε car C1 (3/2 + ε) n’est en aucun
cas borné lorsque ε tend vers 0. ∗ Pareillement, nous écrivons
X |g1 (ℓ)|
X |g1 (ℓ)|
1
1
≪ε X 2 +ε
≤ X 2 +ε
3
+ε
ℓ
2
ℓ
ℓ≤X
ℓ≤X
(ε > 0)
où nous avons encore une fois étendu la dernière somme à tous les entiers ℓ > 1.
Soit finalement, pour tout ε > 0,
X
f1 (n) = C1 (2)
n≤X
1
X2
+ Oε X 2 +ε .
2
(8.4)
DR
Bien sûr, un traitement plus précis que celui que nous donnons par la méthode
de Rankin permettrait de remplacer ce X ε par une puissance de logarithme, ici
par log X, mais la méthode ci-dessus a l’avantage d’une grande simplicité.
Ordre moyen de f2
Pour ce qui est de l’ordre moyen de f2 , nous procédons comme ci-dessus. Il
vient
X
X
X
X
ℓ
1
+γ+O
g2 (ℓ) log
f2 (n) =
g2 (ℓ) =
m
ℓ
X
ℓ≤X
n≤X
ℓm≤X
X
X
X
1
= log X + γ
g2 (ℓ) −
g2 (ℓ) log ℓ + O
|g2 (ℓ)|ℓ
X
ℓ≤X
ℓ≤X
ℓ≤X
où γ est la constante d’Euler. Le programme précédent s’applique moyennant
de rappeler que


X g2 (ℓ) log ℓ
X |g2 (ℓ)| log ℓ
resp. −

−
ℓs
ℓs
ℓ≥1
ℓ≥1
∗. Pour un traitement plus fin, il suffit de remarquer que C1 admet un pôle double en 3/2
1
1
ce qui fait que le Oε X − 2 +ε est en fait O X − 2 +ε /ε2 et en prenant ε = 1/ log X, nous
√ 2
obtenons O (log X) / X .
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 8. EXEMPLES ET PRATIQUE
56
est simplement la dérivée de C2 (s) (resp. C2 (s)) et que cette série admet la
même abscisse de convergence absolue que la série initiale. Nous obtenons alors
X
n≤X
1
1
f2 (n) = log X + γ C2 (0) + Oε (X − 2 +ε ) + C2′ (0) + Oε (X − 2 +ε ).
Ordre moyen de f3
Il nous reste à nous occuper de C3 (s). Nous avons cette fois-ci
X
X
f3 (n) =
g3 (ℓ)d(m)
n≤X
AF
T
ℓm≤X
où d(m) est le nombre de diviseurs de m. Nous avons de façon classique (voir
lemme 8.2) :
X
d(m) = M log M + (2γ − 1)M + O(M 1/2 )
m≤M
et donc
X
n≤X
f3 (n) =
X
ℓ≤X
g3 (ℓ)
X
X
1/2
log(X/ℓ) + (2γ − 1) + O((X/ℓ) )
ℓ
ℓ
X g3 (ℓ) log ℓ
X g3 (ℓ)
−X
ℓ
ℓ
ℓ≤X
ℓ≤X


√
√ X
+O  X
|g3 (ℓ)|/ ℓ
= (X log X + 2γ − 1)
ℓ≤X
1
DR
= (X log X + 2γ − 1)C3 (1) + XC3′ (1) + Oε X 2 +ε
en suivant les étapes précédentes.
8.2
Un théorème général.
Le lemme suivant est une généralisation d’un lemme de (Riesel & Vaughan,
1983) et se trouve dans (Ramaré, 1995). L’un des aspects essentiels de cette
question tient dans la nature complètement explicite des termes d’erreur.
Lemme 8.1 SoitPg, h et k trois fonctionsPsur N \ {0} à valeurs complexes.
−s
−s
, et H(s) =
. Supposons que g =
Posons H(s) =
n h(n)n
n |h(n)|n
h ⋆ k, que H(s) soit convergente pour ℜ(s) ≥ −1/3 et enfin qu’il existe quatre
constantes A, B, C et D telles que
X
k(n) = A log2 t + B log t + C + O(Dt−1/3 ) pour t > 0;
n≤t
Alors, pour tout t > 0, nous avons :
X
g(n) = u log2 t + v log t + w + O(Dt−1/3 H(−1/3))
n≤t
25 novembre 2012
Version 2
8.2 Un théorème général.
57
avec u = AH(0), v = 2AH ′ (0) + BH(0) and w = AH ′′ (0) + BH ′ (0) + CH(0).
Nous avons aussi
X
ng(n) = U t log t + V t + W + O(2.5Dt2/3 H(−1/3))
n≤t
avec
(
V = −2AH(0) + 2AH ′ (0) + BH(0),
U =AH(0),
W =A(H ′′ (0) − 2H ′ (0) + 2H(0)) + B(H ′ (0) − H(0)) + CH(0).
AF
T
P
P
P
Démonstration. Écrivons ℓ≤t g(ℓ) = m h(m) n≤t/m k(n), et toute la régularité
de nos expresions vient de ce qu’il n’est pas nécessaire d’imposer m ≤ t dans
P
alors la preuve facilement
m h(m). Nous complétons
P
Pour estimer ℓ≤t ℓg(ℓ) for t > 0, nous écrivons
X
ℓg(ℓ) = t
ℓ≤t
X
ℓ≤t
Z tX
g(ℓ) −
et utilisons l’expression asymptotique de
g(ℓ)du,
1 ℓ≤u
P
ℓ≤u
g(ℓ).
Pour appliquer le lemme précédent, nous aurons besoin de
Lemme 8.2 Pour tout t > 0, nous avons
X1
= log t + γ + O 0.9105t−1/3 .
n
n≤t
DR
Soit d(n) le nombre de diviseurs de n. Pour tout t > 0, nous avons
X d(n)
n≤t
n
=
1
log2 t + 2γ log t + γ 2 − γ1 + O 1.641t−1/3 ,
2
avec

X log m log2 n
.
−
γ1 = lim 
n→∞
m
2

m≤n
(−0.072816 < γ1 < −0.072815).
Démonstration. La preuve de la seconde partie de ce lemme se trouve dans le
papier de (Riesel & Vaughan, 1983) cité ci-dessous (Lemma 1).
Pour la première partie, rappelons que
|
X1
7
− log t − γ| ≤
pour t ≥ 1.
n
12t
n≤t
Pour 0 < t < 1, nous choisissons a > 0 tel que log t+ γ + a t−1/3 ≥ 0. Cette fonction décroı̂t de 0 à (a/3)3 et ensuite croı̂t. Cela nous donne la valeur minimale
a = 3 exp(−γ/3 − 1) ≤ 0.9105.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 8. EXEMPLES ET PRATIQUE
58
Dans la pratique, la fonction g sera multiplicative
et vérifiera gp = b/p +
P
−s
b
o(1/p) avec b = 1 or 2. Dans ce cas, nous prenons
k(n)n
P
P = ζ(s+1) et h est
la fonction multiplicative déterminée par
h(n)n−s = g(n)n−s ζ(s + 1)−b .
Lorsque h est multiplicative, nous avons
H(0) =
Y
(1 +
p
et
H ′′ (0)
=
H(0)
8.3
h(pm )),
m
P
mh(pm )
H ′ (0) X
m
P
(− log p),
=
H(0)
1 + m h(pm )
p
AF
T
ainsi que
X
H ′ (0)
H(0)
2
2 P
X P m2 h(pm )
mh(pm )
m
mP
P
log2 p.
−
+
m)
m)
h(p
h(p
1
+
1
+
m
m
p
Un quatrième exemple détaillé
Lemme 8.3 Pour tout X > 0 et tout entier d ≥ 1, la fonction
X µ2 (n)
ϕ(n)
n≤X
(n,d)=1
est approximée par
X log p
X log p ϕ(d)
log X + γ +
+ O(7.284X −1/3 f1 (d))
+
d
p(p − 1)
p
DR
p≥2
p|d
avec
f1 (d) =
Y
p1/3 + p2/3 −1
(1 + p−2/3 ) 1 +
.
p(p − 1)
p|d
Remarque : La somme de gauche est Gd (X). Le cas d = 1 a déjà été étudié
plus haut. La série de Dirichlet associée est
X µ2 (n)
ζ(s) Y
1
=
1+
ϕ(n)ns−1
ζ(2s)
(p − 1)(ps + 1)
n
p≥2
ce qui fait que le terme d’erreur O(X −1/2 ) est admissible (notre méthode pourrait donner O(X −1/2 log2 X)), et que nous ne pouvons espérer mieux que O(X −3/4 ).
Rosser & Schoenfeld ((Rosser & Schoenfeld, 1962) équation (2.11)) nous
donne
X log p
γ+
= 1.332 582 275 332 21...
p(p − 1)
p≥2
25 novembre 2012
Version 2
8.3 Un quatrième exemple détaillé
59
Démonstration. Définissons la fonction multiplicative hd par
hd (p) =
1
,
p(p − 1)
hd (p2 ) =
−1
,
p(p − 1)
hd (pm ) = 0
si m ≥ 3,
si p est un nombre premier qui ne divise pas d, et par hd (pm ) =
m ≥ 1 si p est un facteur premier de d.
Nous avons alors
µ(pm )
pm
pour tout
X µ2 (n)
X hd (n)
ζ(s
+
1)
=
ns
ϕ(n)ns
n≥1
(n,d)=1
AF
T
n≥1
ce qui nous permet d’appliquer le lemme 2. Nous vérifions que
Y
p1/3 + p2/3
≤ 8.
1+
p(p − 1)
p≥2
Exercice 99.
⋄ 1 ⋄ Montrer que
⋄ 2 ⋄ Montrer que
X
ϕ(n) = (3/π 2 )x2 + O(x log x) pour x ≥ 2.
n≤x
X
m,n≤x,
pgcd(m,n)=1
1 = −1 + 2
X
ϕ(n)
n≤x
et en conclure que le membre de gauche est égal à (6/π 2 )x2 + O(x log x).
X
σ(n) = (π 2 /12)x2 + O(x log x) pour x ≥ 2.
DR
Exercice 100. Montrer que
n≤x
Exercice 101.
P
⋄ 1 ⋄ Montrer que 2ω(n) = d2 m=n µ(d)d(m).
X
√
⋄ 2 ⋄ Montrer que
2ω(n) = (6/π 2 )x log x + cx + O( x log x) pour x ≥ 2 et
n≤x
où c = 2γ − 1 − 2ζ ′ (2)/ζ(2).
X
⋄ 3 ⋄ Montrer que
2Ω(n) = Cx(log x)2 + O(x log x) pour x ≥ 2 pour une
n≤x
constante C > 0.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 8. EXEMPLES ET PRATIQUE
DR
AF
T
60
25 novembre 2012
Version 2
Chapitre 9
9.1
AF
T
Le théorème de
Levin-Fainleib et alia
Une première borne supérieure
Ce premier théorème est efficace lorsque l’ordre moyen de g sur les puissances
de nombres premiers est proche de constant. Il existe de nombreuses versions de
ce résultat, dont la plus précise est due à (Halberstam & Richert, 1979). Celle
que nous présentons est une légère modification de ce qui est proposé dans le
livre de Tenenbaum référencé à la fin de ce papier.
L’idée de départ est tirée du célèbre article (Levin & Fainleib, 1967). Signalons ici l’article (Moree, 2004) qui explore et améliore le caractère explicite des
deux théorèmes ci-dessous.
DR
Théorème 9.1 Soit D ≥ 2 un paramètre réel fixé. Supposons que g soit multiplicative et positive ou nulle, et que
X
g pν log pν ≤ KQ + K ′
(∀Q ∈ [1, D])
p≥2,ν≥1
pν ≤Q
pour deux constantes K, K ′ ≥ 0. Alors
X
d≤D
g(d) ≤ (K + 1)
X
D
g(d)/d
′
log D − K
d≤D
pour D > exp K ′ .
Démonstration. Posons G̃(D) =
nous obtenons
G(D) log D =
X
P
g(d) log
d≤D
d≤D
X
D
+
g(d) log d
d
X g(d)
+
≤D
d
d≤D
g(d)/d. Alors, en utilisant log D
d ≤
d≤D
X
p≥2,ν≥1
pν ≤D
X
g(ℓ)
g pν log pν
ℓ≤D/pν
(ℓ,p)=1
D
d,
CHAPITRE 9. LE THÉORÈME DE LEVIN-FAINLEIB
62
où l’on obtient le second sommant en écrivant
log d =
X
pν kd
log pν .
Finalement
X
p≥2,ν≥1
pν ≤D
X
X
g(ℓ) =
g(ℓ)
g pν log rpν
ℓ≤D/pν
(ℓ,p)=1
ℓ≤D
X
p≥2,ν≥1
pν ≤D/ℓ
(p,ℓ)=1
g(ℓ)K
g pν log pν
D
ℓ
AF
T
≤
X
ℓ≤D
ce qui nous permet de conclure facilement.
Théorème 9.2 Soit D ≥ 2 un paramètre réel fixé. Supposons que g soit multiplicative et positive ou nulle. Alors
X
d≤D
X
g(d)/d ≤ exp
g(pν )/pν
ν≥1,
pν ≤D
où la somme de droite porte sur tous les entiers ν ≥ 1 et tous les nombres
premiers p, les deux vérifiant pν ≤ D.
DR
Démonstration. En effet, le développement du produit
Y X
p≤D 0≤ν
contient tous les termes de la somme
ration. Nous utilisons alors, à p fixé,
log
g(pν )/pν
X
0≤ν
P
d≤D
g(d)/d. Il s’agit donc d’une majo-
X
g(pν )/pν .
g(pν )/pν ≤
1≤ν
Exercice 102. Supposons que g soit multiplicative et positive ou nulle et
vérifie 0 ≤ g(p) ≤ λ < 1 pour tous nombres premiers p et où λ est un paramètre
fixé. Nous avons
Y
X µ2 (d)g(d)
g(p) .
≥ (1 − λ)
1+
d
p
d≤D
25 novembre 2012
p≤D
Version 2
9.2 Une formule asymptotique
Indication : On utilisera l’inegalité
D ≥ 1. Nous avons
63
P
p≤D (log p)/p
Y
X µ2 (d)g(d)
g(p) −
=
1+
d
p
p≤D
d≤D
≤ log D, valable pour
X
n>D,
P + (n)≤D
µ2 (n)f (n)
n
où P + (n) est le plus grand facteur premier de n. On pourra alors majorer le
membre de droite par
X
AF
T
P + (n)≤D
µ2 (n)f (n) log n
.
n
log D
Exercice 103. (A. Selberg) Nous considérons la somme S(x) =
X µ(n)
.
n2ω(n)
n≤x
√
⋄ 1 ⋄ Montrer qu’il existe une constante c0 > 0 telle que |S(x)| ≤ c0 / log x.
⋄ 2 ⋄ Montrer l’identité :
xS(x) =
X µ(n) n x o
1
+
2ω (n)
2ω(n) n
n≤x
n≤x
X
et en déduire que S(x) ≥ 0.
Exercice 104. Montrer que
−1
X1
Y
≤
1 − 1/p
.
n
n≤x
p≤x
DR
log x ≤
En déduire que pour x ≥ 10, on a
X1
≥ log log x + O(1).
p
p≤x
9.2
Une formule asymptotique
Notre second théorème s’applique lui aux fonctions multiplicatives g telles
que g(p) ≃ κ/p pour un certain κ > 0.
Ce second théorème demande des hypothèses bien plus fortes mais en échange
nous prouvons une formule asymptotique. Sa preuve est à la base assez simple,
mais se complique du fait que (i) nous prenons en compte la dépendance en certains paramètres des termes d’erreur (ii) nous tenons compte des valeurs de g sur
les puissances de nombres premiers (iii) nous offrons un résultat complètement
explicite. L’essentiel de ce théorème se trouve dans (Halberstam & Richert,
1971), et une présentation légèrement simplifiée dans le livre de ces deux mêmes
auteurs.
Théorème 9.3 Donnons-nous une fonction multiplicative g positive ou nulle
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 9. LE THÉORÈME DE LEVIN-FAINLEIB
64
et trois paramètres réels strictement positifs κ, L et A tels que






X
p≥2,ν≥1
w<pν ≤Q
Q
g pν log pν = κ log + O∗ (L)
w
(Q > w ≥ 1),
X X



g pk g pν log pν ≤ A.


p≥2 ν,k≥1
X
d≤D
avec
κ
g(d) = C (log D) (1 + O∗ (B/ log D))
(D ≥ exp(2(L + A)))
AF
T
Alors
κ Y X
1
1
,
1−
g pν
Γ(κ + 1)
p
p≥2
ν≥0


B = 2(L + A) 1 + 2(κ + 1)eκ+1


C =
Notons que dans la plupart des applications, si la dépendance en L peut
s’avérer importante, celle en A est presque toujours sans intérêt. De plus (Rawsthorne, 1982) et (Greaves & Huxley, 1999) donnent des évaluations où seule la
majoration est nécessaire.
Démonstration. Le départ est similaire au précédent :
G(D) log D =
X
g(d) log
d≤D
d≤D
D
g(d) log +
d
DR
=
X
d≤D
X
D
+
g(d) log d
d
X
p≥2,ν≥1
pν ≤D
X
g(ℓ)
g pν log pν
ℓ≤D/pν
(ℓ,p)=1
et l’on pose

X

g(ℓ)
Gp (X) =




ℓ≤X

ce qui nous donne
(ℓ,p)=1
Z D

X

D
dt


T
(D)
=
g(d)
log
=
G(t) ,


d
t
1
d≤D
G(D) log(D) = T (D) +
X
p≥2,ν≥1
pν ≤D
g pν log pν Gp (D/pν ).
De plus, nous vérifions aisément que
Gp (X) = G(X) −
25 novembre 2012
X
Gp (X/pk )
k≥1
Version 2
9.2 Une formule asymptotique
65
ce qui, joint à nos hypothèse, nous donne
X
G(D) log(D) = T (D) +
g pν log pν G(D/pν ) + O∗ (AG(D))
p≥2,ν≥1
pν ≤D
= T (D) +
X
d≤D
g(d)
X
p≥2,ν≥1
pν ≤D/d
g pν log pν + O∗ (AG(D))
= T (D)(κ + 1) + O∗ ((L + A)G(D))
ce que nous réécrivons en
avec r(D) = O∗
L+A
log D
AF
T
(κ + 1)T (D) = G(D) log D (1 + r(D))
que nous regardons comme une équation différentielle. Posons
exp E(D) =
(κ + 1)T (D)
G(D)
=
(1 + r(D))
(log D)κ+1
(log D)κ
ce qui nous donne pour D ≥ D0 = exp(2(L + A))
T ′ (D)
(κ + 1)
r(D)(κ + 1)
∗ 2(L + A)
E (D) =
−
=
=O
T (D)
D log D
(1 − r(D))D log D
D log D
′
1
2
si D ≥ D0 . Il vient (D ≥ D0 ) :
Z ∞
2(L + A)
E(∞) − E(D) =
E ′ (t)dt = O∗
.
log D
D
puisque |r(D)| ≤
Bref
DR
G(D)
exp E(D)
eE(∞)
∗ 2(L + A)
κ+1
1
+
O
.
=
=
(κ
+
1)e
(log D)κ
1 + r(D)
1 + r(D)
log D
Or 1/(1 + x) ≤ 1 + 2x si 0 ≤ x ≤ 21 d’où
G(D)
∗ 2(L + A)
κ+1
E(∞)
1+O
1 + 2(κ + 1)e
=e
(log D)κ
log D
pour D ≥ D0 , ce qui constitue l’essentiel de la démonstration. Il nous faut à
présent expliciter eE(∞) = C. Remarquons tout d’abord que la preuve ci-dessus
est a priori fausse car T ′ (D) 6= G(D)/D aux points de discontinuités de G, mais
il nous suffit de travailler avec D non entier et de procéder par continuité.
Expression de C :
Pour ce qui est du calcul de la constante, nous avons pour s réel positif
Z ∞
X g(d)
dD
G(D) s+1
=
s
D(g, s) =
ds
D
1
d≥1
Z ∞
Z ∞
κ dD
κ−1 dD
= sC
(log D) s+1 + O sC
(log D)
D
Ds+1
1
1
−κ
1−κ
= C s Γ(κ + 1) + O(s
Γ(κ))
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 9. LE THÉORÈME DE LEVIN-FAINLEIB
66
et par conséquent
C = lim+ D(g, s)sκ Γ(κ + 1)−1 = lim+ D(g, s)ζ(s + 1)−κ Γ(κ + 1)−1 .
s→0
s→0
Il est alors assez facile de montrer que le produit
Y X
p≥2
ν≥0
g pν
κ 1
1−
p
AF
T
est convergent et égale donc CΓ(κ + 1) comme voulu.
Exercice 105. Montrer que, lorsque D tend vers l’infini, nous avons
X
9ω(d) /ϕ(d) ∼ C(log D)9
d≤D
où C est une constante > 0 que l’on explicitera.
Exercice 106.
⋄ 1 ⋄ Donner un asymptotique de
XX
µ2 (n/d)3−ω(d) /n.
DR
n≤N d|n
⋄ 2 ⋄ Donner un asymptotique de
XX
µ2 (n/d)3−ω(d) /(n + 1).
n≤N d|n
Exercice 107.
⋄ 1 ⋄ Montrer que
X µ2 (d)
n
=
.
ϕ(n)
ϕ(d)
d|n
⋄ 2 ⋄ Montrer que
X
n≤N
n
ζ(2)ζ(3)
=
N + O(log(2N )).
ϕ(n)
ζ(6)
⋄ 3 ⋄ Montrer qu’il existe une constante C telle que
X
n≤N
25 novembre 2012
ζ(2)ζ(3)
1
=
log N + C + O(log(2N )/N ).
ϕ(n)
ζ(6)
Version 2
9.2 Une formule asymptotique
67
⋄ 4 ⋄ Montrer que
X µ2 (d) log d
dϕ(d)
d≥1
=
X
p≥2
Y
log p
1
1
+
p2 − p + 1
p(p − 1)
p≥2
et en déduire que la constante C de la question précédente est donnée par
X
ζ(2)ζ(3)
log p
C=
γ−
.
ζ(6)
p2 − p + 1
p≥2
AF
T
⋄ 5 ⋄ Montrer que le terme d’erreur dans l’évaluation de la somme des 1/ϕ(n)
ne peut être meilleur que O(1/N ).
Exercice 110. Donner un asymptotique pour
X
1/(1 + ϕ(d)).
d≤D
Indication : On pourra comparer cette série à
Exercice 111.
⋄ 1 ⋄ Montrer que
P
d≤D
1/ϕ(d).
ϕ(n) X µ(d)
=
n
d
d|n
⋄ 2 ⋄ Montrer que
X ϕ(n)
= CN + O(log(2N ))
n
DR
n≤N
pour une certaine constante que l’on calculera.
⋄ 3 ⋄ Montrer que
X ϕ(n)
= C log N + C2 + O(log(2N )/N )
n2
n≤N
pour une certaine constante C2 (le tout étant valable pour N ≥ 1).
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 9. LE THÉORÈME DE LEVIN-FAINLEIB
DR
AF
T
68
25 novembre 2012
Version 2
Chapitre 10
AF
T
Le théorème de
Brun-Titchmarsh : une
approche moderne
Les dernières décennies ont vu des progrès immenses dans la compréhension des nombres premiers, presque tous dus à l’invention de la méthode du
crible. Nous exposerons comment cette approche permet de majorer le nombre
de premiers dans un intervalle [M + 1, M + N ] uniformément en M .
10.1
Des nombres premiers
DR
Commençons par rappeler que les nombres premiers sont ces entiers ≥ 2 qui
ne sont divisibles par aucun entier ≥ 1, sauf évidemment par 1 et par eux mêmes.
5 est un nombre premier. Ces entiers permettent de comprendre parfaitement
tous les problèmes multiplicatifs grâce à la décomposition en facteurs premiers :
tout entier n s’écrit comme un produit de nombres premiers et cette écriture
est unique à l’ordre des facteurs près.
Dans la suite, la lettre p désignera toujours un nombre premier.
Donc nous comprenons bien la multiplication des entiers, bien leur addition
et en conséquence nous maı̂trisons aussi la soustraction et la division. Aussi nous
tournons-nous vers le problème qui consiste à comparer ces deux structures. Il
existe un lien : celui donné par la distributivité. Et si l’on ajoute (action du
royaume additif) deux entiers divisibles pas 3 (propriété du royaume multiplicatif), on obtient un entier encore divisible par 3, c’est à dire que l’addition n’a
pas détruit cette propriété additive ! Nous croyons à l’heure actuelle qu’il s’agit
là du seul lien entre l’additif et le multiplicatif (excepté peut-être un autre lien
ténu donné par la conjecture abc. Qui est largement hors sujet).
Parmi les problèmes de base, nous voulons connaı̂tre le plus précisément
possible le nombre de nombres premiers dans les intervalles [M + 1, M + N ]. Il
s’agit encore d’un problème additif/multiplicatif, mais c’est un peu plus délicat
à voir : être premier est bien une propriété multiplicative, et être inférieur à une
borne donnée, disons X, est elle une propriété additive ! Il s’agit effectivement
de la relation d’ordre liée à l’addition, et non celle liée à la multiplication qui
CHAPITRE 10. UNE APPROCHE MODERNE
70
est la divisibilité.
Le théorème des nombres premiers nous garantit que le nombre π(X) de
nombres premiers ≤ X est ≃ X/ log X.
En fait, nous disposons d’une approximation encore meilleure
π(X) =
Z
2
X
dt
+ O(X/ log2 X)
log t
AF
T
Le 2 ci-dessus peut surprendre, et à voir la taille du terme d’erreur, nous pourrions le remplacer par n’importe quelle constante > 1. Comment dans ces conditions trouver une définition plus ”canonique” que les autres ? En analyse classique et numérique, on prend comme borne initiale 0 . . . Mais il faut réfléchir
alors au sens de l’intégrale ! Ceci dit, le logarithme intégral est bien celui-ci, et
RX
c’est celui qui est tabulé, et non 2 dt/log t.
À interpréter comme “un nombre est premier avec probabilité 1/ log t”.
Cela règle le cas de l’intervalle initial, où M = 0.
Exercice 112. Nous définissons la somme de Ramanujan modulo q par
X
cq (n) =
e(na/q).
1≤a≤q,
(pgcd(a,q)=1
P
d|q cq (n)
DR
⋄ 1 ⋄ Montrer que
= qδq|n et en déduire que
cq (n) =
X
µ(q/ℓ)ℓ.
ℓ|n,
ℓ|q
⋄ 2 ⋄ Montrer que, à n fixé, la fonction q 7→ cq (n) est multiplicative. On peut
aussi montrer la multiplicativité en employant l’exercice 10.
⋄ 3 ⋄ Montrer que, à q fixé, la fonction n 7→ cq (n) est multiplicative si et
seulement si µ(q) = 1.
10.2
Une approche “crible”
La preuve donnant l’évaluation de π(X) est purement analytique. Si elle est
précise dans son cas d’application, elle ne réussit pas à donner d’informations
sur le nombre de nombres premiers dans un intervalle quelconque. Revenons
donc aux bases.
Dans I = [M + 1, M + N ], il y a N/2 + O(1) nombres pairs. En langage un
peu flou, la probabilité qu’un entier de cet intervalle soit divisible par 2 est 12
et celle qu’il ne soit pas divisible par 2 vaut 1 − 12 . Pour la divisibilité par 3,
nous constatons que la probabilité qu’un entier de cet intervalle ne soit pas
divisible par 3 vaut 1 − 31 . Et en supposant ces deux évènements indépendants,
la probabilité
pour qu’un entier ne soit divisible ni par 2, ni par 3, vaut 1 −
1
1
1
−
.
Pour
obtenir les nombres premiers, il nous faut ôter les multiples
2
3
25 novembre 2012
Version 2
10.3 L’inégalité de Brun-Titchmarsh
71
de 2, de 3, . . . de p, pour tous les p ≤ ?, où il n’est pas clair jusqu’où√ nous
devrions aller. Dans le cas de l’intervalle initial, il faudrait aller jusqu’à X et
cela donnerait
1
? Y
1−
X.
π(X) ≃
p
√
p≤ X
AF
T
Or le théorème de Mertens nous dit que le produit ci-dessus est asymptotique
à 2e−γ / log X ≃ 1.122 · · · / log X. La constante n’est par conséquent pas la
bonne ! Le problème dans cette approche vient de ce que nous considérons que
le fait d’être divible par p1 ou de l’être par un autre nombre premier p2 sont
deux évènements indépendants, ce qui n’est manifestement pas ! Enfin, presque,
puisque nous obtenons toutefois une expression proche de la vérité.
L’argument qui ne fonctionne pas concerne l’indépendance des évènements.
Et cette indépendance sera d’autant plus caduque que le nombres de modules
considérés sera grand. Nous allons donc restreindre ce nombre de modules, mais
du coup, nous n’allons plus avoir accès qu’à une borne supérieure.
En contrepartie, cette approche va fonctionner dans le cas général d’un intervalle, là où le théorème des nombres premiers ne s’applique pas !
10.3
L’inégalité de Brun-Titchmarsh
Théorème 10.1 Pour M et N deux entiers ≥ 1, le nombre Z de nombres
premiers dans l’intervalle [M + 1, M + N ] est au plus 2N/ log N .
DR
Si M = 1, le théorème des nombres premiers nous donne un meilleur résultat,
puisqu’il nous permet de remplacer le 2 par un 1+o(1). L’avantage de cette borne
est ailleurs, et précisément dans le fait que nous pouvons l’appliquer lorsque M
est très grand par rapport à N . Nous trouvons par exemple qu’entre 10100 et
10100 + 10 000, il y a moins de 2 200 nombres premiers.
La version du théorème que nous proposons est due à (Montgomery & Vaughan, 1973). C’est Linnik qui dans les années 40 a baptisé ce genre de résultat
des théorèmes de Brun-Titchmarsh à cause d’un lemme allant dans cette direction de Titchmarsh dans les années 30 où il utilisait une méthode de crible due
au père des méthodes de crible : Viggo Brun. Nous avons ajouté l’adjectif “simplifié” ci-dessus, parce que la version non simplifiée traite des nombres premiers
en progressions arithmétiques. L’adaptation énoncée plus loin est sans difficulté.
Par contre, le facteur 2 est lui vital, et toute amélioration aurait des répercussions énormes sur notre connaissance des nombres premiers.
Nous allons démontrer une version un peu plus faible avec 4 + o(1) au lieu
de la constante 2 ; et aussi imposer M ≥ N 1/4 , mais un peu plus de soin dans la
preuve permettrait d’obtenir 2 + o(1) sans condition sur M . Par contre, montrer
que le o(1) peut être pris égal à 0 est plus difficile.
Nous allons prouver une version légèrement affaiblie de ce théorème en passant par une petite série de quatre lemmes. Nous y posons
Q = q ≤ Q, q sans facteurs carrés
(10.1)
où Q est un paramètre que nous choisirons plus loin. La route que nous prenons
est bien loin a priori des considérations de divisibilité et d’indépendance que
nous avons utilisées pour la motiver. Il serait trop long de refaire ici le chemin
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 10. UNE APPROCHE MODERNE
72
qui va d’une approche à l’autre. Contentons de dire ici que ce chemin existe, les
deux méthodes ne sont effectivement pas étrangères l’une à l’autre, et celle que
nous présentons est franchement moderne.
10.4
Considérations hermitiennes
Notre premier lemme prend place dans un espace de Hilbert H .
AF
T
Lemme 10.2 (Parseval approché) Soit (ϕq )q∈Q une famille finie de points de
H . Soit f un autre point de H . Alors
X
|[f |ϕq ]|2 /Mq ≤ kf k2
q∈Q
où Mq est une borne supérieure pour
P
q′ ∈Q
|[ϕq |ϕq′ ]|.
Pour comprendre ce lemme, il suffit de considérer le cas où les ϕq sont deux à
deux orthogonaux. Dans ce cas, nous pouvons prendre Mq = kϕq k2 et l’inégalité
proposée est simplement celle de Parseval. Ce lemme permet de se dispenser de
l’hypothèse d’orthogonalité, mais est construit en pensant que notre système est
”presque orthogonal”, i.e. que Mq vaut ”presque” kϕq k2 .
Inégalité due à Selberg dans les années 70. On dit souvent que c’est le
mathématicien hongrois Hálasz qui a introduit un peu avant dans la théorie
ce genre d’inégalités générales, mais l’histoire n’est pas claire à ce sujet.
Démonstration. La preuve du lemme 10.2 est très simple. Considérons l’inégalité
2
X
f −
ξq ϕq ≥0
q∈Q
DR
où les ξq sont des paramètres que nous souhaitons choisir au mieux, c’est à dire
de façon à rendrePcette norme aussi petite que possible. Le mieux serait bien sûr
de prendre pour q∈Q ξq ϕq la projection orthogonale de f sur l’espace engendré
par les ϕq , mais nous ne savons pas calculer de tels coefficients ξq en général.
Nous nous contenterons de ce que nous espèrons être une approximation, mais
que nous savons exprimer. Le développement de la norme nous donne
X
X
kf k2 − 2ℜ
ξq [f |ϕq ] +
ξq ξq′ [ϕq |ϕq′ ] ≥ 0,
q,q′ ∈Q
q∈Q
où nous séparons q et q ′ à l’aide de |ξq ||ξq′ | ≤ 12 (|ξq |2 + |ξq′ |2 ). Nous réorganisons
nos termes et injectons Mq dans l’inéquation résultante. Il vient
X
X
ξq [f |ϕq ] +
|ξq |2 Mq ≥ 0.
(10.2)
kf k2 − 2ℜ
q∈Q
q∈Q
Maintenant que la forme quadratique en ξq est remplacée par une forme diagonale, il est facile de déterminer les ξq qui minimisent (10.2) :
ξq = [f |ϕq ]/Mq .
En injectant ces valeurs dans (10.2), nous obtenons bien l’inégalité annoncée.
25 novembre 2012
Version 2
10.5 Un peu d’arithmétique
10.5
73
Un peu d’arithmétique
Notre second lemme concerne les sommes de Ramanujan :
cq (n) =
q
X
exp(2iπan/q).
(10.3)
a=1,
pgcd(a,q)=1
cp (n) =
AF
T
Bien sûr, cq (n) ne dépend que de la classe de n modulo q. Notons dès à présent
que cette somme porte sur ϕ(q) entiers a, où ϕ(q) désigne l’indicateur d’Euler,
et ce parce que ϕ(q) est précisément le nombre d’entiers ≤ q premiers à q.
À titre d’exemple, pour q = p un nombre premier, la condition pgcd(a, p) = 1
se réduit à a 6= 0 et
p
X
a=1
exp(2iπan/p) − 1 =
(
p−1
−1
si p|n,
si p ∤ n.
(10.4)
Voilà qui règle le cas où q est un nombre premier. En utilisant le lemme chinois,
nous montrons que
cq1 q2 (n) = cq1 (n) cq2 (n)
si pgcd(q1 , q2 ) = 1.
(10.5)
Comme dans notre application, q sera un produit de nombres premiers distincts,
la conjugaison de (10.6) et de (10.5) suffit pour calculer cq (n). Voici la propriété
qui nous intéresse particulièrement :
Lemme 10.3 Si q ∈ Q et n est premier à q, alors cq (n) vaut (−1)ω(q) où ω(q)
est le nombre de facteurs premiers de q.
DR
En particulier, il s’agit d’un nombre indépendant de n et de module 1.
Notre troisième lemme donne une évaluation pour la fonction sommatoire
d’une fonction multiplicative positive, un sujet très classique en théorie analytique des nombres.
Lemme 10.4 Nous avons
X
q∈Q
1/ϕ(q) ≥ log Q.
Le lecteur sait maintenant donner un asympotique de cette somme. La
preuve qui suit est intéressante et donne qui plus est une borne inférieure explicite.
Démonstration. Commençons par remarquer que, si q = p est un nombre premier, alors
1
1
1
1
1
=
= + 2 + 3 + ··· .
ϕ(p)
p−1
p p
p
Une fois cela acquis, regardons ce qui se passe si q = p1 p2 un produit de deux
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 10. UNE APPROCHE MODERNE
74
nombres premiers distincts :
1
1
=
ϕ(p1 p2 )
(p1 − 1)(p2 − 1)
1
1
1
1
1
1
+ 2 + 3 + ···
+ 2 + 3 + ···
=
p1
p1
p1
p2
p2
p2
X1
=
n
n
AF
T
où la somme porte sur tous les entiers dont les facteurs premiers sont exactement
p1 et p2 . En poursuivant ce raisonnement, nous constatons que notre somme
initiale est celle des 1/n où n est un entier dont le produit de tous les facteurs
premiers est ≤ Q. Ensemble qui contient au moins tous les entiers ≤ Q, soit la
minoration
X
X
1/ϕ(q) ≥
1/n ≥ log Q.
q∈Q
1≤n≤Q
Ce qu’il fallait démontrer.
10.6
Preuve de l’inégalité de Brun-Titchmarsh
Nous prenons pour ϕq la fonction suivante :
(
cq (n) si M + 1 ≤ n ≤ M + N
ϕq (n) =
0
sinon,
(10.6)
DR
pour q variant dans Q.
Notre Hilbert est simplement l’ensemble des fonctions sur les entiers de [M +
1, M + N ] muni du produit hermitien standard :
X
[g|h] =
f (n)g(n).
(10.7)
M+1≤n≤M+N
Le dernier lemmes dont nous aurons besoin mesure la quasi-orthogonalité de
la famille (ϕq )q∈Q .
Lemme 10.5
X
q′ ∈Q
|[ϕq |ϕq′ ]| ≤ Mq = ϕ(q)(N + Q4 ).
Ce lemme va être une conséquence facile du suivant.
Lemme 10.6 Nous avons [ϕq |ϕq ] − ϕ(q)N ≤ ϕ(q)q 3 . De plus, si q ′ 6= q, nous
avons aussi
|[ϕq |ϕq′ ]| ≤ ϕ(q)qq ′2 .
Démonstration. Il vaut mieux raccourcir un peu les notations et écrire e(α) =
exp(2iπα). Nous obtenons alors, que q ′ soit premier à q ou non,
X
X
X
[ϕq |ϕq′ ] =
e(na/q)
e(−na′ /q ′ ) .
M+1≤n≤M+N
25 novembre 2012
1≤a≤q,
pgcd(a,q)=1
1≤a′ ≤q′ ,
pgcd(a′ ,q′ )=1
Version 2
10.7 Compléments
75
En mettant les sommations sur a et a′ devant, cela donne
X
X
X
a a′
[ϕq |ϕq′ ] =
.
e n
− ′
q
q
′
′
1≤a≤q,
1≤a ≤q , M+1≤n≤M+N
pgcd(a,q)=1 pgcd(a′ ,q′ )=1
La somme interne est en fait la somme d’une progression arithmétique. Si a/q 6=
a′ /q ′ , elle vaut au plus en module
a a′
1/| sin π
| ≤ qq ′ /2
− ′
q
q
AF
T
en utilisant l’inégalité classique sin x ≥ 2x/π si 0 ≤ x ≤ π/2.
Tout cela résulte en le lemme 10.5.
Nous prenons tout simplement pour f la fonction caractéristique des nombres
premiers de l’intervalle [M + 1, M + N ] et nous supposons que Q, qui intervient
dans la définition de Q est ≤ M . Dans ce cas, nous obtenons directement
X
X
f (n)
(10.8)
[f |ϕq ] =
f (n)ϕq (n) = (−1)ω(q)
M+1≤n≤M+N
M+1≤n≤M+N
tout simplement parce que ϕq (n) = (−1)ω(q) pour tous les nombres premiers de
notre intervalle. En rappelant que Z désigne le nombre de ces nombres premiers,
nous pouvons réécrire l’équation ci-dessus sous la forme
[f |ϕq ] = (−1)ω(q) Z.
(10.9)
DR
Notre lemme nous donne alors
X
(−1)ω(q) Z 2 /ϕ(q) ≤ Z(N + Q4 ),
q∈Q
soit encore
Z
X
q∈Q
1/ϕ(q) ≤ N + Q4 .
(10.10)
Le lemme 10.4 nous permet alors d’atteindre la majoration Z ≤ (N +Q4 )/ log Q
où il nous faut à présent optimiser Q. Nous prenons
Q = N 1/4 / log N
(10.11)
ce qui nous donne le résultat annoncé.
10.7
Compléments
Tout d’abord, en remarquant que dans l’ensemble {a/q, pgcd(a, q) = 1, q ≤
Q}, deux points sont distants d’au moins 1/Q2 , il est assez facile de montrer
qu’en fait, nous avons
X
(10.12)
|[ϕq |ϕq′ ]| = ϕ(q)N + O(ϕ(q)Q2 log Q)
q′ ∈Q
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 10. UNE APPROCHE MODERNE
76
ce qui nous donnerait Z ≤ (2 + o(1))N/ log N .
Il nous faut ensuite éliminer la condition Q ≤ M : pour cela, il suffit de
prendre pour f la fonction caractéristique
P des nombres premiers de notre intervalle, mais qui sont aussi > Q. Du coup, n f (n) ne vaut plus Z, mais Z +O(Q),
ce qui nous suffit largement.
Cette preuve est récente : je l’ai mise au point en 2008 ! En fait, cela m’a
permis de montrer la majoration
Z ≤ 2N/(log N + 2.88 + o(1)).
(10.13)
10.8
AF
T
Qui n’est d’ailleurs pas encore publiée. Qu’une telle inégalité soit possible, mais
avec une constante non spécifiée est dû à (van Lint & Richert, 1965) bien
que (Selberg, 1949) mentionne un tel résultat sans démonstration. (Bombieri,
1971) obtenait le première valeur avec la majoration Z ≤ 2N/(log N − 3 + o(1)).
(Montgomery & Vaughan, 1973) ont ensuite affiné ce −3 en 5/6 et dans la section 22 de (Selberg, 1991) se trouve une preuve donnant c = 2.81, preuve à
laquelle nous empruntons certains éléments.
Optimalité ?
Si nous savons que les méthodes de preuves dont nous disposons à l’heure
actuelle ne sauraient améliorer notoirement le théorème de Brun-Titchmarsh,
si ce n’est sous la forme de petites améliorations comme dans (10.13), il n’est
absolument pas clair que ce théorème ne soit pas optimal en soi. Il serait très
intéressant de déterminer un intervalle [M + 1, M + N ] où le nombre de nombres
premiers divisé par N/ log N soit > 1 et où M ≥ 2N . Et en fait le plus grand
possible et même proche de 2 . . . À l’heure actuelle, je ne connais que des
exemples :
DR
M +1
M +N
N Z rapport
5 639
5 659
21 7 1.0148 . . .
113 143
113 177
35 10 1.0158 . . .
21 817 283 854 511 261 21 817 283 854 511 311 51 14 1.0793 . . .
Ce dernier exemple date de 1982.
Ceci est à rapprocher de la conjecture de Hardy & Littlewood de 1923 qui
affirme que π(M + 1) − π(M + N ) ≤ π(N − 1). Voir à ce sujet (Dusart, 1998),
(Hensley & Richards, 1974), (Schinzel & Sierpiǹski, 1958) et (Schinzel, 1961).
Pour déterminer des exemples permettant de s’approcher plus près de la
borne donnée par le théorème de Brun-Titchmarsh, il convient peut être de se
tourner vers sa formulation la plus générale :
Théorème 10.7 (Théorème de Brun-Tichmarsh) Soit q ≥ 1 un entier et a un
entier premier à q. Pour M et N deux entiers ≥ 1, le nombre Z de nombres
premiers congrus à a modulo q et dans l’intervalle [M + 1, M + N ] est au plus
2N
.
ϕ(q) log(N/q)
Je ne crois pas qu’une telle approche ait été tentée, par exemple avec des
nombres premiers = 2[3].
25 novembre 2012
Version 2
10.9 Des nombres premiers jumeaux
Exercice 113. Démontrer que
X
p≤x
10.9
77
d(p − 1) ≪ x/ log x.
Des nombres premiers jumeaux
Approche locale
AF
T
Considérons le nombre J(X) de nombres premiers p ≤ X qui sont tels que
p+2 est aussi premier, comme 17 ou 41. Depuis le milieu du dix neuvième siècle,
on conjecture qu’il y a une infinité de tels nombres, dits jumeaux, conjecture qui
reste très largement hors de notre portée. Le fait est que nous savons très mal
travailler avec cette condition supplémentaire sur p, et même montrer que de tels
nombres ne sont pas en proportion positive dans la suite des nombres premiers
est longtemps resté indémontré ! Le théorème de Brun ci-dessous répare cette
lacune de façon éclatante.
Commençons par quelques remarques simples :
1. Si p et p + 2 sont premiers, alors p ≡ 2[3].
2. Si p et p + 2 sont premiers, alors modulo 5, p ne peut être congrus qu’à 1,
2 ou 4.
3. Modulo le nombre premier q, si p et p = 2 sont premier et premiers à q,
alors p ne peut être congrus à 0 ou à −2 modulo p.
DR
Si nous raisonnons comme précédemment, nous constatons que la probabilité
que l’entier n soit premier, de même que l’entier n + 2 ressemble à
1
3
5
1
1−
1−
1−
···
1−
2
3
5
7
Philosophie et heuristique
Les études allient alors une exploration plus approfondie du modèle local
précédent à la remarque suivante, directement issue de la première partie :
n ≤ X est premier avec la probabilité 1/ log X et de même pour n + 2. En
arguant que ces deux probabilités sont indépendantes l’une de l’autre, nous
obtenons que la probablité que n et n + 2 soient premiers est de l’ordre de
1/ log2 X. Bien sûr il faut voir comment mélanger les deux arguments, et cela
donne lieu à la conjecture quantitative que voici.
Conjecture Le nombre de nombres premiers jumeaux ≤ X est équivalent à
Y
1
.
SX/ log2 X avec S = 2
1−
(p − 1)2
p≥3
Ce théorème montre que le nombre de nombres premiers jumeaux est asymptotiquement nettement inférieur à celui des nombres premiers. Fait que (Brun,
1919) a exprimé en 1916 en énonçant :
Théorème 10.8 (Viggo Brun) La somme des inverses des nombres premiers
jumeaux est finie ou convergente.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 10. UNE APPROCHE MODERNE
78
Alors que la somme des inverses des nombres premiers est elle divergente.
Nous allons ici montrer le théorème suivant.
Théorème 10.9 Il existe une constante positive C > 0 telle que
J(X) ≤ CX/ log2 X.
Le résultat de Brun en est alors un simple corollaire que l’on déduit par la
technique dite de sommation par parties. En effet, il vient
Z X !
Z X
X
X
1
J(X)
dt
J(t)dt
1/p =
=
+
+
2
X
t
X
t2
p
1
p≤X,
p + 2 premier
AF
T
p≤X,
p + 2 premier
qui est effectivement borné en vertu de ce que nous venons d’établir.
Une majoration
Nous allons adapter la preuve de la partie 10.6. Il nous faut tout d’abord
définir un équivalent des sommes de Ramanujan. Commençons par une petite
définition. Si d|q où q est sans facteurs carrés, alors q/d et d sont premiers entre
eux. En conséquence, il existe un (unique) entier uq,d dans {1, . . . , d] tel que
(q/d)uq,d ≡ 1[d].
Une fois cela posé, nous définissons alors
cjumeaux
(n) = 2−ω(q)
q
X
(10.14)
DR
d|q
c n + 2uq,dq/d
où ω(q) est le nombre de facteurs premiers de q, de sorte que le nombre de
diviseurs de q est ici 2ω(q) , et ceci, parce que q est sans facteurs carrés. Nous
disposons alors d’un équivalent du lemme 10.3.
Lemme 10.10 Lorsque q ∈ Q et n et n + 2 sont premiers à q, la fonction
prend la valeur 1 en n.
cjumeaux
q
Démonstration. Pour d divisant q, regardons cq n + 2uq,d q/d où n et n = 2
sont premier à q. Par la propriété de multiplicativité établie en (10.5), nous
obtenons
cq n + 2uq,d q/d = cd n + 2uq,d q/d cq/d n + 2uq,d q/d
Or, cℓ (n) ne dépend que de n modulo ℓ et donc
cd n + 2uq,d q/d = cd (n),
cq/d n + 2uq,d q/d = cq/d (n + 2)
Comme nous supposons n et n+2 premiers à q et donc a fortiori à q/d et à d, chacune des deux quantités précédentes vaut respectivement (−1)ω(d) et (−1)ω(q/d) .
Comme ω(q/d) = ω(q) − ω(d), nous obtenons bien le résultat annoncé.
25 novembre 2012
Version 2
10.9 Des nombres premiers jumeaux
79
Nous prenons pour ϕjumeaux
la fonction suivante :
q
(
cjumeaux
(n) si M + 1 ≤ n ≤ M + N
q
ϕjumeaux
(n) =
q
0
sinon,
(10.15)
pour q variant dans Qjumeaux où
Qjumeaux = q ≤ Q, q impair et sans facteurs carrés
(10.16)
Q étant un paramètre que nous choisirons plus tard. L’arithmétique de la situation va être passablement plus délicate. Nous introduisons deux fonctions :
Y
1−
2
p
(10.17)
AF
T
ϕ2 (q) = q
p|q
que le lecteur pourra comparer à la définition suivante de l’indicateur d’Euler :
ϕ(q) = q
Y
p|q
1−
1
.
p
(10.18)
Nous introduisons ensuite
h(q) = ϕ2 (q)/2ω(q) .
(10.19)
Et voici alors l’équivalent du lemme 10.5.
Lemme 10.11
X
q′ ∈Q
|[ϕjumeaux
|ϕjumeaux
]| ≤ Mq = h(q)(N + 6Q4 ).
q
q′
DR
Ce lemme va être une conséquence facile du suivant, qui est modelé sur le
lemme 10.6.
Lemme 10.12 Nous avons [ϕjumeaux
|ϕjumeaux
] − h(q)N ≤ q 4 . De plus, si
q
q
q ′ 6= q, nous avons aussi
|[ϕjumeaux
|ϕjumeaux
]| ≤ (qq ′ )2 .
q
q′
Démonstration. Nous obtenons aisément
X
X
′
2ω(q)+ω(q ) [ϕjumeaux
|ϕjumeaux
]=
q
q′
X
1≤a≤q,
d|q,
1≤a′ ≤q′ ,
d′ |q′ pgcd(a,q)=1 pgcd(a′ ,q′ )=1
X
M+1≤n≤M+N
a a′
auq,d a′ uq′ ,d′
e n
.
−
− ′
e 2
d
d′
q
q
Si a/q 6= a′ /q ′ , nous majorons la somme sur n par qq ′ , ce qui nous donne une
′
terme d’erreur de 2ω(q)+ω(q ) (qq ′ )2 . Si a/q = a′ /q ′ ( et en particulier q = q ′ ), il
nous reste le terme principal
X
X
X
uq,d
uq,d′
N
e 2a
cq 2(uq,d (q/d) − uq,d′ (q ′ /d′ )
=N
− ′
d
d
1≤a≤q,
d|q,
d′ |q pgcd(a,q)=1
Le cours de Nouakchott
d|q,
d′ |q
25 novembre 2012
CHAPITRE 10. UNE APPROCHE MODERNE
80
et nous calculons ce dernier par multiplicativité (voir (10.5)) :
Y
cp 2(uq,d (q/d) − uq,d′ (q ′ /d′ ) .
cq 2(uq,d (q/d) − uq,d′ (q ′ /d′ ) =
p|q
Or, chaque facteur ne dépend que de son argument modulo p. Nous avons quatre
cas à distinguer. Soit p ne divise ni d, ni d′ . Comme il divise q, la contribution est
cp (0) = p−1. Soit p divise d mais pas d′ . La contribution est alors cp (2) = −1, et
de même si p divise d′ mais pas d. Par contre, si p divise d et d′ , la contribution
est cp (2(1 − 1)) = p − 1. Ce que nous rassemblons dans l’expression
Y
(1 − p).
AF
T
(−1)ω(q)
p|q,
p∤dd′ / pgcd(d,d′ )2
À partir de là, calculer le terme principal est un peu difficile. Par multiplicativité,
nous obtenons qu’il vaut
Y
X
Y
YX
(−1)ω(q)
(1 − p1 )
(1 − p) = (−1)ω(q)
d|q,
d′ |q
p|q,
p∤dd′ / pgcd(d,d′ )2
= (−1)ω(q)
p|q
p1 |p,
d|p,
d′ |p p1 ∤dd′ / pgcd(d,d′ )2
Y
4 − 2p = 2ω(q) ϕ2 (q).
p|q
En prenant encore pour f la fonction caractéristique des nombres premiers
jumeaux ≤ X, nous obtenons
DR
[f |ϕjumeaux
] = Z = J(X).
q
Nous invoquons alors le lemme 10.2 pour obtenir
X
Z2
1/h(q) ≤ Z(N + Q4 )
q∈Qjumeaux
ce qui nous laisse avec la somme des inverses des h(q) à minorer. Le lemme
suivant règle ce problème :
Lemme 10.13 Nous avons pour Q ≥ 170
X
1/h(q) ≥
1
16
log2 Q.
q∈Qjumeaux
Nous prenons enfin Q4 = X/ log X pour obtenir le théorème annoncé.
Démonstration. Nous montrons comme pour la démonstration du lemme 10.4
que
X
X
2Ω(ℓ)
1/h(q) ≥
ℓ
jumeaux
q∈Q
25 novembre 2012
ℓ≤Q,
pgcd(ℓ,2)=1
Version 2
10.9 Des nombres premiers jumeaux
81
où Ω(ℓ) désigne le nombre de facteurs premiers de ℓ comptés avec multiplicité,
de sorte que Ω(9) = 2 et Ω(18) = 3. Il se trouve que 2Ω(ℓ) est supérieur au
nombre d(ℓ) de diviseurs de ℓ. Nous remarquons alors que
X
√
ℓ1 ≤ Q,
pgcd(ℓ1 ,2)=1
1
ℓ1
X
√
ℓ2 ≤ Q,
pgcd(ℓ2 ,2)=1
1
=
ℓ2
X
ℓ≤Q,
pgcd(ℓ,2)=1
C(ℓ)
ℓ
où C(ℓ) est
√ le nombre de façon d’écrire ℓ comme produit ℓ1 ℓ2 , chacun des facteurs
étant ≤ Q. Bien sûr, C(ℓ) est majoré par d(ℓ) qui est lui-même majoré par
2Ω(ℓ) . Comme par ailleurs
√
X 1
1
=
−
ℓ1
√ ℓ1
1
2
X
1
ℓ1
AF
T
X
ℓ1 ≤ Q,
pgcd(ℓ1 ,2)=1
ℓ1 ≤ Q
≥
1
2
X
√
ℓ1 ≤ Q/2
√
ℓ1 ≤ Q/2
1
+
ℓ1 √
X
√
Q/2<ℓ1 ≤ Q
1
ℓ1
p
p
1
≥ 12 log( Q/2) + √ ( 12 Q − 1)
Q
≥ 41 log Q
DR
pour Q ≥ 170, nous obtenons la majoration annoncée.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 10. UNE APPROCHE MODERNE
DR
AF
T
82
25 novembre 2012
Version 2
Chapitre 11
11.1
AF
T
L’inégalité du grand crible
Une inégalité de Parseval approchée
Nous nous plaçons dans un espace vectoriel H complexe muni d’une seminorme hermitienne hf |gi, linéaire à gauche et sesqui-linéaire à droite, c’est à
dire qui vérifie
hλf |gi = λhf |gi , hf |gi = hg|f i,
hλf + µh|gi = λhf |gi + µhh|gi , hf |f i ≥ 0
pour tout λ, µ ∈ C et f, g, h ∈ H.
Dans ce contexte, nous nous donnons une famille finie (ϕ∗i )i∈I de points
de H, une famille (Mi )i∈I de nombres réels strictement positifs et une famille
(ωi,j )i,j∈I de nombres complexes tels que
k
X
ξi ϕ∗i k2 ≤
DR
∀(ξi )i ∈ CI ,
i
X
i
Mi |ξi |2 +
X
ξi ξj ωi,j .
(11.1)
i,j
Nous avons alors les deux lemmes suivants :
P
Lemme 11.1 Nous pouvons prendre Mi = j |hϕ∗i |ϕ∗j i| et ωi,j = 0.
Voici une lecture éclairante de ce lemme : la forme hermitenne qui apparaı̂t
a une matrice dont les termes diagonaux sont les hϕ∗i |ϕ∗i i. Un théorème de
Gershgorin dit que les valeur propres de la
Pmatrice se situent alors dans un disque
de centre l’un des hϕ∗i |ϕ∗i i| et de rayon j6=i |hϕ∗i |ϕ∗j i| pour le i correspondant,
disque qui porte le nom de disque de Gershgorin. Cette approche due à (Elliott,
1971) a toutefois un défaut : nous ne savons pas a priori que chaque disque de
Gershgorin contient une valeur propre, ce qui est en quelque sorte réparé dans
le lemme précédent.
Lemme 11.2 Pour tout f ∈ H et ξi = hf |ϕ∗i i/Mi , nous avons
X
X
ξi ξj ωi,j .
Mi−1 |hf |ϕ∗i i|2 ≤ kf k2 +
i
i,j
Ce lemme sans les ωi,j est dû à Atle Selberg d’après la section 2 de (Bombieri,
1987/1974b) et (Bombieri, 1971).
CHAPITRE 11. L’INÉGALITÉ DU GRAND CRIBLE
84
Démonstration. La preuve consiste à écrire
2
X
ξi ϕ∗i ≥ 0
f −
i
P
que nous développons. Nous nous débarrassons de k i ξi ϕ∗i k2 en utilisant (11.1),
ce qui nous donne
X
X
X
kf k2 − 2ℜ
ξi ξj ωi,j ≥ 0.
Mi |ξi |2 +
ξi hf |ϕ∗i i +
i
i,j
i
AF
T
Nous choisissons les ξ au meilleur de notre avantage, moyennant de négliger la
forme bilinéaire contenant les ωi,j , c’est à dire que nous prenons ξi = hf |ϕ∗i i/Mi .
Le résultat annoncé suit.
La conjugaison des deux lemmes est ce que l’on appelle usuellement “le
lemme de Selberg” dans ce contexte et l’introduction des ωi,j est due à l’auteur.
Dans ce lemme, la valeur exacte des ξ est généralement sans importance, mais
leur ordre de grandeur ainsi que la structure de forme quadratique sont eux
importants. D’une façon toute aussi générale, Mi est proche de kϕ∗i k2 .
L’introduction des ωi,j permet d’hybrider les résultats issus de l’inégalité
pondérée du grand crible et des résultats du crible de Selberg qui amènent à
cribler des suites et non simplement des intervalles.
11.2
L’inégalité du grand crible
Nous notons
e(α) = exp(2iπα).
(11.2)
DR
Théorème 11.3 (Inégalité du grand crible) Soit X un ensemble fini de points
de R/Z. Posons
δ = min {kx − x′ k, x 6= x′ ∈ X } .
Pour toute suite (un )1≤n≤N de nombres complexes, nous avons
2 X
X X
un e(nx) ≤
|un |2 (N − 1 + δ −1 ).
x∈X
n
n
Nous pouvons voir le membre de gauche comme une somme de Riemann sur
les points de X . Au moins si l’ensemble X est suffisament dense. En suivant ce
point de vue et puisque l’espacement entre deux points consécutifs est au moins
δ, nous sommes amenés à consiérer ce membre de gauche multiplié par δ comme
une approximation de
Z 1 X
2
X
un e(nα) dα =
|un |2 .
0
n
n
C’est effectivement le cas si δ −1 is bien plus grand que N (et pourvu que X soitt
aussi suffisament dense), mais il se trouve que le cas qui nous intéresse
Pen théorie
des nombres est précisément l’opposé. Dans ce cas, nous regardons n un e(nx)
comme une forme linéaire en les (un )n . La condition d’espacement implique que
25 novembre 2012
Version 2
11.2.1 Une transformée de Fourier
85
11.2.1
AF
T
X ne contient pas plus de δ −1 elements ; Or, si le nombre de formes linéaires
impliquées est effectvement inférieur à la dimension de l’espace ambient (soit
N ), elles sont linéairement indépendantes comme le lecteur l’établira simplement
en calculant un déterminant de van der Monde. Sinon, il y a des redondances
d’informations. Ce qui met en lumière le fait que ce qui entre en jeu ici est plus le
phénomène d’orthogonalité approchée que l’aspect approximation, ce pourquoi
j’ai choisi cette preuve.
Dans cette version, le théorème 11.3 est dû à Selberg. La même année et
par une méthode différente, (Montgomery & Vaughan, 1973) en obtinrent une
version très marginalement plus faible (sans le −1 à droite).
Nous montrons ici un résultat un peu plus faible avec N + 1 + 2δ −1 au lieu
de N − 1 + δ −1 . Nous commençons par rappeler quelle est la transformée de
Fourier discrète du noyau de Fejer.
Une transformée de Fourier
Soit N ′ et L deux entiers fixés. Considérons la fonction dont le graphe est :
F
0
L
N
N
0
0
N
0
+L
DR
N
1
Comme calculer sa transformée de Fourier discrète peut être lourd, nous introduisons deux autres fonctions G et H dessinées ci-après et qui vérifient
F = (G − H)/L.
G
L
N
0
L N
0
Le cours de Nouakchott
H
N
0
N +L
0
25 novembre 2012
CHAPITRE 11. L’INÉGALITÉ DU GRAND CRIBLE
86
Cela nous donne
X
X
X
L
F (n)e(ny) =
G(n)e(ny) −
H(n)e(ny)
n∈Z
n∈Z
n∈Z
X
(N ′ + L − |n|)e(ny) −
=
0≤|n|≤N ′ +L
= X
0≤m≤N ′ +L
d’où, finalement :
F (n)e(ny) =
n∈Z
La valeur en y = 0 vaut
11.2.2
0≤m≤N ′
0≤|n|≤N ′
(N ′ − |n|)e(ny)
2
e(my)
2
2
1 sin πN ′ y 1 sin π(N ′ + L)y −
,
L
sin πy
L sin πy (11.3)
AF
T
X
2 X
e(my) − X
P
n∈Z F (n)
= 2N ′ + L.
Preuve du théorème 11.3 (forme faible)
Nous utilisons les lemmes 11.2 et 11.1. Remarquons tout d’abord que nous
pouvons supposer que N est un entier. Soit ensuite N ′ = ⌊N/2⌋ la partie entière
de N/2 et f (n) = uN ′ +1+n (avec uN +1 = 0 si N est pair) de telle sorte que f a
son support sur [−N ′ , N ′ ]. Notre espace de Hilbert est ℓ2 (Z) muni du produit
scalaire standard, et f y appartient en l’étendant par f (n) = 0 si n n’est pas
dans l’intervalle [−N ′ , N ′ ]. Remarquons aussi que
X
kf k2 =
|un |2 .
(11.4)
n
DR
Nous devons à présent définir notre système quasi-orthogonal. Nous posons
p
(11.5)
∀x ∈ X , ϕ∗x (n) = e(nx) F (n),
où F est définie section 11.2.1. Comme f s’annule hors de [−N ′ , N ′ ], nous trouvons
X
[f |ϕ∗x ] = e(−(N ′ + 1)x)
un e(nx).
(11.6)
1≤n≤N
Les calculs de la section précédente donnent
kϕ∗x k2 = 2N ′ + L,
|[ϕ∗x |ϕ∗x′ ]| ≤
1
4Lkx − x′ k2
if x 6= x′
(11.7)
grâce à l’inégalité classique | sin x| ≤ 2kxk/π. Si x est fixé, nous obtenons
X
x′ ∈X
x′ 6=x
|[ϕ∗x |ϕ∗x′ ]| ≤
X
x′ ∈X
x′ 6=x
≤2
X
k≥1
1
4Lkx − x′ k2
π2
1
≤
2
4L(kδ)
12Lδ 2
car la définition de δ implique que le cas le pire qui puisse arriver pour la suite
(kx − x′ k)x′ est lorsque tous les x′ ’s sont les x + kδ où k est un entier relatif qui
25 novembre 2012
Version 2
11.3 La suite de Farey
87
prend les valeurs ±1, ±2, ±3, . . . . Nous choisissons ensuite l’entier L qui minise
presque 2N ′ + L + π 2 /(12Lδ 2), i.e.
π
L= √
(11.8)
2 3δ
où ⌈x⌉ dénote exceptionnellement ici la partie entière par valeurs supérieures de
x. Tout cela nous donne la majoration 2N ′ + L + π 2 /(12Lδ 2) ≤ N + 1 + √π3 δ −1 .
√
Nous concluons en remarquant que π/ 3 ≤ 1.82 ≤ 2.
La suite de Farey
AF
T
11.3
Dans la plupart des applications arithmétiques, l’ensemble X est tout simplement une partie de la suite de Farey et même
X = a/q, q ≤ Q, a mod∗ q
(11.9)
où Q est à paramètre à choisir et où a mod∗ q signifie ici encore que a parcourt
les classes inversibles modulo q. Si a/q et a′ /q ′ sont deux points distincts de X ,
nous avons
a a′ |aq ′ − a′ q|
1
− =
≥ ′ ≥ Q−2
(11.10)
q
q′ qq ′
qq
car aq ′ −a′ q est un entier non nul. ∗ Nous introduisons alors la notation classique
X
S(x) =
un e(na/q)
(11.11)
1≤n≤N
et affirmons que
|S(a/q)|2 ≤
DR
X X
q≤Q a mod∗ q
X
n
|un |2 (N + Q2 ).
(11.12)
C’est aussi cette inégalité que l’on désigne couramment sous le nom d’inégalité
du grand crible.
∗. En discutant selon que q = q ′ ou non, nous pourrions augmenter cette borne jusqu’à
1/(Q(Q − 1)).
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 11. L’INÉGALITÉ DU GRAND CRIBLE
DR
AF
T
88
25 novembre 2012
Version 2
Chapitre 12
12.1
AF
T
Le crible de Montgomery
L’énoncé
Commençons par un énoncé un peu difficile à comprendre au départ, parce
que long.
Théorème 12.1 Soit Q un réel ≥ 1. Nous nous donnons un ensemble P de
nombres premiers ≤ Q et pour chaque p dans P un sous-ensemble Ωp de Z/pZ
de cardinal ω(p). Soit Q l’ensemble des entiers sans facteurs carrés et dont tous
les facteurs premiers appartiennent à P. Soit enfin Z le nombre d’entiers dans
l’intervalle [M +1, M +N ] qui ne sont dans aucun Ωp lorsque nous les réduisons
modulo p. Nous avons
Z ≤ (N + Q2 )/L
avec
L=
X
Y
DR
q∈Q
µ2 (q)
p|q
ω(p)
.
p − ω(p)
Quelques exemples :
1. Choisissons Ωp = {0} pour tout p ≤ Q. Les entiers qui ne sont dans aucun
Ωp quand p ≤ Q sont simplement les entiers qui ne sont divisibles par
aucun p ≤ Q. Ceci contient en particulier les nombres premiers > Q. Il
vient alors
.X
# p ∈] min(Q, M + 1), M + N ] ≤ (N + Q2 )
µ2 (q)/ϕ(q).
q≤Q
et le lecteur √
sait ici en déduire que #{p ∈ · · · } ≤ (N +Q2 )/ log Q. En choisissant Q = N / log N , nous retrouvons le théorème de Brun-Titchmarsh !
2. Choisissons Ωp = {0, −2} pour tout p ≤ Q. Les entiers qui ne sont dans
aucun Ωp quand p ≤ Q sont simplement les entiers n tels que ni n ni n + 2
ne sont divisibles par un p ≤ Q. Ceci contient en particulier les nombres
premiers p > Q tels que p + 2 soit aussi premier. Il vient alors
# p ∈] min(Q, M + 1), M + N ], p + 2 premier
.X
Y 2
.
≤ (N + Q2 )
µ2 (q)
p−2
q≤Q
p|q,
p6=2
CHAPITRE 12. LE CRIBLE DE MONTGOMERY
90
Nous laissons le lecteur conclure.
Remarques : les notations Ωp et ω(p) sont traditionnelles. Elles n’ont rien à
voir avec les nombres de facteurs premiers, compté ou non avec multiplicité !
Preuve du théorème 12.1. Soit N la suite des entiers de [M + 1, M + N ] qui ne
sont dans aucun Ωp pour p dans notre suite P. Soit alors (un )M+1≤n≤M+N une
suite quelconque de nombres complexes dont nous supposons que
n∈
/ N =⇒ un = 0.
AF
T
Considérons le polynôme trigonométrique
X
S(α) =
un e(nα).
n∈N
Le point central de la preuve consiste à que, pour tout q ∈ Q, nous avons
X
1≤a≤q,
pgcd(a,q)=1
|S(a/q)|2 ≥ |S(0)|2 J(q),
J(q) =
Y
p|q
ω(p)
.
p − ω(p)
(12.1)
Remarquons tout d’abord que, si (12.1) a lieu pour q et q ′ , et que q et q ′ sont
premiers entre eux, alors cette inégalité a lieu pour qq ′ . En effet le théorème
chinois (voir l’exercice 10) nous permet d’écrire
X
c 2
=
S
qq ′
1≤c≤qq′ ,
pgcd(c,qq′ )=1
X
X
a
b 2
+ ′ .
S
q
q
1≤a≤q,
1≤b≤q′ ,
pgcd(a,q)=1 pgcd(b,q′ )=1
Soit alors a fixé et remarquons que
a
X
b
=
an e(na/q)e(nb/q ′ ).
q′
DR
S
q
+
n∈N
Le fait que (12.1) soit vrai pour q ′ nous donne, en changeant un en un e(na/q) :
X
a
a 2
b 2
+ ′ ≥ J(q ′ )|S
S
q
q
q
1≤b≤q′ ,
pgcd(b,q′ )=1
Il suffit alors d’appliquer (12.1) pour q pour obtenir la multiplicativité requise.
Il nous suffit donc de démontrer la propriété lorsque q est un nombre premier,
disons p. Dans ce cas
X
X
X
an .
|S(a/q)|2 = p
|S(b; p)|2 − |S(0)|2 où S(b; p) =
1≤a≤p,
pgcd(a,p)=1
b mod p
n≡b[p]
Dans le membre de droite, nous remarquons que nous pouvons restreindre b à
b ∈ Z/pZ \ Ωp . L’inégalité de Cauchy-Schwartz nous garantit que
X
X
2
|S(0)|2 = S(b; p) ≤ (p − ω(p))
|S(b; p)|2
b mod p
b∈Z/pZ\Ωp
25 novembre 2012
Version 2
12.2 Applications
91
et donc,
X
1≤a≤p,
pgcd(a,p)=1
|S(a/q)|2 ≥
p
− 1 |S(0)|2 ,
p − ω(p)
ce que nous recherchions. Nous pouvons alors employer l’inégalité du grand
crible, c’est à dire l’inégalité (11.12). Cela nous donne
X
X
|S(0)|2
µ2 (q)J(q) ≤
|an |2 (N + Q2 ).
n
q∈Q
12.2
AF
T
Nous choisissons alors an = 1 lorsque n ∈ N et an = 0 sinon. La conclusion est
facile.
Applications
Théorème 12.2 Soit h > 1 un entier pair. Nous avons, quand x tend vers
l’infini :
# p ≤ x, p + h premier
≤ 8(1 + o(1))
Y
1−
p≥3
Y p−1
x
1
.
2
(p − 1)
p − 2 (log x)2
2<p|h
Théorème 12.3 Nous avons, quand x tend vers l’infini :
# p ≤ x, p + 2 et p + 6 premiers ≪
x
.
(log x)3
L’application qui suit nécessite le chapitre 13.
DR
Théorème 12.4 Nous avons, quand x tend vers l’infini :
# p ≤ x, p2 − 2 premier ≪
x
.
(log x)2
Exercice 114. Montrer que , quand x tend vers l’infini :
# p ≤ x, (p2 + 1)/2 premier ≪
x
.
(log x)2
Exercice 115. Considérons le nombre r(N ) de représentations de l’entier
pair N comme somme de deux nombres premiers, soit
X
r(N ) =
log p1 log p2 .
p1 +p2 =N
Montrer que
N
log2 N
Y
=2
1−
r(N ) ≤ (8 + o(1)) S(N )
avec
Y p−1
S(N ) = S∞
p−2
p|N
p6=2
Le cours de Nouakchott
et
S∞
p≥3
1
(p − 1)2
.
25 novembre 2012
CHAPITRE 12. LE CRIBLE DE MONTGOMERY
92
Exercice 116. Soit A la suite des entiers pairs qui sont somme de deux
nombres premiers et
A(X) = #{a ∈ A, a ≤ X}.
Montrer que A(X) ≫ X, c’est à dire que l’ensemble des entiers qui sont
sommes de deux nombres premiers à une densité inférieure strictement positive.
P
Indication : Le lecteur pourra partir de R =
n≤X r(n) et s’inspirer de
l’exercice 74 pour en donner un asymptotique. Par ailleurs, l’inégalité de
Cauchy-Schwartz donne
X
R2 ≤ A(X)
r2 (n)
AF
T
n≤X
DR
où l’on majorera la seconde somme à l’aide du résultat de l’exercice ?? ou ??.
Pour majorer
P la somme arithmétique résultante, le lecteur pourra se ramener
à majorer n≤X S(n)2 /n.
25 novembre 2012
Version 2
Chapitre 13
13.1
AF
T
Nombres premiers en
progressions arithmétiques :
une introduction
Le groupe multiplicatif de
Z/qZ
L’ensemble quotient Z/q Z est naturellement muni d’une structure d’anneau.
L’addition est donnée par
(a mod q) + (b mod q) = (a + b mod q)
ce qui fait sens parce que cela ne dépend pas ni choix du représentant a dans
Z, ni de celui de b. Le produit est défini de la même façon :
DR
(a mod q) · (b mod q) = (a · b mod q)
Cette définition est aussi cohérente parce qu’elle ne dépend pas des choix de a
et b. Voilà pour ce qui est des rappels de la théorie classique.
Si a est premier à q, tout autre représentant a′ de la classe de a modulo q est
aussi premier à q. Il s’agit donc d’une propriété de la classe a mod q. Soit (Z/q Z)×
l’ensemble des classes premières à q. Il se trouve que si nous multiplions deux
tels éléments, la classe résultante est encore première à q. Il n’est pas difficile
d’en conclure que ((Z/q Z)× , ·) est un groupe abélien fini dont l’élément neutre
est 1 mod q, et de cardinal ϕ(q). Le théorème de Lagrange nous garantit donc
que
∀a ∈ (Z/q Z)× , aφ(q) ≡ 1[q].
En 1837, pour étudier les nombres premiers dans les progressions arithmétiques,
le mathématicien allemand Johann (Peter Gustav Lejeune) Dirichlet introduisit
les caractères de Dirichlet modulo q : il s’agit ici des fonctions χ : Z/q Z 7→ C
qui sont telles que
χ(x) = 0 ssi x ∈
/ (Z/q Z)×
et ∀(x, y), χ(xy) = χ(x)χ(y).
Si χ est un caractère de Dirichlet modulo q, nous avons
χ(1) = 1
et ∀a/ pgcd(a, q) = 1,
χ(a)φ(q) = 1
CHAPITRE 13. PREMIERS DANS LES PROGRESSIONS
94
ce qui fait que les valeurs non nulles de χ sont des racines de l’unité. La théorie
des caractères de Dirichlet se développe ensuite dans deux directions : tout
d’abord vers les représentations de (Z/q Z)× de dimension 1, et ensuite vers la
dualité de Pontryagin. Nous n’aborderons rien de tout cela ici et nous contenterons d’exemples !
Exercice 117. Montrer que l’ensemble des caractères de Dirichlet modulo q
est un groupe abélien fini, lorsque le produit de χ1 et χ2 est simplement donné
par (χ1 χ2 )(n) = χ1 (n)χ2 (n).
Exercice 118. On dit qu’un entier est un nombre de Carmichael si n n’est
pas premier mais, pour tout a entier, on a an ≡ a[n].
AF
T
⋄ 1 ⋄ Démontrer le théorème de Korselt : n est un nombre de Carmichael si
et seulement si -1) n est sans facteur carré et (2) pour tout facteur p de n,
l’entier p − 1 divise n − 1.
⋄ 2 ⋄ Démontrer que 561 est un nombre de Carmichael (c’est le plus petit).
13.2
Les caractères de Dirichlet modulo 3 et modulo 4
Le seul caractère non constant modulo 4 est
∀n ≡ 1[2],
χ4 (n) = (−1)(n−1)/2 .
Voici une propiété que nous allons utiliser très souvent :
X
χ4 (n) = 0.
(13.1)
M<n≤M+4
DR
Le seul caractère non constant modulo 3


0
χ3 (n) = 1


−1
Et nous avons encore
X
est
si n ≡ 0[3],
si n ≡ 1[3],
si n ≡ 2[3].
χ3 (n) = 0.
(13.2)
M<n≤M+3
Exercice 119. Montrer que les deux caractères non constants modulo 8 sont
donnés par
2
2
∀n ≡ 1[2], χ8 (n) = (−1)(n −1)/8 , χ4 χ8 (n) = (−1)(n−1)/2+(n −1)/8 .
Nous considérons alors les deux séries L de Dirichlet définies par
L(s, χ3 ) =
X χ3 (n)
,
ns
n≥1
L(s, χ4 ) =
X χ4 (n)
.
ns
(13.3)
n≥1
Ces deux sommes convergent en s = 1 en vertu de (13.1) et (13.1). Il va se
révéler crucial de montrer que L(1, χ3 ) et L(1, χ4 ) sont non nuls. Voici le lemme
qui va nous permettre de les calculer :
25 novembre 2012
Version 2
13.2 Les caractères de Dirichlet modulo 3 et modulo 4
95
Lemme 13.1 Soit α ∈]0, 1[ est un nombre réel. Nous avons
lim
K→∞
X e(kα)
= − log |2 sin πα| + i( 12 − α)π.
k
1≤k≤K
Démonstration. Le série en question converge vers − log(1 − e(α). C’est plutôt
le rôle du cours d’analyse de s’occuper de cela, mais voici une preuve, qui part
du prolongement explicite du logarithme :
log(x + iy) = log
p
x2 + y 2 + 2i arctan
y
p
x + x2 + y 2
x + iy ∈ C \ R− .
AF
T
Ici, avec β = πα, nous avons x = 1 − cos β = 2 sin2 (β/2), puis x2 + y 2 =
4 sin2 (β/2) et y = − sin β = −2 sin(β/2) cos(β/2). Il vient
log(1 − e(α)) = log |2 sin(β/2)| + 2i arctan
− cos(β/2)
.
sin(β/2) + 1
Nous posons alors t = tan(β/4), et avec cos(β/2) = (1−t2 )/(1+t2 ) et sin(β/2) =
2t/(1 + t2 ), nous trouvons que
arctan
sin(β/4) − cos(β/4)
sin((β − π)/4)
− cos(β/2)
= arctan
= arctan
.
sin(β/2) + 1
sin(β/4) + cos(β/4)
cos((β − π)/4)
Finalement, nous obtenons
DR
log(1 − e(α)) = log |2 sin(β/2)| + i(α − 21 )π.
Théorème 13.2
π
L(χ3 ) = √ ,
3 3
L(χ4 ) =
π
.
4
(13.4)
Démonstration. Nous avons
√
χ3 (n) = (e(n/3) − e(2n/3))/(i 3)
(13.5)
ce que nous vérifions en chaque point n à partir de
√
−1 + i 3
,
e(1/3) =
2
√
−1 − i 3
e(2/3) =
.
2
De même, nous vérifions que
χ4 (n) = (e(n/4) − e(3n/4))/(2i).
(13.6)
Le lemme 13.1 nous donne
X e(k/3)
π
π = − log2 sin + i ,
k
3
6
k≥1
Le cours de Nouakchott
X e(2k/3)
π
2π = − log2 sin
−i .
k
3
6
k≥1
25 novembre 2012
CHAPITRE 13. PREMIERS DANS LES PROGRESSIONS
96
La conclusion est alors facile. Je tiens à faire remarquer qu’il est facile de vérifier
numériquement notre résultat ; en effet une sommation par parties nous donne
directement
X e(k/3)
X e(k/3) Z ∞ X
dt
=
+
e(k/3) 2
k
k
t
K+1
k≥1
1≤k≤K
K<k≤t
X e(k/3)
=
+ O∗ (1/(K + 1)).
k
1≤k≤K
13.3
AF
T
En prenant K = 100 par exemple et en calculant avec GP/Pari, nous obtenons
une bonne approximation du résultat annoncé.
Les théorèmes de Mertens modulo 3 et 4
Cette partie commence en remarquant que les caractères de Dirichlet sont
des fonctions multiplicatives, ce qui nous donne
L(s, χ) =
Y
p≥2
1
1−
(ℜs > 1).
χ(p)
ps
Exercice 120.
⋄ 1 ⋄ Montrer que, pour χ = χ3 ou χ4 et ℜs > 1, nous avons
−
X χ(n)Λ(n)
L′
.
(s, χ) =
L
ns
n≥1
DR
⋄ 2 ⋄ Montrer que, pour χ = χ3 ou χ4 et s > 1, nous avons
log L(s, χ) =
X χ(n)Λ(n)
.
ns log n
n≥2
Voici une invention de Dirichlet :
Lemme 13.3 Nous avons, si n est premier à 3 :
1n≡1[3] = (1(n) + χ3 (n))/2,
1n≡2[3] = (1(n) − χ3 (n))/2.
De même, si n est premier à 2 :
1n≡1[4] = (1(n) + χ4 (n))/2,
1n≡3[4] = (1(n) − χ4 (n))/2.
Ce lemme permet d’écrire la fonction caractéristique des progressions arithmétiques concernées sous la forme d’une combinaison linéaire de fonctions
multiplicatives.
Nous pouvons commencer la preuve à proprement parler, voir (Mertens,
1897). La version moderne de cette preuve se trouve dans (Ramaré, 2002)
Lemme 13.4 Pour χ = χ3 ou χ4 , nous avons
L(1, χ) =
X χ(n)
+ O(1/x),
n
n≤x
25 novembre 2012
−L′ (1, χ) =
X χ(n) log n
+ O(log(2x)/x).
n
n≤x
Version 2
13.3 Les théorèmes de Mertens modulo 3 et 4
97
Démonstration. Utiliser une sommation par parties à chaque fois.
Lemme 13.5 Pour χ = χ3 ou χ4 , nous avons
X Λ(n)χ(n)
−L′ (1, χ)
=
+ O(log(2x)/x).
L(1, χ)
n
n≤x
Démonstration. Nous partons de
−L′ (1, χ) =
X χ(n) log n
+ O(log(2x)/x)
n
n≤x
AF
T
et utilisons log = 1 ⋆ Λ. Cela donne
−L′ (1, χ) =
X χ(ℓ)Λ(ℓ) X χ(m)
+ O(log(2x)/x).
ℓ
m
ℓ≤x
m≤x/ℓ
Le lemme précédent nous donne alors
−L′ (1, χ) = L(1, χ)
X χ(ℓ)Λ(ℓ)
ℓ
ℓ≤x
+O
X
ℓ≤x
Λ(ℓ)/x + O(log(2x)/x).
Le théorème de Tchebyscheff ainsi que la non-annulation de L(1, χ) nous permet
de conclure.
Théorème 13.6 Nous avons
X Λ(n)
=
n
n≤x,
n≡1[3]
1
2
log x + O(1),
X Λ(n)
=
n
1
2
log x + O(1),
1
2
log x + O(1).
n≤x,
n≡2[3]
DR
et de même concernant les nombres premiers modulo 4
X Λ(n)
=
n
1
2
n≤x,
n≡1[4]
log x + O(1),
X Λ(n)
=
n
n≤x,
n≡3[4]
Démonstration. Nous écrivons, à l’aide du lemme 13.3,
X Λ(n)
=
n
n≤x,
n≡1[3]
1
2
X
n≤x,
pgcd(n,3)=1
Λ(n)
+
n
1
2
X
n≤x,
pgcd(n,3)=1
Λ(n)χ3 (n)
.
n
La contribution des puissances de 3 à la première somme est O(1). Nous utilisons
le lemme 5.6 pour la première somme et le lemme 13.5 pour la seconde. Il est
facile de conclure.
Exercice 121.
⋄ 1 ⋄ Montrer qu’il existe deux constantes c1 , c2 > 0 telles que, pour x ≥ 7,
X
Λ(n) ≥ c1 x.
c2 x ≥
n≤x,
n≡1[3]
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 13. PREMIERS DANS LES PROGRESSIONS
98
⋄ 2 ⋄ Montrer qu’il existe deux constantes c1 , c2 > 0 telles que, pour x ≥ 3,
X
Λ(n) ≥ c1 x.
c2 x ≥
n≤x,
n≡2[3]
⋄ 3 ⋄ Montrer qu’il existe deux constantes c1 , c2 > 0 telles que, pour x ≥ 5,
X
c2 x ≥
Λ(n) ≥ c1 x.
AF
T
n≤x,
n≡1[4]
⋄ 4 ⋄ Montrer qu’il existe deux constantes c1 , c2 > 0 telles que, pour x ≥ 3,
X
c2 x ≥
Λ(n) ≥ c1 x.
n≤x,
n≡3[4]
Le lecteur lira aussi (Bordellés, 2005) avec bénéfice.
13.4
Un exemple
Considérons la fonction multiplicative h définie par
h(pk ) = 1
DR





2k
h(p ) = 1
h(p
2k+1
)=1
si k ≥ 1
et p ≡ 1, 2[4],
si k ≥ 0
et p ≡ 3[4],
si k ≥ 1
et p ≡ 3[4],
qui est en fait la fonction caractéristique des sommes de deux carrés. Avec
g(d) = h(d)/d, nous constatons que les hypothèses du théorème 2 sont vérifiées
pour κ = 12 ce qui nous donne
X h(d)
= C (log D)1/2 1 + O(1/ log D)
d
d≤D
pour une certaine constante C > 0.
Exercice 125. Montrer que, pour n ≥ 1, nous avons
X
µ(b) log ℓ = Λ(n).
bℓ=n
25 novembre 2012
Version 2
13.4 Un exemple
99
Exercice 126. (P. Gallagher et R. Vaughan) Soit une fonction quelconque
gP ≥ 0 et y et z deux paramètres réels positifs. Montrer que la somme
n Λ(n)g(n) égale
X
X
wℓ g(ℓm)
(un − vn )g(n) +
n≤P
yz<ℓ≤P/z
yz<m≤P/(yz)
lorsque P > 4z et avec
X
un =
µ(b) log(n/b) , vn =
µ(b)Λ(c)
bc|n
b≤y,c≤z
AF
T
b|n
b≤y
X
wℓ =
X
µ(b)Λ(c).
bc=ℓ
b>y,c>z
Exercice 127. (Yu Linnik) Montrer que pour K entier pair, et une fonction
quelconque g ≥ 0, nous avons :
X Λ(n)
n
log n
g(n) ≥
X (−1)k+1 X
τk∗ (n)g(n)
k
n
1≤k≤K
où τk∗ (n) est le nombre de k-uplets (d1 , d2 , . . . , dk ) d’entiers strictement
supérieurs à 1 tels que d1 d2 . . . dk = n.
Montrer que, pour K impair, l’inégalité inverse a lieu.
Indication : Commençer par l’inégalité :
DR
Λ(n) ≥ T (n) = Λ(n) −
Le cours de Nouakchott
X
∗
Λ(ℓ)τK
(a).
ℓa=n
25 novembre 2012
CHAPITRE 13. PREMIERS DANS LES PROGRESSIONS
DR
AF
T
100
25 novembre 2012
Version 2
Chapitre 14
AF
T
Exercices
Exercice 128. On using the proof of (3.1) but replacing (3.2) by (7.10), show
that
X ϕ(n) log n
(log(2X))2
= C1 log2 X + C2 log X + C3 + O
n
n
X
n≤X
for some constants C1 , C2 and C3 .
Exercice 129. Soit d un entier ≥ 1 et N un réel ≥ 0. Montrer que
X
µ(n)/n ≤ 1.
n≤N,
(n,d)=1
DR
Indication : Soit d′ le produit P
des nombres premiers ≤ N qui sont aussi
premiers à d. Étudier la quantité n≤N,(n,d′ )=1 1 en utilisant
X
µ(ℓ) =
ℓ|n,
ℓ|d′
(
1
0
si pgcd(n, d′ ) = 1,
sinon.
On pourra supposer x entier.
Exercice 130. Donner une majoration de
X µ(n)
x log n
n
n≤x
à partir de
P
nm≤x µ(n)d(m).
Exercice 131. Montrer que, pour tout entier n, nous avons
X
µ(d)µ(e) = µ(n).
d,e≥1,
[d,e]=n
CHAPITRE 14. EXERCICES
102
Exercice 132. Montrer que nous avons
X µ(d)µ(e)
6
= 2.
[d, e]2
π
d,e≥1
Exercice 133. Montrer en utilisant l’inégalité de Brun-Titchmarsh, le
théorème de Bombieri-Vinogradov et l’exercice 105 qu’il existe B tel que
X
3ω(d) max max ψ(y; q, a) − y/ϕ(q) ≪ X/ logA X
y≤X a mod ∗ q
q≤Q
√
X/(log X)B .
AF
T
pour Q =
Indication : Utiliser l’inégalité de Cauchy-Schwartz et l’exercice 105.
Exercice 134. Montrer que pour tout caractère χ modulo q de conducteur f,
nous avons
χ(n) =
τf (χ∗ , 1)ϕ(q)
q
X
d|q,
f|d,(f,d/f)=1
µ(d/f)χ∗ (d/f)
ϕ(d)
X
χ(a) e(−na/d)
a mod ∗ d
où χ∗ est le caractère induit par χ modulo f.
Indication : Utiliser le théorème ??.
Exercice 135. Soit χ un caractère modulo q de conducteur f. Montrer que
p Y
X
√
(2 − 1/p) log q ≪ q log q.
χ(n) ≪ f
n≤N
p|q,
p∤f
DR
Indication : Utiliser l’exercice 134.
Exercice 136. Soit χ un caractère de Dirichlet primitif modulo q. Montrer
que

X

2
sin πm si χ(−1) = 1,
χ(m)
log


q −τ (χ)  1≤m≤q/2
L(1, χ) =
X
2m
q 

iπ
χ(m) 1 −
si χ(−1) = −1,



q
avec τ (χ) =
P
a mod q
1≤m≤q/2
χ(a) e(a/q).
Indication : Développer
le caractère χ en termes
additifs mo des caractères
P
+ iπ 1 − 2m .
dulo q et utiliser n≥1 e(na/q)/n = logsin πm
q
q
Exercice 137. Montrer que |L(1, χ)| ≤ log q + O(1) où χ est un caractère de
Dirichlet modulo q.
Indication : Utiliser une intégration P
par parties pour exprimer L(1, χ) −
P
n≤t χ(n), puis choisir N de façon
n≤N χ(n)/n en fonction de S(t) =
optimale. Remarquons ici qu’en utilisant l’exercice 134, nous pourrions obtenir
la majoration |L(1, χ)| ≤ 12 log q + O(log log q).
25 novembre 2012
Version 2
103
Exercice 138. Montrer que |L( 21 + it, χ)| ≪ q
de Dirichlet modulo q.
p
|t| + 1 où χ est un caractère
Exercice 139. Soit χ1 et χ2 deux caractères modulo q. La somme de Jacobi
se définit par
X
Jq (χ1 , χ2 ) =
χ1 (x)χ2 (1 − x).
x mod q
Montrer que si χ1 et χ2 sont primitifs modulo q, alors
Jq (χ1 , χ2 ) = τq (χ1 , 1)τq (χ2 , 1)τq (χ1 χ2 , 1)/q.
AF
T
Montrer que lorsque χ est de conducteur f, nous avons
Y
Jq (χ, χ) = µ(f)χ(−1) (p − 2).
p|q,
p∤f
Exercice 140. Soit p un nombre premier ≡ 1[4]. Montrer qu’il existe un
caractère primitif χ d’ordre 4 modulo p. Montrer que pour ce caractère, Jp (χ, χ)
√
est de modulo p. En déduire que p peut s’écrire comme une somme de deux
carrés d’entiers.
Indication : Utiliser l’exercice 139 et déterminer l’ensemble des valeurs prises
par χ.
Exercice 141. Montrer qu’il existe une constante C > 0 telle que
Y
1 − 1/p ∼ C(log X)−1/2 .
DR
p≤X,
p≡2[3]
Indication : Utiliser le théorème de Siegel-Walfish.
Exercice 142. Montrer que pour Y ≥ 10 et σ > 0, nous avons
Y
(1 + p−σ ) ≪σ exp Y max(0,1−σ) log log Y .
p≤Y
Indication : Passer aux logarithmes pour se ramener à la somme de 1/pσ .
Pour évaluer cette dernière, traiter séparément les cas 1 − σ ≤ 1/ log Y et
1 − σ > 1/ log Y .
Exercice 143. Montrer que
X µ(d)
N log
≪ 1.
d
d
d≤N
Indication : On pourra partir de
µ ⋆ log = Λ.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 14. EXERCICES
104
Exercice 144.
⋄ 1 ⋄ Montrer que, lorsque α ∈ [0, 1[, nous avons
log(1 − e(α)) =
X e(kα)
= log(2 sin πα) + iπ(α − 21 ).
k
k≥1
(On rappelle que e(α) = exp(2iπα)).
AF
T
⋄ 2 ⋄ Soit χ un caractère de Dirichlet primitif modulo q. Montrer que
∀n ∈ Z,
où
χ(n) =
τ (χ) X
χ(m)e(mn/q)
q
m mod q
τ (χ) =
X
χ(a)e(−a/q).
a mod q
Établir que |τ (χ)| =
√
q.
DR
⋄ 3 ⋄ Montrer que si χ est un caractère de Dirichlet primitif modulo q > 1,
alors

iπτ (χ) X


mχ(m)
lorsque χ(−1) = −1,

 q2
1≤m≤q
L(1, χ) = τ (χ) X
m


lorsque χ(−1) = 1.
χ(m) log sin

 q
q
1≤m≤q
Exercice 147.
P
σ
⋄ 1 ⋄ Montrer que la série
n≥1 µ(n)/n est convergente pour σ ≥ 1 et
représente une fonction continue.
⋄ 2 ⋄ Montrer qu’il existe une constante c′ > 0 telle que, pour tout x ≥ 2, nous
avons
X
µ(n)/n = O 1/ log x .
n≤x
⋄ 3 ⋄ Comparer la série de Dirichlet de µ(n)/ϕ(n) à 1/ζ(s + 1) et montrer
qu’il existe une constante c′′ > 0 telle que
X µ(n)
= O 1/ log x .
ϕ(n)
n≤x
Indication : On pourra utiliser la méthode de convolution.
25 novembre 2012
Version 2
105
Exercice 148. Il s’agit de montrer que le nombre d’entiers ≤ N dont tous
les facteurs sont ≤ N ε est ≫ε N .
Soit ǫ = 1/k, où k ≥ 1 est un entier. Soit S l’ensemble des entiers qui n’ont
que des facteurs ≤ N ǫ . Et Z le nombre d’entre eux qui sont ≤ N .
XX
log p, montrer que
⋄ 1 ⋄ En partant de Z log N ≥
n∈S, p|n
n≤N
Z log N ≥ C6 N
X
1/n − C7 Z
n∈S,
N 1−ǫ <n≤N
AF
T
pour des constantes strictement positives C6 et C7 .
⋄ 2 ⋄ La minoration de la somme de 1/n pour n dans S et dans l’intervalle
ci-dessus va suivre le même chemin, mais nécessite une récurrence dont voici
l’élément clé : il existe deux constantes c1 = c1 (ǫ) et N0 = N0 (ǫ) telles que
pour tout ℓ ∈ {0, . . . , k − 1} et N ≥ N0 , nous avons
X
X
1/n ≥ c1
1/n.
(14.1)
n∈S,
2ℓ N 1−(ℓ+1)/k <n≤N 1−ℓ/k
n∈S,
2ℓ+1 N 1−(ℓ+2)/k <n≤N 1−(ℓ+1)/k
Montrer cette inégalité.
⋄ 3 ⋄ En utilisant (14.1), montrer par récurrence que
X
X
1/n ≥ c1k−1
1/n.
n∈S,
2k−1 <n≤N 1/k
DR
n∈S,
N 1−1/k <n≤N
Cette dernière quantité est ≫ log N ǫ puisque la condition n ∈ S y est superflue.
En conclure que
(log N + C7 )Z ≫ǫ N log N
ce que nous cherchions à démontrer.
Le cours de Nouakchott
25 novembre 2012
CHAPITRE 14. EXERCICES
DR
AF
T
106
25 novembre 2012
Version 2
Notations
AF
T
Toutes les notations utilisées sont standards . . . d’une façon ou d’une autre !
En voici quelques unes :
— kak désigne la norme L2 , mais kuk désigne aussi la distance au plus proche
entier.
— e(y) = exp(2iπy).
— La lettre p pour une variable implique toujours que celle-ci est un nombre
premier.
— Nous notons [d, d′ ] le ppcm et (d, d′ ) le pgcd des entiers d et d′ .
— |A| désigne le cardinal de l’ensemble A et 1A sa fonction caractèristique.
Oui, bien sûr, |s| est aussi le module du nombre complexe s.
— qkd signifie que q divise d de telle sorte que q et d/q soit premiers entre
eux. Nous énoncerons : q divise exactement d.
Q
Q
i
est i pi , soit encore le
— Le noyau sans facteurs carrés de d = i pα
i
produit de tous les diviseurs premiers de d.
— ω(d) est le nombre de facteurs premiers de d, comptés sans multiplicité.
DR
— ϕ(d) est la focntion d’Euler, c’est à dire le cardinal du groupe multiplicatif
de Z/dZ.
— σ(d) est le nombre de diviseurs (positifs) de d.
— µ(d) est la fonction de Moebius, c’est à dire 0 si d est divisible par un
carré > 1 et (−1)r sinon, où r = ω(d) est le nombre de facteurs premiers
de d.
— cq (n) désigne la somme de Ramanujan sum. Il s’agit de la somme des
e(an/q) sur tous les a modulo q qui sont premiers à q.
— Λ(n) est la fonction de van Mangoldt : log p si n est une puissance du
nombre premier p et 0 sinon.
— La notation de Landau f = OA (g) signifie qu’il existe une constante B
telle que |f | ≤ Bg, constante qui peut dépendre de A. Si nous mettons
plusieurs variables en indices, cela signfie tout simplement que la constante
implicite B dépend de tous ceux-là.
— La notation f = O∗ (g) signifie que |f | ≤ g, c’est à dire qu’il s’agit d’un O
mais avec une constante implicite égale à 1.
— Nous utiliserons aussi la notation de Vinogradov f ≪ g qui signifie f =
O(g). Ces deux notations seront donc pour nous équivalentes (ce n’est
pas toujours le cas en général car les notations de Landau font appel à
CHAPITRE 14. EXERCICES
108
la notion de voisinage d’un point ; en ce sens, il est correct de dire que la
notation de Vinogradov correposnd à une version uniforme de la notation
de Landau). Nous utiliserons aussi f ≪A g pour f = OA (g).
— La notation f ⋆ g désigne la convolution arithmétique,
c’est à dire la foncP
tion h sur les entiers positifs définie par h(d) = q|d f (q)g(d/q).
DR
AF
T
— π est . . . le nombre réel classique qui vaut à peu près 3.141 5 . . . ! Mais π
désigne aussi la fonction de comptage des nombres premiers et π(X) est
donc le nombre de nombres premiers inférieur ou égaux à X : par exemple
π(6) = 3. Nous éviterons cette notation si possible.
P Une autre façon de
dire la définition ci-dessus consite à écrire π(X) = p≤X 1.
P
— Les fonctionsP
de Tchebyschev ϑ et ψ valent respectivement ϑ(X) = p≤X log p
et ψ(X) =
n≤X Λ(n). Ces deux fonctions sont très proches l’une de
l’autre.
25 novembre 2012
Version 2
References
AF
T
Apostol, T.M. 1976. Introduction to analytic number theory. New York : SpringerVerlag. Undergraduate Texts in Mathematics.
Bateman, P.T., & Diamond, H.G. 2004. Analytic number theory. World Scientific
Publishing Co. Pte. Ltd., Hackensack, NJ. An introductory course.
Bombieri, E. 1971. A note on the large sieve. Acta Arith., 18, 401–404.
Bombieri, E. 1987/1974a. Le grand crible dans la théorie analytique des nombres.
Astérisque, 18, 103pp.
Bombieri, E. 1987/1974b. Le grand crible dans la théorie analytique des nombres.
Astérisque, 18, 103pp.
Bordellés, O. 2005. An explicit Mertens’ type inequality for arithmetic progressions.
J. Inequal. Pure Appl. Math., 6(3), paper no 67 (10p).
Bordellès, O. 2006. An inequality for the class number. JIPAM. J. Inequal. Pure Appl.
Math., 7(3), Article 87, 8 pp. (electronic).
Bordellès, O. 2012. Arithmetic Tales. Springer.
DR
1
1
1
1
1
1
1
1
1
1
Brun, V. 1919. La série 51 + 71 + 11
+ 13
+ 17
+ 19
+ 29
+ 31
+ 41
+ 43
+ 59
+ 61
+···
où les dénominateurs sont ”nombres premiers jumeaux” est convergente ou finie.
Darboux Bull., 43(2), 100–104, 124–128.
Cahen, E. 1894. Sur la fonction ζ(s) de Riemann et sur des fonctions analogues.
http://www.numdam.org/item?id=ASENS_1894_3_11__75_0.
Daboussi, H. 1984. Sur le théorème des nombres premiers. C. R. Acad. Sci., Paris,
Sér. I, 298, 161–164.
Daboussi, H. 1996. Effective estimates of exponential sums over primes. Analytic
number theory. Vol. 1. Proceedings of a conference in honor of Heini Halberstam,
May 16-20, 1995, Urbana, IL, USA. Boston, MA: Birkhaeuser. Prog. Math., 138,
231–244.
Daboussi, H., & Rivat, J. 2001. Explicit upper bounds for exponential sums over
primes. Math. Comp., 70(233), 431–447.
Davenport, H. 2000. Multiplicative Number Theory. third edition edn. Graduate texts
in Mathematics. Springer-Verlag.
de la Vallée-Poussin, Ch. 1899. Sur la fonction ζ(s) de Riemann et le nombre des
nombres premiers inférieurs à une limite donnée. Belg. Mém. cour. in 8◦ , LIX,
74pp.
Delange, H. 1954. Généralisation du théorème de Ikehara. Ann. Sci. Ecole Norm. Sup.
(3), 71, 213–242. http://www.numdam.org/item?id=ASENS_1954_3_71_3_213_0.
Delange, H. 1961. Un théorème sur les fonctions arithmétiques multiplicatives et ses
applications. Ann. Sci. École Norm. Sup. (3), 78, 1–29. http://www.numdam.
org/item?id=ASENS_1961_3_78_1_1_0.
REFERENCES
110
Dirichlet, P.G.L. 1937. Beweis des Satzes, das jede unbegrenzte arithmetische Progression, deren erstes Glied und Differenz ganze Zahlen ohne gemeinschaftlichen
Factor sind, unendlich viele Primzahlen enthält. Abhandlungen der Königlichen
Preussischen Akademie der Wissenschaften zu Berlin. Scan de l’article original : http://bibliothek.bbaw.de/bibliothek-digital/digitalequellen/
schriften/anzeige?band=07-abh/1837&seite:int=00000286 et traduction :
http://arxiv.org/abs/0808.1408.
Dress, F. 1983/84. Théorèmes d’oscillations et fonction de Möbius. Sémin. Théor.
Nombres, Univ. Bordeaux I, Exp. No 33, 33pp. http://resolver.sub.
uni-goettingen.de/purl?GDZPPN002545454.
AF
T
Dusart, P. 1998. Autour de la fonction qui compte le nombre de nombres premiers. Ph.D. thesis, Limoges, http\string://www.unilim.fr/laco/theses/
1998/T1998_01.pdf. 173 pp.
Elliott, P.D.T.A. 1971. On inequalities of large sieve type. Acta Arith., 18, 405–422.
Ellison, W.J. 1975. Les nombres premiers. Paris : Hermann. En collaboration avec
Michel Mendès France, Publications de l’Institut de Mathématique de l’Université
de Nancago, No. IX, Actualités Scientifiques et Industrielles, No. 1366.
Granville, A., & Soundararajan, K. 2001. The spectrum of multiplicative functions.
Ann. of Math. (2), 153(2), 407–470.
Greaves, G., & Huxley, M. 1999. One sided sifting density hypotheses in Selberg’s
sieve. Pages 105–114 of : Jutila, M. (ed), Turku symposium on number theory in
memory of Kustaa Inkeri. Turku, Finland : Berlin : de Gruyter.
Halász, G. 1968. Über die Mittelwerte multiplikativer zahlentheorischer Funktionen.
Acta Math. Acad. Sci. Hungar., 19, 365–403.
Halberstam, H., & Richert, H.E. 1971. Mean value theorems for a class of arithmetic
functions. Acta Arith., 43, 243–256.
Halberstam, H., & Richert, H.E. 1974. Sieve methods. Academic Press (London),
364pp.
DR
Halberstam, H., & Richert, H.E. 1979. On a result of R. R. Hall. J. Number Theory,
11, 76–89.
Hardy, G. H., & Riesz, M. 1964. The general theory of Dirichlet’s series. Cambridge
Tracts in Mathematics and Mathematical Physics, No. 18. Stechert-Hafner, Inc.,
New York. Première édition en 1915.
Hensley, D., & Richards, I. 1974. Primes in intervals. Acta Arith., 4(25), 375–391.
Hewitt, E., & Williamson, J.H. 1957. Note on absolutely convergent Dirichlet series.
Proc. Amer. Math. Soc., 8, 863–868.
Kahane, J.-P., & Queffélec, H. 1997. Ordre, convergence et sommabilité de produits
de séries de Dirichlet. Ann. Inst. Fourier (Grenoble), 47(2), 485–529. http:
//www.numdam.org/item?id=AIF_1997__47_2_485_0.
Lejeune-Dirichlet, P.G. 1871. Lectures on Number Theory, edited by R. Dedekind.
Second edition. (Vorlesungen über Zahlentheorie, herausgegeben von R. Dedekind.
Zweite Auflage.). Braunschweig. Vieweg . Première édition en 1863.
Levin, B.V., & Fainleib, A.S. 1967. Application of some integral equations to problems
of number theory. Russian Math. Surveys, 22, 119–204.
Mertens, F. 1897. On Dirichlet’s proof of the theorem that every infinite arithmetic
progression of integers, whose difference is prime to its members, contains infiniely
many prime numbers. (Ueber Dirichlet’s Beweis des Satzes, dass jede unbegrenzte
ganzzahlige arithmetische Progression, deren Differenz zu ihren Gliedern teilerfremd ist, unendlich viele Primzahlen enthält.). Wien. Ber., 106, 254–286.
25 novembre 2012
Version 2
REFERENCES
111
Montgomery, H.L., & Vaughan, R.C. 1973. The large sieve. Mathematika, 20(2),
119–133.
Montgomery, H.L., & Vaughan, R.C. 2006. Multiplicative Number Theory : I. Classical Theory. Cambridge Studies in Advanced Mathematics, vol. 97. Cambridge
University Press.
Moree, P. 2004. Chebyshev’s bias for composite numbers with restricted prime divisors.
Math. Comp., 73(245), 425–449.
Ramaré, O. 1995. On Snirel’man’s constant. Ann. Scu. Norm. Pisa, 21, 645–706.
http://math.univ-lille1.fr/~ ramare/Maths/Article.pdf.
Ramaré, O. 2002. Sur un théorème de Mertens. Manuscripta Math., 108, 483–494.
AF
T
Rawsthorne, D.A. 1982. Selberg’s sieve estimate with a one-sided hypothesis. Acta
Arith., 49, 281–289.
Riesel, H., & Vaughan, R.C. 1983. On sums of primes. Arkiv för mathematik, 21,
45–74.
Rosser, J.B., & Schoenfeld, L. 1962. Approximate formulas for some functions of prime
numbers. Illinois J. Math., 6, 64–94.
Schinzel, A. 1961. Remarks on the paper : Sur certaines hypothèses concernant les
nombres premiers. Acta Arith., 7(1), 1–8.
Schinzel, A., & Sierpiǹski, W. 1958. Sur certaines hypothèses concernant les nombres
premiers. Acta Arith., 4(3), 185–208.
Selberg, A. 1949. On elementary problems in prime number-theory and their limitations. C.R. Onzième Congrès Math. Scandinaves, Trondheim, Johan Grundt
Tanums Forlag, 13–22.
Selberg, A. 1991. Collected Papers. Springer-Verlag, II, 251pp.
Tenenbaum, G. 1995. Introduction à la théorie analytique et probabiliste des nombres.
Second edn. Cours Spécialisés, vol. 1. Paris : Société Mathématique de France.
van Lint, J.E., & Richert, H.E. 1965. On primes in arithmetic progressions. Acta
Arith., 11, 209–216.
DR
Vinogradov, I. M. 1954. Elements of number theory. New York : Dover Publications
Inc. Translated by S. Kravetz.
Wirsing, E. 1961. Das asymptotische Verhalten von Summen über multiplikative
Funktionen. Math. Ann., 143, 75–102.
Le cours de Nouakchott
25 novembre 2012
Index
Λ(n), 35
π(x), ψ(x), 38
132, 106
133, 106
134, 106
135, 106
136, 106
137, 106
138, 107
139, 107
14, 9
140, 107
141, 107
142, 107
143, 107
144, 108
147, 110
148, 111
15, 9
16, 9
17, 9
18, 10
19, 10
2, 6
20, 10
21, 11
24, 11
25, 12
26, 12
27, 12
28, 12
29, 13
3, 6
30, 17
31, 17
32, 17
33, 17
34, 17
35, 18
36, 18
37, 18
38, 18
39, 18
4, 6
40, 21
41, 21
AF
T
Bertrand, Joseph, 39
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
Caractère de Dirichlet, 97
Chebyshev, Pafnouty, 37, 39
Comparaison à une intégrale, 36
Dusart, Pierre, 40
DR
Euler-MacLaurin summation formula, 26
Exercice
no 1, 6
no 10, 8
no 100, 61
no 101, 61
no 102, 64
no 103, 65
no 104, 65
no 105, 68
no 106, 68
no 107, 68
no 11, 8
no 110, 71
no 111, 71
no 112, 74
no 113, 81
no 114, 95
no 115, 95
no 116, 96
no 117, 98
no 118, 98
no 119, 99
no 12, 9
no 120, 100
no 121, 102
no 125, 102
no 126, 103
no 127, 103
no 128, 105
no 129, 105
no 13, 9
no 130, 105
no 131, 105
INDEX
Montgomery H.L. & Vaughan R.C., 89
Noyau sans facteurs carrés, 115
Produit de convolution, 9
Rosser, John, 37, 40
Selberg, Atle, 87, 89
Sommation par parties, 38, 40
Somme de Jacobi, 107
Somme de Ramanujan, 74, 77, 82, 115
Stieltjes, Thomas, 38
Summation by parts, 26
AF
T
42, 22
43, 22
44, 23
47, 27
48, 27
49, 27
5, 7
52, 28
53, 28
54, 31
56, 32
61, 37
62, 38
63, 38
64, 38
65, 39
66, 40
67, 41
71, 42
72, 42
73, 42
74, 42
75, 42
76, 42
77, 43
78, 43
79, 43
8, 7
80, 43
81, 43
83, 45
84, 46
85, 46
86, 46
87, 46
91, 47
94, 48
95, 48
96, 48
97, 54
98, 54
99, 61
Uniformity in error terms, 26
DR
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
no
113
Fonction
Additive, 5
Multiplicative, 6
Fonction de Liouville, 5
Fonction de Moebius, 5
Inégalité du grand crible, 88
Méthode de Rankin, 57
von Mangoldt, Hans, 35
Mertens, Franz, 39
Le cours de Nouakchott
25 novembre 2012
INDEX
DR
AF
T
114
25 novembre 2012
Version 2
DR
AF
T
Téléchargement