AF T Moyenne de fonctions arithmétiques — Une introduction agrémentée d’exercices et d’applications au crible — DR Cours donnés à l’université de Nouakchott — Nouakchott 25 Novembre / 6 Décembre 2012 — Olivier Ramaré 25 novembre 2012 DR AF T 2 25 novembre 2012 Version 2 Introduction AF T Ce cours portera surtout sur les valeurs moyennes de fonctions arithmétiques et se poursuivra par une introduction au crible de Montgomery et des applications. Les fonctions arithmétiques sont très souvent mal connues, et possèdent un comportement qui semble irrégulier et sans cohérence. Regardons par exemple la fonction Y (p − 2). f0 (n) = p|n Si la suite de sesP valeurs semble très erratique, régularité apparaı̂t lorsque l’on considère (1/X) n≤X f0 (n). Nous allons en effet démontrer que Théorème Soit X un réel positif. Nous avons X (1/X) f0 (n) = C X + O(X 3/4 ) n≤X 3 p(p + 1) DR où la constante C est donnée par Y 1 C = 2 1− p≥2 = 0.14630 · · · Remarquons que dans cet énoncé et de façon systématique dans la suite, la lettre p désigne un nombre premier. L’ordre moyen a pour effet de dissimuler certaines valeurs aberrantes prises par la fonction considérée. Nous continuerons ce cours par des applications au crible et nous établirons par exemple le théorème de Brun-Titchmarsh (sous une forme légèrement plus faible) : Théorème Pour M et N deux entiers ≥ 1, le nombre de nombres premiers dans l’intervalle [M + 1, M + N ] est au plus 2N/ log N . D’autres applications concerneront les nombres premiers jumeaux, la conjecture de Goldbach et bien d’autres problèmes concernant les nombres premiers. Le lecteur pourra consulter les livres (Apostol, 1976) ou (Ellison, 1975). Les livres (Bombieri, 1987/1974a) et (Halberstam & Richert, 1974) sont deux autres références incontournables. D’autres très bons livres : (Vinogradov, 1954), (Davenport, 2000), (Montgomery & Vaughan, 2006) et (Bordellès, 2012). 2 Un calendrier : Dimanche 25/11 – 2h Introduction, bestiaire, produit de convolution et multiplicativité. (a) Introduction : régularité en moyenne. Fonctions multiplicatives. Bestiaire. (b) Multiplicativité de la fonction de diviseurs (c) Convolution de fonctions multiplicatives Après midi, 2h : fonction ζ de Riemann, abscisse de convergence absolue, unicité des coefficients de Dirichlet, convolution arithmétique. Lundi 26/11 – 2h (a) Sommer des fonctions lisses (b) Le principe de l’hyperbole de Dirichlet AF T (c) Valeur moyenne de µ2 (n). Après midi, 2h : Valeur moyenne du pgcd, suite des séries de Dirichlet : multiplicativité. Mardi 27/11 – 2h Estimations de Mertens (a) Nombres premiers, (b) Estimation de Mertens, sommation par parties, (c) Théorème de Tchebysheff. Après midi, 2h : taille de la fonction de diviseurs. Exercices sur les applications et le théorème de Hall en majoration. Mercredi 28/11 Jour férié. Jeudi 29/11 – 2h Méthode de convolution (a) Via un exemple, (b) Le lemme usuel. Des applications. Après midi, 2h : Questions, corrections. Vendredi 28/11 Jour férié. Samedi 1/11 – 2h Théorème de Levin Fainleib DR (a) Le théorème, (b) Des applications. Pas d’exercice l’après midi Dimanche 2/11 – 2h Introduction au crible, Le théorème de Brun Titchmarsh via l’inégalité de Selberg. Après midi, 2h : l’inégalité du grand crible. Lundi 3/12 – 2h Le crible de Montgomery, applications. Après midi, 1h30 : Applications. Mardi 4/12 – 2h Le groupe multiplicatif de Z/qZ (a) Les notions. Les caractères modulo 3 et 4, χ3 (−1) = −1 = χ4 (−1). Nonannulation de L(1, χ3 ) et L(1, χ4 ). (b) Nombres premiers en progressions arithmétiques par la méthode de Mertens. Après midi, 1h30 : equation fonctionnelle de la fonction θ, et celle de ζ. Exercice sur le groupe multiplicatif modulo 5. Mercredi 5/12 – 2h – Selon ce qui a été fait. Après midi, 1h. Jeudi 6/12 – 2h Devoir surveillé. Au total : 32 heures 25 novembre 2012 Version 2 Table des matières Introduction 1 AF T Table des matières 1 Convolution arithmétique 1.1 Bestiaire . . . . . . . . . . . . . . . . . . 1.2 Fonctions multiplicatives . . . . . . . . . 1.3 La fonction nombre de diviseurs . . . . . 1.4 Convolution et fonctions multiplicatives 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 8 9 2 Initiation aux séries de Dirichlet 2.1 Abscisse de convergence absolue . . . . . . . 2.2 Séries de Dirichlet et produit de convolution 2.3 La fonction ζ de Riemann. . . . . . . . . . . 2.4 Série de Dirichlet et multiplicativité . . . . 2.5 Quelques digressions sans preuve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 13 14 15 16 19 . . . . DR 3 Sommer des fonctions lisses 23 4 Le principe de l’hyperbole 4.1 Un premier terme d’erreur pour la moyenne nombre de diviseurs . . . . . . . . . . . . . . 4.2 Le principe de l’hyperbole de Dirichlet . . . . 4.3 Un meilleur terme d’erreur pour le nombre de de la fonction de . . . . . . . . . . . . . . . . . . . . . . diviseurs . . . . . 27 27 28 5 Les estimations de Mertens 5.1 La fonction de von Mangoldt . . . . . . . 5.2 De la fonction log à la fonction Λ . . . . . 5.2.1 Une majoration à la Chebyshev . . 5.2.2 Un théorème à la Mertens . . . . . 5.3 Un résultat de type postulat de Bertrand 5.4 Le théorème des nombres premiers . . . . . . . . . . 33 33 34 35 37 37 39 6 Nombre de diviseurs . . . . . . . . . . . . 27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 7 La méthode de convolution 47 7.1 Preuve du théorème 7.1 . . . . . . . . . . . . . . . . . . . . . . . 48 7.2 Un exercice de sommations par parties . . . . . . . . . . . . . . . 51 7.3 Être sans facteurs carrés . . . . . . . . . . . . . . . . . . . . . . . 52 TABLE DES MATIÈRES 4 8 Exemples et pratique 53 8.1 Trois exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 8.2 Un théorème général. . . . . . . . . . . . . . . . . . . . . . . . . . 56 8.3 Un quatrième exemple détaillé . . . . . . . . . . . . . . . . . . . 58 9 Le théorème de Levin-Fainleib 61 9.1 Une première borne supérieure . . . . . . . . . . . . . . . . . . . 61 9.2 Une formule asymptotique . . . . . . . . . . . . . . . . . . . . . . 63 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 69 70 71 72 73 74 75 76 77 11 L’inégalité du grand crible 11.1 Une inégalité de Parseval approchée . . . . . . 11.2 L’inégalité du grand crible . . . . . . . . . . . . 11.2.1 Une transformée de Fourier . . . . . . . 11.2.2 Preuve du théorème 11.3 (forme faible) 11.3 La suite de Farey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 83 84 85 86 87 . . . . . . . . . . . . . . . . . . AF T 10 Une approche moderne 10.1 Des nombres premiers . . . . . . . . . . . 10.2 Une approche “crible” . . . . . . . . . . . 10.3 L’inégalité de Brun-Titchmarsh . . . . . . 10.4 Considérations hermitiennes . . . . . . . . 10.5 Un peu d’arithmétique . . . . . . . . . . . 10.6 Preuve de l’inégalité de Brun-Titchmarsh 10.7 Compléments . . . . . . . . . . . . . . . . 10.8 Optimalité ? . . . . . . . . . . . . . . . . . 10.9 Des nombres premiers jumeaux . . . . . . DR 12 Le crible de Montgomery 89 12.1 L’énoncé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 12.2 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 13 Premiers dans les progressions 13.1 Le groupe multiplicatif de Z/q Z . . . . . . . . . . 13.2 Les caractères de Dirichlet modulo 3 et modulo 4 13.3 Les théorèmes de Mertens modulo 3 et 4 . . . . . 13.4 Un exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 93 94 96 98 14 Exercices 101 Notations 107 References 109 Index 114 25 novembre 2012 Version 2 Chapitre 1 AF T Convolution arithmétique Il s’agit ici d’une présentation des acteurs. 1.1 Bestiaire 1. La fonction de Moebius µ(n) vaut −1 sur chaque nombre premier et 0 sur toutes leurs puissances. 2. ϕ(n) est l’indicateur d’Euler, c’est à dire le nombre d’entiers entre 1 et n qui sont premiers à n. 3. d(n) est le nombre de diviseurs (positifs) de n. 4. σ(n) est la somme des diviseurs (positifs) de n. 5. La fonction de Liouville λ(n) = (−1)Ω(n) en est assez proche : en effet cette dernière est la fonction multiplicative qui vaut (−1)α sur chaque pα . DR 6. d(n2 ) est le nombre de diviseurs (positifs) de n2 . Il s’agit aussi d’une fonction multiplicative de n. 7. ω(n) est le nombre de diviseurs premiers de n et par exemple ω(12) = 2 puisque 2 et 3 sont les deux seuls nombres premiers divisant 12. On dit aussi “sans multiplicité” car, en fait, 22 divise aussi 12. Le nombre de diviseurs avec multiplicité est Ω(n) qui vérifie Ω(12) = 3. Ces deux fonctions sont additives, i.e. ω(nm) = ω(n) + ω(m) si (n, m) = 1 et de même pour Ω. Cette notion est bien sûr le pendant additif de la notion de fonction multiplicative introduite ci-après. 8. µ2 (n) vaut 1 si n est divisible par un carré > 1 et 0 sinon. 9. Λ(n) est a fonction de van Mangoldt 10. δn=1 ou δ1 est la fonction qui vaut 1 en n = 1 et 0 ailleurs, alors que 1 est la fonction qui vaut uniformément 1 sur tous les entiers. 11. π(X) est le nombre de nombres premiers inférieurs à X, de sorte que π(3) = 2 par exemple. Nous pouvons aussi considérer 1. la fonction ϕ2 qui à chaque entier n associe le nombre d’entiers modulo n qui sont premiers à n et tels que n + 2 qui le sont aussi, 2. la fonction qui à chaque entier n associe le nombre de carrés modulo n. CHAPITRE 1. CONVOLUTION ARITHMÉTIQUE 6 1.2 Fonctions multiplicatives Une fonction f : N \ {0} → C est dite multiplicative si ( f (1) = 1, f (mn) = f (m)f (n) (1.1) si n et m sont premiers entre eux. De façon équivalente, nous pouvons écrire Y Y f pαp = f pαp p (1.2) p AF T où le produit porte sur tous les nombres premiers et où les αp sont des entiers positifs ou nuls, dont tous sauf un nombre fini sont nuls. Cette expression montre clairement que la fonction f est complètement déterminée par sa valeur sur les entiers qui sont des puissances de nombres premiers. Réciproquement la donnée de telles valeurs détermine bien une fonction multiplicative, tout simplement en la définissant à partir de l’égalité ci-dessus. Exercice 1. Montrer que x, y et z sont trois entiers, et si x est premier à z, alors le pgcd de xy et z est égal au pgcd de y et de z, i.e. pgcd(xy, z) = pgcd(y, z). Indication : Utiliser les décompositions en facteurs premiers. Exercice 2. Soit a et b deux entiers premiers entre eux. ⋄ 1 ⋄ Montrer que pgcd(a + b, a − b) vaut 1 ou 2. Donner des exemples de chacun des cas. DR ⋄ 2 ⋄ Montrer que a + b et ab sont premiers entre eux. Cette notion de multiplicativité va s’avérer fondamentale. Nous constaterons en particulier que beaucoup de fonctions arithmétiques a priori mystérieuses se comprennent beaucoup mieux lorsque l’on regarde leurs valeurs sur les puissances de nombres premiers. Avant d’examiner des exemples, notons le lemme suivant que nous utiliserons très souvent : Lemme 1.1 Soit f une fonction multiplicative et m et n deux entiers. Nous avons f ([m, n])f ((m, n)) = f (m)f (n) où [m, n] et (m, n) désigne respectivement le ppcm et le pgcd des entiers m et n. Exercice 3. Démontrer le lemme précédent. Indication : Utiliser les décompositions en facteurs premiers. Exercice 4. ⋄ 1 ⋄ Montrer que la fonction somme de diviseurs σ est multiplicative. ⋄ 2 ⋄ Soit p un nombre premier et a ≥ 1 un entier. Montrer que σ(pa ) = pa+1 − 1 p−1 où σ(d) est la somme des diviseurs entiers positifs de d. 25 novembre 2012 Version 2 1.2 Fonctions multiplicatives 7 Exercice 5. ⋄ 1 ⋄ Montrer que si n et m sont sans facteurs carrés et distincts, alors ϕ(n) ϕ(m) 6= . m n ⋄ 2 ⋄ Montrer que la fonction n 7→ σ(n)/n vérifie la même propriété (i.e. que celle de n 7→ ϕ(n)/n exhibée à la question précédente). AF T ⋄ 3 ⋄ Que pensez-vous de la fonction n 7→ σ(n)/ϕ(n) vis à vis de cette propriété ? ⋄ 4 ⋄ Que pensez-vous de la fonction n 7→ cette propriété ? Exercice 8. Q p|n (p + 2)/(p + 1) vis à vis de ⋄ 1 ⋄ Montrer que la fonction f qui à l’entier n associe n admet la fonction g définie par g(d) = dµ(d) comme inverse de convolution. ⋄ 2 ⋄ Démontrer l’identité suivante σ(n)2 = n X σ(d2 )/d. DR d|n Exercice 10. Pour tout module r ≥ 1, nous posons o nu , 1 ≤ u ≤ r, pgcd(u, r) = 1 . Ξr = r Soit q et q ′ deux entiers premiers entre eux. Montrer que la fonction Ξqq′ Ψ : Ξq × Ξq′ → (a/q, a′ /q ′ ) 7→ (aq ′ + a′ q)/(qq ′ ) est une bijection. Indication : On vérifiera que cette fonction est injective. Pour montrer la surjectivité, ou bien on prendra un argument de cardinalité, ou bien on emploiera le théorème de Bezout : il existe deux entiers u et v tels que uq + vq ′ = 1. Le point b/(qq ′ ) de Ξqq′ est alors égal à Ψ(bv/q mod 1, bu/q ′ mod 1). Exercice 11. Soit P (X) un polynôme non constant à coefficients dans Z. Soit ρ(q) le nombre de solutions de P (x) ≡ 0[q]. Montrer que la fonction q 7→ ρ(q) est multiplicative. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 1. CONVOLUTION ARITHMÉTIQUE 8 1.3 La fonction nombre de diviseurs Commençons par détailler ce pourquoi la fonction qui à n associe son nombre de diviseurs est multiplicative. Ceci repose en fait sur la structure de l’ensemble D(n) des diviseurs de n. Tout d’abord D(pα ) = 1, p, p2 , · · · , pα−1 bigr}. (1.3) AF T Ensuite, si p1 et p2 sont deux nombres premiers distincts, chaque diviseur du β1 β2 1 α2 produit pα 1 p2 est de la forme p1 p2 avec 0 ≤ β1 ≤ α1 et 0 ≤ β2 ≤ α2 . Par 1 α2 ailleurs, chaque entier de cette forme est bien un diviseur de pα 1 p2 . Ceci nous donne 2 1 1 α2 (1.4) · D pα = D pα D pα 2 . 1 1 p2 Nous montrons de la même façon que D(mn) = D(m) · D(n) si m et n sont premiers entre eux. De façon explicite la fonction suivante est une bijection : D(mn) → D(m) · D(n) d 7→ (d, m), (d, n) . (1.5) Il s’agit là d’une forme de multiplicativité au niveau des ensembles, et que nous allons exploiter sous la forme suivante : pour toute fonction F , l’identité suivante a lieu dès que m et n sont deux entiers premiers entre eux XX X F (d1 d2 ). (1.6) F (d) = d1 |m d2 |n d|mn Démonstration. Soit D(ℓ) l’ensemble des diviseurs positifs de ℓ. Étant donné deux entiers premiers entre eux m et n, nous considérons DR f : D(m) × D(n) → D(mn) (u, v) 7→ uv , g : D(mn) → D(m) × D(n) w 7→ (pgcd(w, m), pgcd(w, n)) Nous montrons que g◦f = Id. En effet (g◦f )(u, v) = (pgcd(uv, m), pgcd(uv, n)). Comme v divise n et que n est premier à m, les entiers v et m sont premiers entre eux. L’exercice 1 nous donne alors pgcd(uv, m) = pgcd(u, m) = u et de même pgcd(uv, n) = pgcd(v, n) = v. Ce qu’il fallait démontrer. √ Exercice 12. Montrer que, pour tout n ≥ 1, nous avons d(n) ≤ 2 n. √ Indication : La meilleure constante est 3. Exercice 13. Montrer que, pour tout n ≥ 1, nous avons d(n) ≤ 3 n1/3 . Indication : La meilleure constante est 181/3 . Exercice 14. Montrer que, pour tout n ≥ 1, nous avons ϕ(n) ≥ p n/2. Exercice 15. Montrer que, pour tout n ≥ 1, nous avons ϕ(n) ≥ (9/2)1/3 n2/3 . Exercice 16. Montrer que, pour tout n ≥ 1, nous avons σ(n)ϕ(n) ≤ n2 . 25 novembre 2012 Version 2 1.4 Convolution et fonctions multiplicatives 1.4 9 Convolution et fonctions multiplicatives Nous définissons le produit de convolution arithmétique f ⋆ g par X f (n/d)g(d) (f ⋆ g)(n) = (1.7) d|n où la somme porte sur les diviseurs d de n. En notant 1 la fonction qui vaut 1 sur tous les entiers, nous avons d(n) = 1 ⋆ 1. La lectrice vérifiera que ce produit est associatif et commutatif. La fonction δn=1 en est l’élément neutre, puisque pour toute fonction arithmétique g, nous avons X (δ1 ⋆ g)(n) = δ1 (ℓ)g(m) = g(n). AF T ℓm=n Ce produit est par ailleurs distributif vis-à-vis de l’addition de deux fonctions arithmétiques et ces deux lois permettent de munir l’ensemble de fonctions arithmétiques d’une structure d’algèbre commutative unitaire sur C. Nous pourrions aussi enrichir cette structure en considérant la dérivation ∂ : (f (n))n≥1 7→ (f (n) log n)n≥1 qui est linéaire et vérifie de surcroı̂t ∂(f ⋆ g) = (∂f ) ⋆ g + f ⋆ (∂g) mais nous sortons ici de notre cadre. La lectrice trouvera une étude assez détaillée de cette structure dans le livre de Bateman & Diamond (Bateman & Diamond, 2004). Exercice 17. Montrer que, si D(f, s) converge absolument, il en est de même de D(∂f, r) pour r > s. Que penser de la réciproque ? Peut-on affaiblir cette condition à r ≥ s ? Le théorème général suivant nous donne la multiplicativité de toute une kyrielle de fonctions : DR Théorème 1.2 Si f et g sont deux fonctions multiplicatives, il en est de même de f ⋆ g. Démonstration. La valeur en 1 est aisée : f ⋆ g(1) = f (1)g(1) = 1. Soit ensuite deux entiers m et n premiers entre eux. Nous avons X f (mn/d)g(d) (f ⋆ g)(mn) = d|mn et appliquons (1.6) : X X mn g(d1 d2 ) f (f ⋆ g)(mn) = d1 d2 d1 |m d2 |n X X m n f = f g(d1 )g(d2 ) = (f ⋆ g)(m)(f ⋆ g)(n) d1 d2 d1 |m d2 |n comme requis. Ceci nous donne d’un seul coup la multiplicativité de beaucoup de fonctions, en partant des exemples simples que sont les fonctions 1 et plus généralement X a : n 7→ na . En particulier, le lecteur vérifiera que d(n) = (1 ⋆ 1)(n), Le cours de Nouakchott σ(n) = (1 ⋆ X)(n). 25 novembre 2012 CHAPITRE 1. CONVOLUTION ARITHMÉTIQUE 10 Cette convolution nous permet aussi d’exprimer simplement certaines relations, comme 1. d(n2 ) = (1 ⋆ 2ω(X) )(n). 2. µ2 (n) = (1 ⋆ 1X 2 )(n) où 1X 2 est la fonction caractéristique des carrés. Exercice 18. Montrer que d(n2 ) = X 2ω(d) . d|n AF T Exercice 19. Soit F l’espace vectoriel sur C des fonctions de N \ {0} dans C. Si f et g sont dans F , rappelons que f ⋆ g est défini par X f (d)g(n/d). f ⋆ g(n) = d|n Alors 1. Montrer que f ⋆ (g ⋆ h) = (f ⋆ g) ⋆ h. 2. Montrer que (F , +, ⋆) est une algèbre commutative sur C. 3. Déterminer une unité δ pour ⋆. 4. Montrer que 1 (la suite constante égale à 1) et µ sont inverses l’un de l’autre. Exercice 20. ⋄ 1 ⋄ Montrer que pour tout entier d sans facteurs carrés, le nombre de solutions en d1 et d2 de [d1 , d2 ] = d est 3ω(d) . DR ⋄ 2 ⋄ Soit q un entier. Nous notons f (q) le nombre de solutions en q1 et q2 de [q1 , q2 ] = q. Montrer que f est multiplicative. ⋄ 3 ⋄ Montrer que 1 ⋆ f (n) est le nombre de couples (q1 , q2 ) tels que [q1 , q2 ]|n. Exercice 21. On rappelle que f est complètement multiplicative si et seulement si f (mn) = f (m)f (n) pour tout couple d’entiers m et n. ⋄ 1 ⋄ Déterminer toutes les fonctions complètement multiplicatives f qui sont telles que 1 ⋆ f est encore complètement multiplicatif. ⋄ 2 ⋄ Déterminer l’inverse de la fonction complètement multiplicative f . ⋄ 3 ⋄ Montrer que l’inverse de l’inverse de convolution de la fonction 1 ⋆ f n’est en général pas µ · (1 ⋆ f ), même si nous nous restreignons aux fonctions complètement multiplicatives f . Exercice 24. Montrer que la fonction qui à l’entier n > 1 associe le double de la somme des entiers entre 1 et n qui lui sont premiers, et qui à 1 associe 1, est multiplicative. 25 novembre 2012 Version 2 1.4 Convolution et fonctions multiplicatives 11 Indication : On pourra calculer cette somme directement en utilisant le fait que la fonction caractéristique des entiers m premiers à n s’écrit aussi X µ(d), d|n, d|m AF T ce que l’on prendra soin de démontrer. Exercice 25. Nous posons σk (n) = P k d|n d . Montrer que σk (n) ≤ nk ζ(k) dès que k > 1. Exercice 26. Nous souhaitons montrer le lemme de Thue qui dit : soit a ≥ 1 un entier et p ≥ 3 un nombre premier tel que p ∤ a. L’équation au ≡ v[p] admet une solution (u, v) ∈ Z2 telle que 1 ≤ |u| < √ 1 ≤ |v| < p, √ p. √ ⋄ 1 ⋄ Considérons S = {0, · · · , [ p]} et l’application DR f : S 2 → {0, · · · , p − 1}, (u, v) 7→ f (u, v) ≡ au − v[p]. Montrer que f n’est pas injective. ⋄ 2 ⋄ Soit deux paires (u1 , v1 ) et (u2 , v2 ) telles que f (u1 , v1 ) = f (u2 , v2 ). Nous √ posons u = u1 − u2 et v = v1 − v2 . Montrer que au ≡ v[p], puis que |u| < p √ et |v| < p, et enfin que ni u ni v n’est nul. Exercice 27. Montrer que X m|n Exercice 28. Montrer que X d(m)3 = X m|n 2 d(m) . µ2 (d)k ω(d) = (k + 1)ω(d) . d|n Le cours de Nouakchott 25 novembre 2012 CHAPITRE 1. CONVOLUTION ARITHMÉTIQUE 12 Exercice 29. ⋄ 1 ⋄ Montrer que, pour tout entier n ≥ 1, on a nn+1 ≤ ϕ(n)σ(nn ) ≤ nn+1 . ζ(n + 1) ⋄ 2 ⋄ Déterminer si la série X n σ(nn ) − ϕ(n) nn n≥1 DR AF T est convergente ou non. 25 novembre 2012 Version 2 Chapitre 2 AF T Initiation aux séries de Dirichlet Le lecteur peut ici se restreindre aux séries de Dirichlet d’argument réel. Nous nous bornerons de plus à rester dans des domaines de convergence absolue, ce qui nous suffira ici. Pour une étude plus complète, voir (Tenenbaum, 1995) ou (Ellison, 1975). 2.1 Abscisse de convergence absolue Lorsque nous disposons d’une fonction arithmétique, disons f , nous pouvons former sa série de Dirichlet qui est, pour tout argument réel s : X D(f, s) = f (n)/ns . (2.1) DR n≥1 Cette définition est a priori formelle, puisqu’il n’est pas toujours vrai qu’il existe au moins un s pour lequel cette série converge (il n’en existe d’ailleurs pas quand f (n) = en ). Lemme 2.1 Soit f une fonction arithmétique telle que sa série de Dirichlet converge absolument pour un certain nombre complexe s. Alors, pour tout nombre réel r > ℜs, la série D(f, r) converge absolument, et donc, pour tout nombre complexe s′ tel que ℜs′ > ℜs, la série D(f, s′ ) converge absolument. Démonstration. Nous avons D(f, r) = X f (n) ns . ns nr n≥1 Or r > s donc ns /nr < 1, d’où D(|f |, r) < D(|f |, s), i.e. la série de Dirichlet de f converge pour tout r > s. Cette propriété nous donne accès à la notion d’abscisse de convergence. Définition 2.2 On appelle abscisse de convergence de la fonction f , le plus petit réel s tel que la série de Dirichlet D(f, s) converge. Si D(f, s) converge pour tout s, on dit alors que l’abscisse de convergence est −∞. CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET 14 AF T Notons qu’il n’est pas acquis que la série en question converge en son abscisse de convergence. D’après un théorème de Landau, voir (Dress, 1983/84), cette situation n’arrive même jamais dès que cette abscisse est finie et que que f est positive ou nulle. Notons ici que l’abscisse de convergence peut valoir −∞ et la fonction f être positive ou nulle, sans que cela n’implique que f soit à support borné, i.e. qu’elle s’annule partout sauf sur un nombre fini de valeurs. Le cas f (n) = e−n fournit un contre-exemple. Nous pouvons associer à chaque fonction arithmétique f une série de Dirichlet, et cette série convergera au moins en un point si la fonction f croı̂t raisonnablement. Une telle série de Dirichlet définit en fait parfaitement la fonction dont elle est issue comme le montre la propriété suivante. Nous ne l’utiliserons pas dans la suite. Lemme 2.3 Soit f et g deux fonctions arithmétiques telles que leurs séries de Dirichlet respectives convergent absolument pour un certain s. Supposons en outre que D(f, r) = D(g, r) pour tout r > s. Alors f = g. Démonstration. En posant h1 = f − g, nous avons D(h1 , r) = 0 pour tout r > s. Comme cette série converge en r = s + 1, nous en déduisons que h2 (n) = h1 (n)/nr+1 est bornée en valeur absolue et vérifie D(h2 , r) = 0 pour tout r > −1 et il nous faut établir que h2 = 0. Supposons que ce ne soit pas le cas, et nommons n0 le plus petit entier n tel que h2 (n) 6= 0. Une comparaison à une intégrale nous donne directement, pour r > 1 : |nr0 D(h2 , r) − h2 (n0 )| ≤ max |h2 (n)| n ≤ X nr0 nr n≥n0 +1 Z ∞ dt r max |h2 (n)|n0 r n n0 t ≤ max |h2 (n)|/(r − 1), n DR quantité qui tend vers 0 quand r tend vers l’infini. Mais D(h2 , r) = 0, ce qui nous garantit que h2 (n0 ) = 0 contrairement à notre hypothèse. Le lecteur pourra modifier cette démonstration de deux façons : tout d’abord remplacer le recours à un raisonnement par l’absurde par une démonstration par récurrence. Ensuite, −r une petite modification donne nr0 D(h2 , r) − h2 (n0 ) = O((1 + n−1 ) alors que 0 ) la preuve ci-dessus ne donne que O(1/r). 2.2 Séries de Dirichlet et produit de convolution Les deux lois internes sur les fonctions arithmétiques se traduisent agréablement en termes de séries de Dirichlet : – Concernant l’addition (+) : étant donné deux fonctions f et g dont les séries de Dirichlet convergent absolument pour s, nous avons D(f + g; s) = D(f ; s) + D(g; s). – Concernant la multiplication (⋆) : étant donné deux fonctions f et g dont les séries de Dirichlet convergent absolument pour s, alors celle de f ⋆ g est également absolument convergente, et nous avons D(f ⋆ g; s) = D(f ; s)D(g; s). 25 novembre 2012 Version 2 2.3 La fonction ζ de Riemann. 15 Cette dernière égalité est facile à vérifier de ce que les séries convergent absolument, ce qui nous permet d’en déplacer les termes comme bon nous semble. Elle montre en particulier que l’opérateur qui, à une fonction arithmétique, lui associe sa série de Dirichlet trivialise le produit de convolution arithmétique, de la même façon que la transformée de Fourier trivialise le produit de convolution des fonctions de la droite réelle. Il est clair que l’abscisse de convergence de la série de Dirichlet de f ⋆ g est majorée par le maximum des abscisses de convergence absolue des séries de Dirichlet associées à de f et g. Cette majoration est souvent une égalité lorsque ces deux abscisses ne sont pas égales ... et qu’aucun des facteurs n’est nul ! Exercice 30. Montrer que AF T 1. D(ϕ, s) = ζ(s − 1)/ζ(s), 2. D(λ, s) = ζ(2s)/ζ(s), 3. D(µ2 , s) = ζ(s)/ζ(2s). Exercice 31. Montrer que la série de Dirichlet associée à la fonction de Moebius µ est 1/ζ(s) et en déduire un exemple montrant que l’abscisse de convergence absolue d’un produit peut être strictement inférieure à la plus grande des deux abscisses des deux facteurs (considérer 1 ⋆ µ). Exercice 32. Exprimer la série de Dirichlet de la fonction qui à n associe 2ω(n) en fonction de la fonction ζ de Riemann. Ici ω(n) est le nombre de facteurs premiers de n comptés sans multiplicité. Exercice 33. Exprimer la série de Dirichlet de la fonction qui à n associe 2ω(n) λ(n) en fonction de la fonction ζ de Riemann. Ici, λ est la fonction de Liouville définie par λ(n) = (−1)Ω(n) où Ω(n) est le nombre de facteurs premiers de n comptés avec multiplicité. DR Exercice 34. Dans cet exercice, d(n) désigne le nombre de diviseurs de n, et si n = pν11 pν22 · · · pνkk , nous posons κ(n) = ν1 ν2 · · · νk . Montrer que X ⋄1⋄ κ(n)/ns = ζ(s)ζ(2s)ζ(3s)/ζ(6s), n≥1 ⋄2⋄ X 3ω(n) κ(n)/ns = ζ 3 (s)/ζ(3s). n≥1 Indication : Toutes ces fonctions étant multiplicatives (à montrer), il suffit de calculer chaque facteur eulérien. 2.3 La fonction ζ de Riemann. La fonction ζ est très importante en arithmétique puisqu’elle intervient dans la formule d’Euler, elle fait donc un lien entre les entiers naturels et les nombres premiers. C’est aussi la série de Dirichlet la plus simple puisqu’elle est associée à la fonction constante 1 (fonction que nous avons notée 1 dans notre bestiaire). Elle est définie pour s > 1 par X ζ(s) = n−s . n≥1 Le cours de Nouakchott 25 novembre 2012 16 CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET Si il s’agit de la série de Dirichlet la plus simple et la plus célèbre, cependant elle reste assez mal connue. Pour une étude approfondie de cette fonction, le lecteur pourra se référer à (Tenenbaum, 1995) et (Ellison, 1975). Exercice 35. Montrer que la série qui définit ζ(s) est absolument convergente pour ℜs > 1. Indication : On pourra utiliser une comparaison à une intégrale. Exercice 36. Montrer que l’on a Z ∞ 1 {t} dt ts+1 AF T 1 −s ζ(s) = s−1 et en déduire un équivalent de ζ(1 + u) lorsque u tend vers 0. Indication : On pourra écrire, pour n ≥ 1, Z ∞ dt 1 = s s+1 ns t n (technique dite de sommation par parties). Exercice 37. P ⋄ 1 ⋄ Nous posons L(s) = n≥1 (−1)n n−s . Montrer que L(s) est convergente pour ℜs > 0, puis que L(1) < 0 et enfin que L′ (1) < 0. ⋄ 2 ⋄ Montrer que −ζ ′ (s)/ζ(s) < 1/(s − 1) lorsque s est réel et > 1. Indication : On pourra utiliser ζ(s) = L(s)/(21−s − 1), que l’on démontrera. DR Exercice 38. Montrer que, pour σ > 1, nous avons 1/(σ − 1) < ζ(σ) < σ/(σ − 1). Exercice 39. Montrer que, pour σ > 1, nous avons ζ(σ) = (σ − 1)−1 + γ + O(σ − 1). 2.4 Série de Dirichlet et multiplicativité Théorème 2.4 Supposons que la série de Dirichlet de la fonction multiplicative f converge absolument pour un certain s. Alors, D(f, s) est développable en produit eulérien : Y X f (pk ) D(f, s) = . pks p≥2 k≥0 Le reste de cette section est dédiée à établir cette propriété. Nous nous donnons ici une fonction arithmétique multiplicative f que nous supposerons bornée en valeur absolue par 1. Nous pouvons dans tous les cas pratiques nous ramener à ce cas, quitte à considérer une fonction auxiliaire de la forme f (n)/na qui est, elle aussi, multiplicative (dès lors que f l’est). 25 novembre 2012 Version 2 2.4 Série de Dirichlet et multiplicativité 17 Soit y ≥ 1 un paramètre réel. Nous considérons la fonction multiplicative fy définie par ∀p ≤ y, ∀α ≥ 1, fy (pa ) = f (pa ), (2.2) ∀p > y, ∀α ≥ 1, f (pa ) = 0, y (p est ici un nombre premier) et, de façon symétrique, ∀p ≤ y, ∀α ≥ 1, f y (pa ) = 0, (2.3) ∀p > y, ∀α ≥ 1, f y (pa ) = f (pa ). Lemme 2.5 AF T Notons que nous avons l’équation f = fy ⋆ f y (2.4) Démonstration. En effet, les sommants de la somme X fy (d1 )f y (d2 ) d1 d2 =n sont presque tous nuls puisque l’entier n admet une unique écriture sous la forme n = ℓm où tous les facteurs premiers de ℓ sont inférieurs y et tous ceux de m sont strictement supérieurs à y. La somme ci-dessus se réduit donc à fy (ℓ)f y (m) qui vaut bien f (n). Nous posons alors Dy♯ (f, s) = D(f y , s) (2.5) DR Dy♭ (f, s) = D(fy , s), de telle sorte que D(f, y) = Dy♭ (f, s)Dy♯ (f, s). La série de Dirichlet Dy♭ (f, s) se réduit à un produit, pour ℜs > 1 : Dy♭ (f, s) = Y f (p) f (p2 ) f (p3 ) 1 + s + 2s + 3s + · · · . p p p (2.6) p≤y La série Dy♯ (f, s) tend à devenir petite lorsque y tend vers l’infini. En effet, avec σ = ℜs, Z ∞ X σ . (2.7) |Dy♯ (f, s) − 1| ≤ 1/nσ ≤ y −σ + dt/tσ ≤ (σ − 1)y σ−1 y n>y En laissant y tendre vers l’infini, nous obtenons donc l’expression de D(f, s) sous forme d’un produit dit eulérien D(f, s) = Y 1+ p≥2 f (p) f (p2 ) f (p3 ) + + + · · · , ps p2s p3s (ℜs > 1), (2.8) où chaque facteur est dit le facteur local, ou eulérien, en p. Le cours de Nouakchott 25 novembre 2012 18 CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET Convergence et produit convergent Nous ouvrons ici une parenthèse sur la signification de (2.8). La suite 1/2, (1/2) × (1/2), (1/2) × (1/2) × (1/2), et de terme général (1/2)n , est convergente, et de limite 0. Ici, rien de neuf. Toutefois, par une maladresse terminologique, on dit qu’un produit (formel) infini Y an n≥1 est convergent si et seulement AF T 1. La suite des produits partiels converge vers une limite, disons P ; 2. P 6= 0. L’equation (2.8) donne donc une écriture sous forme de produit, c’est à dire comme la limite d’une suite de produits partiels qui converge vers une limite, mais il faut en général vérifier la condition 2 ci-dessus. Parfois on dit que le produit converge strictement lorsque cette condition est vérifiée. Convergence et produit convergent : le point de vue de Godement Hervé Queffelec propose d’adopter leQpoint de vue suivant, qui est efficace et limpide. Godement P dit que le produit n≥1 an est absolument convergent en tant que produit si n≥1 |an − 1| = M < ∞. Ceci à cause du théorème suivant : P Théorème 2.6 Supposons que n≥1 |un | = M < ∞. Alors Q 1. Pn = 1≤j≤n (1 + uj ) → P ∈ C. DR 2. Si 1 + uj 6= 0 pour tout j alors P 6= 0. Démonstration. Nous avons Pn − Pn−1 = un Pn−1 et donc |Pn − Pn−1 | ≤ |un ||Pn−1 | ≤ |un | Y 1≤j≤n−1 e|uj | ≤ |un |eM . P Il en résulte que la série n (Pn − Pn−1 ) est absolument convergente, et donc la suite Pn converge, disons vers P ∈ C. Pour montrer que P 6= 0, on exhibe Q tel que P Q = 1. Quoi de Qplus naturel que de chercher Q sous la forme d’un autre produit infini Q = j≥1 (1 + vj ), P avec j≥1 |vj | < ∞ ? L’idéal serait d’ajuster vj pour avoir (1 + uj )(1 + vj ) = 1 pour tout j. Or c’est possible car 1 + uj 6= 0. Et ça donne vj = −uj 1 −1= , 1 + uj 1 + uj d’où |vj | ∼ |uj | et tout est dit. Les logarithmes sont cachés dans les majorations 1 + x ≤ ex et Pn−1 ≤ eM . Mais leur présence reste discrète. 25 novembre 2012 Version 2 2.5 Quelques digressions sans preuve 19 Un détour historique AF T La décomposition (2.4) a été beaucoup exploitée, notamment par (Daboussi, 1984) (voir aussi (Daboussi, 1996) et (Daboussi & Rivat, 2001)) et permet dans l’article cité de donner une preuve élémentaire du théorème des nombres premiers. Cette décomposition est au cœur du travail récent (Granville & Soundararajan, 2001) où les auteurs développent la philosophie suivante : le comportement de la fonction fy est très bien décrit par son produit eulérien alors que le comportement de f y est lui décrit par des équations fonctionnelles (ce que nous ne décrivons pas ici). Essayer de réduire la compréhension d’une fonction multiplicative f à la composante fy est l’essence des méthode dites probabilistes, notoirement développées par Kubilius. P Exercice 40. Soit a un réel ≥ 0. Nous posons λa (n) = d|n da λ(d) où λ(d) est la fonction de Liouville. Montrer que X λa (n) ζ(s)ζ(2s − 2a) = ns ζ(s − a) n≥1 pour ℜs > 1 + a. et X λ(n)λa (n) ζ(2s)ζ(s − a) = ns ζ(s) n≥1 Exercice 41. Montrer que l’on a, pour ℜs > 1, ζ(s) = 1 1 1 − ps p≥2 Y où le produit est convergent au sens de Godement. Quelques digressions sans preuve DR 2.5 Les séries des Dirichlet ont été introduites dans (Dirichlet, 1937) par P.G. Lejeune-Dirichlet en 1937 pour montrer de l’existence d’une infinité de nombres premiers dans les progressions arithmétiques (de type a + nq avec a et q premiers entre eux). Dedekind, d’abord un élève puis un ami de Dirichlet, a établi plusieurs propriétés de ces séries enrichissant ainsi le livre (Lejeune-Dirichlet, 1871). L’étape de structuration suivante est due à un mémoire de Cahen (Cahen, 1894), qui est notamment célèbre pour . . . l’inexactitude de ses preuves ! L’élaboration de la théorie est allée bon train à cette période, et en 1915 parut la splendide petite monographie (Hardy & Riesz, 1964) de Hardy & Riesz qui reste à ce jour l’ouvrage de base sur la question. La lectrice pourra retrouver dans (Tenenbaum, 1995) une partie de ce matériel. Nous nous intéressons ici à deux points : 1. Dans quelle mesure l’ordre moyen et l’abscisse de convergence sont-ils liés ? 2. L’écriture D(f, s) = D(h, s)D(g, s) nous permet-elle de conclure que l’abscisse de convergence absolue de D(f, s) est le maximum de celle de D(h, s) et de celle de D(g, s) ? En ce qui concerne le premier point, nous avons vu dans la section 7.1 que la connaissance de l’ordre moyen de la fonction f permettait d’en déduire l’abscisse de convergence de D(f, s). La réciproque est fausse, tout simplement parce qu’il Le cours de Nouakchott 25 novembre 2012 20 CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET est tout à fait possible que f n’admette pas d’ordre moyen. Ces deux notions sont tout de même liées par le théorème suivant (dû à Cahen (Cahen, 1894)) : Théorème 2.7 Si l’abscisse de convergence absolue σ0 de D(f, s) est strictement positive, elle est donnée par P log 1≤n≤N |f (n)| σ0 = lim sup . log N n→∞ AF T Il existe un théorème analogue pour déterminer l’abscisse de convergence (mais nous n’avons pas établi son existence !), et il est aussi possible de traiter le cas où σ0 est négative ou nulle (mais la formule est différente). La lectrice remarquera que cette formule est l’exact pendant de la formule de Hadamard donnant le rayon de convergence d’une série entière, moyennant de rappeler l’identité que nous avons (presque !) démontrée en (7.4) : Z ∞ X |f (n)| dt/ts+1 . D(|f |, s) = s 1 n≤t DR Tournons-nous à présent vers la seconde question. Nous supposons ici que nous disposons d’une décomposition de la forme D(f, s) = D(h, s)D(g, s), où nous connaissons l’abscisse de convergence absolue, disons σ0 , de D(g, s) et où celle de D(h, s) est strictement plus petite. Pouvons-nous en conclure que σ0 est encore l’abscisse de convergence absolue σ0′ de D(f, s) ? Il est clair que σ0′ ≤ σ0 , mais peut-elle être plus petite ? C’est évidemment le cas si h = 0, amis qu’en est-il si h 6= 0 ? Les auteurs de cet article ne savent pas répondre à cette question générale, mais il est loisible dans notre cas d’application d’ajouter une hypothèse : nous supposons que, pour tout δ > 0, le module de D(h, s) est minoré lorsque s décrit le demi-plan complexe ℜs ≥ σ0 + δ. Cette hypothèse ne nous coûte rien en pratique puisque nous obtenons D(h, s) sous la forme d’un produit eulérien, qui en tant que produit convergent, n’est ni infini, ni nul. Mais il nous faut maintenant considérer les s du domaine complexe, ce que nous avions réussi à éviter jusqu’à présent ! Voici le théorème (Hewitt & Williamson, 1957) de Hewitt & Williamson qui nous intéresse : Théorème 2.8 Soit D(h, s) une série de Dirichlet absolument convergente pour ℜs ≥ σ et minorée en module par une constante > 0, alors 1/D(h, s) est encore une série de Dirichlet absolument convergente pour ℜs ≥ σ. Ce résultat nous permet d’écrire D(g, s) = D(h, s)−1 D(f, s) et d’en conclure que σ0′ ≥ σ0 , ce qui nous donne bien σ0 = σ0′ . De nombreux travaux comparent les abscisses de convergence simple, absolue ou uniforme des trois constituants de l’égalité D(f, s) = D(h, s)D(g, s) ; la lectrice en trouvera un exposé ainsi que leurs extensions au cas de plusieurs facteurs et les dernières améliorations (optimales) dans (Kahane & Queffélec, 1997). Exercice 42. Montrer que 1 ⋆ λ est la fonction caractéristique des carrés et en déduire la série de Dirichlet de λ. Ici, λ est la fonction de Liouville, définie par λ(n) = (−1)Ω(n) où Ω(n) est le nombre de facteurs premiers de n comptés avec multiplicité. Exercice 43. Exprimer la série de Dirichlet de la fonction qui à n associe ϕ(n) en fonction de la fonction ζ de Riemann. 25 novembre 2012 Version 2 2.5 Quelques digressions sans preuve 21 Exercice 44. ⋄ 1 ⋄ Déterminer la série de Dirichlet de d(n2 ). ⋄ 2 ⋄ Déterminer la série de Dirichlet de d(n)2 . ⋄ 3 ⋄ En utilisant les deux questions précédentes, montrer que X d(m2 ). d(n)2 = DR AF T m|n Le cours de Nouakchott 25 novembre 2012 CHAPITRE 2. INITIATION AUX SÉRIES DE DIRICHLET DR AF T 22 25 novembre 2012 Version 2 Chapitre 3 AF T Sommer des fonctions lisses The main objects in analytic number theory often look like X a(n) n≤X for some function of ”arithmetical” nature a(n), where the adjective ”arithmetical” needs to be defined. This is the case when a is C1 . A hidden hypothesis we will comment later on is that a′ is bounded. A first example of this situation is X 1 = log X + γ + O(1/X), (X ≥ 1). (3.1) n n≤X DR An even simpler example is given by X 1 = X + O(1), n≤X (X ≥ 1). (3.2) Preuve de (3.1) : Commençons par rappeler que, pour tout t ∈ R, nous avons X n≤t 1 = t + O(1). Supposons à présent que nous souhaitions obtenir une approximation de Et bien il nous suffit de remarquer que : 1 1 = + n X Z X n dt . t2 Il vient alors : X 1 = n n≤X We prove here that P n≤X X 1 + Z 1 X X dt 1 2 = log X + O(1). t n≤t P n≤X 1/n. (3.3) CHAPITRE 3. SOMMER DES FONCTIONS LISSES 24 Lemme 3.1 X log n = n n≤X 1 2 log2 X + γ1 + O(log(2X)/X), (X ≥ 1) for some constant γ1 that is called the Laurent-Stieltjes constant of index 1. AF T A preliminary remark on uniformity : In all three previous estimates, we have written “X ≥ 1” while the estimate is most interesting when X is large. However, we need an estimate that is uniform in some range, and, for instance here, there exists a constant C such that, for any X ≥ 1, we have X log n 1 2 − log X − γ 1 ≤ C log(2X)/X. 2 n n≤X This would be false if we had written +O((log X)/X) in (3.1), for it cannot hold when X = 1. Such problems are usually trivial to sort, but a slip at this level may lead to mighty mistakes later on. There is nothing magic in the “log(2X)” and we may as well have written “1 + log X” or “log(3X)”. Démonstration. We simply write log X log n = + n X Z X n log t − 1 dt. t2 This gives us DR X Z X log t − 1 X log n log X dt = [X] + n X t2 n≤X n n≤X Z X X log X log t − 1 = [X] 1 dt + X t2 1 n≤t where [X] denotes the integer part of X. We continue by using (3.2) in the form [t] = t − {t} ({t} being the fractionnal part of t) : Z ∞ log(2X) X log n Z X log t − 1 log t − 1 . dt + O = dt + log X − {t} n t t2 X 1 1 n≤X and (3.1) follows readily. The technique we have developped in the above proof is known as summation by parts. The reader will find different versions of this, usually more intricate than the one above, relying either on Abel summation process or on Stieltjes integration. We have relied on (3.2), but see exercise 128 for a more general usage. We recommend to the reader the following two exercises ?? and 47. This case is thus well-understood. If we want to gain precision in the error term, then we appeal to the Euler-MacLaurin summation formula, but as the reader will see by analysing the example we treated, there is no way one can avoid fractionnal parts in the development. Note P however that – We do not know how to evaluate n≤X nit with enough precision when t is large with respect to X. 25 novembre 2012 Version 2 25 – The error term in (3.2) (i.e. the fractionnal part) is much more important than it looks. In our proofs, we want very often to show that the resulting error term is very small but, if it simply did not exist, then we would have ζ(s) ”=” 1/(s − 1). This implies that this error term is responsible for the functionnal equation of the Riemann zeta function as well as for its Euler-product ! Exercice 47. Montrer que X X 2 log ≪ X, n n≤X (X → ∞). AF T Exercice 48. Montrer que, pour tout entier k ≥ 1, X log n≤X X k ≪ X, n (X → ∞). Exercice 49. Nous définissons X T (N ) = y≤(N/2)1/3 /2 ⋄ 1 ⋄ Montrer que log(N − 8y 3 ). T (N ) = 21 (N/2)1/3 log N + c0 N 1/3 + O(log N ) pour une certaine constante c0 . ⋄ 2 ⋄ Montrer que DR T (N ) = 16 (N/2)1/3 log N + X (N/2)1/3 <m≤N, ∃y≤(N/2)1/3 /2,m|N −8y 3 Λ(m) + O(N 1/3 ) ⋄ 3 ⋄ En déduire qu’il existe une infinité d’entiers de la forme n = N − 8y 3 où y est un entier qui vérifie 8y 3 ≤ N/2 qui admettent un facteur premier p ≥ n1/6 . Exercice 52. Montrer que X √ {x/n} = (1 − γ)x + O( x) n≤x où {y} est la partie fractionnaire de y. Exercice 53. Pour des entiers N ≥ 1 et d ≥ 1, nous avons (1/d) X n,m≤N d|n−m Le cours de Nouakchott 1= 2 N2 + N/d − N/d . 2 d 25 novembre 2012 CHAPITRE 3. SOMMER DES FONCTIONS LISSES 26 Indication : Le cas N < d est facile. Dans le cas N ≥ d, soit b l’entier dans [1, d] qui est congruent à N modulo d. On trouve que d fois la somme en question vaut 2 X N − a b − a − +1 + d d b+1≤a≤d N −a b−a − d d 2 . DR AF T 1≤a≤b X 25 novembre 2012 Version 2 Chapitre 4 4.1 AF T Le principe de l’hyperbole de Dirichlet Un premier terme d’erreur pour la moyenne de la fonction de nombre de diviseurs Théorème 4.1 Nous avons X n≤x d(n) = x log x + O∗ (2x). Démonstration. La preuve est sans surprise : X x X X X 1= + O∗ (1) d(n) = ℓ n≤x ℓ≤x ℓ≤x m≤x/ℓ ∗ DR = x log x + O (2x). en utilisant X1 = log L + O∗ (1) ℓ ℓ≤L que l’on obtient par comparaison à une intégrale. Le terme d’erreur est très proche du terme principal. Et par exemple, lorsque x = 106 , nous calculons X d(n) = 13 970 034 n≤x 6 6 alors que 10 log(10 ) = 13 815 510.557 · · ·. Peut-on faire mieux ? 4.2 Le principe de l’hyperbole de Dirichlet Soit f et g deux fonctions définies sur les entiers. Nous rappelons que f ⋆ g est la fonction h définie sur les entiers par X h(ℓ) = f (m)g(n) m,n≥1, mn=ℓ CHAPITRE 4. LE PRINCIPE DE L’HYPERBOLE 28 où m (et n) parcourt l’ensemble des diviseurs positifs de ℓ. Nous notons 1 la fonction définie sur les entiers par 1(n) = 1 pour tout n. Lemme 4.2 Soit L, M et N trois paramètres réels positifs tels que L = M N . Nous avons X h(ℓ) = ℓ≤L X f (m) m≤M X g(n) + X n≤N n≤L/m X g(n) − ℓ≤L X m≤M X f (m) g(n) n≤N AF T Démonstration. Nous écrivons X X X h(ℓ) = f (m)g(n) = f (m) m≤L/n mn≤L X X X X f (m)g(n) M<m≤L n≤L/m m≤M n≤L/m = X f (m)g(n) + f (m)g(n) + X X f (m)g(n) n≤N M<m≤L/n m≤M n≤L/m d’où l’on conclut aisément. Quand on utilise cette formule, on dit que l’on utilise la méthode de l’hyperbole de Dirichlet. 4.3 Un meilleur terme d’erreur pour le nombre de diviseurs Théorème 4.3 Nous avons X √ d(n) = x log x + (2γ − 1)x + O∗ (2 x). DR n≤x Pour x = 106 , nous vérifions que 106 log(106 )+(2γ−1)106 √ = 13 969 941.887 · · · qui ne différe que de 92.112 · · · de la vraie valeur ! Comme 2 106 = 2000, nous constatons sur cet exemple que le terme d’erreur est peut être même d’ordre plus petit que ce que nous démontrons. C’est vrai. Nous avons déjà introduit la méthode de l’hyperbole de Dirichlet. Elle√nous conduit ici à la formule suivante, en notant S(x) la somme en question et x = √ x: X X √ S(x) = 1=2 [x/ℓ] − [ x]2 √ ℓ≤ x ℓm≤x où [y] désigne la partie entière du réel y. En utilisant [y] = y − 1 2 − {y} + 1 2 (4.1) il vient S(x) = 2x X √ ℓ≤ x X √ √ x/ℓ − 12 . 1/ℓ − [ x] − [ x]2 − 2 √ ℓ≤ x (4.2) Nous allons montrer que la dernière somme est petite, mais il nous faut d’abord traiter les premiers termes. Ce n’est pas difficile, mais il est utile de signaler au 25 novembre 2012 Version 2 4.3 Un meilleur terme d’erreur pour le nombre de diviseurs 29 lecteur qu’un peu de doigté est nécessaire et qu’il n’est a priori absolument pas √ évident qu’un terme de la forme x{ x} n’apparaisse pas, puisque √ √ √ √ √ √ [ x] + [ x]2 = x + x − 2 x{ x} + { x}2 √ √ √ en écrivant [ x] = x − { x}. Par ailleurs, en utilisant la formule d’Euler Maclaurin, nous obtenons X et par conséquent 2x X √ ℓ≤ x √ 2 1 √ + O(1/ x ) 2[ x] AF T √ ℓ≤ x √ 1/ℓ = log[ x] + γ + √ √ 2 x 1/ℓ = 2x log[ x] + 2γx + √ + O(x/ x ) [ x] √ √ √ x √ √ + O(1) = x log x + 2γx + 2x log 1 − { x}/ x + 1 − { x}/ x √ √ √ = x log x + 2γx − x{ x} + x + O(1) Exercice 54. Soit q ≥ 2 un entier que l’on suppose premier dans cette partie. ⋄ 1 ⋄ Exprimer Tq (L) = X d(ℓ) ℓ≤L q|ℓ en fonction T1 et en déduire que, si L ≥ q, nous avons p 2q − 1 q−1 2q − 1 L log L − 2 2 L log q + (2γ − 1)L + O( L/q). 2 2 q q q DR Tq (L) = ⋄ 2 ⋄ Montrer que l’estimation de la question précédente est en fait valable pour L > 0. Exercice 56. Soit X un paramètre réel positif. Soit f une fonction. Nous supposons qu’il existe trois constantes M (f ), M + (f ) et δ > 0 (qui peuvent toutes dépendre de X, tout comme f d’ailleurs), telles que X f (d) = M (f )y + O(y 1−δ ) (1 ≤ y ≤ X) d≤y et X 1 1 |f (d)| ≪ (M + (f ) + δ −1 ) X 1+δ . d≤X 1+δ Nous supposons aussi que |M (f )| ≪ M + (f ). ⋄ 1 ⋄ Montrer que nous pouvons prendre Λ ou µ comme fonction f , avec δ = 10(log log X)/ log X. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 4. LE PRINCIPE DE L’HYPERBOLE 30 ⋄ 2 ⋄ Pour λ > 0, nous définissons Z c1 (λ) = λ ∞ λ {t} dt t2 de telle sorte que c1 (1) = 1 − γ. Montrer que c1 est dérivable sauf aux points entiers et que l’on a |c1 (λ) − 21 | ≤ 1/(4λ). ⋄ 3 ⋄ Montrer que X 1 1 = λ Z λ [t] 1 dt = log λ − t2 Z λ 1 {t} dt . t2 AF T ℓ≤λ ℓ − ⋄ 4 ⋄ Montrer que, pour λ > 0, nous avons X f (d){X/d} = c1 (λ)M (f ) d≤X/λ 1 X + O (M + (f ) + δ −1 )X 1+δ . λ Indication : Le principe de l’hyperbole de Dirichlet nous donne X f (d)[X/d ] = d≤X/λ X f (d) d≤D X 1 ℓ≤X/d + X X DR ℓ≤L d≤min(X/λ,X/ℓ) f (d) − X ℓ≤L 1 X f (d). d≤D Ensuite, il faut atteindre X f (d)[X/d ] = X(M (f ) log X + C(f )) d≤X/λ X 1 1 − M (f )X 1 − γ + − + O(R) ℓ λ ℓ≤λ où R est un terme d’erreur. ⋄ 5 ⋄ Nous définissons c2 (λ) = λ Z ∞ λ {t} log t dt . t2 Montrer que pour λ ≥ 1, nous avons X f (d){X/d} log d≤X/λ 25 novembre 2012 1 X X = c2 (λ)M (f ) + O (M + (f ) + δ −1 )X 1+δ log X . d λ Version 2 4.3 Un meilleur terme d’erreur pour le nombre de diviseurs 31 ⋄ 6 ⋄ Montrer que, pour λ ≥ 1, nous avons X d≤X/λ µ2 (d) {X/d} = X 6 c1 (λ) + O(X 2/3 ). π2 λ ⋄ 7 ⋄ Montrer que nous avons X X X 6 2 µ (d) log = 2 c2 (1)X + O(X 2/3 log X). d d π d≤X DR AF T Indication : Il faut aller voir la section 7.3. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 4. LE PRINCIPE DE L’HYPERBOLE DR AF T 32 25 novembre 2012 Version 2 Chapitre 5 AF T Les estimations de Mertens sur les nombres premiers Nous allons évidemment avoir besoin de quantifier le nombre de nombres premiers dans un intervalle. De telles estimations existent depuis longtemps, et le travail consistant à les rendre explicite numériquement a débuté dans les années quarante. Nous disposons maintenant de bonnes estimations pour les quantités simples. Nous en profitons aussi pour introduire deux techniques simples et efficaces. 5.1 La fonction de von Mangoldt DR Nous avons besoin ici d’une fonction nommée d’après Hans von Mangoldt. Celui-ci a publié en 1894 un mémoire important sur les nombres premiers où il introduit notamment cette fonction sous la notation L(n). Nous la notons Λ(n) comme il est usuel à l’heure actuelle. Elle est définie par : Λ(n) = ( log p 0 si n = pa avec a ≥ 1, sinon. (5.1) Par exemple Λ(2) = Λ(4) = log 2 et Λ(15) = 0. Notons explicitement que Λ(1) = 0. L’apparition de cette fonction n’est pas du tout mystérieuse si l’on raisonne en termes de séries de Dirichlet mais nous évitons ce point de vue ici. Du coup, la justification de son introduction vient de deux aspects. Tout d’abord, elle permet d’isoler les puissances des nombres premiers des autres entiers tout en leur attribuant un poids assez peu fluctuant log p, et nous verrons au lemme 5.5 que la contribution des p2 , p3 , . . . est négligeable devant celle des nombres premiers p. Cela étant, son intérêt véritable résulte de l’identité : ∀n (entier) ≥ 1, X Λ(d) = log n, d|n où la somme porte sur tous les diviseurs d ≥ 1 de n. (5.2) CHAPITRE 5. LES ESTIMATIONS DE MERTENS 34 Démonstration. Pour n = 1, cette identité est évidente. Pour n plus grand, nous le décomposons en facteurs premiers n = pa1 1 pa2 2 · · · paKK où les pi sont des nombres premiers distincts et les ai des entiers ≥ 1. Il vient alors log n = a1 log p1 + a2 log p2 + · · · + aK log pK et les diviseurs d de n pour lesquels Λ(d) 6= 0 sont les pb11 avec 1 ≤ b1 ≤ a1 (il y en a a1 de cette forme), puis les pb22Pavec 1 ≤ b2 ≤ a2 (il y en a a2 de cette forme), etc. Et bien sûr, a1 log p1 = b1 log p1 , ce qui permet de clore la preuve. De la fonction log à la fonction Λ AF T 5.2 Commençons par un lemme classique d’analyse : Lemme 5.1 Pour x ≥ 1, nous avons X log n = x log x − x + O∗ (log(2x)). 1≤n≤x Démonstration. Soit N la partie entière de x. Nous procédons par comparaison à une intégrale, c’est à dire que nous utilisons les inégalités Z n n−1 log t dt ≤ log n ≤ n+1 Z log t dt n qui sont une simple conséquence du caractère croissant du logarithme. En les sommant, nous obtenons N log t dt ≤ DR Z 1 X 2≤n≤N log n ≤ Z N +1 log t dt (5.3) 2 et un peu de travail permet de conclure, moyennant de se souvenir que x 7→ x log x − x est une primitive de x 7→ log x. Voici une interprétation graphique de l’encadrement : log(x − 1) log x log 3 log 9 log 8 log 7 log 6 log 5 log 4 log 2 0 1 2 3 4 5 6 7 8 9 10 La somme cumulée de l’aire des petits rectangles est la quantité qui nous interesse. Nous constatons graphiquement qu’elle est majorée par l’intégrale de la fonction ce qui est le membre de droite de 5.3 et minorée par l’intégrale de cette fonction translatée d’une unité vers la gauche, soit le membre de gauche de 5.3. 25 novembre 2012 Version 2 5.2.1 Une majoration à la Chebyshev Nous écrivons alors X log n = n≤x XX Λ(d) = n≤x d|n 35 X Λ(d)[x/d] d≤x et l’idée de tout ce qui suit est basée sur l’égalité : X Λ(d)[x/d] = x log x − x + O∗ (log(2x)). (5.4) d≤x Exercice 61. X Λ(n) ζ′ . (s) = ζ ns n≥1 AF T ⋄ 1 ⋄ Montrer que, pour ℜs > 1, nous avons − X Λ(n) ⋄ 2 ⋄ Montrer que, pour s > 1, nous avons log ζ(s) = . ns log n n≥2 5.2.1 Une majoration à la Chebyshev Théorème 5.2 Nous avons pour tout x ≥ 1, X Λ(d) ≤ 7x/10. x/2<d≤x Démonstration. Une utilisation directe de 5.4 donne X Λ(d) [x/d] − 2[x/(2d)] = x log 2 + O∗ (2 log(2x)). d≤x DR Nous remarquons maintenant que [x] − 2[x/2] ≥ 0 pour tout x réel : en effet, cette quantité vaut 0 si x est dans [0, 1[, puis 1 si x est dans [1, 2[ et enfin est périodique de période 2. Par conséquent, l’équation ci-dessus implique X Λ(d) [x/d] − 2[x/(2d)] ≤ x log 2 + 2 log(2x). x/2<d≤x Pour les d entre x/2 et x, nous avons [x/d] − 2[x/(2d)] = 1 ce qui aboutit à X Λ(d) ≤ x log 2 + 2 log(2x). x/2<d≤x Cette inégalité permet de prouver le théorème si x ≥ 1150 et une vérification numérique permet d’étendre ce résultat à tout x réel ≥ 1. En découpant l’intervalle [1, x] entre ]x/2, x] union ]x/4, x/2] union etc, nous obtenons le corollaire classique : P Corollaire 5.3 Nous avons d≤x Λ(d) ≤ 7x/5 pour tout x ≥ 1. Pafnouty Chebyshev est le premier à avoir établi en 1848 une telle estimation, par une méthode d’ailleurs proche de celle que nous avons développée. P Notons ici que John Rosser a montré en 1941 que le maximum de la fonction d≤x Λ(d)/x était atteint en x = 113 et était un peu inférieur à 1.04. Ceci nous donne aussi une majoration du nombre de nombres premiers inférieurs à une borne donnée : Le cours de Nouakchott 25 novembre 2012 CHAPITRE 5. LES ESTIMATIONS DE MERTENS 36 Corollaire 5.4 Pour tout x ≥ 1, le nombre de nombres premiers inférieurs à x est au plus 3x/(2 log x). P P Signalons les notations traditionnelles π(x) = p≤x 1 et ψ(x) = d≤x Λ(d). AF T Démonstration. P Remarquons tout d’abord que ce nombre de nombres premiers s’écrit aussi p≤x 1. Or, nous tirons du corollaire précédent la majoration : P log p ≤ 7x/5. Nous nous débarrassons alors du poids log p par une techp≤x nique que l’on appelle la sommation par parties du fait que, dans le formalisme de l’intégrale de Stieltjes, il s’agit effectivement de l’extension de la technique du même nom standard au niveau du calcul intégral. Une version souple et élémentaire s’obtient en écrivant : Z x 1 1 dt = + 2 log p log x p t log t ce qui nous donne Z x X log p 7x 7dt ≤ + 2 . log p 5 log x 2 5 log t p≤x Pour la dernière intégrale, nous commençons par remarquer qu’une intégration par parties (classique !) implique, pour k ≥ 0, que : Z x Z x x k dt dt ≤ + Jk = k k k+1 log x t 2 log 2 log t d’où nous déduisons que (log x − 3)(log2 x)J3 ≤ x et J2 ≤ x/ log2 x + J3 . Ce qui à termes nous donne le résultat annoncé si x ≥ exp(5). Un calcul finit. P Exercice 62. Montrer que la série p 1/(p log p) est convergente. DR La fonction Λ donne aussi un poids non nul à des entiers qui ne sont pas de nombres premiers mais des puissances de ceux-ci. Leur contribution est la plupart du temps négligeable grâce au lemme suivant : Lemme 5.5 Pour x ≥ 1, nous avons X d≤x d non premier √ Λ(d) ≤ 3 x/2. √ Démonstration. En effet, les d comptés s’écrivent pa avec a ≥ 2 et p ≤ x. 2 a Un nombre premier va apparaı̂tre en p, puis p , et caetera jusqu’à p où a ≤ (log x)/ log p. Le corollaire précédent conclut. Exercice 63. Montrer qu’il existe une infinité de nombres premiers de la forme 4m + 3. Indication : On pourra montrer que l’entier 4 · m! + 3 admet au moins un facteur premier ≡ 3[4]. Exercice 64. Montrer qu’il existe une infinité de nombres premiers de la forme 6m + 5. Indication : On pourra montrer que l’entier 6 · m! + 5 admet au moins un facteur premier ≡ 5[6]. 25 novembre 2012 Version 2 5.2.2 Un théorème à la Mertens 5.2.2 37 Un théorème à la Mertens Nous en arrivons à un théorème dans l’esprit d’un résultat de Franz Mertens issu d’un mémoire de 1874. Il contient en essence une minoration du nombre de nombres premiers comme nous le montrons ci-après. Théorème 5.6 Pour x ≥ 2, l’égalité suivante a lieu X Λ(d)/d = log x − 32 + O∗ ( 21 ) d≤x AF T Démonstration. Nous partons toujours de (5.4) et écrivons cette fois-ci [x] = x − {x} où nous majorons la partie fractionnaire par 1 et la minorons par 0. Il vient X 7 Λ(d)/d − log x + 1 ≥ − log(2x)/x. 10 + log(2x)/x ≥ d≤x 4 Pour x ≥ 120, cela donne la borne supérieure log x − 15 et la borne inférieure 21 log x − 20 , ce qui est meilleur que le résultat annoncé. Pour x plus petit, une vérification numérique conclut. Exercice 65. ⋄ 1 ⋄ (A. Selberg) Montrer que Λ ⋆ Λ + Λ log = µ ⋆ log2 où Λ log est la fonction qui à n, associe Λ(n) log n. ⋄ 2 ⋄ Montrer que Λ ⋆ Λ − Λ log = µ log2 où µ log2 est la fonction qui à n, associe µ(n)(log n)2 . 5.3 Un résultat de type postulat de Bertrand DR Le mathématicien français Joseph Bertrand conjecturait en 1845 qu’il y a toujours un nombre premier dans l’intervalle [n, 2n − 3] si n est un entier ≥ 4, conjecture qui devait être démontrée par Chebyshev en 1850. Les résultats que nous avons montrés sont un peu plus faibles que ceux dont disposaient Chebyshev mais nous permettent de démontrer un résultat du même genre, à savoir : Théorème 5.7 Pour x ≥ 2, nous avons X 1 ≥ 2x/(25 log x). C(x) = x/4<p≤x Il existe donc un nombre premier dans l’intervalle ]x/4, x] pour tout x ≥ 2. Pour arriver au postulat de Bertrand, nous pourrions rechercher une autre inégalité sur les parties entières, ce qui est le chemin suivi par Chebyshev. Ou inclure dans le théorème 5.2 la contribution des entiers entre x/4 et x/8 et modifier conséquemment le théorème 5.6. Démonstration. En appliquant le théorème 5.6 en x et x/4, nous obtenons X Λ(d)/d ≥ log 4 − 1 (5.5) x/4<d≤x Le cours de Nouakchott 25 novembre 2012 CHAPITRE 5. LES ESTIMATIONS DE MERTENS 38 P et par conséquent x/4<d≤x Λ(d) ≥ x(log 4 − 1)/4 ≥ x/11 pour x ≥ 16. Nous étendons cette inégalité à x ≥ 2 par le calcul et il s’agit ensuite de passer de Λ(d) à une somme sur les nombres premiers, ce que nous effectuons à l’aide du lemme 5.5, obtenant X x/4<p≤x log p ≥ √ x 3 x − ≥ 2x/25 11 2 AF T si x ≥ 19 000 d’où le théorème dans ce cas. Un calcul numérique permet d’étendre ce résultat. Concernant de bonnes approximations de la somme des nombre premiers ≤ x, signalons ici que dans la continuité des travaux de Rosser, Pierre Dusart a établi en 1999 que, pour x ≥ 598 1+ 0.992 log x X 1.2762 < . 1<1+ log x x log x (5.6) p≤x Nous aurons encore besoin à la fin de ce livre d’un dernier résultat que voici. Lemme 5.8 Pour x ≥ 2, nous avons X p≤x 1/p = log log x − 1 5 + O∗ (7/5). DR Démonstration. Le théorème de Mertens implique que − 67 − X k≥2,p≥2 log p X log p ≤ − log x ≤ − 61 . pk p p≤x En sommant d’abord sur k et en utilisant un peu de calcul numérique, nous montrons que la somme sur k et p qui apparaı̂t vaut au plus 0.8. Pour obtenir le lemme, nous utilisons une sommation par parties comme page 36. Il en résulte la majoration X 1 − log log 2 1/p ≤ log log x + 1 − 6 log 2 p≤x et la minoration log log x + 1 − 59 30 log 2 − log log 2. Exercice 66. Montrer que X ω(n) = X log log X + O(X) n≤X où ω(n) est le nombre de facteurs premiers de n. 25 novembre 2012 Version 2 5.4 Le théorème des nombres premiers 39 Exercice 67. ⋄ 1 ⋄ Montrer qu’il existe une constante b telle que X 1/p = log log x + b + O(1/ log x) p≤x et telle que − X p≤x 1 = log log x + c + O(1/ log x) log 1 − p où la constante c est donnée par XX 1 . kpk AF T c=b+ p≥2 k≥2 ⋄ 2 ⋄ Montrer que, pour x ≥ 1, X 2≤n≤x X 1 Λ(n) = + c − γ + O(1/ log(2x)). n log n n n≤log x ⋄ 3 ⋄ Montrer que, pour δ > 0, Z ∞ X Λ(n) dx = log ζ(1 + δ) = − log δ + O(δ). δ n log n x1+δ 1 2≤n≤x ⋄ 4 ⋄ Montrer que, pour δ > 0, Z ∞ X 1 dx δ = log(1 − e−δ )1 = − log δ + O(δ) 1+δ n x 1 DR 1≤n≤x et en conclure que c = γ. 5.4 Le théorème des nombres premiers En 1896, Hadamard d’un côté et De la Vallée-Poussin de l’autre (de la ValléePoussin, 1899) démontraient le théorème suivant : Théorème 5.9 (Théorème des nombres premiers) Nous avons, pour tout constante A ≥ 1, X p≤X log p = X + O(X/(log X)A ). La constante impliquée dans le symbole O dépend bien sûr du choix de A. Nous ne le démontrerons pas ici. Sa preuve est assez simple mais demande du matériel théorique dont nous ne disposons pas ici. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 5. LES ESTIMATIONS DE MERTENS 40 Exercice 71. ⋄ 1 ⋄ Montrer que ⋄ 2 ⋄ Montrer que X 1 ∼ X/ log X. X 1 − X/ log X = O X/(log X)2 . p≤X p≤X ⋄ 3 ⋄ Montrer que X p≤X 1 − X/ log X = X/(log X)2 + O X/(log X)3 . Ceci montre que le terme d’erreur de la question précédente ne peut pas être amélioré. AF T Exercice 72. Montrer que X Λ(n) = X + O X/(log X)10 n≤X Exercice 73. Montrer que X n 1 = 2 X + O(X/ log2 X). Λ(n) 1 − X n≤X Indication : Une sommation par parties résoud le problème, c’est à dire que R1 l’on utilise 1 − u = u dt. Exercice 74. Montrer que X Λ(n)Λ(m) = 12 X 2 + O(X 2 / log2 X). n+m≤X DR Indication : L’exercice 73 peut aider. Exercice 75. (Théorème de Mertens) ⋄ 1 ⋄ Montrer qu’il existe une constante B > 0 telle que Y 1 ∼ B/ log X 1− p p≤X ⋄ 2 ⋄ Montrer que Y 1 π2 1+ ∼ / log X. p 6B p≤X Voir l’exercice 67 pour la valeur B = e−γ . Exercice 76. Nous définissons m(D) = P µ(d). Montrer que d≤D m(D) = M (D) 1 + D D Z 1 D D t P d≤D µ(d)/d et M (D) = M (t)dt log D + t D pour D ≥ 1. 25 novembre 2012 Version 2 5.4 Le théorème des nombres premiers 41 Indication : On pourra démontrer l’identité annexe : Z D D M (t)dt = log D. t t 1 Exercice 77. Montrer que − X µ(d) log d d d|q ≥0 AF T en utilisant log = Λ ⋆ 1. Exercice 78. Montrer que ψ(x) = ϑ(x) + ϑ(x1/2 ) + ϑ(x1/3 ) + ϑ(x1/4 ) + · · · où Θ(y) = P p≤y log p. Exercice 79. En notant M (z) = P d≤z µ(d), montrer que M (x) + M (x/2) + M (x/3) + M (x/4) + · · · = 1 pour tout réel x ≥ 1. Exercice 80. (Iseki & Tatuzawa) Soit F une fonction de la variable réelle. Nous définissons X G(x) = (log x) F (x/n). DR n≤x Montrer que F (x) log x + X F (x/n)Λ(n) = n≤x X µ(d)G(x/d). d≤x Indication : On pourra partir de X X x µ(d) log F (x) log x = F (x/n) n n≤x et utiliser X d|n µ(d) log d|n n = Λ(n). d Exercice 81. ⋄ 1 ⋄ Utiliser la formule d’Iseki & Tatuzawa de l’exercice précédent avec F1 (x) = ψ(x) et F2 (x) = x − γ − 1 pour montrer la formule de Selberg : X ψ(x) log x + Λ(n)ψ(x/n) = 2x log x + O(x). n≤x Le cours de Nouakchott 25 novembre 2012 CHAPITRE 5. LES ESTIMATIONS DE MERTENS 42 ⋄ 2 ⋄ Utiliser la formule d’Iseki & Tatuzawa de l’exercice précédent pour montrer : X M (x) log x + Λ(n)M (x/n) = O(x). DR AF T n≤x 25 novembre 2012 Version 2 Chapitre 6 AF T Taille de la fonction nombre de diviseurs Commençons par l’expression explicite de la fonction (nombre) de diviseurs : Y Y i (αi + 1). (6.1) (pi 6= pj si i 6= j), d(n) = pα n= i , i i Théorème 6.1 log d(n) ≪ log(3n)/ log log(3n) Démonstration. Nous écrivons X X X log d(n) = αi . log(αi + 1) + 2 log(αi + 1) ≤ α α pi i kn pi i kn, pi ≤P α pi i kn, pi ≥P DR i Posons qi = pα i . Les qi sont premiers entre eux. Par conséquent, la deuxième somme, disons R, vérifie P R ≤ n, i.e. X αi ≤ (log n)/ log P. α pi i kn, pi ≥P Concernant la première somme, nous écrivons simplement X X P log(αi + 1) ≤ log log(3n) 1 ≪ log log(3n) . log P αi pi kn, pi ≤P Le choix P = p≤P log(3n) (log log(3n))2 donne le résultat. Exercice 83. Montrer qu’il existe une suite (nk ) tendant vers l’infini et telle que d(nk ) log log nk > 0. lim inf log nk Quelle est la meilleure minoration possible ? CHAPITRE 6. NOMBRE DE DIVISEURS 44 Exercice 84. Montrer qu’il existe une constante c1 > 0 telle que, pour tout entier q, on a q/ϕ(q) ≤ c1 log log 3q. P Indication : On peut partir de log(q/ϕ(q)) = − p|q log(1−1/p) puis séparer le traitement des p ≤ P = log q de ceux qui sont plus grands. Ces derniers sont peu nombreux. Exercice 85. Montrer qu’il existe une constante c2 > 0 telle que, pour tout entier q, on a X1 ≤ c2 log log log 9q. p p|q AF T Indication : On pourra utiliser un procédé similaire à celui de l’exercice 84. Exercice 86. Montrer pour tout entier q, on a σ(q) ≤ q(1 + log q) Montrer en outre qu’il existe une constante c3 > 0 telle que, pour tout entier q, on a X d ≤ c3 q log log(9q). σ(q) = d|q Montrer que cette majoration est la meilleure possible à la constante multiplicative c3 près. Indication : On pourra d’abord montrer que σ est multiplicative, en déduire une expression explicite et enfin considérer log(σ(n)/n). On pourra utiliser un procédé similaire à celui de l’exercice 84 ou utiliser l’exercice 85. Exercice 87. DR ⋄ 1 ⋄ Soit D l’ensemble des entiers n’ayant que des facteurs premiers ≤ D où D est un paramètre ≥ 1. Montrer que X 1/d ≪ log(2D). d∈D ⋄ 2 ⋄ Montrer que, pour tout q ≥ 1, nous avons X τ (m)q ≤ τ (d)q−1 τ (k)q−1 dk=m ⋄ 3 ⋄ Soit D l’ensemble des entiers n’ayant que des facteurs premiers ≤ D où D est un paramètre ≥ 1. Montrer que, pour tout q paramètre entier ≥ 1, nous avons X q τ (m)q /m ≪ (log(2D))2 . m∈D Indication : On pourra procéder par récurrence sur q. ⋄ 4 ⋄ Soit D est un paramètre ≥ 1 fixé et soit τD (n) le nombre de diviseurs de n qui sont ≤ D. Soit q ≥ 1 un paramètre. Montrer que X q τD (n)q ≪ X(log(2D))2 . n≤X 25 novembre 2012 Version 2 45 Indication : On pourra noter k(n), pour tout entier n, le plus grand diviseur de n dans D. Exercice 91. Nous notons ici τr (n) le nombre r-uplets d’entiers (n1 , n2 , · · · , nr ) tels que n1 n2 · · · nr = n. ⋄ 1 ⋄ Calculer τr (pa ) lorsque p est un nombre premier. ⋄ 2 ⋄ Montrer que τr (n)2 /n ≤ (log N + 1)r 2 AF T X n≤N Indication : On pourra utiliser τr (n1 n2 · · · nr ) ≤ τr (n1 )τr (n2 ) · · · τr (nr ) que l’on prendra soin de démontrer. ⋄ 3 ⋄ Montrer que X n≤N τr (n)2 ≪r N (log N + 1)r 2 −1 où le symbole ≪r signifie que la valeur absolue du membre de gauche est inférieure au membre de droite multiplié par une constante qui peut dépendre de r. DR Exercice 94. Montrer que la série X µ(n) r n≥1 ϕ(n) est convergente pour tout entier r ≥ 2. Exercice 95. Montrer que d(n) ≤ 2 X 1. δ|n, √ δ≤ n Exercice 96. (B. Landreau sur une idée de van der Corput) Montrer que pour tout entier k ≥ 1, et tout réel s > 0, nous avons X dks (δ). ds (n) ≤ k k(k−1)s δ|n, δ≤n1/k Le cours de Nouakchott 25 novembre 2012 CHAPITRE 6. NOMBRE DE DIVISEURS 46 Indication : On définira la fonction auxiliaire X dks (δ) G(n) = δ|n, δ≤n1/k et on montrera d’abord que cette fonction est sur-multiplicative, i.e. que G(n1 n2 ) ≥ G(n1 )G(n2 ) si pgcd(n1 , n2 ) = 1. On établira ensuite que ds (pν ) ≤ dks (p[ν/k] ) ≤ G(pν ) lorsque ν ≥ k et que ds ((p1 · · · pr )ν ) ≤ k ks G((p1 · · · pr )ν ) lorsque ν < k, car, si r < k, nous avons ds (n) ≤ k ks et si r ≥ k, ds (n) ≤ k ks dks ((p1 · · · p[r/k] )ν ) (et en rangeant p1 < p2 < · · · < pr , on a (p1 · · · p[r/k] )ν ≤ n1/k ). DR AF T Voir (Bordellès, 2006) pour une application. 25 novembre 2012 Version 2 Chapitre 7 AF T La méthode de convolution Nous présentons ici une méthode classique sur un exemple qui concerne la fonction Y (p − 2). (7.1) f0 (n) = p|n La suite de ses valeurs sur les entiers entre 1 et 54, que voici 1, 0, 1, 0, 3, 0, 5, 0, 1, 0, 9, 0, 11, 0, 3, 0, 15, 0, 17, 0, 5, 0, 21, 0, 3, 0, 1, 0, 27, 0, 29, 0, 9, 0, 15, 0, 35, 0, 11, 0, 39, 0, 41, 0, 3, 0, 45, 0, 5, 0, 15, 0, 51, 0, ne nous informe que peu, même si nous nous contentons de cette suite sur les entiers impairs de ce même intervalle : 1, 1, 3, 5, 1, 9, 11, 3, 15, 17, 5, 21, 3, 1, 27, 29, 9, 15, 35, 11, 39, 41, 3, 45, 5, 15, 51. DR Pour obtenir plus d’informations, nous pouvons P chercher à déterminer son ordre moyen, soit une approximation de (1/X) n≤X f0 (n). Et une régularité apparaı̂t ici. Nous allons en effet démontrer que Théorème 7.1 Soit X un réel positif. Pour tout σ réel dans ]1/2, 1], nous avons X (1/X) f0 (n) = C X + O(X σ ) n≤X où la constante impliquée dans le symbole O dépend de σ et où Y 3 C = 21 1− = 0.14630 · · · p(p + 1) p≥2 Remarquons que comme cela est le cas pour les équivalents, nous choisissons comme ordre moyen une fonction “bien comprise” et “assez simple”, qui permette de surcroı̂t d’avoir un terme d’erreur assez petit. Quant à savoir ce qu’est une fonction “assez simple”, cela dépend évidemment des auteurs ! Dans cet énoncé et de façon systématique dans la suite, la lettre p désigne un nombre premier. La méthode que nous proposons appartient au folklore et n’a fait lieu d’aucune exposition systématique, pour autant que nous sachions. Elle est très CHAPITRE 7. LA MÉTHODE DE CONVOLUTION 48 DR AF T souple dans son utilisation et donne accès à de très bons termes d’erreur. Il s’est développé depuis les années 50 une théorie complète pour évaluer les ordres moyens de fonctions multiplicatives (voir plus loin pour une définition), mais celle-ci s’est surtout orientée vers une extension maximale de la classe considérée plutôt que vers la qualité du terme d’erreur. Citons les théorèmes de Ikehara généralisé par Delange (Delange, 1954), le théorème de Wirsing (Wirsing, 1961), un autre résultat de Delange (Delange, 1961), et le travail exceptionnel de (Halász, 1968). Le lecteur trouvera dans les livres de Ellison & Mendès France (Ellison, 1975) et de Tenenbaum (Tenenbaum, 1995) des expositions pédagogiques de ce matériel. Signalons encore qu’il nous serait très facile de remplacer le O dans ce théorème par une inégalité effective. Il est un peu plus difficile de certifier la valeur numérique de C que nous avançons, mais nous laissons ici ce problème de côté. Présentons à présent les grandes lignes de la méthode de convolution. Il s’agit de déterminer l’ordre moyen d’une fonction arithmétique f . Pour cela, nous prenons une fonction “modèle” g, qui ressemble à f et dont nous connaissons l’ordre moyen. Le modèle pour f0 sera la fonction qui à n associe n, dont nous connaissons évidemment un ordre moyen. Comment qualifier le fait que g soit un modèle pour f ? Nous allons définir un produit de convolution ⋆ et montrer qu’il existe une fonction h vérifiant f = h ⋆ g, et où h sera “plus petite” que f . L’ordre moyen de f s’obtiendra alors en déterminant celui de h ⋆ g, lequel sera essentiellement gouverné par celui de g. Glissons ici un mot à propos du choix de la fonction f0 . Cette fonction n’a a priori aucune interprétation géométrique ; ce n’est pas tout à fait vrai puisque sa valeur sur un entier sans facteurs carrés, disons q, est le nombre de caractères de Dirichlet primitifs modulo q. Nous avons précisément choisi f0 pour son côté “quelconque” ; sa forme particulière nous permet aussi de simplifier certaines parties de l’exposition. La preuve en elle-même est très courte et fait l’objet de la section 7.1, mais nous détaillons avant les notions utilisées. Nous tenons ici à remercier chaleureusement Hervé Queffelec pour ses indications et ses remarques qui nous ont été essentielles pour rédiger cet article. 7.1 Preuve du théorème 7.1 Première étape Commençons par expliciter la série de Dirichlet de f0 , et notamment son expression sous forme de produit eulérien. Nous avons, par définition : Q Y X ℓ|pk (ℓ − 2) D(f0 , s) = . pks p≥2 k≥0 Regardons de plus près chaque facteur. Dans la somme portant sur k, la contribution correspondant à k = 0 est exceptionnelle et vaut 1 ; le facteur eulérien en p devient : Q X ℓ|pk (ℓ − 2) 1+ . pks k≥1 25 novembre 2012 Version 2 7.1 Preuve du théorème 7.1 49 Or ℓ et p sont des nombres premiers, ce qui implique que ℓ = p. Il nous reste X k≥1 (p − 2)/pks = p−2 . ps − 1 Voici donc la série de Dirichlet associée à f0 : Y p−2 D(f0 , s) = 1+ s . p −1 (7.2) p≥2 p≥2 AF T Q Nous remarquons que ce produit ressemble à p≥2 1 + ps−11 −1 qui, lui, correspond à ζ(s − 1). Entreprenons par conséquent de sortir ce facteur de notre produit. Nous écrivons Y Y 2ps−1 + p − 3 1 p−2 = 1− s D(f0 , s) = 1+ s p −1 (p − 1)ps−1 1 − 1/ps−1 p≥2 = H(s)ζ(s − 1). (7.3) DR Le produit définissant H(s) converge absolument pour les s pour lesquels P 2ps−1 +p−3 la série (ps −1)ps−1 converge absolument, ce qui a lieu au moins, en étendant cette somme à tous les entiers, pour s > 3/2. L’abscisse de convergence absolue de ζ(s − 1) est égale à 2, c’est aussi probablement celle de D(f0 , s), tant et si bien que la série H converge effectivement dans un domaine plus large. Si nous réalisons la série H comme la série de Dirichlet d’une fonction, alors celle-ci sera bel et bien plus petite que f0 , au sens que nous avons donné à cette expression au paragraphe 2.2. Commentons plus avant le terme probablement ci-dessus. Remarquons tout d’abord que nous n’utilisons cette notion de taille que pour nous guider dans les calculs et qu’un contrôle heuristique nous suffit. Mais nous pouvons aussi montrer à posteriori que l’abscisse de convergence (et donc de convergence absolue ici puisque f0 est positive ou nulle) est effectivement égale à 2. En effet, supposons le théorème 7.1 démontré. Une sommation par parties nous donne Z N 1 X X dt s + s f0 (n)/n = f0 (n) s+1 Ns n t 1≤n≤N 1≤n≤N P Z N X dt 1≤n≤N f0 (n) + s f0 (n) s+1 (7.4) = Ns t n 1≤n≤t Z N Z N dt 1+σ−s s−σ 2−s + O(N ) + O . dt/t = CN + sC ts−1 1 1 En prenant σ = 0.6 par exemple, nous constatons bien que la série définissant D(f0 , s) converge pour s > 2 et diverge pour s < 2. Nous poursuivons cette discussion dans la dernière section de cet article. Deuxième étape Il faut maintenant transformer les deux fonctions obtenue H(s) et G(s) = ζ(s − 1) en série de Dirichlet. Le cas de G est facile puisque G(s) = D(θ1 , s). Le cours de Nouakchott 25 novembre 2012 CHAPITRE 7. LA MÉTHODE DE CONVOLUTION 50 Tournons-nous à présent vers H. Nous cherchons une fonction h telle que X H(s) = h(n)/ns (7.5) n≥1 et nous limitons notre recherche à des fonctions multiplicatives. Nous cherchons donc h telle que : X h(pk ) 2ps−1 + p − 3 =1− s . (7.6) ks p (p − 1)ps−1 k≥0 − AF T La condition h(1) = 1 permet de régler le cas k = 0. Il nous reste à nous occuper de la somme correspondant à k ≥ 1. Nous posons z = 1/ps , et obtenons pour le membre de droite de (7.6) la fraction rationnelle en z suivante : 2 pz ( 1z +p−3 − 1 1) pz = X X 2z + p2 z 2 − 3pz 2 = −2 z k − (p2 − 3p) zk. z−1 k≥1 k≥2 En identifiant termes à termes, nous constatons alors que la fonction multiplicative h définie par h(p) = −2, (7.7) h(pk ) = −(p2 − 3p + 2) pour k ≥ 2, résout notre problème. Troisième étape DR Comme D(f0 , s) = H(s)ζ(s − 1), et que l’on sait développer en série de Dirichlet H(s) et ζ(s − 1), on a un produit de deux séries de Dirichlet, qui correspond donc à un produit de convolution arithmétique. La propriété 3 nous permet d’identifier termes à termes et de conclure que f0 = θ1 ⋆ h. Nous présentons ici une autre méthode plus pédestre. Considérons la fonction multiplicative h définie par (7.7) et rappelons que θ1 est la fonction n 7→ n. Nous remarquons que : θ1 ⋆ h est encore une fonction multiplicative, qui est par conséquent définie par ses valeurs prises sur les puissances des nombres premiers. Or, pour p nombre premier et k entier naturel ≥ 1 : (θ1 ⋆ h)(pk ) = X θ1 ( ℓ/pk X pk pk )h(ℓ) = h(ℓ) ℓ ℓ k ℓ/p X p2 − 3p + 2 2 k = f (pk ). =p 1− − p pt 2≤t≤k Par multiplicativité, cela implique bien f0 (n) = (θ1 ⋆ h)(n). Nous écrivons cette identité sous forme déployée pour la suite : X X f0 (n) = h(ℓ)θ1 (m) = h(ℓ)m. ℓm=n ℓm=n Amorçons maintenant le calcul de l’ordre moyen de f0 . L’égalité ci-dessus nous donne X X X X m. (7.8) f0 (n) = h(ℓ)m = h(ℓ) n≤X 25 novembre 2012 ℓm≤X ℓ≤X m≤X/ℓ Version 2 7.2 Un exercice de sommations par parties 51 Or, nous savons que, pour tout entier naturel N : X n = N (N + 1)/2, n≤N ce qui implique que, pour M ≥ 1 que nous prenons cette fois-ci réel : X m = 12 M (M + 1) + O(M ) = 12 M 2 + O(M ). (7.9) m≤M AF T Remarquons tout d’abord que cette estimée est valable dès que M est positif ou nul. Il se trouve que la méthode que nous proposons se simplifie beaucoup si nous nous contentons d’un terme d’erreur moins fort. L’estimation (7.9) implique en effet aussi que X m = 21 M 2 + O(M σ ) (7.10) m≤M pour tout σ ∈ [1, 2] et tout M ≥ 0. Nous disposons alors de tous les outils pour conclure. Nous reprenons la preuve à l’équation (7.8) et constatons que la condition ℓ ≤ X est superflue. Il vient alors directement X X |h(ℓ)| X 2 X h(ℓ) σ f0 (n) = + O X . 2 ℓ2 ℓσ n≤X ℓ≥1 ℓ≥1 P Comme H(s) converge absolument pour s > 3/2, la somme ℓ≤1 |h(ℓ)|/ℓσ est finie pour tout σ > 3/2. La preuve du théorème 7.1 est terminée, quitte à renommer σ. Pour le même prix . . . DR Le lecteur pourra, en suivant une méthode identique à celle proposée dans la démonstration du théorème 7.1, trouver l’ordre moyen de la fonction ϕ. 7.2 Un exercice de sommations par parties Afin d’illustrer plus avant cette technique, anticipons sur la preuve du théorème 7.1 et démontrons dès à présent le corollaire suivant du théorème 7.1 : Théorème P 7.2 Nous avons n≤X f0 (n)/n = 2C X + O(X σ ) pour tout σ réel dans ]1/2, 1]. Voici une façon plus usuelle d’énoncer le théorème précédent : Théorème 7.3 P 1 Pour tout ε > 0, nous avons n≤X f0 (n)/n = 2C X + O(X 2 +ε ). Démonstration. En effet, nous utilisons (3.3) pour obtenir : Z X P Z XX 1 X X dt dt n≤X f0 (n) = + + f0 (n) 2 f0 (n)/n = f0 (n) 2 X X t n t 1 n≤t n≤X n≤X Z X Z X = C X + O(X σ ) + C dt + O tσ−1 dt 1 1 ce qui nous donne bien le résultat annoncé. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 7. LA MÉTHODE DE CONVOLUTION 52 7.3 Être sans facteurs carrés Dans le même ordre d’idées, la condition ”être sans facteurs carrés” est elle aussi souvent assez simple à traiter grâce à l’identité ( X 1 si µ2 (n) = 1 µ(d) = (7.11) 0 sinon. 2 d |n AF T P Démonstration. La fonction qui à n associe d2 |n µ(d) et la fonction caractéristique des entiers sans facteurs carrés sont toutes les deux multiplicatives. Il suffit dès lors d’établir leur égalité sur les puissances de nombres premiers, mais c’est évident. L’identité (7.11) est intéressante en ce que d est beaucoup plus petit que n. Voici une utilisation : X X X X X µ(d) 1 µ2 (n) = µ(d) = √ d≤ N n≤N d2 |n n≤N = X √ d≤ N n≤N, d2 |n N µ(d) 2 + O∗ (1) . d P Maintenant, comme |µ(d)| ≤ 1, nous avons d’une part d≤√N µ(d)O∗ (1) = √ O∗ ( N ) et d’autre part X X µ(d) X µ(d) 2 ∗ 1/d = + O d2 d2 √ √ d≥1 d≤ N d> N DR et une √ comparaison à une intégrale nous garantit que le dernier O est au plus 1/( N − 1). En définitive X µ2 (n) = n≤N car X µ(d) d≥1 d2 = Y √ 6 N + O( N ) 2 π (7.12) (1 − p−2 ) = 1/ζ(2) = 6/π 2 . (7.13) p≥2 Exercice 97. Montrer qu’il existe une constante C telle que l’on ait X µ2 (n) √ 6 = 2 log X + C + O((log X)/ X). n π n≤X Exercice 98. Donner un asympotique pour X µ2 (n) n n≤X, (n,d)=1 où d est un paramètre entier. 25 novembre 2012 Version 2 Chapitre 8 AF T Exemples et pratique Ce chapitre commence par expliciter la méthode de convolution sur trois exemples, et ce parce que les mécanismes de manipulation des expressions arithmétiques en jeu sont fondamentaux pour comprendre les développements subséquents. 8.1 Trois exemples Nous partons d’une fonction multiplicative f : N \ {0} → C pour laquelle nous définissons Y X f (pk ) X f (n) . (8.1) = D(f, s) = ns pks p≥2 n≥1 k≥0 DR Souvent, la fonction f est assez “proche” d’une fonction connue, et c’est cette idée que nous mettons ici en pratique sur trois exemples. Approximation des séries de Dirichlet Q Exemple 1. f1 (n) = p|n (p − 2). Il vient Y Y 2ps−1 + p − 3 1 p−2 = 1− s D(f1 , s) = 1+ s s−1 p −1 (p − 1)p 1 − 1/ps−1 p≥2 p≥2 = C1 (s)ζ(s − 1) où C1 (s) est holomorphe pour ℜs > 32 . Cette écriture montre que D(f1 , s) est méromorphe pour ℜs > 23 et admet un pôle simple en s = 2. — Exemple 2. f2 (n) = µ2 (n)/ϕ(n). Il vient Y 1 D(f2 , s) = 1+ (p − 1)ps p≥2 Y 1 1 1 − = 1− (p − 1)ps+1 (p − 1)p2s+1 1 − 1/ps+1 p≥2 = C2 (s)ζ(s + 1) CHAPITRE 8. EXEMPLES ET PRATIQUE 54 où C2 (s) est holomorphe pour ℜs > − 12 . Cette écriture montre que D(f2 , s) est méromorphe pour ℜs > − 21 et admet un pôle simple en s = 0. — Exemple 3. f3 (n) = 2Ω(n) . Il vient D(f3 , s) = Y 1 1 = 1 + ζ 2 (s) 2 2s − 2ps p 1 − ps p≥2 p≥2 Y = C3 (s)ζ 2 (s) AF T où C3 (s) est holomorphe pour ℜs > 21 . Cette écriture montre que D(f3 , s) est méromorphe pour ℜs > 21 et admet un pôle double en s = 1. — Nous développons alors les Ci en séries de Dirichlet : X gi (n) ns Ci (s) = (8.2) n≥1 où les fonctions gi sont bien sûr multiplicatives. Pour obtenir leurs valeurs exactes, il suffit d’identifier les coefficients dans le développement du facteur local en série de p−s . Nous obtenons ainsi ( 1 g2 (p) = g2 (p2 ) = − g1 (p) = −2 p(p − 1) g1 (pk ) = −(p2 − 3p + 2), (k ≥ 2) g2 (pk ) = 0, (k ≥ 3) ainsi que ( g3 (p) = 0 g3 (pk ) = 2k−2 , (k ≥ 2) DR Nous posons aussi Ci (s) = X |gi (n)| n (8.3) ns et il se trouve que ces séries convergent encore là où nous avons montré que chaque Ci existait, c’est à dire respectivement pour ℜs > 3/2, ℜs > −1/2 et ℜs > 1/2. Ordre moyen de f1 Occupons-nous à présent des ordres moyens. La traduction sur les coefficients de D(f1 , s) = C1 (s)ζ(s − 1) nous donne X f1 (n) = g1 (ℓ)m ℓm=n et par conséquent X 2 X 1 X +O g1 (ℓ) 2 ℓ ℓ ℓm≤X ℓ≤X X |g1 (ℓ)| X 2 X g1 (ℓ) + O X = 2 ℓ2 ℓ f1 (n) = n≤X X g1 (ℓ)m = ℓ≤X 25 novembre 2012 X ℓ≤X Version 2 8.1 Trois exemples 55 Nous utilisons alors la méthode de Rankin : Il s’agit de remplacer la fonction indicatrice des ℓ > X, qui n’est évidemment pas multiplicative, par (ℓ/X)a où a > 0 est à choisir. En l’occurrence, ici, nous prenons a = 21 − ε pour un ε > 0 qui va tendre vers 0. X X g1 (ℓ) X g1 (ℓ) |g1 (ℓ)| = +O ℓ2 ℓ2 ℓ2 ℓ≥1 ℓ>X ℓ≤X X |g1 (ℓ)| 1 = C1 (2) + O 3 1 ℓ 2 +ε X 2 −ε ℓ>X AF T P 3 pour tout ε > 0. Ensuite nous nous contentons de majorer ℓ>X |g1 (ℓ)|/ℓ 2 +ε P par la somme complète, soit C1 (3/2 + ε). ce qui nous donne ℓ≤X g1 (ℓ)/ℓ2 = 1 C1 (2) + Oε X − 2 +ε . Le O dépend bien sûr de ε car C1 (3/2 + ε) n’est en aucun cas borné lorsque ε tend vers 0. ∗ Pareillement, nous écrivons X |g1 (ℓ)| X |g1 (ℓ)| 1 1 ≪ε X 2 +ε ≤ X 2 +ε 3 +ε ℓ 2 ℓ ℓ≤X ℓ≤X (ε > 0) où nous avons encore une fois étendu la dernière somme à tous les entiers ℓ > 1. Soit finalement, pour tout ε > 0, X f1 (n) = C1 (2) n≤X 1 X2 + Oε X 2 +ε . 2 (8.4) DR Bien sûr, un traitement plus précis que celui que nous donnons par la méthode de Rankin permettrait de remplacer ce X ε par une puissance de logarithme, ici par log X, mais la méthode ci-dessus a l’avantage d’une grande simplicité. Ordre moyen de f2 Pour ce qui est de l’ordre moyen de f2 , nous procédons comme ci-dessus. Il vient X X X X ℓ 1 +γ+O g2 (ℓ) log f2 (n) = g2 (ℓ) = m ℓ X ℓ≤X n≤X ℓm≤X X X X 1 = log X + γ g2 (ℓ) − g2 (ℓ) log ℓ + O |g2 (ℓ)|ℓ X ℓ≤X ℓ≤X ℓ≤X où γ est la constante d’Euler. Le programme précédent s’applique moyennant de rappeler que X g2 (ℓ) log ℓ X |g2 (ℓ)| log ℓ resp. − − ℓs ℓs ℓ≥1 ℓ≥1 ∗. Pour un traitement plus fin, il suffit de remarquer que C1 admet un pôle double en 3/2 1 1 ce qui fait que le Oε X − 2 +ε est en fait O X − 2 +ε /ε2 et en prenant ε = 1/ log X, nous √ 2 obtenons O (log X) / X . Le cours de Nouakchott 25 novembre 2012 CHAPITRE 8. EXEMPLES ET PRATIQUE 56 est simplement la dérivée de C2 (s) (resp. C2 (s)) et que cette série admet la même abscisse de convergence absolue que la série initiale. Nous obtenons alors X n≤X 1 1 f2 (n) = log X + γ C2 (0) + Oε (X − 2 +ε ) + C2′ (0) + Oε (X − 2 +ε ). Ordre moyen de f3 Il nous reste à nous occuper de C3 (s). Nous avons cette fois-ci X X f3 (n) = g3 (ℓ)d(m) n≤X AF T ℓm≤X où d(m) est le nombre de diviseurs de m. Nous avons de façon classique (voir lemme 8.2) : X d(m) = M log M + (2γ − 1)M + O(M 1/2 ) m≤M et donc X n≤X f3 (n) = X ℓ≤X g3 (ℓ) X X 1/2 log(X/ℓ) + (2γ − 1) + O((X/ℓ) ) ℓ ℓ X g3 (ℓ) log ℓ X g3 (ℓ) −X ℓ ℓ ℓ≤X ℓ≤X √ √ X +O X |g3 (ℓ)|/ ℓ = (X log X + 2γ − 1) ℓ≤X 1 DR = (X log X + 2γ − 1)C3 (1) + XC3′ (1) + Oε X 2 +ε en suivant les étapes précédentes. 8.2 Un théorème général. Le lemme suivant est une généralisation d’un lemme de (Riesel & Vaughan, 1983) et se trouve dans (Ramaré, 1995). L’un des aspects essentiels de cette question tient dans la nature complètement explicite des termes d’erreur. Lemme 8.1 SoitPg, h et k trois fonctionsPsur N \ {0} à valeurs complexes. −s −s , et H(s) = . Supposons que g = Posons H(s) = n h(n)n n |h(n)|n h ⋆ k, que H(s) soit convergente pour ℜ(s) ≥ −1/3 et enfin qu’il existe quatre constantes A, B, C et D telles que X k(n) = A log2 t + B log t + C + O(Dt−1/3 ) pour t > 0; n≤t Alors, pour tout t > 0, nous avons : X g(n) = u log2 t + v log t + w + O(Dt−1/3 H(−1/3)) n≤t 25 novembre 2012 Version 2 8.2 Un théorème général. 57 avec u = AH(0), v = 2AH ′ (0) + BH(0) and w = AH ′′ (0) + BH ′ (0) + CH(0). Nous avons aussi X ng(n) = U t log t + V t + W + O(2.5Dt2/3 H(−1/3)) n≤t avec ( V = −2AH(0) + 2AH ′ (0) + BH(0), U =AH(0), W =A(H ′′ (0) − 2H ′ (0) + 2H(0)) + B(H ′ (0) − H(0)) + CH(0). AF T P P P Démonstration. Écrivons ℓ≤t g(ℓ) = m h(m) n≤t/m k(n), et toute la régularité de nos expresions vient de ce qu’il n’est pas nécessaire d’imposer m ≤ t dans P alors la preuve facilement m h(m). Nous complétons P Pour estimer ℓ≤t ℓg(ℓ) for t > 0, nous écrivons X ℓg(ℓ) = t ℓ≤t X ℓ≤t Z tX g(ℓ) − et utilisons l’expression asymptotique de g(ℓ)du, 1 ℓ≤u P ℓ≤u g(ℓ). Pour appliquer le lemme précédent, nous aurons besoin de Lemme 8.2 Pour tout t > 0, nous avons X1 = log t + γ + O 0.9105t−1/3 . n n≤t DR Soit d(n) le nombre de diviseurs de n. Pour tout t > 0, nous avons X d(n) n≤t n = 1 log2 t + 2γ log t + γ 2 − γ1 + O 1.641t−1/3 , 2 avec X log m log2 n . − γ1 = lim n→∞ m 2 m≤n (−0.072816 < γ1 < −0.072815). Démonstration. La preuve de la seconde partie de ce lemme se trouve dans le papier de (Riesel & Vaughan, 1983) cité ci-dessous (Lemma 1). Pour la première partie, rappelons que | X1 7 − log t − γ| ≤ pour t ≥ 1. n 12t n≤t Pour 0 < t < 1, nous choisissons a > 0 tel que log t+ γ + a t−1/3 ≥ 0. Cette fonction décroı̂t de 0 à (a/3)3 et ensuite croı̂t. Cela nous donne la valeur minimale a = 3 exp(−γ/3 − 1) ≤ 0.9105. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 8. EXEMPLES ET PRATIQUE 58 Dans la pratique, la fonction g sera multiplicative et vérifiera gp = b/p + P −s b o(1/p) avec b = 1 or 2. Dans ce cas, nous prenons k(n)n P P = ζ(s+1) et h est la fonction multiplicative déterminée par h(n)n−s = g(n)n−s ζ(s + 1)−b . Lorsque h est multiplicative, nous avons H(0) = Y (1 + p et H ′′ (0) = H(0) 8.3 h(pm )), m P mh(pm ) H ′ (0) X m P (− log p), = H(0) 1 + m h(pm ) p AF T ainsi que X H ′ (0) H(0) 2 2 P X P m2 h(pm ) mh(pm ) m mP P log2 p. − + m) m) h(p h(p 1 + 1 + m m p Un quatrième exemple détaillé Lemme 8.3 Pour tout X > 0 et tout entier d ≥ 1, la fonction X µ2 (n) ϕ(n) n≤X (n,d)=1 est approximée par X log p X log p ϕ(d) log X + γ + + O(7.284X −1/3 f1 (d)) + d p(p − 1) p DR p≥2 p|d avec f1 (d) = Y p1/3 + p2/3 −1 (1 + p−2/3 ) 1 + . p(p − 1) p|d Remarque : La somme de gauche est Gd (X). Le cas d = 1 a déjà été étudié plus haut. La série de Dirichlet associée est X µ2 (n) ζ(s) Y 1 = 1+ ϕ(n)ns−1 ζ(2s) (p − 1)(ps + 1) n p≥2 ce qui fait que le terme d’erreur O(X −1/2 ) est admissible (notre méthode pourrait donner O(X −1/2 log2 X)), et que nous ne pouvons espérer mieux que O(X −3/4 ). Rosser & Schoenfeld ((Rosser & Schoenfeld, 1962) équation (2.11)) nous donne X log p γ+ = 1.332 582 275 332 21... p(p − 1) p≥2 25 novembre 2012 Version 2 8.3 Un quatrième exemple détaillé 59 Démonstration. Définissons la fonction multiplicative hd par hd (p) = 1 , p(p − 1) hd (p2 ) = −1 , p(p − 1) hd (pm ) = 0 si m ≥ 3, si p est un nombre premier qui ne divise pas d, et par hd (pm ) = m ≥ 1 si p est un facteur premier de d. Nous avons alors µ(pm ) pm pour tout X µ2 (n) X hd (n) ζ(s + 1) = ns ϕ(n)ns n≥1 (n,d)=1 AF T n≥1 ce qui nous permet d’appliquer le lemme 2. Nous vérifions que Y p1/3 + p2/3 ≤ 8. 1+ p(p − 1) p≥2 Exercice 99. ⋄ 1 ⋄ Montrer que ⋄ 2 ⋄ Montrer que X ϕ(n) = (3/π 2 )x2 + O(x log x) pour x ≥ 2. n≤x X m,n≤x, pgcd(m,n)=1 1 = −1 + 2 X ϕ(n) n≤x et en conclure que le membre de gauche est égal à (6/π 2 )x2 + O(x log x). X σ(n) = (π 2 /12)x2 + O(x log x) pour x ≥ 2. DR Exercice 100. Montrer que n≤x Exercice 101. P ⋄ 1 ⋄ Montrer que 2ω(n) = d2 m=n µ(d)d(m). X √ ⋄ 2 ⋄ Montrer que 2ω(n) = (6/π 2 )x log x + cx + O( x log x) pour x ≥ 2 et n≤x où c = 2γ − 1 − 2ζ ′ (2)/ζ(2). X ⋄ 3 ⋄ Montrer que 2Ω(n) = Cx(log x)2 + O(x log x) pour x ≥ 2 pour une n≤x constante C > 0. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 8. EXEMPLES ET PRATIQUE DR AF T 60 25 novembre 2012 Version 2 Chapitre 9 9.1 AF T Le théorème de Levin-Fainleib et alia Une première borne supérieure Ce premier théorème est efficace lorsque l’ordre moyen de g sur les puissances de nombres premiers est proche de constant. Il existe de nombreuses versions de ce résultat, dont la plus précise est due à (Halberstam & Richert, 1979). Celle que nous présentons est une légère modification de ce qui est proposé dans le livre de Tenenbaum référencé à la fin de ce papier. L’idée de départ est tirée du célèbre article (Levin & Fainleib, 1967). Signalons ici l’article (Moree, 2004) qui explore et améliore le caractère explicite des deux théorèmes ci-dessous. DR Théorème 9.1 Soit D ≥ 2 un paramètre réel fixé. Supposons que g soit multiplicative et positive ou nulle, et que X g pν log pν ≤ KQ + K ′ (∀Q ∈ [1, D]) p≥2,ν≥1 pν ≤Q pour deux constantes K, K ′ ≥ 0. Alors X d≤D g(d) ≤ (K + 1) X D g(d)/d ′ log D − K d≤D pour D > exp K ′ . Démonstration. Posons G̃(D) = nous obtenons G(D) log D = X P g(d) log d≤D d≤D X D + g(d) log d d X g(d) + ≤D d d≤D g(d)/d. Alors, en utilisant log D d ≤ d≤D X p≥2,ν≥1 pν ≤D X g(ℓ) g pν log pν ℓ≤D/pν (ℓ,p)=1 D d, CHAPITRE 9. LE THÉORÈME DE LEVIN-FAINLEIB 62 où l’on obtient le second sommant en écrivant log d = X pν kd log pν . Finalement X p≥2,ν≥1 pν ≤D X X g(ℓ) = g(ℓ) g pν log rpν ℓ≤D/pν (ℓ,p)=1 ℓ≤D X p≥2,ν≥1 pν ≤D/ℓ (p,ℓ)=1 g(ℓ)K g pν log pν D ℓ AF T ≤ X ℓ≤D ce qui nous permet de conclure facilement. Théorème 9.2 Soit D ≥ 2 un paramètre réel fixé. Supposons que g soit multiplicative et positive ou nulle. Alors X d≤D X g(d)/d ≤ exp g(pν )/pν ν≥1, pν ≤D où la somme de droite porte sur tous les entiers ν ≥ 1 et tous les nombres premiers p, les deux vérifiant pν ≤ D. DR Démonstration. En effet, le développement du produit Y X p≤D 0≤ν contient tous les termes de la somme ration. Nous utilisons alors, à p fixé, log g(pν )/pν X 0≤ν P d≤D g(d)/d. Il s’agit donc d’une majo- X g(pν )/pν . g(pν )/pν ≤ 1≤ν Exercice 102. Supposons que g soit multiplicative et positive ou nulle et vérifie 0 ≤ g(p) ≤ λ < 1 pour tous nombres premiers p et où λ est un paramètre fixé. Nous avons Y X µ2 (d)g(d) g(p) . ≥ (1 − λ) 1+ d p d≤D 25 novembre 2012 p≤D Version 2 9.2 Une formule asymptotique Indication : On utilisera l’inegalité D ≥ 1. Nous avons 63 P p≤D (log p)/p Y X µ2 (d)g(d) g(p) − = 1+ d p p≤D d≤D ≤ log D, valable pour X n>D, P + (n)≤D µ2 (n)f (n) n où P + (n) est le plus grand facteur premier de n. On pourra alors majorer le membre de droite par X AF T P + (n)≤D µ2 (n)f (n) log n . n log D Exercice 103. (A. Selberg) Nous considérons la somme S(x) = X µ(n) . n2ω(n) n≤x √ ⋄ 1 ⋄ Montrer qu’il existe une constante c0 > 0 telle que |S(x)| ≤ c0 / log x. ⋄ 2 ⋄ Montrer l’identité : xS(x) = X µ(n) n x o 1 + 2ω (n) 2ω(n) n n≤x n≤x X et en déduire que S(x) ≥ 0. Exercice 104. Montrer que −1 X1 Y ≤ 1 − 1/p . n n≤x p≤x DR log x ≤ En déduire que pour x ≥ 10, on a X1 ≥ log log x + O(1). p p≤x 9.2 Une formule asymptotique Notre second théorème s’applique lui aux fonctions multiplicatives g telles que g(p) ≃ κ/p pour un certain κ > 0. Ce second théorème demande des hypothèses bien plus fortes mais en échange nous prouvons une formule asymptotique. Sa preuve est à la base assez simple, mais se complique du fait que (i) nous prenons en compte la dépendance en certains paramètres des termes d’erreur (ii) nous tenons compte des valeurs de g sur les puissances de nombres premiers (iii) nous offrons un résultat complètement explicite. L’essentiel de ce théorème se trouve dans (Halberstam & Richert, 1971), et une présentation légèrement simplifiée dans le livre de ces deux mêmes auteurs. Théorème 9.3 Donnons-nous une fonction multiplicative g positive ou nulle Le cours de Nouakchott 25 novembre 2012 CHAPITRE 9. LE THÉORÈME DE LEVIN-FAINLEIB 64 et trois paramètres réels strictement positifs κ, L et A tels que X p≥2,ν≥1 w<pν ≤Q Q g pν log pν = κ log + O∗ (L) w (Q > w ≥ 1), X X g pk g pν log pν ≤ A. p≥2 ν,k≥1 X d≤D avec κ g(d) = C (log D) (1 + O∗ (B/ log D)) (D ≥ exp(2(L + A))) AF T Alors κ Y X 1 1 , 1− g pν Γ(κ + 1) p p≥2 ν≥0 B = 2(L + A) 1 + 2(κ + 1)eκ+1 C = Notons que dans la plupart des applications, si la dépendance en L peut s’avérer importante, celle en A est presque toujours sans intérêt. De plus (Rawsthorne, 1982) et (Greaves & Huxley, 1999) donnent des évaluations où seule la majoration est nécessaire. Démonstration. Le départ est similaire au précédent : G(D) log D = X g(d) log d≤D d≤D D g(d) log + d DR = X d≤D X D + g(d) log d d X p≥2,ν≥1 pν ≤D X g(ℓ) g pν log pν ℓ≤D/pν (ℓ,p)=1 et l’on pose X g(ℓ) Gp (X) = ℓ≤X ce qui nous donne (ℓ,p)=1 Z D X D dt T (D) = g(d) log = G(t) , d t 1 d≤D G(D) log(D) = T (D) + X p≥2,ν≥1 pν ≤D g pν log pν Gp (D/pν ). De plus, nous vérifions aisément que Gp (X) = G(X) − 25 novembre 2012 X Gp (X/pk ) k≥1 Version 2 9.2 Une formule asymptotique 65 ce qui, joint à nos hypothèse, nous donne X G(D) log(D) = T (D) + g pν log pν G(D/pν ) + O∗ (AG(D)) p≥2,ν≥1 pν ≤D = T (D) + X d≤D g(d) X p≥2,ν≥1 pν ≤D/d g pν log pν + O∗ (AG(D)) = T (D)(κ + 1) + O∗ ((L + A)G(D)) ce que nous réécrivons en avec r(D) = O∗ L+A log D AF T (κ + 1)T (D) = G(D) log D (1 + r(D)) que nous regardons comme une équation différentielle. Posons exp E(D) = (κ + 1)T (D) G(D) = (1 + r(D)) (log D)κ+1 (log D)κ ce qui nous donne pour D ≥ D0 = exp(2(L + A)) T ′ (D) (κ + 1) r(D)(κ + 1) ∗ 2(L + A) E (D) = − = =O T (D) D log D (1 − r(D))D log D D log D ′ 1 2 si D ≥ D0 . Il vient (D ≥ D0 ) : Z ∞ 2(L + A) E(∞) − E(D) = E ′ (t)dt = O∗ . log D D puisque |r(D)| ≤ Bref DR G(D) exp E(D) eE(∞) ∗ 2(L + A) κ+1 1 + O . = = (κ + 1)e (log D)κ 1 + r(D) 1 + r(D) log D Or 1/(1 + x) ≤ 1 + 2x si 0 ≤ x ≤ 21 d’où G(D) ∗ 2(L + A) κ+1 E(∞) 1+O 1 + 2(κ + 1)e =e (log D)κ log D pour D ≥ D0 , ce qui constitue l’essentiel de la démonstration. Il nous faut à présent expliciter eE(∞) = C. Remarquons tout d’abord que la preuve ci-dessus est a priori fausse car T ′ (D) 6= G(D)/D aux points de discontinuités de G, mais il nous suffit de travailler avec D non entier et de procéder par continuité. Expression de C : Pour ce qui est du calcul de la constante, nous avons pour s réel positif Z ∞ X g(d) dD G(D) s+1 = s D(g, s) = ds D 1 d≥1 Z ∞ Z ∞ κ dD κ−1 dD = sC (log D) s+1 + O sC (log D) D Ds+1 1 1 −κ 1−κ = C s Γ(κ + 1) + O(s Γ(κ)) Le cours de Nouakchott 25 novembre 2012 CHAPITRE 9. LE THÉORÈME DE LEVIN-FAINLEIB 66 et par conséquent C = lim+ D(g, s)sκ Γ(κ + 1)−1 = lim+ D(g, s)ζ(s + 1)−κ Γ(κ + 1)−1 . s→0 s→0 Il est alors assez facile de montrer que le produit Y X p≥2 ν≥0 g pν κ 1 1− p AF T est convergent et égale donc CΓ(κ + 1) comme voulu. Exercice 105. Montrer que, lorsque D tend vers l’infini, nous avons X 9ω(d) /ϕ(d) ∼ C(log D)9 d≤D où C est une constante > 0 que l’on explicitera. Exercice 106. ⋄ 1 ⋄ Donner un asymptotique de XX µ2 (n/d)3−ω(d) /n. DR n≤N d|n ⋄ 2 ⋄ Donner un asymptotique de XX µ2 (n/d)3−ω(d) /(n + 1). n≤N d|n Exercice 107. ⋄ 1 ⋄ Montrer que X µ2 (d) n = . ϕ(n) ϕ(d) d|n ⋄ 2 ⋄ Montrer que X n≤N n ζ(2)ζ(3) = N + O(log(2N )). ϕ(n) ζ(6) ⋄ 3 ⋄ Montrer qu’il existe une constante C telle que X n≤N 25 novembre 2012 ζ(2)ζ(3) 1 = log N + C + O(log(2N )/N ). ϕ(n) ζ(6) Version 2 9.2 Une formule asymptotique 67 ⋄ 4 ⋄ Montrer que X µ2 (d) log d dϕ(d) d≥1 = X p≥2 Y log p 1 1 + p2 − p + 1 p(p − 1) p≥2 et en déduire que la constante C de la question précédente est donnée par X ζ(2)ζ(3) log p C= γ− . ζ(6) p2 − p + 1 p≥2 AF T ⋄ 5 ⋄ Montrer que le terme d’erreur dans l’évaluation de la somme des 1/ϕ(n) ne peut être meilleur que O(1/N ). Exercice 110. Donner un asymptotique pour X 1/(1 + ϕ(d)). d≤D Indication : On pourra comparer cette série à Exercice 111. ⋄ 1 ⋄ Montrer que P d≤D 1/ϕ(d). ϕ(n) X µ(d) = n d d|n ⋄ 2 ⋄ Montrer que X ϕ(n) = CN + O(log(2N )) n DR n≤N pour une certaine constante que l’on calculera. ⋄ 3 ⋄ Montrer que X ϕ(n) = C log N + C2 + O(log(2N )/N ) n2 n≤N pour une certaine constante C2 (le tout étant valable pour N ≥ 1). Le cours de Nouakchott 25 novembre 2012 CHAPITRE 9. LE THÉORÈME DE LEVIN-FAINLEIB DR AF T 68 25 novembre 2012 Version 2 Chapitre 10 AF T Le théorème de Brun-Titchmarsh : une approche moderne Les dernières décennies ont vu des progrès immenses dans la compréhension des nombres premiers, presque tous dus à l’invention de la méthode du crible. Nous exposerons comment cette approche permet de majorer le nombre de premiers dans un intervalle [M + 1, M + N ] uniformément en M . 10.1 Des nombres premiers DR Commençons par rappeler que les nombres premiers sont ces entiers ≥ 2 qui ne sont divisibles par aucun entier ≥ 1, sauf évidemment par 1 et par eux mêmes. 5 est un nombre premier. Ces entiers permettent de comprendre parfaitement tous les problèmes multiplicatifs grâce à la décomposition en facteurs premiers : tout entier n s’écrit comme un produit de nombres premiers et cette écriture est unique à l’ordre des facteurs près. Dans la suite, la lettre p désignera toujours un nombre premier. Donc nous comprenons bien la multiplication des entiers, bien leur addition et en conséquence nous maı̂trisons aussi la soustraction et la division. Aussi nous tournons-nous vers le problème qui consiste à comparer ces deux structures. Il existe un lien : celui donné par la distributivité. Et si l’on ajoute (action du royaume additif) deux entiers divisibles pas 3 (propriété du royaume multiplicatif), on obtient un entier encore divisible par 3, c’est à dire que l’addition n’a pas détruit cette propriété additive ! Nous croyons à l’heure actuelle qu’il s’agit là du seul lien entre l’additif et le multiplicatif (excepté peut-être un autre lien ténu donné par la conjecture abc. Qui est largement hors sujet). Parmi les problèmes de base, nous voulons connaı̂tre le plus précisément possible le nombre de nombres premiers dans les intervalles [M + 1, M + N ]. Il s’agit encore d’un problème additif/multiplicatif, mais c’est un peu plus délicat à voir : être premier est bien une propriété multiplicative, et être inférieur à une borne donnée, disons X, est elle une propriété additive ! Il s’agit effectivement de la relation d’ordre liée à l’addition, et non celle liée à la multiplication qui CHAPITRE 10. UNE APPROCHE MODERNE 70 est la divisibilité. Le théorème des nombres premiers nous garantit que le nombre π(X) de nombres premiers ≤ X est ≃ X/ log X. En fait, nous disposons d’une approximation encore meilleure π(X) = Z 2 X dt + O(X/ log2 X) log t AF T Le 2 ci-dessus peut surprendre, et à voir la taille du terme d’erreur, nous pourrions le remplacer par n’importe quelle constante > 1. Comment dans ces conditions trouver une définition plus ”canonique” que les autres ? En analyse classique et numérique, on prend comme borne initiale 0 . . . Mais il faut réfléchir alors au sens de l’intégrale ! Ceci dit, le logarithme intégral est bien celui-ci, et RX c’est celui qui est tabulé, et non 2 dt/log t. À interpréter comme “un nombre est premier avec probabilité 1/ log t”. Cela règle le cas de l’intervalle initial, où M = 0. Exercice 112. Nous définissons la somme de Ramanujan modulo q par X cq (n) = e(na/q). 1≤a≤q, (pgcd(a,q)=1 P d|q cq (n) DR ⋄ 1 ⋄ Montrer que = qδq|n et en déduire que cq (n) = X µ(q/ℓ)ℓ. ℓ|n, ℓ|q ⋄ 2 ⋄ Montrer que, à n fixé, la fonction q 7→ cq (n) est multiplicative. On peut aussi montrer la multiplicativité en employant l’exercice 10. ⋄ 3 ⋄ Montrer que, à q fixé, la fonction n 7→ cq (n) est multiplicative si et seulement si µ(q) = 1. 10.2 Une approche “crible” La preuve donnant l’évaluation de π(X) est purement analytique. Si elle est précise dans son cas d’application, elle ne réussit pas à donner d’informations sur le nombre de nombres premiers dans un intervalle quelconque. Revenons donc aux bases. Dans I = [M + 1, M + N ], il y a N/2 + O(1) nombres pairs. En langage un peu flou, la probabilité qu’un entier de cet intervalle soit divisible par 2 est 12 et celle qu’il ne soit pas divisible par 2 vaut 1 − 12 . Pour la divisibilité par 3, nous constatons que la probabilité qu’un entier de cet intervalle ne soit pas divisible par 3 vaut 1 − 31 . Et en supposant ces deux évènements indépendants, la probabilité pour qu’un entier ne soit divisible ni par 2, ni par 3, vaut 1 − 1 1 1 − . Pour obtenir les nombres premiers, il nous faut ôter les multiples 2 3 25 novembre 2012 Version 2 10.3 L’inégalité de Brun-Titchmarsh 71 de 2, de 3, . . . de p, pour tous les p ≤ ?, où il n’est pas clair jusqu’où√ nous devrions aller. Dans le cas de l’intervalle initial, il faudrait aller jusqu’à X et cela donnerait 1 ? Y 1− X. π(X) ≃ p √ p≤ X AF T Or le théorème de Mertens nous dit que le produit ci-dessus est asymptotique à 2e−γ / log X ≃ 1.122 · · · / log X. La constante n’est par conséquent pas la bonne ! Le problème dans cette approche vient de ce que nous considérons que le fait d’être divible par p1 ou de l’être par un autre nombre premier p2 sont deux évènements indépendants, ce qui n’est manifestement pas ! Enfin, presque, puisque nous obtenons toutefois une expression proche de la vérité. L’argument qui ne fonctionne pas concerne l’indépendance des évènements. Et cette indépendance sera d’autant plus caduque que le nombres de modules considérés sera grand. Nous allons donc restreindre ce nombre de modules, mais du coup, nous n’allons plus avoir accès qu’à une borne supérieure. En contrepartie, cette approche va fonctionner dans le cas général d’un intervalle, là où le théorème des nombres premiers ne s’applique pas ! 10.3 L’inégalité de Brun-Titchmarsh Théorème 10.1 Pour M et N deux entiers ≥ 1, le nombre Z de nombres premiers dans l’intervalle [M + 1, M + N ] est au plus 2N/ log N . DR Si M = 1, le théorème des nombres premiers nous donne un meilleur résultat, puisqu’il nous permet de remplacer le 2 par un 1+o(1). L’avantage de cette borne est ailleurs, et précisément dans le fait que nous pouvons l’appliquer lorsque M est très grand par rapport à N . Nous trouvons par exemple qu’entre 10100 et 10100 + 10 000, il y a moins de 2 200 nombres premiers. La version du théorème que nous proposons est due à (Montgomery & Vaughan, 1973). C’est Linnik qui dans les années 40 a baptisé ce genre de résultat des théorèmes de Brun-Titchmarsh à cause d’un lemme allant dans cette direction de Titchmarsh dans les années 30 où il utilisait une méthode de crible due au père des méthodes de crible : Viggo Brun. Nous avons ajouté l’adjectif “simplifié” ci-dessus, parce que la version non simplifiée traite des nombres premiers en progressions arithmétiques. L’adaptation énoncée plus loin est sans difficulté. Par contre, le facteur 2 est lui vital, et toute amélioration aurait des répercussions énormes sur notre connaissance des nombres premiers. Nous allons démontrer une version un peu plus faible avec 4 + o(1) au lieu de la constante 2 ; et aussi imposer M ≥ N 1/4 , mais un peu plus de soin dans la preuve permettrait d’obtenir 2 + o(1) sans condition sur M . Par contre, montrer que le o(1) peut être pris égal à 0 est plus difficile. Nous allons prouver une version légèrement affaiblie de ce théorème en passant par une petite série de quatre lemmes. Nous y posons Q = q ≤ Q, q sans facteurs carrés (10.1) où Q est un paramètre que nous choisirons plus loin. La route que nous prenons est bien loin a priori des considérations de divisibilité et d’indépendance que nous avons utilisées pour la motiver. Il serait trop long de refaire ici le chemin Le cours de Nouakchott 25 novembre 2012 CHAPITRE 10. UNE APPROCHE MODERNE 72 qui va d’une approche à l’autre. Contentons de dire ici que ce chemin existe, les deux méthodes ne sont effectivement pas étrangères l’une à l’autre, et celle que nous présentons est franchement moderne. 10.4 Considérations hermitiennes Notre premier lemme prend place dans un espace de Hilbert H . AF T Lemme 10.2 (Parseval approché) Soit (ϕq )q∈Q une famille finie de points de H . Soit f un autre point de H . Alors X |[f |ϕq ]|2 /Mq ≤ kf k2 q∈Q où Mq est une borne supérieure pour P q′ ∈Q |[ϕq |ϕq′ ]|. Pour comprendre ce lemme, il suffit de considérer le cas où les ϕq sont deux à deux orthogonaux. Dans ce cas, nous pouvons prendre Mq = kϕq k2 et l’inégalité proposée est simplement celle de Parseval. Ce lemme permet de se dispenser de l’hypothèse d’orthogonalité, mais est construit en pensant que notre système est ”presque orthogonal”, i.e. que Mq vaut ”presque” kϕq k2 . Inégalité due à Selberg dans les années 70. On dit souvent que c’est le mathématicien hongrois Hálasz qui a introduit un peu avant dans la théorie ce genre d’inégalités générales, mais l’histoire n’est pas claire à ce sujet. Démonstration. La preuve du lemme 10.2 est très simple. Considérons l’inégalité 2 X f − ξq ϕq ≥0 q∈Q DR où les ξq sont des paramètres que nous souhaitons choisir au mieux, c’est à dire de façon à rendrePcette norme aussi petite que possible. Le mieux serait bien sûr de prendre pour q∈Q ξq ϕq la projection orthogonale de f sur l’espace engendré par les ϕq , mais nous ne savons pas calculer de tels coefficients ξq en général. Nous nous contenterons de ce que nous espèrons être une approximation, mais que nous savons exprimer. Le développement de la norme nous donne X X kf k2 − 2ℜ ξq [f |ϕq ] + ξq ξq′ [ϕq |ϕq′ ] ≥ 0, q,q′ ∈Q q∈Q où nous séparons q et q ′ à l’aide de |ξq ||ξq′ | ≤ 12 (|ξq |2 + |ξq′ |2 ). Nous réorganisons nos termes et injectons Mq dans l’inéquation résultante. Il vient X X ξq [f |ϕq ] + |ξq |2 Mq ≥ 0. (10.2) kf k2 − 2ℜ q∈Q q∈Q Maintenant que la forme quadratique en ξq est remplacée par une forme diagonale, il est facile de déterminer les ξq qui minimisent (10.2) : ξq = [f |ϕq ]/Mq . En injectant ces valeurs dans (10.2), nous obtenons bien l’inégalité annoncée. 25 novembre 2012 Version 2 10.5 Un peu d’arithmétique 10.5 73 Un peu d’arithmétique Notre second lemme concerne les sommes de Ramanujan : cq (n) = q X exp(2iπan/q). (10.3) a=1, pgcd(a,q)=1 cp (n) = AF T Bien sûr, cq (n) ne dépend que de la classe de n modulo q. Notons dès à présent que cette somme porte sur ϕ(q) entiers a, où ϕ(q) désigne l’indicateur d’Euler, et ce parce que ϕ(q) est précisément le nombre d’entiers ≤ q premiers à q. À titre d’exemple, pour q = p un nombre premier, la condition pgcd(a, p) = 1 se réduit à a 6= 0 et p X a=1 exp(2iπan/p) − 1 = ( p−1 −1 si p|n, si p ∤ n. (10.4) Voilà qui règle le cas où q est un nombre premier. En utilisant le lemme chinois, nous montrons que cq1 q2 (n) = cq1 (n) cq2 (n) si pgcd(q1 , q2 ) = 1. (10.5) Comme dans notre application, q sera un produit de nombres premiers distincts, la conjugaison de (10.6) et de (10.5) suffit pour calculer cq (n). Voici la propriété qui nous intéresse particulièrement : Lemme 10.3 Si q ∈ Q et n est premier à q, alors cq (n) vaut (−1)ω(q) où ω(q) est le nombre de facteurs premiers de q. DR En particulier, il s’agit d’un nombre indépendant de n et de module 1. Notre troisième lemme donne une évaluation pour la fonction sommatoire d’une fonction multiplicative positive, un sujet très classique en théorie analytique des nombres. Lemme 10.4 Nous avons X q∈Q 1/ϕ(q) ≥ log Q. Le lecteur sait maintenant donner un asympotique de cette somme. La preuve qui suit est intéressante et donne qui plus est une borne inférieure explicite. Démonstration. Commençons par remarquer que, si q = p est un nombre premier, alors 1 1 1 1 1 = = + 2 + 3 + ··· . ϕ(p) p−1 p p p Une fois cela acquis, regardons ce qui se passe si q = p1 p2 un produit de deux Le cours de Nouakchott 25 novembre 2012 CHAPITRE 10. UNE APPROCHE MODERNE 74 nombres premiers distincts : 1 1 = ϕ(p1 p2 ) (p1 − 1)(p2 − 1) 1 1 1 1 1 1 + 2 + 3 + ··· + 2 + 3 + ··· = p1 p1 p1 p2 p2 p2 X1 = n n AF T où la somme porte sur tous les entiers dont les facteurs premiers sont exactement p1 et p2 . En poursuivant ce raisonnement, nous constatons que notre somme initiale est celle des 1/n où n est un entier dont le produit de tous les facteurs premiers est ≤ Q. Ensemble qui contient au moins tous les entiers ≤ Q, soit la minoration X X 1/ϕ(q) ≥ 1/n ≥ log Q. q∈Q 1≤n≤Q Ce qu’il fallait démontrer. 10.6 Preuve de l’inégalité de Brun-Titchmarsh Nous prenons pour ϕq la fonction suivante : ( cq (n) si M + 1 ≤ n ≤ M + N ϕq (n) = 0 sinon, (10.6) DR pour q variant dans Q. Notre Hilbert est simplement l’ensemble des fonctions sur les entiers de [M + 1, M + N ] muni du produit hermitien standard : X [g|h] = f (n)g(n). (10.7) M+1≤n≤M+N Le dernier lemmes dont nous aurons besoin mesure la quasi-orthogonalité de la famille (ϕq )q∈Q . Lemme 10.5 X q′ ∈Q |[ϕq |ϕq′ ]| ≤ Mq = ϕ(q)(N + Q4 ). Ce lemme va être une conséquence facile du suivant. Lemme 10.6 Nous avons [ϕq |ϕq ] − ϕ(q)N ≤ ϕ(q)q 3 . De plus, si q ′ 6= q, nous avons aussi |[ϕq |ϕq′ ]| ≤ ϕ(q)qq ′2 . Démonstration. Il vaut mieux raccourcir un peu les notations et écrire e(α) = exp(2iπα). Nous obtenons alors, que q ′ soit premier à q ou non, X X X [ϕq |ϕq′ ] = e(na/q) e(−na′ /q ′ ) . M+1≤n≤M+N 25 novembre 2012 1≤a≤q, pgcd(a,q)=1 1≤a′ ≤q′ , pgcd(a′ ,q′ )=1 Version 2 10.7 Compléments 75 En mettant les sommations sur a et a′ devant, cela donne X X X a a′ [ϕq |ϕq′ ] = . e n − ′ q q ′ ′ 1≤a≤q, 1≤a ≤q , M+1≤n≤M+N pgcd(a,q)=1 pgcd(a′ ,q′ )=1 La somme interne est en fait la somme d’une progression arithmétique. Si a/q 6= a′ /q ′ , elle vaut au plus en module a a′ 1/| sin π | ≤ qq ′ /2 − ′ q q AF T en utilisant l’inégalité classique sin x ≥ 2x/π si 0 ≤ x ≤ π/2. Tout cela résulte en le lemme 10.5. Nous prenons tout simplement pour f la fonction caractéristique des nombres premiers de l’intervalle [M + 1, M + N ] et nous supposons que Q, qui intervient dans la définition de Q est ≤ M . Dans ce cas, nous obtenons directement X X f (n) (10.8) [f |ϕq ] = f (n)ϕq (n) = (−1)ω(q) M+1≤n≤M+N M+1≤n≤M+N tout simplement parce que ϕq (n) = (−1)ω(q) pour tous les nombres premiers de notre intervalle. En rappelant que Z désigne le nombre de ces nombres premiers, nous pouvons réécrire l’équation ci-dessus sous la forme [f |ϕq ] = (−1)ω(q) Z. (10.9) DR Notre lemme nous donne alors X (−1)ω(q) Z 2 /ϕ(q) ≤ Z(N + Q4 ), q∈Q soit encore Z X q∈Q 1/ϕ(q) ≤ N + Q4 . (10.10) Le lemme 10.4 nous permet alors d’atteindre la majoration Z ≤ (N +Q4 )/ log Q où il nous faut à présent optimiser Q. Nous prenons Q = N 1/4 / log N (10.11) ce qui nous donne le résultat annoncé. 10.7 Compléments Tout d’abord, en remarquant que dans l’ensemble {a/q, pgcd(a, q) = 1, q ≤ Q}, deux points sont distants d’au moins 1/Q2 , il est assez facile de montrer qu’en fait, nous avons X (10.12) |[ϕq |ϕq′ ]| = ϕ(q)N + O(ϕ(q)Q2 log Q) q′ ∈Q Le cours de Nouakchott 25 novembre 2012 CHAPITRE 10. UNE APPROCHE MODERNE 76 ce qui nous donnerait Z ≤ (2 + o(1))N/ log N . Il nous faut ensuite éliminer la condition Q ≤ M : pour cela, il suffit de prendre pour f la fonction caractéristique P des nombres premiers de notre intervalle, mais qui sont aussi > Q. Du coup, n f (n) ne vaut plus Z, mais Z +O(Q), ce qui nous suffit largement. Cette preuve est récente : je l’ai mise au point en 2008 ! En fait, cela m’a permis de montrer la majoration Z ≤ 2N/(log N + 2.88 + o(1)). (10.13) 10.8 AF T Qui n’est d’ailleurs pas encore publiée. Qu’une telle inégalité soit possible, mais avec une constante non spécifiée est dû à (van Lint & Richert, 1965) bien que (Selberg, 1949) mentionne un tel résultat sans démonstration. (Bombieri, 1971) obtenait le première valeur avec la majoration Z ≤ 2N/(log N − 3 + o(1)). (Montgomery & Vaughan, 1973) ont ensuite affiné ce −3 en 5/6 et dans la section 22 de (Selberg, 1991) se trouve une preuve donnant c = 2.81, preuve à laquelle nous empruntons certains éléments. Optimalité ? Si nous savons que les méthodes de preuves dont nous disposons à l’heure actuelle ne sauraient améliorer notoirement le théorème de Brun-Titchmarsh, si ce n’est sous la forme de petites améliorations comme dans (10.13), il n’est absolument pas clair que ce théorème ne soit pas optimal en soi. Il serait très intéressant de déterminer un intervalle [M + 1, M + N ] où le nombre de nombres premiers divisé par N/ log N soit > 1 et où M ≥ 2N . Et en fait le plus grand possible et même proche de 2 . . . À l’heure actuelle, je ne connais que des exemples : DR M +1 M +N N Z rapport 5 639 5 659 21 7 1.0148 . . . 113 143 113 177 35 10 1.0158 . . . 21 817 283 854 511 261 21 817 283 854 511 311 51 14 1.0793 . . . Ce dernier exemple date de 1982. Ceci est à rapprocher de la conjecture de Hardy & Littlewood de 1923 qui affirme que π(M + 1) − π(M + N ) ≤ π(N − 1). Voir à ce sujet (Dusart, 1998), (Hensley & Richards, 1974), (Schinzel & Sierpiǹski, 1958) et (Schinzel, 1961). Pour déterminer des exemples permettant de s’approcher plus près de la borne donnée par le théorème de Brun-Titchmarsh, il convient peut être de se tourner vers sa formulation la plus générale : Théorème 10.7 (Théorème de Brun-Tichmarsh) Soit q ≥ 1 un entier et a un entier premier à q. Pour M et N deux entiers ≥ 1, le nombre Z de nombres premiers congrus à a modulo q et dans l’intervalle [M + 1, M + N ] est au plus 2N . ϕ(q) log(N/q) Je ne crois pas qu’une telle approche ait été tentée, par exemple avec des nombres premiers = 2[3]. 25 novembre 2012 Version 2 10.9 Des nombres premiers jumeaux Exercice 113. Démontrer que X p≤x 10.9 77 d(p − 1) ≪ x/ log x. Des nombres premiers jumeaux Approche locale AF T Considérons le nombre J(X) de nombres premiers p ≤ X qui sont tels que p+2 est aussi premier, comme 17 ou 41. Depuis le milieu du dix neuvième siècle, on conjecture qu’il y a une infinité de tels nombres, dits jumeaux, conjecture qui reste très largement hors de notre portée. Le fait est que nous savons très mal travailler avec cette condition supplémentaire sur p, et même montrer que de tels nombres ne sont pas en proportion positive dans la suite des nombres premiers est longtemps resté indémontré ! Le théorème de Brun ci-dessous répare cette lacune de façon éclatante. Commençons par quelques remarques simples : 1. Si p et p + 2 sont premiers, alors p ≡ 2[3]. 2. Si p et p + 2 sont premiers, alors modulo 5, p ne peut être congrus qu’à 1, 2 ou 4. 3. Modulo le nombre premier q, si p et p = 2 sont premier et premiers à q, alors p ne peut être congrus à 0 ou à −2 modulo p. DR Si nous raisonnons comme précédemment, nous constatons que la probabilité que l’entier n soit premier, de même que l’entier n + 2 ressemble à 1 3 5 1 1− 1− 1− ··· 1− 2 3 5 7 Philosophie et heuristique Les études allient alors une exploration plus approfondie du modèle local précédent à la remarque suivante, directement issue de la première partie : n ≤ X est premier avec la probabilité 1/ log X et de même pour n + 2. En arguant que ces deux probabilités sont indépendantes l’une de l’autre, nous obtenons que la probablité que n et n + 2 soient premiers est de l’ordre de 1/ log2 X. Bien sûr il faut voir comment mélanger les deux arguments, et cela donne lieu à la conjecture quantitative que voici. Conjecture Le nombre de nombres premiers jumeaux ≤ X est équivalent à Y 1 . SX/ log2 X avec S = 2 1− (p − 1)2 p≥3 Ce théorème montre que le nombre de nombres premiers jumeaux est asymptotiquement nettement inférieur à celui des nombres premiers. Fait que (Brun, 1919) a exprimé en 1916 en énonçant : Théorème 10.8 (Viggo Brun) La somme des inverses des nombres premiers jumeaux est finie ou convergente. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 10. UNE APPROCHE MODERNE 78 Alors que la somme des inverses des nombres premiers est elle divergente. Nous allons ici montrer le théorème suivant. Théorème 10.9 Il existe une constante positive C > 0 telle que J(X) ≤ CX/ log2 X. Le résultat de Brun en est alors un simple corollaire que l’on déduit par la technique dite de sommation par parties. En effet, il vient Z X ! Z X X X 1 J(X) dt J(t)dt 1/p = = + + 2 X t X t2 p 1 p≤X, p + 2 premier AF T p≤X, p + 2 premier qui est effectivement borné en vertu de ce que nous venons d’établir. Une majoration Nous allons adapter la preuve de la partie 10.6. Il nous faut tout d’abord définir un équivalent des sommes de Ramanujan. Commençons par une petite définition. Si d|q où q est sans facteurs carrés, alors q/d et d sont premiers entre eux. En conséquence, il existe un (unique) entier uq,d dans {1, . . . , d] tel que (q/d)uq,d ≡ 1[d]. Une fois cela posé, nous définissons alors cjumeaux (n) = 2−ω(q) q X (10.14) DR d|q c n + 2uq,dq/d où ω(q) est le nombre de facteurs premiers de q, de sorte que le nombre de diviseurs de q est ici 2ω(q) , et ceci, parce que q est sans facteurs carrés. Nous disposons alors d’un équivalent du lemme 10.3. Lemme 10.10 Lorsque q ∈ Q et n et n + 2 sont premiers à q, la fonction prend la valeur 1 en n. cjumeaux q Démonstration. Pour d divisant q, regardons cq n + 2uq,d q/d où n et n = 2 sont premier à q. Par la propriété de multiplicativité établie en (10.5), nous obtenons cq n + 2uq,d q/d = cd n + 2uq,d q/d cq/d n + 2uq,d q/d Or, cℓ (n) ne dépend que de n modulo ℓ et donc cd n + 2uq,d q/d = cd (n), cq/d n + 2uq,d q/d = cq/d (n + 2) Comme nous supposons n et n+2 premiers à q et donc a fortiori à q/d et à d, chacune des deux quantités précédentes vaut respectivement (−1)ω(d) et (−1)ω(q/d) . Comme ω(q/d) = ω(q) − ω(d), nous obtenons bien le résultat annoncé. 25 novembre 2012 Version 2 10.9 Des nombres premiers jumeaux 79 Nous prenons pour ϕjumeaux la fonction suivante : q ( cjumeaux (n) si M + 1 ≤ n ≤ M + N q ϕjumeaux (n) = q 0 sinon, (10.15) pour q variant dans Qjumeaux où Qjumeaux = q ≤ Q, q impair et sans facteurs carrés (10.16) Q étant un paramètre que nous choisirons plus tard. L’arithmétique de la situation va être passablement plus délicate. Nous introduisons deux fonctions : Y 1− 2 p (10.17) AF T ϕ2 (q) = q p|q que le lecteur pourra comparer à la définition suivante de l’indicateur d’Euler : ϕ(q) = q Y p|q 1− 1 . p (10.18) Nous introduisons ensuite h(q) = ϕ2 (q)/2ω(q) . (10.19) Et voici alors l’équivalent du lemme 10.5. Lemme 10.11 X q′ ∈Q |[ϕjumeaux |ϕjumeaux ]| ≤ Mq = h(q)(N + 6Q4 ). q q′ DR Ce lemme va être une conséquence facile du suivant, qui est modelé sur le lemme 10.6. Lemme 10.12 Nous avons [ϕjumeaux |ϕjumeaux ] − h(q)N ≤ q 4 . De plus, si q q q ′ 6= q, nous avons aussi |[ϕjumeaux |ϕjumeaux ]| ≤ (qq ′ )2 . q q′ Démonstration. Nous obtenons aisément X X ′ 2ω(q)+ω(q ) [ϕjumeaux |ϕjumeaux ]= q q′ X 1≤a≤q, d|q, 1≤a′ ≤q′ , d′ |q′ pgcd(a,q)=1 pgcd(a′ ,q′ )=1 X M+1≤n≤M+N a a′ auq,d a′ uq′ ,d′ e n . − − ′ e 2 d d′ q q Si a/q 6= a′ /q ′ , nous majorons la somme sur n par qq ′ , ce qui nous donne une ′ terme d’erreur de 2ω(q)+ω(q ) (qq ′ )2 . Si a/q = a′ /q ′ ( et en particulier q = q ′ ), il nous reste le terme principal X X X uq,d uq,d′ N e 2a cq 2(uq,d (q/d) − uq,d′ (q ′ /d′ ) =N − ′ d d 1≤a≤q, d|q, d′ |q pgcd(a,q)=1 Le cours de Nouakchott d|q, d′ |q 25 novembre 2012 CHAPITRE 10. UNE APPROCHE MODERNE 80 et nous calculons ce dernier par multiplicativité (voir (10.5)) : Y cp 2(uq,d (q/d) − uq,d′ (q ′ /d′ ) . cq 2(uq,d (q/d) − uq,d′ (q ′ /d′ ) = p|q Or, chaque facteur ne dépend que de son argument modulo p. Nous avons quatre cas à distinguer. Soit p ne divise ni d, ni d′ . Comme il divise q, la contribution est cp (0) = p−1. Soit p divise d mais pas d′ . La contribution est alors cp (2) = −1, et de même si p divise d′ mais pas d. Par contre, si p divise d et d′ , la contribution est cp (2(1 − 1)) = p − 1. Ce que nous rassemblons dans l’expression Y (1 − p). AF T (−1)ω(q) p|q, p∤dd′ / pgcd(d,d′ )2 À partir de là, calculer le terme principal est un peu difficile. Par multiplicativité, nous obtenons qu’il vaut Y X Y YX (−1)ω(q) (1 − p1 ) (1 − p) = (−1)ω(q) d|q, d′ |q p|q, p∤dd′ / pgcd(d,d′ )2 = (−1)ω(q) p|q p1 |p, d|p, d′ |p p1 ∤dd′ / pgcd(d,d′ )2 Y 4 − 2p = 2ω(q) ϕ2 (q). p|q En prenant encore pour f la fonction caractéristique des nombres premiers jumeaux ≤ X, nous obtenons DR [f |ϕjumeaux ] = Z = J(X). q Nous invoquons alors le lemme 10.2 pour obtenir X Z2 1/h(q) ≤ Z(N + Q4 ) q∈Qjumeaux ce qui nous laisse avec la somme des inverses des h(q) à minorer. Le lemme suivant règle ce problème : Lemme 10.13 Nous avons pour Q ≥ 170 X 1/h(q) ≥ 1 16 log2 Q. q∈Qjumeaux Nous prenons enfin Q4 = X/ log X pour obtenir le théorème annoncé. Démonstration. Nous montrons comme pour la démonstration du lemme 10.4 que X X 2Ω(ℓ) 1/h(q) ≥ ℓ jumeaux q∈Q 25 novembre 2012 ℓ≤Q, pgcd(ℓ,2)=1 Version 2 10.9 Des nombres premiers jumeaux 81 où Ω(ℓ) désigne le nombre de facteurs premiers de ℓ comptés avec multiplicité, de sorte que Ω(9) = 2 et Ω(18) = 3. Il se trouve que 2Ω(ℓ) est supérieur au nombre d(ℓ) de diviseurs de ℓ. Nous remarquons alors que X √ ℓ1 ≤ Q, pgcd(ℓ1 ,2)=1 1 ℓ1 X √ ℓ2 ≤ Q, pgcd(ℓ2 ,2)=1 1 = ℓ2 X ℓ≤Q, pgcd(ℓ,2)=1 C(ℓ) ℓ où C(ℓ) est √ le nombre de façon d’écrire ℓ comme produit ℓ1 ℓ2 , chacun des facteurs étant ≤ Q. Bien sûr, C(ℓ) est majoré par d(ℓ) qui est lui-même majoré par 2Ω(ℓ) . Comme par ailleurs √ X 1 1 = − ℓ1 √ ℓ1 1 2 X 1 ℓ1 AF T X ℓ1 ≤ Q, pgcd(ℓ1 ,2)=1 ℓ1 ≤ Q ≥ 1 2 X √ ℓ1 ≤ Q/2 √ ℓ1 ≤ Q/2 1 + ℓ1 √ X √ Q/2<ℓ1 ≤ Q 1 ℓ1 p p 1 ≥ 12 log( Q/2) + √ ( 12 Q − 1) Q ≥ 41 log Q DR pour Q ≥ 170, nous obtenons la majoration annoncée. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 10. UNE APPROCHE MODERNE DR AF T 82 25 novembre 2012 Version 2 Chapitre 11 11.1 AF T L’inégalité du grand crible Une inégalité de Parseval approchée Nous nous plaçons dans un espace vectoriel H complexe muni d’une seminorme hermitienne hf |gi, linéaire à gauche et sesqui-linéaire à droite, c’est à dire qui vérifie hλf |gi = λhf |gi , hf |gi = hg|f i, hλf + µh|gi = λhf |gi + µhh|gi , hf |f i ≥ 0 pour tout λ, µ ∈ C et f, g, h ∈ H. Dans ce contexte, nous nous donnons une famille finie (ϕ∗i )i∈I de points de H, une famille (Mi )i∈I de nombres réels strictement positifs et une famille (ωi,j )i,j∈I de nombres complexes tels que k X ξi ϕ∗i k2 ≤ DR ∀(ξi )i ∈ CI , i X i Mi |ξi |2 + X ξi ξj ωi,j . (11.1) i,j Nous avons alors les deux lemmes suivants : P Lemme 11.1 Nous pouvons prendre Mi = j |hϕ∗i |ϕ∗j i| et ωi,j = 0. Voici une lecture éclairante de ce lemme : la forme hermitenne qui apparaı̂t a une matrice dont les termes diagonaux sont les hϕ∗i |ϕ∗i i. Un théorème de Gershgorin dit que les valeur propres de la Pmatrice se situent alors dans un disque de centre l’un des hϕ∗i |ϕ∗i i| et de rayon j6=i |hϕ∗i |ϕ∗j i| pour le i correspondant, disque qui porte le nom de disque de Gershgorin. Cette approche due à (Elliott, 1971) a toutefois un défaut : nous ne savons pas a priori que chaque disque de Gershgorin contient une valeur propre, ce qui est en quelque sorte réparé dans le lemme précédent. Lemme 11.2 Pour tout f ∈ H et ξi = hf |ϕ∗i i/Mi , nous avons X X ξi ξj ωi,j . Mi−1 |hf |ϕ∗i i|2 ≤ kf k2 + i i,j Ce lemme sans les ωi,j est dû à Atle Selberg d’après la section 2 de (Bombieri, 1987/1974b) et (Bombieri, 1971). CHAPITRE 11. L’INÉGALITÉ DU GRAND CRIBLE 84 Démonstration. La preuve consiste à écrire 2 X ξi ϕ∗i ≥ 0 f − i P que nous développons. Nous nous débarrassons de k i ξi ϕ∗i k2 en utilisant (11.1), ce qui nous donne X X X kf k2 − 2ℜ ξi ξj ωi,j ≥ 0. Mi |ξi |2 + ξi hf |ϕ∗i i + i i,j i AF T Nous choisissons les ξ au meilleur de notre avantage, moyennant de négliger la forme bilinéaire contenant les ωi,j , c’est à dire que nous prenons ξi = hf |ϕ∗i i/Mi . Le résultat annoncé suit. La conjugaison des deux lemmes est ce que l’on appelle usuellement “le lemme de Selberg” dans ce contexte et l’introduction des ωi,j est due à l’auteur. Dans ce lemme, la valeur exacte des ξ est généralement sans importance, mais leur ordre de grandeur ainsi que la structure de forme quadratique sont eux importants. D’une façon toute aussi générale, Mi est proche de kϕ∗i k2 . L’introduction des ωi,j permet d’hybrider les résultats issus de l’inégalité pondérée du grand crible et des résultats du crible de Selberg qui amènent à cribler des suites et non simplement des intervalles. 11.2 L’inégalité du grand crible Nous notons e(α) = exp(2iπα). (11.2) DR Théorème 11.3 (Inégalité du grand crible) Soit X un ensemble fini de points de R/Z. Posons δ = min {kx − x′ k, x 6= x′ ∈ X } . Pour toute suite (un )1≤n≤N de nombres complexes, nous avons 2 X X X un e(nx) ≤ |un |2 (N − 1 + δ −1 ). x∈X n n Nous pouvons voir le membre de gauche comme une somme de Riemann sur les points de X . Au moins si l’ensemble X est suffisament dense. En suivant ce point de vue et puisque l’espacement entre deux points consécutifs est au moins δ, nous sommes amenés à consiérer ce membre de gauche multiplié par δ comme une approximation de Z 1 X 2 X un e(nα) dα = |un |2 . 0 n n C’est effectivement le cas si δ −1 is bien plus grand que N (et pourvu que X soitt aussi suffisament dense), mais il se trouve que le cas qui nous intéresse Pen théorie des nombres est précisément l’opposé. Dans ce cas, nous regardons n un e(nx) comme une forme linéaire en les (un )n . La condition d’espacement implique que 25 novembre 2012 Version 2 11.2.1 Une transformée de Fourier 85 11.2.1 AF T X ne contient pas plus de δ −1 elements ; Or, si le nombre de formes linéaires impliquées est effectvement inférieur à la dimension de l’espace ambient (soit N ), elles sont linéairement indépendantes comme le lecteur l’établira simplement en calculant un déterminant de van der Monde. Sinon, il y a des redondances d’informations. Ce qui met en lumière le fait que ce qui entre en jeu ici est plus le phénomène d’orthogonalité approchée que l’aspect approximation, ce pourquoi j’ai choisi cette preuve. Dans cette version, le théorème 11.3 est dû à Selberg. La même année et par une méthode différente, (Montgomery & Vaughan, 1973) en obtinrent une version très marginalement plus faible (sans le −1 à droite). Nous montrons ici un résultat un peu plus faible avec N + 1 + 2δ −1 au lieu de N − 1 + δ −1 . Nous commençons par rappeler quelle est la transformée de Fourier discrète du noyau de Fejer. Une transformée de Fourier Soit N ′ et L deux entiers fixés. Considérons la fonction dont le graphe est : F 0 L N N 0 0 N 0 +L DR N 1 Comme calculer sa transformée de Fourier discrète peut être lourd, nous introduisons deux autres fonctions G et H dessinées ci-après et qui vérifient F = (G − H)/L. G L N 0 L N 0 Le cours de Nouakchott H N 0 N +L 0 25 novembre 2012 CHAPITRE 11. L’INÉGALITÉ DU GRAND CRIBLE 86 Cela nous donne X X X L F (n)e(ny) = G(n)e(ny) − H(n)e(ny) n∈Z n∈Z n∈Z X (N ′ + L − |n|)e(ny) − = 0≤|n|≤N ′ +L = X 0≤m≤N ′ +L d’où, finalement : F (n)e(ny) = n∈Z La valeur en y = 0 vaut 11.2.2 0≤m≤N ′ 0≤|n|≤N ′ (N ′ − |n|)e(ny) 2 e(my) 2 2 1 sin πN ′ y 1 sin π(N ′ + L)y − , L sin πy L sin πy (11.3) AF T X 2 X e(my) − X P n∈Z F (n) = 2N ′ + L. Preuve du théorème 11.3 (forme faible) Nous utilisons les lemmes 11.2 et 11.1. Remarquons tout d’abord que nous pouvons supposer que N est un entier. Soit ensuite N ′ = ⌊N/2⌋ la partie entière de N/2 et f (n) = uN ′ +1+n (avec uN +1 = 0 si N est pair) de telle sorte que f a son support sur [−N ′ , N ′ ]. Notre espace de Hilbert est ℓ2 (Z) muni du produit scalaire standard, et f y appartient en l’étendant par f (n) = 0 si n n’est pas dans l’intervalle [−N ′ , N ′ ]. Remarquons aussi que X kf k2 = |un |2 . (11.4) n DR Nous devons à présent définir notre système quasi-orthogonal. Nous posons p (11.5) ∀x ∈ X , ϕ∗x (n) = e(nx) F (n), où F est définie section 11.2.1. Comme f s’annule hors de [−N ′ , N ′ ], nous trouvons X [f |ϕ∗x ] = e(−(N ′ + 1)x) un e(nx). (11.6) 1≤n≤N Les calculs de la section précédente donnent kϕ∗x k2 = 2N ′ + L, |[ϕ∗x |ϕ∗x′ ]| ≤ 1 4Lkx − x′ k2 if x 6= x′ (11.7) grâce à l’inégalité classique | sin x| ≤ 2kxk/π. Si x est fixé, nous obtenons X x′ ∈X x′ 6=x |[ϕ∗x |ϕ∗x′ ]| ≤ X x′ ∈X x′ 6=x ≤2 X k≥1 1 4Lkx − x′ k2 π2 1 ≤ 2 4L(kδ) 12Lδ 2 car la définition de δ implique que le cas le pire qui puisse arriver pour la suite (kx − x′ k)x′ est lorsque tous les x′ ’s sont les x + kδ où k est un entier relatif qui 25 novembre 2012 Version 2 11.3 La suite de Farey 87 prend les valeurs ±1, ±2, ±3, . . . . Nous choisissons ensuite l’entier L qui minise presque 2N ′ + L + π 2 /(12Lδ 2), i.e. π L= √ (11.8) 2 3δ où ⌈x⌉ dénote exceptionnellement ici la partie entière par valeurs supérieures de x. Tout cela nous donne la majoration 2N ′ + L + π 2 /(12Lδ 2) ≤ N + 1 + √π3 δ −1 . √ Nous concluons en remarquant que π/ 3 ≤ 1.82 ≤ 2. La suite de Farey AF T 11.3 Dans la plupart des applications arithmétiques, l’ensemble X est tout simplement une partie de la suite de Farey et même X = a/q, q ≤ Q, a mod∗ q (11.9) où Q est à paramètre à choisir et où a mod∗ q signifie ici encore que a parcourt les classes inversibles modulo q. Si a/q et a′ /q ′ sont deux points distincts de X , nous avons a a′ |aq ′ − a′ q| 1 − = ≥ ′ ≥ Q−2 (11.10) q q′ qq ′ qq car aq ′ −a′ q est un entier non nul. ∗ Nous introduisons alors la notation classique X S(x) = un e(na/q) (11.11) 1≤n≤N et affirmons que |S(a/q)|2 ≤ DR X X q≤Q a mod∗ q X n |un |2 (N + Q2 ). (11.12) C’est aussi cette inégalité que l’on désigne couramment sous le nom d’inégalité du grand crible. ∗. En discutant selon que q = q ′ ou non, nous pourrions augmenter cette borne jusqu’à 1/(Q(Q − 1)). Le cours de Nouakchott 25 novembre 2012 CHAPITRE 11. L’INÉGALITÉ DU GRAND CRIBLE DR AF T 88 25 novembre 2012 Version 2 Chapitre 12 12.1 AF T Le crible de Montgomery L’énoncé Commençons par un énoncé un peu difficile à comprendre au départ, parce que long. Théorème 12.1 Soit Q un réel ≥ 1. Nous nous donnons un ensemble P de nombres premiers ≤ Q et pour chaque p dans P un sous-ensemble Ωp de Z/pZ de cardinal ω(p). Soit Q l’ensemble des entiers sans facteurs carrés et dont tous les facteurs premiers appartiennent à P. Soit enfin Z le nombre d’entiers dans l’intervalle [M +1, M +N ] qui ne sont dans aucun Ωp lorsque nous les réduisons modulo p. Nous avons Z ≤ (N + Q2 )/L avec L= X Y DR q∈Q µ2 (q) p|q ω(p) . p − ω(p) Quelques exemples : 1. Choisissons Ωp = {0} pour tout p ≤ Q. Les entiers qui ne sont dans aucun Ωp quand p ≤ Q sont simplement les entiers qui ne sont divisibles par aucun p ≤ Q. Ceci contient en particulier les nombres premiers > Q. Il vient alors .X # p ∈] min(Q, M + 1), M + N ] ≤ (N + Q2 ) µ2 (q)/ϕ(q). q≤Q et le lecteur √ sait ici en déduire que #{p ∈ · · · } ≤ (N +Q2 )/ log Q. En choisissant Q = N / log N , nous retrouvons le théorème de Brun-Titchmarsh ! 2. Choisissons Ωp = {0, −2} pour tout p ≤ Q. Les entiers qui ne sont dans aucun Ωp quand p ≤ Q sont simplement les entiers n tels que ni n ni n + 2 ne sont divisibles par un p ≤ Q. Ceci contient en particulier les nombres premiers p > Q tels que p + 2 soit aussi premier. Il vient alors # p ∈] min(Q, M + 1), M + N ], p + 2 premier .X Y 2 . ≤ (N + Q2 ) µ2 (q) p−2 q≤Q p|q, p6=2 CHAPITRE 12. LE CRIBLE DE MONTGOMERY 90 Nous laissons le lecteur conclure. Remarques : les notations Ωp et ω(p) sont traditionnelles. Elles n’ont rien à voir avec les nombres de facteurs premiers, compté ou non avec multiplicité ! Preuve du théorème 12.1. Soit N la suite des entiers de [M + 1, M + N ] qui ne sont dans aucun Ωp pour p dans notre suite P. Soit alors (un )M+1≤n≤M+N une suite quelconque de nombres complexes dont nous supposons que n∈ / N =⇒ un = 0. AF T Considérons le polynôme trigonométrique X S(α) = un e(nα). n∈N Le point central de la preuve consiste à que, pour tout q ∈ Q, nous avons X 1≤a≤q, pgcd(a,q)=1 |S(a/q)|2 ≥ |S(0)|2 J(q), J(q) = Y p|q ω(p) . p − ω(p) (12.1) Remarquons tout d’abord que, si (12.1) a lieu pour q et q ′ , et que q et q ′ sont premiers entre eux, alors cette inégalité a lieu pour qq ′ . En effet le théorème chinois (voir l’exercice 10) nous permet d’écrire X c 2 = S qq ′ 1≤c≤qq′ , pgcd(c,qq′ )=1 X X a b 2 + ′ . S q q 1≤a≤q, 1≤b≤q′ , pgcd(a,q)=1 pgcd(b,q′ )=1 Soit alors a fixé et remarquons que a X b = an e(na/q)e(nb/q ′ ). q′ DR S q + n∈N Le fait que (12.1) soit vrai pour q ′ nous donne, en changeant un en un e(na/q) : X a a 2 b 2 + ′ ≥ J(q ′ )|S S q q q 1≤b≤q′ , pgcd(b,q′ )=1 Il suffit alors d’appliquer (12.1) pour q pour obtenir la multiplicativité requise. Il nous suffit donc de démontrer la propriété lorsque q est un nombre premier, disons p. Dans ce cas X X X an . |S(a/q)|2 = p |S(b; p)|2 − |S(0)|2 où S(b; p) = 1≤a≤p, pgcd(a,p)=1 b mod p n≡b[p] Dans le membre de droite, nous remarquons que nous pouvons restreindre b à b ∈ Z/pZ \ Ωp . L’inégalité de Cauchy-Schwartz nous garantit que X X 2 |S(0)|2 = S(b; p) ≤ (p − ω(p)) |S(b; p)|2 b mod p b∈Z/pZ\Ωp 25 novembre 2012 Version 2 12.2 Applications 91 et donc, X 1≤a≤p, pgcd(a,p)=1 |S(a/q)|2 ≥ p − 1 |S(0)|2 , p − ω(p) ce que nous recherchions. Nous pouvons alors employer l’inégalité du grand crible, c’est à dire l’inégalité (11.12). Cela nous donne X X |S(0)|2 µ2 (q)J(q) ≤ |an |2 (N + Q2 ). n q∈Q 12.2 AF T Nous choisissons alors an = 1 lorsque n ∈ N et an = 0 sinon. La conclusion est facile. Applications Théorème 12.2 Soit h > 1 un entier pair. Nous avons, quand x tend vers l’infini : # p ≤ x, p + h premier ≤ 8(1 + o(1)) Y 1− p≥3 Y p−1 x 1 . 2 (p − 1) p − 2 (log x)2 2<p|h Théorème 12.3 Nous avons, quand x tend vers l’infini : # p ≤ x, p + 2 et p + 6 premiers ≪ x . (log x)3 L’application qui suit nécessite le chapitre 13. DR Théorème 12.4 Nous avons, quand x tend vers l’infini : # p ≤ x, p2 − 2 premier ≪ x . (log x)2 Exercice 114. Montrer que , quand x tend vers l’infini : # p ≤ x, (p2 + 1)/2 premier ≪ x . (log x)2 Exercice 115. Considérons le nombre r(N ) de représentations de l’entier pair N comme somme de deux nombres premiers, soit X r(N ) = log p1 log p2 . p1 +p2 =N Montrer que N log2 N Y =2 1− r(N ) ≤ (8 + o(1)) S(N ) avec Y p−1 S(N ) = S∞ p−2 p|N p6=2 Le cours de Nouakchott et S∞ p≥3 1 (p − 1)2 . 25 novembre 2012 CHAPITRE 12. LE CRIBLE DE MONTGOMERY 92 Exercice 116. Soit A la suite des entiers pairs qui sont somme de deux nombres premiers et A(X) = #{a ∈ A, a ≤ X}. Montrer que A(X) ≫ X, c’est à dire que l’ensemble des entiers qui sont sommes de deux nombres premiers à une densité inférieure strictement positive. P Indication : Le lecteur pourra partir de R = n≤X r(n) et s’inspirer de l’exercice 74 pour en donner un asymptotique. Par ailleurs, l’inégalité de Cauchy-Schwartz donne X R2 ≤ A(X) r2 (n) AF T n≤X DR où l’on majorera la seconde somme à l’aide du résultat de l’exercice ?? ou ??. Pour majorer P la somme arithmétique résultante, le lecteur pourra se ramener à majorer n≤X S(n)2 /n. 25 novembre 2012 Version 2 Chapitre 13 13.1 AF T Nombres premiers en progressions arithmétiques : une introduction Le groupe multiplicatif de Z/qZ L’ensemble quotient Z/q Z est naturellement muni d’une structure d’anneau. L’addition est donnée par (a mod q) + (b mod q) = (a + b mod q) ce qui fait sens parce que cela ne dépend pas ni choix du représentant a dans Z, ni de celui de b. Le produit est défini de la même façon : DR (a mod q) · (b mod q) = (a · b mod q) Cette définition est aussi cohérente parce qu’elle ne dépend pas des choix de a et b. Voilà pour ce qui est des rappels de la théorie classique. Si a est premier à q, tout autre représentant a′ de la classe de a modulo q est aussi premier à q. Il s’agit donc d’une propriété de la classe a mod q. Soit (Z/q Z)× l’ensemble des classes premières à q. Il se trouve que si nous multiplions deux tels éléments, la classe résultante est encore première à q. Il n’est pas difficile d’en conclure que ((Z/q Z)× , ·) est un groupe abélien fini dont l’élément neutre est 1 mod q, et de cardinal ϕ(q). Le théorème de Lagrange nous garantit donc que ∀a ∈ (Z/q Z)× , aφ(q) ≡ 1[q]. En 1837, pour étudier les nombres premiers dans les progressions arithmétiques, le mathématicien allemand Johann (Peter Gustav Lejeune) Dirichlet introduisit les caractères de Dirichlet modulo q : il s’agit ici des fonctions χ : Z/q Z 7→ C qui sont telles que χ(x) = 0 ssi x ∈ / (Z/q Z)× et ∀(x, y), χ(xy) = χ(x)χ(y). Si χ est un caractère de Dirichlet modulo q, nous avons χ(1) = 1 et ∀a/ pgcd(a, q) = 1, χ(a)φ(q) = 1 CHAPITRE 13. PREMIERS DANS LES PROGRESSIONS 94 ce qui fait que les valeurs non nulles de χ sont des racines de l’unité. La théorie des caractères de Dirichlet se développe ensuite dans deux directions : tout d’abord vers les représentations de (Z/q Z)× de dimension 1, et ensuite vers la dualité de Pontryagin. Nous n’aborderons rien de tout cela ici et nous contenterons d’exemples ! Exercice 117. Montrer que l’ensemble des caractères de Dirichlet modulo q est un groupe abélien fini, lorsque le produit de χ1 et χ2 est simplement donné par (χ1 χ2 )(n) = χ1 (n)χ2 (n). Exercice 118. On dit qu’un entier est un nombre de Carmichael si n n’est pas premier mais, pour tout a entier, on a an ≡ a[n]. AF T ⋄ 1 ⋄ Démontrer le théorème de Korselt : n est un nombre de Carmichael si et seulement si -1) n est sans facteur carré et (2) pour tout facteur p de n, l’entier p − 1 divise n − 1. ⋄ 2 ⋄ Démontrer que 561 est un nombre de Carmichael (c’est le plus petit). 13.2 Les caractères de Dirichlet modulo 3 et modulo 4 Le seul caractère non constant modulo 4 est ∀n ≡ 1[2], χ4 (n) = (−1)(n−1)/2 . Voici une propiété que nous allons utiliser très souvent : X χ4 (n) = 0. (13.1) M<n≤M+4 DR Le seul caractère non constant modulo 3 0 χ3 (n) = 1 −1 Et nous avons encore X est si n ≡ 0[3], si n ≡ 1[3], si n ≡ 2[3]. χ3 (n) = 0. (13.2) M<n≤M+3 Exercice 119. Montrer que les deux caractères non constants modulo 8 sont donnés par 2 2 ∀n ≡ 1[2], χ8 (n) = (−1)(n −1)/8 , χ4 χ8 (n) = (−1)(n−1)/2+(n −1)/8 . Nous considérons alors les deux séries L de Dirichlet définies par L(s, χ3 ) = X χ3 (n) , ns n≥1 L(s, χ4 ) = X χ4 (n) . ns (13.3) n≥1 Ces deux sommes convergent en s = 1 en vertu de (13.1) et (13.1). Il va se révéler crucial de montrer que L(1, χ3 ) et L(1, χ4 ) sont non nuls. Voici le lemme qui va nous permettre de les calculer : 25 novembre 2012 Version 2 13.2 Les caractères de Dirichlet modulo 3 et modulo 4 95 Lemme 13.1 Soit α ∈]0, 1[ est un nombre réel. Nous avons lim K→∞ X e(kα) = − log |2 sin πα| + i( 12 − α)π. k 1≤k≤K Démonstration. Le série en question converge vers − log(1 − e(α). C’est plutôt le rôle du cours d’analyse de s’occuper de cela, mais voici une preuve, qui part du prolongement explicite du logarithme : log(x + iy) = log p x2 + y 2 + 2i arctan y p x + x2 + y 2 x + iy ∈ C \ R− . AF T Ici, avec β = πα, nous avons x = 1 − cos β = 2 sin2 (β/2), puis x2 + y 2 = 4 sin2 (β/2) et y = − sin β = −2 sin(β/2) cos(β/2). Il vient log(1 − e(α)) = log |2 sin(β/2)| + 2i arctan − cos(β/2) . sin(β/2) + 1 Nous posons alors t = tan(β/4), et avec cos(β/2) = (1−t2 )/(1+t2 ) et sin(β/2) = 2t/(1 + t2 ), nous trouvons que arctan sin(β/4) − cos(β/4) sin((β − π)/4) − cos(β/2) = arctan = arctan . sin(β/2) + 1 sin(β/4) + cos(β/4) cos((β − π)/4) Finalement, nous obtenons DR log(1 − e(α)) = log |2 sin(β/2)| + i(α − 21 )π. Théorème 13.2 π L(χ3 ) = √ , 3 3 L(χ4 ) = π . 4 (13.4) Démonstration. Nous avons √ χ3 (n) = (e(n/3) − e(2n/3))/(i 3) (13.5) ce que nous vérifions en chaque point n à partir de √ −1 + i 3 , e(1/3) = 2 √ −1 − i 3 e(2/3) = . 2 De même, nous vérifions que χ4 (n) = (e(n/4) − e(3n/4))/(2i). (13.6) Le lemme 13.1 nous donne X e(k/3) π π = − log2 sin + i , k 3 6 k≥1 Le cours de Nouakchott X e(2k/3) π 2π = − log2 sin −i . k 3 6 k≥1 25 novembre 2012 CHAPITRE 13. PREMIERS DANS LES PROGRESSIONS 96 La conclusion est alors facile. Je tiens à faire remarquer qu’il est facile de vérifier numériquement notre résultat ; en effet une sommation par parties nous donne directement X e(k/3) X e(k/3) Z ∞ X dt = + e(k/3) 2 k k t K+1 k≥1 1≤k≤K K<k≤t X e(k/3) = + O∗ (1/(K + 1)). k 1≤k≤K 13.3 AF T En prenant K = 100 par exemple et en calculant avec GP/Pari, nous obtenons une bonne approximation du résultat annoncé. Les théorèmes de Mertens modulo 3 et 4 Cette partie commence en remarquant que les caractères de Dirichlet sont des fonctions multiplicatives, ce qui nous donne L(s, χ) = Y p≥2 1 1− (ℜs > 1). χ(p) ps Exercice 120. ⋄ 1 ⋄ Montrer que, pour χ = χ3 ou χ4 et ℜs > 1, nous avons − X χ(n)Λ(n) L′ . (s, χ) = L ns n≥1 DR ⋄ 2 ⋄ Montrer que, pour χ = χ3 ou χ4 et s > 1, nous avons log L(s, χ) = X χ(n)Λ(n) . ns log n n≥2 Voici une invention de Dirichlet : Lemme 13.3 Nous avons, si n est premier à 3 : 1n≡1[3] = (1(n) + χ3 (n))/2, 1n≡2[3] = (1(n) − χ3 (n))/2. De même, si n est premier à 2 : 1n≡1[4] = (1(n) + χ4 (n))/2, 1n≡3[4] = (1(n) − χ4 (n))/2. Ce lemme permet d’écrire la fonction caractéristique des progressions arithmétiques concernées sous la forme d’une combinaison linéaire de fonctions multiplicatives. Nous pouvons commencer la preuve à proprement parler, voir (Mertens, 1897). La version moderne de cette preuve se trouve dans (Ramaré, 2002) Lemme 13.4 Pour χ = χ3 ou χ4 , nous avons L(1, χ) = X χ(n) + O(1/x), n n≤x 25 novembre 2012 −L′ (1, χ) = X χ(n) log n + O(log(2x)/x). n n≤x Version 2 13.3 Les théorèmes de Mertens modulo 3 et 4 97 Démonstration. Utiliser une sommation par parties à chaque fois. Lemme 13.5 Pour χ = χ3 ou χ4 , nous avons X Λ(n)χ(n) −L′ (1, χ) = + O(log(2x)/x). L(1, χ) n n≤x Démonstration. Nous partons de −L′ (1, χ) = X χ(n) log n + O(log(2x)/x) n n≤x AF T et utilisons log = 1 ⋆ Λ. Cela donne −L′ (1, χ) = X χ(ℓ)Λ(ℓ) X χ(m) + O(log(2x)/x). ℓ m ℓ≤x m≤x/ℓ Le lemme précédent nous donne alors −L′ (1, χ) = L(1, χ) X χ(ℓ)Λ(ℓ) ℓ ℓ≤x +O X ℓ≤x Λ(ℓ)/x + O(log(2x)/x). Le théorème de Tchebyscheff ainsi que la non-annulation de L(1, χ) nous permet de conclure. Théorème 13.6 Nous avons X Λ(n) = n n≤x, n≡1[3] 1 2 log x + O(1), X Λ(n) = n 1 2 log x + O(1), 1 2 log x + O(1). n≤x, n≡2[3] DR et de même concernant les nombres premiers modulo 4 X Λ(n) = n 1 2 n≤x, n≡1[4] log x + O(1), X Λ(n) = n n≤x, n≡3[4] Démonstration. Nous écrivons, à l’aide du lemme 13.3, X Λ(n) = n n≤x, n≡1[3] 1 2 X n≤x, pgcd(n,3)=1 Λ(n) + n 1 2 X n≤x, pgcd(n,3)=1 Λ(n)χ3 (n) . n La contribution des puissances de 3 à la première somme est O(1). Nous utilisons le lemme 5.6 pour la première somme et le lemme 13.5 pour la seconde. Il est facile de conclure. Exercice 121. ⋄ 1 ⋄ Montrer qu’il existe deux constantes c1 , c2 > 0 telles que, pour x ≥ 7, X Λ(n) ≥ c1 x. c2 x ≥ n≤x, n≡1[3] Le cours de Nouakchott 25 novembre 2012 CHAPITRE 13. PREMIERS DANS LES PROGRESSIONS 98 ⋄ 2 ⋄ Montrer qu’il existe deux constantes c1 , c2 > 0 telles que, pour x ≥ 3, X Λ(n) ≥ c1 x. c2 x ≥ n≤x, n≡2[3] ⋄ 3 ⋄ Montrer qu’il existe deux constantes c1 , c2 > 0 telles que, pour x ≥ 5, X c2 x ≥ Λ(n) ≥ c1 x. AF T n≤x, n≡1[4] ⋄ 4 ⋄ Montrer qu’il existe deux constantes c1 , c2 > 0 telles que, pour x ≥ 3, X c2 x ≥ Λ(n) ≥ c1 x. n≤x, n≡3[4] Le lecteur lira aussi (Bordellés, 2005) avec bénéfice. 13.4 Un exemple Considérons la fonction multiplicative h définie par h(pk ) = 1 DR 2k h(p ) = 1 h(p 2k+1 )=1 si k ≥ 1 et p ≡ 1, 2[4], si k ≥ 0 et p ≡ 3[4], si k ≥ 1 et p ≡ 3[4], qui est en fait la fonction caractéristique des sommes de deux carrés. Avec g(d) = h(d)/d, nous constatons que les hypothèses du théorème 2 sont vérifiées pour κ = 12 ce qui nous donne X h(d) = C (log D)1/2 1 + O(1/ log D) d d≤D pour une certaine constante C > 0. Exercice 125. Montrer que, pour n ≥ 1, nous avons X µ(b) log ℓ = Λ(n). bℓ=n 25 novembre 2012 Version 2 13.4 Un exemple 99 Exercice 126. (P. Gallagher et R. Vaughan) Soit une fonction quelconque gP ≥ 0 et y et z deux paramètres réels positifs. Montrer que la somme n Λ(n)g(n) égale X X wℓ g(ℓm) (un − vn )g(n) + n≤P yz<ℓ≤P/z yz<m≤P/(yz) lorsque P > 4z et avec X un = µ(b) log(n/b) , vn = µ(b)Λ(c) bc|n b≤y,c≤z AF T b|n b≤y X wℓ = X µ(b)Λ(c). bc=ℓ b>y,c>z Exercice 127. (Yu Linnik) Montrer que pour K entier pair, et une fonction quelconque g ≥ 0, nous avons : X Λ(n) n log n g(n) ≥ X (−1)k+1 X τk∗ (n)g(n) k n 1≤k≤K où τk∗ (n) est le nombre de k-uplets (d1 , d2 , . . . , dk ) d’entiers strictement supérieurs à 1 tels que d1 d2 . . . dk = n. Montrer que, pour K impair, l’inégalité inverse a lieu. Indication : Commençer par l’inégalité : DR Λ(n) ≥ T (n) = Λ(n) − Le cours de Nouakchott X ∗ Λ(ℓ)τK (a). ℓa=n 25 novembre 2012 CHAPITRE 13. PREMIERS DANS LES PROGRESSIONS DR AF T 100 25 novembre 2012 Version 2 Chapitre 14 AF T Exercices Exercice 128. On using the proof of (3.1) but replacing (3.2) by (7.10), show that X ϕ(n) log n (log(2X))2 = C1 log2 X + C2 log X + C3 + O n n X n≤X for some constants C1 , C2 and C3 . Exercice 129. Soit d un entier ≥ 1 et N un réel ≥ 0. Montrer que X µ(n)/n ≤ 1. n≤N, (n,d)=1 DR Indication : Soit d′ le produit P des nombres premiers ≤ N qui sont aussi premiers à d. Étudier la quantité n≤N,(n,d′ )=1 1 en utilisant X µ(ℓ) = ℓ|n, ℓ|d′ ( 1 0 si pgcd(n, d′ ) = 1, sinon. On pourra supposer x entier. Exercice 130. Donner une majoration de X µ(n) x log n n n≤x à partir de P nm≤x µ(n)d(m). Exercice 131. Montrer que, pour tout entier n, nous avons X µ(d)µ(e) = µ(n). d,e≥1, [d,e]=n CHAPITRE 14. EXERCICES 102 Exercice 132. Montrer que nous avons X µ(d)µ(e) 6 = 2. [d, e]2 π d,e≥1 Exercice 133. Montrer en utilisant l’inégalité de Brun-Titchmarsh, le théorème de Bombieri-Vinogradov et l’exercice 105 qu’il existe B tel que X 3ω(d) max max ψ(y; q, a) − y/ϕ(q) ≪ X/ logA X y≤X a mod ∗ q q≤Q √ X/(log X)B . AF T pour Q = Indication : Utiliser l’inégalité de Cauchy-Schwartz et l’exercice 105. Exercice 134. Montrer que pour tout caractère χ modulo q de conducteur f, nous avons χ(n) = τf (χ∗ , 1)ϕ(q) q X d|q, f|d,(f,d/f)=1 µ(d/f)χ∗ (d/f) ϕ(d) X χ(a) e(−na/d) a mod ∗ d où χ∗ est le caractère induit par χ modulo f. Indication : Utiliser le théorème ??. Exercice 135. Soit χ un caractère modulo q de conducteur f. Montrer que p Y X √ (2 − 1/p) log q ≪ q log q. χ(n) ≪ f n≤N p|q, p∤f DR Indication : Utiliser l’exercice 134. Exercice 136. Soit χ un caractère de Dirichlet primitif modulo q. Montrer que X 2 sin πm si χ(−1) = 1, χ(m) log q −τ (χ) 1≤m≤q/2 L(1, χ) = X 2m q iπ χ(m) 1 − si χ(−1) = −1, q avec τ (χ) = P a mod q 1≤m≤q/2 χ(a) e(a/q). Indication : Développer le caractère χ en termes additifs mo des caractères P + iπ 1 − 2m . dulo q et utiliser n≥1 e(na/q)/n = logsin πm q q Exercice 137. Montrer que |L(1, χ)| ≤ log q + O(1) où χ est un caractère de Dirichlet modulo q. Indication : Utiliser une intégration P par parties pour exprimer L(1, χ) − P n≤t χ(n), puis choisir N de façon n≤N χ(n)/n en fonction de S(t) = optimale. Remarquons ici qu’en utilisant l’exercice 134, nous pourrions obtenir la majoration |L(1, χ)| ≤ 12 log q + O(log log q). 25 novembre 2012 Version 2 103 Exercice 138. Montrer que |L( 21 + it, χ)| ≪ q de Dirichlet modulo q. p |t| + 1 où χ est un caractère Exercice 139. Soit χ1 et χ2 deux caractères modulo q. La somme de Jacobi se définit par X Jq (χ1 , χ2 ) = χ1 (x)χ2 (1 − x). x mod q Montrer que si χ1 et χ2 sont primitifs modulo q, alors Jq (χ1 , χ2 ) = τq (χ1 , 1)τq (χ2 , 1)τq (χ1 χ2 , 1)/q. AF T Montrer que lorsque χ est de conducteur f, nous avons Y Jq (χ, χ) = µ(f)χ(−1) (p − 2). p|q, p∤f Exercice 140. Soit p un nombre premier ≡ 1[4]. Montrer qu’il existe un caractère primitif χ d’ordre 4 modulo p. Montrer que pour ce caractère, Jp (χ, χ) √ est de modulo p. En déduire que p peut s’écrire comme une somme de deux carrés d’entiers. Indication : Utiliser l’exercice 139 et déterminer l’ensemble des valeurs prises par χ. Exercice 141. Montrer qu’il existe une constante C > 0 telle que Y 1 − 1/p ∼ C(log X)−1/2 . DR p≤X, p≡2[3] Indication : Utiliser le théorème de Siegel-Walfish. Exercice 142. Montrer que pour Y ≥ 10 et σ > 0, nous avons Y (1 + p−σ ) ≪σ exp Y max(0,1−σ) log log Y . p≤Y Indication : Passer aux logarithmes pour se ramener à la somme de 1/pσ . Pour évaluer cette dernière, traiter séparément les cas 1 − σ ≤ 1/ log Y et 1 − σ > 1/ log Y . Exercice 143. Montrer que X µ(d) N log ≪ 1. d d d≤N Indication : On pourra partir de µ ⋆ log = Λ. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 14. EXERCICES 104 Exercice 144. ⋄ 1 ⋄ Montrer que, lorsque α ∈ [0, 1[, nous avons log(1 − e(α)) = X e(kα) = log(2 sin πα) + iπ(α − 21 ). k k≥1 (On rappelle que e(α) = exp(2iπα)). AF T ⋄ 2 ⋄ Soit χ un caractère de Dirichlet primitif modulo q. Montrer que ∀n ∈ Z, où χ(n) = τ (χ) X χ(m)e(mn/q) q m mod q τ (χ) = X χ(a)e(−a/q). a mod q Établir que |τ (χ)| = √ q. DR ⋄ 3 ⋄ Montrer que si χ est un caractère de Dirichlet primitif modulo q > 1, alors iπτ (χ) X mχ(m) lorsque χ(−1) = −1, q2 1≤m≤q L(1, χ) = τ (χ) X m lorsque χ(−1) = 1. χ(m) log sin q q 1≤m≤q Exercice 147. P σ ⋄ 1 ⋄ Montrer que la série n≥1 µ(n)/n est convergente pour σ ≥ 1 et représente une fonction continue. ⋄ 2 ⋄ Montrer qu’il existe une constante c′ > 0 telle que, pour tout x ≥ 2, nous avons X µ(n)/n = O 1/ log x . n≤x ⋄ 3 ⋄ Comparer la série de Dirichlet de µ(n)/ϕ(n) à 1/ζ(s + 1) et montrer qu’il existe une constante c′′ > 0 telle que X µ(n) = O 1/ log x . ϕ(n) n≤x Indication : On pourra utiliser la méthode de convolution. 25 novembre 2012 Version 2 105 Exercice 148. Il s’agit de montrer que le nombre d’entiers ≤ N dont tous les facteurs sont ≤ N ε est ≫ε N . Soit ǫ = 1/k, où k ≥ 1 est un entier. Soit S l’ensemble des entiers qui n’ont que des facteurs ≤ N ǫ . Et Z le nombre d’entre eux qui sont ≤ N . XX log p, montrer que ⋄ 1 ⋄ En partant de Z log N ≥ n∈S, p|n n≤N Z log N ≥ C6 N X 1/n − C7 Z n∈S, N 1−ǫ <n≤N AF T pour des constantes strictement positives C6 et C7 . ⋄ 2 ⋄ La minoration de la somme de 1/n pour n dans S et dans l’intervalle ci-dessus va suivre le même chemin, mais nécessite une récurrence dont voici l’élément clé : il existe deux constantes c1 = c1 (ǫ) et N0 = N0 (ǫ) telles que pour tout ℓ ∈ {0, . . . , k − 1} et N ≥ N0 , nous avons X X 1/n ≥ c1 1/n. (14.1) n∈S, 2ℓ N 1−(ℓ+1)/k <n≤N 1−ℓ/k n∈S, 2ℓ+1 N 1−(ℓ+2)/k <n≤N 1−(ℓ+1)/k Montrer cette inégalité. ⋄ 3 ⋄ En utilisant (14.1), montrer par récurrence que X X 1/n ≥ c1k−1 1/n. n∈S, 2k−1 <n≤N 1/k DR n∈S, N 1−1/k <n≤N Cette dernière quantité est ≫ log N ǫ puisque la condition n ∈ S y est superflue. En conclure que (log N + C7 )Z ≫ǫ N log N ce que nous cherchions à démontrer. Le cours de Nouakchott 25 novembre 2012 CHAPITRE 14. EXERCICES DR AF T 106 25 novembre 2012 Version 2 Notations AF T Toutes les notations utilisées sont standards . . . d’une façon ou d’une autre ! En voici quelques unes : — kak désigne la norme L2 , mais kuk désigne aussi la distance au plus proche entier. — e(y) = exp(2iπy). — La lettre p pour une variable implique toujours que celle-ci est un nombre premier. — Nous notons [d, d′ ] le ppcm et (d, d′ ) le pgcd des entiers d et d′ . — |A| désigne le cardinal de l’ensemble A et 1A sa fonction caractèristique. Oui, bien sûr, |s| est aussi le module du nombre complexe s. — qkd signifie que q divise d de telle sorte que q et d/q soit premiers entre eux. Nous énoncerons : q divise exactement d. Q Q i est i pi , soit encore le — Le noyau sans facteurs carrés de d = i pα i produit de tous les diviseurs premiers de d. — ω(d) est le nombre de facteurs premiers de d, comptés sans multiplicité. DR — ϕ(d) est la focntion d’Euler, c’est à dire le cardinal du groupe multiplicatif de Z/dZ. — σ(d) est le nombre de diviseurs (positifs) de d. — µ(d) est la fonction de Moebius, c’est à dire 0 si d est divisible par un carré > 1 et (−1)r sinon, où r = ω(d) est le nombre de facteurs premiers de d. — cq (n) désigne la somme de Ramanujan sum. Il s’agit de la somme des e(an/q) sur tous les a modulo q qui sont premiers à q. — Λ(n) est la fonction de van Mangoldt : log p si n est une puissance du nombre premier p et 0 sinon. — La notation de Landau f = OA (g) signifie qu’il existe une constante B telle que |f | ≤ Bg, constante qui peut dépendre de A. Si nous mettons plusieurs variables en indices, cela signfie tout simplement que la constante implicite B dépend de tous ceux-là. — La notation f = O∗ (g) signifie que |f | ≤ g, c’est à dire qu’il s’agit d’un O mais avec une constante implicite égale à 1. — Nous utiliserons aussi la notation de Vinogradov f ≪ g qui signifie f = O(g). Ces deux notations seront donc pour nous équivalentes (ce n’est pas toujours le cas en général car les notations de Landau font appel à CHAPITRE 14. EXERCICES 108 la notion de voisinage d’un point ; en ce sens, il est correct de dire que la notation de Vinogradov correposnd à une version uniforme de la notation de Landau). Nous utiliserons aussi f ≪A g pour f = OA (g). — La notation f ⋆ g désigne la convolution arithmétique, c’est à dire la foncP tion h sur les entiers positifs définie par h(d) = q|d f (q)g(d/q). DR AF T — π est . . . le nombre réel classique qui vaut à peu près 3.141 5 . . . ! Mais π désigne aussi la fonction de comptage des nombres premiers et π(X) est donc le nombre de nombres premiers inférieur ou égaux à X : par exemple π(6) = 3. Nous éviterons cette notation si possible. P Une autre façon de dire la définition ci-dessus consite à écrire π(X) = p≤X 1. P — Les fonctionsP de Tchebyschev ϑ et ψ valent respectivement ϑ(X) = p≤X log p et ψ(X) = n≤X Λ(n). Ces deux fonctions sont très proches l’une de l’autre. 25 novembre 2012 Version 2 References AF T Apostol, T.M. 1976. Introduction to analytic number theory. New York : SpringerVerlag. Undergraduate Texts in Mathematics. Bateman, P.T., & Diamond, H.G. 2004. Analytic number theory. World Scientific Publishing Co. Pte. Ltd., Hackensack, NJ. An introductory course. Bombieri, E. 1971. A note on the large sieve. Acta Arith., 18, 401–404. Bombieri, E. 1987/1974a. Le grand crible dans la théorie analytique des nombres. Astérisque, 18, 103pp. Bombieri, E. 1987/1974b. Le grand crible dans la théorie analytique des nombres. Astérisque, 18, 103pp. Bordellés, O. 2005. An explicit Mertens’ type inequality for arithmetic progressions. J. Inequal. Pure Appl. Math., 6(3), paper no 67 (10p). Bordellès, O. 2006. An inequality for the class number. JIPAM. J. Inequal. Pure Appl. Math., 7(3), Article 87, 8 pp. (electronic). Bordellès, O. 2012. Arithmetic Tales. Springer. DR 1 1 1 1 1 1 1 1 1 1 Brun, V. 1919. La série 51 + 71 + 11 + 13 + 17 + 19 + 29 + 31 + 41 + 43 + 59 + 61 +··· où les dénominateurs sont ”nombres premiers jumeaux” est convergente ou finie. Darboux Bull., 43(2), 100–104, 124–128. Cahen, E. 1894. Sur la fonction ζ(s) de Riemann et sur des fonctions analogues. http://www.numdam.org/item?id=ASENS_1894_3_11__75_0. Daboussi, H. 1984. Sur le théorème des nombres premiers. C. R. Acad. Sci., Paris, Sér. I, 298, 161–164. Daboussi, H. 1996. Effective estimates of exponential sums over primes. Analytic number theory. Vol. 1. Proceedings of a conference in honor of Heini Halberstam, May 16-20, 1995, Urbana, IL, USA. Boston, MA: Birkhaeuser. Prog. Math., 138, 231–244. Daboussi, H., & Rivat, J. 2001. Explicit upper bounds for exponential sums over primes. Math. Comp., 70(233), 431–447. Davenport, H. 2000. Multiplicative Number Theory. third edition edn. Graduate texts in Mathematics. Springer-Verlag. de la Vallée-Poussin, Ch. 1899. Sur la fonction ζ(s) de Riemann et le nombre des nombres premiers inférieurs à une limite donnée. Belg. Mém. cour. in 8◦ , LIX, 74pp. Delange, H. 1954. Généralisation du théorème de Ikehara. Ann. Sci. Ecole Norm. Sup. (3), 71, 213–242. http://www.numdam.org/item?id=ASENS_1954_3_71_3_213_0. Delange, H. 1961. Un théorème sur les fonctions arithmétiques multiplicatives et ses applications. Ann. Sci. École Norm. Sup. (3), 78, 1–29. http://www.numdam. org/item?id=ASENS_1961_3_78_1_1_0. REFERENCES 110 Dirichlet, P.G.L. 1937. Beweis des Satzes, das jede unbegrenzte arithmetische Progression, deren erstes Glied und Differenz ganze Zahlen ohne gemeinschaftlichen Factor sind, unendlich viele Primzahlen enthält. Abhandlungen der Königlichen Preussischen Akademie der Wissenschaften zu Berlin. Scan de l’article original : http://bibliothek.bbaw.de/bibliothek-digital/digitalequellen/ schriften/anzeige?band=07-abh/1837&seite:int=00000286 et traduction : http://arxiv.org/abs/0808.1408. Dress, F. 1983/84. Théorèmes d’oscillations et fonction de Möbius. Sémin. Théor. Nombres, Univ. Bordeaux I, Exp. No 33, 33pp. http://resolver.sub. uni-goettingen.de/purl?GDZPPN002545454. AF T Dusart, P. 1998. Autour de la fonction qui compte le nombre de nombres premiers. Ph.D. thesis, Limoges, http\string://www.unilim.fr/laco/theses/ 1998/T1998_01.pdf. 173 pp. Elliott, P.D.T.A. 1971. On inequalities of large sieve type. Acta Arith., 18, 405–422. Ellison, W.J. 1975. Les nombres premiers. Paris : Hermann. En collaboration avec Michel Mendès France, Publications de l’Institut de Mathématique de l’Université de Nancago, No. IX, Actualités Scientifiques et Industrielles, No. 1366. Granville, A., & Soundararajan, K. 2001. The spectrum of multiplicative functions. Ann. of Math. (2), 153(2), 407–470. Greaves, G., & Huxley, M. 1999. One sided sifting density hypotheses in Selberg’s sieve. Pages 105–114 of : Jutila, M. (ed), Turku symposium on number theory in memory of Kustaa Inkeri. Turku, Finland : Berlin : de Gruyter. Halász, G. 1968. Über die Mittelwerte multiplikativer zahlentheorischer Funktionen. Acta Math. Acad. Sci. Hungar., 19, 365–403. Halberstam, H., & Richert, H.E. 1971. Mean value theorems for a class of arithmetic functions. Acta Arith., 43, 243–256. Halberstam, H., & Richert, H.E. 1974. Sieve methods. Academic Press (London), 364pp. DR Halberstam, H., & Richert, H.E. 1979. On a result of R. R. Hall. J. Number Theory, 11, 76–89. Hardy, G. H., & Riesz, M. 1964. The general theory of Dirichlet’s series. Cambridge Tracts in Mathematics and Mathematical Physics, No. 18. Stechert-Hafner, Inc., New York. Première édition en 1915. Hensley, D., & Richards, I. 1974. Primes in intervals. Acta Arith., 4(25), 375–391. Hewitt, E., & Williamson, J.H. 1957. Note on absolutely convergent Dirichlet series. Proc. Amer. Math. Soc., 8, 863–868. Kahane, J.-P., & Queffélec, H. 1997. Ordre, convergence et sommabilité de produits de séries de Dirichlet. Ann. Inst. Fourier (Grenoble), 47(2), 485–529. http: //www.numdam.org/item?id=AIF_1997__47_2_485_0. Lejeune-Dirichlet, P.G. 1871. Lectures on Number Theory, edited by R. Dedekind. Second edition. (Vorlesungen über Zahlentheorie, herausgegeben von R. Dedekind. Zweite Auflage.). Braunschweig. Vieweg . Première édition en 1863. Levin, B.V., & Fainleib, A.S. 1967. Application of some integral equations to problems of number theory. Russian Math. Surveys, 22, 119–204. Mertens, F. 1897. On Dirichlet’s proof of the theorem that every infinite arithmetic progression of integers, whose difference is prime to its members, contains infiniely many prime numbers. (Ueber Dirichlet’s Beweis des Satzes, dass jede unbegrenzte ganzzahlige arithmetische Progression, deren Differenz zu ihren Gliedern teilerfremd ist, unendlich viele Primzahlen enthält.). Wien. Ber., 106, 254–286. 25 novembre 2012 Version 2 REFERENCES 111 Montgomery, H.L., & Vaughan, R.C. 1973. The large sieve. Mathematika, 20(2), 119–133. Montgomery, H.L., & Vaughan, R.C. 2006. Multiplicative Number Theory : I. Classical Theory. Cambridge Studies in Advanced Mathematics, vol. 97. Cambridge University Press. Moree, P. 2004. Chebyshev’s bias for composite numbers with restricted prime divisors. Math. Comp., 73(245), 425–449. Ramaré, O. 1995. On Snirel’man’s constant. Ann. Scu. Norm. Pisa, 21, 645–706. http://math.univ-lille1.fr/~ ramare/Maths/Article.pdf. Ramaré, O. 2002. Sur un théorème de Mertens. Manuscripta Math., 108, 483–494. AF T Rawsthorne, D.A. 1982. Selberg’s sieve estimate with a one-sided hypothesis. Acta Arith., 49, 281–289. Riesel, H., & Vaughan, R.C. 1983. On sums of primes. Arkiv för mathematik, 21, 45–74. Rosser, J.B., & Schoenfeld, L. 1962. Approximate formulas for some functions of prime numbers. Illinois J. Math., 6, 64–94. Schinzel, A. 1961. Remarks on the paper : Sur certaines hypothèses concernant les nombres premiers. Acta Arith., 7(1), 1–8. Schinzel, A., & Sierpiǹski, W. 1958. Sur certaines hypothèses concernant les nombres premiers. Acta Arith., 4(3), 185–208. Selberg, A. 1949. On elementary problems in prime number-theory and their limitations. C.R. Onzième Congrès Math. Scandinaves, Trondheim, Johan Grundt Tanums Forlag, 13–22. Selberg, A. 1991. Collected Papers. Springer-Verlag, II, 251pp. Tenenbaum, G. 1995. Introduction à la théorie analytique et probabiliste des nombres. Second edn. Cours Spécialisés, vol. 1. Paris : Société Mathématique de France. van Lint, J.E., & Richert, H.E. 1965. On primes in arithmetic progressions. Acta Arith., 11, 209–216. DR Vinogradov, I. M. 1954. Elements of number theory. New York : Dover Publications Inc. Translated by S. Kravetz. Wirsing, E. 1961. Das asymptotische Verhalten von Summen über multiplikative Funktionen. Math. Ann., 143, 75–102. Le cours de Nouakchott 25 novembre 2012 Index Λ(n), 35 π(x), ψ(x), 38 132, 106 133, 106 134, 106 135, 106 136, 106 137, 106 138, 107 139, 107 14, 9 140, 107 141, 107 142, 107 143, 107 144, 108 147, 110 148, 111 15, 9 16, 9 17, 9 18, 10 19, 10 2, 6 20, 10 21, 11 24, 11 25, 12 26, 12 27, 12 28, 12 29, 13 3, 6 30, 17 31, 17 32, 17 33, 17 34, 17 35, 18 36, 18 37, 18 38, 18 39, 18 4, 6 40, 21 41, 21 AF T Bertrand, Joseph, 39 no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no Caractère de Dirichlet, 97 Chebyshev, Pafnouty, 37, 39 Comparaison à une intégrale, 36 Dusart, Pierre, 40 DR Euler-MacLaurin summation formula, 26 Exercice no 1, 6 no 10, 8 no 100, 61 no 101, 61 no 102, 64 no 103, 65 no 104, 65 no 105, 68 no 106, 68 no 107, 68 no 11, 8 no 110, 71 no 111, 71 no 112, 74 no 113, 81 no 114, 95 no 115, 95 no 116, 96 no 117, 98 no 118, 98 no 119, 99 no 12, 9 no 120, 100 no 121, 102 no 125, 102 no 126, 103 no 127, 103 no 128, 105 no 129, 105 no 13, 9 no 130, 105 no 131, 105 INDEX Montgomery H.L. & Vaughan R.C., 89 Noyau sans facteurs carrés, 115 Produit de convolution, 9 Rosser, John, 37, 40 Selberg, Atle, 87, 89 Sommation par parties, 38, 40 Somme de Jacobi, 107 Somme de Ramanujan, 74, 77, 82, 115 Stieltjes, Thomas, 38 Summation by parts, 26 AF T 42, 22 43, 22 44, 23 47, 27 48, 27 49, 27 5, 7 52, 28 53, 28 54, 31 56, 32 61, 37 62, 38 63, 38 64, 38 65, 39 66, 40 67, 41 71, 42 72, 42 73, 42 74, 42 75, 42 76, 42 77, 43 78, 43 79, 43 8, 7 80, 43 81, 43 83, 45 84, 46 85, 46 86, 46 87, 46 91, 47 94, 48 95, 48 96, 48 97, 54 98, 54 99, 61 Uniformity in error terms, 26 DR no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no no 113 Fonction Additive, 5 Multiplicative, 6 Fonction de Liouville, 5 Fonction de Moebius, 5 Inégalité du grand crible, 88 Méthode de Rankin, 57 von Mangoldt, Hans, 35 Mertens, Franz, 39 Le cours de Nouakchott 25 novembre 2012 INDEX DR AF T 114 25 novembre 2012 Version 2 DR AF T