See discussions, stats, and author profiles for this publication at: http://www.researchgate.net/publication/266367922 Analyse. Fondements, techniques, évolution. (Analysis. Foundations, techniques, evolution).2ème éd. 2ème éd ARTICLE READS 13 1 AUTHOR: Jean Mawhin Université catholique de Louvain 447 PUBLICATIONS 5,177 CITATIONS SEE PROFILE Available from: Jean Mawhin Retrieved on: 02 November 2015 ANALYSE Fondements, techniques, évolution Jean Mawhin Université Catholique de Louvain Préface de la deuxième édition Ce Cours d’analyse constitue la partie théorique du cours de calcul différentiel et intégral dispensé aux étudiants de candidatures en sciences mathématiques et physiques à l’Université Catholique de Louvain. En le publiant, nous ne faisons que suivre une tradition illustrée à l’U.C.L. par Ph. Gilbert et Ch.J. de la Vallée Poussin et, dans les autres universités belges, par A. Timmermans, A. Meyer, M. Schaar, E. Catalan, P. Mansion, J. Neuberg, L. Godeaux et H.G. Garnir. Le but de cet ouvrage est d’introduire les concepts et les résultats fondamentaux du calcul différentiel et intégral, de développer les techniques correspondantes utiles à tant de disciplines scientifiques, et d’ouvrir à quelques domaines importants de l’analyse qui seront développés dans d’autres cours. La notion de limite est le seul concept vraiment nouveau que l’analyse introduit. Face à une opération impossible pour les opérations habituelles de l’arithmétique ou de l’algèbre, mais pour lesquelles un procédé de résolution “approchée” existe, on cherche à montrer que l’erreur commise peut être rendue arbitrairement petite pour un choix approprié, et suffisamment vaste, de solutions approchées. C’est une méthodologie proche de celle de l’expérimentateur ou du technicien, à cela près qu’il n’y a pas de limitation a priori dans la précision. Depuis la publication par L’Hospital, il y a exactement trois cents ans, du premier d’entre eux, la production de livres de calcul différentiel et intégral a été très abondante. Chaque auteur doit donc se justifier en dégageant l’originalité de son produit. Après un premier chapitre rappelant le minimum indispensable sur le langage des ensembles, les nombres et l’espace vectoriel à n dimensions, les suivants abordent successivement les notions de limite, continuité etdérivabilité en un point pour les fonctions d’une ou de plusieurs variables réelles, en se limitant rigoureusement aux propriétés locales. Le débutant peut ainsi se concentrer sur la définition de limite et sur les techniques régissant son utilisation. L’ouvrage insiste plus que d’autres sur la notion de fonction localement bornée en un point: le produit d’une fonction ayant une limite nulle par une fonction localement bornée a une limite nulle, et l’utilisation systématique de ce résultat simplifie la démonstration de nombreuses propriétés. C’est en particulier le cas pour l’étude du délicat concept de dérivée totale d’une fonction de plusieurs variables. Le passage des propriétés locales aux propriétés globales fait appel à une variante de la compacité classique, le lemme de Cousin, qui sera indispensable pour définir, plus loin, la notion d’intégrale. Les propriétés globales des fonctions continues sont systématiquement démontrés à partir de cette technique, qui privilégie la notion de partition ou découpage, plus concrète peut-être que celle de recouvrement. Le théorèmes et inégalités de la moyenne pour les fonctions dérivables sont d’autres résultats globaux importants dont découlent de nouvelles techniques de calcul des limites. Le lemme de Cousin fournit aussi une démonstration naturelle de l’indispensable critère de Cauchy permettant de prouver l’existence d’une limite sans en connaı̂tre a priori la valeur, une caractéristique précieuse en théorie de l’itération et dans ses applications aux fonctions implicites. ii Afin de minimiser, chez les débutants, les confusions trop fréquentes entre les notions liées à l’ordre et celles liées à la distance, un chapitre regroupe les résultats dépendant de la structure d’ordre de la droite réelle. C’est là qu’apparaissent les fonctions monotones, les fonctions convexes et les premières fonctions transcendantes élémentaires: l’exponentielle et le logarithme. La notion de dérivée d’ordre supérieur et le développement de Taylor conduisent à l’étude des séries, permettant l’introduction analytique des fonctions trigonométriques et des exponentielles complexes. On dispose ainsi du matériel nécessaire pour aborder les équations différentielles linéaires à coefficients constants. L’approche proposée ne fait appel qu’à des techniques simples d’algèbre linéaire sur des espaces convenables d’exponentielles-polynômes. Le problème de Cauchy pour un système différentiel est introduit, et l’unicité de sa solution prouvée par des considérations élémentaires. La résolution de l’équation différentielle linéaire non homogène la plus simple n’est rien d’autre que le problème de la primitivation d’une fonction, qu’on résoud explicitement pour certaines classes de fonctions élémentaires, avant de se tourner, dans le cas général, vers le concept de résolution approchée infiniment précise mentionné plus haut. Son interprétation géométrique conduit très naturellement à une approche nouvelle de l’intégrale, due à Kurzweil et Henstock, que nous enseignons depuis une vingtaine d’années. Formellement très proche de celle de Riemann, dont elle conserve le support intuitif et la simplicité technique, cette définition fournit une intégrale plus puissante que celle de Lebesgue capable, en particulier, d’intégrer toutes les dérivées. Cette approche autorise une progression naturelle, sans modification de définition, depuis le calcul intégral élémentaire jusqu’aux aspects avancés de l’intégrale de Lebesgue. Elle rend également inutile le concept d’intégrale généralisée ou impropre: ce qui servait de définition à cette notion n’est plus, ici, qu’un procédé de calcul d’une véritable intégrale. On lui rattache naturellement la convergence simple ou absolue des séries, ce qui permet un traitement unifié des critères correspondants. On dispose alors des outils nécessaires pour étudier la continuité, la dérivabilité et l’intégrabilité de limites de suites de fonctions, les ensembles et les fonctions mesurables et les représentations intégrales des fonctions. A cette occasion sont introduites non seulement des fonctions spéciales classiques comme les fonctions de Bessel, les fonctions beta et gamma d’Euler, les polynômes d’Hermite, la fonction hypergéométrique et la fonction zeta, mais aussi des fonctions continues non dérivables, ces monstres mathématiques récemment transformés en paradigmes scientifiques par la théorie des fractales. C’est aussi le moment de faire les premiers pas en analyse harmonique en introduisant les séries et intégrales de Fourier et le produit de convolution. Après avoir défini les intégrales sur une courbe et sur une surface, les extensions du théorème fondamental du calcul différentiel et intégral aux fonctions de plusieurs variables (formules de Green-Riemann, Stokes-Ampère, Gauss-Ostrogradsky) sont présentées d’une manière générale et unifiée à partir du concept de forme différentielle, indispensable aujourd’hui aux mathématiciens et aux physiciens. Cette élégante et féconde théorie trouve des applications directes en analyse vectorielle, et dans l’étude globale des fonctions C-dérivables d’une variable complexe. Les concepts fondamentaux de la théorie des fonctions holomorphes sont ainsi dégagés, iii pour aboutir à cette puissante technique de calcul que constitue le théorème des résidus. La notion d’espace métrique avec, comme cas particulier, les plus importants espaces de Banach, est alors introduite. Elle unifie de nombreux types de passage à la limite définis précédemment et fournit des théorèmes d’existence au problème de Cauchy pour les systèmes différentiels. Elle mène au calcul des variations, illustration exemplaire de cette analyse fonctionnelle qui étudie les fonctions définies sur des espaces de fonctions, et outil fondamental dans la formulation et l’étude des lois de la mécanique et de la physique. L’ouvrage se termine par un index historique, qui, en plus de son rôle pratique usuel, montre que la mathématique est une oeuvre humaine en constante évolution, esquisse quelques développements récents et formule plusieurs problèmes ouverts. Des exemples variés illustrent les définitions, et des contre-exemples montrent la nécessité des hypothèses de nombreux théorèmes. Ils serviront de modèles au lecteur pour en construire lui-même de nombreux autres. A la fin de chaque chapitre sont rassemblés des exercices, qui proposent une approche plus personnelle à quelques compléments théoriques. Une petite anthologie rejoint les préoccupations de l’index historique en montrant, par des citations appropriées de mathématiciens célèbres, l’évolution de l’énoncé des grands concepts et des grands résultats du chapitre. Le lecteur pourra juger par lui-même si, comme on peut l’espérer, cette évolution s’est faite dans le sens d’une plus grande clarté et d’une plus grande précision. Il reste à parler des figures, totalement absentes de cet ouvrage. Si elles ont cessé d’être indispensables à la présentation rigoureuse de l’analyse, elles demeurent un précieux outil de compréhension et de découverte. Absentes du support écrit, où ne pourrait subsister que le résidu figé du processus dynamique de leur construction, les figures sont omniprésentes dans l’exposé oral, avec la dimension temporelle, si importante, de leur tracé. Le lecteur devra donc illustrer, par ses propres figures, les notions et les théorèmes introduits. Chacun sait qu’il est difficile d’apprendre une matière délicate en consultant un seul ouvrage. Tout enseignant qui publie un livre espère susciter la lecture d’autres traités. En se limitant à un choix restreint, mais issu d’horizons divers, on peut citer, parmi de nombreux livres de niveau et d’esprit assez proches de celui-ci, les références suivantes: T. Apostol, Mathematical Analysis, Addison-Wesley, Reading, 1974, G. Chilov, Analyse mathématique, 3 vol., Mir, Moscou, 1973, H.G. Garnir, Fonctions de variables réelles, 2 vol., Vander, Leuven, 1970, R. Remmert, Theory of Complex Functions, Springer, New York, 1991, W. Rudin, Principles of Mathematical Analysis, Mc Graw-Hill, New York, 1975, W. Walter, Analysis I und II, Springer, Berlin, 1990. Le lecteur qui reste sur sa faim poursuivra son effort avec beaucoup de profit en lisant l’incomparable livre iv L. Schwartz, Analyse, 4 vol., Hermann, Paris, 1991-1993. Par ailleurs, les ouvrages suivants fournissent des développements, aussi différents que remarquables, de l’analyse harmonique, T.W. Körner, Fourier Analysis, Cambridge University Press, Cambridge, 1988, M. Willem, Analyse harmonique réelle, Hermann, Paris, 1995, tandis que la monographie H. Brézis, Analyse fonctionnelle. Théorie et applications, Masson, Paris, 1983 est sans rivale pour approfondir l’analyse fonctionnelle et ses applications actuelles. Enfin, le lecteur curieux d’histoire pourra compléter ses connaissances en consultant E. Hairer, G. Wanner, Analysis by its History, Springer, New York, 1996. Cette deuxième édition conserve strictement la structure et le volume de la première, qui était une version profondément transformée de l’Introduction à l’analyse publiée pour la première fois en 1979. Elle en diffère par de nombreuses corrections de détail, des améliorations typographiques et surtout par des modifications de présentation portant principalement sur la dérivée totale, le passage du local au global, les formes différentielles et les chaı̂nes, les ensembles compacts. Les gains d’espace qui en résultent ont permis d’enrichir cette nouvelle édition de notions importantes comme celles de système dynamique discret, de produit de convolution, de fonction à variation bornée, de forme symplectique, et de résultats utiles dans la théorie des équations différentielles comme le lemme de Gronwall, l’équation fonctionnelle de Cauchy et le théorème de Peano. Ce texte a bénéficié, aux différents stages de son élaboration, des critiques, remarques et corrections de nombreux collègues, en particulier de M. Anciaux, M. Brémond, C. Debiève, C. de Coster, Th. De Pauw, E. Giusti, P. Habets, M. Henrard, H. Kalf, J.R. Roisin, J.P. Tignol, G. Vandenbossche (†) et M. Willem, mais aussi, et surtout, des améliorations suggérées ou provoquées par les étudiants de candidatures en sciences mathématiques et physiques. Les générations futures de lecteurs et lectrices auront tout le loisir de s’illustrer à leur tour sur la présente édition, et ils en sont remerciés d’avance. Verviers et Louvain-la-Neuve, août 1996 Chapitre 1 Ensembles, graphes, fonctions 1.1 Logique et ensembles : terminologie et notations La mathématique actuelle est fondée sur la théorie des ensembles, et utilise le langage de la logique formelle. Il n’entre pas dans notre propos de développer ici la logique formelle et la théorie des ensembles : le point de vue naı̈f nous suffira et nous le supposerons connu du lecteur. Rappelons simplement que, P , Q . . . étant des propositions ou énoncés ou formules, la négation de P se note ¬P ou non P, la disjonction de P et Q se note P ∨ Q ou P ou Q, la conjonction de P et Q se note P ∧ Q ou P et Q, l’implication matérielle, qui est l’abréviation de (¬P ) ∨ Q, se note P ⇒ Q et l’équivalence matérielle, qui est l’abréviation de (P ⇒ Q) ∧ (Q ⇒ P ), se note P ⇔ Q. On a en particulier l’équivalence suivante (P ⇒ Q) ⇔ (¬Q ⇒ ¬P ), qui permet parfois de simplifier la démonstration d’un théorème. La deuxième proposition dans cette équivalence s’appelle la contraposée de la première. Signalons également que, pour éviter des paradoxes très vite apparus dès l’introduction, par Georg Cantor, de la notion d’ensemble à la fin du XIXe siècle, la théorie des ensembles a dû se construire comme théorie formelle partant des notions primitives d’ensemble et d’appartenance, représentée par le prédicat binaire ∈ (qui se lit appartient à ou élément de) et d’une liste 1 2 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS d’axiomes que nous n’énoncerons pas formellement et que l’on peut d’ailleurs présenter sous plusieurs formes. Dans l’axiomatique de Zermelo-Fraenkel, le premier axiome affirme l’existence d’un ensemble sans élément : c’est l’ensemble vide, noté ∅. Le deuxième axiome affirme que deux ensembles sont égaux dès qu’ils ont les mêmes éléments. Dans l’approche naı̈ve des ensembles, un ensemble est défini en extension lorsqu’on donne la liste de ses éléments. Le troisième axiome affirme l’existence d’un ensemble z = {x, y} dont les éléments sont deux ensembles quelconques donnés x et y. Cet ensemble s’appelle la paire d’éléments x et y et, si x = y, la paire {x, x} est notée plus simplement {x} et s’appelle le singleton de x. La paire {x, {x, y}} est notée (x, y) et s’appelle le couple (x, y). Le quatrième axiome affirme l’existence de l’union des éléments t d’un ensemble d’ensembles x constituée des éléments z qui appartiennent à l’un ! des t de x; cet ensemble est noté t∈x t. Si x et y sont des ensembles, la réunion x ∪ y des ensembles x et y est la réunion des éléments de la paire {x, y}. De manière plus naı̈ve, on peut écrire x ∪ y = {u : u ∈ x ou u ∈ y}. Le cinquième axiome affirme l’existence de l’ensemble des parties de tout ensemble x (y est une partie de x si tout élément de y est élément de x); cet ensemble se note P(x) ou 2x et si z ∈ P(x), on écrit aussi y ⊂ x (ou parfois y ⊆ x). Lorsque y est une partie de x différente de x, on dit que y est une partie propre de x et l’on écrit alors y ! x (ou y ⊂ x dans le second choix de notation). Nous adopterons la première notation dans cet ouvrage. Si a est un ensemble non vide, on appelle intersection des éléments de a, l’ensemble, noté ∩x∈ax ou ∩{x : x ∈ a}, formé par les éléments qui appartiennent à tous les ensembles qui appartiennent à a. Etant donnés deux ensembles x et y, on appelle intersection des ensembles x et y l’intersection des éléments de la paire {x, y}; elle est notée x ∩ y. De manière plus naı̈ve, on peut écrire x ∩ y = {u : u ∈ x et u ∈ y}. Le sixième axiome affirme l’existence d’un ensemble x contenant ∅ et tel que, s’il contient y il contient son “successeur” y ∪ {y}; cet axiome garantit l’existence d’ensembles infinis . Le septième axiome (qui est en fait une liste sans fin de formules construites sur le même schéma) entraı̂ne en particulier que, pour tout ensemble u et pour toute propriété “raisonnable” P (x) dépendant des éléments x de 1.1. LOGIQUE ET ENSEMBLES : TERMINOLOGIE ET NOTATIONS3 v et qui peut être exprimée dans le langage formel de la théorie, il existera un sous-ensemble v formé des éléments x satisfaisant à P ; cet ensemble est noté {x ∈ u : P (x)}. Dans l’approche naı̈ve des ensembles, on dit qu’un tel ensemble est défini en compréhension. Le huitième axiome, dit axiome du choix ou axiome de Zermelo, affirme qu’il est possible de former un ensemble en choissant un élément dans chaque ensemble d’un ensemble d’ensembles. Le neuvième axiome exclut des formules comme x ∈ x. On peut construire, à partir de ces axiomes, l’ensemble N = {0, 1, 2, . . .} des entiers naturels et démontrer l’important principe d’induction affirmant que si une partie A de N contient 0 et est telle que, chaque fois que n ∈ A, on a n + 1 ∈ A, alors A = N. On désignera également par N∗ l’ensemble N \ {0} l’ensemble des entiers naturels strictement positifs. On rappellera que, si x et y sont des ensembles, x \ y désigne l’ensemble des éléments de x qui n’appartiennent pas à y. On démontre également que N est un ensemble ordonné et que toute partie de N possède un plus petit élément. Si une propriété P (x) (dépendant des éléments x d’un ensemble y) est satisfaite par tous les éléments de y, on écrira (∀x ∈ y) : P (x), (1.1) ce qui se lit “pour tout élément x de y, la propriété P (x) est vraie” ou “quel que soit l’élément x de y, la propriété P (x) est vraie”. Le symbole ∀ est appelé le quantificateur universel . Si un élément x (au moins) de y vérifie la propriété P (x), on écrira (∃x ∈ y) : P (x), (1.2) ce qui se lit “il existe (au moins) un élément x de y tel que la propriété P (x) soit vraie”. Le symbole ∃ est le quantificateur existentiel . La négation logique de la formule (1.1), ¬[(∀x ∈ y) : P (x)] est equivalente à la formule (∃x ∈ y) : ¬P (x), et la négation logique de la formule (1.2), ¬[(∃x ∈ y) : P (x)] est équivalente à la formule (∀x ∈ y) : ¬P (x). 4 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS On voit que, pour nier (1.1) (resp. (1.2)), on a remplacé le quantificateur universel, (resp. existentiel), par le quantificateur existentiel (resp. universel), et remplacé P (x) par sa négation ¬P (x). La proposition suivante montre que cette règle s’étend aux formules contenant un nombre fini d’expressions de type (∀x ∈ y), (∃u ∈ v) suivi de l’énoncé d’une propriété P dépendant des éléments des ensembles correspondants. Proposition. La négation d’une proposition du type (∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 )(∀xm ∈ ym ) : (1.3) P (x1 , x2 , x3 , . . . , xm−1 , xm ), contenant un nombre fini d’expressions du type (∀x ∈ y) ou (∃x ∈ y) suivi de l’énoncé d’une propriété P s’obtient en remplaçant chaque ∀ par ∃, chaque ∃ par ∀ et P par ¬P . Démonstration. Elle se fait par récurrence sur le nombre d’expressions du type (∀x ∈ y) ou (∃x ∈ y) qui précèdent P . Nous avons admis le résultat pour une formule contenant une seule de ces expressions. Supposons donc la proposition vraie pour une formule de type (1.3) contenant m−1 expressions du type (∀x ∈ y) ou (∃x ∈ y) et montrons qu’elle est vraie pour une formule en contenant m, par exemple, pour fixer les idées, la formule (1.3). Si nous posons Q(x1 , . . . , xm−1 ) = (∀xm ∈ ym ) : P (x1 , . . . , xm−1 , xm ), la formule (1.3) peut s’écrire (∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 ) : Q(x1 , . . . , xm−1 ), et, par l’hypothèse de récurrence, sa négation est équivalente à (∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 ) : ¬Q(x1 , . . . , xm−1 ), et donc, en vertu de la définition de Q et de ce qui précède, à (∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 )(∃xm ∈ ym ) : ¬P (x1 , . . . , xm ). 1.2. GRAPHES, FONCTIONS, APPLICATIONS 5 Remarque. On a évidemment les équivalences (∀x ∈ y)(∀u ∈ v) ⇔ (∀u ∈ v)(∀x ∈ y), et (∃x ∈ y)(∃u ∈ v) ⇔ (∃u ∈ v)(∃x ∈ y), mais une permutation de quantificateurs consécutifs d’espèces différentes modifie le sens de la formule. 1.2 Graphes, fonctions, applications A partir d’ici nous utiliserons la convention usuelle consistant à désigner les ensembles par des capitales et leurs éléments par des minuscules. Soient E et F deux ensembles non vides. Rappelons que le produit cartésien ou produit ensembliste de E par F , noté E × F , est l’ensemble des couples (a, b) tels que a ∈ E et b ∈ F ; formellement, E × F = {(a, b) : a ∈ E et b ∈ F }. Définition. Un graphe ou relation de E vers F est une partie de E × F . Si G ⊂ E × F est un graphe de E vers F , le domaine de G est l’ensemble dom G défini par dom G = {a ∈ E : (∃b ∈ F ) : (a, b) ∈ G}, et l’image de G est l’ensemble im G défini par im G = {b ∈ F : (∃a ∈ E) : (a, b) ∈ G}. Le graphe réciproque G−1 de G est le graphe de F dans E défini par G−1 = {(b, a) ∈ F × E : (a, b) ∈ G}. Exemples. Si b ∈ F , E × {b} est un graphe de E dans F appelé graphe constant de E dans F , et si a ∈ E, alors {a} × F est un graphe de E dans F que l’on peut appeler graphe vertical de E dans F . Le graphe réciproque d’un graphe constant est un graphe vertical, et le graphe réciproque d’un graphe vertical est un graphe constant. On vérifie sans peine que dom G−1 = im G, im G−1 = dom G. 6 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Si a ∈ dom G, on dit encore que G est défini en a, et si b ∈ im G, on dit que b est une valeur prise par G. En particulier, on dira que le graphe G de E dans F est partout défini si dom G = E. Donc G−1 est partout défini si et seulement si dom G−1 = F , c’est-à-dire si et seulement si im G = F . On est ainsi conduit à la définition suivante. Définition. On dit que le graphe G de E dans F est surjectif si im G = F . Ainsi donc, G (resp. G−1 ) est partout défini si et seulement si G−1 (resp. G) est surjectif. Si A ⊂ E, l’ensemble G|A défini par G|A = G ∩ (A × F ), est évidemment encore un graphe de E dans F qui s’appelle la restriction de G à A. Son image im G|A s’appelle l’image (directe) de A par G et se note G(A). Si B ⊂ F , on appelle image réciproque de B par G l’image G−1 (B) de B par le graphe réciproque G−1 . Par conséquent, G(A) = {b ∈ F : (∃a ∈ A) : (a, b) ∈ G}, G−1 (B) = {a ∈ E : (∃b ∈ B) : (b, a) ∈ G−1 } = {a ∈ E : (∃b ∈ B) : (a, b) ∈ G}. En particulier, si A = {a} où a ∈ E, G({a}) est appelée l’image de a par G. On notera que G({a}) /= ∅ si et seulement si a ∈ dom G. Si G et H sont deux graphes de E dans F tels que G ⊂ H, on dit que H est un prolongement de G ou encore que G est une restriction de H. Définissons aussi l’importante notion de composé de deux graphes. Définition. Soient D, E, F des ensembles, G un graphe de D dans E et H un graphe de E dans F . Le composé H ◦ G de H et G est le graphe de D dans F défini par H ◦ G = {(a, c) ∈ D × F : (∃b ∈ E) : (a, b) ∈ G et (b, c) ∈ H}. Le lecteur vérifiera aisément les égalités suivantes : dom (H ◦ G) = {a ∈ dom G : G({a}) ∩ dom H /= ∅}, im (H ◦ G) = H(im G). Il vérifiera aussi sans peine que le composé de deux graphes partout définis est partout défini et que le composé de deux graphes surjectifs est surjectif. Introduisons maintenant un type particulier de graphe qui joue un rôle essentiel en analyse mathématique. 1.2. GRAPHES, FONCTIONS, APPLICATIONS 7 Définition. Un graphe G de E dans F est dit fonctionnel ou est appelé une fonction de E dans F si, pour chaque a ∈ E, il existe au plus un b ∈ F tel que (a, b) ∈ G, c’est-à-dire si les relations (a, b) ∈ G et (a, b$) ∈ G entraı̂nent que b = b$ . En d’autres termes, G est une fonction de E dans F si et seulement si, pour chaque a ∈ E, G({a}) est soit vide, soit un singleton, ou encore si et seulement si, pour chaque a ∈ dom G, G({a}) est un singleton. Dans ce cas, G({a}) est donc de la forme {b} pour un certain élément b de F que l’on notera G(a) et qu’on appellera l’image de a par G ou encore la valeur de la fonction G en a. Exemples. Un graphe constant de E dans F est toujours une fonction de E dans F ; un graphe vertical de E dans F est une fonction de E dans F si et seulement si F est un singleton. Pour désigner une fonction G de E dans F , on utilise souvent la notation G : dom G ⊂ E → F, a 2→ G(a), qui met en évidence la valeur G(a) de G en a ∈ dom G. Le caractère fonctionnel d’un graphe se conserve par composition. Proposition. Si G est une fonction de D dans E et H une fonction de E dans F , alors H ◦ G est une fonction de D dans F . Démonstration. Soit a ∈ dom (H ◦ G) et soient c ∈ F et c$ ∈ F tels que (a, c) ∈ H ◦ G et (a, c$) ∈ H ◦ G. Par définition du composé, il existe b ∈ E tel que (a, b) ∈ G et (b, c) ∈ H et il existe b$ ∈ E tel que (a, b$ ) ∈ G et (b$ , c$) ∈ H. Comme G est une fonction, on a nécessairement b = b$ et dès lors, comme H est une fonction, on a nécessairement c = c$ . On pourra donc parler de la fonction composée de deux fonctions, et la démonstration ci-dessus montre que, si a ∈ dom (H ◦ G), alors (H ◦ G)(a) = H(G(a)). Même si G est une fonction de E dans F , l’exemple du graphe constant avec E différent d’un singleton montre que le graphe réciproque G−1 (qui est un graphe vertical) n’est pas nécessairement une fonction. Si G est un graphe de E dans F , G−1 sera une fonction si et seulement si (b, a) ∈ G−1 et (b, a$ ) ∈ G−1 ⇒ a = a$ , c’est-à-dire si et seulement si (a, b) ∈ G et (a$ , b) ∈ G ⇒ a = a$ . On est ainsi conduit à la définition suivante. (1.4) 8 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Définition. Soit G un graphe de E dans F . On dit que G est injectif si la condition (1.4) est satisfaite. Ainsi donc, G−1 est un graphe fonctionnel si et seulement si G est un graphe injectif. On a la caractérisation suivante des graphes injectifs. Proposition. Le graphe G de E dans F est injectif si et seulement si, pour chaque a ∈ E et chaque a$ ∈ E tel que a$ = / a, on a G({a}) ∩ G({a$ }) = ∅. Démonstration. La condition nécessaire et suffisante d’injectivité que nous voulons démontrer est équivalente, par contraposition, à la condition (∀a ∈ E)(∀a$ ∈ E) : G({a}) ∩ G({a$ }) /= ∅ ⇒ a = a$ , et donc à la condition (∀a ∈ E)(∀a$ ∈ E) : (a, b) ∈ G et (a$ , b) ∈ G ⇒ a = a$ , c’est-à-dire à la définition d’injectivité. On en déduit facilement que la composition de graphes préserve l’injectivité. Proposition. Si G est un graphe injectif de D dans E et H un graphe injectif de E dans F , alors H ◦ G est un graphe injectif de D dans F . Un graphe fonctionnel injectif est appelé une fonction injective ou une injection. G est donc une injection si et seulement si a ∈ dom G, a$ ∈ dom G et G(a) = G(a$ ) ⇒ a = a$ , ou encore, si et seulement si (∀a ∈ dom G)(∀a$ ∈ dom G : a /= a$ ) : G(a) /= G(a$ ). Les propositions qui précèdent montrent que G est une injection de E dans F si et seulement si G−1 est une injection de F dans E et que le composé de deux injections est une injection. Lorsque G est une injection de E dans F , G−1 est appelée la fonction réciproque de G. Un graphe fonctionnel G de E dans F partout défini est appelé une application de E dans F , et noté G : E → F, a 2→ G(a). 1.2. GRAPHES, FONCTIONS, APPLICATIONS 9 Bien entendu, si G est une fonction de E dans F , alors G|dom G est une application de dom G dans F : toute fonction restreinte à son domaine devient une application. D’autre part, si G est une application injective de E dans F , on sait que G−1 est une fonction de F dans E et des exemples simples montrent que G−1 n’est pas nécessairement une application de F dans E. Ainsi, si E = {a1 , a2, a3 }, F = {a1 , a2 , a3 , a4 } et si G est l’application injective de E dans F définie par G : E → F, ai 2→ ai (i = 1, 2, 3) alors la fonction inverse G−1 n’est pas définie en a4 et n’est donc pas une application de F dans E. Si G est une application injective de E dans F , G−1 sera une application de F dans E si et seulement im G = F , c’est-à-dire si et seulement si G est surjectif. Un graphe fonctionnel surjectif G de E dans F est appelé une fonction surjective ou une surjection de E sur F . En combinant les propriétés des graphes déjà obtenues, on voit facilement que G est une application injective et surjective de E sur F si et seulement si G−1 est une application surjective de F sur E. Une application injective et surjective G de E dans F est appelée une application bijective ou bijection de E sur F . En combinant les propriétés de conservation du caractère fonctionnel, du caractère partout défini, de l’injectivité et de la surjectivité par passage au composé, on obtient immédiatement le résultat suivant. Proposition. Si G est une bijection de D sur E et H une bijection de E sur F , alors H ◦ G est une bijection de D sur F . Il existe, pour les applications, une variante terminologique souvent utilisée en mathématiques. Si I est un ensemble, que l’on appellera ensemble des indices, et E un ensemble, une application G de I dans E est parfois appelée famille d’éléments de E indicée par I et, au lieu de la notation canonique G : I → E, i 2→ G(i), on utilise la notation G : I → E, i 2→ Gi , ou encore la notation compacte (Gi)i∈I . En particulier, une famille d’éléments de E indicée par N ou N∗ est appelée une suite dans E ou encore une suite d’éléments de E, et notée en abrégé (Gk )k∈N ou (Gk )k∈N∗ selon le cas. 10 1.3 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Ensembles finis, infinis, dénombrables La notion de bijection permet de “comparer” les ensembles. Soient E et F des ensembles. Définition. On dit que E est équipotent à F s’il existe une bijection B de E sur F . Il en résulte aussitôt que E est équipotent à E (prendre B définie par B(a) = a pour chaque a ∈ E), que E est équipotent à F si et seulement si F est équipotent à E (puisque B est une bijection de E sur F si et seulement si B −1 est une bijection de F sur E) et que si E est équipotent à F et F équipotent à l’ensemble G, alors E est équipotent à G (puisque le composé de deux bijections est une bijection). La relation “est équipotent à” est donc une relation d’équivalence. Pour chaque n ∈ N∗ , posons Jn = {1, 2, . . . , n}, et, pour unifier les notations dans ce qui suit, posons J0 = ∅. On vérifiera facilement que Jn est équipotent à Jm si et seulement si m = n. Définition. On dit que l’ensemble E est fini s’il existe n ∈ N tel que E soit équipotent à Jn . Dans le cas contraire, E est dit infini. Les éléments d’un ensemble fini non vide pourront donc être ”numérotés” par les entiers 1, 2, . . ., n pour un certain entier n. La remarque précédant la définition montre que l’entier n ainsi associé à un ensemble fini E est unique; on l’appelle le nombre d’éléments ou le cardinal de E et on le note # E. Proposition. Si E est fini et s’il existe une bijection C de E sur l’ensemble F , alors F est fini et # E = # F . Démonstration. Si # E = n, il existe une bijection B de E sur Jn , et donc B ◦ C −1 est une bijection de F sur Jn . Corollaire. Si E est infini et s’il existe une bijection B de E sur F , alors F est infini. Démonstration. Si F est fini, E l’est aussi par la proposition précédente, ce qui contredit l’hypothèse. La définition d’ensemble fini entraı̂ne qu’un ensemble fini ne peut être équipotent à aucune de ses parties propres (cette propriété peut d’ailleurs être prise comme définition d’un ensemble fini). L’existence de la bijection B : N → 2N, n 2→ 2n, 11 1.3. ENSEMBLES FINIS, INFINIS, DÉNOMBRABLES de l’ensemble des entiers naturels sur l’ensemble 2N des entiers naturels pairs, partie propre de N, montre que N est infini. Introduisons maintenant une importante classe d’ensembles infinis. Intuitivement, ce sont les ensembles infinis dont les éléments peuvent être “numérotés” par tous les entiers naturels. Définition. On dit que l’ensemble E est dénombrable s’il est équipotent à N. Comme N est infini, un ensemble dénombrable est évidemment infini. Si B : N → E est la bijection donc l’existence est assurée par la définition, on aura donc E = {B(n) : n ∈ N} = {B(0), B(1), . . .}. Ainsi, les ensembles 2N et N∗ sont dénombrables (prendre respectivement les applications B définies sur N par B(n) = 2n et B(n) = n + 1 pour chaque n ∈ N). De même, l’ensemble N × N est dénombrable, puisque l’application B : N × N → N, (m, n) 2→ (m + n)(m + n + 1) +n 2 est bijective. Elle correspond en effet au schéma de numérotation suivant 0 1 2 ... (0, 0) (1, 0) (0, 1) . . . l(l+1) 2 +1 (l, 0) l(l+1) 2 +2 ... (l − 1, 1) . . . l(l+1) 2 +l ... (0, l) ... qui consiste, sur le tableau suivant suivant “représentant” N × N, (0, 0) (1, 0) (2, 0) (3, 0) (4, 0) .. . (0, 1) (1, 1) (2, 1) (3, 1) (4, 1) .. . (0, 2) (1, 2) (2, 2) (3, 2) (4, 2) .. . (0, 3) (1, 3) (2, 3) (3, 3) (4, 3) .. . (0, 4) (1, 4) (2, 4) (3, 4) (4, 4) .. . ... ... ... ... ... .. . à associer un élément de type (l, 0) à l’entier constitué du nombre d’éléments du tableau situés au dessus de la diagonale passant par (l, 0) (c’est-à-dire 1 + 2 + . . . + l = l(l + 1)/2), à numéroter successivement les éléments de cette diagonale en ajoutant 1 au numéro de l’élément qui précède jusqu’à ce qu’on arrive à l’élément de la première ligne, à revenir à l’élément (l + 1, 0) et répéter le même processus. Remarquons qu’un raisonnement strictement analogue permet de montrer que le produit cartésien de deux ensembles dénombrables est dénombrable. 12 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Le résultat suivant permet de construire de nombreux ensembles dénombrables et montre qu’intuitivement, les ensembles dénombrables sont les “plus petits” ensembles infinis que l’on puisse considérer. Proposition. Toute partie infinie d’un ensemble dénombrable est dénombrable. Démonstration. Soit E un ensemble dénombrable et A une partie infinie de E. Il existe donc une bijection B : E → N. Comme A est infini, l’ensemble B(A) est une partie infinie de N. Soit n0 le plus petit élément de B(A), n1 le plus petit élément de B(A) \ {n0 }, et, de proche en proche, nk le plus petit élément de B(A)\{n0 , n1 , . . . , nk−1 }. Comme B(A) est infini, on définit ainsi une bijection C : N → B(A), k 2→ nk , qui fournit la bijection C ◦ B de A sur N et montre que A est dénombrable. Corollaire. Tout ensemble contenant une partie infinie non dénombrable est infini non dénombrable. Définition. On dira qu’un ensemble E est au plus dénombrable s’il est fini ou dénombrable. On vérifie aisément que E est au plus dénombrable s’il existe une surjection de N sur E. Il est évident que toute partie d’un ensemble au plus dénombrable est au plus dénombrable. Le résultat suivant montre qu’une union dénombrable d’ensembles au plus dénombrables est encore au plus dénombrable. Proposition. Soit (En )n∈N une suite d’ensembles En telle que chaque En ! soit au plus dénombrable. Alors l’ensemble E = n∈N En est au plus dénombrable. Démonstration. Par hypothèse, pour chaque n ∈ N, il existe une surjection Bn : N → En . Il en résulte que l’application B : N × N → E, (n, m) 2→ Bn (m) est également surjective. Comme on a vu plus haut qu’il existe une bijection C : N → N × N, on obtient une surjection B ◦ C de N sur E. 1.4 Nombres réels Nous ne reviendrons pas ici sur les extensions de la notion de nombre obtenues à partir de N et supposerons connus l’ensemble Z des entiers relatifs, l’ensemble Q des nombres rationnels et leurs propriétés. On sait que N ! Z ! Q 1.4. NOMBRES RÉELS 13 et que l’on peut construire un ensemble R, l’ensemble des nombres réels, ou, brièvement, des réels, qui contient strictement Q et possède les propriétés suivantes. Nous n’aborderons pas ici le problème de la construction de R. L’ensemble des réels ou corps des réels ou champ des réels est un ensemble, noté R, pour lequel sont définies : 1) deux applications A et M de R × R dans R, respectivement appelées l’addition et la multiplication sur R et pour lesquelles on peut utiliser respectivement les notations A(x, y) = x + y et M (x, y) = x.y ou M (x, y) = xy ou M (x, y) = x × y, qui se lisent respectivement x plus y et x fois y; 2) une relation G dite relation d’ordre de R dans R notée x ≤ y (ou y ≥ x) si et seulement si (x, y) ∈ G, qui se lit x inférieur à y (ou y supérieur à x); qui vérifient les quatre groupes de propriétés suivantes. (I) R est un corps commutatif ou champ. En d’autres termes : (i) pour tout x ∈ R, y ∈ R et z ∈ R, on a x + y = y + x, x + (y + z) = (x + y) + z, xy = yx, x(yz) = (xy)z, x(y + z) = xy + xz; (ii) il existe un élément 0 ∈ R tel que, pour tout x ∈ R, on ait 0 + x = x; (iii) pour chaque x ∈ R il existe un unique réel, noté −x tel que x+(−x) = 0; (iv) il existe un élément 1 /= 0 dans R tel que, pour tout x ∈ R, on ait 1.x = x : (v) pour chaque x /= 0 dans R, il existe un unique réel noté x−1 ou x1 tel que x.x−1 = 1. (II) R est un corps ordonné. En d’autres termes : (i) pour tout x ∈ R, y ∈ R et z ∈ R, les relations x ≤ y et y ≤ z impliquent la relation x ≤ z; (ii) pour tout x ∈ R et y ∈ R, ”x ≤ y et y ≤ x” équivaut à x = y; (iii) pour chaque x ∈ R et chaque y ∈ R, on a x ≤ y ou y ≤ x; (iv) pour tout x ∈ R, y ∈ R et z ∈ R, la relation x ≤ y implique la relation x + z ≤ y + z; (v) pour tout x ∈ R tel que x ≥ 0 et tout y ∈ R tel que y ≥ 0, on a xy ≥ 0. La relation x ≤ y et x /= y s’écrira x < y ou y > x et se lira x strictement inférieur à y ou y strictement supérieur à x. Si a < b sont deux réels, l’ensemble {x ∈ R : a < x < b} 14 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS sera appelé intervalle ouvert d’origine a et d’extrémité b et sera désigné par ]a, b[; l’ensemble {x ∈ R : a ≤ x ≤ b} sera appelé intervalle fermé d’origine a et d’extrémité b et sera désigné par [a, b]; l’ensemble {x ∈ R : a < x ≤ b} (resp.{x ∈ R : a ≤ x < b}) sera appelé un intervalle semi-ouvert ou semi-fermé et désigné par ]a, b] (resp. [a, b[). (III) R est un corps ordonné archimédien, c’est-à-dire qu’il satisfait au théorème d’Archimède: pour tout réel x > 0 et tout réel y ≥ 0, il existe un entier m tel que mx ≥ y. (IV) R est un corps complet, c’est-à-dire qu’il vérifie le théorème des intervalles fermés emboı̂tés: si ([ak , bk ])k∈N est une suite d’intervalles fermés tels que, pour tout k ∈ N, on ait [ak+1 , bk+1 ] ⊂ [ak , bk ], alors " k∈N [ak , bk ] /= ∅. En d’autres termes, si les suites dans R (ak )k∈N et (bk )k∈N sont telles que, pour chaque k ∈ N, on ait ak ≤ ak+1 < bk+1 ≤ bk , alors il existe au moins un réel c tel que, pour chaque k ∈ N, on ait c ∈ [ak , bk ]. Rappelons que Q est formé du sous-ensemble des éléments de R qui ∗ peuvent s’écrire sous la forme ± m n où m ∈ N et n ∈ N . Proposition. L’ensemble Q des rationnels est dénombrable. Démonstration. Comme Q ⊃ N, Q est infini et il suffit de montrer qu’il est au plus dénombrable, ce qui sera le cas si l’on montre que Q+ = {x ∈ Q : x ≥ 0} est au plus dénombrable, puisque Q = Q+ ∪ Q− avec Q− = {x ∈ Q : x ≤ 0} et Q− est évidemment équipotent à Q+ . L’application B : N × N∗ → Q+ est une surjection, et, comme N × N∗ est dénombrable, Q est au plus dénombrable. Donnons maintenant quelques conséquences importantes des propriétés des réels. La première résulte des propriétés de l’ordre. Proposition. Si b > c sont deux réels, il existe un réel ! > 0 tel que b > c+!. Démonstration. Par hypothèse, b − c > 0 et dès lors b − c > suffit donc de prendre ! = b−c 2 . b−c 2 > 0; il 15 1.4. NOMBRES RÉELS Corollaire. Soient b et c des réels. Alors b ≤ c si et seulement si, pour tout ! > 0, on a b ≤ c + !. Démonstration. Condition nécessaire. Si b ≤ c et ! > 0 est donné, on a évidemment b ≤ c + !. Condition suffisante. Elle est équivalente à sa contraposée, qui n’est rien d’autre que la proposition précédente. Démontrons maintenant une conséquence du théorème d’Archimède exprimant la propriété de densité des rationnels dans les réels. Proposition. Tout invervalle ouvert de R contient un ensemble infini de rationnels. Démonstration. Montrons d’abord qu’il suffit de démontrer que tout intervalle ouvert de R contient au moins un rationnel. En effet, s’il en est ainsi et si c1 ∈ ]a, b[ est rationnel, alors ]a, c1[ contiendra un rationnel c2 et, en continuant de la sorte, on obtient un ensemble infini {ci : i ∈ N} de rationnels contenus dans ]a, b[. Pour démontrer maintenant que ]a, b[ contient au moins un rationnel, on peut supposer sans perte de généralité que b > 0, car, dans le cas contraire, il suffit de considérer l’intervalle ] − b, −a[ dont l’extrémité −a est strictement positive et de noter que si c ∈ ] − b, −a[, alors −c ∈ ]a, b[. La démonstration consiste maintenant à déterminer un n ∈ N∗ et un m ∈ N tels que a < m n < b. Comme b − a > 0, le théorème d’Archimède implique l’existence d’un entier n ≥ 1 tel que n(b − a) ≥ 2 et donc tel que n(b − a) > 1, ou encore b−a> 1 . n (1.5) Comme b > 0, le même théorème d’Archimède entraı̂ne l’existence d’un entier naturel k ≥ 1 tel que nk ≥ b. Désignons par h le plus petit entier naturel ayant cette propriété. On a donc h−1 h < b, ≥ b. n n (1.6) En utilisant (1.5) et la deuxième inégalité de (1.6), on obtient h 1 −a > , n n c’est-à-dire a < h−1 n . En vertu de la première inégalité de (1.6), il suffit donc de prendre m = h − 1. 16 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Donnons maintenant une conséquence importante du théorème des intervalles fermés emboı̂tés : l’existence d’ensembles infinis non dénombrables. Proposition. Si a < b sont des réels, l’intervalle fermé [a, b] n’est pas dénombrable. Démonstration. Supposons que [a, b] soit dénombrable et soit B : N → [a, b] une bijection fournie par la définition. Pour simplifier les notations, nous poserons, pour chaque n ∈ N, xn = B(n). Notons que si c ∈ [a, b] et que l’on divise [a, b] en trois intervalles fermés de même longueur, l’un d’entre eux au moins ne contiendra pas c. Cela étant, divisons [a, b] en trois intervalles fermés de même longueur et soit [a0 , b0] l’un d’eux tel que x0 /∈ [a0 , b0]. Si x1 /∈ [a0 , b0], prenons [a1 , b1] = [a0 , b0 ], tandis que si x1 ∈ [a0 , b0], divisons [a0 , b0 ] en trois intervalles fermés de même longueur et prenons pour [a1 , b1] l’un deux tel que x1 /∈ [a1 , b1 ]. Ayant ainsi construit [ak−1 , bk−1] ⊂ [ak−2 , bk−2 ] ⊂ . . . ⊂ [a1 , b1] ⊂ [a0 , b0] ⊂ [a, b], tels que, xj /∈ [aj , bj ], (1 ≤ j ≤ k − 1), prenons [ak , bk ] = [ak−1 , bk−1 ] si xk /∈ [ak−1 , bk−1] tandis que, si xk ∈ [ak−1 , bk−1], divisons [ak−1 , bk−1] en trois intervalles fermés de même longueur et prenons pour [ak , bk ] l’un d’entre eux qui ne contient pas xk . En continuant de la sorte, on obtient une suite ([ak , bk ])k∈N d’intervalles fermés emboı̂tés contenus dans [a, b] et tels que, pour chaque k ∈ N, xk /∈ [ak , bk ]. Le théorème des intervalles emboı̂tés implique l’existence d’un réel c appartenant à chaque intervalle [ak , bk ], (k ∈ N). Dès lors, cet élément c de [a, b] est différent de xk pour chaque k ∈ N, ce qui contredit la définition de B. Corollaire. Tout intervalle de R et R lui-même sont des ensembles non dénombrables. Démonstration. Ces ensembles contiennent en effet un intervalle fermé. Corollaire. Tout intervalle de R contient un nombre rationnel et un nombre irrationnel. Démonstration. Tout intervalle I de R contient un intervalle ouvert qui contient lui-même un rationnel. Si I ne contient pas d’irrationnel, alors I ⊂ Q est au plus dénombrable, ce qui contredit le Corollaire précédent. 1.4. NOMBRES RÉELS 17 Nous avons donc démontré l’existence, à côté des ensembles infinis dénombrables, d’ensembles infinis non dénombrables équipotents à R. On dit qu’ils ont la puissance du continu. Le créateur de la théorie des ensembles, Georg Cantor, et ses successeurs ont cherché sans succès à montrer l’existence de parties infinies de R non dénombrables et non équipotentes à R et ont été amenés à formuler la célèbre hypothèse du continu : tout ensemble infini non dénombrable possède une partie équipotente à R. Paul Cohen a démontré en 1962 que l’hypothèse du continu était indécidable (c’est-àdire ni vraie ni fausse) dans le cadre de la théorie des ensembles : on peut ajouter indifféremment aux axiomes de la théorie des ensembles l’hypothèse du continu ou sa négation et obtenir des théories ayant la même cohérence. Définissons maintenant l’importante notion de valeur absolue d’un réel. Définition. La valeur absolue du réel x, notée |x|, est le réel positif défini par |x| = x si x ≥ 0 et |x| = −x si x < 0. Il résulte aussitôt de cette définition que, pour tout x ∈ R, on a |x| = |−x| et que |x| = 0 si et seulement si x = 0. En outre, il est très facile de montrer que, a > 0 et x ∈ R étant donnés, on a les équivalences |x| ≤ a ⇔ −a ≤ x ≤ a ⇔ x ∈ [−a, a], |x| < a ⇔ −a < x < a ⇔ x ∈ ] − a, a[. Dans la représentation géométrique de R, qui consiste à associer à chaque réel x le point d’abscisse x sur une droite orientée munie d’une origine, |x| représente la longueur du segment de droite joignant 0 à x. Dès lors, si x ∈ R et y ∈ R, |x − y| représente la distance entre les points correspondants à x et à y sur la droite. Les inégalités suivantes, qui expriment les relations entre l’addition, la soustraction et la valeur absolue, sont fondamentales. Proposition. Pour tout x ∈ R et tout y ∈ R, on a |x + y| ≤ |x| + |y|, ||x| − |y|| ≤ |x − y|. Démonstration. Démonstrons tout d’abord la première inégalité. Si x ≥ 0 et y ≥ 0, alors, en utilisant les propriétés (II), on a x + y ≥ 0 + y = y ≥ 0, et dès lors |x + y| = x + y = |x| + |y|. On procède de même si x ≤ 0 et y ≤ 0. Si x ≤ 0 ≤ y, alors x + y ≤ 0 + y = y = |y| = |y| + 0 ≤ |y| + |x| = |x| + |y|, 18 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS x + y ≥ x + 0 = x = −(−x) = −|x| = −|x| + 0 ≥ −|x| − |y| = −(|x| + |y|). Par conséquent, −(|x| + |y|) ≤ x + y ≤ |x| + |y|, c’est-à-dire la thèse. Si y ≤ 0 ≤ x, il suffit d’intervertir x et y. Pour la seconde inégalité, en utilisant la première et les égalités x = (x − y) + y, y = (y − x) + x, on obtient |x| ≤ |x − y| + |y|, |y| ≤ |y − x| + |x| = |x − y| + |x|, et dès lors |x| − |y| ≤ |x − y|, |x| − |y| ≥ −|x − y|, ce qui équivaut à la seconde inégalité. Remarque. On déduit aussitôt, de proche en proche, de la Proposition précédente, que si x1 , x2 , . . ., xn sont des réels, alors # # n n #$ # $ # # xi # ≤ |xi|. # # # i=1 i=1 La propriété suivante exprime les relations entre valeur absolue et multiplication. Proposition. Pour tout x ∈ R et tout y ∈ R, on a |xy| = |x||y|. Démonstration. Si x ≥ 0 et y ≥ 0, alors xy ≥ 0 et |xy| = xy = |x||y|. Si x ≤ 0 ≤ y, alors, en utilisant le premier cas, |xy| = | − (xy)| = |(−x)y| = |(−x)||y| = |x||y|. Le cas où y ≤ 0 ≤ x s’en déduit en intervertissant x et y. Enfin, si x ≤ 0 et y ≤ 0, on a |xy| = |(−x)(−y)| = |(−x)||(−y)| = |x||y|. 1.5. L’ESPACE VECTORIEL NORMÉ RN 19 Si nous posons R+ = {x ∈ R : x ≥ 0}, la notion de valeur absolue d’un réel permet de définir comme suit sur R l’application valeur absolue | · | : R → R+ , x 2→ |x|, vérifiant les propriétés suivantes : 1) pour chaque réel x, |x| = 0 ⇔ x = 0; 2) pour chaque c ∈ R et chaque x ∈ R, on a |cx| = |c||x|; 3) pour chaque x ∈ R et chaque y ∈ R, on a |x + y| ≤ |x| + |y|. Enfin, la condition d’annulation suivante est souvent utile. Proposition. Soit a un réel. Alors a = 0 si et seulement si, pour tout ! > 0, on a |a| ≤ !. Démonstration. La condition nécessaire est évidente. La condition suffisante résulte d’une condition nécessaire et suffisante pour que b ≤ c vue plus haut; il suffit de prendre c = 0 et b = |a|. 1.5 L’espace vectoriel normé Rn L’étude des fonctions de plusieurs variables et des fonctions à valeurs vectorielles gagne en clarté et en concision par l’emploi du langage géométrique lié à l’espace vectoriel Rn . Si n ≥ 1 est un entier, nous désignerons par Rn le produit cartésien R × R × . . . R de n copies de R. Rn est donc l’ensemble des n-uples ordonnés (x1 , x2 , . . . , xn ) de nombres réels. Un élément x = (x1 , x2 , . . ., xn ) de Rn est souvent appelé un point de Rn et, pour chaque 1 ≤ i ≤ n, xi s’appelle la ie composante de x. En définissant les applications Rn × Rn → Rn , (x, y) 2→ x + y = (x1 + y1 , . . . , xn + yn ), R × Rn → Rn , (c, x) 2→ cx = (cx1 , . . . , cxn), respectivement appelées somme de deux éléments de Rn et multiplication d’un élément de Rn par un réel, on vérifie aisément qu’on munit Rn d’une structure d’espace vectoriel sur le corps R. Lorsque n = 1, ces applications se réduisent respectivement à l’addition et à la multiplication usuelles. L’élément (0, . . ., 0) de Rn sera noté 0. L’espace vectoriel Rn est de dimension n et les points e1 = (1, 0, . . ., 0), e2 = (0, 1, 0, . . ., 0), . . ., en = (0, . . ., 0, 1) 20 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS de Rn forment une base algébrique de cet espace vectoriel qui est appelée base canonique. Tout élément x de Rn peut en effet s’écrire x = x1 e1 + . . . + xn en = n $ xi ei . i=1 Pour chaque 1 ≤ i ≤ n, on appellera projection sur la ie composante l’application pi : Rn → R, x 2→ xi . Comme, pour chaque x ∈ Rn , y ∈ Rn et c ∈ R, on a pi (x + y) = (x + y)i = xi + yi = pi (x) + pi (y), pi (cx) = (cx)i = cxi , on voit que pi est une application linéaire de Rn dans R. Nous n’insisterons pas davantage ici sur la structure algébrique de Rn ni sur son interprétation géométrique lorsque n = 1, 2 ou 3. La définition suivante s’inspire des propriétés de l’application valeur absolue sur R. Définition. Si E est un espace vectoriel sur R, on appelle norme sur E toute application 6 · 6 : E → R+ , x → 2 6x6, vérifiant les conditions suivantes : 1) pour chaque x ∈ E, on a 6x6 = 0 ⇔ x = 0; 2) pour chaque c ∈ R et chaque x ∈ E, on a 6cx6 = |c|6x6; 3) pour chaque x ∈ E et chaque y ∈ E, on a 6x + y6 ≤ 6x6 + 6y6. Un espace vectoriel E muni d’une telle norme est dit un espace vectoriel normé . Il est clair que R muni de l’application valeur absolue est un espace vectoriel normé. Nous allons voir que l’on peut, et de différentes manières, définir, quel que soit n ∈ N∗ , une norme sur Rn qui se réduira à la valeur absolue lorsque n = 1. Définissons l’application | · |1 de Rn dans R+ par | · |1 : Rn → R+ , x = (x1 , . . . , xn ) 2→ |x1 | + . . . + |xn | = Proposition. | · |1 est une norme sur Rn . % n $ i=1 |xi |. Démonstration. On a |0|1 = 0 et si |x|1 = 0, alors ni=1 |xi| = 0, et comme chaque terme |xi| est positif, il faut nécessairement que |xi| = 0, (1 ≤ i ≤ n), 21 1.5. L’ESPACE VECTORIEL NORMÉ RN et donc que xi = 0, (1 ≤ i ≤ n), c’est-à-dire que x = 0. Si c ∈ R et x ∈ Rn , on a & n ' n n |cx|1 = $ |cxi | = i=1 $ i=1 $ |c||xi| = |c| i=1 Enfin, si x ∈ Rn et y ∈ Rn , on a |x + y|1 = n $ i=1 |xi + yi | ≤ n $ i=1 |xi | = |c||x|1. (|xi| + |yi |) = |x|1 + |y|1 . Définissons l’application | · |2 de Rn dans R+ par | · |2 : R → R+ , x 2→ n (x21 + . . . + x2n )1/2 = & n $ x2i i=1 '1/2 = & n $ i=1 |xi | 2 '1/2 . Pour vérifier que | · |2 est une norme sur Rn , nous aurons besoin des deux résultats importants suivants. Le premier porte le nom d’identité de Lagrange. Proposition. Pour tout x ∈ Rn et tout y ∈ Rn , on a & n $ i=1 , ' n -2 n n $ n $ $ 1$ 2 2 xi yj − (xiyi ) = (xi yj − xj yi )2 . j=1 2 i=1 i=1 j=1 Démonstration. On a n $ n 1$ (xiyj − xj yi )2 = 2 i=1 j=1 n $ n $ n $ n n n $ 1$ 1$ x2i yj2 − xi yj xj yi + x2j yi2 = 2 i=1 j=1 2 i=1 j=1 i=1 j=1 & n $ i=1 , ' n - n n $ $ $ x2 y2 − (xi yi ) (xj yj ) , i j j=1 i=1 j=1 et l’identité de Lagrange s’en déduit aussitôt. L’identité de Lagrange a pour conséquence immédiate l’inégalité de Cauchy. 22 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Corollaire. Pour tout x ∈ Rn et tout y ∈ Rn , on a , n $ (xi yi ) i=1 -2 ≤ & n $ i=1 ' n $ x2 y2 . i j j=1 Nous pouvons maintenant démontrer que | · |2 est une norme sur Rn . Proposition. | · |2 est une norme sur Rn . Démonstration. La vérification facile des propriétés 1 et 2 de la norme est laissée au lecteur. La propriété 3 s’écrit explicitement , n $ (xi + yi ) i=1 2 -1/2 ≤ & n $ i=1 x2i '1/2 + & n $ yi2 i=1 '1/2 , et les deux membres étant positifs, cette inégalité équivaut à l’inégalité n $ i=1 & (xi + yi )2 ≤ n $ x2i i=1 '1/2 + & n $ i=1 '1/2 2 , y2 i c’est-à-dire, en effectuant les calculs et en simplifiant les termes communs aux deux membres, à l’inégalité n $ i=1 xi yi ≤ & n $ i=1 x2i '1/2 & Cette inégalité est évidemment satisfaite si % l’inégalité de Cauchy si ni=1 xi yi ≥ 0. n $ yi2 i=1 %n i=1 '1/2 . xi yi < 0 et elle résulte de Remarque. La norme | · |2 est souvent appelée la norme euclidienne de Rn parce que, si n = 2 ou 3 et si x ∈ Rn et y ∈ Rn , l’expression |x − y|2 n’est rien d’autre que la distance euclidienne entre les points x et y. Définissons l’application | · |∞ de Rn dans R+ par | · |∞ : Rn → R+ , x = (x1 , . . ., xn ) 2→ max{|xi| : 1 ≤ i ≤ n}, où max{|xi | : 1 ≤ i ≤ n} désigne le plus grand élément de l’ensemble {|xi| : 1 ≤ i ≤ n}. 23 1.5. L’ESPACE VECTORIEL NORMÉ RN Proposition. | · |∞ est une norme sur Rn . Démonstration. La vérification des conditions 1 et 2 est laissée au lecteur. Pour la propriété 3, soit x ∈ Rn , y ∈ Rn et k un indice tel que |x + y|∞ = max{|xi + yi | : 1 ≤ i ≤ n} = |xk + yk |. On a évidemment |xk + yk | ≤ |xk | + |yk | ≤ max{|xi| : 1 ≤ i ≤ n} + max{|yi | : 1 ≤ i ≤ n} = |x|∞ + |y|∞ . On a les inégalités suivantes entre les trois normes que nous venons de définir sur Rn . Proposition. Pour tout x ∈ Rn et tout 1 ≤ i ≤ n, on a |xi| ≤ |x|∞ ≤ |x|2 ≤ |x|1 ≤ n|x|∞ . Démonstration. Soit x ∈ Rn et k un indice tel |x|∞ = |xk |. On a évidemment, pour chaque 1 ≤ i ≤ n, |xi| ≤ |xk | ≤ En outre, on a |x|1 = Enfin, on a trivialement, |x|22 = n $ i=1 n $ i=1 & n $ i=1 |xi | 2 '1/2 = |x|2 . |xi | ≤ n|xk | = n|x|∞ . |xi ||xi| ≤ n $ n $ i=1 j=1 |xi ||xj | = |x|21 , ce qui entraı̂ne |x|2 ≤ |x|1 , puisque ces nombres sont positifs. Définition. Si E est un espace vectoriel, les deux normes 6 · 61 et 6 · 62 sur E seront dites équivalentes s’il existe deux constantes a > 0 et b > 0 telles que, pour tout x ∈ E, on ait a6x61 ≤ 6x62 ≤ b6x61 . 24 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS On vérifie sans peine qu’il s’agit bien d’une relation d’équivalence sur les normes de E. La Proposition que nous venons de démontrer montre que les trois normes | · |i , (i = 1, 2, ∞) que nous venons de définir sur Rn sont équivalentes. On montrera plus loin que toutes les normes sur Rn sont équivalentes. La notion de norme permet de définir la notion de boule dans Rn . Définition. Soit a ∈ Rn , r > 0 et i = 1, 2 ou ∞. La boule de centre a et de rayon r pour la norme | · |i est la partie Bi [a; r] de Rn définie par Bi [a; r] = {x ∈ Rn : |x − a|i ≤ r}. Lorsque a = 0, on écrira en général Bi [r] au lieu de Bi [a; r]. La terminologie provient évidemment de ce que, pour n = 3 et pour la norme euclidienne, l’ensemble B2 [a; r] correspond à la boule usuelle de centre a et de rayon r. Pour n = 2 et la norme euclidienne, B2 [a; r] correspond au disque de centre a et de rayon r. Enfin, pour n = 1, les trois normes se réduisent à la valeur absolue et Bi [a; r] = [a − r, a + r], (i = 1, 2, ∞), et les boules sont donc des intervalles fermés. Réciproquement, tout interb−a valle fermé [a, b] de R corrrespond à la boule Bi [ a+b 2 ; 2 ]. Proposition. Pour tout a ∈ Rn et tout r > 0, on a 2 B∞ a; 3 r ⊂ B1 [a; r] ⊂ B2 [a; r] ⊂ B∞ [a; r]. n Démonstration. C’est une conséquence facile des inégalités entre normes qui entraı̂nent, pour tout x ∈ Rn , que |x − a|∞ ≤ |x − a|2 ≤ |x − a|1 ≤ n|x − a|∞ . La norme | · |2 sur Rn est associée à la notion de produit scalaire de deux éléments de Rn . Définition. L’application (·|·) de Rn × Rn dans R définie par (x|y) = n $ i=1 xi yi 1.6. NOMBRES COMPLEXES 25 s’appelle le produit scalaire sur Rn . On vérifie facilement les propriétés suivantes du produit scalaire. Si x ∈ Rn , y ∈ Rn , z ∈ Rn et c ∈ R, alors 1) (x|y) = (y|x) et (x|x) = |x|22 ; 2) (x + y|z) = (x|z) + (y|z); 3) (cx|y) = c(x|y). On en déduit aussitôt que (x|y + z) = (x|y) + (x|z), (x|cy) = c(x|y). D’autre part, l’inégalité de Cauchy s’écrit, en termes de produit scalaire et de norme | · |2 |(x|y)| ≤ |x|2 |y|2. On notera que, si n = 1, le produit scalaire se ramène à la multiplication ordinaire sur R mais que, pour n ≥ 2, il constitue une application bilinéaire de Rn × Rn dans R et non pas l’éventuelle application de Rn × Rn dans Rn qui étendrait à Rn la notion de multiplication définie sur R. Nous allons voir qu’une telle extension est possible pour n = 2. 1.6 Nombres complexes Introduisons dans R2 une multiplication à partir de l’application R2 × R2 dans R2 (x, y) 2→ xy = (x1 y1 − x2 y2 , x1 y2 + x2 y1 ). On vérifie sans peine par des calculs très simples que l’addition usuelle dans R2 et cette multiplication satisfont à tous les axiomes (I) vérifiés par les nombres réels si l’on prend 0 = (0, 0) comme élément neutre pour l’addition, e1 = (1, 0) comme élément neutre pour la multiplication, −x = (−x1 , −y1 ) et, pour x /= 0, 4 5 x1 −x2 x−1 = , . x21 + x22 x21 + x22 Muni de cette addition et de cette multiplication, R2 possède donc la structure de champ, est appelé le corps ou le champ des nombres complexes, est noté C et ses éléments sont appelés des nombres complexes. L’application j de R dans C définie par x 2→ (x, 0) est une bijection de R sur R × {0} et est telle que, pour tout x ∈ R et tout y ∈ R, on a j(x) + j(y) = (x, 0) + (y, 0) = (x + y, 0) = j(x + y), 26 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS j(x).j(y) = (xy, 0) = j(xy). On peut donc identifier R au sous-corps R × {0} de C; par suite de cette identification, l’élément e1 = (1, 0) de C sera encore simplement noté 1 et les éléments de R×{0} notés indifféremment (x1 , 0) ou x1 . L’élément e2 = (0, 1) de C sera noté i et la loi de multiplication et l’identification que nous venons de faire entraı̂nent i2 = i.i = (0, 1).(0, 1) = (−1, 0) = −1. On retrouve ainsi l’origine historique des nombres complexes comme extension des nombres réels permettant de donner un sens à la racine carrée d’un nombre négatif, problème qui s’était présenté dès le XVIe siècle dans la résolution des équations algébriques. On a aussi, pour tout c ∈ R et tout x ∈ C, (c, 0).x = (c, 0).(x1, x2 ) = (cx1 , cx2 ) = c(x1 , x2 ) = cx, ce qui montre la compatibilité, via l’identification faite plus haut, entre le produit par un réel d’un élément de C et la multiplication de cet élément par l’élément de C identifié à ce réel. On pourra donc écrire, pour tout x ∈ C, x1 e1 = x1 .1 = x1 , x2 e2 = (x2 , 0).(0, 1) = (0, x2 ) = x2 (0, 1) = x2 i = ix2 , et dès lors x = x1 e1 + x2 e2 = x1 + ix2 , qui est l’écriture complexe de x ∈ C. x1 est alors appelé la partie réelle de x et noté aussi 8x et x2 est appelé la partie imaginaire de x et noté aussi 9x. L’avantage de la notation complexe est que les opérations d’additions et de multiplication peuvent se faire avec les règles habituelles de l’algèbre sur R, à condition de remplacer i2 par −1. Pour éviter l’emploi d’indices, on utilise souvent, pour un nombre complexe, la notation z = (x, y) = x + iy. Le nombre complexe x − iy = (x, −y) est appelé le conjugué du nombre complexe z = x + iy = (x, y) et est noté z̄. On vérifie sans peine que, pour tout z ∈ C et tout v ∈ C, on a ¯ z̄ = z, z + v = z̄ + v̄, zv = z̄v̄, et z z̄ = x2 + y 2 = |z|22 . 1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE 27 Dans C, la norme |z|2 de z, qui est donc égale à (z z̄)1/2, se note simplement |z| et est souvent appelée (comme dans R), la valeur absolue de z ou le module de z. On a, pour tout z ∈ C et tout v ∈ C, |zv|2 = zvzv = zvz̄v̄ = z z̄vv̄ = |z|2 |v|2 , et dès lors |zv| = |z||v|, comme pour la multiplication et la valeur absolue dans R. Cette dernière relation n’est pas vraie pour les deux autres normes sur R2 , comme on le vérifie aisément. On utilisera uniquement la norme | · |2 dans C. Tant que la notion de multiplication de deux éléments n’est pas utilisée dans C, ce dernier ensemble ne diffère donc de R2 muni de la norme | · |2 que par les notations et la terminologie. D’autre part, de la même manière que R est un espace vectoriel sur R, on peut considérer C non seulement comme un espace vectoriel sur R (lorsqu’on l’identifie à R2 ), mais aussi comme un espace vectoriel sur C, le produit par un scalaire (c’est-à-dire un élément de C) étant défini à partir de la multiplication dans C. On notera enfin qu’il n’a pas été question de relation d’ordre dans C. On démontre en algèbre qu’il est impossible de munir C d’une relation d’ordre vérifiant tous les axiomes II de la section sur les réels. En outre, Georg Frobenius a démontré qu’il était impossible, pour n ≥ 3, de munir Rn d’une multiplication (c’est-à-dire d’une application bilinéaire de Rn × Rn dans Rn telle que tous les axiomes I de la section sur les réels soient vérifiés). 1.7 Intérieur, adhérence, frontière La notion de norme dans Rn permet de renforcer et d’affaiblir la notion d’appartenance à une partie de Rn . Soit a ∈ Rn et E une partie de Rn . Définition. On dit que a est intérieur à E (ou que E est un voisinage de a) s’il existe r > 0 tel que B2 [a; r] ⊂ E. L’intérieur int E de E est l’ensemble int E = {a ∈ Rn : a est intérieur à E} = {a ∈ Rn : E est voisinage de a}. Le résultat suivant est une conséquence immédiate de la définition. Proposition. Si a est intérieur à E, alors a ∈ E. En d’autres termes, int E ⊂ E. La réciproque de cette proposition est fausse : un point peut appartenir à un ensemble sans être intérieur à cet ensemble. Par exemple, si a < b sont 28 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS des réels, a ∈ [a, b] mais a n’est pas intérieur à [a, b]. En effet, pour chaque r > 0, B2 [a; r] /⊂ [a, b] puisque B2 [a; r] = [a − r, a + r] et a − r /∈ [a, b]. Définition. On dit que a est adhérent à E si, pour tout r > 0, on a B2 [a; r] ∩ E /= ∅. L’adhérence adh E de E est l’ensemble adh E = {a ∈ Rn : a est adhérent à E}. On le note aussi E. Le résultat suivant est une conséquence immédiate de la définition. Proposition. Si a ∈ E, alors a est adhérent à E. La réciproque de cette proposition est fausse : un point peut être adhérent à un ensemble sans lui appartenir. Par exemple, si a < b sont des réels, a /∈ ]a, b[ mais a est adhérent à ]a, b[. En effet, pour chaque r > 0, on a B2 [a; r]∩ ]a, b[ = [a − r, a + r]∩ ]a, b[ /= ∅, puisque a + r $ ∈ [a − r, a + r]∩ ]a, b[ si r $ = min{r, b−a 2 }. Il résulte immédiatement des définitions que int ∅ = adh ∅ = ∅, et que int Rn = adh Rn = Rn . En outre, puisque tout intervalle de R contient à la fois un rationnel et un irrationnel, on a nécessairement int Q = int (R \ Q) = ∅, et adh Q = adh (R \ Q) = R. La proposition suivante montre que le rôle privilégié joué par la norme | · |2 dans la définition de point intérieur et de point adhérent à un ensemble n’est qu’apparent. 1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE 29 Proposition. Si i = 1, 2 ou ∞, alors a est intérieur à E si et seulement s’il existe r > 0 tel que Bi [a; r] ⊂ E. a est adhérent à E si et seulement si, pour tout r > 0, on a Bi [a; r] ∩ E /= ∅. Démonstration. Condition nécessaire. Si a est intérieur à E, il existe r2 > 0 tel que B2 [a; r2] ⊂ E. Comme B∞ 2 3 r2 a; ⊂ B1 [a; r2] ⊂ B2 [a; r2], n il existe r1 = r2 tel que B1 [a; r1] ⊂ E et r∞ = rn2 tel que B∞ [a; r∞] ⊂ E. On procède de même dans le cas de l’adhérence. Condition suffisante. Soit a ∈ Rn tel que, pour i = 1 ou ∞, il existe ri > 0 tel que Bi [a; ri] ⊂ E. Comme 2 B2 [a; r∞] ⊂ B∞ [a; r∞] et B2 a; 3 r1 ⊂ B1 [a; r1], n on obtient, en prenant r = r∞ ou r = rn1 selon le cas considéré l’existence d’un r > 0 tel que B2 [a; r] ⊂ E. On procède de même dans le cas de l’adhérence. Les notions de point intérieur et de point adhérent s’échangent par double passage au complémentaire. On posera !E = Rn \ E. Proposition. a est adhérent à E si et seulement si a n’est pas intérieur à !E. a est intérieur à E si et seulement si a n’est pas adhérent à !E. En d’autres termes, on a adh E = !int !E, int E = !adh !E, ou encore Rn = E ∪ !E = int E ∪ adh !E = adh E ∪ int !E. Démonstration. En utilisant les définitions et les règles de négation d’une proposition contenant des quantificateurs, on a a n’est pas intérieur à !E ⇔ (∀r > 0) : B2 [a; r] /⊂ !E ⇔ (∀r > 0) : B2 [a; r] ∩ !!E /= ∅ ⇔ (∀r > 0) : B2 [a; r] ∩ E /= ∅ ⇔ a est adhérent à E. L’autre proposition s’obtient en appliquant la première à !E. Etudions maintenant les relations entre les notions d’intérieur et d’adhérence et les relations et opérations usuelles entre ensembles. Soit F une partie de Rn . Le premier résultat est une conséquence immédiate des définitions. 30 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Proposition. Si E ⊂ F , alors int E ⊂ int F et adh E ⊂ adh F . Proposition. On a int (E ∪ F ) ⊃ int E ∪ int F, int (E ∩ F ) = int E ∩ int F, adh (E ∪ F ) = adh E ∪ adh F, adh (E ∩ F ) ⊂ adh E ∩ adh F. Démonstration. Comme E∪F ⊃ E et E∪F ⊃ F , on a, par la proposition précédente, int (E ∪ F ) ⊃ int E et int (E ∪ F ) ⊃ int F, et donc int (E ∪ F ) ⊃ int E ∪ int F. Comme E ⊃ E ∩ F et F ⊃ E ∩ F , on a, par la proposition précédente, int E ⊃ int (E ∩ F ), int F ⊃ int (E ∩ F ), et dès lors int E ∩ int F ⊃ int (E ∩ F ). Par ailleurs, si a ∈ int E, il existe r1 > 0 tel que B2 [a; r1] ⊂ E et si a ∈ int F , il existe r2 > 0 tel que B2 [a; r2] ⊂ F. Dès lors, r = min{r1 , r2} est tel que B2 [a; r] ⊂ E ∩ F, ce qui montre que int E ∩ int F ⊂ int (E ∩ F ). Comme l’inclusion contraire a été démontrée plus haut, on a bien l’égalité souhaitée. Pour obtenir les propriétés de l’adhérence, on utilise les propriétés de l’intérieur, les lois de De Morgan !(A ∪ B) = !A ∩ !B, !(A ∩ B) = !A ∪ !B, et les relations entre intérieur et adhérence. Cela donne adh (E ∪ F ) = !int !(E ∪ F ) = !int (!E ∩ !F ) = ![(int !E) ∩ (int !F )] = !(int !E) ∪ !(int !F ) = adh E ∪ adh F, et adh (E ∩ F ) = !int !(E ∩ F ) = !int (!E ∪ !F ) ⊂ ![(int !E) ∪ (int !F )] = (!int !E) ∩ (!int !F ) = adh E ∩ adh F. 1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE 31 Remarque. Traduits en termes de voisinages, les résultats ci-dessus expriment que toute partie de Rn contenant un voisinage de a est un voisinage de a et que l’intersection de deux voisinages de a est encore voisinage de a. A titre d’exemple, déterminons l’intérieur et l’adhérence des différents types d’intervalle de R muni de la norme valeur absolue. Proposition. Si a < b sont deux réels, alors ]a, b[= int ]a, b[ = int [a, b[ = int ]a, b] = int [a, b], [a, b] = adh ]a, b[ = adh [a, b[ = adh ]a, b] = adh [a, b]. Démonstration. Démontrons d’abord la première série d’égalités. Puisque ]a, b[ ⊂ [a, b[ ⊂ [a, b] et ]a, b[ ⊂ ]a, b] ⊂ [a, b], et que ces inclusions se conservent par passage à l’intérieur, il suffit de démontrer que ]a, b[ = int ]a, b[ = int [a, b]. La première égalité sera démontrée si l’on prouve que ]a, b[ ⊂ int ]a, b[. Soit x ∈]a, b[, c’est-à-dire tel que a < x < b. Par une propriété des réels démontrée plus haut, il existe donc r1 > 0 tel que a + r1 < x et r2 > 0 tel que x + r2 < b et, en prenant r = min{r1 , r2 }, on voit que a < x − r < x + r < b ou encore que B2 [x; r] = [x − r, x + r] ⊂ ]a, b[. Pour démontrer que ]a, b[ = int [a, b], on sait déjà, puisque ]a, b[ ⊂ [a, b], que ]a, b[ = int ]a, b[ ⊂ int [a, b] et il suffit donc de prouver que int [a, b] ⊂ ]a, b[. Si x ∈ int [a, b], il existe r > 0 tel que B2 [x; r] = [x − r, x + r] ⊂ [a, b]. Par conséquent, on a a < a + r ≤ x ≤ b − r < b, et x ∈ ]a, b[. Pour calculer les adhérences, il suffit, comme dans le cas des intérieurs, de prouver que [a, b] = adh [a, b] = adh ]a, b[. Pour la première égalité, il suffit de nouveau de prouver que adh [a, b] ⊂ [a, b]. Si x ∈ adh [a, b], alors, pour chaque r > 0, on a B2 [x; r] ∩ [a, b] = [x − r, x + r] ∩ [a, b] /= ∅. En d’autres termes, (∀r > 0)(∃y ∈ R) : x − r ≤ y ≤ b et a ≤ y ≤ x + r, 32 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS ce qui entraı̂ne que (∀r > 0) : a ≤ x + r et x ≤ b + r. On a vu plus haut que cette propriété équivaut à a ≤ x ≤ b, et donc x ∈ [a, b]. Pour démontrer que adh [a, b] = adh ]a, b[, on déduit tout d’abord de l’inclusion ]a, b[ ⊂ [a, b] que adh ]a, b[ ⊂ adh [a, b] = [a, b], et il suffit de prouver que [a, b] ⊂ adh ]a, b[, ce qui se ramène à {a, b} ⊂ adh ]a, b[ et a été démontré plus haut. Remarque. Les exemples suivants montrent qu’on ne peut pas améliorer les conclusions de la proposition sur l’intérieur d’une union et l’adhérence d’une intersection. Si a < b < c sont des réels, E = [a, b[ et F = [b, c[, alors E ∪ F = [a, c[ et int (E ∪ F ) = ]a, c[ /= ]a, b[ ∪ ]b, c[ = int E ∪ int F. Si a < b < c < d sont des réels, et si E = [b, c[, F =]a, b] ∪ ]c, d[, alors E ∩ F = {b} = {b} /= {b} ∪ {c} = [b, c] ∩ ([a, b] ∪ [c, d]) = E ∩ F . Introduisons enfin la notion de frontière d’une partie de Rn . Définition. Si E ⊂ Rn , la frontière fr E ou Ė ou ∂E est l’ensemble fr E = adh E ∩ adh !E. Il résulte aussitôt de cette définition que fr E = fr !E, et le lien entre intérieur et adhérence entraı̂ne aussi la relation fr E = adh E \ int E, puisque adh E \ int E = adh E ∩ !int E = adh E ∩ adh !E. Il résulte de la définition et de résultats démontrés pour l’intérieur et l’adhérence que l’on a fr Q = R, fr Rn = ∅, fr ∅ = ∅, et, si a < b sont des réels, fr [a, b] = fr [a, b[ = fr ]a, b] = fr ]a, b[ = {a, b}. 33 1.8. EXERCICES 1.8 Exercices 1. Soient a1 , a2 , . . . , an et b1 , b2, . . . , bn des nombres réels. Vérifier l’identité n $ j=1 & aj n $ bk k=1 ' −n & n $ k=1 ak bk ' $ = 1≤j<k≤n (aj − ak )(bk − bj ) = n $ n 1$ (aj − ak )(bk − bj ). 2 j=1 k=1 En déduire que si aj ≤ ak et bj ≥ bk pour tout 1 ≤ j < k ≤ n, on a l’inégalité de Tchebycheff & n 1$ aj n j=1 n 1$ bk n k=1 ' ≥ n 1$ ak bk . n k=1 2. Soient a1 , a2 , . . . an des nombres réels tels que aj ∈ ] − 1, 0] (1 ≤ j ≤ n) ou aj ≥ 0, (1 ≤ j ≤ n). Démontrer, par récurrence, l’inégalité n 6 j=1 (1 + aj ) ≥ 1 + n $ aj , j=1 l’inégalité étant stricte dès que n ≥ 2. En déduire l’inégalité de Bernoulli : si a > −1 et si n ≥ 1 est un entier, alors (1 + a)n ≥ 1 + na. 3. On dit qu’un nombre réel x est algébrique s’il est solution d’une équation % algébrique à coefficients aj entiers nj=0 aj xj = 0. On dit qu’un nombre réel est transcendant s’il n’est pas algébrique. Démontrer que tout rationnel est algébrique, que l’ensemble des nombres algébriques est dénombrable et que l’ensemble des nombres transcendants est non-dénombrable. 1.9 Petite anthologie Ensembles Par ensemble, nous devons entendre toute collection M considérée comme un tout d’objets définis et séparés de notre intuition et de notre pensée. Ces objets sont appelés les “éléments” de M. Georg Cantor, 1895 34 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Si, d’autre part, la totalité des éléments d’une multiplicité peut être considérée sans contradiction “comme un tout”, alors ils peuvent être rassemblés en “une seule chose”. Je l’appelle une multiplicité consistante ou un ensemble. Georg Cantor, 1899 Jusqu’à présent, personne n’a réussi à définir correctement la notion d’ensemble. Il ne faut probablement pas espérer une définition, mais plutôt un système d’axiomes. Les définitions usuelles d’ensemble ne permettent aucune conclusion utile, et en outre elles tolèrent des ensembles paradoxaux.... Mais, comme il semble exister des ensembles infinis consistants, une définition convenable ou un système d’axiomes correct devraient exclure les êtres paradoxaux. Gerhard Hessenberg, 1906 Fonctions, applications On appelle ici fonction d’une grandeur variable, une quantité composée de quelque manière que ce soit de cette grandeur variable et de constantes. Jean Bernoulli, 1718 Une fonction d’une quantité variable est une expression analytique composée de quelque manière que ce soit de cette quantité variable et de nombres ou quantités constantes. Leonhard Euler, 1748 On appelle fonction d’une ou de plusieurs quantités toute expression de calcul dans laquelle ces quantités entrent d’une manière quelconque, mêlées ou non avec d’autres quantités qu’on regarde comme ayant des valeurs données et invariables, tandis que les quantités de la fonction peuvent recevoir toutes les valeurs possibles. Ainsi, dans les fonctions, on ne considère que les quantités qu’on suppose variables, sans aucun égard aux constantes qui peuvent y être mêlées. Nous désignerons en général par la caractéristique f ou F , placée devant une variable, toute fonction de cette variable, c’est-àdire toute quantité dépendante de cette variable et qui varie avec elle suivant une loi donnée. Joseph-Louis Lagrange, 1797 1.9. PETITE ANTHOLOGIE 35 Enfin de nouvelles idées, amenées par le progrès de l’analyse, ont donné lieu à la définition suivante des fonctions : toute quantité dont la valeur dépend d’une ou plusieurs autres quantités, est dite fonction de ces dernières, soit qu’on sache ou qu’on ignore par quelles opérations il faut passer pour remonter de celles-ci à la première. Sylvestre François Lacroix, 1797 En général, la fonction f (x) représente une suite de valeurs, ou ordonnées, dont chacune est arbitraire. L’abscisse x pouvant recevoir une infinité de valeurs, il y a un pareil nombre d’ordonnées f (x). Toutes ont des valeurs numériques actuelles, ou positives, ou négatives, ou nulles. On ne suppose point que ces ordonnées soient assujetties à une loi commune; elles se succèdent d’une manière quelconque, et chacune d’elles est donnée comme le serait une seule quantité. Jean-Baptiste Joseph Fourier, 1822 Lorsque des quantités variables sont tellement liées entre elles que, la valeur de l’une d’elles étant donnée, on puisse en conclure les valeurs de toutes les autres, on conçoit d’ordinaire ces diverses quantités exprimées au moyen de l’une d’entre elles, qui prend alors le nom de variable indépendante; et les autres quantités, exprimées au moyen de la variable indépendante, sont ce qu’on appelle des fonctions de cette variable. Augustin Cauchy, 1823 D’une manière générale, on doit appeler fonction de x un nombre qui est donné pour chaque x et qui change progressivement avec x. La valeur de la fonction pourrait être donnée ou bien par une expression analytique, ou par une condition qui offre un moyen de tester tous les nombres et de sélectionner l’un deux, ou, finalement, la dépendance peut exister mais rester inconnue. Nicolas Lobatchevsky, 1834 Il n’est pas, en outre, du tout nécessaire que y dépende de x dans tout l’intervalle suivant la même loi; en fait, il n’est pas nécessaire de penser seulement à des relations qui puissent être exprimées par des opérations mathématiques. Gustave Lejeune Dirichlet, 1837 36 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Par le terme fonction, je considère une quantité dont les valeurs dépendent d’une manière quelconque de la valeur de la variable, ou des valeurs de plusieurs variables dont elle est composée. Ainsi, les fonctions considérées n’ont pas besoin pour être admises d’être exprimées par une combinaison de symboles algébriques, même entre des limites des variables arbitrairement proches. Georges Stokes, 1848 Une fonction de x est appelée f (x) si à chaque valeur de x à l’intérieur d’un intervalle est associée une valeur univoquement déterminée de f (x). En outre, la manière dont f (x) est déterminée n’a aucune importance, que ce soit par une opération analytique sur les quantités ou une autre manière. La valeur de f (x) doit seulement être déterminée univoquement partout. Hermann Hankel, 1870 Quand deux multiplicités bien ordonnées M et N se laissent mettre en correspondance, élément par élément, de façon univoque et complète (chose qui, si elle est possible de quelque manière, peut toujours se faire de beaucoup d’autres manières), nous nous autoriserons désormais à dire que ces multiplicités one même puissance, ou encore qu’elles sont équivalentes. ... La série des nombres entiers positifs offre, comme on peut le montrer facilement, la plus petite de toutes les puissances qui se trouvent dans les multiplicités infinies. Néanmoins la classe des multiplicités qui ont cette plus petite puissance est une classe extraordinairement riche et étendue. Georg Cantor, 1878 Par une application d’une système S, on entend une loi par laquelle à chaque élément déterminé s de S est associé un objet déterminé, qui est appelé l’image de s et noté φ(s); on dit, aussi, que φ(s) correspond à l’élément s, que φ(s) est déterminé ou engendré par l’application φ à partir de s, que s est transformé par l’application φ en φ(s). Richard Dedekind, 1887 Considérons un ensemble (X) de nombres distincts, et regardons ces nombres comme des valeurs qui puissent être attribuées à une lettre x, laquelle sera désignée comme étant une variable. Supposons qu’à chaque valeur de x, c’est-à-dire à chaque élément de l’ensemble (X) corresponde un nombre que l’on regardera comme une valeur attribuée à une lettre y; on dira 37 1.9. PETITE ANTHOLOGIE que y est une fonction de x déterminée dans cet ensemble (X): la fonction sera définie dans cet ensemble si la correspondance est définie. L’ensemble (Y ) des valeurs distinctes que prend y est déterminé par la correspondance même : dire que b est un élément de (Y ) c’est dire qu’il y a un élément a de (X) auquel correspond le nombre b. A chaque élément de (X) correspond un élément de (Y ) et un seul; mais rien n’empêche, dans la définition précédente, qu’à plusieurs éléments différents de (X) corresponde un même élément de (Y ). Jules Tannery, 1904 Une fonction est une relation u telle que, si deux paires y; x et z; x ayant le même second élément, satisfont à la relation u, il en résulte nécessairement que y = x quelles que soient les valeurs de x, y, z. Giuseppe Peano, 1911 Soient E et F deux ensembles, distincts ou non. Une relation entre une variable x de E et une variable y de F est dite relation fonctionnelle en y, ou relation fonctionnelle de E vers F , si, quel que soit x ∈ E, il existe un élément y de F , et un seul, qui soit dans la relation considérée avec x. Nicolas Bourbaki, 1939 Nombres réels On doit se rappeler cependant que les quantités infiniment petites, même comprises dans le sens populaire, ne sont en aucun cas constantes et déterminées. Car si un opposant dénie l’exactitude de nos théorèmes, nos calculs montrent que l’erreur est plus petite que toute quantité donnée, puisqu’il est en notre pouvoir de diminuer l’incomparablement petit, que l’on peut toujours supposer aussi petit que l’on veut. Nul doute que là se trouve la démonstration rigoureuse de notre calcul infinitésimal. Gottfried W. Leibniz, 1702 Les nombres irrationnels se trouvent en une quantité sans comparaison plus grande que les nombres rationnels. Bernard le Bovier de Fontenelle, 1727 38 CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS Il n’y a pas de doute que toute quantité peut être diminuée de telle manière qu’elle s’annule complètement et disparaisse. Mais une quantité infiniment petite n’est rien d’autre qu’une quantité qui s’annule et dès lors la chose elle-même est égale à zéro. C’est en harmonie aussi avec cette définition des choses infiniment petites, par laquelle les choses sont dites inférieures à toute quantité assignable; elles devraient certainement n’être rien, car à moins qu’elle ne soit égale à zéro, une quantité égale peut lui être assignée, ce qui est contraire à l’hypothèse. Léonard Euler, 1755 Nombres complexes Après les irrationnels sont nées les quantités impossibles ou imaginaires dont la nature est très étrange mais dont l’utilité est indéniable. Gottfried W. Leibniz De la même manière qu’on peut imaginer le domaine entier des quantités réelles comme étant représentées par une ligne droite infinie, le domaine complet de toutes les grandeurs, nombres réels aussi bien qu’imaginaires, peut être visualisé comme un plan infini, dans lequel le point défini par l’abscisse a et l’ordonnée b représente la quantité a + bi. Carl-Friedrich Gauss, 1811 On √ appelle expression imaginaire toute expression symbolique de la forme a + b −1, a, b désignant deux quantités réelles. Augustin Cauchy, 1821 Chapitre 2 Limites et continuité 2.1 Fonctions de plusieurs variables réelles Soient n ≥ 1 et p ≥ 1 des entiers et soit f une fonction de Rn dans Rp. Pour chaque x ∈ dom f, on a f (x) = (p1 (f (x)), . . ., pp(f (x))) = ((p1 ◦ f ))(x), . . . , (pp ◦ f )(x)) où, pour chaque 1 ≤ j ≤ p, pj : Rp → R, y 2→ yj est l’application projection sur la j e composante. On pose, pour chaque 1 ≤ j ≤ p, fj = pj ◦ f , ce qui définit une fonction de Rn dans R, de domaine dom fj = dom f , appelée fonction j e composante de f . Réciproquement, si l’on se donne p fonctions f1 , . . . , fp de Rn dans R, de domaines respectifs dom f1 , . . . , dom fp , on peut 7p leur associer la fonction f de Rn dans Rp , de domaine dom f = j=1 dom fj , définie, pour chaque x ∈ dom f , par f (x) = (f1 (x), . . . , fp(x)). La fonction j e composante de f est alors la restriction de fj à dom f . Lorsque n > 1 et p = 1, on dit que f est une fonction réelle de plusieurs (ici n) variables réelles; si n > 1 et p > 1, on dit que f est une fonction vectorielle de plusieurs variables réelles; si n = 1 et p > 1, on dit que f est une fonction vectorielle d’une variable réelle et si n = p = 1, on dit que f est une fonction réelle d’une variable réelle. Exemples. 1. La fonction qui associe à chaque réel x son carré x2 est une fonction réelle d’une variable réelle de domaine égal à R puisque l’opération “élévation au carré” est définie pour chaque réel. x 2. La fonction qui associe à chaque réel x différent de zéro le réel |x| est une ∗ fonction réelle de variable réelle de domaine égal à R = R \ {0}, puisque la division n’est définie que pour des diviseurs non nuls. 39 40 CHAPITRE 2. LIMITES ET CONTINUITÉ 3. La fonction qui associe à chaque réel positif x sa racine carrée arithmétique x1/2 est une fonction réelle d’une variable réelle de domaine égal à R+ = {x ∈ R : x ≥ 0}, puisque l’opération “racine carrée arithmétique” n’est définie que pour les réels positifs. 4. La fonction de R2 dans R2 définie par f (x1 , x2 ) = 4 x1 + x 2 x 1 x2 , x1 − x2 (x1 − 1)1/2 5 a pour domaine dom f = {(x1 , x2 ) ∈ R2 : x1 /= x2 et x1 > 1} x1 x2 2 puisque l’expression xx11 +x −x2 est définie lorsque x1 /= x2 et l’expression (x1 −1)1/2 est définie lorsque x1 > 1. Une fonction f de Rn dans R2 peut évidemment être considérée comme une fonction f de Rn dans C et s’appelle alors une fonction complexe de plusieurs variables réelles si n > 1 et d’une variable réelle si n = 1. Ses composantes au sens défini plus haut s’appellent alors respectivement la fonction partie réelle et la fonction partie imaginaire de f . Une fonction de R2 dans Rp peut également être considérée comme fonction de C dans Rp et s’appelle alors une fonction vectorielle d’une variable complexe. En particulier, une fonction de R2 dans R2 peut être considérée comme une fonction de C dans C; on l’appelle alors une fonction complexe d’une variable complexe. Tant que la structure de corps qui distingue C de R2 n’est pas utilisée, il n’y a évidemment aucune nécessité de distinguer R2 de C comme espace de départ ou d’arrivée d’une fonction. Il en sera ainsi pour les notions de limite et de continuité. Par contre, la notion de dérivabilité sera différente selon que l’on considère C ou R2 . Rappelons enfin que, conformément aux notions générales introduites sur les graphes, si f est une fonction de Rn dans Rp et E une partie de Rn , la restriction f |E de f à E sera la fonction de Rn dans Rp de domaine dom f |E = dom f ∩ E telle que, pour chaque x ∈ dom f |E , on a f |E (x) = f (x). 2.2 Limite des valeurs d’une fonction Introduisons maintenant le concept fondamental de limite, en un point de Rn , des valeurs d’une fonction de Rn dans Rp . Si f est une fonction de Rn dans Rp , l’opération “calculer f (a) en a ∈ Rn ” est possible si et seulement 2.2. LIMITE DES VALEURS D’UNE FONCTION 41 si a ∈ dom f . Si nous considérons à titre d’exemple la fonction f de R dans R définie par 1 1 f (x) = − , x x + x2 nous voyons immédiatement que son domaine est égal à R \ {−1, 0}. Si nous calculons numériquement des valeurs de f (x) pour des x différents de −1 mais proches de −1, nous constatons que f (x) prend des valeurs positives et des valeurs négatives dont la valeur absolue peut devenir très grande. Si nous calculons numériquement f (x) pour des valeurs différentes de 0 mais proches de 0, nous constatons que les valeurs obtenues pour f (x) diffèrent peu de 1. La fonction f présente donc un comportement différent au voisinage des points −1 et 0 du complémentaire de son domaine. Dans le cas de 0, l’opération impossible “calculer f (0)” semble réalisable “de manière approchée” dans le sens suivant : f (x) diffère d’aussi peu que l’on veut de 1 si on la calcule aux points de dom f \ {0} suffisamment proches de 0. D’une manière plus précise, montrons que chaque fois qu’on se donne un réel ! > 0, on pourra trouver un réel δ > 0 tel que |f (x) − 1| ≤ ! pour tous les x ∈ dom f vérifiant l’inégalité |x| ≤ δ. Pour ce faire, notons tout d’abord que, pour chaque x ∈ dom f, on a # #1 |f (x) − 1| = ## x − # # # # # −x # 1 # = |x| . − 1## = ## 2 x+x 1 + x # |1 + x| |x| ! > 0 étant donné, nous devons donc trouver un δ > 0 tel que |1+x| ≤ ! lorsque x /∈ {−1, 0} et |x| ≤ δ. Rappelons qu’on majore une fraction en majorant son numérateur et en minorant son dénominateur. Pour minorer |1 + x|, notons que si |x| ≤ 12 , c’est-à-dire si − 12 ≤ x ≤ 12 , on a 12 ≤ 1 + x ≤ 32 , et dès lors 1 |1 + x| = 1 + x ≥ . 2 En conséquence, on a |x| ≤ 2|x| |1 + x| dès que |x| ≤ 12 , ce qui entraı̂ne que |f (x) − 1| = |x| ≤ 2|x| ≤ !, |1 + x| si, outre les conditions x /∈ {−1, 0} et |x| ≤ 12 déjà imposées, on ajoute |x| ≤ 2! . Nous avons donc montré que le réel strictement positif δ = min{ 12 , 2! } 42 CHAPITRE 2. LIMITES ET CONTINUITÉ est tel que |f (x) − 1| ≤ ! pour tous les x ∈ dom f vérifiant l’inégalité |x| ≤ δ. Dans ce sens précis, on peut dire que l’opération impossible “faire prendre à f en 0 la valeur 1” est réalisée de manière approchée, et avec une approximation aussi bonne que l’on veut. Dans ce processus, ! > 0 mesure l’erreur maximale tolérée dans la réalisation de l’opération approchée et le réel strictement positif δ qu’on lui associe délimite les valeurs de la variable x pour lesquelles l’opération approchée est réalisée dans les limites de l’erreur maximale tolérée. On voit tout de suite que si un δ1 > 0 convient, dans ce qui précède, pour un !1 > 0 donné, il conviendra a fortiori pour chaque ! > !1 puisque |f (x) − 1| ≤ !1 entraı̂ne |f (x) − 1| ≤ !. Par contre, si ! < !1 , on constate facilement que le δ1 associé à !1 ne conviendra pas en général pour !; il faudra prendre un δ < δ1 et être assuré de trouver des éléments x dans dom f tels que |x| ≤ δ. Comme δ peut être arbitrairement petit, il est important que dom f ∩ {x : |x| ≤ δ} /= ∅ pour tout δ > 0, c’est-à-dire que 0 ∈ adh dom f. Nous pouvons maintenant formaliser ce qui précède et obtenir la définition suivante. Définition. Soit f une fonction de Rn dans Rp, a ∈ Rn et b ∈ Rp . On dit que f (x) tend vers b lorsque x tend vers a, ou encore que b est limite de f (x) lorsque x tend vers a, et l’on écrit f (x) → b si x → a, si les deux conditions suivantes sont satisfaites : 1) a ∈ adh dom f ; 2) (∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !. Rappelons que la condition 2 se lit comme suit : pour tout ! > 0, il existe un δ > 0 tel que pour tout x ∈ dom f vérifiant l’inégalité |x − a|2 ≤ δ, on a l’inégalité |f (x) − b|2 ≤ !. Pour chaque ! > 0 donné, on devra donc trouver un δ > 0 (pouvant dépendre d’!) tel que |f (x) − b|2 ≤ ! pour tous les x ∈ dom f tels que |x − a|2 ≤ δ. Dans l’exemple considéré plus haut, toutes les conditions de la définition sont satisfaites avec a = 0 et b = 1, et l’on peut donc écrire 1 1 → 1 si x → 0. − x x + x2 Donnons maintenant un exemple de vérification de la définition pour une fonction de plusieurs variables. Exemple. Soit f la fonction de R2 dans R définie par x 1 x2 x 1 x2 f (x1 , x2 ) = = 2 . |x|2 (x1 + x22 )1/2 2.2. LIMITE DES VALEURS D’UNE FONCTION 43 Comme |x|2 = 0 si et seulement si x = 0, on voit que dom f = R2 \ {0}. On a 0 ∈ adh dom f puisque adh dom f = R2 . Montrons que f (x) → 0 si x → 0. Soit ! > 0; il faut donc trouver un δ > 0 tel que, pour tout x = (x1 , x2 ) /= (0, 0) vérifiant l’inégalité |x|2 ≤ δ, on ait # # # x1 x2 # # # # |x| # ≤ !, 2 c’est-à-dire |x1 ||x2| ≤ !. |x|2 L’étude de cette inégalité est simplifiée si l’on rappelle que, pour tout x = (x1 , x2 ) ∈ R2 , on a |xi | ≤ |x|2 , (i = 1, 2), et dès lors, pour tout x ∈ R2 \ {0}, on a |x1 ||x2| |x|22 ≤ = |x|2 . |x|2 |x|2 Il suffit donc de prendre δ = ! pour que les conditions x ∈ dom f et |x|2 ≤ δ entraı̂nent |x|2 ≤ ! et dès lors |f (x)| ≤ |x|2 ≤ !. Dans les applications pratiques de la notion de limite, il est souvent nécessaire de restreindre les valeurs de la variable x à une certaine partie de Rn fixée d’avance et constituant un ensemble de contraintes. Par exemple, dans le cas d’une fonction réelle d’une variable réelle, on peut n’être intéressé que par les valeurs strictement positives de la variable. Il est donc nécessaire, pour couvrir toutes les situations rencontrées dans les applications, d’étendre la définition de limite au cas où la variable x est astreinte à rester dans un ensemble de contraintes E, c’est-à-dire de demander à la définition précédente de s’appliquer seulement à la restriction f |E de f à E. Définition. Soit f une fonction de Rn dans Rp , a ∈ Rn , b ∈ Rp et E ⊂ Rn tel que dom f ∩ E /= ∅. On dit que f (x) tend vers b lorsque x tend vers a dans E, ou encore que b est limite de f (x) lorsque x tend vers a dans E, et l’on écrit f (x) → b si x → a dans E, (2.1) 44 CHAPITRE 2. LIMITES ET CONTINUITÉ si b est limite de f |E (x) pour x tendant vers a, c’est-à-dire si les deux conditions suivantes sont satisfaites : 1) a ∈ adh (dom f ∩ E); 2) (∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ E : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !. x Exemple. Soit f la fonction de R dans R définie par f (x) = |x| . On a évidemment dom f = R \ {0}. Prenons E = R+ = {x ∈ R : x ≥ 0}, ce qui entraı̂ne dom f ∩ E = R∗+ = {x ∈ R : x > 0}, et 0 ∈ adh R∗+ = R+ . Montrons que f (x) → 1 si x → 0 dans E. On a, pour tout x > 0, f (x) = xx = 1 et donc |f (x) − 1| = 0. Si ! > 0 est donné, on aura donc |f (x) − 1| = 0 ≤ ! quel que soit x > 0 et l’on peut donc choisir n’importe quel δ > 0 dans la définition. Il est évident que, pour chaque E ⊂ Rn tel que a ∈ adh (dom f ∩ E), on a l’implication f (x) → b si x → a ⇒ f (x) → b si x → a dans E. Nous donnerons plus loin un exemple montrant que l’implication contraire est fausse. Donnons maintenant quelques remarques simples mais importantes sur la structure et l’utilisation de la définition de limite. Remarques. 1. La condition 2 est évidemment équivalente à la condition (∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : f (x) ∈ B2 [b; !], elle-même équivalente à la condition (∀! > 0)(∃δ > 0) : f (B2 [a; δ]) ⊂ B2 [b; !]. 2. Si r > 0 est donné, la condition 2 de la définition est équivalente à la condition (∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ r!, puisque l’application ! 2→ r! est une bijection de R∗+ = {x ∈ R : x > 0} sur lui-même. 3. La condition 2 est équivalente à la condition (∀! > 0)(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 < δ $ ) : |f (x) − b|2 < !, (2.2) 45 2.2. LIMITE DES VALEURS D’UNE FONCTION où les signes ≤ sont remplacés par < (le changement de δ en δ $ n’a évidemment aucune signification profonde et ne sert que pour clarifier la démonstration). Montrons tout d’abord que la condition 2 de la définition implique (2.2) : si ! > 0 est donné, il faut donc trouver un δ $ > 0 tel que (2.2) soit satisfaite. Par la condition 2 de la définition et la remarque 2, il existe un δ $$ > 0 tel que (∀x ∈ dom f ∩ E : |x − a|2 ≤ δ $$ ) : |f (x) − b|2 ≤ ! , 2 ce qui entraı̂ne évidemment que (∀x ∈ dom f ∩ E : |x − a|2 < δ $$ ) : |f (x) − b|2 < !. On peut donc prendre δ $ = δ $$ . Montrons maintenant que la condition (2.2) implique la condition 2 de la définition. Si ! > 0 est donné, nous devons trouver un δ > 0 tel que la condition 2 soit satisfaite. Par (2.2), il existe un δ $ > 0 tel que ! (∀x ∈ dom f ∩ E : |x − a|2 < δ $ ) : |f (x) − b|2 < , 2 ce qui entraı̂ne aussitôt que (∀x ∈ dom f ∩ E : |x − a|2 ≤ " δ$ ) : |f (x) − b|2 ≤ !, 2 et montre que δ = δ2 convient. 4. La deuxième partie de la démonstration de la Remarque 3 a fait usage du fait suivant, qui est aussi simple qu’utile : si, étant donné un ! > 0 on a trouvé un δ > 0 qui convient pour cet ! dans la condition 2 de la définition, alors tout δ $ ∈ ]0, δ] conviendra a fortiori, puisqu’alors |x − a|2 ≤ δ si |x − a|2 ≤ δ $ . En particulier, on peut toujours décider d’avance de se restreindre à déterminer des δ inférieurs à un nombre strictement positif donné. 5. Si, dans la condition 2 de la définition, on a trouvé un δ > 0 qui convient pour un ! > 0 donné, ce δ conviendra également pour tous les !$ ≥ !. Il suffit donc que la condition 2 puisse être vérifiée pour chaque ! strictement positif inférieur à un !∗ fixé d’avance. L’exigence “pour chaque ! > 0” signifie donc fondamentalement “pour chaque ! > 0 arbitrairement petit”. 6. Les exemples que nous avons déjà traités montrent l’intérêt qu’il y a, pour vérifier les conditions de la définition de limite, à majorer l’expression |f (x) − b|2 par une expression plus simple à estimer. On utilise pour ce faire 46 CHAPITRE 2. LIMITES ET CONTINUITÉ un stock d’inégalités qui se constitue petit à petit par la pratique. Le choix de l’inégalité est un art plus qu’une science puisqu’il faut veiller à ce qu’elle simplifie suffisamment l’expression à majorer sans altérer la nature de cette expression au point de rendre l’inégalité impossible. Montrons maintenant qu’il ne peut pas exister plus d’un b vérifiant les conditions de la définition de la limite. Proposition. Etant donnés f et a, il existe au plus un b ∈ Rp vérifiant les conditions de la définition de la limite des valeurs de f (x) lorsque x tend vers a. Démonstration. Supposons que b ∈ Rp et b$ ∈ Rp vérifient les conditions de la définition de limite. Rappelons que b = b$ ⇔ (∀! > 0) : |b − b$ |2 ≤ !, et que, pour tout x ∈ dom f , on a évidemment |b − b$ |2 = |b − f (x) + f (x) − b$ |2 ≤ |b − f (x)|2 + |f (x) − b$ |2 . Soit ! > 0. Par hypothèse (∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ et ! , 2 ! . 2 Dès lors, si l’on pose δ $$ = min{δ, δ $} et que l’on choisit x ∈ dom f tel que |x − a|2 ≤ δ $$ (ce qui est toujours possible par la condition 1 de la définition), on aura ! ! |b − b$ |2 ≤ + = !. 2 2 (∃δ $ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $ ) : |f (x) − b$ |2 ≤ Ce résultat d’unicité entraı̂ne qu’on pourra appeler b la limite de f (x) lorsque x tend vers a. On écrira alors b = lim f (x). x→a En appliquant ce résultat à f |E , on obtient évidemment l’existence d’au plus un b vérifiant les conditions de la définition de la limite des valeurs de f (x) lorsque x tend vers a dans E. On l’appellera la limite de f (x) lorsque x tend vers a dans E et l’on écrira b= lim x→a, x∈E f (x). 2.3. CONDITIONS NÉCESSAIRES D’EXISTENCE DE LA LIMITE 2.3 47 Conditions nécessaires d’existence de la limite La définition que nous avons donnée permet, étant donnés f, a et b, de vérifier si b = limx→a f (x). Il est évidemment fastidieux de l’utiliser pour montrer que f n’a pas de limite lorsque x tend vers a, puisqu’il faut alors vérifier qu’elle n’est satisfaite pour aucun b ∈ Rp . Nous allons donner dans cette section des conditions nécessaires d’existence d’une limite qui ne font pas intervenir la valeur b de la limite. Par contraposition, ces conditions nécessaires donneront alors des conditions de non-existence de la limite plus facilement utilisables. La première condition porte le nom de condition de Cauchy. Proposition. Soit f une fonction de Rn dans Rp et a ∈ Rn . Si limx→a f (x) existe alors la condition suivante est satisfaite: (∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)(∀x$ ∈ dom f : |x$ − a|2 ≤ δ) : |f (x) − f (x$ )|2 ≤ !. (2.3) Démonstration. Posons b = limx→a f (x) et notons tout d’abord que, pour tout x ∈ dom f et tout x$ ∈ dom f , on a |f (x) − f (x$ )|2 = |f (x) − b + b − f (x$ )|2 ≤ |f (x) − b|2 + |f (x$ ) − b|2 . Si ! > 0 est donné, il existe δ > 0 tel que (∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ ! , 2 et dès lors, en utilisant l’inégalité ci-dessus, (∀x ∈ dom f : |x − a|2 ≤ δ)(∀x$ ∈ dom f : |x$ − a|2 ≤ δ) : |f (x) − f (x$ )|2 ≤ |f (x) − b|2 + |f (x$ ) − b|2 ≤ ! ! + = !. 2 2 Par contraposition, nous obtenons immédiatement le 48 CHAPITRE 2. LIMITES ET CONTINUITÉ Corollaire. Soit f une fonction de Rn dans Rp et a ∈ Rn tels que a ∈ adh dom f. Si la condition de Cauchy (2.3) n’est pas satisfaite, c’est-à-dire si sa négation (∃! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ)(∃x$ ∈ dom f : |x$ − a|2 ≤ δ) : |f (x) − f (x$ )|2 > !, (2.4) est vérifiée, alors la limite de f (x) pour x tendant vers a n’existe pas. On notera que, dans la condition (2.4), il suffit de trouver un ! > 0 tel que (2.4) soit satisfaite pour tout δ ∈ ]0, δ ∗ [ pour un δ ∗ fixé a priori, puisque, si x et x$ conviennent dans (2.4) pour un δ > 0, ils conviennent pour tous les δ supérieurs. On obtient évidemment une condition nécessaire de Cauchy pour la limite de f (x) lorsque x tend vers a dans E en appliquant le résultat précédent à f |E . Exemples. 1. Nous avons vu précédemment que lim x→0, x>0 Montrons que lim x→0 x = 1. |x| x |x| n’existe pas, ce qui justifiera le fait mentionné plus haut que, lorsque E ∩ dom f ! dom f , l’existence de la limite de f (x) lorsque x tend vers a dans E n’entraı̂ne pas nécessairement celle de la limite de f (x) lorsque x tend vers a . Pour vérifier (2.4), il faut donc trouver des réels x et des réels x$ arbitrairement proches de 0 tels que |f (x) − f (x$ )| reste supérieur à un x nombre positif fixe. Comme f (x) = −x = −1 si x < 0 et f (x) = xx = 1 si x > 0, on voit que, pour tout x > 0 et tout x$ < 0, on aura |f (x) − f (x$ )| = |1 − (−1)| = 2, et la condition (2.4) est vérifiée pour ! = 1 en prenant, pour chaque δ > 0, x = δ et x$ = −δ. 2. Si f est la fonction de R dans R définie par f (x) = 0 si x /= 0 et f (0) = 1, alors limx→0 f (x) n’existe pas. En effet, pour chaque δ > 0 fixé, en prenant x = δ et x$ = 0 (qui sont bien tels que |x| ≤ δ et |x$ | ≤ δ), on trouve |f (x) − f (x$ )| = |0 − 1| = 1, et la condition (2.4) est vérifiée avec ! = 12 . 2.3. CONDITIONS NÉCESSAIRES D’EXISTENCE DE LA LIMITE 49 Ce dernier exemple nous conduit à une remarque terminologique importante. Certains auteurs définissent le concept de limite f (x) → b si x → a par les conditions 1’) a ∈ adh (dom f \ {a}) et 2’) (∀! > 0)(∃δ > 0)(∀x ∈ dom f \ {a} : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !, et ils écrivent dans ce cas b = limx→a f (x). Cette définition, dans les notations que nous avons adoptées ici, n’est pas équivalente à notre définition de b = limx→a f (x), mais au choix de E = dom f \ {a} dans la définition générale, c’est-à-dire à b = limx→a, x(=a f (x). Pour éviter des contradictions apparentes dans l’énoncé de certains résultats dans différentes ouvrages d’analyse, il convient donc d’être attentif à la définition de limite choisie par l’auteur. Une autre condition nécessaire d’existence de la limite est fondée sur l’utile notion de fonction localement bornée. Définition. Soit f une fonction de Rn dans Rp et a ∈ Rn . On dit que f est localement bornée en a si la condition suivante est vérifiée : (∃r > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 ≤ r. (2.5) En d’autres termes, f est localement bornée en a s’il existe une boule B2 [a; δ] dans Rn centrée en a et une boule B2 [r] dans Rp centrée en 0 telles que f ([B2 [a; δ]) ⊂ B2 [r]. x Ainsi, la fonction réelle d’une variable réelle f définie par f (x) = |x| , qui, en vertu de l’exemple 1 ci-dessus, n’a pas de limite pour x tendant vers 0, # # #x# ∗ est localement bornée en 0. En effet, # |x| ≤ 1 pour tout x ∈ R . De même, la # x fonction réelle d’une variable réelle f définie par f (x) = |x| +x est localement bornée en 0 puisque, pour tout x ∈ [−1, 1] \ {0}, on a |f (x)| ≤ 2. L’existence d’une limite en un point entraı̂ne que la condition de borne locale est satisfaite en ce point. C’est une conséquence de la Proposition suivante, montrant que le caractère localement borné de f en a est une condition nécessaire pour que f vérifie la condition de Cauchy en a. Proposition. Soit f une fonction de Rn dans Rp et a ∈ Rn . Si f vérifie la condition de Cauchy (2.3), alors f est localement bornée en a. Démonstration. En prenant ! = 1 dans la condition (2.3), on voit qu’il existe δ > 0 tel que, pour tout x ∈ dom f tel que |x − a|2 ≤ δ, et pour 50 CHAPITRE 2. LIMITES ET CONTINUITÉ tout x$ ∈ dom f tel que |x$ − a|2 ≤ δ, on a |f (x) − f (x$ )|2 ≤ 1. Dès lors, si l’on fixe un x$ ∈ dom f ∩ B2 [a; δ], on trouve, pour tout x ∈ dom f tel que |x − a|2 ≤ δ, |f (x)|2 = |f (x) − f (x$ ) + f (x$ )|2 ≤ |f (x) − f (x$ )|2 + |f (x$ )|2 ≤ 1 + |f (x$ )|2 , ce qui montre que la condition (2.5) est vérifiée pour ce δ et r = 1 + |f (x$)|2 . La contraposée de cette proposition et le Corollaire précédent fournissent immédiatement une condition suffisante de non-existence de la limite. Corollaire. Soit f une fonction de Rn dans Rp et a ∈ Rn tels que a ∈ adh dom f. Si f n’est pas localement bornée en a (c’est-à-dire si la condition suivante est vérifiée (∀r > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 > r), alors la limite de f (x) pour x tendant vers a n’existe pas. En appliquant les résultats précédents à f |E , on voit qu’une condition nécessaire pour que f vérifie la condition de Cauchy lorsque x tend vers a dans E est que f |E soit localement bornée en a. 1 Exemple. Utilisons ce corollaire pour montrer que la limite de x1 − x+x 2 lorsque x tend vers −1 n’existe pas. C’est la première fonction introduite pour motiver l’introduction de la notion de limite, mais considérée cette fois au deuxième point −1 du complémentaire de son domaine. Pour tout x ∈ dom f , on a # # # x + x2 − x # 1 # # |f (x)| = # . #= # x(x + x2 ) # |1 + x| 1 Dès lors, si r > 0 et δ > 0 sont donnés et si l’on prend x = −1+min{δ, 2r }, on 1 1 voit que x−(−1) = x+1 = min{δ, 2r } > 0, donc |x+1| = x+1 = min{δ, 2r }, 1 ce qui entraı̂ne aussitôt que |x + 1| ≤ δ et |f (x)| = |1+x| ≥ 2r > r. 2.4 Règles de calcul des limites Le recours systématique à la définition pour vérifier l’existence d’une limite est long et fastidieux. Il est donc important de voir comment la notion de limite se comporte vis-à-vis des opérations algébriques et ensemblistes que l’on peut effectuer sur des fonctions, afin de déduire automatiquement l’existence et la valeur de la limite de fonctions compliquées lorsqu’on connaı̂t 51 2.4. RÈGLES DE CALCUL DES LIMITES celle de fonctions plus simples qui les composent. C’est l’objet des règles de calcul des limites. La première exprime essentiellement que la limite d’une somme est égale à la somme des limites. Rappelons que si f et g sont deux fonctions de Rn dans Rp , la somme f + g de f et g est la fonction de Rn dans Rp de domaine dom (f + g) = dom f ∩ dom g telle que, pour tout x ∈ dom (f + g), on a (f + g)(x) = f (x) + g(x). Proposition. Soient f et g deux fonctions de Rn dans Rp , a ∈ Rn , b ∈ Rp et c ∈ Rp tels que a ∈ adh (dom f ∩ dom g). Si lim f (x) = b et lim g(x) = c, x→a x→a alors lim (f + g)(x) = b + c. x→a Démonstration. Notons tout d’abord que, pour tout x ∈ dom (f + g), on a |(f + g)(x) − (b + c)|2 = |f (x) − b + g(x) − c|2 ≤ |f (x) − b|2 + |g(x) − c|2 . Si ! > 0 est donné, alors, par hypothèse, (∃δ $ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $ ) : |f (x) − b|2 ≤ ! , 2 ! . 2 Dès lors, si l’on pose δ = min{δ $ , δ $$ }, on aura, pour tout x ∈ dom f ∩dom g : |x − a|2 ≤ δ, ! ! |(f + g)(x) − (b + c)|2 ≤ + = !. 2 2 (∃δ $$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$ ) : |g(x) − c|2 ≤ Un raisonnement semblable, dont les détails sont laissés au lecteur, démontre le résultat suivant. Proposition. Si f et g sont des fonctions de Rn dans Rp localement bornées en a ∈ Rn , alors f + g est localement bornée en a. Le deuxième résultat affirme essentiellement que la limite d’un produit de deux fonctions est égale au produit des limites. Encore faut-il que ce produit soit bien défini, ce qui impose des restrictions aux espaces d’arrivée. Rappelons que si f est une fonction de Rn dans Rp (resp. C) et g une fonction de Rn dans R (resp. C), le produit gf de g par f est la fonction de 52 CHAPITRE 2. LIMITES ET CONTINUITÉ Rn dans Rp (resp. C) de domaine dom gf = dom f ∩ dom g telle que, pour chaque x ∈ dom gf , on a (gf )(x) = g(x).f (x), g(x).f (x) désignant selon le cas le produit de f (x) ∈ Rp par le réel g(x) ou le produit des nombres complexes g(x) et f (x). Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction de Rn dans R (resp. C), a ∈ Rn , b ∈ Rp (resp. C) et c ∈ R (resp. C) tels que a ∈ adh (dom f ∩ dom g). Si lim f (x) = b et lim g(x) = c, x→a x→a alors lim (gf )(x) = cb. x→a Démonstration. Notons tout d’abord que, pour tout x ∈ dom f ∩ dom g, on a |(gf )(x) − cb|2 = |g(x)f (x) − g(x)b + g(x)b − cb|2 ≤ |g(x)||f (x) − b|2 + |b|2|g(x) − c|. D’autre part, l’existence de la limite de g lorsque x tend vers a entraı̂ne que g est localement bornée en a, c’est-à-dire l’existence de r > 0 et δ $ > 0 tels que (∀x ∈ dom g : |x − a|2 ≤ δ $ ) : |g(x)| ≤ r. Si ! > 0 est donné, alors, par hypothèse, (∃δ $$ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $$ ) : |f (x) − b|2 ≤ (∃δ $$$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$$) : |g(x) − c| ≤ ! , 2r ! . 2(1 + |b|2 ) Si l’on pose δ = min{δ $ , δ $$ , δ $$$}, on voit, en rassemblant les résultats ci-dessus que, pour chaque x ∈ dom f ∩ dom g tel que |x − a|2 ≤ δ), on a |(gf )(x) − cb|2 ≤ r. ! ! + |b|2. ≤ !. 2r 2(1 + |b|2) Un raisonnement semblable, dont les détails sont laissés au lecteur, démontre le résultat suivant 53 2.4. RÈGLES DE CALCUL DES LIMITES Proposition. Si g est une fonction de Rn dans R (resp. C) localement bornée en a et f une fonction de Rn dans Rp (resp. C) localement bornée en a, alors gf est localement bornée en a. On peut obtenir une variante utile des deux propositions précédentes dans laquelle l’hypothèse sur l’une des deux fonctions est renforcée et celle sur l’autre affaiblie. Essentiellement, le résultat affirme que la limite du produit d’une fonction ayant une limite nulle par une fonction localement bornée est égale à zéro. Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction de Rn dans R (resp. C) et a ∈ adh (dom f ∩ dom g). Si limx→a f (x) = 0 et si g est localement bornée en a, alors lim (gf )(x) = 0. x→a Démonstration. Par hypothèse, il existe r > 0 et δ $ > 0 tels que, pour tout x ∈ dom g tel que |x − a|2 ≤ δ $ , on a Si ! > 0 est donné, alors |g(x)| ≤ r. ! (∃δ $$ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $$ ) : |f (x)|2 ≤ . r Dès lors, en posant δ = min{δ $ , δ $$} et en rassemblant les résultats qui précèdent, on aura ! (∀x ∈ dom f ∩ dom g : |x − a|2 ≤ δ) : |(gf )(x)|2 = |g(x)||f (x)|2 ≤ r. = !. r On a évidemment un résultat semblable, avec la même démonstration, si f est localement bornée en a et limx→a g(x) = 0. Le résultat suivant affirme que la limite d’un quotient de deux fonctions est égale au quotient des limites lorsque la limite du dénominateur est différente de zéro. Rappelons que si f est une fonction de Rn dans Rp (resp. C) et g une fonction de Rn dans R (resp. C), le quotient fg de f par g est la fonction de Rn dans Rp (resp. C) de domaine dom f g = {x ∈ dom f ∩dom g : (x) (x) g(x) /= 0} telle que, pour chaque x ∈ dom on a ( fg )(x) = fg(x) , où fg(x) 1 désigne selon le cas le produit de f (x) ∈ R par le réel g(x) ou le produit 1 des nombres complexes f (x) et g(x) . Bien entendu, si 1 désigne l’application f g, p constante de R dans R partout égale à 1, on a f g = 1g .f. 54 CHAPITRE 2. LIMITES ET CONTINUITÉ Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction de Rn dans R (resp. C), a ∈ Rn , b ∈ Rp (resp. C) et c ∈ R (resp. C) tels que a ∈ adh (dom f ∩ dom g). Si lim f (x) = b et lim g(x) = c, x→a avec c /= 0, alors x→a f b (x) = . x→a g c lim Démonstration. En vertu de l’égalité fg = 1g .f. et du résultat sur le produit des limites, il suffit de démontrer que, avec les hypothèses faites sur g, on a 1 1 lim (x) = . x→a g c Notons que dom 1g = {x ∈ dom g : g(x) /= 0}, et montrons tout d’abord que a ∈ adh dom 1g . En prenant ! = |c|/2, l’hypothèse et une inégalité classique entraı̂nent l’existence d’un δ $ > 0 tel que, pour tout x ∈ dom g vérifiant |x − a|2 ≤ δ $ , on ait ||g(x)| − |c|| ≤ |g(x) − c| ≤ |c| , 2 et dès lors, pour les mêmes valeurs de x, |g(x)| ≥ |c| . 2 En conséquence, dom 1g ⊃ dom g ∩ B2 [a; δ $], ce qui entraı̂ne aussitôt que dom 1g ∩ B2 [a; r] /= ∅ pour tout r > 0. Pour tout x ∈ dom 1g , on a # # # # #1 # # # # (x) − 1 # = # 1 − 1 # = |c − g(x)| . #g c # # g(x) c # |c||g(x)| Soit maintenant ! > 0; par hypothèse, (∃δ $$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$ ) : |g(x) − c| ≤ !|c|2 . 2 Dès lors, en posant δ = min{δ $ , δ $$ }, on aura, en rassemblant les résultats qui précèdent, pour chaque x ∈ dom 1g tel que |x − a|2 ≤ δ, # # 2 #1 # # (x) − 1 # ≤ !|c| . 1 . 2 = !. #g # c 2 |c| |c| 2.4. RÈGLES DE CALCUL DES LIMITES 55 Remarque. Le lecteur trouvera facilement des exemples montrant qu’on ne peut tirer aucune conclusion générale sur la valeur de la limite d’un quotient lorsque le dénominateur a une limite nulle. Nous analyserons plus tard quelques situations particulières. En appliquant les résultats qui précèdent à f |E et g|E , on obtient immédiatement les règles de calcul pour la limite lorsque x tend vers a dans E des sommes, produits et quotients de fonctions. Le résultat qui suit donne des conditions sous lesquelles la limite du composé de deux fonctions existe. Proposition. Soit f une fonction de Rn dans Rp, g une fonction de Rp dans Rq , a ∈ Rn , b ∈ Rp et c ∈ Rq tels que a ∈ adh dom (g ◦ f ) et b ∈ adh dom g. Si lim f (x) = b et lim g(y) = c, x→a y→b alors lim (g ◦ f )(x) = c. x→a Démonstration. Soit ! > 0; par hypothèse, (∃η > 0)(∀y ∈ dom g : |y − b|2 ≤ η) : |g(y) − c|2 ≤ !, et, pour cet η > 0, (∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ η. Dès lors, pour tout x ∈ dom (g◦f ) tel que |x−a|2 ≤ δ, on aura f (x) ∈ dom g et |f (x) − b|2 ≤ η, et dès lors |(g ◦ f )(x) − c|2 = |g(f (x)) − c|2 ≤ !. Remarques. 1. En appliquant le résultat précédent à f |E , on obtient un théorème sur la limite, lorsque x tend vers a dans E, du composé g ◦ f . 2. On peut démontrer que la proposition cesse d’être vraie si l’on remplace l’hypothèse lim g(y) = c y→b par lim y→b, y(=b g(y) = c. 56 CHAPITRE 2. LIMITES ET CONTINUITÉ Dans ce dernier cas, la limite de g ◦ f lorsque x tend vers a peut cesser d’exister, être égale à g(b) ou être égale à c. Donnons quelques conséquences du théorème sur la limite des fonctions composées. Pour i = 1, 2 ou ∞, désignons par |f |i la fonction de Rn dans Rp de domaine égal à dom f définie pour chaque x ∈ dom f par |f |i(x) = |f (x)|i. Corollaire. Soit f une fonction de Rn dans Rp, a ∈ Rn et b ∈ Rp tels que limx→a f (x) = b. Alors, pour i = 1, 2 ou ∞, on a lim |f |i(x) = |b|i. x→a Démonstration. Soit i = 1, 2 ou ∞; si g désigne l’application de Rp dans R définie par g(y) = |y|i, on a évidemment |f |i = g ◦f et dom g ◦f = dom f . D’ailleurs, pour chaque y ∈ Rp et chaque z ∈ Rp , on a la relation ||y|i − |z|i| ≤ |y − z|i , qui se démontre exactement comme l’inégalité correspondante pour la valeur absolue et entraı̂ne aussitôt que, pour chaque z ∈ Rp , on a lim g(y) = g(z). y→z La thèse résulte alors du théorème sur la limite d’une fonction composée. La réciproque de ce résultat est fausse : limx→a |f |i(x) peut exister sans x que limx→a f (x) n’existe (penser à f (x) = |x| avec a = 0). Toutefois, la réciproque est vraie dans le cas d’une limite nulle. Corollaire. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp tels que, pour i = 1, 2 ou ∞, on ait lim |f |i(x) = 0. x→a Alors, limx→a f (x) = 0. Démonstration. C’est une conséquence immédiate de la définition et du fait que, pour chaque x ∈ dom f , on a ||f |i(x)| = |f (x)|i ≤ n|f (x)|2 . 57 2.4. RÈGLES DE CALCUL DES LIMITES Une autre conséquence montre l’équivalence entre l’existence de la limite des valeurs d’une fonction et de la limite des valeurs de chaque composante de la fonction. Corollaire. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp . Alors, limx→a f (x) = b si et seulement si, pour chaque 1 ≤ j ≤ p, on a lim fj (x) = bj . x→a Démonstration. Pour chaque 1 ≤ j ≤ p, on a fj = pj ◦ f si pj désigne l’application projection sur la j e composante de Rp dans R; en particulier, dom fj = dom f. Condition nécessaire. Pour chaque y ∈ Rp et chaque z ∈ Rp , on a |pj (y) − pj (z)| = |yj − zj | ≤ |y − z|2 , on en déduit immédiatement que, pour chaque z ∈ Rp , on a limy→z pj (y) = pj (z), et le résultat découle du théorème sur la limite d’une fonction composée. Condition suffisante. Soit ! et 1 ≤ j ≤ p; par hypothèse (∃δj > 0)(∀x ∈ dom fj : |x − a|2 ≤ δj ) : |fj (x) − bj | ≤ ! p1/2 . Dès lors, si l’on pose δ = min{δ1 , . . . , δp}, on voit que, pour chaque x ∈ dom f tel que |x − a|2 ≤ δ, on a |f (x) − b|2 = p $ j=1 1/2 |fj (x) − bj |2 ≤ p $ !2 j=1 p 1/2 = !. Ce résultat montre que l’étude de la limite des valeurs d’une fonction de Rn dans Rp peut se ramener à l’étude de la limite des valeurs des p fonctions composantes, qui sont chacune à valeurs réelles. Par contre, l’étude de la limite des valeurs d’une fonction de Rn dans Rp ne peut pas se faire “composante par composante” dans l’espace de départ Rn de la fonction, ainsi que le montre l’exemple suivant. x2 Exemple. La fonction f de R2 dans R définie par f (x1 , x2 ) = xx21+x 2 a pour 1 2 domaine R2 \ {0}. Si x1 = 0, alors, pour tout x2 /= 0, on a f (0, x2 ) = 0 et dès lors lim f (0, x2 ) = 0. x2 →0 58 CHAPITRE 2. LIMITES ET CONTINUITÉ x2 Si x1 /= 0 est fixé, la fonction réelle d’une variable réelle f (x1 , ·) : x2 2→ xx21+x 2 1 2 est définie pour chaque x2 ∈ R, et il est facile de montrer, en utilisant par exemple le théorème sur la limite d’un quotient de fonctions, que, pour chaque x1 /= 0 fixé, lim f (x1 , x2 ) = 0. x2 →0 Ces résultats entraı̂nent aussitôt que lim 2 lim f (x1 , x2 ) = 0. 2 lim f (x1 , x2 ) = 0. x1 →0 x2 →0 3 Comme f est symétrique par rapport à x1 et x2 , on a évidemment aussi lim x2 →0 x1 →0 3 Il ne faut pourtant pas en déduire que limx→0 f (x1 , x2 ) = 0, car cette limite n’existe pas ! En effet, pour chaque point de la forme (x1 , x1 ) avec x1 /= x2 0, on a f (x1 , x1 ) = 2x12 = 12 et l’on en déduit aussitôt que, pour chaque 1 δ δ δ > 0, si l’on choisit x = (δ, 0) et x$ = ( 21/2 , 21/2 ), on a |x|2 = |x$ |2 = δ et |f (x) − f (x$ )| = 12 , ce qui montre que la négation de la condition nécessaire de Cauchy est satisfaite avec ! = 14 . Montrons enfin que la limite respecte les inégalités non strictes entre fonctions à valeurs réelles. Proposition. Soient f et g des fonctions de Rn dans R, a ∈ Rn , b ∈ R et c ∈ R. Si, lim f (x) = b et lim g(x) = c, x→a, x∈dom g x→a, x∈dom f et si, pour tout x ∈ dom f ∩ dom g, on a f (x) ≤ g(x), alors b ≤ c. Démonstration. On sait qu’il est équivalent de démontrer que, pour chaque ! > 0, on a b ≤ c + !. Soit donc ! > 0; par hypothèse, ! ! (∃δ $ > 0)(∀x ∈ dom f ∩ dom g : |x − a|2 ≤ δ $ ) : − ≤ f (x) − b ≤ , 2 2 et ! ! (∃δ $$ > 0)(∀x ∈ dom g ∩ dom f : |x − a|2 ≤ δ $$ ) : − ≤ g(x) − c ≤ . 2 2 Dès lors, si δ = min{δ $ , δ $$ } et si x ∈ dom f ∩ dom g est tel que |x − a|2 ≤ δ, on aura ! ! ! ! b ≤ f (x) + ≤ g(x) + ≤ c + + = c + !. 2 2 2 2 2.5. FORMULATIONS ÉQUIVALENTES ET CARACTÈRE LOCAL 59 L’exemple de la fonction réelle d’une variable réelle f définie par f (x) = qui est strictement positive sur son domaine R \ {0} et a pour limite 0 lorsque x tend vers zéro montre qu’une inégalité stricte n’est pas nécessairement conservée à la limite; seule l’inégalité non stricte correspondante est satisfaite, en vertu de la proposition que nous venons de démontrer. En considérant f |E et g|E , on voit immédiatement que tous ces résultats restent valables pour les limites lorsque x tend vers a dans E. x2 |x| 2.5 Formulations équivalentes et caractère local On va montrer que la notion de limite des valeurs de f lorsque x tend vers a peut s’exprimer en termes de voisinages. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp. Proposition. limx→a f (x) = b si et seulement si 1) a ∈ adh dom f ; 2’) (∀V : V est voisinage de b)(∃U : U est voisinage de a) : f (U ) ⊂ V. Démonstration. Condition nécessaire. Il faut montrer que la condition 2 de la définition de limite entraı̂ne la condition 2’. Soit V un voisinage de b; il existe donc ! > 0 tel que B2 [b; !] ⊂ V. Pour cet ! > 0, la condition 2 dans la définition de la limite entraı̂ne l’existence d’un δ > 0 tel que, pour tout x ∈ dom f ∩ B2 [a; δ], on ait f (x) ∈ B2 [b; !]. En d’autres termes, le voisinage U = B2 [a; δ] est tel que f (U ) ⊂ B2 [b; !] ⊂ V. Condition suffisante. Il faut montrer que si 2’ est satisfaite, il en est de même de la condition 2 de la définition de la limite. Soit donc ! > 0; comme V = B2 [b; !] est un voisinage de b, il existera par (2’) un voisinage U de a tel que f (U ) ⊂ V = B2 [b; !], c’est-à-dire tel que, pour tout x ∈ dom f ∩ U , on ait |f (x) − b|2 ≤ !. D’autre part, U étant un voisinage de a, il existe un δ > 0 tel que B2 [a; δ] ⊂ U, et on aura donc aussi |f (x) − b|2 ≤ ! pour tout x ∈ dom f tel que |x − a|2 ≤ δ. Rappelons que n’importe quelle boule Bi [a; r] est voisinage de a ∈ Rn , n’importe quelle boule Bi [b; r] est voisinage de b ∈ Rp (i = 1, 2, ∞) et que tout voisinage d’un point contient une boule en chacune des normes centrée en ce point. Une conséquence de ce fait et de la proposition précédente est évidemment que, dans la condition 2 de définition de la limite, on peut remplacer |x − a|2 par |x − a|i et |f (x) − b|2 par |f (x) − b|j pour n’importe quel choix de i, j = 1, 2 ou ∞. 60 CHAPITRE 2. LIMITES ET CONTINUITÉ Comme la notion de voisinage est liée à celle de point intérieur et que cette notion peut s’exprimer en fonction de la notion de point adhérent, on peut s’attendre à ce qu’il existe une formulation de la notion de limite en termes de points adhérents. C’est bien le cas et l’on a la caractérisation suivante, que nous n’utiliserons pas dans la suite et dont nous laissons la démonstration au lecteur, en lui suggérant de démontrer la condition suffisante par contraposition. Proposition. limx→a f (x) = b si et seulement si 1) a ∈ adh dom f ; 2”) (∀A ⊂ Rn : a ∈ adh (dom f ∩ A)) : b ∈ adh f (A). On obtient évidemment des caractérisations analogues pour la limite de f (x) lorsque x tend vers a dans E en appliquant les résultats précédents à f |E . Etudions maintenant l’influence du choix de l’ensemble de contraintes E sur l’existence de la limite. Soit f une fonction de Rn dans Rp, a ∈ Rn , b ∈ Rp et E ⊂ Rn . Le premier résultat montre que l’existence de la limite se maintient si l’on diminue E en respectant évidemment la première condition de la définition. Proposition. Si F ⊂ E et si a ∈ adh (dom f ∩ F ) et limx→a, x∈E f (x) = b, alors, limx→a, x∈F f (x) = b. Démonstration. C’est une conséquence immédiate de la définition. Un exemple antérieur a montré qu’on pouvait par contre perdre l’existence de la limite en agrandissant l’ensemble des contraintes E. On a toutefois l’importante propriété suivante, qui montre le caractère local de la notion de limite, en ce sens que l’existence et la valeur de la limite ne dépendent que des valeurs de la fonction dans un voisinage arbitrairement petit du point considéré. Proposition. Soit W un voisinage de a. Alors lim x→a, x∈E f (x) = b ⇔ lim x→a, x∈E∩W f (x) = b. Démonstration. Condition nécessaire. Puisque E ∩ W ⊂ E, il suffit, pour pouvoir appliquer la proposition précédente, de montrer que a ∈ adh (dom f ∩ E ∩ W ). Pour ce faire, soit r > 0; puisque W et B2 [a; r] sont voisinages de a, il en est de même de W ∩ B2 [a; r], et il existe donc r $ ∈ ]0, r] tel que B2 [a; r $] ⊂ W ∩ B2 [a; r]; d’autre part, puisque a ∈ adh (dom f ∩ E), on a dom f ∩ E ∩ B2 [a; r $] /= ∅ et dès lors dom f ∩ E ∩ W ∩ B2 [a; r] /= ∅. 2.5. FORMULATIONS ÉQUIVALENTES ET CARACTÈRE LOCAL 61 Condition suffisante. Bien entendu, l’hypothèse a ∈ adh (dom f ∩ E ∩ W ) entraı̂ne a ∈ adh (dom f ∩ E). Il suffit donc maintenant de démontrer la condition 2’ de la caractérisation de la limite par les voisinages. Soit V un voisinage de b; par hypothèse, il existe un voisinage U $ de a tel que f (U $ ∩ E ∩ W ) ⊂ V et, comme U $ ∩ W est un voisinage de a, il existe donc un voisinage U = U $ ∩ W de a tel que f (U ∩ E) ⊂ V . Pour une fonction f d’une variable réelle, les choix particuliers suivants pour E donnent lieu à une terminologie et à des notations particulières. Si f est une fonction de R dans Rp , a ∈ R et si E = {x ∈ R : x < a}, alors, lorsque b = limx→a, x∈E f (x), on dira que b est la limite à gauche de f (x) lorsque x tend vers a, et l’on écrira b= lim x→a, x<a f (x) ou b = lim f (x). x→a− D’une manière similaire, si E = {x ∈ R : x > a}, et b = limx→a, x∈E f (x), on dira que b est la limite à droite de f (x) lorsque x tend vers a, et l’on écrira b= lim x→a, x>a f (x) ou b = lim f (x). x→a+ La propriété d’existence de la limite lorsqu’on diminue l’ensemble des contraintes entraı̂ne aussitôt la proposition suivante. Proposition. Soit f une fonction de R dans Rp et a ∈ R. Si a ∈ adh (dom f ∩ {x ∈ R : x < a}) ∩ adh (dom f ∩ {x ∈ R : x > a}), et si limx→a, x(=a f (x) = b, alors lim f (x) = lim f (x) = b. x→a− x→a+ La réciproque est vraie dans le sens suivant. Proposition. Soit f une fonction de R dans Rp et a ∈ R. Si lim f (x) = lim f (x) = b, x→a− x→a+ alors limx→a, x(=a f (x) = b. Démonstration. Comme, par hypothèse, on a a ∈ adh (dom f ∩ {x ∈ R : x < a}) ∩ adh (dom f ∩ {x ∈ R : x > a}), 62 CHAPITRE 2. LIMITES ET CONTINUITÉ on a évidemment que a ∈ adh [dom f ∩ (R \ {a})]. Soit ! > 0; par hypothèse, (∃δ $ > 0)(∀x ∈ dom f : a − δ $ ≤ x < a) : |f (x) − b|2 ≤ !, et (∃δ $$ > 0)(∀x ∈ dom f : a < x ≤ a + δ $$ ) : |f (x) − b|2 ≤ !. Dès lors, si δ = min{δ $ , δ $$}, et si x ∈ dom f \ {a} est tel que |x − a| ≤ δ, on aura |f (x) − b|2 ≤ !. 2.6 Limites à l’infini et convergence des suites Introduisons d’abord la notion de partie bornée de Rn . Définition. On dit qu’une partie A de Rn est bornée s’il existe un r > 0 tel que A ⊂ B2 [r]. On montre sans peine que A est bornée si et seulement s’il existe un r > 0 tel que A ⊂ Bi [r] pour i = 1, 2 ou ∞. L’ensemble vide est borné et toute boule est bornée. En outre, il est évident que si A est bornée et si B ⊂ A, alors B est bornée. La définition entraı̂ne aussi que A ⊂ Rn est non bornée si et seulement si, pour tout r > 0, on a A /⊂ B2 [r], ou encore si et seulement si, (∀r > 0)(∃x ∈ A) : |x|2 > r. En particulier, le théorème d’Archimède entraı̂ne que N∗ est non borné puisque, si r > 0 est donné, il existe un m ∈ N∗ tel que m = m.1 ≥ r + 1, et dès lors ce m /∈ B[r] = [−r, r]. D’autre part, si A est non borné et B ⊃ A, B est non borné (par contraposition du résultat ci-dessus), et l’on en déduit que Rn est une partie non bornée de Rn et que R, Q, Z et N sont des parties non bornées de R. L’exemple de la fonction f de Rn dans R définie par f (x) = |x|1 2 pour chaque x /= 0 montre que la propriété “prendre la valeur zéro” est vérifiée “approximativement” au sens donné dans l’introduction de la notion de limite non pas pour des valeurs suffisamment proches d’un point a de Rn mais pour les points de Rn de norme suffisamment grande. En effet, si ! > 0 est donné, on aura |f (x)| = |x|1 2 ≤ ! dès que |x|2 ≥ 1! . On est ainsi conduit à la définition suivante de limite à l’infini pour une fonction. Définition. Soit f une fonction de Rn dans Rp et b ∈ Rp. On dit que f (x) tend vers b lorsque x tend vers l’infini, et l’on écrit f (x) → b si x → ∞, 2.6. LIMITES À L’INFINI ET CONVERGENCE DES SUITES 63 si les conditions suivantes sont satisfaites : 1) dom f est non borné; 2) (∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !. Comme dans le cas classique, on démontre qu’il existe au plus un b vérifiant cette définition (on écrit alors b = lim f (x)) x→∞ et que la condition de Cauchy (∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) (∀x$ ∈ dom f : |x$ |2 ≥ ρ) : |f (x) − f (x$ )|2 ≤ !, est une condition nécessaire d’existence de la limite de f pour x tendant vers l’infini. Une condition nécessaire pour la condition de Cauchy soit vérifiée, et qui se démontre comme dans le cas classique, est que f soit bornée à l’infini au sens de la définition suivante. Définition. Soit f une fonction de Rn dans Rp . On dit que f est bornée à l’infini si dom f est non borné et si la condition suivante est vérifiée: (∃r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x)|2 ≤ r. Enfin, les règles de calcul des limites s’étendent aussi, avec des démonstrations analogues, à la limite à l’infini. Si E est une partie de Rn , alors, en appliquant la définition ci-dessus à f |E , on obtient immédiatement la notion de limite des valeurs de f (x) lorsque x tend vers l’infini dans E. Définition. Soit f une fonction de Rn dans Rp , b ∈ Rp et E ⊂ Rn . On dit que f (x) tend vers b lorsque x tend vers l’infini dans E, et l’on écrit f (x) → b si x → ∞ dans E, si les conditions suivantes sont satisfaites : 1) dom f ∩ E est non borné; 2) (∀! > 0)(∃ρ > 0)(∀x ∈ dom f ∩ E : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !. Lorsque f est une fonction d’une variable réelle, des choix particuliers de E bénéficient d’une terminologie et de notations spéciales. Ainsi, lorsque E = R+ (resp. E = R− ) et que lim x→∞, x∈R+ f (x) = b, (resp. lim x→∞, x∈R− f (x) = b), 64 CHAPITRE 2. LIMITES ET CONTINUITÉ on dit que f (x) tend vers b lorsque x tend vers plus l’infini (resp. moins l’infini), et l’on écrit lim f (x) = b, (resp. x→+∞ lim f (x) = b). x→−∞ Ces notions correspondent donc respectivement aux conditions (∀! > 0)(∃ρ > 0)(∀x ∈ dom f : x ≥ ρ) : |f (x) − b|2 ≤ !, et (∀! > 0)(∃ρ > 0)(∀x ∈ dom f : x ≤ −ρ) : |f (x) − b|2 ≤ !. x Exemple. Soit f l’application de R dans R définie par f (x) = 1+|x| . Si x 1 ! > 0 est donné, alors, pour x ≥ 0, |f (x) − 1| = | 1+x − 1| = 1+x ≤ ! dès que x ≥ 1! − 1. On voit donc que limx→+∞ f (x) = 1. On montre de même que limx→−∞ f (x) = −1. D’autre part, pour chaque ρ > 0, on a # # # ρ −ρ ## 2ρ # |f (ρ) − f (−ρ)| = # = − >1 # 1+ρ 1+ρ 1+ρ si ρ > 1. On en déduit aisément que la condition nécessaire de Cauchy d’existence de limx→∞ f (x) n’est pas satisfaite et que cette dernière limite n’existe pas. Les notions que nous venons de développer s’appliquent évidemment dans le cas particulier d’une suite (ak )k∈N dans Rp , c’est-à-dire d’une application de N (ou de N∗ ) dans Rp. Si b ∈ Rp alors b = limk→∞ ak si et seulement si (∀! > 0)(∃ρ > 0)(∀k ∈ N : k ≥ ρ) : |ak − b|2 ≤ !. Etant donné que, pour chaque ρ > 0, le théorème d’Archimède affirme l’existence d’un entier naturel m ≥ ρ, il est clair que la condition précédente est équivalente à la condition (∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |ak − b|2 ≤ !, plus couramment utilisée pour caractériser la limite d’une suite. On vérifie immédiatement à partir de cette définition que, si q ∈ N est fixé, alors lim ak = b ⇔ lim aq+k = b, k→∞ k→∞ ce qui traduit simplement le fait qu’on peut ignorer les q premiers termes d’une suite sans modifier l’existence et la valeur de sa limite. Lorsque la 2.6. LIMITES À L’INFINI ET CONVERGENCE DES SUITES 65 limite de (ak )k∈N existe, on dit aussi que la suite (ak )k∈N converge ou est une suite convergente; sinon on dit qu’elle diverge ou est une suite divergente. Les points ak de Rp sont souvent appelés les termes de la suite. Exemple. La suite ( k1 )k∈N∗ converge vers zéro et la suite ((−1)k )k∈N diverge. On le vérifiera comme exercice. La condition nécessaire de Cauchy peut s’écrire, dans le cas d’une suite (ak )k∈N dans Rp sous la forme équivalence (∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |ak − aq |2 ≤ !. Les règles de calcul des limites s’appliquent évidemment au cas particulier des suites. On peut caractériser la notion de point adhérent à une partie de Rn en termes de la notion de convergence d’une suite. Proposition. Soit a ∈ Rn et E une partie de Rn . Alors a est adhérent à E si et seulement s’il existe une suite (xk )k∈N dans E qui converge vers a. Démonstration. Condition nécessaire. Soit a adhérent à E; alors, pour 1 chaque k ∈ N, on a E ∩ B2 [a; k+1 ] /= ∅; on d’autres termes, pour chaque 1 k ∈ N, il existe un xk ∈ E ∩ B2 [a; k+1 ], c’est-à-dire un xk ∈ E tel que 1 |xk − a|2 ≤ k+1 . Cette dernière condition entraı̂ne aussitôt que la suite (xk )k∈N converge vers a. Condition suffisante. Soit (xk )k∈N une suite dans E qui converge vers a. En conséquence, si r > 0 est donné, (∃m ∈ N)(∀k ∈ N : k ≥ m) : |xk − a|2 ≤ r, et dès lors, xm ∈ E ∩ B2 [a; r]. Donc a ∈ adh E. On peut également caractériser en termes de suite la notion de limite en un point des valeurs d’une fonction. Proposition. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp . Alors, limx→a f (x) = b si et seulement si les deux conditions suivantes sont satisfaites : 1) a ∈ adh dom f ; 2) toute suite (xk )k∈N dans dom f qui converge vers a, a pour image une suite (f (xk ))k∈N qui converge vers b. Démonstration. Condition nécessaire. Soit (xk )k∈N une suite dans dom f qui converge vers a. Si l’on désigne par h : N → Rn , k 2→ xk , l’application correspondante, on voit que, pour chaque k ∈ N, f (xk ) = 66 CHAPITRE 2. LIMITES ET CONTINUITÉ (f ◦ h)(k), dom (f ◦ h) = N, et il suffit d’appliquer le théorème de la limite d’une fonction composée. Condition suffisante. On démontre le contraposé. Si b n’est pas limite de f (x) lorsque x tend vers a, alors (∃! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 > !. 1 En choisissant successivement δ = k+1 pour chaque k ∈ N, on trouve ainsi 1 un xk ∈ dom f tel que |xk − a|2 ≤ k+1 et |f (xk ) − b|2 > !. En conséquence, la suite (xk )k∈N ainsi obtenue est une suite dans dom f qui converge vers a et est telle que f (xk )k∈N ne converge pas vers b. La forme contraposée de cette caractérisation de la limite des valeurs d’une fonction est souvent utile pour montrer que la limite n’est pas égale à b : il suffira de trouver une suite (xk )k∈N dans dom f qui converge vers a et soit telle que la suite f (xk )k∈N ne converge pas vers b. On en déduit également un moyen utile pour prouver la non-existence de la limite : il suffira de trouver une suite (xk )k∈N dans dom f qui converge vers a et soit telle que la suite f (xk )k∈N converge vers b$ et une suite (x$k )k∈N dans dom f qui converge vers a et soit telle que la suite f (x$k )k∈N converge vers b$$ /= b$ . En appliquant le résultat précédent à f |E , on obtient une caractérisation en termes de suites de la limite de f (x) lorsque x tend vers a dans E. 2.7 Limites infinies Soit f une fonction de Rn dans R et a ∈ adh dom f. Nous allons analyser la situation dans laquelle la limite de f (x) lorsque x tend vers a n’existe pas parce que |f (x)|2 prend des valeurs arbitrairement grandes lorsque x est suffisamment proche de a. Par abus de langage, on parle alors d’existence d’une limite infinie pour f . Définition. Soit f une fonction de Rn dans Rp et a ∈ Rn . On dit que f (x) tend vers l’infini lorsque x tend vers a, et l’on écrit lim f (x) = ∞, x→a si les conditions suivantes sont réalisées. 1. a ∈ adh dom f. 2. (∀r > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 ≥ r. Par exemple, la fonction f : x 2→ |x|−1 2 est telle que limx→0 f (x) = ∞, puisque, si r > 0 est donné, on a |x|−1 ≥ r dès que 0 < |x|2 ≤ r −1 . 2 On a une notion semblable lorsque x tend vers l’infini. 67 2.7. LIMITES INFINIES Définition. Soit f une fonction de Rn dans Rp . On dit que f (x) tend vers l’infini lorsque x tend vers l’infini, et l’on écrit lim f (x) = ∞, x→∞ si les conditions suivantes sont réalisées. 1. dom f est non borné. 2. (∀r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x)|2 ≥ r. Par exemple, la fonction identité sur Rn tend vers l’infini lorsque x tend vers l’infini. On montre facilement que les définitions ci-dessus ne dépendent pas du choix de la norme |·|2 et qu’on peut utiliser n’importe quelle autre norme. Si E est une partie de Rn , on obtient évidemment les situations correspondantes lorsque x tend vers a dans E ou lorsque x tend vers l’infini dans E en appliquant les définitions ci-dessus à la restriction f |E de f à E. Cela revient, dans les définitions ci-dessus, à remplacer partout dom f par dom f ∩ E. Dans le cas particulier où p = 1, on utilise la structure d’ordre sur R pour introduire les situations suivantes. Définition. Soit f une fonction de Rn dans R et a ∈ Rn . On dit que f (x) tend vers +∞ (resp. −∞) lorsque x tend vers a, et l’on écrit lim f (x) = +∞ (resp. lim f (x) = −∞), x→a x→a si les conditions suivantes sont vérifiées. 1. a ∈ adh dom f. 2. (∀r > 0)(∃δ > 0)(∀x ∈ dom f : |x−a|2 ≤ δ) : f (x) ≥ r (resp. f (x) ≤ −r). Définition. Soit f une fonction de Rn dans R. On dit que f (x) tend vers +∞ (resp. −∞) lorsque x tend vers l’infini, et l’on écrit lim f (x) = +∞ (resp. lim f (x) = −∞), x→∞ x→∞ si les conditions suivantes sont vérifiées. 1. dom f est non borné. 2. (∀r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : f (x) ≥ r (resp. f (x) ≤ −r). On a bien entendu des définitions analogues pour x tendant vers a ou vers l’infini dans E ⊂ Rn en appliquant ces définitions à f |E . Insistons sur le fait que ces définitions couvrent des situations où la limite n’existe pas. Les conditions nécessaires d’existence de la limite et les règles 68 CHAPITRE 2. LIMITES ET CONTINUITÉ de calcul des limites n’ont donc aucune raison de s’appliquer, et il est facile de le montrer par des exemples. D’ailleurs les énoncés correspondants n’ont eux-mêmes souvent aucun sens. Il convient donc de traiter ces notions avec prudence en retournant aux définitions. La notion de limite infinie fournit toutefois des compléments d’information sur les limites de quotients de fonctions dans des situations où les règles de calcul classiques ne s’appliquent pas. Nous les formulons dans le cas où x tend vers a. On a des résultats entièrement analogues lorsque x tend vers l’infini, dont les énoncés et les démonstrations sont laissés au lecteur. Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction de Rn dans R (resp. C) et a ∈ adh (dom f ∩ dom 1/g). Si lim g(x) = 0 x→a et s’il existe δ1 > 0 et η1 > 0 tels que |f (x)|2 ≥ η1 pour tout x ∈ dom f ∩ B2 [a; δ1 ], (ce qui est le cas si limx→a f (x) = b /= 0), alors lim x→a f (x) = ∞. g Démonstration. Soit r > 0; et soient δ1 et η1 donnés par les hypothèses. Puisque g(x) tend vers 0 lorsque x tend vers a, il existera δ2 > 0 tel que, pour tout x ∈ dom g ∩ B2 [a; δ2 ], on a |g(x)| ≤ ηr1 . Dès lors, si δ = min{δ1 , δ2 } et si x ∈ dom f ∩ dom 1/g ∩ B2 [a; δ], on aura # # #f # # (x)# = |f (x)|2 ≥ η1 r = r. #g # |g(x)| η1 2 Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction de Rn dans R (resp. C) et a ∈ adh dom f ∩ dom g. Si lim g(x) = ∞ x→a et si f est localement bornée en a, (ce qui est le cas si limx→a f (x) existe), alors f lim (x) = 0. x→a g Démonstration. Notons tout d’abord qu’on montre facilement, comme dans le cas classique de la limite d’un quotient, que a ∈ adh dom fg , en 2.8. CONTINUITÉ D’UNE FONCTION EN UN POINT 69 montrant que g ne s’annule pas suffisamment près de a. Par l’hypothèse sur f , il existe δ1 > 0 et r1 > 0 tels que, pour tout x ∈ dom f ∩ B2 [a; δ1 ], on a |f (x)|2 ≤ r1 . Soit ! > 0; l’hypothèse sur g entraı̂ne l’existence d’un δ2 > 0 tel que, pour tout x ∈ dom g ∩ B2 [a; δ2 ], on a |g(x)| ≥ r!1 . En conséquence, si δ = min{δ1 , δ2 }, on aura, pour tout x ∈ dom fg tel que |x − a|2 ≤ δ, : # # #f # # (x)# = |f (x)|2 ≤ r1 ! = !. #g # |g(x)| r1 2 La notion de limite infinie fournit également, par une démonstration entièrement analogue à celle du cas classique, une caractérisation en termes de suites de l’existence de la limite limite de f (x) lorsque x tend vers l’infini. Proposition. Soit f une fonction de Rn dans Rp telle que dom f soit non borné et soit b ∈ Rp . Alors, limx→∞ f (x) = b si et seulement si, pour toute suite (xk )k∈N dans dom f telle que xk → ∞ si k → ∞, la suite (f (xk ))k∈N converge vers b. 2.8 Continuité d’une fonction en un point Soit f une fonction de Rn dans Rp; nous allons maintenant étudier le problème de la limite de ses valeurs en un point a appartenant au domaine de f . Dans ce cas, l’existence de la limite lorsque x tend vers a se ramène à la vérification de la deuxième condition. Si cette deuxième condition est vérifiée, on dira que f est continue en a; si elle ne l’est pas, on dira que f est discontinue en a. En d’autres termes, on a la définition suivante. Définition. Soit f une fonction de Rn dans Rp et a ∈ dom f . On dit que f est continue au point a si limx→a f (x) existe et que f est discontinue au point a si limx→a f (x) n’existe pas. Bien entendu, dans l’expression d’existence de la limite, on pourra utiliser n’importe laquelle des formulations équivalentes. On a l’utile propriété suivante. Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Alors f est continue en a si et seulement si limx→a f (x) = f (a). Démonstration. Condition nécessaire. Soit b = limx→a f (x). Par la caractérisation de la limite en termes de suites, si on prend la suite constante 70 CHAPITRE 2. LIMITES ET CONTINUITÉ (xk )k∈N définie par xk = a pour chaque k ∈ N, on obtient une suite dans dom f convergeant vers a et dès lors la suite (constante) (f (xk ))k∈N égale pour tout k ∈ N à f (a) convergera vers b; mais sa limite est évidemment f (a), ce qui entraı̂ne que f (a) = b. Condition suffisante. Elle est évidente. Cette proposition montre qu’en un point de continuité d’une fonction, il suffit simplement, pour obtenir la limite, de calculer la valeur de la fonction en ce point. On pourra donc gagner beaucoup de temps, dans le calcul des limites, en identifiant rapidement les points de continuité d’une fonction. Il existe une condition sur a et dom f qui assure toujours la continuité de f en a. Définition. Si E ⊂ Rn et si a ∈ E, on dit que a est un point isolé de E s’il existe r > 0 tel que B2 [a; r] ∩ E = {a}. En d’autres termes, a est isolé dans E si et seulement s’il existe un r > 0 tel que B2 [a; r] ∩ (E \ {a}) = ∅ c’est-à-dire si et seulement si a n’est pas adhérent à E \ {a}. Proposition. Si f est une fonction de Rn dans Rp et si a est isolé dans dom f , alors f est continue en a. Démonstration. Soit r > 0 tel que B2 [a; r] ∩ dom f = {a}. Si ! > 0 est donné, alors, {x ∈ dom f : x ∈ B2 [a; r]} = {a}, et évidemment, |f (a) − f (a)|2 = 0 ≤ !. Considérons maintenant le cas d’un point non isolé du domaine. Proposition. Soit f une fonction de Rn dans Rp et a un point non isolé de dom f . Alors lim f (x) = f (a) ⇔ x→a lim x→a, x(=a f (x) = f (a). Démonstration. Condition nécessaire. Elle est évidente puisque, par hypothèse, a ∈ adh (dom f \ {a}). Condition suffisante. Soit ! > 0; par hypothèse, (∃δ > 0)(∀x ∈ dom f \ {a} : |x − a|2 ≤ δ) : |f (x) − f (a)|2 ≤ !. Comme on a évidemment |f (a)−f (a)|2 = 0 ≤ !, la thèse s’en déduit aussitôt. 2.8. CONTINUITÉ D’UNE FONCTION EN UN POINT 71 Exemples. 1. Toute fonction constante de Rn dans Rp est continue en chaque point de son domaine et l’application identité I de Rn dans Rn est continue en chaque point de Rn (vérification immédiate). 2. Si i = 1, 2 ou ∞, l’application | · |i de Rn dans R est continue en chaque point de Rn ; on effet, si a ∈ Rn on a, pour chaque x ∈ Rn , ||x|i − |a|i| ≤ |x − a|i , et le résultat s’en déduit aussitôt en prenant δ = ! dans la définition. 3. La fonction de Dirichlet est l’application de R dans R définie par d(x) = 1 si x est rationnel et d(x) = 0 si x est irrationnel. Cette fonction n’est continue en aucun point de R. On le montre en utilisant la condition de non existence de la limite déduite de la condition nécessaire de Cauchy. Si a ∈ R et si δ > 0 est donné, on a vu que l’intervalle [a−δ, a+δ] contient au moins un rationnel x et un irrationnel x$ ; on a donc |d(x) − d(x$ )| = 1 et il suffit de prendre ! = 12 dans la négation de la condition de Cauchy. 4. L’application f de R dans R définie par f (x) = x si x est rationnel et f (x) = −x si x est irrationnel est continue en 0 (le vérifier) mais n’est continue en aucun autre point de R. En effet, si, pour fixer les idées, a > 0, alors, pour chaque δ > 0, l’intervalle [a, a + δ] contient un rationnel x et un irrationnel x$ ; ils sont tels que |f (x) − f (x$ )| = |x + x$ | = x + x$ ≥ 2a > a, et la négation de la condition de Cauchy est vérifiée avec ! = a. Le cas où a < 0 se traite de même et est laissé au lecteur. 5. La fonction racine carrée arithmétique qui à chaque réel positif associe sa racine carrée arithmétique est continue en chaque point de R+ . En effet, si √ ! > 0 est donné, on a, en a = 0, x ≤ ! pour tout 0 ≤ x ≤ !2 , et, en a > 0, on a, pour tout x ≥ 0, # # # x−a # √ √ |x − a| √ ## ≤ √ , | x − a| = ## √ x+ a a √ et la dernière expression sera inférieure à ! si |x − a| ≤ a!. On peut maintenant utiliser les règles de calcul sur les limites pour en déduire immédiatement des résultats de continuité. Proposition. 1. Si f et g sont des fonctions de Rn dans Rp continues en a, alors f + g est continue en a. 2. Si f est une fonction de Rn dans Rp (resp. C) continue en a et g une 72 CHAPITRE 2. LIMITES ET CONTINUITÉ fonction de Rn dans R (resp. C) continue en a, alors gf est continue en a et si, en outre, g(a) /= 0, fg est continue en a. 3. Si f est une fonction de Rn dans Rp continue en a et g une fonction de Rp dans Rq continue en f (a), alors g ◦ f est continue en a. Démonstration. Les propriétés 1 et 2 sont des conséquences immédiates des définitions et des propriétés des limites. Pour la propriété 3, il suffit, pour appliquer le théorème sur les limites, de noter que a ∈ dom (g ◦ f ). En combinant cette proposition avec les exemples simples d’applications continues déjà donnés, on voit que les applications polynômiales (et en particulier linéaires) de Rn dans Rp sont continues en chaque point de Rn et que les fonctions rationnelles de Rn dans Rp (c’est-à-dire les fonctions qui peuvent s’écrire comme quotient d’un polynôme de Rn dans Rp (resp. C) par un polynôme de Rn dans R (resp. C)) sont continues en chaque point de Rn où leur dénominateur est différent de zéro. 2.9 Applications linéaires Approfondissons les propriétés de continuité des applications linéaires. Rappelons qu’une application linéaire de Rn dans Rp est une application L de Rn dans Rp telle que : 1. (∀x ∈ Rn )(∀y ∈ Rn ) : L(x + y) = L(x) + L(y). 2. (∀c ∈ R)(∀x ∈ Rn ) : L(cx) = cL(x). On en déduit aussitôt que, pour tout x ∈ Rn , on a L(x) = L( n $ xj ej ) = j=1 n $ L(xj ej ) = j=1 n $ xj L(ej ). (2.6) j=1 Réciproquement, si c1 , . . . , cn sont des éléments donnés de Rp , l’application L de Rn dans Rp définie pour chaque x ∈ Rn par L(x) = n $ (2.7) xj c j , j=1 sera telle que, pour tout x ∈ Rn , tout y ∈ Rn et tout c ∈ R, on ait L(x + y) = n $ j=1 (x + y)j cj = n $ j=1 (xj + yj )cj = n $ j=1 xj c j + n $ j=1 yj cj = L(x) + L(y), 73 2.9. APPLICATIONS LINÉAIRES L(cx) = n $ (cx)j cj = j=1 n $ n $ cxj cj = c j=1 xj cj = cL(x), j=1 et sera donc linéaire. En conséquence, toute application linéaire de Rn dans Rp est de la forme (2.7) avec cj = L(ej ), (1 ≤ j ≤ n). Les éléments cj = L(ej ) s’appellent les coefficients de L dans la base canonique. Leurs composantes Lk (ej ) = pk (L(ej )), (1 ≤ j ≤ n, 1 ≤ k ≤ p) définissent une matrice qui représente l’application linéaire dans la base canonique. Ainsi, la donnée d’une application linéaire de Rn dans Rp revient à la donnnée de n éléments de Rp, c’est-à-dire de np réels. En particulier, la donnée d’une application linéaire de Rn dans R revient à la donnée de n réels ou encore d’un élément de Rn et celle d’une application linéaire de R dans Rp revient à la donnée d’un élément de Rp . On notera aussi que L est l’application nulle si et seulement si tous les cj sont nuls. Exemple. Pour chaque 1 ≤ k ≤ n, l’application pk : x 2→ xk (projection sur la ke composante) est une application linéaire de Rn dans R. Le résultat suivant est la clef de l’étude des propriétés de continuité d’une application linéaire. Proposition. Soit k = 1, 2 ou ∞ et L une application linéaire de Rn dans Rp . Pour tout x ∈ Rn et (i, j) = (1, ∞), (2, 2) ou (∞, 1), on a où |L|k,i |L(x)|k ≤ |L|k,i|x|j , # # = #(|L(e1 )|k , . . . , |L(en)|k )#i . Démonstration. On a, pour chaque x ∈ Rn , en utilisant (2.6), |L(x)|k ≤ et dès lors, |L(x)|k ≤ n $ j=1 n $ j=1 |xj L(ej )|k = n $ j=1 |L(e )|k max{|x1 |, . . . , |xn|} = |L|k,1 |x|∞ , j |L(x)|k ≤ max{|L(e1 )|k , . . . , |L(en)|k } et, en utilisant l’inégalité de Cauchy, |L(x)|k ≤ |xj ||L(ej )|k n $ j=1 1/2 |L(ej )|2k n $ j=1 n $ j=1 |xj | = |L|k,∞ |x|1 , 1/2 x2j = |L|k,2 |x|2 . 74 CHAPITRE 2. LIMITES ET CONTINUITÉ Corollaire. Si L est une application linéaire de Rn dans Rp, alors, pour chaque i = 1, 2 ou ∞ et pour tout x ∈ Rn et tout y ∈ Rn , on a (2.8) |L(x) − L(y)|i ≤ |L|i,j |x − y|i , et en particulier L est continue en chaque point de Rn et les fonctions x 2→ L(x) |x|i sont localement bornées en 0. Démonstration. Le cas de l’application nulle est évident. Sinon, soit i = 1, 2 ou ∞, x ∈ Rn et y ∈ Rn ; par la proposition précédente et la linéarité de L, on a |L(x) − L(y)|i = |L(x − y)|i ≤ |L|i,j |x − y|i , et la continuité en y s’en déduit aussitôt en prenant, # # dans la définition, si # L(x) # ! ! > 0 est donné, δ = |L|i,i . Enfin, si x /= 0, on a # |x|i # ≤ |L|i,i, ce qui montre i que la fonction x 2→ L(x) |x|i est localement bornée en 0 (elle l’est évidemment aux autres points puisqu’elle y est continue). Terminons par quelques remarques sur les applications linéaires de C dans C. Rappelons que C peut être considéré comme un espace vectoriel sur R (c’est alors essentiellement R2 ) et comme un espace vectoriel sur C. Dès lors, nous dirons qu’une application L de C dans C est R-linéaire (resp. Clinéaire) si elle est linéaire comme application de C dans C où C est considéré comme espace vectoriel sur R (resp. C.) Ainsi donc, L sera R-linéaire si et seulement si, pour tout x ∈ C, tout y ∈ C et tout c ∈ R, on a L(x + y) = L(x) + L(y), L(cx) = cL(x), et L sera C-linéaire si et seulement si, pour tout x ∈ C, tout y ∈ C et tout c ∈ C, on a L(x + y) = L(x) + L(y), L(cx) = cL(x). Comme R est canoniquement injecté dans C, on en déduit aussitôt que toute application C-linéaire de C dans C est R-linéaire. La réciproque n’est pas vraie. En effet, l’application de conjugaison C : C → C, z 2→ z̄ est évidemment R-linéaire puisque, pour chaque z ∈ C et chaque v ∈ C, on a C(z + v) = z + v = z̄ + v̄ = C(z) + C(v), et, pour chaque c ∈ R et chaque z ∈ C, on a C(cz) = cz = cz̄ = cC(z). 75 2.10. EXERCICES Mais elle n’est pas C-linéaire puisque C(i.1) = C(i) = ī = −i /= i.1. En fait, si L est C-linéaire, alors, pour tout z = x1 + ix2 ∈ C, on a L(z) = L(z.1) = z.L(1) = x1 L(1) + x2 (iL(1)) = x1 L(e1 ) + x2 L(e2 ), ce qui montre que les coefficients L(ej ) de L vérifient la relation L(e2 ) = iL(e1 ), ou encore, en posant L(ej ) = L1 (ej ) + iL2 (ej ), si et seulement si les coefficients Lk (ej ) vérifient les relations L2 (e2 ) = L1 (e1 ), L1 (e2 ) = −L2 (e1 ). En d’autres termes, la matrice représentant L dans la base canonique doit avoir ses éléments diagonaux égaux et ses éléments hors diagonale opposés. On montre facilement que si une application R-linéaire de C dans C vérifie ces conditions, elle est également C-linéaire. 2.10 Exercices 1. Pour chaque nombre rationnel x, il existe un et un seul couple d’entiers (m, n) tels que n > 0, m et n soient premiers entre eux et x = m n (représentation irréductible de x). Si l’on définit l’application f de R dans R par f (x) = n si x est rationnel de représentation irréductible m n , et f (x) = 0 si x est irrationnel, montrer que f n’est localement bornée en aucun point de R. (Raisonner par l’absurde). 2. On définit la suite de Fibonacci (uk )k∈N par u0 = u1 = 1 et uk+2 = uk+1 + uk , pour k ≥ 0. Ainsi, u2 = 2, u3 = 3, u4 = 5, u5 = 8, . . . . On définit la suite u (vk )k∈N par vk = uk+1 . Montrer que, pour tout k ≥ 1, on a vk > 1 et que, k pour tout k ≥ 0, on a 1 vk+1 = 1 + . vk En déduire que, si la suite (vk )k∈N converge vers v ∗ , alors v ∗ est la racine positive de l’équation algébrique v 2 − v − 1 = 0, 76 CHAPITRE 2. LIMITES ET CONTINUITÉ c’est-à-dire √ 1+ 5 v = = 1, 618 . . .. 2 Cette quantité est appelée le nombre d’or. Montrer que, pour tout k ≥ 1, on a |vk − v ∗ | |vk+1 − v ∗ | ≤ , v∗ et dès lors |v1 − v ∗ | |vk+1 − v ∗ | ≤ . (v ∗ )k ∗ En déduire que (vk )k∈N converge vers v ∗ . 3. Si p ≥ 1 est un réel et si x ∈ Rn , on définit |x|p par |x|p = p $ j=1 Montrer que 1/p |xj |p . |x|∞ = lim |x|p, p→∞ ce qui “justifie” la notation utilisée pour la norme |x|∞ . Pour ce faire, on utilisera les inégalités suivantes, qui sont faciles à démontrer |x|p ≤ n1/p |x|∞, |x|∞ ≤ |x|p. 4. Si d est la fonction de Dirichlet, montrer que, pour chaque a ∈ R, on a lim x→a; x∈Q d(x) = 1, lim x→a; x∈R\Q d(x) = 0. En déduire que d n’est pas continue en a. 5. Soit f l’application de R dans R définie par f (x) = x si x est rationnel et f (x) = −x si x est irrationnel. Montrer que f est continue en a si et seulement si a = 0. La fonction f n’est donc continue qu’à l’origine. Par contre, on a, pour tout x ∈ R, (f ◦ f )(x) = x, qui est continue en chaque point de R. 6. Si l’on définit l’application g de R dans R par g(x) = n1 si x est rationnel de représentation irréductible m n , et g(x) = 0 si x est irrationnel, montrer que g est continue en chaque point irrationnel et discontinue en chaque point rationnel. En utilisant le théorème de Baire démontré au chapitre 17, on peut prouver qu’il n’existe pas de fonction de R dans R qui est discontinue en chaque point irrationnel et continue en chaque point rationnel. 77 2.11. PETITE ANTHOLOGIE 7. Soit f l’application de R2 dans R définie par f (0, 0) = 0 et f (x, y) = x2 xy si (x, y) /= (0, 0). + y2 Montrer que cette fonction n’est pas continue en (0, 0) mais que les fonctions x 2→ f (x, 0) et y 2→ f (0, y) sont continues en 0. 8. Soit (ak )k∈N∗ une suite dans Rp. Montrer que si limk→∞ ak = a, alors lim n→∞ %n k=1 ak n = a. Suggestion. Soit ! > 0; il existe m$ ∈ N∗ tel que, pour tout k ≥ m$ , on a |ak − a|2 ≤ 2! . Si n ≥ m$ , alors # # %m" −1 %n # %n # n #$ # k=1 ak # ak − a ## " |ak − a|2 # k=1 |ak − a|2 # # − a# = # + k=m # ≤ # # # n n n n 2 k=1 ≤ %m" −1 k=1 2 |ak − a|2 n − m$ + 1 ! + ≤ n n 2 %m" −1 %m" −1 k=1 |ak − a|2 ! + . n 2 |ak −a|2 Prendre alors m ≥ m tel que k=1 n ≤ 2! lorsque n ≥ m. La réciproque est fausse, comme le montre l’exemple de ak = (−1)k . $ 2.11 Petite anthologie Limites On dit qu’une grandeur est la limite d’une autre grandeur, quand la seconde peut approcher de la première plus près que d’une grandeur donnée, si petite qu’on la puisse supposer, sans pourtant que la grandeur, qui approche, puisse jamais surpasser la grandeur dont elle approche; en sorte que la différence d’une pareille quantité à sa limite est absolument inassignable. Jean le Rond d’Alembert, 1752 Si une quantité variable susceptible de limite, jouit d’une certaine propriété, sa limite jouit de la même propriété. Simon Lhuilier, 1786 78 CHAPITRE 2. LIMITES ET CONTINUITÉ Quand les valeurs successivement attribuées à une variable s’approchent indéfiniment d’une valeur fixée, de manière à finir par en différer aussi peu que l’on voudra, cette dernière est appelée la limite de toutes les autres. Lorsque les valeurs numériques successives d’une même variable décroissent indéfiniment, de manière à s’abaisser au-dessous de tout nombre donné, cette variable devient ce qu’on nomme un infiniment petit ou une quantité infiniment petite. Augustin Cauchy, 1821 Limites infinies Lorsque les valeurs numériques successives d’une même variable croissent de plus en plus, de manière à s’élever au-dessus de tout nombre donné, on dit que cette variable a pour limite l’infini positif, indiqué par le signe ∞, s’il s’agit d’une variable positive, et l’infini négatif, indiqué par la notation −∞, s’il s’agit d’une variable négative. Les infinis positif et négatif sont désignés conjointement sous le nom de quantités infinies. Augustin Cauchy, 1821 Je proteste contre l’usage de la grandeur infinie comme quelque chose d’achevé, ce qui n’est jamais admissible en mathématiques. L’infini est purement une manière de parler; son vrai sens est une limite de laquelle certains rapports s’approchent indéfiniment, tandis que d’autres peuvent croı̂tre sans restriction. Carl-Friedrichs Gauss, 1831 Continuité Les fonctions continues sont celles dont la nature est définie par une relation précise entre les coordonnées exprimée par une équation; en sorte que tous ses points soient déterminés par une même équation, comme par une loi. Leonhard Euler, 1767 La loi de continuité consiste en ce qu’une quantité ne peut pas passer d’un état à un autre sans passer par tous les états intermédiaires qui sont sujets à la même loi. Les fonctions algébriques sont considérées comme continues parce que les différentes valeurs de ces fonctions dépendent de 2.11. PETITE ANTHOLOGIE 79 la même manière de celles de la variable; et supposant que la variable croı̂t continûment, la fonction recevra des variations correspondantes; mais elle ne passera pas d’une valeur à une autre sans passer aussi par toutes les valeurs intermédiaires. La continuité peut être détruite de deux manières : (1) La fonction peut changer de forme, c’est-à-dire la loi par laquelle la fonction dépend de la variable peut changer tout d’un coup. (2) La loi de continuité est aussi brisée quand les différentes parties d’une courbe ne tiennent pas les unes aux autres. Louis François Arbogast, 1791 En considérant la courbe dont i serait l’abscisse et l’une de ces fonctions l’ordonnée, cette courbe coupera l’axe à l’origine des abscisses et ... le cours de la courbe sera nécessairement continu depuis ce point; donc elle s’approchera peu à peu de l’axe avant de le couper et s’en approchera, par conséquent, d’une quantité moindre qu’aucune quantité donnée, de sorte qu’on pourra toujours trouver une abscisse i correspondant à une ordonnée moindre qu’une quantité donnée, et alors toute valeur plus petite de i répondra aussi à des ordonnées moindres que la quantité donnée. Joseph-Louis Lagrange, 1797 Une fonction f (x) qui varie selon la loi de continuité pour toutes les valeurs de x situées à l’intérieur ou à l’extérieur de certaines limites n’est rien d’autre que ce qui suit : si x est l’une quelconque de ces valeurs, la différence f (x + w) − f (x) peut être rendue plus petite que n’importe quelle quantité donnée si on fait w aussi petit qu’on le désire. Bernard Bolzano, 1817 La fonction f (x) sera, entre les deux limites assignées à la variable x, fonction continue de cette variable, si, pour chaque valeur de x intermédiaire entre ces limites, la valeur numérique de la différence f (x + α) − f (x) décroı̂t indéfiniment avec celle de α. En d’autres termes, la fonction f(x) restera continue par rapport à x entre les limites données, si, entre ces limites, un accroissement infiniment petit de la variable produit toujours un accroissement infiniment petit de la fonction elle-même. Augustin Cauchy, 1821 S’il est possible de déterminer une borne δ telle que pour toute valeur de h, plus petite en valeur absolue que δ, f (x + h) − f (x) soit plus petite qu’une 80 CHAPITRE 2. LIMITES ET CONTINUITÉ quantité ! aussi petite que l’on veut, alors on dira qu’on a fait correspondre à une variation infiniment petite de la variable une variation infiniment petite de la fonction. Karl Weierstrass, 1861 Chapitre 3 Dérivabilité 3.1 Fonctions d’une variable réelle Soit f une fonction de R dans Rp et a ∈ dom f . Des questions de géométrie et de mécanique (vitesse moyenne) suggèrent l’introduction de la fonction suivante. Définition. Le taux de variation de f en a ou l’accroissement relatif de f en a ou le quotient différentiel de f en a est la fonction de R dans Rp de domaine dom f \ {a} définie par ∆af (x) = f (x) − f (a) . x−a On remarquera que cette fonction ∆a f ne peut pas être définie pour une fonction f de Rn dans Rp lorsque n > 1, puisqu’il n’existe pas de division d’un élément de Rp par un élément de Rn . La notion géométrique de tangente à une courbe et la notion mécanique de vitesse instantanée conduisent alors à la notion suivante. Définition. On dit que la fonction f de R dans Rp est dérivable au point a ∈ dom f si la limite lim ∆a f (x) ≡ lim x→a x→a f (x) − f (a) x−a (3.1) df existe. Dans ce cas, cette limite est notée f $ (a), Df (a) ou dx (a) et appelée le vecteur dérivé de f en a (nombre dérivé si p = 1), ou encore, plus simplement, la dérivée de f en a. 81 82 CHAPITRE 3. DÉRIVABILITÉ Rappelons que l’existence de (3.1) impose que a ∈ adh (dom f \ {a}), c’est-à-dire que a ne soit pas un point isolé de dom f. Remarques. 1. Si nous posons dom f − a = {h ∈ R : a + h ∈ dom f }, alors, en posant x = a + h dans la définition de (3.1) exprimée en termes d’! et δ # # # f (x) − f (a) # $ # (∀! > 0)(∃δ > 0)(∀x ∈ dom f \{a} : |x−a| ≤ δ) : # − f (a)## ≤ !, x−a 2 nous voyons immédiatement que la dérivabilité de f en a équivaut à la condition (∀! > 0)(∃δ > 0)(∀h ∈ (dom f − a) \ {0} : |h| ≤ δ) : # # # f (a + h) − f (a) # $ # # ≤ !. (a) − f # # h 2 2. En ajoutant dans (3.1) la contrainte “x < a” (resp. “x > a”), on définit le concept de dérivabilité à gauche (resp. à droite) de f au point a, et les propriétés de la limite impliquent aussitôt que si f est dérivable à gauche et à droite en a et que ses dérivées à gauche et à droite sont égales, alors f est dérivable en a. Exemples. 1. Toute application constante de R dans Rp est dérivable en chaque point de R et sa dérivée y est nulle. 2. Toute application linéaire f : R → Rp , x 2→ xc, où c ∈ Rp , est dérivable en chaque point a ∈ R, et f $ (a) = c. 3. Pour chaque n ≥ 2, l’application de R dans R définie par f (x) = xn est telle que, pour chaque a ∈ R, on a xn − an = lim (xn−1 + xn−2 a + . . . + xan−2 + an−1 ) = nan−1 , x→a x − a x→a, x(=a lim ce qui montre que f est dérivable en a et f $ (a) = nan−1 . 4. Considérons maintenant l’application valeur absolue de R dans R. Si a > 0, alors, pour tout x appartenant au voisinage U = [ a2 , 3a 2 ] de a, on a |x| = x et dès lors, par le caractère local de la limite, lim x→a |x| − |a| |x| − |a| x−a = lim = lim = 1, x→a, x∈U x→a, x∈U x−a x−a x−a ce qui montre que l’application valeur absolue est dérivable en a > 0 et y a pour dérivée 1. On montre de même que l’application valeur absolue est 3.1. FONCTIONS D’UNE VARIABLE RÉELLE 83 dérivable en chaque a < 0 et y a pour dérivée −1. Par contre, l’application valeur absolue n’est pas dérivable en 0, puisque |x| −x = lim = −1, x→0− x x→0− x lim et |x| x = lim = 1. x→0+ x x→0+ x La dérivabilité en un point d’une fonction d’une variable réelle à valeurs dans Rp se ramène à celle de ses p fonctions composantes. lim Proposition. Si f est une fonction de R dans Rp et a ∈ dom f , alors f est dérivable en a si et seulement si, pour chaque 1 ≤ k ≤ p, les fonctions composantes fk sont dérivables en a, auquel cas l’on a f $ (a) = ((f1 )$ (a), . . ., (fp)$ (a)), c’est-à-dire (f $ (a))k = (fk )$ (a), (1 ≤ k ≤ p). Démonstration. Comme, pour chaque 1 ≤ k ≤ p, fk = pk ◦ f et que pk est linéaire, on a, pour tout a ∈ dom f et tout x ∈ dom f \ {a}, (pk ◦ ∆a f )(x) = (pk ◦ f )(x) − (pk ◦ f )(a) fk (x) − fk (a) = = ∆afk (x).(3.2) x−a x−a Par ailleurs, en vertu des propriétés des limites, lim ∆a f (x) = b ⇔ lim (pk ◦ ∆af )(x) = bk , (1 ≤ k ≤ p), x→a x→a et la thèse se déduit aussitôt de ce résultat et de (3.2). Introduisons maintenant une formulation équivalente de la notion de dérivabilité qui constitue une étape importante vers la généralisation de cette notion aux fonctions de plusieurs variables. Proposition. Soit f une fonction de R dans Rp et a ∈ dom f . Alors f est dérivable en a si et seulement s’il existe b ∈ Rp et une fonction r de R dans Rp définie au moins sur (dom f − a) \ {0} tels que lim r(h) = 0, h→0 et, tels que, pour tout h ∈ (dom f − a) \ {0}, on ait f (a + h) = f (a) + hb + |h|r(h). (3.3) 84 CHAPITRE 3. DÉRIVABILITÉ S’il en est ainsi, b = f $ (a). Démonstration. Condition nécessaire. Si f est dérivable en a, alors, en prenant b = f $ (a), on a f (a + h) − f (a) = b, h→0 h lim c’est-à-dire lim h→0 f (a + h) − f (a) − hb = 0. h Dès lors si l’on pose r(h) = f (a + h) − f (a) − hb , |h| on voit que dom r = (dom f − a) \ {0}, (3.3) est satisfaite, et lim r(h) = lim h→0 h→0 2 3 h f (a + h) − f (a) − hb = 0, . |h| h puisque la fonction h 2→ h/|h| est localement bornée en 0. Condition suffisante. Si f vérifie (3.3), alors, pour tout h ∈ (dom f −a)\{0}, on a f (a + h) − f (a) |h| =b+ r(h), h h et dès lors f (a + h) − f (a) lim = b, h→0 h ce qui montre que la limite (3.1) existe et est égale à b. Remarque. La caractérisation que nous venons d’obtenir peut évidemment s’énoncer sous la forme équivalente de l’existence d’un b ∈ Rp tel que lim h→0 ou encore tel que lim x→a f (a + h) − f (a) − hb = 0, |h| f (x) − f (a) − (x − a)b = 0. |x − a| Quant à (3.3), elle peut bien sûr également s’écrire f (x) = f (a) + (x − a)b + |x − a|r(x − a), 3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES 85 pour tout x ∈ dom f \ {a}. La condition (3.3) peut être interprétée comme suit : une fonction f est dérivable en a ∈ dom f si et seulement si f (a + h) peut être approchée pour |h| suffisamment petit par une fonction affine g : h 2→ f (a) + hb, en ce sens que l’erreur commise f (a+h)−g(h) est de la forme |h|r(h) avec r(h) tendant vers 0 si h tend vers 0, c’est-à-dire tend vers zéro plus rapidement que |h| lorsque |h| → 0. En résumé, la dérivabilité en un point d’une fonction de R dans Rp peut se concevoir comme l’existence d’un taux de variation “instantané” de la fonction en ce point, ou comme la possibilité d’approcher cette fonction, au voisinage de ce point, par une fonction affine. Géométriquement, parmi toutes les droites de R × Rp passant par (a, f (a)), le graphe de g constitue la meilleure approximation de celui de f au voisinage de (a, f (a)). On pourra visualiser la situation lorsque p = 1 et p = 2. 3.2 Fonctions de plusieurs variables réelles Si l’on rappelle que toute application linéaire de R dans Rp est de la forme x 2→ xb pour un certain b ∈ Rp, on voit que la caractérisation de la notion de dérivabilité en a ∈ dom f d’une fonction f de R dans Rp revient à demander l’existence d’une application linéaire L de R dans Rp et d’une fonction r de R dans Rp définie au moins sur (dom f − a) \ {0}, telle que limh→0 r(h) = 0 et telle que, pour tout h ∈ (dom f − a) \ {0}, on ait f (a + h) = f (a) + L(h) + |h|r(h). Les deux membres de cette égalité gardent un sens pour une fonction f de Rn dans Rp à condition de prendre pour L une application linéaire de Rn dans Rp , pour r une fonction de Rn dans Rp et de remplacer |h| par |h|2 . Nous sommes ainsi conduits à la définition suivante. Définition. Soit f une fonction de Rn dans Rp et a ∈ dom f . On dit que f est dérivable (ou différentiable) au point a s’il existe une application linéaire L de Rn dans Rp et une fonction r de Rn dans Rp définie au moins sur (dom f − a) \ {0}, telles que lim r(h) = 0 h→0 et telles que, pour tout h ∈ (dom f − a) \ {0}, on ait f (a + h) = f (a) + L(h) + |h|2 r(h), (3.4) 86 CHAPITRE 3. DÉRIVABILITÉ ou encore, d’une manière équivalente, f (x) = f (a) + L(x − a) + |x − a|2 r(x − a), (3.5) pour tout x ∈ dom f \ {a}. Dans cette définition, on a posé, par analogie avec le cas n = 1, dom f − a = {h ∈ Rn : a + h ∈ dom f }. Remarques. 1. La condition limh→0 r(h) = 0 implique évidemment que 0 ne soit pas isolé dans (dom f − a), c’est-à-dire que a ne soit pas isolé dans dom f. 2. Si j = 1, 2 ou ∞, les inégalités entre les différentes normes entraı̂nent que les relations (3.4) et (3.5) sont évidemment équivalentes respectivement à f (a + h) = f (a) + L(h) + |h|j rj (h), et f (x) = f (a) + L(x − a) + |x − a|j rj (x − a), pour une certaine function rj de Rn dans Rp définie au moins sur (dom f − a) \ {a} et telle que limh→0 rj (h) = 0. En particulier, la définition ne dépend pas du choix de la norme | · |2 . 3. La caractérisation de la dérivabilité d’une fonction de R dans Rp donnée dans la section précédente et la structure générale des applications linéaires de R dans Rp entraı̂nent évidemment que la définition de dérivabilité que nous venons de donner dans le cas général d’une fonction de Rn dans Rp est compatible avec celle donnée pour n = 1. 4. En vertu de la propriété correspondante pour la limite, la dérivabilité de f en a est une notion locale, c’est-à-dire qu’elle ne dépend que de la restriction de f à un voisinage arbitraire de a. Comme pour n = 1, et avec une démonstration semblable, on a la caractérisation suivante de la dérivabilité de f en a. Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Alors f est dérivable en a si et seulement s’il existe une application linéaire L de Rn dans Rp telle que f (a + h) − f (a) − L(h) = 0, h→0 |h|2 lim 3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES 87 c’est-à-dire telle que lim x→a f (x) − f (a) − L(x − a) = 0. |x − a|2 Exemples. 1. Toute application constante de Rn dans Rp est dérivable en chaque point a ∈ Rn . Il suffit de prendre L = 0 et r = 0 dans la définition. 2. Toute application linéaire f de Rn dans Rp est dérivable en chaque point a ∈ Rn . Comme, par linéarité, on a, pour tout h ∈ Rn , f (a+h) = f (a)+f (h), il suffit de prendre L = f et r = 0 dans la définition. 3. Soit f : R2 → R, (x1, x2 ) 2→ x21 + x2 . Si a = (a1 , a2 ) ∈ R2 et h = (h1 , h2 ) ∈ R2 , on a f (a + h) = (a1 + h1 )2 + (a2 + h2 ) = a21 + a2 + 2a1 h1 + h2 + h21 = f (a) + L(h) + |h|2 r(h), si l’on définit l’application linéaire L : R2 → R par L(h) = 2a1 h1 + h2 et la fonction r de R2 dans R par r(h) = Comme, pour tout h /= 0, on a |r(h)| ≤ h21 |h|2 . On voit que dom r = R2 \ {0}. h21 + h22 = |h|2 , |h|2 on voit que limh→0 r(h) = 0 et f est dérivable en chaque point a ∈ R2 . Lorsque n ≥ 2, il peut exister plus d’une application linéaire L vérifiant les conditions de la définition de dérivabilité. Pour le voir, soit f la fonction de R2 dans R définie par f (x1 , x2 ) = x1 (x21 − |x2 |)1/2. On a dom f = {(x1 , x2 ) ∈ R2 : |x2 | ≤ x21 }. Si c ∈ R, si l’on considère l’application linéaire Lc : R2 → R, (h1 , h2 ) 2→ ch2 , et si l’on définit la fonction rc de R2 dans R par rc (h1 , h2 ) = 91/2 h1 8 2 h2 h1 − |h2 | −c , |h|2 |h|2 on a, pour chaque (h1 , h2 ) ∈ dom f \ {(0, 0)}, f (h1 , h2 ) = f (0, 0) + Lc (h1 , h2 ) + |h|2 rc (h1 , h2 ). 88 CHAPITRE 3. DÉRIVABILITÉ Comme, pour tout (h1 , h2 ) ∈ dom f, on a # # h2 #c # |h| # 2 # # ≤ |c| |h1| ≤ |c||h|2, # |h|2 2 on voit que limh→0 rc (h) = 0 et donc que, pour chaque c ∈ R, l’application linéaire Lc vérifie la définition de la dérivabilité de f en 0. Un dessin convaincra aisément le lecteur de la forme particulière du domaine de f dans l’exemple ci-dessus. On retrouve l’unicité en faisant des hypothèses plus fortes sur les relations entre a et dom f . Proposition. Soit f une fonction de Rn dans Rp . Si a ∈ int dom f, il existe au plus une application linéaire L vérifiant les conditions de la définition de dérivabilité de f en a. Démonstration. Supposons qu’il existe deux applications linéaires L et M de Rn dans Rp vérifiant les conditions de la définition de dérivabilité de f en a. Alors, il existera deux fonctions r et s de Rn dans Rp définies au moins sur (dom f − a) \ {0} et telles que, pour chaque h ∈ (dom f − a) \ {0}, on ait f (a) + L(h) + |h|2 r(h) = f (a + h) = f (a) + M (h) + |h|2 s(h). En conséquence, on a, pour chaque h ∈ (dom f − a) \ {0}, (L − M )(h) = |h|2 [s(h) − r(h)]. Soit ρ > 0 tel que B2 [a; ρ] ⊂ dom f. Comme B2 [ρ] ⊂ dom f − a, on aura, pour chaque 1 ≤ k ≤ n, et chaque t ∈ ]0, ρ], t(L − M )(ek ) = (L − M )(tek ) = |t|[s(tek ) − r(tek )] = t[s(tek ) − r(tek )], et dès lors (L − M )(ek ) = [s(tek ) − r(tek )]. En faisant tendre t vers 0 dans cette égalité, et en utilisant les propriétés de r et s et le théorème sur la limite d’une fonction composée, on obtient, pour chaque 1 ≤ k ≤ n, (L − M )(ek ) = 0, et dès lors L = M , puisqu’une application linéaire de Rn dans Rp est nulle si et seulement si elle s’annulle sur chaque élément de la base canonique de Rn . 3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES 89 Définition. Si f est une fonction de Rn dans Rp dérivable en a ∈ int dom f si n ≥ 2 et en a ∈ dom f si n = 1, l’unique application linéaire L de Rn dans Rp vérifiant les conditions de la définition est appelée la dérivée totale ou la différentielle de f au point a et notée fa$ ou dfa . fa$ est donc, dans ce cas, l’unique application linéaire de Rn dans Rp telle que l’on puisse écrire, pour chaque h ∈ (dom f − a) \ {0}, f (a + h) = f (a) + fa$ (h) + |h|2 r(h), avec r une fonction de Rn dans Rp définie au moins sur (dom f − a) \ {0} et telle que limh→0 r(h) = 0, ou encore l’unique application linéaire de Rn dans Rp telle que l’on ait f (a + h) − f (a) − fa$ (h) = 0. h→0 |h|2 lim Lorsque n = 1 et que f est dérivable en a au sens de la première section de de chapitre, il existe un élément unique f $ (a) ∈ Rp tel que, pour chaque h ∈ (dom f − a) \ {0}, on ait f (a + h) = f (a) + hf $ (a) + |h|r(h). Dès lors, on a nécessairement, pour chaque h ∈ R, fa$ (h) = hf $ (a), et en particulier f $ (a) = fa$ (1). La connaissance de la dérivée f $ (a) de f en a entraı̂ne donc, pour n = 1, la connaissance de sa dérivée totale fa$ , et réciproquement. Géométriquement, lorsque n ≥ 2 et que f est une fonction de Rn dans R dérivable en a ∈ int dom f, le graphe de la fonction affine h 2→ f (a) + fa$ (h) est le plan de Rn × R passant par (a, f (a)) qui fournit la meilleure approximation du graphe de f au voisinage de (a, f (a)). On l’appelle le plan tangent au graphe de f en (a, f (a)). On pourra visualiser la situation lorsque n = 2. La dérivabilité de f en a entraı̂ne sa continuité en ce point. Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Si f est dérivable en a, alors, pour chaque j = 1, 2 ou ∞, la fonction g de Rn dans Rp 90 CHAPITRE 3. DÉRIVABILITÉ définie par g(h) = en a. f (a+h)−f (a) |h|j est localement bornée en 0 et f est continue Démonstration. Soit j = 1, 2 ou ∞. Par hypothèse, il existe une application linéaire L de Rn dans Rp et une fonction r de Rn dans Rp définie au moins sur (dom f − a) \ {0} telle que limh→0 r(h) = 0 et f (a + h) = f (a) + L(h) + |h|2 r(h) pour chaque h ∈ (dom f − a) \ {0}. En conséquence, pour ces mêmes h, on a f (a + h) − f (a) L(h) + |h|2 r(h) g(h) = = =L |h|j |h|j & h |h|j ' + |h|2 r(h). |h|j On sait que le premier terme est une fonction localement bornée en 0 et, en utilisant les inégalités entre normes, on voit aisément que le deuxième terme est le produit par r d’une fonction localement bornée en 0; il tend donc vers 0 lorsque h tend vers 0, et est donc également localement borné en 0. Enfin, pour tout x ∈ dom f \ {a}, on a f (x) = f (a) + L(x − a) + |x − a|2 r(x − a), et dès lors lim x→a, x(=a f (x) = f (a), ce qui équivaut à la continuité de f en a, puisque a est non isolé dans dom f . Remarque. La réciproque de cette proposition est fausse : une fonction peut être continue en un point sans y être dérivable. Ainsi, l’application valeur absolue de R dans R est continue en 0 et n’y est pas dérivable. Comme on le verra plus loin, il existe même des fonctions de R dans R continues en chaque point de R qui ne sont dérivables en aucun point de R ! 3.3 Dérivées directionnelles et dérivées partielles La définition de dérivabilité d’une fonction de Rn dans Rp requiert la détermination de l’application linéaire L intervenant dans la définition. Cette détermination est facilitée par l’introduction des dérivées d’une fonction de Rn dans Rp dans une direction fixée. On appellera direction dans Rn tout élément u ∈ Rn tel que |u|2 = 1. Un tel élément fixe en effet la direction de la droite qui le joint à l’origine. 3.3. DÉRIVÉES DIRECTIONNELLES ET DÉRIVÉES PARTIELLES 91 Définition. Soit f une fonction de Rn dans Rp , a ∈ dom f et u ∈ Rn tel que |u|2 = 1. On dit que f est dérivable au point a dans la direction u si la fonction de R dans Rp t 2→ f (a + tu) est dérivable en 0, c’est-à-dire si lim t→0 f (a + tu) − f (a) t (3.6) existe. Dans ce cas, cette limite est notée f $ (a; u) ou Du f (a) et appelée la dérivée de f au point a dans la direction u. Dans le cas particulier où u = ek pour un certain 1 ≤ k ≤ n, f $ (a; ek ) est appelée la dérivée partielle de f en a par rapport à la ke -composante (brièvement par rapport à xk ) et notée ∂f Dk f (a) ou Dxk f (a) ou ∂x (a) ou ∂k f (a). k Notons que l’existence de la limite (3.6) requiert que a soit adhérent à l’ensemble {x ∈ dom f \ {a} : x = a + tu, t ∈ R}. Si a ∈ int dom f, ce sera évidemment le cas, pour n’importe quel u ∈ Rn tel que |u|2 = 1. Notons aussi que, si l’on introduit l’application affine g : R → Rn , t 2→ a + tu, la dérivabilité de f en a dans la direction u équivaut à la dérivabilité en 0 de la fonction de R dans Rp f ◦ g, auquel cas f $ (a; u) = (f ◦ g)$(0). D’autre part, lorsque n = 1, on a u = 1 ou u = −1 et l’on voit tout de suite que l’existence de f $ (a; 1) et f $ (a; −1) équivalent toutes deux à la dérivabilité (ordinaire) de f en a, avec les relations f $ (a; 1) = −f $ (a; −1) = f $ (a). Remarquons enfin que, dans le cas de la dérivée partielle par rapport à xk , on a, explicitement, par (3.6), f (a1 , . . ., ak−1 , ak + t, ak+1 , . . . , an ) − f (a1 , . . ., an ) , t→0 t Dk f (a) = lim ou encore, d’une manière équivalente, Dk f (a) = lim xk →ak f (a1 , . . . , ak−1, xk , ak+1 , . . . , an ) − f (a1 , . . ., an ) . xk − ak L’existence et le calcul de Dk f (a) revient donc à la dérivabilité et au calcul de la dérivée de la fonction de R dans Rp xk 2→ f (a1 , . . . , ak−1 , xk , ak+1 , . . ., an ). Il suffit donc de “geler” à leur valeur aj les composantes xj telles que j /= k et de considérer la seule dépendance en xk . 92 CHAPITRE 3. DÉRIVABILITÉ Notons que, contrairement à la notion de dérivabilité introduite dans la section précédente, la dérivabilité d’une fonction en un point dans toutes les directions n’entraı̂ne pas la continuité de la fonction en ce point. Par exemple, si f est la fonction de R2 dans R définie par f (x) = x1 x22 si x /= 0 x21 + x42 et f (0) = 0, on voit que, pour chaque u = (u1 , u2 ) tel que |u|2 = 1, on a, pour chaque réel t /= 0, f (tu) − f (0) f (tu) u1 u22 = = 2 , t t u1 + t2 u42 et dès lors f (tu) − f (0) u2 = 2 si u1 /= 0, t→0 t u1 lim et f (tu) − f (0) = 0 si u1 = 0. t En conséquence, f $ (0; u) existe pour toute direction u de R2 . D’autre part, pour tout réel h /= 0, on a lim t→0 f (h2 , h) = h4 1 = , h4 + h4 2 ce qui montre que |f (h2 , h) − f (0, 0)| = 12 quel que soit h /= 0 et dès lors f n’est pas continue en 0 puisque limx→0 f n’est pas égale à f (0). Nous allons voir maintenant qu’en un point intérieur au domaine d’une fonction de Rn dans Rp, l’existence de la dérivée totale entraı̂ne celle de la dérivée dans n’importe quelle direction (et en particulier des n dérivées partielles) et que la dérivée totale peut s’exprimer en termes des dérivées directionnelles ou des dérivées partielles. Proposition. Soit f une fonction de Rn dans Rp, a ∈ int dom f . Si f est dérivable en a, alors, pour chaque u ∈ Rn tel que |u|2 = 1, f est dérivable en a dans la direction u et l’on a f $ (a; u) = fa$ (u). En particulier, pour chaque 1 ≤ k ≤ n, f possède une dérivée partielle Dk f (a) en a par rapport à xk et, pour tout h ∈ Rn , on a fa$ (h) = n $ k=1 hk Dk f (a). (3.7) 3.3. DÉRIVÉES DIRECTIONNELLES ET DÉRIVÉES PARTIELLES 93 Démonstration. Par la définition de la dérivabilité totale de f en a, il existe une fonction r de Rn dans Rp définie au moins sur (dom f − a) \ {0}, telle que limh→0 r(h) = 0 et telle que, pour tout h ∈ (dom f − a) \ {0}, on ait f (a + h) = f (a) + fa$ (h) + |h|2 r(h). Dès lors, pour tout réel t /= 0 tel que a + tu ∈ dom f , on a f (a + tu) = f (a) + fa$ (tu) + |tu|2 r(tu) = f (a) + tfa$ (u) + |t|r(tu), et, en utilisant le théorème sur la limite des fonctions composées et le fait que la fonction t 2→ |t| t est localement bornée en 0, 2 3 f (a + tu) − f (a) |t| lim = lim fa$ (u) + r(tu) = fa$ (u). t→0 t→0 t t En particulier, en prenant u = ek , (1 ≤ k ≤ n), on obtient Dk f (a) = fa$ (ek ), (1 ≤ k ≤ n), et, pour tout h ∈ Rn , on aura fa$ (h) = fa$ & n $ k=1 k hk e ' = n $ hk fa$ (ek ) = k=1 n $ hk Dk f (a). k=1 L’exemple donné d’une fonction dérivable dans chaque direction sans être continue, et donc sans être dérivable, montre que la réciproque de cette proposition est fausse. Nous donnerons plus loin des conditions supplémentaires à imposer à l’existence des dérivées partielles en un point pour en déduire la dérivabilité en ce point. La proposition que nous venons de démontrer fournit un procédé systématique pour étudier la dérivabilité d’une fonction f de Rn dans Rp en un point a ∈ dom f : 1. On étudie l’existence des dérivées partielles de f en a par rapport à xk (1 ≤ k ≤ n). Si l’une d’entre elles n’existe pas, f ne sera pas dérivable en a. 2. Si toutes les dérivées partielles D1 f (a), . . . , Dnf (a) existent, on définit l’application linéaire L de Rn dans Rp par la relation L(h) = n $ k=1 hk Dk f (a). 94 CHAPITRE 3. DÉRIVABILITÉ Si f (a + h) − f (a) − L(h) = |h|2 r(h) avec limh→0 r(h) = 0, ou encore si lim h→0 f (a + h) − f (a) − L(h) = 0, |h|2 (3.8) alors f est dérivable en a. Si la limite du premier membre de (3.8) est différente de zéro ou n’existe pas, alors f n’est pas dérivable en a. Exemple. Reprenons l’exemple de la fonction f de R2 dans R définie par f (x) = x21 + x2 . Si a = (a1 , a2 ) ∈ R2 est donné, alors la fonction x1 2→ x21 + a2 est dérivable en a1 et y a pour dérivée 2a1 et la fonction x2 2→ a21 + x2 est dérivable en a2 et y a pour dérivée 1. En conséquence, D1 f (a) = 2a1 , D2 f (a) = 1. Soit L l’application linéaire de R2 dans R définie par L(h) = 2 $ hk Dk f (a) = 2a1 h1 + h2 . k=1 On a f (a + h) − f (a) − L(h) = (a1 + h1 )2 + a2 − a21 − a2 − 2a1 h1 − h2 = h21 , et dès lors f (a + h) − f (a) − L(h) h2 = lim 1 = 0. h→0 h→0 |h|2 |h|2 lim Remarque. Dans le cas particulier d’une fonction f de Rn dans R dérivable en a ∈ int dom f , chaque dérivée partielle Dk f (a) est un nombre réel et l’élément (D1 f (a), . . ., Dnf (a)) de Rn est appelé le gradient de f en a et noté ∇f (a) ou grad f (a). En utilisant le produit scalaire, la relation (3.7) s’écrit f $ (a; h) = fa$ (h) = (∇f (a)|h). En vertu de l’inégalité de Cauchy, on aura alors, pour tout u ∈ Rn , tel que |u|2 = 1, fa$ (u) ≤ |fa$ (u)| ≤ |∇f (a)|2 |u|2 = |∇f (a)|2 , et si ∇f (a) /= 0, on obtient, en prenant u = 4 f $ a; ∇f (a) |∇f (a)|2 5 4 = ∇f (a)| ∇f (a) |∇f (a)|2 5 = ∇f (a) |∇f (a)|2 , (∇f (a)|∇f (a)) = |∇f (a)|2, |∇f (a)|2 3.4. RÈGLES DE CALCUL DES DÉRIVÉES ce qui montre que f $ (a; u) prend sa plus grande valeur lorsque u = Comme f (a + tu) = f (a) + t(∇f (a)|u) + |t|r(tu), 95 ∇f (a) |∇f (a)|2 . ∇f (a) avec r(h) → 0 si h → 0, le résultat qui précède montre que u = |∇f est (a)|2 la direction suivant laquelle f croı̂t le plus vite à partir de a. L’opposée −u est la direction de plus grande pente. 3.4 Règles de calcul des dérivées Pour éviter de devoir retourner systématiquement à la définition pour étudier la dérivabilité et calculer la dérivée, il est important de savoir comment la dérivabilité se comporte par rapport aux opérations algébriques et ensemblistes faites sur des fonctions dérivables. On pourra alors obtenir la dérivabilité et la dérivée de fonctions compliquées lorsqu’on connaı̂t celle de fonctions plus simples. On se contentera de traiter le cas important de la dérivabilité en un point intérieur au domaine. Montrons tout d’abord que la dérivée d’une somme est la somme des dérivées. Proposition. Soient f et g deux fonctions de Rn dans Rp et a ∈ int (dom f ∩dom g). Si f et g sont dérivables en a, alors f + g est dérivable en a et l’on a (f + g)$a = fa$ + ga$ . En particulier, pour n = 1, (f + g)$(a) = f $ (a) + g $ (a). Démonstration. Par hypothèse, il existe des fonctions r et s de Rn dans définies au moins sur (dom f −a)\{0} et (dom g−a)\{0} respectivement, telles que lim r(h) = 0, lim s(h) = 0, Rp h→0 h→0 et f (a + h) = f (a) + fa$ (h) + |h|2 r(h), pour tout h ∈ (dom f − a) \ {0} et g(a + h) = g(a) + ga$ (h) + |h|2 s(h), 96 CHAPITRE 3. DÉRIVABILITÉ pour tout h ∈ (dom g − a) \ {0}. Dès lors, pour tout h ∈ [(dom f − a) ∩ (dom g − a)] \ {0}, on a (f + g)(a + h) = f (a + h) + g(a + h) = f (a) + fa$ (h) + |h|2 r(h) + g(a) + ga$ (h) + |h|2 s(h) avec = (f + g)(a) + (fa$ + ga$ )(h) + |h|2 [r(h) + s(h)], lim [r(h) + s(h)] = 0. h→0 Le cas n = 1 s’en déduit aussitôt puisque (f + g)$ (a) = (f + g)$a(1) = fa$ (1) + ga$ (1) = f $ (a) + g $ (a). Etudions maintenant la dérivabilité d’un produit de fonctions dérivables. Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables en a, alors gf est dérivable en a et l’on a (gf )$a = ga$ (·)f (a) + g(a)fa$ . En particulier, si n = 1, on a aussi (gf )$ (a) = g $ (a)f (a) + g(a)f $ (a). Démonstration. Par hypothèse, il existe une fonction r de Rn dans Rp (resp. C) définie au moins sur (dom f − a) \ {0} et une fonction s de Rn dans R (resp. C) définie au moins sur (dom g − a) \ {0}, telles que lim r(h) = 0, lim s(h) = 0, h→0 h→0 et f (a + h) = f (a) + fa$ (h) + |h|2 r(h), pour tout h ∈ (dom f − a) \ {0} et g(a + h) = g(a) + ga$ (h) + |h|2 s(h), pour tout h ∈ (dom g − a) \ {0}. Dès lors, pour tout h ∈ [(dom f − a) ∩ (dom g − a)] \ {0}, on a (gf )(a + h) = g(a + h)f (a + h) 97 3.4. RÈGLES DE CALCUL DES DÉRIVÉES = [g(a) + ga$ (h) + |h|2 s(h)][f (a) + fa$ (h) + |h|2 r(h)] 2 = (gf )(a) + ga$ (h)f (a) + g(a)fa$ (h) + |h|2 g(a)r(h) + ga$ (h)fa$ (h) |h|2 + ga$ (h)r(h) + s(h)f (a) + s(h)fa$ (h) + |h|2 s(h)r(h) si l’on pose = (gf )(a) + ga$ (h)f (a) + g(a)fa$ (h) + |h|2 q(h), q(h) = g(a)r(h) + : ga$ (h)fa$ (h) |h|2 +ga$ (h)r(h) + s(h)f (a) + s(h)fa$ (h) + |h|2 s(h)r(h). $ $ h Comme la fonction h 2→ |h|−1 2 ga (h) = ga ( |h|2 ) est localement bornée en 0, on voit que chaque terme de q est formé du produit d’une fonction localement bornée en 0 par une fonction ayant une limite nulle en 0, et donc que lim q(h) = 0. h→0 La formule particulière pour n = 1 s’en déduit aisément. Remarque. On démontre de la même manière le théorème de dérivabilité du produit scalaire de deux fonctions f et g de Rn dans Rp dérivables en a ∈ int dom f ∩ int dom g et la formule pour la dérivée (f |g)$a = (fa$ (·)|g(a)) + (f (a)|ga$ (·)). Etudions la dérivabilité d’un quotient de fonctions dérivables. Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables en a et si g(a) /= 0, alors fg est dérivable en a et l’on a 4 5$ f g a = g(a)fa$ (·) − ga$ (·)f (a) . (g(a))2 En particulier, si n = 1, on a aussi 4 5$ f g (a) = g(a)f $(a) − g $ (a)f (a) . (g(a))2 Démonstration. Puisque fg = f. 1g , il suffit de montrer que en a, avec 4 5$ 1 1 =− g$ , g a (g(a))2 a 1 g est dérivable 98 CHAPITRE 3. DÉRIVABILITÉ et d’utiliser le résultat précédent sur le produit. Montrons tout d’abord que a ∈ int dom fg . On a dom f = {x ∈ dom f ∩ dom g : g(x) /= 0}. g Puisque g(a) /= 0 et que g, dérivable en a, y est continue, il existera δ > 0 tel que, pour tout x ∈ dom g tel que |x − a|2 ≤ δ, on ait |g(x) − g(a)| ≤ |g(a)| , 2 et dès lors |g(a)| , 2 ce qui entraı̂ne en particulier que, pour tout x ∈ dom g tel que |x − a|2 ≤ δ, on aura |g(x)| ≥ |g(a)| > 0. Donc dom f ∩ dom g ∩ B2 [a; δ] ⊂ dom fg et 2 a ∈ int dom 1g . D’autre part, g étant dérivable en a, il existe une fonction r de Rn dans R définie au moins sur (dom g − a) \ {0} telle que, pour tout h ∈ (dom g − a) \ {0}, on ait ||g(x)| − |g(a)|| ≤ g(a + h) = g(a) + ga$ (h) + |h|2 r(h), et dès lors, pour tout h ∈ [(dom g − a) ∩ B2 [δ]] \ {0}, on aura 2 1 1 1 g $ (h) − − − g(a + h) g(a) (g(a))2 a = |h|2 ga$ ( |h|h 2 )ga$ (h) + [ga$ (h) − g(a)]r(h) (g(a))2g(a + h) 3 = |h|2 s(h), et l’on vérifie sans peine que s(h) → 0 lorsque h → 0. La formule particulière pour n = 1 s’en déduit aisément. Donnons maintenant l’importante règle de dérivation d’une fonction composée. Proposition. Soif f une fonction de Rn dans Rp , g une fonction de Rp dans Rq , a ∈ int dom f tel que f (a) ∈ int dom g. Si f est dérivable en a et si g est dérivable en f (a), alors a ∈ int dom (g ◦ f ), g ◦ f est dérivable en a et (g ◦ f )$a = gf$ (a) ◦ fa$ . 3.4. RÈGLES DE CALCUL DES DÉRIVÉES 99 Si n = p = 1, on a aussi la formule particulière (g ◦ f )$ (a) = g $ (f (a)).f $(a). Démonstration. Par hypothèse, f , dérivable en a, y est continue. Si r > 0 est tel que B2 [f (a); r] ⊂ int dom g, il existera δ > 0 tel que f (B2 [a; δ]) ⊂ B2 [f (a); r] et donc tel que B2 [a; r] ⊂ dom (g ◦ f ). Donc a ∈ int dom (g ◦ f ). D’autre part, il existe une fonction r de Rn dans Rp définie au moins sur (dom f − a) \ {0} telle que, pour tout h ∈ (dom f − a) \ {0}, on ait f (a + h) = f (a) + fa$ (h) + |h|2 r(h), et une fonction s de Rp dans Rq définie au moins sur (dom g − f (a)) \ {0} telle que, pour tout t ∈ (dom g − f (a)) \ {0}, on ait g[f (a) + t] = g[f (a)] + gf$ (a)(t) + |t|2 s(t). Dès lors, si h ∈ [(dom f − a) ∩ B2 [δ]] \ {0}, alors f (a + h) − f (a) ∈ (dom g − f (a)) \ {0}, et g(f (a + h)) = g[f (a) + f (a + h) − f (a)] = g[f (a)] + gf$ (a)(f (a + h) − f (a)) + |f (a + h) − f (a)|2s[f (a + h) − f (a)] = g[f (a)]+gf$ (a)(fa$ (h))+gf$ (a)(|h|2r(h))+|fa$ (h)+|h|2r(h)|2 s[f (a+h)−f (a)] +|h|2 ; = g[f (a)] + (gf$ (a) ◦ fa$ )(h) gf$ (a)(r(h)) + = < # 4 # 5 # $ # h #f + r(h)## s[f (a + h) − f (a)] # a |h| 2 g[f (a)] + (gf$ (a) 2 ◦ fa$ )(h) + |h|2 b(h), et l’on vérifie sans peine que b(h) → 0 lorsque h → 0. La formule pour n = 1 s’en déduit facilement. Remarque. En appliquant le théorème précédent aux fonctions composées pk ◦ f (1 ≤ k ≤ p) lorsque f est une fonction de Rn dans Rp dérivable en a ∈ int dom f , on trouve immédiatement que chaque composante fk de f est dérivable en a et que (fk )$a = (pk )$f (a) ◦ fa$ = pk ◦ fa$ = (fa$ )k , ce qui montre que la dérivée totale en a de la ke -composante de f est la ke -composante de la dérivée totale de f en a. Réciproquement, si chaque 100 CHAPITRE 3. DÉRIVABILITÉ composante fk de f est dérivable en a ∈ int dom f , il existera des fonctions rk de Rn dans R définies au moins sur (dom f − a) \ {0} telles que fk (a + h) = f (a) + (fk )$a(h) + |h|2 rk (h), (1 ≤ k ≤ p), pour tout h ∈ (dom f − a) \ {0}; dès lors, en définissant l’application linéaire L de Rn dans Rp par L(h) = ((f1 )$a(h), . . ., (fp)$a (h)), et la fonction r de Rn dans Rp par r(h) = (r1 (h), . . ., rp(h)), on voit que f est dérivable en a et que fa$ = L. Cette remarque combinée avec la formule (3.7) reliant la dérivée totale aux dérivées partielles entraı̂ne aussitôt que, si f est une fonction de Rn dans Rp dérivable en a ∈ int dom f , on a, pour chaque h ∈ Rn et chaque 1 ≤ j ≤ p, (fa$ (h))j = (fj )$a(h) = n $ hk Dk fj (a), k=1 et dès lors, si l’on considère h comme un vecteur-colonne dans Rn , l’application linéaire fa$ de Rn dans Rp est représentée par la matrice (Dk fj (a))(1≤k≤n; 1≤j≤p) à n colonnes et p lignes formée par les dérivées partielles des composantes de f . Cette matrice appelée la matrice jacobienne de f en a constitue donc la représentation de l’application linéaire fa$ dans les bases canoniques de Rn et Rp . 3.5 Règles de calcul des dérivées partielles Les règles de calcul des dérivées totales que nous venons d’établir se combinent aux formules liant la dérivée totale aux dérivées directionnelles et aux dérivées partielles pour fournir immédiatement les règles de calcul de ces dernières dérivées dans le cas de la somme, du produit et du quotient de deux fonctions. 3.5. RÈGLES DE CALCUL DES DÉRIVÉES PARTIELLES 101 Proposition. Soient f et g deux fonctions de Rn dans Rp et a ∈ int (dom f ∩dom g). Si f et g sont dérivables en a, alors, pour chaque u ∈ Rn tel que |u|2 = 1, f + g est dérivable en a dans la direction u et l’on a (f + g)$ (a; u) = f $ (a; u) + g $ (a; u). En particulier, pour chaque 1 ≤ k ≤ n, on a Dk (f + g)(a) = Dk f (a) + Dk g(a). Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables en a, alors, pour chaque u ∈ Rn tel que |u|2 = 1, gf est dérivable en a dans la direction u et l’on a (gf )$(a; u) = g $ (a; u)f (a) + g(a)f $ (a; u). En particulier, pour chaque 1 ≤ k ≤ n, on a Dk (gf )(a) = Dk g(a)f (a) + g(a)Dk f (a). Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables en a et si g(a) /= 0, alors, pour chaque u ∈ Rn tel que |u|2 = 1, fg est dérivable en a dans la direction u et l’on a 4 5$ f g (a; u) = g(a)f $(a; u) − g $ (a; u)f (a) . (g(a))2 En particulier, pour chaque 1 ≤ k ≤ n, on a Dk 4 5 f g (a) = g(a)Dk f (a) − Dk g(a)f (a) . (g(a))2 Le cas du composé de deux fonctions est un peu moins direct. On ne manquera pas de noter le contraste entre la simplicité de la règle de calcul pour les dérivées totales et le caractère plus compliqué de la règle pour les dérivées partielles. Proposition. Soif f une fonction de Rn dans Rp , g une fonction de Rp dans Rq , a ∈ int dom f tel que f (a) ∈ int dom g. Si f est dérivable en a et si g est dérivable en f (a), alors, a ∈ int dom (g ◦ f ), et, pour chaque u ∈ Rn tel que |u|2 = 1, g ◦ f est dérivable en a dans la direction de u, et (g ◦ f )$ (a; u) = g $ [f (a); f $(a; u)]. 102 CHAPITRE 3. DÉRIVABILITÉ En particulier, pour chaque 1 ≤ k ≤ n, on a Dk (g ◦ f )(a) = p $ Dk fj (a)Dj g(f (a)), (3.9) p $ Dj gl (f (a))Dk fj (a). (3.10) j=1 et, pour chaque 1 ≤ l ≤ q, on a Dk (g ◦ f )l (a) = j=1 Démonstration. On a, en utilisant le lien entre dérivée totale et dérivée directionnelle et la règle de la dérivée totale d’une fonction composée, (g ◦ f )$ (a; u) = (g ◦ f )$a(u) = (gf$ (a) ◦ fa$ )(u) = gf$ (a)(fa$ (u)) = gf$ (a)[f $ (a; u)] = g $ [f (a); f $(a; u)]. Dès lors, pour chaque 1 ≤ k ≤ n, il vient Dk (g ◦ f )(a) = (g ◦ f )$ (a; ek ) = g $ [f (a); f $(a; ek )] = g $ [f (a); fa$ (ek )] = p $ j=1 (fa$ (ek ))j Dj g(f (a)) = p $ (fj )$a(ek )Dj g(f (a)) j=1 = p $ Dk fj (a)Dj g(f (a)). j=1 La formule (3.10) s’obtient en passant aux composantes dans la formule (3.9). Remarque. La formule (3.10) montre que la matrice jacobienne de g ◦ f en a est égale au produit matriciel de la matrice jacobienne de g en f (a) par la matrice jacobienne de f en a. Exemples. 1. Considérons le passage des coordonnées cartésiennes (x1 , x2 ) aux coordonnées polaires (r, θ) dans R2 pour une fonction g de R2 dans R dérivable en chaque point de R2 \ {0}. Rappelons que ce changement de variables est donné par l’application f de R+ × R dans R2 définie par f (r, θ) = (r cos θ, r sin θ), et que cette fonction f est dérivable en chaque point de R+ × R. En utilisant la formule (3.10), on voit, que pour chaque (r, θ) ∈ R+ × R, on a Dr (g ◦ f )(r, θ) = D1 g(r cos θ, r sin θ)Dr f1 (r, θ) + D2 g(r cos θ, r sin θ)Dr f2 (r, θ) 103 3.6. C-DÉRIVABILITÉ = D1 g(r cos θ, r sin θ) cos θ + D2 g(r cos θ, r sin θ) sin θ, Dθ (g ◦ f )(r, θ) = D1 g(r cos θ, r sin θ)Dθ f1 (r, θ) + D2 g(r cos θ, r sin θ)Dθ f2 (r, θ) = −D1 g(r cos θ, r sin θ)r sin θ + D2 g(r cos θ, r sin θ)r cos θ. En notations matricielles, ces relations s’écrivent & Dr (g ◦ f )(r, θ) Dθ (g ◦ f )(r, θ) ' = & cos θ sin θ −r sin θ r cos θ '& D1 g(r cos θ, r sin θ) D2 g(r cos θ, r sin θ) ce qui donne également, si r /= 0, en inversant la matrice, & D1 g(r cos θ, r sin θ) D2 g(r cos θ, r sin θ) ' = & cos θ −r −1 sin θ sin θ r −1 cos θ '& Dr (g ◦ f )(r, θ) Dθ (g ◦ f )(r, θ) ' , ' . 2. Un cas particulier important, pour la mécanique par exemple, est celui où f est une fonction de R dans Rp+1 de la forme f (x) = (x, h(x)), avec h une fonction de R dans Rp dérivable en a ∈ int dom h et g une fonction de Rp+1 dans R dérivable en f (a) = (a, h(a)) ∈ int dom g. On numérotera les variables dans Rp+1 par les indices 0, 1, . . ., p. Dans ce cas, g ◦ f = g(·, h(·)) est une fonction de R dans R dérivable en a et (g ◦ f )$ (a) = (g ◦ f )$a (1) = [gf$ (a) ◦ fa$ ](1) = gf$ (a)(fa$ (1)) = gf$ (a)(f $ (a)) = D0 g(a, h(a))f0$ (a) + p $ Dk g(a, h(a))fk$ (a) k=1 = D0 g(a, h(a)) + p $ Dk g(a, h(a))h$k(a). k=1 3.6 C-dérivabilité Soit f une fonction de C dans C et a ∈ dom f . On peut évidemment la considérer simplement comme une fonction de R2 dans R2 (en oubliant la structure supplémentaire de champ de R2 ), et considérer sa dérivabilité en a au sens de l’existence de la dérivée totale en a. Mais la structure supplémentaire de C nous permet également de généraliser à une telle fonction la notion de fonction taux d’accroissement en a (puisqu’on peut diviser un élément de C par un élément non nul de C) et la notion de dérivée correspondante. 104 CHAPITRE 3. DÉRIVABILITÉ Définition. Soit f une fonction de C dans C et a ∈ dom f . On dit que f est C-dérivable en a si f (z) − f (a) lim z→a z −a existe. Dans ce cas, cette limite est appelée la C-dérivée de f en a et elle est df notée f $ (a) ou dz (a). L’existence de la limite implique évidemment que a ne soit pas isolé dans dom f. Exemples. 1. Toute application constante de C dans C est évidemment C-dérivable en chaque point a de C et f $ (a) = 0. 2. Toute application C-linéaire de C dans C est C-dérivable en chaque point a de C puisqu’alors f est de la forme f (z) = cz pour un certain c ∈ C, et lim z→a cz − ca c(z − a) = lim = c. z→a z − a z−a On a, dans ce cas, f $ (a) = c. 3. L’application f : z 2→ z̄, qui est R-linéaire mais n’est pas C-linéaire, n’est C-dérivable en aucun point a de C puisque lim z→a z̄ − ā , z−a n’existe pas. En effet, si (hk )k∈N est une suite de nombres réels non nuls tendant vers zéro, alors, en prenant zk = a + hk , on obtient lim k→∞ zk − ā hk = 1, = lim k→∞ zk − a hk et en prenant zk = a + ihk , on obtient lim k→∞ zk − ā −ihk = −1. = lim zk − a k→∞ ihk En procédant exactement comme dans le cas d’une fonction d’une variable réelle, et en se rappelant la structure des applications C-linéaires de C dans C, on démontre aisément le résultat suivant. Proposition. Soit f une fonction de C dans C et a ∈ dom f . Alors f est C-dérivable en a si et seulement s’il existe b ∈ C et une fonction r de C dans C définie au moins sur (dom f − a) \ {0} tels que limh→0 r(h) = 0 et f (a + h) = f (a) + hb + |h|r(h), 105 3.6. C-DÉRIVABILITÉ pour tout h ∈ (dom f − a) \ {0}, ou encore si et seulement s’il existe une application C-linéaire L de C dans C et une fonction r de C dans C définie au moins sur (dom f − a) \ {0} tels que limh→0 r(h) = 0 et f (a + h) = f (a) + L(h) + |h|r(h), auquel cas L(1) = f $ (a). On en déduit aisément une condition nécessaire et suffisante de C-dérivabilité due à Maurice Fréchet et Grace Young. Proposition. Soit f une fonction de C dans C et a ∈ int dom f. Alors f est C-dérivable en a si et seulement si les deux conditions suivantes sont réalisées a. f , considérée comme fonction de R2 dans R2 , est dérivable en a; b. D1 f (a) = 1i D2 f (a), auquel cas on a f $ (a) = D1 f (a) = 1i D2 f (a). Démonstration. Par la proposition précédente, on voit que f est Cdérivable en a si et seulement si f , considérée comme fonction de R2 dans R2 est dérivable en a et sa dérivée totale en a est une application C-linéaire de C dans C. Il existera donc un b ∈ C tel que l’on ait, pour tout h ∈ C, fa$ (h) = bh = b(h1 + ih2 ) = bh1 + (ib)h2, ce qui entraı̂ne aussitôt, puisque fa$ (h) = h1 D1 f (a) + h2 D2 f (a), que 1 D1 f (a) = b = D2 f (a), i et f $ (a) = fa$ (1) = D1 f (a). La condition b du théorème de Fréchet-Young porte le nom de condition de Cauchy-Riemann. Comme Dk f (a) = (Dk f1 (a), Dkf2 (a)) (k = 1, 2) et que le deuxième membre s’écrit encore, en notations complexes, Dk f (a) = Dk f1 (a) + iDk f2 (a) (k = 1, 2), 106 CHAPITRE 3. DÉRIVABILITÉ ou Dk f (a) = Dk 8f (a) + iDk 9f (a), (k = 1, 2), les conditions de Cauchy-Riemann s’écrivent également, en égalant les parties réelles et imaginaires des deux membres de la condition b, D1 f1 (a) = D2 f2 (a), D2 f1 (a) = −D1 f2 (a), ou D1 8f (a) = D2 9f (a), D2 8f (a) = −D1 9f (a). La matrice jacobienne en a d’une fonction C-dérivable en a a donc ses termes diagonaux égaux et ses termes hors-diagonale opposés. Exemple. L’application f de C dans C définie par f (z) = |z|2 n’est Cdérivable qu’en z = 0. En effet, si z = x + iy, on a f1 (z) = 8f (z) = x2 + y 2 , f2 (z) = 9f (z) = 0, et f , considérée comme fonction de R2 dans R2 possède évidemment une dérivée totale en chaque point a = (a1 , a2 ) = a1 + ia2 . En un tel point, on a D1 f1 (a) = 2a1 , D2 f1 (a) = 2a2 , D1 f2 (a) = 0, D2 f2 (a) = 0, et les conditions de Cauchy-Riemann 2a1 = 0, 2a2 = 0, sont donc satisfaites si et seulement si a = 0. Enfin, on obtient aisément les règles de calcul suivantes, en utilisant la définition de la C-dérivabilité en terme de limite du taux d’accroissement et les propriétés des limites par rapport aux opérations algébriques sur les fonctions. Proposition. Soient f et g deux fonctions de C dans C qui sont C-dérivables en a non isolé dans dom f ∩ dom g. Alors : 1. f + g est C-dérivable en a et (f + g)$ (a) = f $ (a) + g $(a). 2. f g est C-dérivable en a et (f g)$ (a) = f $ (a)g(a) + f (a)g $ (a). 3. Si g(a) /= 0, fg est C-dérivable en a et 4 5$ f g (a) = f $ (a)g(a) − f (a)g $ (a) . (g(a))2 107 3.7. EXERCICES Enfin, si f est C-dérivable en a et g est C-dérivable en f (a), alors g ◦ f est C-dérivable en a et (g ◦ f )$ (a) = g $ (f (a))f $ (a). Une conséquence immédiate de cette proposition et des exemples donnés plus haut est que tout polynôme de C dans C est C-dérivable en chaque point de C et que toute fonction rationnelle de C dans C est C-dérivable en chaque point où son dénominateur ne s’annule pas. 3.7 Exercices 1. Soit f une fonction de R dans R∗+ dérivable en a ∈ R. On appelle dérivée logarithmique de f en a le nombre réel Dlog f (a) = f $ (a) = (log f )$ (a). f (a) Montrer que si f et g sont deux fonctions de R dans R∗+ dérivables en a ∈ R, alors on a Dlog (f g)(a) = Dlog f (a) + Dlog g(a), f Dlog (a) = Dlog f (a) − Dlog g(a). g 2. Soit E une partie non vide de Rn , a ∈ E et b ∈ Rn tel que |b|2 = 1. On dit que b est tangent à E en a s’il existe une suite (xk )k∈N dans E \ {a} qui −a converge vers a et est telle que la suite ( |xxkk−a| )k∈N converge vers b. Montrer 2 n que si a ∈ int E, alors tout b ∈ R tel que |b|2 = 1 est tangent à E en a. Montrer que si E = {(r, r 2) ∈ R2 : r ∈ R}, alors b est tangent à E en 0 si et seulement si b = e1 ou b = −e1 . 3. Soit f une fonction de Rn dans Rp dérivable en a ∈ dom f. Montrer qu’il existe au plus une application linéaire L de Rn dans Rp telle que f (a + h) = f (a) + L(h) + |h|2 r(h), avec r définie au moins sur (dom f − a) \ {0} et lim r(h) = 0, h→0 si et seulement s’il existe une base {b1 , b2, . . . , bn} formée d’éléments bj tangents à dom f en a. 108 CHAPITRE 3. DÉRIVABILITÉ 4. Si m > 0 est un réel, on dit qu’une application f de Rn dans Rp est homogène de degré m si, pour tout a ∈ Rn et tout t ∈ R, on a f (ta) = tm f (a). En dérivant les deux membres de cette expression par rapport à t en t = 1, montrer que si f est dérivable en a, on a la formule d’Euler n $ aj Dj f (a) = mf (a). j=1 5. Si f est une application de Rn dans Rn et k ≥ 1 un entier, posons f k = f ◦ f ◦ . . . ◦ f (k fois). Montrer par récurrence sur k que si f est dérivable en chaque point a ∈ Rn , alors, pour chaque k ≥ 2, f k est dérivable en chaque point a ∈ Rn et (f k )$a = ff$ k−1 (a) ◦ . . . ◦ ff$ (a) ◦ fa$ . 6. Soit v une fonction de R dans Rp dérivable en chaque point de R, aj ∈ R, bj ∈ R, (1 ≤ j ≤ n). Montrer que la fonction u de Rn dans Rp définie par u(x) = v & n $ ak xk k=1 est telle que, pour chaque x ∈ Rn , $ bj Dj u(x) = j=1 n $ aj bj v $ j=1 & ' n $ k=1 ' ak xk . 7. Soit f une fonction de Rn dans R dérivable en a, g et h des fonctions de Rn dans Rn définies en a. On appelle dérivée de Lie en a de f par rapport à g le réel Lg f (a) = fa$ (g(a)) = n $ gj (a)Dj f (a) = (g(a)|∇f (a)), j=1 et on appelle dérivée de Lie en a de h par rapport à g l’élément de Rn Lg h(a) = h$a (g(a)) = n $ j=1 gj (a)Dj h(a). 109 3.8. PETITE ANTHOLOGIE Montrer que si ϕ est une fonction de Rn dans R et κ une fonction de Rn dans Rn dérivables en a et si c ∈ Rn , alors Lg (f + ϕ)(a) = Lg f (a) + Lg ϕ(a), Lg (h + κ)(a) = Lg h(a) + Lg κ(a), Lg (cf )(a) = cLg f (a), Lg (ch)(a) = cLg h(a), Lg (f ϕ)(a) = ϕ(a)Lg f (a) + f (a)Lg ϕ(a). 8. Soit f une fonction de R dans Rp et a non isolé dans dom f. Montrer que f est dérivable en a si et seulement s’il existe une fonction ϕ de R dans Rp, continue en a et telle que f (x) = f (a) + (x − a)ϕ(x), pour tout x ∈ dom f (caractérisation de Carathéodory). (Suggestion: prendre pour ϕ le prolongement continu en a de ∆a f ). Soit f une fonction de Rn dans R et a non isolé dans dom f. Montrer que f est dérivable en a si et seulement s’il existe une fonction ϕ de Rn dans Rn continue en a et telle que f (x) = f (a) + (x − a|ϕ(x)), pour tout x ∈ dom f. (Suggestion: si f (a + h) = f (a) + (∇f (a)|h) + |h|2r(h), noter que |h|2 r(h) = r(h) |h|2 (h|h)). 3.8 Petite anthologie Dérivée Les rapports ultimes dans lequels les quantités disparaissent ne sont pas réellement les rapports de quantités ultimes, mais les limites vers lesquelles les rapports de quantités, décroissant sans limite, s’en approchent toujours; et vers lesquelles ils peuvent s’en approcher aussi près que toute différence donnée, mais dont ils ne peuvent jamais les dépasser ou atteindre avant que les quantités soient diminuées indéfiniment. Isaac Newton, 1687 Le calcul différentiel en fait consiste seulement en la détermination algébrique de la limite d’un quotient. Jean Le Rond d’Alembert, 1754 110 CHAPITRE 3. DÉRIVABILITÉ Si l’on pose alors ∆x = i, les deux termes du rapport aux différences ∆y f (x + i) − f (x) = , ∆x i seront des quantités infiniment petites. Mais, tandis que ces deux termes s’approcheront indéfiniment et simultanément de la limite zéro, le rapport lui-même pourra converger vers une autre limite, soit positive, soit négative. Cette limite, lorsqu’elle existe, a une valeur déterminée pour chaque valeur particulière de x. Pour indiquer cette dépendance, on donne à la nouvelle fonction le nom de fonction dérivée, et on la désigne, à l’aide d’un accent, par la notation y $ ou f $ (x). Augustin Cauchy, 1823 f (x0 + h) = f (x0 ) + c.h + h.h1 (h) où h1 tend vers zéro avec h et c est une constante : là-dedans se trouve la véritable notion de dérivée. Karl Weierstrass, 1874 Dérivées partielles et dérivée totale Juste comme une fonction de y et z ne peut pas être appelée continue en un point quand elle y est continue comme une fonction de y seulement, z étant constante, et comme une fonction de z seulement, y étant constant, on ne peut pas appeler la fonction dérivable simplement parce que les dérivées partielles existent. Karl Thomae, 1873 f a une différentielle première en (x, y), donnée par df (x, y) = ∂f (x, y) ∂f (x, y) ξ+ η, ∂x ∂y si, pour tous les points (x + ξ, y + η) proches de (x, y) on peut écrire f (x + ξ, y + η) = f (x, y) + df (x, y) + ξρ(ξ, η) + ησ(ξ, η), où ρ(ξ, η) et σ(ξ, η) sont des fonctions de ξ, η qui tendent vers zéro lorsque ξ et η tendent vers zéro. Otto Stolz, 1893 111 3.8. PETITE ANTHOLOGIE Dès que nous quittons le domaine d’une seule variable dans les applications des définitions fondamentales du calcul différentiel, nous sentons presqu’immédiatement que nous nous trouvons sur un sol moins sûr. Il ne peut pas, par la nature des choses, exister une théorie applicable aux fonctions de deux ou plus variables aussi élégante et simple que celle du coefficient différentiel. Une connaissance des coefficients dérivées partielles dans le cas le plus général n’est en aucune manière équivalent à celui du seul coefficient différentiel d’une fonction d’une variable. En fait, gardant à l’esprit l’interprétation géométrique usuelle, et, fixant notre pensée sur le plan comme image géométrique de la région de variation de deux variables, nous ne pouvons même pas affirmer qu’une connaissance des coefficients différentiels dans toutes les directions issues du point constitue l’équivalent de la connaissance du coefficient différentiel dans le cas d’une seule variable. Pour comprendre et pour caractériser le comportement d’une fonction au voisinage d’un point, nous devons recourir à ce qui a été appelé la différentielle. William H. Young, 1909 C-dérivée Supposons d’ailleurs que Z reste fonction continue de z, du moins pour des valeurs de z comprises entre certaines limites. Pour de telles valeurs de z, à des accroissements infiniment petits ∆x, ∆y de x, y correspondront des accroissements infiniment petits ∆z, ∆Z de z, Z; et la dérivée de la variable Z considérée comme fonction de z ne sera autre chose que la limite dont s’approchera indéfiniment le rapport ∆Z ∆z tandis que ∆x, ∆y s’approcheront indéfiniment de zéro. Cette dérivée sera désignée par la notation Dz Z. Cela posé, la dérivée de Z, relative à z, se confondra évidemment avec le rapport différentiel de Z à z, c’est-à-dire avec le rapport dZ dz . Si, dans cette formule, on substitue à la différentielle dz, sa valeur dz = dx+idy, et à la différentielle dZ sa valeur dZ = Dx Z dx + Dy Z dy, on trouvera Dz Z = Si, d’ailleurs, on pose dy dx DxZ dx + Dy Z dy . dx + idy = tg-, cette dernière équation donnera Dz Z = Dx Z cos - + Dy Z sin . cos - + i sin - 112 CHAPITRE 3. DÉRIVABILITÉ ... Il suit immédiatement de cette formule que la dérivée de Z, considérée comme fonction de z, dépend en général, non seulement de la position du point A de coordonnées rectangulaires x, y sur la ligne qu’il décrit, mais encore de la direction de cette ligne. Cette dérivée deviendra indépendante de l’angle - si ... Dy Z = iDxZ. Augustin Cauchy, 1853 Lorsqu’une fonction u d’une variable imaginaire z est continue, à un accroissement infiniment petit de la variable correspond un accroissement infiniment petit de la fonction, et la limite du rapport de l’accroissement de la fonction à l’accroissement de la variable est la dérivée de la fonction. On a donc du dX + idY = = dz dx + idy ou du = dz dX dx dX dx dx + dX dy dy + ( dX dx dx + dx + idy dX dY dy + i dY dx + ( dy + i dy ) dx dy 1 + i dx dY dy dy)i , . En général, la dérivée dépend de la quantité dy dx , et par conséquent de la direction du déplacement infiniment petit donné au point z. A chaque direction de déplacement correspond une dérivée particulière, et la fonction a ainsi, pour une même valeur de z, une infinité de dérivées. Lorsque la valeur de la dérivée est indépendante de la direction du déplacement, en d’autres termes, lorsque la fonction admet une dérivée unique en chaque point, M. Cauchy dit que la fonction est monogène. Charles Briot et Jean-Claude Bouquet, 1856 Chapitre 4 Fonctions continues ou dérivables 4.1 Propriétés locales et propriétés globales Il est important en mathématiques de distinguer les propriétés locales des propriétés globales et d’étudier leurs relations. Si E est une partie non vide de Rn , et P est une propriété, on dira que P est localement vérifiée sur E si, pour chaque a ∈ E, il existe un nombre δ = δ(a) > 0 tel que P soit vérifiée sur E ∩ B∞ [a; δ(a)]. Bien entendu, une telle définition est indépendante du choix de la norme dans Rn et nous avons choisi | · |∞ pour des raisons de commodité qui apparaı̂tront plus tard. Il est clair que si P est vérifiée sur E, alors P est vérifiée localement sur E, mais la réciproque est fausse. Ainsi, prenant pour P la propriété “être fini”, on voit que E sera localement fini si, pour chaque a ∈ E, il existe δ = δ(a) > 0 tel que E ∩B∞ [a; δ(a)] soit fini. Z n’est pas fini mais est localement fini (prendre par exemple δ(k) = 1/2 pour k ∈ Z), et E = {1/k : k ∈ N∗ }, également infini, est localement fini (prendre δ(1/k) = 1/2k(k + 1)). On a dit au Chapitre 2 qu’une fonction f de Rn dans Rp est localement bornée en a ∈ Rn si la condition (∃δ > 0)(∃r > 0)(∀x ∈ dom f ∩ B∞ [a; δ]) : |f (x)|2 ≤ r est satisfaite. Cette propriété suggère la définition suivante. Soit f une fonction de Rn dans Rp et E une partie de Rn telle que dom f ∩ E /= ∅. Définition. On dit que f est bornée sur E si la condition (∃r > 0)(∀x ∈ dom f ∩ E) : |f (x)|2 ≤ r 113 114 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES est satisfaite. Il est clair que f est localement bornée en a si et seulement s’il existe δ > 0 tel que f soit bornée sur B∞ [a; δ]. La propriété pour f d’être bornée sur E est évidemment une propriété globale de E. Elle implique évidemment la propriété locale correspondante. Définition. On dit que f est localement bornée sur E si (∀a ∈ E)(∃δ(a) > 0)(∃r(a) > 0)(∀x ∈ dom f ∩ E ∩ B∞ [a; δ(a)]) : |f (x)|2 ≤ r(a). Il est clair que si f est bornée sur E, elle est localement bornée sur E, et que f est localement bornée sur E si et seulement si f est localement bornée en chaque a ∈ E, au sens de la définition du Chapitre 2. Par exemple, la fonction f de R dans R définie par f (x) = x1 est localement bornée sur R∗+ . En effet, étant donné a > 0, si l’on prend# δ(a) = a/2, on voit que pour # #1# a 3a 1 2 2 x ∈ ] 2 , 2 ], on aura x ∈ [ 3a , a [, et donc # x # < a2 . La valeur r(a) = 2/a convient donc dans la définition. Par contre, cette fonction n’est pas bornée 1 sur R∗+ puisque, pour chaque r > 0, on aura 1/2r = 2r > r. Ainsi donc, la propriété: la fonction f est localement bornée sur l’ensemble E n’implique pas nécessairement que f soit bornée sur E. Comme autre exemple, considérons la propriété, pour une fonction f de Rn dans R, d’être de signe constant sur E ⊂ Rn , c’est-à-dire d’être strictement positive sur E ou strictement négative sur E. C’est une propriété globale sur E qu’on peut localiser en disant que f est localement de signe constant sur E si, pour chaque a ∈ E, il existe δ(a) > 0 tel que f soit de signe constant sur E ∩B∞ [a; δ(a)]. Toute fonction de signe constant sur E est évidemment localement de signe constant sur E, mais la réciproque est fausse. Ainsi, l’identité de R dans R n’est pas de signe constant sur R \ {0}, mais elle y est localement de signe constant. En effet, si a > 0, on voit que f est strictement positive sur [a/2, 2a/2] et si a < 0, f est strictement négative sur [3a/2, a/2]. On voit donc que δ(a) = |a|/2 convient dans la définition. Une propriété vérifiée localement sur E introduit donc une application δ : E → R∗+ , a 2→ δ(a), dont la valeur en a fixe sur le rayon d’une boule centrée en a telle que la propriété P ait lieu sur E ∩ B∞ [a; δ(a)]. Une telle application sera appelée une jauge sur E. Nous allons développer une technique permettant de montrer que, pour certaines classes d’ensembles E de Rn , une propriété localement satisfaite sur E y sera globalement vérifiée. En utilisant le théorème des intervalles fermés emboı̂tés, nous montrerons 4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN 115 d’abord que c’est le cas pour les intervalles fermés (bornés) de R et les produits cartésiens de tels intervalles dans Rn . C’est le fait qu’une boule en norme | · |∞ soit un produit d’intervalles fermés bornés qui suggère, par commodité, le choix de cette norme. Nous étendrons ensuite le résultat à une classe plus vaste de parties de Rn . 4.2 P-partitions d’un pavé et lemme de Cousin Généralisons à Rn la notion d’intervalle. Définition. On appelle pavé de Rn toute partie K ⊂ Rn de la forme K = K1 × K2 × . . . × Kn = n 6 Ki , i=1 où, pour chaque 1 ≤ i ≤ n, Ki = [ai , bi] est un intervalle fermé de R. On appelle pavé ouvert de Rn toute partie J ⊂ Rn de la forme J = J1 × J2 × . . . × Jn = n 6 Ji , i=1 où, pour chaque 1 ≤ i ≤ n, Ji = ]ai , bi[ est un intervalle ouvert de R. Enfin, on appelle semi-pavé de Rn toute partie I ⊂ Rn de la forme I = I1 × I2 × . . . × In = n 6 Ii , i=1 où, pour chaque 1 ≤ i ≤ n, Ii = ]ai , bi] est un intervalle ouvert à gauche et fermé à droite. Lorsque b1 − a1 = b2 − a2 = . . . = bn − an , on parlera respectivement d’un n-cube, d’un n-cube ouvert ou d’un n-semi-cube. Ainsi donc, avec les notations de la définition, K = {x ∈ Rn : ai ≤ xi ≤ bi , (1 ≤ i ≤ n)}, J = {x ∈ Rn : ai < xi < bi , (1 ≤ i ≤ n)}, I = {x ∈ Rn : ai < xi ≤ bi , (1 ≤ i ≤ n)}. Exemple. Pour chaque a ∈ Rn et chaque r > 0, B∞ [a; r] est le n-cube [a1 − r, a1 + r] × [a2 − r, a2 + r] × . . . × [an − r, an + r]. 116 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Définition. On dit que (K (i))i∈N est une suite de pavés emboı̂tés de Rn si chaque K (i) est un pavé de Rn et si, pour chaque i ∈ N, on a K (i+1) ⊂ K (i). Si, pour chaque i ∈ N, (i) (i) K (i) = K1 × K2 × . . . × Kn(i) , l’hypothèse que (K (i))i∈N soit une suite de pavés emboı̂tés équivaut évidem(i) ment à ce que, pour chaque 1 ≤ j ≤ n, la suite (Kj )i∈N soit une suite d’intervalles fermés emboı̂tés de R. Le résultat suivant, appelé théorème des pavés emboı̂tés, est une conséquence facile du théorème des intervalles fermés emboı̂tés. Proposition. Si (K (i))i∈N est une suite de pavés emboı̂tés de Rn , alors (i) /= ∅. i∈N K 7 Démonstration. Soit (K (i))i∈N une suite de pavés emboı̂tés de Rn . Si, pour chaque i ∈ N, on écrit (i) (i) K (i) = K1 × K2 × . . . × Kn(i) , (i) alors, pour chaque 1 ≤ j ≤ n, la suite (Kj )i∈N est une suite d’intervalles fermés emboı̂tés de R, et il existe donc un réel cj tel que, pour chaque i ∈ N, on ait (i) cj ∈ K j . Dès lors, c = (c1 , c2 , . . . , cn) ∈ Rn est tel que, pour chaque i ∈ N, on a (i) c’est-à-dire c ∈ 7 (i) c ∈ K1 × K2 × . . . × Kn(i) = K (i), i∈N K (i) . Pour étudier les relations entre les pavés, pavés ouverts et semi-pavés, on a besoin des compléments suivants sur l’intérieur et l’adhérence d’une partie de Rn . Proposition. Si m ≥ 1, p ≥ 1 sont des entiers et si A ⊂ Rm et B ⊂ Rp, alors int (A × B) = int A × int B, adh (A × B) = adh A × adh B. 4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN 117 Démonstration. Soit x = (y, z) ∈ int (A × B), avec y ∈ A et z ∈ B. Il existe donc r > 0 tel que n B∞ [x; r] ⊂ A × B, n [x; r] désigne la boule de centre x et de rayon r dans Rn avec n = m+p. où B∞ Comme n m p B∞ [x; r] = B∞ [y; r] × B∞ [z; r], on aura évidemment m p B∞ [y; r] ⊂ A et B∞ [z; r] ⊂ B, ce qui montre que y ∈ int A et z ∈ int B, et donc que x = (y, z) ∈ int A × int B. Réciproquement, si x = (y, z) ∈ int A × int B, alors y ∈ int A et z ∈ int B, et il existera r1 > 0 et r2 > 0 tels que m p B∞ [y; r1] ⊂ A et B∞ [z; r2] ⊂ B. En conséquence, si r = min{r1 , r2 }, on aura n m p B∞ [x; r] = B∞ [y; r] × B∞ [z; r] ⊂ A × B, ce qui montre que x ∈ int (A × B). On a donc démontré la première égalité. Pour la seconde, notons que x = (y, z) ∈ adh (A × B) si et seulement si, n [x; r] ∩ (A × B) /= ∅, c’est-à-dire si et seulement pour chaque r > 0, on a B∞ si, pour chaque r > 0, on a m p B∞ [y, r] ∩ A /= ∅ et B∞ [z; r] ∩ B /= ∅, c’est-à-dire si et seulement si y ∈ adh A et z ∈ adh B, ou encore si et seulement si x = (y, z) ∈ adh A × adh B. En appliquant ce résultat de proche en proche et en le combinant avec les calculs d’intérieur et d’adhérence des différents types d’intervalles de R, on obtient aussitôt le corollaire suivant. 118 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Corollaire. Soient ai < bi , (1 ≤ i ≤ n), des réels, et soient K= n 6 [ai, bi], J = i=1 n 6 ]ai , bi[, I = i=1 n 6 ]ai , bi]. i=1 Alors, int K = int J = int I = J, K = J = I = K. Rappelons que si E est un ensemble quelconque et (Eα)α∈A une famille de parties Eα de E, on dit que (Eα)α∈A partitionne E ou est une partition de E si les deux conditions suivantes sont vérifiées : 1) (∀α ∈ A)(∀β ∈ A : α /= β) : Eα ∩ Eβ = ∅. ! 2) E = α∈A Eα. En d’autres termes, les Eα doivent être des parties mutuellement disjointes de E dont l’union redonne E. Comme on travaillera en général avec des partitions en un nombre fini d’ensembles, on utilisera l’abus de notation commode consistant à désigner, lorsque A = {α1 , . . . , αm }, la famille (Eα)α∈A par {Eα1 , Eα2 , . . . , Eαm }. Bien entendu, (E) est une partition de E, que l’on qualifiera de triviale. On se convaincra aisément que, à l’exception de la partition triviale, il n’est pas possible de partitionner un pavé en un nombre fini de pavés et qu’il n’est pas possible de partitionner un pavé ouvert en un nombre fini de pavés ouverts. Ainsi, {[a, c], [c, b]} avec a < c < b n’est pas une partition de [a, b] puisque [a, c] ∩ [c, b] = {c}, et {]a, c[, ]c, b[} n’est pas une partition de ]a, b[ puisque ]a, c[ ∪ ]c, b[ /= [a, b[. Par contre, il est toujours possible de partitionner un semi-pavé en un nombre fini de semi-pavés, puisque, si = a < c < b, {]a, c], ]c, b]} est une partition de ]a, b], et que si I = ni=1 Ii est un semi-pavé de Rn et si, pour chaque 1 ≤ i ≤ n, les intervalles semi-ouverts Ii1 , Ii2 , . . . , Iiki partitionnent l’intervalle semi-ouvert Ii , alors la famille finie {I1j1 × I2j2 × . . . × Injn : 1 ≤ j1 ≤ k1 , 1 ≤ j2 ≤ k2 , . . . , 1 ≤ jn ≤ kn } est une partition de I en un nombre fini de semi-pavés. Notons aussi que si (I j )1≤j≤m est une partition du semi-pavé I en semi-pavés, alors, de la ! j relation I = m j=1 I , on déduit aussitôt I¯ = m > j=1 Ij = m > j=1 Ij. 4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN 119 Dans l’étude du passage d’une propriété locale à une propriété globale, il est utile de considérer des partitions d’un semi-pavé de Rn en un nombre fini de semi-pavés à chacun desquels est attaché un point de son adhérence. Ce concept se formalise comme suit. Définition. Soit I ⊂ Rn un semi-pavé. Une P-partition de I est une famille finie 8 9 ? @ Π = (xj , I j ) = (x1 , I 1), (x2, I 2 ), . . ., (xm, I m ) 1≤j≤m telle que : 1) (I j )1≤j≤m = {I 1 , I 2 , . . . , I m} est une partition de I en semi-pavés. 2) xj ∈ I j pour chaque 1 ≤ j ≤ m. ¯ {(c, I)} est une P-partition du semi-pavé I Ainsi, quel que soit c ∈ I, n de R et {(0, ]0, 1]), (2, ]1, 3])} est une P-partition de ]0, 3]. Bien entendu, si les semi-pavés I 1 , . . . I q partitionnent le semi-pavé I et si, pour chaque 1 ≤ l ≤ q, 8 9 Πl = (xl,jl , I l,jl ) 1≤jl ≤ml est une P-partition de I l , alors 8 Π = (xl,jl , I l,jl ) 9 1≤jl ≤ml , 1≤l≤q sera une P-partition de I que l’on désignera souvent d’une manière impropre mais commode par la notation {Π1 , Π2 , . . . , Πq }. On a vu qu’une propriété locale P sur un ensemble E de Rn s’obtient en associant à chaque point x ∈ Rn un nombre strictement positif (pouvant dépendre de x) δ(x) tel que P soit satisfaite sur E ∩ B∞ [x; δ(x)], c’est-à-dire en donnant une jauge δ sur E. La donnée d’une jauge sur l’adhérence I¯ d’un semi-pavé permet de mesurer la “finesse” d’une P-partition de I. A B Définition. Si I ⊂ Rn est un semi-pavé, Π = (xj , I j ) 1≤j≤m une P¯ on dit que Π est δ-fine si, pour chaque partition de I et δ une jauge sur I, 1 ≤ j ≤ m, on a I j ⊂ B∞ [xj ; δ(xj )]. Comme, pour chaque 1 ≤ j ≤ m, on a adh B∞ [xj ; δ(xj )] = B∞ [xj ; δ(xj )], (4.1) 120 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES on voit que la condition (4.1) équivaut à ce que, pour chaque 1 ≤ j ≤ m, on ait I j ⊂ B∞ [xj ; δ(xj )]. ¯ dont la valeur constante est Lorsque δ est une jauge constante sur I, également notée δ, il est facile de construire une P-partition δ-fine de I. Si I = I1 × . . . × In , avec, pour chaque 1 ≤ k ≤ n, Ik = ]ak , bk ], il suffit en effet de partitionner Ik en q semi-intervalles Ikl = ]clk , cl+1 k ] de longueur l ≤ δ (1 ≤ l ≤ q − 1), de considérer la partition produit cl+1 − c k k (I1l1 × I2l2 × . . . × Inln )(1≤lk ≤q; 1≤k≤n) , et d’associer à chacun des semi-pavés I j de cette partition un élément quelconque xj appartenant à son adhérence (1 ≤ j ≤ m). Ici, m = q n . En effet, = si I j = nk=1 ]ajk , bjk ], alors on a, par construction, pour chaque 1 ≤ k ≤ n, bjk − ajk ≤ δ, et dès lors xjk − δ ≤ bjk − δ ≤ ajk < bjk ≤ ajk + δ ≤ xjk + δ, ce qui entraı̂ne aussitôt que I j ⊂ B∞ [xj ; δ] = B∞ [xj ; δ(xj )]. On ne dispose pas d’un tel procédé de construction dans le cas d’une ¯ et l’existence d’une P-partition δ-fine résulte alors jauge quelconque δ sur I, de l’important résultat suivant, qu’on appelle le lemme de Cousin. ¯ alors il existe Théorème. Si I un semi-pavé de Rn et δ une jauge sur I, une P-partition δ-fine de I. Démonstration. Supposons le résultat faux et soit δ une jauge sur I¯ telle = que I n’admette pas de P-partition δ-fine. Partitionnons I = ni=1 ]ai , bi] en 2n semi-pavés congruents par bissection des côtés. En d’autres termes, = partitionnons I en 2n semi-pavés congruents du type ni=1 ]ci , di] avec ci = ai , di = ai + bi ai + bi , ou ci = , di = bi , (1 ≤ i ≤ n). 2 2 L’un de ces semi-pavés au moins, disons I (1), n’admet pas de P-partition δ-fine car, autrement, la réunion des P-partitions δ-fines de chaque semipavé de la division fournirait une P-partition δ-fine de I, ce qui a été exclu. Partitionnons alors I (1) en 2n semi-pavés congruents par bissection des côtés, comme on l’a fait pour I. L’un de ces semi-pavés au moins, disons 4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE 121 I (2) n’admettra pas de P-partition δ-fine. En continuant indéfiniment cette construction, on obtient une suite (I (k))k∈N de semi-pavés, avec I (0) = I, vérifiant les propriétés suivantes : (i) chaque I (k) n’admet pas de P-partition δ-fine; (ii) I (k+1) ⊂ I (k), (k ∈ N); (iii) si d = max{bi − ai : 1 ≤ i ≤ n} désigne la longueur du plus grand côté de I, alors, pour tout x ∈ I (k) et tout y ∈ I (k), on a |x − y|∞ ≤ 2dk , (k ∈ N). Cette dernière propriété résulte du fait que la longueur de chacun des côtés d’un semi-pavé I (k) est deux fois plus petite que celle du côté correspondant du semi-pavé qui le précède dans la suite. En conséquence, la suite (I (k))k∈N constitue une suite de pavés emboı̂tés 7 et, par le théorème des pavés emboı̂tés, il existe c ∈ k∈N I (k) . Choisissons p ∈ N suffisamment grand pour que 2dp ≤ δ(c). Comme c ∈ I (p), on aura, pour tout x ∈ I (p), d |x − c|∞ ≤ p ≤ δ(c), 2 8 9 c’est-à-dire I (p) ⊂ B∞ [c; δ(c)], et (c, I (p)) sera une P-partition δ-fine de I (p), ce qui contredit la propriété (i) ci-dessus. Remarque. La démonstration que nous venons de faire prouve en fait que ¯ il existe une P-partition pour tout semi-pavé I de Rn et toute jauge δ sur I, A j j B j δ-fine (x , I ) 1≤j≤m telle que chaque I soit semblable à I, c’est-à-dire telle que, si I = =n i=1 ]ai , bi] et I j = =n j j i=1 ]ai , bi ], (1 ≤ j ≤ m), on ait bj1 − aj1 bj − aj2 bj − ajn = 2 = ... = n . b1 − a1 b2 − a2 bn − an Une telle P-partition est appelée une P-partition régulière de I. 4.3 Propriété de valeur intermédiaire Montrons tout d’abord qu’une fonction réelle, non nulle et continue en un point garde son signe sur un voisinage du point: la propriété ponctuelle devient une propriété locale. Lemme. Soit f une fonction de Rn dans R continue en a ∈ dom f . Si f (a) > 0 (resp. f (a) < 0), il existe δ = δ(a) > 0 tel que, pour tout x ∈ dom f ∩ B∞ [a; δ(a)], on ait f (x) > 0 (resp. f (x) < 0). 122 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Démonstration. Faisons-la dans le cas où f (a) > 0, l’autre cas s’y ramenant en remplaçant f par −f. En prenant ! = f (a) 2 dans la définition de continuité de f en a, on obtient l’existence d’un δ = δ(a) > 0 tel que, pour tout x ∈ dom f ∩ B∞ [a; δ(a)], on aura − et donc f (x) ≥ f (a) 2 f (a) f (a) ≤ f (x) − f (a) ≤ , 2 2 > 0. Remarque. La conclusion de la proposition précédente peut encore s’exprimer en disant que, pour tout x ∈ dom f ∩B∞ [a; δ(a)], on aura f (x)f (a) > 0. Le théorème de Cousin permet, sous certaines conditions, de passer de ce résultat local à un résultat global. Si f est une fonction de Rn dans Rp et E ⊂ dom f , on dira que f est continue sur E si f est continue en chaque point de E. Montrons tout d’abord qu’une fonction réelle d’une variable réelle continue et non nulle sur un intervalle fermé garde un signe constant sur cet intervalle. Proposition. Soit f une fonction de R dans R continue sur l’intervalle fermé [a, b]. Si, pour chaque x ∈ [a, b], on a f (x) /= 0, alors f (a)f (b) > 0. Démonstration. Par la proposition précédente appliquée à chaque point de [a, b], on trouve que (∀x ∈ [a, b])(∃δ(x) > 0)(∀y ∈ [a, b] ∩ [x − δ(x), x + δ(x)]) : f (y)f (x) > 0. On obtient ainsi une jauge δ : x 2→ δ(x) sur [a, b], et leAlemme Bde Cousin garantit alors l’existence d’une P-partition δ-fine Π = (xj , I j ) 1≤j≤m de I = ]a, b], que l’on peut évidemment toujours numéroter de telle sorte que, si I j = ]aj−1 , aj ], on ait a = a0 < a1 < a2 < . . . < am−1 < am = b. Comme Π est δ-fine, on a, pour chaque 1 ≤ j ≤ m, [aj−1 , aj ] ⊂ [xj − δ(xj ), xj + δ(xj )], et dès lors f (aj−1 )f (xj ) > 0, f (aj )f (xj ) > 0, ce qui entraı̂ne aussitôt que f (aj−1 )f (aj ) > 0, et la thèse s’en déduit. 4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE 123 Remarque. Le résultat est faux si f cesse d’être continue en un point de [a, b] (considérer par exemple la fonction f définie sur [0, 1] par f (x) = −1 si x ∈ [0, 12 ] et f (x) = 1 si x ∈ ] 12 , 1]) ou si elle est continue sur un ensemble qui n’est pas un intervalle (considérer par exemple la fonction f définie sur [0, 1] ∪ [2, 3] par f (x) = −1 si x ∈ [0, 1] et f (x) = 1 si x ∈ [2, 3]). La forme contraposée de cette proposition fournit, pour une fonction réelle d’une variable réelle, une utile condition suffisante d’existence d’un zéro, appellée le théorème de Bolzano. C’est Bernard Bolzano qui le premier, en 1817, sentit la nécessité de donner une démonstration analytique de ce résultat, considéré jusqu’alors comme “géométriquement” évident. Corollaire. Soit f une fonction de R dans R continue sur [a, b]. Si f (a)f (b) ≤ 0, alors il existe au moins un c ∈ [a, b] tel que f (c) = 0. Une conséquence utile du théorème de Bolzano est l’existence d’un zéro réel pour tout polynôme réel de degré impair. Corollaire. Tout polynôme à coefficients réels de degré impair possède au moins un zéro réel. Démonstration. Soit p : R → R, x 2→ m $ aj xj , j=0 un polynôme à coefficients réels aj de degré impair m (am /= 0). Sans perte de généralité, on peut supposer que am > 0, puisque, dans le cas contraire, il suffit de considérer −p. On sait que p est continue sur R et, pour tout x /= 0, on a %m−1 Comme j=0 aj |x| ≥ ρ, on ait p(x) = xm am + xj−m m−1 $ j=0 aj xj−m . → 0 si x → ∞, il existera ρ > 0 tel que, pour tout # # #m−1 # #$ # am j−m # # a x j # #≤ 2 . # j=0 # Cela entraı̂ne en particulier que p(ρ) = ρm am + m−1 $ j=0 aj ρj−m ≥ ρm am > 0, 2 124 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES et p(−ρ) = −ρ m am + m−1 $ j=0 aj (−ρ) j−m ≤ −ρm am < 0. 2 La thèse résulte alors du théorème de Bolzano. Il résulte immédiatement de ce résultat que tout nombre réel possède une racine ne réelle lorsque n est impair. On va l’utiliser pour démontrer l’existence de la racine ne complexe d’un nombre complexe quelconque pour tout entier n strictement positif. Proposition. Pour chaque entier n ≥ 1, et chaque c ∈ C, il existe au moins un z ∈ C tel que z n = c. Démonstration. Le résultat est trivial pour n = 1. Si n = 2 et c = a + ib, z = x + iy, l’équation z 2 = c équivaut au système d’équations x2 − y 2 = a, 2xy = b. Comme x2 + y 2 = |z|2 = |c|, on en déduit que 2x2 = |c| + a, 2y 2 = |c| − a, ce qui fournit les solutions z= et C 1 (|c| + a) + i sign b 2 C C 1 (|c| − a), 2 C 1 1 z=− (|c| + a) − i sign b (|c| − a). 2 2 Supposons maintenant que n > 2 et démontrons le résultat par récurrence sur n. Si n est pair, disons n = 2m, il existe, par ce qui précède, au moins un η ∈ C tel que η 2 = c. Comme m < n, l’hypothèse de récurrence entraı̂ne l’existence d’un z ∈ C tel que z m = η, et dès lors tel que z n = z 2m = η 2 = c. Si n est impair, alors, puisqu’on sait déjà que tout réel possède une racine ne réelle, on peut supposer sans perte de généralité que c n’est pas réel et que |c| = 1. Soit d ∈ C tel que d2 = c, de telle sorte que dd¯ = 1. Définissons le polynôme p sur R par p(x) = i[d̄(x + i)n − d(x − i)n]. Son terme de degré n en x, i(d̄ − d)xn , est différent de zéro et, comme p(x) = p(x) pour tout x ∈ R, p est donc un polynôme réel de degré impair 4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE 125 n. Par le Corollaire précédent, il existe donc un λ ∈ R tel que p(λ) = 0, ce qui entraı̂ne d(λ + i)n = d(λ − i)n , et dès lors 4 λ+i λ−i 5n = d = d2 = c. d La propriété suivante a longtemps été confondue avec la propriété de continuité sur E. Nous verrons qu’elle est seulement une condition nécessaire de continuité sur E. Définition. Soit f une fonction de Rn dans R définie sur E ⊂ Rn . On dit que f possède la propriété de valeur intermédiaire ou la propriété de Darboux sur E ou encore que f est continue au sens de Darboux sur E si, pour chaque x ∈ E, chaque y ∈ E et chaque v compris entre f (x) et f (y), il existe au moins un z ∈ E tel que f (z) = v. En d’autres termes, une telle fonction prend sur E toutes les valeurs intermédiaires entre deux quelconques de ses valeurs. Nous allons voir que cette propriété est satisfaite par une fonction réelle continue sur une partie “d’un seul tenant” de Rn . Définition. Soit E ⊂ Rn . On dit que E est connexe par arcs si, pour tout x ∈ E et tout y ∈ E, il existe une application continue γ : [0, 1] → E telle que γ(0) = x et γ(1) = y. Intuitivement, E est connexe par arcs si deux quelconques de ses points peuvent être joints par un arc de courbe continu entièrement contenu dans E. Par exemple, tout intervalle I de R est connexe par arcs puisque, si x < y appartiennent à I, alors [x, y] ⊂ I et l’application continue γ : [0, 1] → R, t 2→ (1 − t)x + ty, satisfait bien aux conditions de la définition puisque γ([0, 1]) = [x, y] ⊂ I. Par contre, N, Z et Q ne sont pas connexes par arcs mais R l’est. De même, toute boule de Rn est connexe par arcs, de même que toute partie du type {x ∈ Rn : r ≤ |x|j ≤ R}, avec j = 1, 2 ou ∞. Mais l’union de deux boules disjointes de Rn n’est pas connexe par arcs. Proposition. Soit f une fonction de Rn dans R continue sur une partie connexe par arcs E de Rn . Alors f possède sur E la propriété de valeur intermédiaire. Démonstration. Soit x ∈ E, y ∈ E et γ : [0, 1] → E une application continue telle que γ(0) = x, γ(1) = y. Soit v compris entre f (x) et f (y) 126 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES (c’est-à-dire v ∈ [f (x), f (y)] si f (x) < f (y), v ∈ [f (y), f (x)] si f (y) < f (x) et v = f (x) = f (y) si f (x) = f (y)). Par le théorème de continuité des fonctions composées, la fonction g = f ◦ γ − v est une fonction de R dans R continue sur [0, 1], et, par construction, elle est telle que g(0)g(1) = (f (x) − v)(f (y) − v) ≤ 0. Le théorème de Bolzano entraı̂ne donc l’existence d’au moins un τ ∈ [0, 1] tel que g(τ ) = 0, c’est-à-dire de z = γ(τ ) ∈ E tel que f (z) = v. 4.4 Ouverts, fermés et bornés Introduisons des familles importantes de parties de Rn qui jouent un rôle important en analyse et qui conduiront à une extension du lemme de Cousin. Définition. On dit que E ⊂ Rn est une partie ouverte ou un ouvert de Rn si chaque élément de E est intérieur à E. En d’autres termes, E est un ouvert s’il est voisinage de chacun de ses points ou encore si int E ⊃ E, ce qui équivaut à int E = E, puisque l’inclusion inverse est toujours satisfaite. Par exemple, ∅ et Rn sont des ouverts de Rn , et ]a, b[ est un ouvert de R. De même, si a ∈ R et b ∈ R, les ensembles ]a, +∞[ = {x ∈ R : x > a} et ] − ∞, b[ = {x ∈ R : x < b} sont des ouverts de R (le vérifier). On les appelle respectivement des intervalles ouverts non bornés d’origine a et d’extrémité b. Définition. On dit que F ⊂ Rn est une partie fermée ou un fermé de Rn si tout point adhérent à F appartient à F . En d’autres termes, F est un fermé si adh F ⊂ F , ce qui équivaut à adh F = F , puisque l’inclusion inverse est toujours satisfaite. Par exemple, ∅ et Rn sont des fermés de Rn , et [a, b] est un fermé de R. D’autre part, ]a, b] et [a, b[ ne sont ni ouverts ni fermés dans R. Les notions d’ouvert et de fermé s’échangent par passage au complémentaire. Proposition. E ⊂ Rn est ouvert si et seulement si !E est fermé. Démonstration. On a !E est fermé ⇔ adh !E = !E ⇔ !int E = !E 127 4.4. OUVERTS, FERMÉS ET BORNÉS ⇔ int E = E ⇔ E est ouvert. Par conséquent, si a ∈ R et b ∈ R, les ensembles [a, +∞[ = {x ∈ R : x ≥ a} et ] − ∞, b] = {x ∈ R : x ≤ b} sont des fermés de R puisqu’ils sont respectivement les complémentaires dans R des ensembles ouverts ] − ∞, a[ et ]b, +∞[. On les appelle respectivement des intervalles fermés non bornés d’origine a ou d’extrémité b. Etudions maintenant comment se comportent les ouverts et les fermés vis-à-vis des opérations d’union et d’intersection. Le premier résultat affirme qu’une union quelconque d’ouverts est un ouvert. Proposition. Si A est un ensemble non vide quelconque et (Eα)α∈A une ! famille d’ouverts Eα de Rn , alors α∈A Eα est un ouvert de Rn . ! Démonstration. Si x ∈ α∈A Eα, il existe α̃ ∈ A tel que x ∈ Eα̃ . Comme ! Eα̃ est ouvert, il est voisinage de x et il en sera donc de même de α∈A Eα. Donc ce dernier ensemble, voisinage de chacun de ses points, est ouvert. Le deuxième résultat affirme qu’une intersection d’un nombre fini d’ouverts est un ouvert. Proposition. Si (Ej )1≤j≤m est une famille finie d’ouverts Ej de Rn , alors 7m n j=1 Ej est un ouvert de R . Démonstration. Par une propriété de l’intérieur vis-à-vis de l’intersection, on a int m " j=1 Ej = m " j=1 int Ej = m " Ej . j=1 Remarque. Ce résultat est faux si la famille n’est pas finie. Ainsi, pour 7 chaque k ∈ N∗ , ] − 1k , k1 [ est un ouvert de R, mais {0} = k∈N∗ ] − k1 , 1k [ ne l’est pas. En utilisant les lois de De Morgan et les trois propositions, on obtient aisément les résultats suivants sur le comportement des fermés : une intersection quelconque de fermés est fermée; une union finie de fermés est fermée. 128 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Proposition. Si A est un ensemble non vide quelconque et (Fα )α∈A une 7 famille de fermés Fα de Rn , alors α∈A Fα est un fermé de Rn . Proposition. Si (Fj )1≤j≤m est une famille finie de fermés Fj de Rn , alors n j=1 Fj est un fermé de R . !m Remarque. La dernière proposition ne s’étend pas au cas d’une famille non k finie de fermés. Ainsi, pour chaque k ∈ N∗ , [0, k+1 ] est un fermé de R, mais ! k k∈N∗ [0, k+1 ] = [0, 1[ n’est pas un fermé de R. Exemples. 1. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, alors Bj [a; r] est un fermé de Rn . Cela équivaut à montrer que !Bj [a; r] = {x ∈ Rn : |x − a|j > r} est ouvert. Soit x ∈ !Bj [a; r]. Alors, |x − a|j > r et il existe donc ! > 0 tel que |x − a|j > r + !. Si y ∈ Bj [x; !], on a |y − a|j = |(x − a) − (x − y)|j ≥ |x − a|j − |x − y|j > r + ! − ! = r, c’est-à-dire Bj [x; !] ⊂ !Bj [a; r]; ce dernier ensemble est donc voisinage de chacun de ses points. 2. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, posons Bj (a; r) = {x ∈ Rn : |x − a|j < r}. Alors Bj (a; r) est un ouvert de Rn . En effet, si x ∈ Bj (a; r), alors |x−a|j < r et il existera un ! > 0 tel que |x − a|j < r − !. Dès lors, si y ∈ Bj [x; !], on a |y − a|j = |(y − x) + (x − a)|j ≤ |y − x|j + |x − a|j < ! + r − ! = r, c’est-à-dire Bj [x; !] ⊂ Bj (a; r). Donc Bj (a; r) est voisinage de chacun de ses points. Il est naturel d’appeler Bj (a; r) la boule ouverte de centre a et de rayon r en norme j dans Rn . Pour n = 1 et j = 1, 2 ou ∞, Bj (a; r) = ]a − r, a + r[. On a les relations suivantes entre Bj [a; r] et Bj (a; r). Proposition. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, alors int Bj [a; r] = Bj (a; r), adh Bj (a; r) = Bj [a; r]. Démonstration. Comme Bj (a; r) ⊂ Bj [a; r] et que Bj (a; r) est un ouvert, on a immédiatement Bj (a; r) = int Bj (a; r) ⊂ int Bj [a; r], 129 4.4. OUVERTS, FERMÉS ET BORNÉS et, pour démontrer la première égalité, il suffit de prouver que int Bj [a; r] ⊂ Bj (a; r). Si x ∈ int Bj [a; r], il existe ρ > 0 tel que Bj [x; ρ] ⊂ Bj [a; r]. Bien sûr, x−a |a − a|j = 0 < r. Si x /= a, x + ρ |x−a| ∈ Bj [a; r], et dès lors j # # & ' # # x−a ρ # # − a# = 1 + |x − a|j ≤ r, #x + ρ # # |x − a|j |x − a|j j ce qui entraı̂ne |x − a|j ≤ r 1+ ρ |x−a|j < r. La démonstration de la deuxième égalité est similaire et laissée au lecteur. On peut caractériser l’intérieur et l’adhérence d’une partie de Rn en termes d’ouverts et de fermés. Proposition. Soit G une partie de Rn . Alors int G est le plus grand ouvert contenu dans G et adh G est le plus petit fermé contenant G. Démonstration. Il faut démontrer que int G est un ouvert et que tout ouvert contenu dans G est contenu dans int G, et que adh G est un fermé contenu dans tout fermé qui contient G. C’est évident si G = ∅. Sinon, démontrons le résultat sur l’intérieur, l’autre en résultant par les relations entre intérieur et adhérence, ouvert et fermé et les lois de De Morgan. Soit H l’union de tous les ouverts de Rn contenus dans G; on a vu que c’était un ouvert et, par construction, c’est le plus grand ouvert contenu dans G. Il reste à montrer que H = int G. Comme H ⊂ G, on aura H = int H ⊂ int G et il reste à montrer que int G ⊂ H. Si x ∈ int G, alors il existe r > 0 tel que B2 [x; r] ⊂ G et donc tel que B2 (x; r) ⊂ G. Comme B2 (x; r) est ouvert, on voit que x appartient à un ouvert contenu dans G, et donc x appartient à H. Enfin, la caractérisation des points adhérents par les suites fournit une caractérisation semblable pour les fermés : une partie de Rn est fermée si et seulement si elle contient les limites de toutes ses suites convergentes. Proposition. F ⊂ Rn est fermé si et seulement si, pour toute suite (ak )k∈N dans F qui converge vers a ∈ Rn , on a a ∈ F . Démonstration. Condition nécessaire. Par hypothèse, F = adh F . Soit (ak )k∈N une suite dans F qui converge vers a ∈ Rn . Alors, a ∈ adh F = F. 130 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Condition suffisante. Soit a ∈ adh F ; alors il existe une suite (ak )k∈N dans F qui converge vers a. Mais alors, a ∈ F , et donc adh F ⊂ F et F est fermé. Rappelons la notion de partie bornée déjà introduite précédemment. Définition. On dit que B ⊂ Rn est une partie bornée ou un borné de Rn s’il existe ρ > 0 tel que B ⊂ B2 [ρ]. On peut évidemment remplacer B2 [ρ] par B1 [ρ] ou par B∞ [ρ] dans la définition. Ainsi, pour a ∈ Rn , r > 0 et j = 1, 2 ou ∞, Bj [a; r] est une partie bornée de Rn puisque, pour tout x ∈ Bj [a; r], on a |x|j = |(x − a) + a|j ≤ |x − a|j + |a|j ≤ r + |a|j , et donc Bj [a; r] ⊂ Bj [r + |a|j ]. Il est clair aussi que toute partie d’un borné de Rn est un borné de Rn . En particulier, Bj (a; r) est un borné de Rn . Les propriétés des bornés par rapport à l’union et l’intersection sont analogues à celles des fermés. Leur démonstration est très facile et laissée au lecteur. Proposition. Si A est un ensemble quelconque non vide et (Bα )α∈A est 7 une famille de bornés Bα de Rn , alors α∈A Bα est un borné de Rn . Proposition. Si (Bj )1≤j≤m est une famille finie de bornés Bj de Rn , alors n j=1 Bj est un borné de R . !m Le lemme de Cousin s’étend aux ensembles fermés et bornés. Théorème. Soit F un fermé borné non vide de Rn . Alors, pour chaque A j j B jauge δ sur F , il existe une famille finie (x , F ) 1≤j≤m telle que F = m > Fj j=1 et telle que, pour chaque 1 ≤ j ≤ m, on ait xj ∈ F j ⊂ B∞ [xj ; δ(xj )]. Démonstration. Puisque F est borné, il existe ρ > 0 tel que F ⊂ B∞ [ρ]. Soit I = ] − ρ, ρ] × . . . × ] − ρ, ρ] le semi-pavé de Rn tel que I¯ = B∞ [ρ]. Définissons comme suit la jauge δ̃ sur Rn . Si x ∈ F, posons δ̃(x) = δ(x). Si x ∈ !F, il existe, puisque !F est ouvert, un r(x) > 0 tel que B∞ [x; r(x)] ⊂ !F ; posons alors δ̃(x) = r(x). Comme la restriction de δ̃ à I¯ est une jauge 131 4.4. OUVERTS, FERMÉS ET BORNÉS ¯ sur 8 I, le9 lemme de Cousin implique l’existence d’une P-partition δ̃-fine k (y , J k ) de I. Si k est tel que y k ∈ !F, on a donc δ̃(y k ) = r(y k ), 1≤k≤q et J k ⊂ B∞ [y k ; δ̃(y k )] = B∞ [y k ; r(y k )] ⊂ !F. Dès lors, F = F ∩ I¯ = F ∩ = & Jk k=1 > {1≤k≤q q > ' = q > k=1 (F ∩ J k ) (F ∩ J k ). : yk ∈F } Si 1 ≤ k1 < k2 < . . . < km ≤ q sont les valeurs de k telles que y k ∈ F , et si l’on pose 8 9 8 9 (xj , F j ) = (y kj , F ∩ J kj ) , 1≤j≤m 1≤j≤m (c’est-à-dire si l’on renumérote les (y k , F ∩ J k ) correspondant aux k tels que y k ∈ F ), on voit que m > j=1 Fj = m > j=1 (F ∩ J kj ) = > {1≤k≤q (F ∩ J k ) = F, : yk ∈F } et, pour chaque 1 ≤ j ≤ m, on a xj = y kj ∈ F ∩ J kj = F j ⊂ J kj ⊂ B∞ [y kj ; δ̃(y kj )] = B∞ [xj ; δ(xj )]. Remarque. La démonstration du lemme de Cousin fournit en fait des F j fermés (1 ≤ j ≤ n). Définition. Soit E une partie de Rn et δ une jauge sur E. Une division A j j B ! j δ-fine de E est une famille finie (x , E ) 1≤j≤m telle que E = m j=1 E et telle que, pour chaque 1 ≤ j ≤ m, on ait xj ∈ E j ⊂ B∞ [xj ; δ(xj )]. Le lemme de Cousin affirme donc que, si F ⊂ Rn est un fermé borné, alors, pour toute jauge δ sur F , il existe une division δ-fine de F . Montrons que cette propriété, parfois appelée propriété de Cousin, caractérise les fermés bornés. 132 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Proposition. Une partie E de Rn est fermée et bornée si et seulement si, pour toute jauge δ sur E, il existe une division δ-fine de E. Démonstration. La condition nécessaire résulte du lemme de Cousin pour les fermés bornés que nous venons de démontrer. Supposons maintenant que E ait la propriété de Cousin. Montrons tout d’abord que E est borné. En prenant sur E la jauge constante de valeur 1, on obtient une division 1-fine A j j B (x , E ) 1≤j≤m . Comme chaque E j , contenu dans le borné B∞ [xj ; 1] est borné, E, union finie de bornés, est borné. Montrons maintenant que E est fermé ou, ce qui est équivalent, que !E est ouvert, c’est-à-dire voisinage de chacun de ses points. Soit a ∈ !E; définissons la jauge δ sur E par δ(x) = 12 |x − a|∞ pour chaque x ∈ E. Par construction, pour chaque x ∈ E, a ∈ !B [x; δ(x)]. Par la propriété de Cousin, il existe une division δ-fine A j j∞B (x , E ) 1≤j≤m et E= m > j=1 Ej ⊂ m > j=1 B∞ [xj ; δ(xj )] = F. Par construction, F ⊃ E est fermé et a /∈ F , c’est-à-dire !F ⊂ !E est un ouvert contenant a. 4.5 Continuité uniforme Si une fonction est continue en un point a, ses valeurs seront arbitrairement proches de f (a) si l’on se restreint à des points suffisamment proches de a. On peut en déduire la propriété locale un peu plus forte suivante. Lemme. Soit f une fonction de Rn dans Rp continue en a ∈ dom f . Alors, pour chaque ! > 0, il existe un δ = δ(a; !) > 0 tel que, pour tout x ∈ dom f ∩ B∞ [a; δ] et tout y ∈ dom f tel que |y − x|∞ ≤ δ, on a |f (x) − f (y)|∞ ≤ !. Démonstration. Soit ! > 0; puisque f est continue en a, il existe δ̃ = δ̃(a; !) > 0 tel que, pour tout x ∈ dom f vérifiant |x − a|∞ ≤ δ̃, on ait ! |f (x) − f (a)|∞ ≤ . 2 Posons δ = 2δ̃ , et soient x ∈ dom f ∩B∞ [a; δ] et y ∈ dom f tel que |y −x|∞ ≤ δ. Alors, |y − a|∞ = |(y − x) + (x − a)|∞ ≤ |y − x|∞ + |x − a|∞ ≤ δ + δ = δ̃, 133 4.5. CONTINUITÉ UNIFORME et dès lors, |f (y) − f (x)|∞ ≤ |f (y) − f (a)|∞ + |f (a) − f (x)|∞ ≤ ! ! + = !. 2 2 Remarque. La conclusion du lemme n’implique pas que f soit continue en x ∈ (dom f ∩ B∞ [a; δ]) \ {a} ! En effet, l’ensemble dom f ∩ B∞ [a; δ] des x autorisés pour que l’inégalité soit satisfaite dépend de δ, et donc d’!. Rappelons à cet effet l’exemple donné précédemment d’une fonction de R dans R qui n’est continue qu’en 0. Lorsque f est continue sur un fermé borné de Rn , on peut utiliser le lemme de Cousin pour obtenir une version globale du lemme : c’est le théorème de Heine. Théorème. Soit f une fonction de Rn dans Rp continue sur le fermé borné E de Rn . Alors, pour chaque ! > 0, il existe un δE > 0 tel que, pour tout x ∈ E et tout y ∈ dom f tel que |y − x|∞ ≤ δE , on a |f (y) − f (x)|∞ ≤ !. Démonstration. Si ! > 0 est fixé, alors, par l’hypothèse de continuité de f sur E et le lemme ci-dessus, on sait que, (∀a ∈ E)(∃δ = δ(a) > 0)(∀x ∈ dom f ∩ B∞ [a; δ])(∀y ∈ dom f ∩ B∞ [x; δ]) : |f (y) − f (x)|∞ ≤ !. (4.2) Soit δ : a 2→ δ(a) la jauge ainsi définie sur E. Par le lemme de Cousin, il A B existe une division δ-fine (aj , E j ) 1≤j≤m de E. Posons δE = min{δ(aj ) : 1 ≤ j ≤ m}, et soit x ∈ E et y ∈ dom f tel que |y − x|∞ ≤ δE . Il existe donc un entier 1 ≤ l ≤ m tel que x ∈ E l , et donc tel que |x − al |∞ ≤ δ(al ); comme en outre |y − x|∞ ≤ δE ≤ δ(al ), (4.2) implique que |f (y) − f (x)|∞ ≤ !. Rappelons que la continuité de f en chaque point x de E équivaut à la propriété suivante : (∀x ∈ E)(∀! > 0)(∃δ > 0)(∀y ∈ dom f : |y − x|∞ ≤ δ) : |f (y) − f (x)|∞ ≤ !, (4.3) 134 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES montrant clairement que le δ peut dépendre à la fois d’! et de x. La propriété que nous venons démontrer dans le théorème de Heine est la suivante : (∀! > 0)(∃δ > 0)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ) : (4.4) |f (y) − f (x)|∞ ≤ !. Dans (4.4), on a la propriété plus forte que δ ne dépend que d’! et convient pour chaque x ∈ E. On est ainsi conduit à la définition suivante. Définition. Soit f une fonction de Rn dans Rp et E ⊂ Rn . On dit que f est uniformément continue sur E si f est définie sur E et vérifie la propriété (4.4). Bien entendu, toute fonction uniformément continue sur un ensemble E est continue sur E, et le théorème de Heine montre que la réciproque est vraie lorsque E est fermé et borné. Une fonction continue sur un ensemble E peut ne pas y être uniformément continue si E n’est pas fermé ou n’est pas borné. C’est ce que montrent les exemples suivants. On notera que, dans (4.4), on peut toujours demander que le δ cherché soit inférieur à une quantité fixe donnée. Exemples. 1. La fonction f de R dans R définie par f (x) = x1 est continue sur le borné (non fermé) ]0, 1] mais n’y est pas uniformément continue. En effet, pour chaque δ ∈ ]0, 1], si l’on prend x = δ et y = 2δ, on a |y − x| = δ, # # #1 1 ## 1 1 1 # |f (x) − f (y)| = # − # = ≥ > , δ 2δ 2δ 2 4 et la négation de (4.4) est satisfaite. 2. La fonction f de R dans R définie par f (x) = x2 est continue sur le fermé (non borné) [0, +∞[ mais n’y est pas uniformément continue. En effet, pour chaque δ > 0, si l’on prend x = 1δ et y = 1δ + δ, on a |y − x| = δ, |f (x) − f (y)| = 2 + δ 2 > 2, et la négation de (4.4) est satisfaite. Remarque. Le lecteur se convaincra sans peine de l’équivalence de la condition (4.3) de continuité de f sur E ⊂ dom f avec la propriété : (∀! > 0)(∃δ, jauge sur E)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ(x)) : |f (y) − f (x)|∞ ≤ !, 4.6. IMAGES PAR UNE FONCTION CONTINUE 135 et de l’équivalence de la condition (4.4) de continuité uniforme de f sur E ⊂ dom f avec la propriété : (∀! > 0)(∃δ, jauge constante sur E)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ) : |f (y) − f (x)|∞ ≤ !. 4.6 Images par une fonction continue Nous allons étudier, dans cette section la préservation des propriétés des ensembles lorsqu’on prend leur image directe ou réciproque par une fonction continue. Les propriétés que nous aurons en vue sont celles rencontrées dans ce chapitre, c’est-à-dire la connexité par arcs, le caractère ouvert, le caractère fermé et le caractère borné. Notons tout d’abord que la fonction f identiquement nulle sur l’ensemble R \ {0} y est évidemment continue et que l’image réciproque f −1 ({0}) de l’ensemble connexe par arcs {0} est égale à R \ {0} qui n’est pas connexe par arcs puisque, si x < 0 < y sont deux points de R \ {0}, toute application continue γ : [0, 1] → R telle que γ(0) = x et γ(1) = y s’annule, par le théorème de Bolzano, en un τ ∈ [0, 1] au moins, et son image n’appartient donc pas à R \ {0}. Par contre, les images directes par une fonction continue d’ensembles connexes par arcs sont connexes par arcs. Proposition. Soit f une fonction de Rn dans Rp continue sur une partie connexe par arcs E de Rn . Alors f (E) est connexe par arcs. Démonstration. Soient u ∈ f (E) et v ∈ f (E). Il existe donc x ∈ E et y ∈ E tels que u = f (x) et v = f (y). Comme E est connexe par arcs, il existe une application continue γ : [0, 1] → E telle que γ(0) = x et γ(1) = y. En conséquence, f ◦ γ est une application continue de [0, 1] dans f (E) telle que (f ◦ γ)(0) = u et (f ◦ γ)(1) = v. Si f est une application constante de l’ouvert E de Rn , alors f (E) est un singleton et n’est donc pas un ouvert. Par contre, les images réciproques d’ouverts par des fonctions continues sont des ouverts, et cette propriété caractérise d’ailleurs les fonctions continues. Proposition. Soit f une fonction de Rn dans Rp et E une partie de dom f . Alors f est continue sur E si et seulement si, pour tout ouvert B de Rp, il existe un ouvert A de Rn tel que f −1 (B) ∩ E = A ∩ E. 136 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Démonstration. Condition nécessaire. Soit B un ouvert de Rp ; si f −1 (B) ∩ E = ∅, il suffit de prendre A = ∅. Sinon, soit a ∈ f −1 (B) ∩ E. B est donc un voisinage de f (a) et, f étant continue en a, il existera un voisinage Ua de a, que l’on peut toujours prendre ouvert (puisque, par exemple, il contient toujours une boule ouverte centrée en a) tel que f (Ua ∩ E) ⊂ B, c’est-à-dire tel que Ua ∩ E ⊂ f −1 (B) ∩ E. Si nous posons A= > Ua , a∈f −1(B)∩E alors A est un ouvert de Rn tel que f −1 (B) ∩ E ⊂ A ∩ E ⊂ f −1 (B) ∩ E. Condition suffisante. Soit a ∈ E et montrons que f est continue en a. Si V est un voisinage de f (a), il existe un ouvert B de Rp tel que f (a) ∈ B ⊂ V (par exemple un boule ouverte centrée en f (a) de rayon suffisamment petit). Par hypothèse, on peut donc trouver un ouvert A de Rn tel que f −1 (B)∩E = A ∩ E. Comme a ∈ f −1 (B) ∩ E, a ∈ A et A est un voisinage de a tel que f (A ∩ E) = f (f −1 (B) ∩ E) ⊂ B ⊂ V. Donc f est continue en a. L’image directe d’un fermé E de Rn par une fonction continue sur E n’est pas nécessairement fermée, ainsi que le montre la fonction f de R dans x R définie par f (x) = 1+|x| , qui est continue sur R et telle que le fermé R a pour image ] − 1, 1[ qui n’est pas fermé. Comme pour les ouverts, les fermés de conservent par image réciproque, et cette propriété caractérise également les fonctions continues. Proposition. Soit f une fonction de Rn dans Rp et E ⊂ dom f . Alors f est continue sur E si et seulement si, pour tout fermé B de Rp , il existe un fermé A de Rn tel que f −1 (B) ∩ E = A ∩ E. Démonstration. Elle se fonde sur le résultat correspondant pour les ouverts, le fait que le complémentaire d’un fermé est un ouvert et les propriétés élémentaires des fonctions et des graphes. Ses détails sont laissés au lecteur. 4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 137 En particulier, on a la propriété suivante de l’ensemble des zéros d’une fonction continue. Corollaire. Soit f une fonction de Rn dans Rp continue sur E ⊂ Rn . Il existe un fermé A de Rn tel que f −1 ({0}) ∩ E = A ∩ E. L’image directe d’un borné par une fonction continue n’est pas nécessairement bornée, ainsi que le montre l’exemple de la fonction f de R dans R définie par f (x) = x1 . Elle est continue sur le borné ]0, 1] et f (]0, 1]) =]0, +∞[ n’est pas borné. L’image réciproque d’un borné par une fonction continue n’est pas non plus nécessairement bornée comme le montre l’exemple de l’application nulle sur R : l’image réciproque de tout borné contenant {0} est R tout entier. Nous avons vu toutefois qu’une fonction f continue en un point a est localement bornée en ce point, ce qui signifie qu’il existe une boule B∞ [a; δ] centrée en a et de rayon δ = δ(a) telle que f (B∞ [a; δ]) soit bornée. La caractérisation des fermés bornés par la propriété de Cousin va nous permettre de globaliser ce résultat local. Proposition. Si E ⊂ Rn est fermé et borné et si f est une fonction de Rn dans Rp continue sur E, alors f (E) est fermé et borné. Démonstration. On va montrer que f (E) possède la propriété de Cousin. Soit ! une jauge sur f (E). Comme, pour chaque x ∈ E, f est continue en x, si l’on prend !(f (x)) dans la définition correspondante, il existera δ(x) > 0 tel que f (E ∩ B∞ [x; δ(x)]) ⊂ B∞ [f (x); !(f (x))]. On définit ainsi sur E une jauge δA : x 2→ δ(x), et le lemme de Cousin entraı̂ne B l’existence d’une division δ-fine (xj , E j ) 1≤j≤m de E. En conséquence, si, pour chaque 1 ≤ j ≤ m, on pose y j = f (xj ), on a f (E j ) ⊂ f (B∞ [xj ; δ(xj )] ∩ E) ⊂ B∞ [y j ; !(y j )], ! ! m j j y j ∈ f (E j ), et f (E) = f ( m pour chaque j=1 E ) = j=1 f (E ). AEn posant, B j j 1 ≤ j ≤ m, F = f (E ), on obtient une division (y j , F j ) 1≤j≤m !-fine de f (E). 4.7 Théorème des bornes atteintes et extrémants La proposition que nous venons de démontrer peut être précisée dans le cas d’une fonction à valeurs réelles : c’est le théorème des bornes atteintes 138 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES ou théorème de Weierstrass et l’on peut en donner une démonstration directe indépendante des résultats de la section précédente. Théorème. Soit E un fermé borné de Rn et f une fonction de Rn dans R continue sur E. Alors, il existe u ∈ E et v ∈ E tels que, pour tout x ∈ E, on ait f (u) ≤ f (x) ≤ f (v). (4.5) Démonstration. Notons tout d’abord qu’il suffit de démontrer l’existence d’un v ∈ E pour lequel l’inégalité de droite dans (4.5) est vérifiée car celle de u se déduit alors de ce résultat appliqué à −f . Supposons qu’un tel v n’existe pas; alors, (∀v ∈ E)(∃xv ∈ E) : f (xv ) > f (v). Choissons ! = 12 (f (xv ) − f (v)) dans la définition de la continuité de f en v; on obtient ainsi un δ = δ(v) > 0 tel que (∀y ∈ dom f ∩ B∞ [v; δ(v)]) : f (y) − f (v) ≤ 1 (f (xv ) − f (v)), 2 et dès lors (∀y ∈ dom f ∩ B∞ [v; δ(v)]) : f (y) ≤ 1 (f (xv ) + f (v)) < f (xv ). 2 (4.6) En appliquant le lemme de Cousin à AE pour Bla jauge δ : v 2→ δ(v) ainsi obtenue, on obtient une division δ-fine (v j , E j ) 1≤j≤m de E. Soit 1 ≤ l ≤ m tel que f (xvl ) = max{f (xvj ) : 1 ≤ j ≤ m}. Si y ∈ E, il existe un 1 ≤ i ≤ m tel que y ∈ E i ⊂ E ∩ B∞ [v i ; δ(v i)], et donc tel que f (y) < f (xvi ) ≤ f (xvl ). En prenant y = xvl dans cette inégalité, on obtient une contradiction. Remarque. Le théorème de Weierstrass est faux si E n’est pas fermé ou n’est pas borné. Ainsi, l’identité sur R est continue sur ]0, 1[ mais il n’existe ni u ∈ ]0, 1[ ni v ∈ ]0, 1[ tels que, pour tout x ∈ ]0, 1[, on ait u ≤ x ≤ v (le montrer par l’absurde). De même il n’existe ni u ∈ R ni v ∈ R tels que, pour tout x ∈ R, on ait u ≤ x ≤ v. Donnons quelques conséquences utiles du théorème de Weierstrass. 4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 139 Corollaire. Soit E un fermé borné de Rn et f une fonction de Rn dans R continue sur E et strictement positive en chaque point de E. Alors il existe r > 0 tel que, pour tout x ∈ E, on a f (x) ≥ r. Démonstration. Par le théorème de Weierstrass, il existe u ∈ E tel que, pour tout x ∈ R, on ait f (x) ≥ f (u) (> 0). Il suffit donc de prendre r = f (u). Remarque. Le premier exemple de la remarque précédente montre que le Corollaire est faux si E n’est pas fermé. D’ailleurs, le Corollaire est faux si E n’est pas borné car la fonction x 2→ x1 est continue sur [1, +∞[ et il n’existe pas de r > 0 tel que x1 ≥ r pour tout x ≥ 1 (le vérifier). Corollaire. Soit f une fonction de R dans R continue et non constante sur [a, b]. Alors il existe u ∈ [a, b] et v ∈ [a, b] tels que f ([a, b]) = [f (u), f (v)]. Démonstration. Par le théorème de Weierstrass et le fait que f n’est pas constante, il existe u ∈ [a, b] et v ∈ [a, b] tels que f (u) < f (v) et f ([a, b]) ⊂ [f (u), f (v)]. D’autre part, si d ∈ [f (u), f (v)], le théorème des valeurs intermédiaires entraı̂ne l’existence d’un c ∈ [a, b] tel que f (c) = d, et dès lors [f (u), f (v)] ⊂ f ([a, b]). Remarque. Le Corollaire que nous venons de démontrer montre que l’image d’un intervalle fermé par une fonction continue non constante est un inter1 valle fermé. L’exemple de la fonction x 2→ 1−x 2 continue sur ] − 1, 1[ montre que l’image d’un intervalle ouvert n’est pas nécessairement un intervalle ouvert. Corollaire. Soit E un fermé non borné de Rn et f une fonction de Rn dans R continue sur E et telle que f (x) → +∞ si x → ∞. Alors il existe un y ∈ E tel que, pour tout x ∈ E, on ait f (y) ≤ f (x). 140 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Démonstration. Soit a ∈ E fixé; par hypothèse, il existe ρ > 0 tel que, pour tout x ∈ E vérifiant |x|2 > ρ, on a f (x) > f (a). En particulier, |a|2 ≤ ρ. Comme E ∩ B2 [ρ] est un fermé borné, le théorème de Weierstrass entraı̂ne l’existence d’un y ∈ E ∩ B2 [ρ] tel que, pour tout x ∈ E ∩ B2 [ρ], on ait f (y) ≤ f (x). En particulier, f (y) ≤ f (a), et dès lors, pour tout x ∈ E tel que |x|2 > ρ, on aura f (y) ≤ f (a) < f (x). Ce corollaire fournit une intéressante démonstration du théorème de d’Alembert ou théorème fondamental de l’algèbre qui généralise le résultat que nous avons déjà obtenu pour un polynôme de la forme z n − c. Corollaire. Tout polynôme sur C de degré supérieur ou égal à un possède au moins un zéro. % k Démonstration. Soit p : C → C, z 2→ m k=0 ak z un polynôme de degré m ≥ 1. On a donc, pour chaque 0 ≤ k ≤ m, ak ∈ C et am /= 0. Montrons d’abord l’existence d’un u ∈ C tel que, pour tout z ∈ C, on a (4.7) |p(z)| ≥ |p(u)|. Pour ce faire, on note que l’application |p| : C 2→ R est continue et que, pour tout z /= 0, on a # & '# & ' m−1 m−1 # # $ ak $ |ak | # m k−m # m k−m |p(z)| = #am z 1+ z 1− . |z| # ≥ |am ||z| # # am |am | k=0 k=0 Puisque m−1 $ k=0 il existera ρ > 0 tel que |ak | k−m → 0 si z → ∞, |z| |am | m−1 $ k=0 |ak | k−m 1 ≤ |z| |am | 2 pour tout z ∈ C tel que |z| ≥ ρ. On a donc, si |z| ≥ ρ, |p(z)| ≥ |am | m |z| , 2 4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 141 et dès lors |p(z)| → +∞ si z → ∞, L’existence d’un u ∈ C vérifiant (4.7) résulte du corollaire précédent. La deuxième partie de la démonstration consiste à montrer que p(u) = 0. Si p(u) /= 0, la fonction q définie par q(z) = p(u+z) p(u) est un polynôme sur C de degré m tel que q(0) = 1 et |q(z)| ≥ 1 pour tout z ∈ C. En conséquence, q est de la forme q(z) = 1 + m $ bk z k , k=j avec 1 ≤ j ≤ m, bj /= 0, bm /= 0. Soit r > 0 tel que r j |bj | < 1. Pour b̄ tout z ∈ C tel que z j = −r j |bjj | , (et l’existence d’un tel z a été démontrée précédemment), on a |z| = r, 1 + bj z j = 1 − r j |bj | > 0, et dès lors |q(z)| ≤ |1 + bj z j | + m $ k=j+1 |bk ||z|k = 1 − r j |bj | + = 1 − r j |bj | − m−j $ k=1 m $ k=j+1 |bk |r k |bj+k |r k . On en déduit aussitôt que |q(z)| < 1 si l’on diminue éventuellement r > 0 de telle sorte que m−j $ k=1 ce qui est contradictoire. |bj+k |r k < |bj |, Le résultat du théorème de Weierstrass conduit à la terminologie suivante pour les fonctions à valeurs réelles. Définition. Soit f une fonction de Rn dans R et E ⊂ dom f . On dit que a ∈ E est un maximant (resp. minimant) de f sur E, ou encore que f possède en a un maximum (resp. minimum) sur E, si, pour tout x ∈ E, on a f (x) ≤ f (a) (resp. f (x) ≥ f (a)). 142 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES On écrit dans ce cas f (a) = max f (resp. f (a) = min f ), E E ou f (a) = max f (x) (resp. f (a) = min f (x)), x∈E x∈E ou encore f (a) = max{f (x) : x ∈ E} (resp. f (a) = min{f (x) : x ∈ E}). On dit également que a ∈ E est un extrémant de f sur E (ou que f possède un extrémum sur E) si a est un minimant ou est un maximant de f sur E. Le théorème de Weierstrass montre donc que toute fonction réelle continue sur un fermé borné E possède un maximum et un minimum sur E. Il ne fournit malheureusement aucune information quant à la localisation du minimant et du maximant correspondant. De telles informations peuvent se déduire de conditions nécessaires pour qu’un point de Rn soit extrémant sur E d’une fonction de Rn dans R. De telles conditions nécessaires peuvent s’obtenir plus généralement dans le cas d’extrémants locaux, ce qui nous conduit à localiser les notions de maximant et de minimant. Définition. Soit f une fonction de Rn dans R et E ⊂ dom f . On dit que a ∈ E est un maximant (resp. minimant) local de f sur E s’il existe un δ > 0 tel que a soit un maximant (resp. minimant) de f sur E ∩ B2 [a; δ]. Cette propriété s’exprime également en disant que f possède en a un maximum (resp. minimum) local sur E. On appellera généralement extrémant local de f sur E un point de E qui est maximant local ou minimant local de f sur E. Tout maximant (resp. minimant) de f sur E est évidemment un maximant (resp. minimant) local de f sur E. Par contre, l’application f : x 2→ x3 3 − x de R dans R a un maximant local sur R en −1 et un minimant local sur R en 1, mais n’a ni maximant ni minimant sur R. Les extrémants locaux les plus simples à étudier sont ceux qui sont intérieurs au domaine de la fonction. Ils ont droit à une terminologie propre. Définition. Soit f une fonction de Rn dans R. On dit que a ∈ Rn est un maximant (resp. minimant) local libre de f si a ∈ int dom f et si a est un maximant (resp. minimant) local de f sur Rn . Un extrémant local libre de f est un point qui est maximant ou minimant local libre de f . Par exemple, les extrémants locaux de l’application x 2→ plus haut sont libres. x3 3 −x considérée 4.8. THÉORÈMES DE FERMAT ET DE ROLLE 143 Les deux notions locales que nous venons d’introduire sont liées par la Proposition suivante. Proposition. Soit f une fonction de Rn dans R, E ⊂ dom f et a ∈ E. Si a est maximant (resp. minimant) local libre de f , alors a est maximant (resp. minimant) local de f sur E. Si a est maximant (resp. minimant) local de f sur E et si a ∈ int E, alors a est maximant (resp. minimant) local libre de f. Démonstration. La première assertion est immédiate. La seconde résulte aisément du fait que, puisque E est voisinage de a, E ∩B2 [a; δ] sera voisinage de a quel que soit δ > 0. Définition. Soit f une fonction de Rn dans R, E ⊂ dom f et a ∈ E. On dira que a est maximant (resp. minimant) local lié de f sur E si a n’est pas intérieur à E et est maximant (resp. minimant) local de f sur E. Un extrémant local lié de f sur E sera un maximant ou un minimant local lié de f sur E. 3 Ainsi, pour l’application f : x 2→ x3 − x de R dans R considérée plus haut, 0 est un extrémant local lié de f sur E = [0, +∞[ et sur E = ] − ∞, 0]. 4.8 Théorèmes de Fermat et de Rolle On peut obtenir d’intéressantes conditions nécessaires d’existence d’un extrémant local libre d’une fonction de Rn dans R lorsque f possède en ce point une dérivée directionnelle. C’est ce qu’exprime le résultat suivant, appelé théorème de Fermat pour rappeler une condition similaire trouvée, dans le cas d’un polynôme réel, par Pierre de Fermat, en 1629, c’est-à-dire environ cinquante ans avant l’invention du calcul différentiel, et que Johannes Kepler avait déjà exprimée d’une manière qualitative en 1615, en observant qu’une fonction réelle varie très peu au voisinage d’un extrémum. Théorème. Soit f une fonction de Rn dans R et a un extrémant local libre de f . Si f possède en a une dérivée dans la direction u, alors f $ (a; u) = 0. Démonstration. Supposons pour fixer les idées que a soit un maximant local libre de f (sinon, il suffit de considérer −f .) Par hypothèse, on peut donc trouver r > 0 tel que B2 [a; r] ⊂ dom f et tel que, pour tout x ∈ B2 [a; r], on ait f (x) ≤ f (a). 144 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES En particulier, pour tout réel t tel que 0 < |t| ≤ r, on aura a + tu ∈ B2 [a; r], et dès lors f (a + tu) − f (a) ≤ 0. En conséquence, pour 0 < t ≤ r, on aura f (a + tu) − f (a) ≤ 0, t d’où, en faisant tendre t vers 0, f $ (a; u) = f (a + tu) − f (a) ≤ 0. t→0; t>0 t lim De même, pour −r ≤ t < 0, on aura f (a + tu) − f (a) ≥ 0, t d’où, en faisant tendre t vers 0, f $ (a; u) = f (a + tu) − f (a) ≥ 0. t→0; t<0 t lim Par conséquent, f $ (a; u) = 0. Remarques. 1. La condition de Fermat n’est nullement suffisante pour que a soit extrémant local libre de f ; ainsi, pour l’application f de R définie par f (x) = x3 , on a f $ (0) = 0, et pourtant 0 n’est ni maximant, ni minimant local libre de f , puisque x3 < 0 si x < 0 et x3 > 0 si x > 0. 2. La condition de Fermat n’est nullement nécessaire si a est un extrémant local lié de f ; ainsi l’application identité sur R possède en 0 un minimant local sur E = [0, +∞[ et f $ (0) = 1. Corollaire. Si f est une fonction de Rn dans R qui possède en a ∈ Rn un extrémant local libre et des dérivées partielles par rapport à toutes les variables, alors on a D1 f (a) = D2 f (a) = . . . = Dn f (a) = 0. En particulier, si f est dérivable en un extrémant local libre a, on a fa$ = 0. Démonstration. C’est une conséquence immédiate du théorème de Fermat et du lien entre dérivée totale et dérivées partielles. Ce corollaire conduit à la définition suivante. 4.8. THÉORÈMES DE FERMAT ET DE ROLLE 145 Définition. Soit f une fonction de Rn dans R et a ∈ dom f tel que, pour chaque 1 ≤ k ≤ n, Dk f (a) existe. On dit que a est un point critique ou un point stationnaire de f si, pour chaque 1 ≤ k ≤ n, on a Dk f (a) = 0. f (a) est alors appelée une valeur critique de f . Le Corollaire du théorème de Fermat affirme donc que tout extrémant local libre de f en lequel f possède des dérivées partielles par rapport à chaque variable est un point critique de f . L’exemple ci-dessus montre qu’un point critique n’est pas nécessairement extrémant local libre. Lorsque n = 1, un point critique qui n’est pas extrémant local libre est appelé un point d’inflexion. Lorsque n ≥ 2, un point critique qui n’est pas extrémant local libre est appelé un col ou un point de selle. Un exemple est donné par 0 pour l’application f de R2 dans R définie par f (x1 , x2 ) = x1 x2 . On a en effet D1 f (0, 0) = 0 = D2 f (0, 0), ce qui montre que 0 est un point critique de f , mais, pour tout r > 0, f (r, r) = r 2 > 0 = f (0, 0) > f (r, −r) = −r 2 , ce qui montre que 0 ne peut être ni maximant local libre, ni minimant local libre. Une conséquence très utile des théorèmes de Weierstrass et de Fermat est une condition suffisante d’existence d’un point critique, appelé théorème généralisé de Rolle, en référence à un cas particulier pour des polynômes réels énoncé en 1691 par Michel Rolle (qui fut pourtant un farouche adversaire du calcul différentiel naissant). Théorème. Soit f une fonction de Rn dans R et E une partie de Rn vérifiant les conditions suivantes. 1. E est fermé, borné et d’intérieur non vide. 2. f est continue sur E. 3. Pour chaque 1 ≤ k ≤ n, Dk f (x) existe en chaque x ∈ int E. 4. f est constante sur fr E. Alors, f possède au moins un point critique c ∈ int E. Démonstration. Si f est constante sur E, alors pour chaque a ∈ int E, on a fa$ = 0 et le théorème est démontré. Si f n’est pas constante sur E, le théorème des bornes atteintes de Weierstrass entraı̂ne l’existence d’un u ∈ E et d’un v ∈ E tels que, pour tout x ∈ E, on ait f (u) ≤ f (x) ≤ f (v), et, comme f n’est pas constante sur E, on a nécessairement f (u) < f (v), et donc u /= v. Comme f est constante sur fr E, u et v ne peuvent tous les 146 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES deux appartenir à fr E = adh E \ int E = E \ int E. L’un d’entre eux au moins, appelons-le c, appartient à int E et est donc un extrémant local libre de f . Par le théorème de Fermat, Dk f (c) = 0 pour chaque 1 ≤ k ≤ n et c est un point critique de f . Le cas particulier suivant lorsque n = 1 et E = [a, b] est généralement appelé théorème de Rolle. Corollaire. Soit f une fonction de R dans R et [a, b] un intervalle fermé vérifiant les conditions suivantes. 1. f est continue sur [a, b]. 2. f est dérivable en chaque point de ]a, b[. 3. f (a) = f (b). Alors il existe au moins un c ∈ ]a, b[ tel que f $ (c) = 0. Le graphe de toute fonction vérifiant les conditions du théorème de Rolle possède donc, en un point au moins, une tangente parallèle au segment de droite joignant l’origine et l’extrémité du graphe. Chaque hypothèse est essentielle dans le théorème de Rolle comme le montrent les exemples suivants sur [−1, 1] pour lesquels la dérivée ne s’annule en aucun point de ] − 1, 1[ : f (x) = x (f (−1) /= f (1)), f (x) = |x| (f n’est pas dérivable en 0) et f (x) = x si x ∈ [−1, 1[, f (1) = 0 (f n’est pas continue en 1.) 4.9 Théorème de Cauchy et règle de l’Hospital On peut généraliser le théorème de Rolle à un couple de fonctions réelles d’une variable réelle. C’est le théorème de la moyenne de Cauchy. Proposition. Soient f et g deux fonctions de R dans R continues sur [a, b] et dérivables en chaque point de ]a, b[. Alors il existe au moins un c ∈ ]a, b[ tel que [f (b) − f (a)]g $(c) = [g(b) − g(a)]f $(c). Démonstration. Il est clair que la fonction h de R dans R définie par h(x) = [f (b) − f (a)]g(x) − [g(b) − g(a)]f (x) est continue sur [a, b], dérivable sur ]a, b[ et, pour tout x ∈ ]a, b[, on a h$ (x) = [f (b) − f (a)]g $(x) − [g(b) − g(a)]f $(x). En outre, h(a) = f (b)g(a) − g(b)f (a) = h(b). 4.9. THÉORÈME DE CAUCHY ET RÈGLE DE L’HOSPITAL 147 Le théorème de Rolle appliqué à h entraı̂ne donc l’existence d’un c ∈ ]a, b[ tel que h$ (c) = 0. L’interprétation géométrique du théorème de Cauchy est la suivante. Si l’on considère (f, g) : [a, b] → R2 comme la représentation paramétrique d’une courbe du plan, le théorème de Cauchy affirme, dans le cas non trivial où (f (a), g(a)) /= (f (b), g(b)), l’existence d’un point de la courbe, différent de (f (a), g(a)) et (f (b), g(b)) en lequel la tangente à la courbe est parallèle au segment de droite joignant (f (a), g(a)) à (f (b), g(b)). En renforçant les hypothèses, on peut écrire la conclusion du théorème de Cauchy sous forme d’une égalité entre quotients. Corollaire. Soient f et g deux fonctions de R dans R continues sur [a, b] et dérivables en chaque point de ]a, b[. Si l’une des conditions suivantes est satisfaite : 1. g(a) /= g(b) et |f $ (x)| + |g $ (x)| = / 0 pour chaque x ∈ ]a, b[. 2. g $ (x) /= 0 pour tout x ∈ ]a, b[. Alors g(b) /= g(a) et il existe au moins un c ∈ ]a, b[ tel que g $ (c) /= 0 et f (b) − f (a) f $ (c) = $ . g(b) − g(a) g (c) Démonstration. Le résultat se déduit immédiatement du théorème de Cauchy si l’on peut montrer que les quantités apparaissant aux dénominateurs sont différentes de zéro. Dans le cas de l’hypothèse 1, si c ∈ ]a, b[ est tel que [f (b) − f (a)]g $(c) = [g(b) − g(a)]f $(c), et si g $ (c) = 0, alors, comme g(b) /= g(a), on a nécessairement f $ (c) = 0, ce qui est exclus par hypothèse. Dans le cas de l’hypothèse 2, il suffit de montrer que g(b) /= g(a). Si g(b) = g(a), le théorème de Rolle appliqué à g entraı̂ne l’existence d’un c$ ∈ ]a, b[ tel que g $ (c$ ) = 0, ce qui contredit l’hypothèse. La version “quotient” du théorème de Cauchy conduit à une règle permettant, dans certains cas, de prouver l’existence et de calculer la limite d’un quotient de deux fonctions réelles d’une variable réelle lorsque la limite du numérateur et du dénominateur sont toutes deux nulles. C’est une première forme de la règle de l’Hospital, l’un des plus anciens théorèmes du calcul différentiel puisque, quoique dû à Jean Bernoulli, il figure dans le premier traité de calcul différentiel jamais publié, l’Analyse des infiniments petits pour l’intelligence des lignes courbes du Marquis Guillaume de l’Hospital (1696). 148 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Proposition. Soit I un intervalle ouvert de R, a son origine ou son extrémité, f et g des fonctions réelles d’une variable réelles dérivables en chaque point de I. Supposons satisfaites les conditions suivantes. 1. limx→a, x∈I f (x) = 0 = limx→a, x∈I g(x). 2. g $ (x) /= 0 pour chaque x ∈ I. " 3. limx→a, x∈I fg" (x) = b. Alors, f lim (x) = b. x→a, x∈I g Démonstration. Supposons pour fixer les idées que a soit l’extrémité de I, l’autre cas se traitant de même. Soient respectivement F et G les prolongements de f et g à I ∪ {a} définis par F (a) = 0 = G(a). Il résulte de l’hypothèse 1 que F et G sont continus sur I ∪ {a} et dérivables en chaque point de I puisqu’ils coı̈cident respectivement avec f et g sur I. Soit ! > 0; par l’hypothèse 3, il existe δ > 0, que l’on peut toujours choisir suffisamment petit pour que a − δ ∈ I, tel que # $ # # f (y) # # (∀y ∈ I : a − δ ≤ y < a) : # $ − b## = g (y) # $ # # F (y) # # # # G$ (y) − b# ≤ !. D’autre part, pour chaque x ∈ [a − δ, a[, la version quotient du théorème de Cauchy appliqué à F et G sur l’intervalle [x, a] entraı̂ne l’existence d’un c ∈ ]x, a[ ⊂ ]a − δ, a[ tel que f (x) F (a) − F (x) F $ (c) f $ (c) = = $ = $ , g(x) G(a) − G(x) G (c) g (c) et dès lors tel que # # # f (x) # # #= − b # g(x) # ce qui démontre la thèse. # $ # # f (c) # # # ≤ !, − b # g $(c) # En utilisant l’équivalence entre l’existence de la limite à gauche et de la limite à droite de a d’une fonction de R dans R avec l’existence de la limite de cette fonction pour x tendant vers a par valeurs différentes de a, on obtient aussitôt la version suivante de la règle de l’Hospital. Corollaire. Soit I un intervalle ouvert de R, a ∈ I, f et g des fonctions réelles d’une variable réelles dérivables en chaque point de I \{a}. Supposons satisfaites les conditions suivantes. 1. limx→a, x(=a f (x) = 0 = limx→a, x(=a g(x). 4.9. THÉORÈME DE CAUCHY ET RÈGLE DE L’HOSPITAL 149 2. g $ (x) /= 0 pour chaque x ∈ I \ {a}. " 3. limx→a, x(=a fg" (x) = b. Alors, lim x→a, x(=a f (x) = b. g 1/3 Exemple. La fonction de R dans R définie par x 2→ (x+1)x −1 est de la forme fg avec f (x) = (x + 1)1/3 − 1 et g(x) = x. Ces fonctions vérifient les 1 $ conditions du Corollaire ci-dessus avec f $ (x) = 3(x+1) 2/3 et g (x) = 1, et dès lors (x + 1)1/3 − 1 1 1 lim = lim = . x→0, x(=0 x→0, x(=0 3(x + 1)2/3 x 3 On a également une version correspondante de la règle de l’Hospital lorsque x tend vers +∞ ou vers −∞. Sa démonstration, tout à fait semblable à celle de la Proposition ci-dessus, est laissée comme exercice au lecteur. Proposition. Soit I = ]a, +∞[ (resp. I = ] − ∞, b[) un intervalle ouvert non borné de R, f et g des fonctions réelles d’une variable réelles dérivables en chaque point de I. Supposons satisfaites les conditions suivantes. 1. limx→+∞ f (x) = 0 = limx→+∞ g(x) (resp. limx→−∞ f (x) = 0 = limx→−∞ g(x)). 2. g $ (x) /= 0 pour chaque x ∈ I. " 3. limx→+∞ fg" (x) = b (resp. limx→−∞ Alors, f" g " (x) = b). lim x→+∞ f (x) = b g (resp. limx→−∞ fg (x) = b). On dispose également d’une règle de l’Hospital pour couvrir certaines situations où g tend vers l’infini et f n’est pas nécessairement localement bornée. Nous la traitons dans le cas d’une limite lorsque x tend vers a, le cas où x tend vers +∞ ou −∞ étant laissé au lecteur. Proposition. Soit I un intervalle ouvert de R, a son origine ou son extrémité, f et g des fonctions de R dans R dérivables en chaque point de I. Supposons satisfaites les conditions suivantes. 1. limx→a, x∈I g(x) = +∞. 2. Pour tout x ∈ I, on a g $(x) /= 0. 150 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES f" g " (x) = b. limx→a, x∈I fg (x) = 3. limx→a, x∈I Alors, b. Démonstration. Supposons pour fixer les idées que a soit l’extrémité de I, l’autre cas étant semblable. Si ! > 0 est donné, alors, par l’hypothèse 3, il existe δ $ > 0 tel que a − δ $ ∈ I et tel que, pour tout y ∈ [a − δ $ , a[, on a # $ # #f # # (y) − b# ≤ ! . # g$ # 2 D’autre part, en vertu de l’hypothèse 1, il existe δ $$ > 0 tel que a − δ $$ ∈ I et tel que, pour tout y ∈ [a − δ $$ , a[, on a g(y) > 0. Posons δ $$$ = min{δ $ , δ $$} et soient a − δ $$$ ≤ y < x < a. Le théorème de Cauchy sous forme quotient appliqué à l’intervalle [y, x] entraı̂ne l’existence d’un c ∈ ]y, x[, et donc appartenant à [a − δ $$$ , c[, tel que f (x) − f (y) f $ (c) = $ , g(x) − g(y) g (c) ce qui donne # # # f (x) − f (y) # # #= − b # g(x) − g(y) # Dès lors, pour ces mêmes x, # # # f (x) # # #= − b # g(x) # # $ # # f (c) # # # ≤ !. − b # g $ (c) # 2 #4 # 54 5 # f (x) − f (y) g(y) f (y) ## # 1 − g(y) − − b b + # g(x) g(x) − g(y) g(x) g(x) # 4 |g(y)| ≤ 1+ |g(x)| = ! + 2 4 5 ! |g(y)| |f (y)| + |b| + 2 |g(x)| |g(x)| 5 ! |g(y)| |f (y)| + |b| + . 2 |g(x)| |g(x)| Le point y étant maintenant fixé, il résulte de l’hypothèse 1 qu’on peut trouver un δ ∈ ]0, δ $$$] tel que, si x ∈ [a − δ, a[, on a |g(x)| ≥ et dès lors 2 ! 24 5 3 ! + |b| |g(y)| + |f (y)| , 2 # # #f # # (x) − b# ≤ ! + ! = !. #g # 2 2 4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE 151 Remarque. Le lecteur pourra également vérifier que, toutes autres hypothèses étant égales, lim x→a lorsque f (x) = +∞ (resp. − ∞) g f$ (x) = +∞ (resp. − ∞), x→a g $ lim a pouvant lui-même être remplacé par +∞ ou par −∞. 4.10 Théorèmes de Lagrange et de la moyenne Un cas particulier immédiat mais important du théorème de Cauchy est le résultat suivant, qui porte le nom de théorème de la moyenne de Lagrange ou de formule des accroissements finis. Théorème. Soit f une fonction de R dans R continue sur [a, b] et dérivable en chaque point de ]a, b[. Alors, il existe c ∈ ]a, b[ tel que f (b) − f (a) = (b − a)f $ (c). Démonstration. Il suffit de prendre pour g l’identité dans le théorème de Cauchy. Géométriquement, le théorème de Lagrange assure l’existence d’un point c ∈ ]a, b[ tel que la tangente en (c, f (c)) au graphe de f est parallèle au segment de droite joignant les points (a, f (a)) et (b, f (b)). Comme tout c ∈ ]a, b[ est de la forme a + θ(b − a) pour un certain θ ∈ ]0, 1[, le théorème de Lagrange affirme l’existence d’un θ ∈ ]0, 1[ tel que f (b) − f (a) = (b − a)f $ (a + θ(b − a)). On a des théorèmes de Lagrange pour les fonctions de Rn dans R. Donnons d’abord une version faisant intervenir la dérivée directionnelle. Théorème. Soit f une fonction de Rn dans R, a ∈ Rn , u ∈ Rn tel que |u|2 = 1 et T > 0 tels que f soit continue sur S = {a + tu : t ∈ [0, T ]} et dérivable dans la direction u en chaque point de S0 = {a + tu : t ∈ ]0, T [}. Alors il existe θ ∈ ]0, 1[ tel que f (a + T u) − f (a) = T f $ (a + θT u; u). 152 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Démonstration. Par hypothèse, la fonction g : t 2→ f (a + tu) est une fonction de R dans R qui vérifie les conditions du théorème de Lagrange sur [0, T ], et, par définition de la dérivée directionnelle, on a g $ (t) = f $ (a + tu; u) pour chaque t ∈ ]0, T [. En conséquence, il existe θ ∈ ]0, 1[ tel que f (a + T u) − f (a) = g(T ) − g(0) = T g $ (θT ) = T f $ (a + θT u; u). Donnons maintenant une version faisant intervenir la dérivée totale. Théorème. Soit f une fonction de Rn dans R, a ∈ Rn , b ∈ Rn , S = {a + t(b − a) : t ∈ [0, 1]} et S0 = {a + t(b − a) : t ∈ ]0, 1[} vérifiant les conditions suivantes. 1. f est continue sur S. 2. Chaque point de S0 est intérieur à dom f . 3. f est dérivable en chaque point de S0 . Alors il existe θ ∈ ]0, 1[ tel que $ f (b) − f (a) = fa+θ(b−a) (b − a), ou encore il existe c ∈ S0 tel que f (b) − f (a) = fc$ (b − a). Démonstration. Soit h l’application affine de R dans Rn définie par h(t) = a + t(b − a). Elle est dérivable en chaque point de R. Par le théorème de continuité et de dérivabilité des fonctions composées, la fonction f ◦ h sera continue sur [0, 1] et dérivable en chaque point de ]0, 1[. En outre, pour chaque t ∈ ]0, 1[, on a $ $ $ (f ◦ h)$ (t) = (f ◦ h)$t (1) = (fh(t) ◦ h$t )(1) = fh(t) (h$ (t)) = fh(t) (b − a). Le théorème de Lagrange entraı̂ne donc l’existence d’un θ ∈ ]0, 1[ tel que f [h(1)] − f [h(0)] = (f ◦ h)$ (θ), et dès lors tel que $ f (b) − f (a) = fh(θ) (b − a), et il suffit de poser c = h(θ) = a + θ(b − a). 4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE 153 Corollaire. Soit f une fonction de Rn dans R, a ∈ Rn et r > 0 tel que f soit dérivable en chaque point de B2 (a; r). Alors, pour chaque 1 ≤ k ≤ n et chaque h ∈ R tel que 0 < |h| < r, il existe θ ∈ ]0, 1[ tel que f (a + hek ) − f (a) = hDk f (a + θhek ). Démonstration. Les conditions du théorème de Lagrange sont satisfaites pour b = a + hek . Dès lors, il existe θ ∈ ]0, 1[ tel que $ k $ k k f (a + hek ) − f (a) = fa+θhe k (he ) = hfa+θhek (e ) = hDk f (a + θhe ). Le théorème de Lagrange est faux pour les fonctions à valeurs dans Rp lorsque p ≥ 2. Ainsi, la fonction f de R dans R2 définie par f (x) = (cos x, sin x) est dérivable (et donc continue) en chaque point x de R et telle que f (2π) − f (0) = 0. D’autre part, pour tout x ∈ R, on a f $ (x) = (− sin x, cos x), et donc |f $ (x)|2 = 1. Il ne peut donc exister de c ∈ ]0, 2π[ tel que f (2π) − f (0) = 2πf $ (c). Toutefois, une version affaiblie, s’exprimant en termes d’inégalité ou lieu d’égalité, mais tout aussi utile pour les applications, subsiste pour les fonctions à valeurs vectorielles. Donnons tout d’abord l’inégalité de la moyenne pour les fonctions de R dans Rp. Théorème. Soit f une fonction de R dans Rp continue sur [a, b] et dérivable en chaque point de ]a, b[. Alors il existe c ∈ ]a, b[ tel que |f (b) − f (a)|2 ≤ (b − a)|f $ (c)|2. Démonstration. Le théorème est évident si f (b) − f (a) = 0. Si f (b) − f (a) /= 0, définissons la fonction g de R dans R par g(x) = (f (b) − f (a)|f (x)) = n $ k=1 [fk (b) − fk (a)]fk (x) pour chaque x ∈ dom f. On montre sans peine qu’elle est continue sur [a, b] et dérivable en chaque point x ∈ ]a, b[, avec g $ (x) = (f (b) − f (a)|f $ (x)). En lui appliquant le théorème de Lagrange, on obtient l’existence d’un c ∈ ]a, b[ tel que g(b) − g(a) = (b − a)g $(c), 154 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES c’est-à-dire tel que |f (b) − f (a)|22 = (b − a)(f (b) − f (a)|f $ (c)). La thèse s’en déduit en utilisant l’inégalité de Cauchy |(f (b) − f (a)|f $ (c))| ≤ |f (b) − f (a)|2 |f $ (c)|2, et en simplifiant les deux membres de l’inégalité obtenue par |f (b) − f (a)|2. Remarque. Le théorème précédent peut encore s’exprimer en disant qu’il existe θ ∈ ]0, 1[ tel que |f (b) − f (a)|2 ≤ (b − a)|f $ (a + θ(b − a))|2 . Une conséquence utile de cette inégalité de la moyenne pour les fonctions vectorielles est une caractérisation des fonctions constantes en termes de dérivabilité. Corollaire. Soit I ⊂ R un intervalle borné ou non et f une fonction de R dans Rp dérivable en chaque point de I. Alors f est constante sur I si et seulement si, pour chaque x ∈ I, on a f $ (x) = 0. Démonstration. La condition nécessaire a déjà été obtenue dans le chapitre sur la dérivabilité. Pour la condition suffisante, si a < b sont deux points de I, alors f est dérivable sur [a, b] et le théorème de la moyenne et l’hypothèse sur f $ (x) entraı̂nent l’existence d’un c ∈ ]a, b[ (et donc contenu dans I) tel que 0 ≤ |f (b) − f (a)|2 ≤ (b − a)|f $ (c)|2 = 0, et dès lors tel que f (b) = f (a). Comme a et b sont arbitraires dans I, f est constante sur I. Nous pouvons maintenant énoncer et démontrer des inégalités de la moyenne pour les fonctions de Rn dans Rp. La première s’exprime en termes de dérivée directionnelle. Théorème. Soit f une fonction de Rn dans Rp , a ∈ Rn , u ∈ Rn tel que |u|2 = 1 et T > 0 tels que f soit continue sur S = {a + tu : t ∈ [0, T ]} et dérivable dans la direction u en chaque point de S0 = {a + tu : t ∈ ]0, T [}. Alors il existe θ ∈ ]0, 1[ tel que |f (a + T u) − f (a)|2 ≤ T |f $ [a + θT u; u]|2 . 4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE 155 Démonstration. Par hypothèse, la fonction g : t 2→ f (a + tu) est une fonction de R dans Rp qui vérifie les conditions du théorème de la moyenne sur [0, T ], et, par définition de la dérivée directionnelle, on a g $ (t) = f $ (a + tu; u) pour chaque t ∈ ]0, T [. En conséquence, il existe θ ∈ ]0, 1[ tel que |f (a + T u) − f (a)|2 = |g(T ) − g(0)|2 ≤ T |g $ (θT )|2 = T |f $ (a + θT u; u)|2 . On a aussi la version suivante en termes de dérivée totale. Théorème. Soit f une fonction de Rn dans Rp , a ∈ Rn , b ∈ Rn , S = {a + t(b − a) : t ∈ [0, 1]} et S0 = {a + t(b − a) : t ∈ ]0, 1[} vérifiant les conditions suivantes. 1. f est continue sur S. 2. Chaque point de S0 est intérieur à dom f . 3. f est dérivable en chaque point de S0 . Alors il existe θ ∈ ]0, 1[ tel que $ |f (b) − f (a)|2 ≤ |fa+θ(b−a) (b − a)|2 , ou encore il existe c ∈ S0 tel que |f (b) − f (a)|2 ≤ |fc$ (b − a)|2 . Démonstration. Soit h l’application affine de R dans Rn définie par h(t) = a + t(b − a). Elle est dérivable en chaque point de R. Par le théorème de continuité et de dérivabilité des fonctions composées, la fonction f ◦ h sera continue sur [0, 1] et dérivable en chaque point de ]0, 1[. En outre, pour chaque t ∈ ]0, 1[, on a $ $ $ (f ◦ h)$ (t) = (f ◦ h)$t (1) = (fh(t) ◦ h$t )(1) = fh(t) (h$ (t)) = fh(t) (b − a). Le théorème de la moyenne pour une fonction de R dans Rp entraı̂ne donc l’existence d’un θ ∈ ]0, 1[ tel que |f [h(1)] − f [h(0)]|2 ≤ |(f ◦ h)$ (θ)|2 , et dès lors tel que $ |f (b) − f (a)|2 ≤ |fh(θ) (b − a)|2 , et il suffit de poser c = h(θ) = a + θ(b − a). 156 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Corollaire. Soit f une fonction de Rn dans Rp, a ∈ Rn et r > 0 tel que f soit dérivable en chaque point de B2 (a; r). Alors, pour chaque 1 ≤ k ≤ n et chaque h ∈ R tel que 0 < |h| < r, il existe θ ∈ ]0, 1[ tel que |f (a + hek ) − f (a)|2 ≤ |h||Dk f (a + θhek )|2 . Démonstration. Les conditions du théorème de la moyenne pour une fonction de Rn dans Rp sont satisfaites pour b = a + hek . Dès lors, il existe θ ∈ ]0, 1[ tel que $ k |f (a + hek ) − f (a)|2 ≤ |fa+θhe k (he )|2 $ k k = |h||fa+θhe k (e )|2 = |h||Dk f (a + θhe )|2 . 4.11 Condition suffisante de dérivabilité On a vu que l’existence des dérivées partielles en un point n’entraı̂nait pas la dérivabilité (totale) en ce point. Les résultats globaux que nous venons d’obtenir permettent de démontrer une intéressante condition suffisante (locale) de dérivabilité en un point en termes de propriétés des dérivées partielles. Elle repose sur la conséquence suivante du théorème de la moyenne. Lemme. Soit f une fonction de Rn dans Rp , a ∈ Rn , h ∈ R et 1 ≤ k ≤ n tels que f soit continue en chaque point de S = {a + thek : t ∈ [0, 1]} et Dk f (x) existe pour chaque x ∈ S0 = {a + thek : t ∈ ]0, 1[}. Alors il existe θ ∈ ]0, 1[ tel que |f (a + hek ) − f (a) − hDk f (a)|2 ≤ |h||Dk f (a + θhek ) − Dk f (a)|2. Démonstration. Soit g la fonction de R dans Rp définie par g(t) = f (a + − f (a) − thDk f (a). Par hypothèse g est dérivable en chaque point de ]0, 1[ et thek ) g(τ ) − g(t) f (a + τ hek ) − f (a + thek ) − (τ − t)hDk f (a) = lim τ →t τ →t τ −t τ −t g $ (t) = lim D E = h Dk f (a + thek ) − Dk f (a) . 157 4.11. CONDITION SUFFISANTE DE DÉRIVABILITÉ Le théorème de la moyenne pour une fonction de R dans Rp appliqué à g sur [0, 1] entraı̂ne l’existence d’un θ ∈ ]0, 1[ tel que |f (a + hek ) − f (a) − hDk f (a)|2 = |g(1) − g(0)|2 ≤ |g $(θ)|2 = |h||Dk f (a + θhek ) − Dk f (a)|2 . Proposition. Soit f une fonction de Rn dans Rp, a ∈ dom f. Supposons qu’il existe un entier 1 ≤ k ≤ n tel que Dk f (a) existe et un r > 0 tel que, pour chaque entier j /= k compris entre 1 et n, Dj f (x) existe pour chaque x ∈ B2 [a; r]. Si les fonctions de Rn dans Rp Dj f : x 2→ Dj f (x), (1 ≤ j /= k ≤ n) sont continues en a, alors f est dérivable en a. Démonstration. En modifiant éventuellement le nom des variables, on peut, sans perte de généralité, supposer que k = n. Si h ∈ B2 [r], on a f (a + h) − f (a) − , & = f (a + h) − f , & + f a+ + f a + + f a + = n−1 $ j=1 n $ k hk e k=2 n $ k=j ' a+ n $ & k=n−1 k hk e −f a+ +... hj Dj f (a) j=1 k=2 hk ek − f a + n $ n $ +... n $ ' − h1 D1 f (a) k hk e k=3 n $ k=j+1 ' − h2 D2 f (a) f a + k=j hk ek − hj Dj f (a) hk ek − f (a + hn en ) − hn−1 Dn−1 f (a) +[f (a + hn en ) − f (a) − hn Dn f (a)] n $ - hk ek − f a + n $ k=j+1 hk ek − hj Dj f (a) +[f (a + hn e ) − f (a) − hn Dn f (a)]. n 158 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES Dès lors, en appliquant le Lemme aux n − 1 premiers termes de la somme, on obtient θj ∈ ]0, 1[, (1 ≤ j ≤ n − 1) tels que # # # # n n $ $ # # k k #f a + # h e − f a + h e − h D f (a) k k j j # # # # k=j k=j+1 2 # # # # n $ # # ≤ |hj | ##Dj f a + θj hj ej + hk ek − Dj f (a)## . # # k=j+1 2 Si maintenant ! > 0 est donné, alors, pour chaque 1 ≤ j ≤ n−1, la continuité de Dj f en a entraı̂ne l’existence d’un δj ∈ ]0, r] tel que, si |x − a|2 ≤ δj , on a ! |Dj f (x) − Dj f (a)|2 ≤ , n et l’existence de Dn f (a) entraı̂ne l’existence d’un δn ∈]0, r] tel que, si |t| ≤ δn , on a ! |f (a + ten ) − f (a) − tDn f (a)|2 ≤ |t|. n En rassemblant tous ces résultats, on voit que si |h|2 ≤ δ = min{δj : 1 ≤ j ≤ n}, on a # # # # #f # j=1 # # n−1 $ # # n $ # # #f (a + h) − f (a) − hj Dj f (a)## ≤ # # # j=1 2 # # n n $ $ # k k a + hk e − f a + hk e − hj Dj f (a)## # k=j k=j+1 2 ! +|f (a + hn e ) − f (a) − hn Dn f (a)|2 ≤ n |h|∞ ≤ !|h|2 , n ce qui montre que f est dérivable en a. n Corollaire. Soit f une fonction de Rn dans Rp , a ∈ dom f. Supposons qu’il existe un r > 0 tel que, pour chaque entier j compris entre 1 et n, Dj f (x) existe pour chaque x ∈ B2 [a; r]. Si les fonctions de Rn dans Rp Dj f : x 2→ Dj f (x), (1 ≤ j ≤ n) sont continues en a, alors f est dérivable en a. Remarque. La Proposition que nous venons de démontrer est une condition suffisante mais nullement nécessaire de dérivabilité. Ainsi, la fonction f de R2 dans R définie par f (0) = 0 et f (x) = |x|22 sin 4 1 |x|22 5 159 4.12. EXERCICES si x /= 0 est dérivable en 0 avec f0$ = 0 puisque, pour h /= 0, f (h) = |h|2 r(h) avec 4 5 1 r(h) = |h|2 sin →0 |h|22 lorsque h → 0 comme produit d’une fonction tendant vers zéro par une fonction localement bornée en 0. D’autre part, un calcul facile laissé au lecteur montre que D1 f (0) = D2 f (0) = 0, et que, pour x /= 0, 4 1 D1 f (x) = 2x1 sin |x|22 D2 f (x) = 2x2 sin 4 1 |x|22 5 5 4 5 4 5 1 2x1 − 2 cos , |x|2 |x|22 − 1 2x2 cos . |x|22 |x|22 Comme limx→0 Dj f (x) n’existe pas (j = 1, 2) (le vérifier), on voit que les fonctions Dj f ne sont pas continues en 0. 4.12 Exercices 1. Soit ]a, b] un intervalle semi-ouvert et c ∈ [a,Ab]. Construire une jauge δ B sur [a, b] telle que, pour toute P-partition δ-fine (xj , I j ) 1≤j≤m de ]a, b], on ait nécessairement xj = c pour l’un des 1 ≤ j ≤ m. 2. Montrer que la fonction f de R dans R définie par f (0) = 0, f (x) = sin 1 si x /= 0, x est continue au sens de Darboux sur [0, 1] mais n’est pas continue sur [0, 1]. 3. Soit g : [a, b] → R une application continue telle que g(a) ∈ [a, b] et g(b) ∈ [a, b]. Montrer que le théorème de Bolzano appliqué à I − g entraı̂ne l’existence d’au moins un c ∈ [a, b] tel que c = g(c). (Théorème du point fixe de Rothe en dimension un). Le cas particulier où g([a, b]) ⊂ [a, b] s’appelle le théorème du point fixe de Brouwer . 4. Soit f une application de R dans R continue sur R et telle que f (x) → −∞ si x → −∞ et f (x) → +∞ si x → +∞. Utiliser le théorème des valeurs intermédiaires pour montrer que f est surjective. Il en est évidemment de même si f (x) → +∞ si x → −∞ et f (x) → −∞ si x → +∞. 160 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES 5. Montrer que E ⊂ Rn est un ouvert si et seulement si E est une union de boules ouvertes. 6. Si E ⊂ R est une union finie d’intervalles fermés mutuellement disjoints, appelons C(E) l’union finie d’intervalles fermés mutuellement disjoints obtenue en retirant de chaque intervalle (disons [a, b]) constituant E b−a l’intervalle ouvert “central” ]a + b−a 3 , b − 3 [ de la division de [a, b] en trois intervalles de longueurs égales. Si E0 = [0, 1], posons E1 = C(E0 ), E2 = C(E1 ), . . . , Ek = C(Ek−1 ), . . ., . 7 Montrer que l’ensemble C = k∈N Ek est un fermé borné non vide. On l’appelle l’ensemble de Cantor. Montrer (c’est plus difficile) que C est d’intérieur vide et n’a aucun point isolé. 7. Montrer que si 6 · 6 : x 2→ 6x6 est une norme sur Rn , il existe des réels 0 < a ≤ b tels que, pour tout x ∈ Rn , on a a|x|2 ≤ 6x6 ≤ b|x|2 . En d’autres termes, toutes les normes sont équivalentes sur Rn . (Il suffit de noter que, pour x /= 0, ces inégalités se réduisent à F F x a≤F F |x| 2 F F F ≤ b, F et d’appliquer le théorème de Weierstrass à la fonction x 2→ 6x6 sur le fermé borné {x ∈ Rn : |x|2 = 1}). 8. Soit f une fonction de Rn dans R et a ∈ dom f. On dit que f est semicontinue inférieurement (resp. semi-continue supérieurement) en a si (∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : f (a) − ! ≤ f (x) (resp. f (x) ≤ f (a) + !). f est évidemment continue en a si elle est semi-continue inférieurement et supérieurement en a. Montrer que la conclusion f (y) ≤ f (x) (resp. f (x) ≤ f (z)), du théorème de Weierstrass subsiste si f est semi-continue inférieurement (resp. semi-continue supérieurement) sur le fermé borné E ⊂ Rn . 9. Soit f une application de Rn dans R+ dérivable en chaque point de Rn . Montrer que, pour tout ! > 0, il existe au moins un point c! ∈ Rn tel que 161 4.12. EXERCICES |∇f (c!)|2 ≤ !. Suggestion : dans le cas non trivial où il existe a ∈ Rn tel que f (a) > 0, appliquer un Corollaire du théorème de Weierstrass à la fonction g : x 2→ f (x) + δ2 |x − a|22 , où δ > 0 est à déterminer. Cette fonction atteint un minimum en un point yδ pour lequel ∇f (yδ ) + δ(yδ − a) = 0. Dès lors, δ f (yδ ) + |yδ − a|22 ≤ f (a), 2 ce qui entraı̂ne |yδ − a|2 ≤ et dès lors si l’on prend δ = 4 2f (a) δ 51/2 , |∇f (yδ )|2 ≤ (2f (a)δ)1/2 ≤ !, !2 2f (a) . Il suffit alors de prendre c! = y !2 2f (a) . La fonction exponentielle fournit un exemple vérifiant ce résultat sans que sa dérivée ne s’annule jamais. 10. Soit f une fonction de R dans R dérivable en chaque point d’un voisinage d’un point a ∈ R. Utiliser le théorème de Lagrange pour démontrer que si limx→a, x(=a f $ (x) = b, alors b = f $ (a). 11. Soit f une fonction de Rn dans Rp et a ∈ adh (dom f \ {a}). On dit que f est fortement dérivable en a s’il existe une application linéaire L de Rn dans Rp telle que f (x) − f (y) − L(x − y) = 0. |x − y|2 (x,y)→(a,a) lim Montrer que : a. Si f est fortement dérivable en a, alors f est dérivable en a. b. Si f est fortement dérivable en a ∈ int dom f, alors nécessairement L = fa$ . c. S’il existe r > 0 tel que f soit dérivable en chaque point de B2 (a; r), et si les fonctions dérivées partielles correspondantes x 2→ Dj f (x), (1 ≤ j ≤ n), sont continues en a, alors f est fortement dérivable en a. (Utiliser le théorème de la moyenne). 12. Soient f et g des fonctions de R dans R et a ∈ dom f ∩ dom g tel que g(a) = 0. On dit que f est dérivable par rapport à g en a si lim x→a f (x) − f (a) g(x) − g(a) 162 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES df existe, auquel cas cette limite est notée Dg f (a) ou dg (a). Utiliser le théorème de l’Hospital pour montrer que si f et g sont dérivables sur un voisinage de a et si g $ (a) /= 0, alors f $ (a) Dg f (a) = $ . g (a) Si h est une fonction de R dans R∗+ et a ∈ dom h, tel que a > 0, on appelle (en économie mathématique) élasticité de h en a la dérivée en a de ln h par rapport à ln x, et on la note Eh(a). Montrer que, si h est dérivable en a, " (a) alors Eh(a) = ah h(a) . 4.13 Petite anthologie Soit, sur le plan Y OX, une aire connexe S limitée par un contour fermé simple ou complexe; on suppose qu’à chaque point de S ou de son périmètre correspond un cercle, de rayon non nul, ayant ce point pour centre : il est alors toujours possible de subdiviser S en régions, en nombre fini et assez petites pour que chacune d’elles soit complètement intérieure au cercle correspondant à un point convenablement choisi dans S ou sur son périmètre. Pierre Cousin, 1895 Dans la théorie des équations, il y a deux théorèmes dont on pouvait dire récemment encore que la démonstration entièrement correcte est inconnue. L’un est le suivant : il faut qu’il y ait toujours, entre deux valeurs quelconques de la grandeur inconnue qui donnent deux résultats de signes opposés, au moins une racine réelle de l’équation. Bernard Bolzano, 1817 On dit qu’une fonction f (x) est continue de x = a jusqu’à x = b quand elle est continue pour chaque valeur particulière x = X entre x = a et x = b, les valeurs a et b comprises; on dit qu’elle est uniformément continue de x = a à x = b quand, pour une grandeur ! donnée aussi petite que l’on veut, il existe une grandeur positive η0 telle que pour toutes les valeurs positives η qui sont plus petites que η0 , f (x ± η) − f (x) reste inférieur à !. Quelles que soient les valeurs qu’on a pu donner à x et seulement telles que x et x ± η appartiennent au domaine entre a et b, la condition doit être réalisée avec le même η0 . Heinrich Heine, 1872 163 4.13. PETITE ANTHOLOGIE Cette démonstration s’appuie, pour l’essentiel, sur le théorème exposé fréquemment et démontré dans les cours de Monsieur Weierstrass : “Une fonction réelle continue ϕ(x), définie dans un intervalle (a . . . b) (les extrémités comprises), atteint le maximum g des valeurs qu’elle peut prendre au moins pour une valeur x0 de la variable de façon que ϕ(x0 ) = g.” Georg Cantor, 1870 Soit à chercher le maximum de b2 a − a3 . D’après les règles de la méthode précitée, on aura de la sorte : b2 a + b2 e − a3 − e3 − 3a2 e − 3e2 a = b2 a − a3 . Il est clair que, si l’on supprime les termes semblables, tous ceux qui resteront seront affectés de l’inconnue e; ceux en a seul se trouvent en effet les mêmes de part et d’autre. On a ainsi : b2 e = e3 + 3a2 e + 3ae2 , et, en divisant tous les termes par e, b2 = e2 + 3a2 + 3ae, ce qui donne la constitution des deux équations corrélatives sous cette forme. Pour trouver le maximum, il s’agit d’égaler les racines des deux équations, afin de satisfaire aux règles de la première méthode, dont notre nouveau procédé tire sa raison et sa façon d’opérer. Ainsi, il faut égaler a à a + e, d’où e = 0. Mais, d’après la constitution que nous avons trouvée pour les équations corrélatives, b2 = e2 +3a2 +3ae, nous devons donc supprimer, dans cette égalité, tous les termes affectés de e, comme se réduisant à zéro; il restera b2 = 3a2 , équation qui donnera le maximum cherché pour le produit dont il s’agit. Pierre de Fermat, 1629 Si l’on substitue deux nombres au lieu de l’inconnue, chacun séparément, et si l’un de ces nombres donne un résultat positif, et l’autre un résultat négatif, il y a toujours une racine qui surpasse le plus petit des nombres, et qui est surpassée par le plus grand. Ces deux nombres s’appelleront Hypothèses. Si une égalité a pu être formée comme il a esté dit dans le premier Article, ses racines sont les hypothèses des racines de la Cascade immédiate. Cette Cascade se forme en multipliant par la progression 0.1.2. etc. Michel Rolle, 1691 Depuis l’impression de cet ouvrage, j’ai reconnu qu’à l’aide d’une formule très simple on pouvait ramener au Calcul différentiel la solution de plusieurs problèmes que j’avais renvoyés au Calcul intégral. D’après ce qui a été dit dans la septième Leçon, si l’on désigne par x0 , X deux valeurs de x entre 164 CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES lesquelles les fonctions f (x) et f $ (x) restent continues, et par θ un nombre inférieur à l’unité, on aura f (X) − f (x0 ) = f $ [x0 + θ(X − x0 )]. X − x0 Or il est aisé de voir que des raisonnements entièrement semblables à ceux dont nous avons fait usage pour démontrer l’équation précédente suffiront pour établir la formule f (X) − f (x0 ) f $ [x0 + θ(X − x0 )] = $ , F (X) − F (x0 ) F [x0 + θ(X − x0 )] θ désignant encore un nombre inférieur à l’unité, et F (x) une fonction nouvelle qui, toujours croissante ou décroissante depuis la limite x = x0 jusqu’à la limite x = X, reste continue, avec sa dérivée F $ (x), entre ces mêmes limites. Augustin Cauchy, 1823 Soit une ligne courbe AM D (AP = x, P M = y, AB = a) telle que la valeur de l’appliquée y soit exprimée par une fraction, dont le numérateur et le dénominateur deviennent chacun zéro lorsque x = a, c’est-à-dire lorsque le point P tombe sur le point donné B. On demande quelle doit être alors la valeur de l’appliquée BD. ... Et partant que si l’on prend la différence du numérateur, et qu’on la divise par la différence du dénominateur, après avoir fait x = a = Ab ou AB, l’on aura la valeur cherchée de l’appliquée bd ou BD. Guillaume-François de L’Hospital, 1696 n’a eu aucune signification jusqu’à présent, et nous n’allons pas lui en donner une. 0 0 Edmund Landau , 1934 Chapitre 5 Fonctions implicites 5.1 Limites infinies et point d’accumulation Le lemme de Cousin fournit une intéressante caractérisation des limites infinies. Commençons par une remarque très simple. Lemme. Soit f une fonction de Rn dans Rp et a ∈ adh dom f. Alors, limx→a f (x) = ∞ si et seulement si (∀b ∈ Rp )(∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x) − b|∞ > !. (5.1) Démonstration. La condition suffisante s’obtient immédiatement en prenant b = 0 dans (5.1). Pour démontrer la condition nécessaire, soit b ∈ Rp et ! > 0. Par hypothèse, (∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x)|∞ > |b|∞ + !, et dès lors, pour ces mêmes x, on aura |f (x) − b|∞ ≥ |f (x)|∞ − |b|∞ > !. Le résultat suivant, plus profond, donne la caractérisation en question. Proposition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f. Alors, limx→a f (x) = ∞ si et seulement si (∀b ∈ Rp )(∃! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x) − b|∞ > !. (5.2) 165 166 CHAPITRE 5. FONCTIONS IMPLICITES Démonstration. Condition nécessaire. Il suffit d’utiliser la condition nécessaire du lemme et de prendre, par exemple, ! = 1 dans (5.1). Condition suffisante. Pour chaque b ∈ Rp, choisissons !(b) > 0 et δ(b) > 0 tels que (5.2) soit satisfaite, c’est-à-dire tels que (∀x ∈ dom f ∩ B2 [a; δ(b)]) : f (x) /∈ B∞ [b, !(b)]. (5.3) Nous définissons ainsi une jauge ! : b 2→ !(b) sur Rp. Soit r > 0; par le lemme de Cousin appliqué au pavé B∞ [r] et à la jauge ! sur B∞ [r], il existe A B une P-partition !-fine (bj , E j ) 1≤j≤m de (] − r, r])n. Posons δ = min{δ(bj ) : 1 ≤ j ≤ m}. Si x ∈ dom f ∩ B2 [a; δ], alors, pour chaque 1 ≤ j ≤ m, on a x ∈ dom f ∩ B2 [a; δ(bj )], et dès lors, par (5.3) et la définition de !-finesse, f (x) /∈ B∞ [bj , !(bj )], (1 ≤ j ≤ m). En conséquence, pour ces mêmes x, f (x) /∈ B∞ [r], c’est-à-dire |f (x)|∞ > r. Donc, limx→a f (x) = ∞. On démontre exactement de la même manière une caractérisation des limites infinies lorsque x tend vers l’infini. Proposition. Soit f une fonction de Rn dans Rp telle que dom f ne soit pas borné. Alors, limx→∞ f (x) = ∞ si et seulement si (∀b ∈ Rp )(∃! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|∞ > !. On obtient les résultats correspondants lorsque x tend vers a ou vers l’infini dans E ⊂ Rn en appliquant les propositions qui précèdent à f |E . Le choix des normes est évidemment indifférent dans les caractérisations. Leur négation conduit aux définitions suivantes. Définition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f . On dit que b ∈ Rp est un point d’accumulation ou une valeur d’adhérence de f (x) lorsque x tend vers a si (∀! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !. (5.4) Définition. Soit f une fonction de Rn dans Rp telle que dom f ne soit pas borné. On dit que b ∈ Rp est un point d’accumulation ou une valeur d’adhérence de f (x) lorsque x tend vers l’infini si (∀! > 0)(∀ρ > 0)(∃x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !. (5.5) 5.1. LIMITES INFINIES ET POINT D’ACCUMULATION 167 On obtient évidemment les définitions correspondantes de point d’accumulation de f lorsque x tend vers a ou vers l’infini dans E ⊂ Rn en appliquant les définitions précédentes à f |E . Enfin, dans le cas d’une suite, la définition obtenue à partir du cas général est équivalente à la suivante. Définition. Soit (ak )k∈N une suite dans Rp . b ∈ Rp est un point d’accumulation ou une valeur d’adhérence de (ak )k∈N si (∀! > 0)(∀m ∈ N)(∃k ≥ m) : |ak − b|2 ≤ !. Bien entendu, dans ces définitions, le choix des normes est indifférent. Il est immédiat que si b = limx→a f (x) (resp. b = limx→∞ f (x)), alors b est un point d’accumulation de f (x) lorsque x tend vers a (resp. tend vers l’infini), et c’est le seul. Mais f peut avoir des points d’accumulation lorsque x tend vers a (ou vers l’infini) sans que la limite existe. Par exemple, -1 et 1 sont x des points d’accumulation de la fonction f : x 2→ x + |x| lorsque x tend vers 0 (le vérifier), alors que la limite correspondante n’existe pas. En s’inspirant du résultat correspondant pour la limite, il est facile d’obtenir les caractérisations suivantes d’un point d’accumulation en termes de suites. Proposition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f (resp. dom f non borné). Alors b est un point d’accumulation de f lorsque x tend vers a (resp. x tend vers l’infini) si et seulement s’il existe une suite (xk )k∈N dans dom f telle que xk → a (resp. xk → ∞) et f (xk ) → b lorsque k → ∞. b est un point d’accumulation de la suite (ak )k∈N si et seulement s’il existe une suite (kn )n∈N tendant vers l’infini telle que akn → b si m → ∞. Par exemple, chaque réel b ∈ [−1, 1] est un point d’accumulation de la fonction x 2→ sin x1 , puisque, si a ∈ [0, 2π] est tel que sin a = b, alors la suite 1 (xk )k∈N∗ = ( a+2kπ )k∈N∗ converge vers 0 et est telle que sin x1k = b quel que ∗ soit k ∈ N . Le contraposé de la caractérisation d’existence d’une limite infinie fournit évidemment une condition nécessaire et suffisante d’existence d’un point d’accumulation de f lorsque x tend vers a ou tend vers l’infini. Proposition. Soit f une fonction de Rn dans Rp , a ∈ adh dom f (resp. dom f non borné). Alors f possède un point d’accumulation lorsque x tend vers a (resp. tend vers l’infini) si et seulement si f (x) ne tend pas vers l’infini lorsque x tend vers a (resp. lorsque x tend vers l’infini). 168 CHAPITRE 5. FONCTIONS IMPLICITES Corollaire. Soit f une fonction de Rn dans Rp , a ∈ adh dom f (resp.dom f non borné). Si f est localement bornée lorsque x tend vers a (resp. bornée à l’infini), alors f possède un point d’accumulation lorsque x tend vers a (resp. tend vers l’infini). Démonstration. C’est une conséquence immédiate de la Proposition précédente et du fait que si f est localement bornée en a (resp. bornée à l’infini), elle ne tend pas vers l’infini lorsque x tend vers a (resp. tend vers l’infini). Dans le premier cas par exemple, (∃r > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x)|2 ≤ r, ce qui implique la négation de la condition de limite infinie (∃r $ > 0)(∀δ $ > 0)(∃x ∈ dom f ∩ B2 [a; δ $]) : |f (x)|2 < r $ , si l’on prend par exemple r $ = 2r et, pour chaque δ $ > 0, n’importe quel x ∈ dom f tel que |x − a|2 ≤ min{δ, δ $ }. Dans le cas des suites, le Corollaire ci-dessus a une formulation encore plus simple due au résultat suivant. Définition. On dit qu’une suite (ak )k∈N dans Rp est bornée si l’ensemble {ak : k ∈ N} est borné. Lemme. Soit (ak )k∈N une suite dans Rp. Alors (ak )k∈N est bornée si et seulement si elle est bornée à l’infini. Démonstration. La condition nécessaire est suffisante. Pour la condition suffisante, (ak )k∈N est bornée à l’infini si et seulement s’il existe r > 0 et m ∈ N tels que, pour tout entier k ≥ m, on a |ak |2 ≤ r, ce qui entraı̂ne aussitôt que, pour tout k ∈ N, on aura |ak |2 ≤ max{|a0 |2 , |a1 |2 , . . . , |am−1 |2 , r}. En combinant ce résultat avec la Proposition précédente appliquée au cas particulier d’une suite, on obtient le résultat important suivant, appelé théorème de Bolzano-Weierstrass. Corollaire. Toute suite bornée dans Rp possède au moins un point d’accumulation. La notion de point d’accumulation d’une suite peut s’exprimer en termes de l’important concept de sous-suite. 5.2. CRITÈRE DE CAUCHY 169 Définition. Soit (ak )k∈N une suite dans Rp. On appelle sous-suite de (ak )k∈N ou suite extraite de (ak )k∈N toute suite de la forme (akn )n∈N où (kn )n∈N est une suite dans N telle que kn < kn+1 pour tout k ∈ N. En d’autres termes, une sous-suite de (ak )k∈N est une suite obtenue en composant (ak )k∈N avec une suite (kn )n∈N vérifiant kn < kn+1 pour chaque n ∈ N. Par exemple, (2n)n∈N et (2n + 1)n∈N sont des sous-suites de (k)k∈N (prendre respectivement kn = 2n et kn = 2n + 1). Notons que la condition kn < kn+1 entraı̂ne évidemment que, pour chaque n ∈ N, kn+1 ≥ kn + 1, et dès lors, par récurrence, que kn ≥ n. La proposition suivante est une conséquence facile de la définition de limite. Proposition. Toute sous-suite d’une suite convergente converge vers la même limite. On a une autre caractérisation d’un point d’accumulation d’une suite. Proposition. b ∈ Rp est un point d’accumulation de la suite (ak )k∈N si et seulement s’il existe une sous-suite (akn )n∈N de (ak )k∈N qui converge vers b. Démonstration. Condition nécessaire. Soit b un point d’accumulation de (ak )k∈N . En prenant ! = 1 et m = 1 dans la définition, on obtient un entier k0 ≥ 1 tel que |ak0 − b|2 ≤ 1. En prenant ! = 12 et m = k0 + 1, on obtient un entier k1 ≥ k0 + 1 tel que |ak1 − b|2 ≤ 12 . En continuant de la sorte, on trouve 1 pour chaque entier n ≥ 1 un entier kn ≥ kn−1 + 1 tel que |akn − b|2 ≤ n+1 . En conséquence, (akn )n∈N est une sous-suite de (ak )k∈N qui converge vers b. Condition suffisante. Soit (akn )n∈N une sous-suite de (ak )k∈N qui converge vers b, et soient ! > 0 et m ∈ N. Par hypothèse, (∃q ∈ N)(∀j ≥ q) : |akj − b|2 ≤ !. Dès lors, si n = kmax{m,q}, on a n ≥ km ≥ m et |an − b|2 ≤ !. 5.2 Critère de Cauchy Nous sommes maintenant en mesure de démontrer que la condition nécessaire de Cauchy d’existence de la limite est également suffisante. Cela fournira le critère de Cauchy, dont l’intérêt est d’être une condition nécessaire et suffisante d’existence de la limite, qui, au contraire de la définition, ne fait pas intervenir la valeur de la limite. 170 CHAPITRE 5. FONCTIONS IMPLICITES Soit f une fonction de Rn dans Rp et a ∈ adh dom f . Rappelons tout d’abord que la condition de Cauchy pour f lorsque x tend vers a est la suivante : (∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) (∀y ∈ dom f : |y − a|2 ≤ δ) : |f (x) − f (y)|2 ≤ !. Complétons maintenant la démonstration du critère de Cauchy pour la limite de f (x) lorsque x tend vers a en montrant que la condition de Cauchy est une condition suffisante d’existence de la limite. Théorème. Soit f une fonction de Rn dans Rp et a ∈ adh dom f . Si f vérifie la condition de Cauchy lorsque x tend vers a, alors limx→a f (x) existe. Démonstration. Puisqu’elle vérifie la condition de Cauchy, f est localement bornée en a et dès lors f possède un point d’accumulation b lorsque x tend vers a. Montrons maintenant que b = limx→a f (x). Soit ! > 0; par hypothèse, (∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) ! (∀y ∈ dom f : |y − a|2 ≤ δ) : |f (y) − f (x)|2 ≤ , 2 et, puisque b est un point d’accumulation, pour cet 2! et ce δ > 0, il existe un z ∈ dom f ∩ B2 [a; δ] tel que ! |f (z) − b|2 ≤ . 2 En conséquence, pour tout x ∈ dom f tel que |x − a|2 ≤ δ, on a |f (x) − b|2 ≤ |f (x) − f (z)|2 + |f (z) − b|2 ≤ ! ! + = !. 2 2 On démontre d’une manière complètement analogue les résultats correspondants lorsque x tend vers l’infini. Rappelons que, dans ce cas, la condition de Cauchy s’énonce comme suit : (∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) (∀y ∈ dom f : |y|2 ≥ ρ) : |f (x) − f (y)|2 ≤ !. Lemme. Soit f une fonction de Rn dans Rp telle que dom f soit non borné. Si f vérifie la condition de Cauchy lorsque x tend vers l’infini, alors f est bornée à l’infini. 5.3. ITÉRÉES D’UNE APPLICATION 171 Théorème. Soit f une fonction de Rn dans Rp telle que dom f soit non borné. Si f vérifie la condition de Cauchy lorsque x tend vers l’infini, alors limx→∞ f (x) existe. En appliquant ces résultats à la restriction f |E de f à E ⊂ Rn , le lecteur obtiendra aisément les assertions correspondantes pour la limite de f (x) lorsque x tend vers a ou vers l’infini dans E. Enfin, le cas particulier d’une suite conduit aux formulations suivantes. Appelons suite de Cauchy toute suite vérifiant la condition de Cauchy : (∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |ak − aq |2 ≤ !. Lemme. Toute suite de Cauchy dans Rp est bornée. Théorème. Toute suite de Cauchy dans Rp est convergente. 5.3 Itérées d’une application Soit h une application de Rp dans Rp dont nous nous proposons de trouver les zéros, c’est-à-dire les éléments a ∈ Rp tels que h(a) = 0. En d’autres termes, nous voulons résoudre l’équation en l’inconnue y h(y) = 0, (5.6) ou encore déterminer ses racines. En dehors de cas très particuliers (h est une application affine, un polynôme de R dans R ou de C dans C de degré inférieur ou égal à quatre,...), il n’est pas possible en général de trouver une formule exacte fournissant les zéros de h et l’on est ramené à leur détermination approchée, avec une erreur arbitrairement petite. Une stratégie possible pour cette détermination approchée consiste à écrire l’équation (5.6) sous la forme équivalente y = y + h(y), c’est-à-dire, en posant g = I + h, sous la forme y = g(y). (5.7) Les zéros a de h correspondent donc aux points fixes de g, c’est-à-dire aux éléments a ∈ Rp tels que g(a) = a. Pour tenter de déterminer les points fixes 172 CHAPITRE 5. FONCTIONS IMPLICITES de g, on peut utiliser la méthode des approximations successives qui consiste à partir d’un élément y0 arbitraire de Rp et de calculer g(y0 ). Si g(y0 ) = y0 , alors y0 est un point fixe de g (et donc un zéro de h). Sinon, on pose y1 = g(y0 ) et l’on calcule g(y1) = g[g(y0)] = (g ◦ g)(y0) = g 2 (y0 ). Si g(y1 ) = y1 , alors y1 est un point fixe de g; sinon, on pose y2 = g(y1 ) et l’on calcule g(y2 ) = (g ◦ g ◦ g)(y0) = g 3 (y0 ). En continuant de la sorte, ou bien l’on trouve un entier positif k et un yk ∈ Rp tel que g(yk ) = yk , ou bien l’on détermine, de proche en proche, une suite (yk )k∈N par les relations y0 ∈ Rp , yk = g(yk−1) = (g ◦ g ◦ . . . ◦ g)(y0) = g k (y0 ), (k ∈ N∗ ). (5.8) Pour chaque entier k ≥ 1, l’application g k = g ◦ g ◦ . . . ◦ g (k fois) s’appelle la ke -itérée de g (on pose aussi g 0 = I). Par exemple, si g est l’application de R dans R définie par g(y) = y 2 , alors g k (y) = y 2k . Supposons maintenant que la suite (yk )k∈N définie par les relations (5.8) converge vers y ∗ et que l’application g soit continue. Alors, en faisant tendre k vers l’infini dans (5.8), on obtient y ∗ = lim yk = lim g(yk−1 ) = g( lim yk−1 ) = g(y ∗), k→∞ k→∞ k→∞ et est un point fixe de g, c’est-à-dire un zéro de h. On dit que ce point fixe y ∗ est obtenu par la méthode d’approximations successives définie par (5.8). On voit donc que la convergence de (yk )k∈N et la continuité de g suffisent pour obtenir un point fixe de g par la méthode des approximations successives. Bien entendu, la limite y ∗ de la suite (yk )k∈N n’est pas, en pratique, connue a priori puisque, dans ce cas, le point fixe correspondant de g serait connu et le problème posé serait résolu. Il est donc important de pouvoir déterminer la convergence de (yk )k∈N, sans connaı̂tre explicitement y ∗ , et l’on fera naturellement appel au critère de Cauchy. La suite (yk )k∈N dépend de g et de y0 , et il en est donc de même de sa convergence. Par exemple, si g est l’application de R dans R définie par g(y) = y + 1, alors, pour n’importe quel y0 ∈ R, on aura, pour k ∈ N∗ , y∗ yk = g k (y0 ) = y0 + k, et la suite correspondante (yk )k∈N est divergente. D’autre part, si g est l’application de R dans R définie par g(y) = y 2 , on a, pour chaque entier k ≥ 1, g k (y) = y 2k ; dès lors, si l’on prend y0 = 2, la suite correspondante 5.4. THÉORÈME DES APPLICATIONS CONTRACTANTES 173 (yk )k∈N = (22k )k∈N est divergente tandis que si l’on prend y0 = 12 , la suite correspondante (yk )k∈N = (2−2k )k∈N converge vers 0. Remarquons aussi que (yk )k∈N convergera vers 1 si et seulement si y0 = 1. Notons enfin que, étant donnée une application h dont on veut déterminer les zéros, on peut construire différentes applications g dont les points fixes fournissent les zéros de h : par exemple, si L est une application linéaire inversible de Rp dans Rp , on aura évidemment h(y) = 0 ⇔ y = y + L[h(y)], et l’on peut donc prendre g = I + L ◦ h. On est donc amené à déterminer des conditions sur g et sur y0 qui assurent la convergence de la suite des itérées (g k (y0 ))k∈N. Nous donnerons, au paragraphe suivant, des conditions sur g assurant cette convergence quel que soit le choix de y0 . Lorsque de telles conditions sur g ne sont pas satisfaites, le comportement de la suite des itérées (g k (y0 ))k∈N peut être extrêmement varié et extraordinairement compliqué même pour une fonction g de R dans R aussi simple que g(y) = ay(1 − y). Une telle suite d’itérées d’une application constitue l’exemple le plus simple d’un système dynamique discret, et (g k (y0 ))k∈N s’appelle l’orbite issue de y0 . L’ensemble limite ω(y0 ) de cette orbite est l’ensemble des points d’accumulation de (g k (y0 ))k∈N . L’étude du comportement asymptotique (pour k → ∞) des orbites conduit en particulier à la théorie du chaos, qui fait actuellement l’objet de nombreuses recherches. 5.4 Théorème des applications contractantes Le but de cette section est d’énoncer et démontrer un résultat qui, pour une application g d’une partie E de Rp en elle-même, assure la convergence de la suite des itérée (g k (y0 ))k∈N quel que soit le choix de y0 ∈ E. Nous aurons besoin pour ce faire d’un type de continuité introduit par Rudolph Lipschitz en 1868. Définition. Soit E ⊂ Rn et f une application de E dans Rp . On dit que f est lipschitzienne sur E s’il existe un α ≥ 0 tel que, pour tout u ∈ E et tout v ∈ E, on ait |f (u) − f (v)|2 ≤ α|u − v|2 . Rn . Ainsi, toute application linéaire L de Rn dans Rp est lipschitzienne sur Si f est une fonction de Rn dans Rp dérivable en chaque point d’une 174 CHAPITRE 5. FONCTIONS IMPLICITES boule ouverte B2 (a; r) de Rn et s’il existe une constante α telle que, pour tout x ∈ B2 (a; r), et tout h ∈ Rn , on ait |fx$ (h)|2 ≤ α|h|2 , alors f sera lipschitzienne sur Bj (a; r) puisque, par le théorème de la moyenne, si u ∈ B2 (a; r) et v ∈ B2 (a; r), il existera θ ∈ ]0, 1[ tel que $ |f (u) − f (v)|2 ≤ |fv+θ(u−v) (u − v)|2 ≤ α|u − v|2 , puisque u + θ(v − u) ∈ B2 (a; r). D’autre part, toute application f de E dans Rp lipschitzienne sur E est évidemment uniformément continue sur E. En outre, si f est lipschitzienne sur E, alors pour chaque a ∈ E, l’application (a) x 2→ f (x)−f est localement bornée en a. On peut évidemment, dans la |x−a|2 définition, remplacer les normes | · |2 par d’autres normes. Définition. Soit E ⊂ Rp et g une application de E dans Rp . On dit que g est une application contractante ou une contraction sur E pour la norme | · |j (j = 1, 2, ∞), s’il existe un α ∈ [0, 1[ tel que, pour tout u ∈ E et tout v ∈ E, on ait |g(u) − g(v)|j ≤ α|u − v|j . α est appelée une constante de contraction de f . Une application f de E dans Rp contractante sur E est évidemment lipschitzienne sur E. La propriété suivante est utile. Lemme. Soit E ⊂ Rp et g une application contractante de E dans E de constante α pour la norme | · |j . Alors, pour chaque entier k ≥ 1, g k = g ◦ g ◦ . . . ◦ g est contractante sur E de constante αk pour la norme | · |j . Démonstration. Elle se fait par récurrence sur k. Le résultat est évident pour k = 1. Si maintenant k ≥ 2 et g k−1 est contractante sur E de constante αk−1 , alors, pour tout u ∈ E et tout v ∈ E, on a # # # # |g k (u)−g k (v)|j = #g k−1 [g(u)] − g k−1 [g(v)]# ≤ αk−1 |g(u)−g(v)|j ≤ αk |u−v|j . j Quoiqu’énoncé et démontré dans Rp par Edouard Goursat en 1903, le résultat suivant, appelé théorème des applications contractantes, est aussi connu comme théorème du point fixe de Banach suite à l’extension à des espaces plus généraux donnée par Stefan Banach en 1922. 5.4. THÉORÈME DES APPLICATIONS CONTRACTANTES 175 Théorème. Soit E un fermé non vide de Rp, j = 1, 2 ou ∞ et g une application contractante de E dans E pour la norme | · |j , de constante α ∈ [0, 1[. Alors, g possède dans E un point fixe unique y ∗ . En outre, pour chaque y0 ∈ E, la suite (yk )k∈N des itérées de y0 définie par yk = g(yk−1) = g k (y0 ), k ∈ N∗ , converge vers y ∗ . Enfin, pour chaque k ∈ N∗ , on a |yk − y ∗ |j ≤ αk |g(y0 ) − y0 |j . 1−α Démonstration. Soit 8 y0 ∈9E. Notons tout d’abord que, puisque g(E) ⊂ E, la suite (yk )k∈N = g k (y0 ) des itérées de y0 est bien définie et est une k∈N suite dans E. Montrons que c’est une suite de Cauchy. Pour chaque k ∈ N∗ , on a # # # # |yk+1 − yk |j = #g k [g(y0)] − g k (y0 )# ≤ αk |g(y0 ) − y0 |j , j et dès lors, si k ∈ N et q ∈ N, on a |yk − yq |j = |yk − yk+1 + yk+1 − yq+1 + yq+1 − yq |j ≤ |yk − yk+1 |j + |yk+1 − yq+1 |j + |yq+1 − yq |j ≤ αk |g(y0 ) − y0 |j + |g(yk ) − g(yq )|j + αq |g(y0) − y0 |j ce qui entraı̂ne ≤ (αk + αq )|g(y0) − y0 |j + α|yk − yq |j , |yk − yq |j ≤ αk + αq |g(y0) − y0 |j . 1−α (5.9) k α Comme α ∈ [0, 1[, la suite ( 1−α |g(y0 ) − y0 |j )k∈N converge vers zéro et dès lors, si ! > 0 est donné, il existera m ∈ N tel que, pour tout entier k ≥ m , on a αk ! |g(y0 ) − y0 |j ≤ ; 1−α 2 cela entraı̂ne que, pour k ≥ m et q ≥ m, on a |yk − yq |j ≤ !, et (yk )k∈N est une suite de Cauchy dans E. Elle converge donc vers un élément y ∗ ∈ Rp et, puisque E est fermé, on a y ∗ ∈ E. Montrons que y ∗ est un point fixe de g; pour tout k ∈ N, on a 0 ≤ |y ∗ − g(y ∗ )|j = |y ∗ − yk+1 + g(yk ) − g(y ∗ )|j ≤ |y ∗ − yk+1 |j + α|yk − y ∗ |j , 176 CHAPITRE 5. FONCTIONS IMPLICITES et dès lors, en faisant tendre k vers l’infini, on en déduit que |y ∗ −g(y ∗ )|j = 0. On peut aussi obtenir le même résultat comme dans la section précédente en utilisant la continuité de g. D’ailleurs, g possède un seul point fixe dans E puisque, si y ∗ et y ∗∗ sont des points fixes de g dans E, on a 0 ≤ |y ∗ − y ∗∗ |j = |g(y ∗) − g(y ∗∗)|j ≤ α|y ∗ − y ∗∗ |j , et dès lors 0 ≤ (1 − α)|y ∗ − y ∗∗ |j ≤ 0, ce qui implique y ∗ = y ∗∗ . Enfin, pour chaque k ∈ N∗ , si l’on fait tendre q vers l’infini dans (5.9), on obtient |yk − y ∗ |j ≤ αk |g(y0 ) − y0 |j . 1−α Par exemple, pour chaque a ∈ ] − 1, 1[ et chaque b ∈ R, l’équation de Kepler y = a sin y + b, possède une solution unique y ∗ = limk→∞ yk où y0 ∈ R est arbitraire et, pour chaque k ∈ N∗ , yk = a sin yk−1 + b, puisque l’application g de R dans R définie par g(y) = a sin y + b est telle que, pour tout u ∈ R et tout v ∈ R, il existe, par le théorème de Lagrange, θ ∈ ]0, 1[ tel que |g(u) − g(v)| = |a||(sin u − sin v)| = |a|| cos(u + θ(v − u))(u − v)| ≤ |a||u − v|, et g est donc une contraction sur R de constante |a| ∈ [0, 1[. Sous les hypothèses du théorème des applications contractantes, le point fixe unique y ∗ de g est un attracteur global pour le système dynamique défini par les itérées de g. 5.5 Fonctions implicites : existence Soit F une fonction de Rn × Rp dans Rq . L’ensemble de ses zéros F −1 ({0}) = {(x, y) ∈ dom F : F (x, y) = 0} (5.10) 5.5. FONCTIONS IMPLICITES : EXISTENCE 177 constitue donc un graphe de Rn dans Rp . L’objet de la théorie des fonctions implicites est de déterminer des conditions sur F sous lesquelles le graphe F −1 ({0}) est une fonction de Rn dans Rp (problème global) ou sous lesquelles la restriction de F −1 ({0}) à un voisinage d’un de ses points est une fonction de Rn dans Rp (problème local). Pour situer la difficulté du problème et motiver les hypothèses du théorème qui donnera la solution du problème local (le problème global est beaucoup plus difficile et ne sera pas abordé ici), considérons tout d’abord le cas où F est une application affine de R × R dans R. Elle peut donc s’écrire F (x, y) = ax + by + c, où a, b et c sont des réels. Pour que le graphe F −1 ({0}) correspondant soit une fonction de R dans R, il faut qu’à chaque x ∈ R corresponde au plus un élément y ∈ R tel que ax + by + c = 0, c’est-à-dire il faut que l’équation linéaire en y by = −ax − c ait au plus une solution; ce sera le cas si et seulement si b /= 0. On notera que pour chaque x ∈ R et chaque y ∈ R, b = D2 F (x, y) est la dérivée partielle de F par rapport à y en (x, y). Considérons maintenant une situation simple où F est non linéaire. Soit F l’application de R × R dans R définie par F (x, y) = x2 + y 2 − 1. Le graphe F −1 ({0}) correspondant est la partie de R2 formée des points du cercle de centre 0 et de rayon 1 et ce n’est pas un graphe fonctionnel, puisque, pour chaque x ∈]−1, 1[⊂ [−1, 1] = dom F −1 ({0}), il existe deux éléments distincts (x, (1 − x2 )1/2) et (x, −(1 − x2 )1/2) appartenant à F −1 ({0}). Pour la même raison, la restriction de F −1 ({0}) à n’importe quel voisinage du point (−1, 0) et du point (1, 0) de F −1 ({0}) ne sera pas une fonction de R dans R. Ces points sont les seuls points du graphe de la forme (x, 0). Si (x, y) ∈ F −1 ({0}) avec y > 0 (resp. y < 0), on vérifie sans peine que la restriction de F −1 ({0}) au voisinage {(x, y) ∈ R2 : y ≥ 0} (resp. {(x, y) ∈ R2 : y ≤ 0}) de (x, y) est une fonction f de R dans R de domaine [−1, 1] donnée explicitement par f (x) = (1 − x2 )1/2 (resp. f (x) = −(1 − x2 )1/2). Notons que, pour chaque (x, y) ∈ R × R, D2 F (x, y) = 2y et dès lors que la restriction de F −1 ({0}) est une fonction sur un voisinage convenable des points (x, y) tels que D2 F (x, y) /= 0 et n’est une fonction sur aucun voisinage des points (x, y) tels que D2 F (x, y) = 0. Il ne faudrait toutefois pas en conclure trop vite que 178 CHAPITRE 5. FONCTIONS IMPLICITES la condition D2 F (x, y) /= 0 est nécessaire et suffisante pour que la restriction de F −1 ({0}) à un voisinage d’un de ses points (x, y) soit une fonction de R dans R puisque l’exemple de F (x, y) = y 3 − x, dont le graphe correspondant F −1 ({0}) = {(x, y) ∈ R × R : y 3 − x = 0} est celui de l’application f de R dans R définie par f (x) = x1/3, est tel que D2 F (x, y) = 3y 2 et donc D2 F (0, 0) = 0 au point (0, 0) de F −1 ({0}). La condition D2 F (x, y) /= 0 n’est donc pas nécessaire. Toutefois, l’important théorème des fonctions implicites, que nous allons démontrer, montre que, sous certaines conditions de régularité sur F , la condition D2 F (x, y) /= 0 est suffisante pour que la restriction de F −1 ({0}) à un voisinage suffisamment petit du point (x, y) de F −1 ({0}) soit une fonction. Nous donnerons d’abord le théorème dans le cas particulier où p = 1 avant de l’étendre au cas où p est quelconque. Théorème. Soit F une fonction de Rn ×R dans R, (x0 , y0 ) ∈ dom F, r0 > 0, R0 > 0 tels que B2 (x0 ; r0 )× ]y0 − R0 , y0 + R0 [ ⊂ dom F et tels que les conditions suivantes soient satisfaites. 1. F (x0 , y0 ) = 0 (c’est-à-dire (x0 , y0 ) ∈ F −1 ({0})). 2. La fonction F (·, y0 ) : x 2→ F (x, y0 ) est continue en x0 . 3. Pour chaque x ∈ B2 (x0 ; r0) et chaque y ∈ ]y0 − R0 , y0 + R0 [, D2 F (x, y) existe et la fonction correspondante D2 F : (x, y) 2→ D2 F (x, y) de Rn × R dans R est continue en (x0 , y0 ). 4. D2 F (x0 , y0 ) /= 0. Alors il existe r ∈ ]0, r0[ et R ∈ ]0, R0[ tels que la restriction f du graphe F −1 ({0}) à B2 [x0 ; r] × [y0 − R, y0 + R] est une application de B2 [x0 ; r] dans [y0 − R, y0 + R] continue en x0 . Démonstration. La première partie de la thèse revient à démontrer l’existence de r ∈]0, r0[ et R ∈]0, R0[ tels que, pour chaque x ∈ B2 [x0 ; r], l’équation F (x, y) = 0 (5.11) en l’inconnue y possède dans [y0 − R, y0 + R] une solution unique, que l’on notera alors f (x). La deuxième partie de la thèse revient à prouver que f est continue en x0 . Nous allons construire, pour chaque x ∈ B2 (x0 ; r0) une fonction de R dans R dont les points fixes y correspondent aux solutions de (5.11) et pour laquelle le théorème des applications contractantes sera 179 5.5. FONCTIONS IMPLICITES : EXISTENCE applicable. Si nous posons L = D2 F (x0 , y0 ), alors pour chaque (x, y) ∈ B2 (x0 ; r0)× ]y0 − R0 , y0 + R0 [, nous avons F (x, y) = 0 ⇔ Ly + F (x, y) − Ly = 0 ⇔ y = G(x, y), si G est la fonction de Rn × R de domaine égal à dom F définie par G(x, y) = −L−1 [F (x, y) − Ly]. Pour chaque x ∈ B2 (x0 ; r0), si u ∈ ]y0 − R0 , y0 + R0 [ et v ∈ ]y0 − R0 , y0 + R0 [, le théorème de Lagrange appliqué à la fonction G(x, ·) : y 2→ G(x, y) entraı̂ne l’existence d’un θ ∈ ]0, 1[ tel que G(x, u) − G(x, v) = (u − v)D2G(x, v + θ(u − v)) = −(u − v)L−1 [D2 F (x, v + θ(u − v)) − L] = −(u − v)L−1 [D2 F (x, v + θ(u − v)) − D2 F (x0 , y0 )]. Par l’hypothèse 3, il existe r1 ∈ ]0, r0[ et R ∈ ]0, R0[ tels que, pour tout (x, y) ∈ B2 [x0 ; r1] × [y0 − R, y0 + R] on a |D2 F (x, y) − D2 F (x0 , y0 )| ≤ L , 2 et dès lors, si x ∈ B2 [x0 ; r1], u ∈ [y0 −R, y0 +R], v ∈ [y0 −R, y0 +R], on aura, pour le θ donné par le théorème de Lagrange, v + θ(u − v) ∈ [y0 − R, y0 + R], et dès lors, |G(x, u) − G(x, v)| ≤ |u − v|L−1 L 1 = |u − v|, 2 2 ce qui montre que, pour chaque x ∈ B2 [x0 ; r1], l’application G(x, ·) est lipschitzienne de constante 12 sur [y0 − R, y0 + R]. Pour pouvoir appliquer le théorème du point fixe de Banach, il faut encore que G(x, ·) soit une application de [y0 − R, y0 + R] dans [y0 − R, y0 + R]. On a, pour tout x ∈ B2 [x0 ; r1] et tout y ∈ [y0 − R, y0 + R], |G(x, y) − y0 | ≤ |G(x, y) − G(x, y0 )| + |G(x, y0) − y0 | = |G(x, y) − G(x, y0)| + |L−1 F (x, y0 )| ≤ 1 R |y − y0 | + |L−1 F (x, y0 )| ≤ + |L−1 F (x, y0 )|. 2 2 180 CHAPITRE 5. FONCTIONS IMPLICITES Par l’hypothèse 1 et l’hypothèse 2, il existe r ∈ ]0, r1] tel que, pour tout x ∈ B2 [x0 ; r], on a |L−1 F (x, y0 )| = |L−1 [F (x, y0 ) − F (x0 , y0 )]| ≤ R , 2 et dès lors, pour chaque x ∈ B2 [x0 ; r] et chaque y ∈ [y0 − R, y0 + R], on aura |G(x, y) − y0 | ≤ R, ce qui montre que G(x, ·) est une application du fermé [y0 − R, y0 + R] en lui-même. Le théorème de Banach entraı̂ne donc, pour chaque x ∈ B2 [x0 ; r], l’existence d’un point fixe unique y ∈ [y0 − R, y0 + R] de G(x, ·), c’est-à-dire l’existence d’un unique y = f (x) ∈ [y0 − R, y0 + R] tel que F [x, f (x)] = 0. Pour x = x0 , l’unicité entraı̂ne en particulier que f (x0 ) = y0 . Il reste à montrer que f est continue en x0 . Si x ∈ B2 [x0 ; r], on a |f (x) − f (x0 )| = |G[x, f (x)] − G[x0 , f (x0 )]| = |G[x, f (x)] − G[x, f (x0)] + G(x, y0 ) − G(x0 , y0 )| 1 ≤ |f (x) − f (x0 )| + |L−1 [F (x, y0 ) − F (x0 , y0 )]|. 2 Dès lors, |f (x) − f (x0 )| ≤ 2|L−1 [F (x, y0 ) − F (x0 , y0 )]|, et comme le second membre tend vers 0 lorsque x tend vers x0 en vertu de l’hypothèse 2, on voit que f est continue en x0 . Enonçons et démontrons maintenant le théorème dans le cas général. Pour motiver l’énoncé dans ce cas (la démonstration sera très semblable à celle du cas particulier précédent), considérons le cas où F est une application linéaire de Rn × Rp dans Rq . Elle peut donc s’écrire F (x, y) = Ax + By, où A est une application linéaire de Rn dans Rq et B une application linéaire de Rp dans Rq . Pour que le graphe F −1 ({0}) correspondant soit une fonction de Rn dans Rp , il faut qu’à chaque x ∈ Rn corresponde au plus un élément y ∈ Rp tel que Ax + By = 0, c’est-à-dire il faut que le système linéaire en y By = −Ax 5.5. FONCTIONS IMPLICITES : EXISTENCE 181 ait au plus une solution. La théorie des équations linéaires nous apprend que ce sera le cas si et seulement si B est injective. Cela entraı̂ne en particulier que p ≤ q et nous nous restreindrons au cas le plus simple où q = p. Dans ce cas, la condition pour que F −1 ({0}) soit une fonction (en fait une application de Rn dans Rp) est que B soit inversible, ou encore que det B /= 0. On notera que si, pour chaque x ∈ Rn fixé, F (x, ·) désigne l’application (affine) de Rp dans Rp définie par F (x, ·) = Ax + B(·), alors, pour chaque y ∈ Rp, B est la dérivée totale de F (x, ·) en y, c’est-à-dire B = (F (x, ·))$y . On doit donc s’attendre, dans le cas non linéaire, à trouver une hypothèse d’inversibilité pour (F (x0 , ·))$y0 . Théorème. Soit F une fonction de Rn × Rp dans Rp , (x0 , y0 ) ∈ dom F, r0 > 0, R0 > 0 tels que B2 (x0 ; r0 ) × B2 (y0 ; R0) ⊂ dom F et tels que les conditions suivantes soient satisfaites. 1. F (x0 , y0 ) = 0 (c’est-à-dire (x0 , y0 ) ∈ F −1 ({0})). 2. La fonction F (., y0 ) : x 2→ F (x, y0 ) est continue en x0 . 3. Pour chaque x ∈ B2 (x0 ; r0 ) la fonction F (x, ·) : y 2→ F (x, y) de Rp dans Rp est dérivable en chaque y ∈ B2 (y0 ; R0), et, pour chaque 1 ≤ j ≤ p, la fonction correspondante Dyj F : (x, y) 2→ Dyj F (x, y) de Rn × Rp dans Rp est continue en (x0 , y0 ). 4. L’application linéaire (F (x0 , ·))$y0 de Rp dans Rp est inversible (c’est-à-dire le déterminant de la matrice jacobienne correspondante (Dyj Fk (x0 , y0 ))(1≤j≤p; 1≤k≤p) est différent de zéro). Alors il existe r ∈ ]0, r0[ et R ∈ ]0, R0[ tels que la restriction f du graphe F −1 ({0}) à B2 [x0 ; r]×B2 [y0 ; R] est une application de B2 [x0 ; r] dans B2 [y0 ; R] continue en x0 . Démonstration. La première partie de la thèse revient à démontrer l’existence de r ∈]0, r0[ et R ∈]0, R0[ tels que, pour chaque x ∈ B2 [x0 ; r], l’équation F (x, y) = 0 (5.12) en l’inconnue y possède dans B2 [y0 ; R] une solution unique, que l’on notera alors f (x). La deuxième partie de la thèse revient à prouver que f est continue en x0 . Nous allons construire, pour chaque x ∈ B2 (x0 , r0) une fonction de R dans R dont les points fixes y correspondent aux solutions 182 CHAPITRE 5. FONCTIONS IMPLICITES de (5.12) et pour laquelle le théorème des applications contractantes sera applicable. Si nous posons L = (F (x0 , ·))$y0 , (L est donc une application linéaire inversible de Rp dans Rp ), alors pour chaque (x, y) ∈ B2 (x0 ; r0) × B2 (y0 ; R0), nous avons F (x, y) = 0 ⇔ Ly + F (x, y) − Ly = 0 ⇔ y = G(x, y), si G est la fonction de Rn × Rp de domaine égal à dom F définie par G(x, y) = −L−1 [F (x, y) − Ly]. Pour chaque x ∈ B2 (x0 ; r0 ), si u ∈ B2 (y0 ; R0) et v ∈ B2 (y0 ; R0 ), l’inégalité de la moyenne appliqué à la fonction G(x, ·) : y 2→ G(x, y) entraı̂ne l’existence d’un θ ∈ ]0, 1[ tel que |G(x, u) − G(x, v)|2 ≤ |(G(x, ·))$v+θ(u−v)(u − v)|2 = |L−1 [(F (x, ·))$v+θ(u−v) − L](u − v)|2 ≤ |L−1 |2,2 |[(F (x, ·))$v+θ(u−v) − L](u − v)|2 = |L −1 |2,2 ≤ |L−1 |2,2 |(F (x, ·))$v+θ(u−v) − L|2,2 |u − v|2 p $ j=1 |Dyj F (x, v + θ(u − v)) 1/2 − Dyj F (x0 , y0 )|22 |u − v|2 . Par l’hypothèse 3, il existe r1 ∈ ]0, r0[ et R ∈ ]0, R0[ tels que, pour tout (x, y) ∈ B2 [x0 ; r1] × B2 [y0 ; R] et chaque 1 ≤ j ≤ p, on a |Dyj F (x, y) − Dyj F (x0 , y0 )|2 ≤ 1 2p1/2|L−1 | , 2,2 et dès lors, si x ∈ B2 [x0 ; r1], u ∈ B2 [y0 ; R], v ∈ B2 [y0 ; R], on aura, pour le θ donné par le théorème de la moyenne, v + θ(u − v) ∈ B2 [y0 ; R], et dès lors, |G(x, u) − G(x, v)|2 ≤ 1 |u − v|2 , 2 ce qui montre que, pour chaque x ∈ B2 [x0 ; r1 ], l’application G(x, ·) est lipschitzienne de constante 12 sur B2 [y0 ; R]. Pour pouvoir appliquer le théorème du point fixe de Banach, il faut encore que G(x, ·) soit une application de B2 [y0 ; R] dans B2 [y0 ; R]. On a, pour tout x ∈ B2 [x0 ; r1 ] et tout y ∈ B2 [y0 ; R], |G(x, y) − y0 |2 ≤ |G(x, y) − G(x, y0 )|2 + |G(x, y0) − y0 |2 183 5.6. FONCTIONS IMPLICITES : RÉGULARITÉ = |G(x, y) − G(x, y0 )|2 + |L−1 F (x, y0 )|2 1 R ≤ |y − y0 |2 + |L−1 F (x, y0 )|2 ≤ + |L−1 F (x, y0 )|2 . 2 2 Par l’hypothèse 1, l’hypothèse 2 et la continuité des applications linéaires, il existe r ∈ ]0, r1] tel que, pour tout x ∈ B2 [x0 ; r], on a |L−1 F (x, y0 )|2 = |L−1 [F (x, y0 ) − F (x0 , y0 )]|2 ≤ R , 2 et dès lors, pour chaque x ∈ B2 [x0 ; r] et chaque y ∈ B2 [y0 ; R], on aura |G(x, y) − y0 |2 ≤ R, ce qui montre que G(x, ·) est une application du fermé B2 [y0 ; R] en ellemême. Le théorème de Banach entraı̂ne donc, pour chaque x ∈ B2 [x0 ; r], l’existence d’un point fixe unique y ∈ B2 [y0 ; R] de G(x, ·), c’est-à-dire l’existence d’un unique y = f (x) ∈ B2 [y0 ; R] tel que F [x, f (x)] = 0. Pour x = x0 , l’unicité entraı̂ne en particulier que f (x0 ) = y0 . Il reste à montrer que f est continue en x0 . Si x ∈ B2 [x0 ; r], on a |f (x) − f (x0 )|2 = |G[x, f (x)] − G[x0 , f (x0 )]|2 = |G[x, f (x)] − G[x, f (x0)] + G(x, y0 ) − G(x0 , y0 )|2 ≤ 1 |f (x) − f (x0 )|2 + |L−1 [F (x, y0 ) − F (x0 , y0 )]|2. 2 Dès lors, |f (x) − f (x0 )|2 ≤ 2|L−1 [F (x, y0 ) − F (x0 , y0 )]|2 , et comme le second membre tend vers 0 lorsque x tend vers x0 en vertu de l’hypothèse 2, on voit que f est continue en x0 . 5.6 Fonctions implicites : régularité Si l’on impose à F des conditions de continuité ou de dérivabilité plus fortes, on obtient des conditions de continuité ou de dérivabilité plus fortes pour f . 184 CHAPITRE 5. FONCTIONS IMPLICITES Proposition. Dans les conditions du théorème des fonctions implicites, si l’on suppose en outre que, pour chaque y ∈ B2 (y0 ; R0 ), la fonction F (·, y) : x 2→ F (x, y) est continue sur B2 (x0 ; r0 ), alors f est continue sur B2 [x0 ; r]. Démonstration. Il suffit d’imiter la fin de la démonstration du théorème des fonctions implicites. Si a ∈ B2 [x0 ; r] et x ∈ B2 [x0 ; r], on a |f (x) − f (a)|2 = |G[x, f (x)] − G[a, f (a)]|2 = |G[x, f (x)] − G[x, f (a)] + G(x, f (a)) − G(a, f (a))|2 ≤ 1 |f (x) − f (a)|2 + |L−1 [F (x, f (a)) − F (a, f (a))]|2. 2 Dès lors, |f (x) − f (a)|2 ≤ 2|L−1 [F (x, f (a)) − F (a, f (a))]|2, et comme le second membre tend vers 0 lorsque x tend vers a en vertu de l’hypothèse de continuité sur F (·, f (a)), on voit que f est continue en a. Proposition. Dans les conditions du théorème des fonctions implicites, si l’on suppose en outre que F est dérivable en (x0 , y0 ), alors f sera dérivable en x0 et fx$ 0 = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 . Démonstration. La dérivabilité de F en (x0 , y0 ) entraı̂ne l’existence d’une fonction α de Rn ×Rp dans Rp de domaine au moins égal à (dom F −(x0 , y0 ))\ {(0, 0)}, tendant vers zéro lorsque son argument tend vers zéro et telle que $ F (x0 + h, y0 + l) = F (x0 , y0 ) + F(x (h, l) + |(h, l)|2α(h, l) 0 ,y0 ) = F (x0 , y0 ) + (F (., y0 ))$x0 (h) + (F (x0 , .))$y0 (l) + |(h, l)|2α(h, l), pour tout (h, l) ∈ (dom F − (x0 , y0 )) \ {(0, 0)}. Dès lors, si h ∈ Rp est tel que |h|2 ≤ r $ avec r $ ∈ ]0, r] tel que |f (x0 + h) − f (x0 )|2 ≤ R lorsque |h|2 ≤ r $ (un tel r $ existe toujours puisque f est continue en x0 ), il résulte de la définition de f et de l’égalité précédente avec l = f (x0 + h) − f (x0 ) que 0 = (F (·, y0))$x0 (h) + (F (x0 , ·))$y0 (f (x0 + h) − f (x0 )) +|(h, f (x0 + h) − f (x0 ))|2α[h, f (x0 + h) − f (x0 )]; dès lors, puisque (F (x0 , ·))$y0 est inversible, f (x0 + h) − f (x0 ) 185 5.6. FONCTIONS IMPLICITES : RÉGULARITÉ = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |(h, f (x0 + h) − f (x0 ))|2 β(h)], (5.13) où β est définie par β(h) = −[(F (x0 , ·))$y0 ]−1 α (h, f (x0 + h) − f (x0 )) , et tend donc vers 0 lorsque h tend vers zéro. En particulier, on peut trouver un r $$ ∈ ]0, r $] tel que, pour tout 0 < |h|2 ≤ r $$ , on ait |β(h)|2 ≤ 1 , 2 et dès lors, pour ces mêmes valeurs de h, on déduit de (5.13) que # # # # |f (x0 + h) − f (x0 )|2 ≤ #[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h)# 2 1 1 + |h|2 + |f (x0 + h) − f (x0 )|2 , 2 2 c’est-à-dire, |f (x0 + h) − f (x0 )|2 ≤ 2|[(F (x0, ·))$y0 ]−1 [(F (·, y0 ))$x0 (h)|2 + |h|2 . Il en résulte aussitôt que la fonction h 2→ en 0. Dès lors (5.13) peut s’écrire f (x0 +h)−f (x0 ) |h|2 est localement bornée f (x0 + h) − f (x0 ) #4 # h = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |h|2 ## |h|2 , 5# f (x0 + h) − f (x0 ) ## # β(h) |h|2 2 = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |h|2 γ(h), où la fonction γ définie par #4 # h γ(h) = ## |h|2 , 5# f (x0 + h) − f (x0 ) ## # β(h), |h|2 2 tend vers 0 lorsque h tend vers 0 comme produit d’une fonction localement bornée en 0 par une fonction tendant vers zéro. Par la caractérisation de la dérivabilité totale, f est dérivable en x0 et fx$ 0 = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 . 186 CHAPITRE 5. FONCTIONS IMPLICITES Remarque. Lorsque n = p = 1, la formule donnant la dérivée d’une fonction implicite peut évidemment s’écrire, en termes de dérivées ordinaires D1 F (x0 , y0 ) f $ (x0 ) = − . D2 F (x0 , y0 ) En faisant des hypothèses de dérivabilité plus fortes sur F , on obtient des propriétés correspondantes de dérivabilité pour f . Proposition. Supposons que, outre les conditions du théorème des fonctions implicites, F soit dérivable en chaque point de B2 (0; r0) × B2 (y0 ; R0) et que les fonctions (x, y) 2→ Dxi F (x, y), (1 ≤ i ≤ n) et (x, y) 2→ Dyj F (x, y), (1 ≤ j ≤ p) soient continues sur B2 (0; r0)×B2 (y0 ; R0). Alors il existe r̃ ∈]0, r] tel que f soit dérivable en chaque point x de B2 (0; r̃) et tel que les fonctions x 2→ Dif (x), (1 ≤ i ≤ n), soient continues sur B2 (0; r̃). Démonstration. Par hypothèse, la fonction (x, y) 2→ det(F (x, ·))$y est continue sur B2 (0; r0) × B2 (y0 ; R0 ) et telle que det(F (x0 , ·)$y0 /= 0. Comme, en outre, f est continue sur B2 (0; r0), la fonction x 2→ det(F (x, ·))$f (x) est continue sur B2 (0; r0) et telle que det(F (x0 , ·))$f (x0) = det(F (x0 , ·))$y0 /= 0. En conséquence, il existe r̃ ∈ ]0, r0] tel que det(F (x, ·))$f (x) /= 0 pour tout x ∈ B2 (x0 ; r̃) et la Proposition précédente est applicable en un tel x, entraı̂nant la dérivabilité de f en x et la formule fx$ = −[(F (x, ·))$f (x)]−1 (F (·, f (x)))$x. Dès lors, en utilisant les formules reliant dérivée totale et dérivées partielles, la continuité des dérivées partielles de F et les formules donnant l’inverse et le produit de deux matrices, on en déduit la continuité des dérivées partielles Di f, (1 ≤ i ≤ n) en chaque point de B2 (x0 ; r̃). Remarque. Dans le cas où n = p = 1 et où f est dérivable sur un voisinage de x0 , la formule donnant la dérivée de f en x peut se retrouver à partir de l’identité F (x, f (x)) = 0, en utilisant le théorème de dérivation d’une fonction composée, qui entraı̂ne ici d 0= [F (x, f (x))] = D1 F (x, f (x)) + D2 F (x, f (x))f $(x), dx dont on déduit aussitôt D1 F (x, f (x)) f $ (x) = − . D2 F (x, f (x)) 5.7. FONCTION RÉCIPROQUE 5.7 187 Fonction réciproque Le théorème des fonctions implicites permet d’étudier l’existence locale et la régularité de la fonction réciproque d’une fonction de Rp dans Rp. Soit g une fonction de Rp dans Rp , y0 ∈ dom g, et posons x0 = g(y0 ). Le graphe de g est l’ensemble G = {(y, x) ∈ Rp × Rp : y ∈ dom g et x = g(y)} et le graphe réciproque G−1 est l’ensemble G−1 = {(x, y) ∈ Rp × Rp : y ∈ dom g et x = g(y)}. Le problème de l’existence locale de la fonction réciproque de g consiste à trouver des conditions sous lesquelles la restriction de G−1 à un voisinage de (x0 , y0 ) est une fonction, qui sera alors la fonction réciproque g −1 de g au voisinage du point considéré. Si l’on remarque que G−1 = {(x, y) ∈ Rp × Rp : y ∈ dom g et g(y) − x = 0}, on voit que l’existence de la fonction réciproque de g au voisinage de (x0 , y0 ) n’est rien d’autre que l’existence locale de la fonction implicite correspondant à F (x, y) = g(y) − x. Proposition. Soit g une fonction de Rp dans Rp , y0 ∈ dom g, x0 = g(y0 ). S’il existe R0 > 0 tel que g soit dérivable en chaque point de B2 (y0 ; R0 ) et tel que, pour chaque 1 ≤ j ≤ p, la fonction y 2→ Dj g(y) soit continue en y0 , et si gy$ 0 est inversible (c’est-à-dire si det gy$ 0 /= 0), alors il existe r̃ > 0 et R̃ ∈ ]0, R0[ tels que la restriction du graphe G−1 à B2 (x0 ; r̃) × B2 (y0 ; R̃) soit une application g −1 de B2 (x0 ; r̃) dans B2 (y0 ; R̃) continue sur B2 (x0 ; r̃), dérivable en y0 et telle que (g −1 )$x0 = [gg$ −1(x0 ) ]−1 . Si, en outre, pour chaque 1 ≤ j ≤ p,la fonction y 2→ Dj g(y) est continue sur B2 (y0 ; R0), alors g −1 est dérivable en chaque point de B2 (x0 ; r̃), telle que (g −1 )$x = [gg$ −1(x)]−1 , et telle que, pour chaque 1 ≤ j ≤ p, la fonction x 2→ Dj g −1 (x) est continue en chaque point x ∈ B2 (x0 ; r̃). Démonstration. Il suffit de vérifier que la fonction F définie par F (x, y) = g(y) − x sur dom F = Rp × dom g vérifie les conditions de régularité 188 CHAPITRE 5. FONCTIONS IMPLICITES requises par la version du théorème des fonctions implicites correspondant aux hypothèses de régularité faites et de noter que (F (x, ·))$y = gy$ , (F (·, y))$x = −I. Remarque. Lorsque p = 1, la formule donnant la dérivée de la fonction réciproque de g peut encore s’écrire (g −1 )$ (x0 ) = 1 . g $ [g(x0)] Par exemple, si g(y) = y 2 , y0 /= 0 et x0 = y02 , on retrouve la formule bien connue 1 (g −1 )$ (x0 ) = 1/2 . 2x0 5.8 Théorème de l’application intérieure Une autre application intéressante du théorème des fonctions implicites est une version non linéaire de la propriété suivante des applications linéaires. Si L : Rm → Rp est linéaire et surjective, c’est-à-dire si rang L = p, alors, pour chaque a ∈ Rm , L(a) est évidemment intérieur à L(Rm ) = Rp; si L n’est pas surjective, c’est-à-dire si rang L < p, L(Rm ) est un sous-espace vectoriel propre de Rp et, quel que soit a ∈ Rm , L(a) n’est pas intérieur à L(Rm ), puisque int L(Rm ) est vide. En d’autres termes, la condition nécessaire et suffisante pour que L(a) soit intérieur à L(Rm ) est que rang L = p. C’est la partie suffisante de ce résultat que le théorème des fonctions implicites permet d’étendre, localement, sous le nom de théorème de l’application intérieure, à certaines fonctions de Rm dans Rp . Ce théorème donne donc des conditions sur g pour que l’image par g d’un voisinage de a soit un voisinage de g(a). Proposition. Soit a ∈ Rm , r0 > 0 et g une fonction de Rm dans Rp dérivable en chaque point x ∈ B2 (a; r0) et telle que, pour chaque 1 ≤ j ≤ m, la fonction x 2→ Dj g(x) soit continue en a. Si m ≥ p et rang ga$ = p, alors g(a) est intérieur à g[B2 (a; r0)]. Démonstration. Il faut donc trouver un r ∈ ]0, r0[ tel que B2 [g(a); r] ⊂ g[B2 (a; r0)], c’est-à-dire trouver un r ∈ ]0, r0[ tel que, pour chaque v ∈ B2 [g(a); r], il existe un u ∈ B2 (a; r0) tel que g(u) = v. Puisque rang ga$ = p, 5.9. EXTRÉMANTS LIÉS 189 on peut trouver dans {D1 g(a), . . ., Dmg(a)} p éléments formant une famille libre et, en permutant si nécessaire les indices des variables, on peut, sans perte de généralité, supposer que les p premiers éléments forment une telle famille, c’est-à-dire supposer que det col [D1 g(a), . . ., Dpg(a)] /= 0. En vertu des hypothèses, si l’on pose y0 = (a1 , . . . , ap), x0 = (g1 (a), . . ., gp(a), ap+1, . . . , am ), l’application F définie sur B2 (x0 ; r0 ) × B2 (y0 ; 0) par F (x, y) = g(y1 , . . . , yp , xp+1 , . . . , xm) − (x1 , . . ., xp) est telle que, F (x0 , y0 ) = g(a) − g(a) = 0, det(F (x0 , ·)$y0 = det col[D1 g(a), . . ., Dpg(a)] /= 0. Le théorème des fonctions implicites implique donc l’existence d’un r ∈]0, r0[, d’un R ∈ ]0, r0[ et d’une application f : B2 [x0 ; r] → B2 [y0 ; R] continue en x0 et telle que, pour tout x ∈ B2 [x0 ; r], on ait F (x, f (x)) = 0. En particulier, si v ∈ B2 [g(a); r] ⊂ Rp , alors (v, ap+1 , . . . , am) ∈ B2 [x0 ; r], et on a donc F [v, ap+1 , . . . , am , v, f (v, ap+1, . . . , am )] = 0, c’est-à-dire v − g[f (v, ap+1, . . . , am ), ap+1 , . . ., am ] = 0, avec [f (v, ap+1, . . . , am), ap+1 , . . . , am] ∈ B2 (a; r0). Remarque. Par définition du rang, on a rang ga$ ≤ min{m, p} = p. Dès lors, le théorème de l’application intérieure implique que si g(a) n’est pas intérieur à g(B2 (a; r0 )), alors rang ga$ < p. 5.9 Extrémants liés Le théorème de Fermat a fourni une condition nécessaire pour l’existence d’un extrémant local libre d’une fonction réelle f . Nous allons montrer que le théorème des fonctions implicites ou ses conséquences permettent de donner des conditions nécessaires d’existence pour certains extrémants liés , c’est-àdire non intérieurs au domaine de la fonction f . Pour motiver ces conditions, 190 CHAPITRE 5. FONCTIONS IMPLICITES soient f et g des fonctions de R2 dans R définies sur B2 (a; r0) pour un certain a ∈ R2 et un certain r0 > 0, et soit E = {(x, y) ∈ R × R : g(x, y) = 0}. On supposera que a ∈ E, c’est-à-dire que g(a) = 0. On veut trouver une condition nécessaire pour que a soit un extrémant local de f sur E. Pour fixer les idées, supposons que a soit un maximant local de f sur E, c’est-à-dire qu’il existe r $ ∈ ]0, r0[ tel que, pour tout (x, y) ∈ B2 (a; r $) ∩ E, on ait f (x, y) ≤ f (a1 , a2 ). Supposons en outre que f soit dérivable en a, que g soit dérivable en chaque point x ∈ B2 (a; r0), que D2 g(a1 , a2 ) /= 0 et que les fonctions (x, y) 2→ D1 g(x, y) et (x, y) 2→ D2 g(x, y) soient continues en a. Dans ce cas, le théorème des fonctions implicites appliqué à g en a entraı̂ne l’existence d’un r ∈ ]0, r0[, d’un R ∈ ]0, r0[ et d’une application e : [a1 − r, a1 + r] → [a2 − R, a2 + R] dérivable en a1 et telle que e soit la restriction du graphe E sur [a1 − r, a1 + r] × [a2 − R, a2 + R]. En d’autres termes, si l’on prend r ≤ r $ , on a (x, y) ∈ E ∩ B2 (a; r) si et seulement si y = e(x) et dès lors f (x, y) ≤ f (a1 , a2 ), x ∈ E ∩ B2 (a; r), si et seulement si f (x, e(x)) ≤ f (a1 , a2 ), x ∈ ]a1 − r, a1 + r[. Par conséquent, a1 est un maximant local libre de la fonction (de R dans R) x 2→ f (x, e(x)), qui est dérivable en a1 , et le théorème de Fermat et les théorèmes de dérivation des fonctions composées et des fonctions implicites entraı̂nent que 0= d [f (a1 , e(a1))] = D1 f (a1 , e(a1 )) + D2 f (a1 , e(a1 ))e$ (a1 ) dx = D1 f (a1 , a2 ) − D2 f (a1 , a2) c’est-à-dire det & D1 g(a1 , a2 ) , D2 g(a1 , a2 ) D1 f (a1 , a2 ) D1 g(a1 , a2 ) D2 f (a1 , a2 ) D2 g(a1 , a2 ) ' = 0. Par conséquent, la famille {fa$ , ga$ } n’est pas libre et il existe donc (µ0 , µ1 ) /= (0, 0) tel que µ0 fa$ + µ1 ga$ = 0. On a nécessairement µ0 /= 0 car, si µ0 = 0, alors µ1 ga$ = 0 et donc, puisque ga$ /= 0, µ1 = 0 ce qui est contradictoire. En divisant les deux membres par 191 5.9. EXTRÉMANTS LIÉS µ0 , la relation précédente s’écrit fa$ + λ1 ga$ = 0. Si l’on se souvient que la condition a ∈ E équivaut à g(a) = 0, on voit que si a est un extrémant local de f sur E = {(x, y) : g(x, y) = 0}, alors il existe λ1 ∈ R tel que (Lf,g )$a,λ1 = 0, où Lf,g est la fonction de Lagrange associée à f et g, c’est-à-dire la fonction de R3 dans R définie par Lf,g (x, λ) = f (x) + λg(x). On constate en effet que D1 Lf,g (x, λ) = D1 f (x) + λD1 g(x), D2 Lf,g (x, λ) = D2 f (x) + λD2 g(x), D3 Lf,g (x, λ) = g(x). Le nombre λ1 est appelé le multiplicateur de Lagrange relatif à l’extrémant lié a de f . Si, au lieu de supposer que D2 g(a1, a2 ) /= 0, on suppose que D1 g(a1 , a2 ) /= 0, on arrive au même résultat en intervertissant le rôle de x et y dans l’application du théorème des fonctions implicites à g. On obtient donc la conclusion sous la seule hypothèse que rang ga$ = 1. On peut généraliser ce résultat à une fonction f de Rn dans R et à une fonction g de Rn dans Rq . Dans ce cas, il est plus simple d’utiliser, au lieu du théorème des fonctions implicites, le théorème de l’application intérieure. Le premier résultat s’appelle la règle des multiplicateurs de Carathéodory. Proposition. Soit f une fonction de Rn dans R, g une fonction de Rn dans Rq , a ∈ Rn et r > 0 tels que f et g soient définies sur B2 (a; r) et g(a) = 0. Supposons que f et g soient dérivables en x pour chaque x ∈ B2 (a; r) et que, pour chaque 1 ≤ j ≤ n, les fonctions x 2→ Dj f (x) et x 2→ Dj g(x) soient continues en a. Si a est un extrémant local de f sur l’ensemble E = {x ∈ Rn : g(x) = 0}, 192 CHAPITRE 5. FONCTIONS IMPLICITES alors il existe γ = (γ0 , γ1, . . . , γq ) ∈ Rq+1 \ {0} tel que γ0 ≥ 0 et tel que γ0 fa$ + q $ γj (gj )$a = 0, j=1 c’est-à-dire tel que (a, γ1, . . . , γq) soit un point critique de la fonction Cf,g de Rn × Rq définie par Cf,g (x, γ1, . . . , γq ) = γ0 f (x) + q $ γj gj (x). j=1 Démonstration. Supposons, pour fixer les idées, que a soit un minimant local de f sur E, et soit r $ ∈ ]0, r[ tel que f (a) ≤ f (x) (5.14) pour tout x ∈ B2 [a; r $] ∩ E. Soit h la fonction de Rn dans Rq+1 définie par h = (f, g1 , . . . , gq), et soit W = {(y0 , 0, . . ., 0) ∈ Rq+1 : y0 < f (a)}. Notons que h(a) = (f (a), 0, . . ., 0). En vertu de (5.14), on a h(B2 [a; r $ ]) ∩ W = ∅. (5.15) h(a) /∈ int h(B2 [a; r $]), (5.16) En conséquence, car, dans le cas contraire, il existerait r0 > 0 tel que B2 [h(a); r0] ⊂ h(B2 [a; r $]) et l’on aurait donc, pour k ≥ r10 , (f (a) − k1 , 0, . . ., 0) ∈ h(B2 [a; r $]) ∩ W, ce qui est impossible par (5.15). Il résulte alors de (5.16) et de la remarque qui suit le théorème de l’application ouverte que rang h$a < q + 1, c’est-à-dire qu’il existe γ = (γ0 , γ1, . . . , γq ) ∈ Rq+1 \ {0} tel que γ0 fa$ + q $ γj (gj )$a = 0, j=1 et l’on peut, sans perte de généralité, supposer que γ0 ≥ 0 dans cette égalité en multipliant, le cas échéant, les deux membres par −1. 193 5.9. EXTRÉMANTS LIÉS Remarque. Les nombres (γ0, γ1 , . . . , γq) s’appellent les multiplicateurs de Carathéodory et Cf,g la fonction de Carathéodory associés à f et g. Un cas particulier important de la proposition précédente porte le nom de règle des multiplicateurs de Lagrange. Corollaire. Dans les conditions de la proposition précédente, si l’on suppose en outre que rang ga$ = q, il existe λ = (λ1 , . . . , λq ) ∈ Rq tel que fa$ + q $ λj (gj )$a = 0, j=1 c’est-à-dire un λ tel que (a, λ) soit un point critique de la fonction Lf,g de Rn × Rq dans R définie par Lf,g (x, λ) = f (x) + q $ λj gj (x) = f (x) + (λ|g(x)). j=1 Démonstration. Soit γ = (γ0 , γ1 , . . . , γq) ∈ Rq+1 \ {0} donné par la règle de Caratheodory. Si γ0 = 0, alors (γ1 , . . . , γq) /= 0 et q $ γj (gj )$a = 0, j=1 ce qui contredit l’hypothèse rang ga$ = q. Donc, γ0 /= 0 et la thèse s’en déduit γ en posant λj = γj0 , (1 ≤ j ≤ q). Remarque. Les nombres (λ1 , . . . , λq ) fournis par la proposition précédente s’appellent les multiplicateurs de Lagrange et Lf,g la fonction de Lagrange associés à f et g. Exemple. Cherchons à déterminer les extrémants locaux de la fonction f de R2 dans R définie par f (x) = |x|2 sur l’ensemble E = {(x1 , x2 ) ∈ R2 : g(x1, x2 ) = 0}, lorsque, a > 0 et b > 0 étant donnés, g(x1 , x2) = 4 x1 a 52 + 4 x2 b 52 − 1, 194 CHAPITRE 5. FONCTIONS IMPLICITES c’est-à-dire les extrémants locaux de la distance entre l’origine et les points de l’ellipse E. On a D1 g(x1 , x2 ) = 2 x1 x2 , D2 g(x1 , x2 ) = 2 2 , 2 a b et dès lors rang gx$ = 1 pour tout x ∈ E puisque (0, 0) /∈ E. La fonction de Lagrange est la fonction L = Lf,g définie par L(x, λ) = |x|2 + λ ,4 x1 a 52 + 4 x2 b 52 - −1 , et ses points critiques sont les solutions du système d’équations D1 L(x, λ) = x1 x1 + 2λ 2 = 0, |x|2 a D2 L(x, λ) = x2 x2 + 2λ 2 = 0, |x|2 b D3 L(x, λ) = 4 x1 a 52 + 4 x2 b 52 − 1 = 0. La résolution de ce système fournit les solutions 4 0, b, − 5 4 5 4 5 4 5 b b a a , 0, −b, − , a, 0, − , −a, 0, − , 2 2 2 2 dont les deux premières composantes correspondent aux sommets de l’ellipse E. 5.10 Exercices 1. Montrer que la suite (ak )k∈N dans Rp converge vers a si et seulement toute sous-suite de (ak )k∈N contient une sous-suite convergeant vers a. 2. Montrer que si la suite (ak )k∈N dans Rp converge vers a, alors a est le seul point d’accumulation de (ak )k∈N . 3. Utiliser le théorème de Bolzano-Weierstrass pour démontrer le théorème de Cantor : Si (Bk )k∈N est une suite de fermés bornés emboı̂tés (Bk+1 ⊂ Bk 7 pour tout k ∈ N), alors k∈N Bk est un fermé borné non vide. 4. Utiliser le théorème de Bolzano-Weierstrass pour démontrer le théorème de Heine (suggestion : procéder par l’absurde). 195 5.10. EXERCICES 5. Soit A : Rn → Rn une application linéaire inversible. Montrer que, pour toute application linéaire B : Rn → Rn telle que |B|2,2 < 1 , |A−1 |2,2 l’application linéaire A + B est inversible. Suggestion : il suffit de montrer que, pour tout x ∈ Rn , l’équation (A+B)y = x possède une solution unique. Cette équation est équivalente au problème de point fixe y = −A−1 By + A−1 x ≡ gx(y), et l’on a, pour tout y ∈ Rn et tout z ∈ Rn , |gx (y) − gx(z)|2 ≤ |A−1 |2,2 |B(y − z)|2 ≤ |A−1 |2,2 |B|2,2 |y − z|2 , ce qui montre que gx est contractante sur Rn . 6. Soit f une contraction de Rn dans Rp , de constante de contraction α. On définit g : Rn → R par g(x) = |x − f (x)|2 . Montrer que, pour tout x ∈ Rn , on a g(x) ≥ (1 − α)|x|2 − |f (0)|2. En conséquence, il existe y ∈ Rn tel que g(y) ≤ g(x) pour tout x ∈ Rn . En particulier, g(y) ≤ g(f (y)) = |f (y) − f (f (y))|2 ≤ α|y − f (y)|2 = αg(y), ce qui entraı̂ne que g(y) = 0 et donc que y est un point fixe de f . Montrer que cette nouvelle démonstration du théorème du point fixe de Banach fournit l’existence d’un point fixe unique de f sous les hypothèses plus générales : a. |x − f (x)|2 → +∞ si x → ∞. b. |f (x) − f (y)|2 < |x − y|2 pour tout x /= y dans Rn . 7. Soit F : R × Rn+1 → R, (x, a0, a1 , . . . , an ) 2→ Une racine simple de l’équation (en l’inconnue x) F (x, a) = 0 n $ k=0 ak xk . 196 CHAPITRE 5. FONCTIONS IMPLICITES est un x ∈ R vérifiant cette équation et tel que F1$ (x, a) /= 0. Utiliser le théorème des fonctions implicites pour montrer que si x∗ est une racine simple de l’équation F (x, a∗ ) = 0, alors il existe r > 0 et R > 0 et une application continue f : [−r, r] × B2 [−R, R] unique tels que, pour chaque a ∈ B2 [−R, R], l’équation F (x, a) possède dans [−r, r] la solution unique f (a). (Dépendance continue des solutions d’une équation algébrique par rapport aux coefficients au voisinage d’une racine simple). Généraliser le résultat aux équations complexes en utilisant la notion de C-dérivabilité. 8. Montrer que l’application g : R2 → R2 , (y1 , y2 ) 2→ (exp y1 cos y2 , exp y1 sin y2 ), vérifie en chaque point (y1 , y2 ) ∈ R2 les conditions du théorème de la fonction réciproque, mais n’est pas une bijection de R2 sur R2 (noter que g(y1 , y2 + 2kπ) = g(y1 , y2 )) (Caractère local du théorème de la fonction réciproque). 9. Soit a : Rn → R l’application définie par a(x) = n $ n $ ajk xj xk , j=1 k=1 où les ajk sont des nombres réels tels que ajk = akj , (1 ≤ j, k ≤ n). On dit que a est la forme quadratique associée à la matrice symétrique A d’éléments ajk . En fait, on a, pour tout x ∈ Rn , a(x) = (Ax|x). Comme a est continue sur Rn , elle admet, par le théorème de Weierstrass, un minimant y et un maximant z sur le fermé borné S = {x ∈ Rn : |x|22 = 1}. Utiliser la règle des multiplicateurs de Lagrange pour montrer que si l’on pose λ1 = a(y), λn = a(z), alors λ1 et λn sont respectivement la plus petite et la plus grande valeur propre de A. 197 5.11. PETITE ANTHOLOGIE 5.11 Petite anthologie Si l’on a à l’intérieur d’une partie bornée du plan une infinité de points possédant une certaine propriété, alors il existe dans son intérieur ou sur sa frontière au moins un point tel que dans tout voisinage de ce point il y a une infinité de points ayant cette propriété. Karl Weierstrass, 1866 Si dans une suite de grandeurs F1 (x), F2(x), F3 (x), . . ., Fn (x), . . ., Fn+r (x), la différence entre son ne terme Fn (x) et tout terme ultérieur Fn+r (x), aussi éloigné soit-il du ne , reste plus petite que toute grandeur donnée, si l’on a pris n suffisamment grand, alors il existe toujours une certaine grandeur constante, et une seule, dont s’approchent toujours davantage les termes de cette suite et dont ils peuvent s’approcher d’aussi près que l’on voudra, lorsqu’on prolonge la suite suffisamment loin. Bernard Bolzano, 1817 Soit un système de n équations entre m + n variables f1 (x1 , . . . , xm, y1 , . . ., yn ) = 0, . . ., fn (x1 , . . . , xm , y1 , . . . , yn ) = 0, qui sont satisfaites pour la valeur a1 , . . ., am , b1, . . . , bn, des variables; supposons que les fonctions f1 , . . . , fn et leurs dérivées partielles du premier ordre soient continues dans un voisinage du point (a1 , . . ., am , b1, . . . , bn); finalement supposons que le déterminant : # # ∂f1 # ∂y1 # ∂f2 # J = ## ∂y1 # ... # ∂fn # ∂y 1 ∂f1 ∂y2 ∂f2 ∂y2 ... ∂fn ∂y2 ... ... ... ... # # # # # # . . . ## ∂fn ## ∂y ∂f1 ∂yn ∂f2 ∂yn n 198 CHAPITRE 5. FONCTIONS IMPLICITES ne soit pas nul en ce point. Alors il existe un et un seul système de fonctions y des variables x: y1 = ψ1 (x1 , . . . , xm ), . . ., yn = ψn (x1 , . . . , xn ), définies sur un voisinage du point a1 , . . . , am et qui vérifient identiquement les équations f1 = 0, . . ., fn = 0 pour les valeurs correspondantes de la variable x; y1 , . . . , yn sont des fonctions continues, qui prennent au point a1 , . . . , am les valeurs b1 , . . . , bn et qui possèdent des dérivées partielles premières. Giuseppe Peano, 1884 On connaı̂t les beaux résultats obtenus par M. E. Picard dans l’étude des équations différentielles et des équations aux dérivées partielles, grâce à sa méthode des approximations successives. Cette méthode s’applique également avec une grande facilité à la théorie des fonctions implicites. ... Soit f (x, y) une fonction de deux variables indépendantes réelles x et y, continue dans le voisinage d’un système de valeurs x0 , y0 , tel que f (x0 , y0 ) = 0. Pour préciser, nous supposerons que cette fonction est continue dans un domaine D défini par les inégalités x0 − a ≤ x ≤ x0 + a, y0 − b ≤ y ≤ y0 + b, a et b étant deux nombres positifs. Nous admettrons de plus que l’on peut choisir les nombres a et b assez petits pour que l’on ait |f (x, y $) − f (x, y $$)| < K|y $ − y $$ |, x étant une valeur quelconque comprise entre x0 − a et x0 + a, y $ , y $$ étant de même deux valeurs quelconques de y comprises entre y0 − b et y0 + b, et K un nombre positif constant plus petit que l’unité. Ces conditions étant supposées satisfaites, nous allons démontrer que l’équation y − y0 = f (x, y), où l’on regarde x comme une variable indépendante et y comme l’inconnue admet une racine, et une seule, qui tend vers y0 lorsque x tend vers x0 . Edouard Goursat, 1903 Chapitre 6 Fonctions monotones 6.1 Parties majorées ou minorées Ce chapitre est consacré à l’étude de propriétés particulières de parties de R et de fonctions réelles liées à l’existence d’une structure d’ordre sur R. Définition. Soit E une partie de R et a ∈ R. On dit que a majore E, ou que a est un majorant de E, ou encore que E est majoré par a si, pour tout x ∈ E, on a x ≤ a. On dit que a minore E, ou que a est un minorant de E, ou encore que E est minoré par a si, pour tout x ∈ E, on a x ≥ a. Ainsi, n’importe quel réel majore ∅ et n’importe quel réel minore ∅. Il résulte immédiatement des définitions que si a majore E et si b ≥ a, alors b majore E et que si a minore E et si b ≤ a, alors b minore E. On désignera par M (E) l’ensemble des majorants de E et par m(E) l’ensemble des minorants de E. Chacun de ces ensembles peut être vide : on vérifie aisément que M ([0, +∞[) = ∅ et m(] − ∞, 0]) = ∅. Lorsque M (E) /= ∅, on dit que E est majoré, et lorsque m(E) /= ∅, on dit que E est minoré. Ces notions sont liées à celle d’ensemble borné par le résultat élémentaire suivant. Proposition. E ⊂ R est borné si et seulement si E est majoré et minoré. Démonstration. Condition nécessaire. Si r > 0 est tel que E ⊂ B[r] = [−r, r], alors r majore E et −r minore E. Condition suffisante. Si a minore E et b majore E, alors, pour tout x ∈ E, on a |x| ≤ r = max{|a|, |b|}, et E est borné. Il peut arriver qu’aucun majorant ou aucun minorant d’une partie E de R n’appartienne à E. C’est le cas par exemple pour E = ]0, 1[. En effet, 199 200 CHAPITRE 6. FONCTIONS MONOTONES si a ∈ ]0, 1[, c’est-à-dire si 0 < a < 1, alors a ne majore pas ]0, 1[ puisque a + 1−a 2 > a et appartient à ]0, 1[. On montre de même qu’aucun minorant de ]0, 1[ n’appartient à ]0, 1[. Il peut aussi arriver qu’un majorant ou un minorant d’une partie E de R appartienne à E. C’est le cas par exemple pour E = [0, 1] qui est majoré par 1 et minoré par 0. E ne contiendra pas d’autre majorant ou d’autre minorant, ainsi que cela résulte de la proposition suivante. Proposition. Soit E une partie de R. Il existe au plus un majorant de E appartenant à E et au plus un minorant de E appartenant à E. Démonstration. Faisons-la, pour fixer les idées, dans le cas d’un majorant. Si a et b majorent E et appartiennent à E, alors on a b ≤ a et a ≤ b, et donc a = b. Cette proposition justifie la définition suivante. Définition. Soit E une partie de R et a ∈ R. On dit que a est le maximum ou le plus grand élément de E, et on le note max E, si a ∈ E et a majore E. On dit que a est le minimum ou le plus petit élément de E, et on le note min E, si a ∈ E et a minore E. Notons que, si max E existe, alors, puisque max E ∈ E, on a max E ≤ a pour tout a ∈ M (E), et max E est donc le plus petit majorant de E. En d’autres termes, max E = min M (E). On montre de même que si min E existe, alors min E = max m(E). L’important résultat suivant, qui porte le nom de théorème du supremum montre que si E et M (E) sont non vides, M (E) possède toujours un minimum. Ainsi, bien qu’une partie non vide et majorée E de R n’ait pas nécessairement de plus grand élément, l’ensemble de ses majorants possédera toujours un plus petit élément. Théorème. Si E est une partie non vide et majorée de R, alors M (E) possède un minimum. Démonstration. Soit a ∈ E et b ∈ M (E) tel que b > a. Si M (E) possède un minimum, ce minimum appartiendra nécessairement à [a, b]. Il faut donc démontrer que (∃x ∈ [a, b] ∩ M (E))(∀y ∈ M (E)) : x ≤ y. 201 6.1. PARTIES MAJORÉES OU MINORÉES Nous procédons par l’absurde et supposons que cette proposition est fausse. Alors, (∀x ∈ [a, b] ∩ M (E))(∃yx ∈ M (E)) : x > yx . (6.1) Définissons dès lors comme suit une jauge δ sur [a, b]. Si x ∈ [a, b] ∩ M (E), x prenons δ(x) = x−y 2 , où yx est donné par (6.1); si x ∈ [a, b] \ M (E), alors il existera z ∈ E tel que zx > x et nous prendrons δ(x) = zx2−x . Soit A j j xB Π = (x , I ) 1≤j≤m une P-partition δ-fine de ]a, b], numérotée de telle sorte que si I j = ]aj−1 , aj ], alors a = a0 < a1 < . . . < am−1 < am = b. Par le choix de la jauge, si xj /∈ M (E), alors δ(xj ) = zxj > xj appartenant à E et dès lors aj ≤ xj + δ(xj ) = zxj −xj 2 pour un certain zxj + xj < zxj ∈ E, 2 ce qui entraı̂ne que [aj−1 , aj ] ∩ M (E) = ∅. D’autre part, si xj ∈ M (E), alors δ(xj ) = yxj −xj 2 pour un certain yxj < xj appartenant à M (E) et dès lors aj−1 ≥ xj − δ(xj ) = yxj + xj > yxj ∈ M (E), 2 c’est-à-dire [aj−1 , aj ] ⊂ M (E) \ E. Comme b ∈ [am−1 , am ] ∩ M (E), on a nécessairement, xm ∈ M (E) et donc [am−1 , am ] ⊂ M (E) \ E. Mais alors xm−1 ∈ M (E) et le même raisonnement entraı̂ne que [am−2 , am−1 ] ⊂ M (E)\ E. En continuant de proche en proche, on en conclut finalement que [a0 , a1 ] ⊂ M (E) \ E, ce qui est contradictoire, puisque a0 = a ∈ E. On est ainsi conduit à la définition suivante. Définition. Soit E une partie non vide de R. Si E est non vide et majorée, on appelle supremum de E, et l’on note sup E, le minimum de M (E), c’està-dire le plus petit majorant de E. Si E est non vide et non majoré, on pose, par extension, sup E = +∞. Si E est vide, on pose, par extension, sup E = −∞. Le résultat suivant fournit trois caractérisations du supremum. 202 CHAPITRE 6. FONCTIONS MONOTONES Proposition. Soit E une partie non vide et majorée de R. Les quatre propriétés suivantes sont équivalentes. 1. x = sup E. 2. (∀y ∈ E) : y ≤ x et (∀! > 0)(∃z ∈ E) : x − ! < z. 3. x ∈ adh E ∩ M (E). 4. x ∈ M (E) et il existe une suite (zk )k∈N dans E qui converge vers x. Démonstration. a. 1 ⇔ 2. x = sup E équivaut à x ∈ M (E) et x = min M (E), c’est-à-dire (∀y ∈ E) : y ≤ x et (∀! > 0) : x − ! /∈ M (E), ce qui équivaut à (∀y ∈ E) : y ≤ x et (∀! > 0)(∃z ∈ E) : z > x − !. 2 ⇔ 3. Conséquence immédiate de la définition de l’adhérence. 3 ⇔ 4. Résulte de la caractérisation de l’adhérence par les suites. Si E et F sont deux parties de R et si c ∈ R, on posera E + F = {x + y : x ∈ E et y ∈ F }, et cE = {cx : x ∈ E}. Lorsque E = {a}, on écrira a + F au lieu de {a} + F et si c = −1, on écrira −E au lieu de (−1)E. On a évidemment E + F = F + E et l’on se gardera de confondre E + F avec E ∪ F . Ainsi [0, 1] + [0, 1] = [0, 2] alors que [0, 1] ∪ [0, 1] = [0, 1]. Les propositions suivantes sont des conséquences faciles des propriétés élémentaires des inégalités et des définitions. Proposition. Si E ⊂ R et a ∈ R, alors a majore E si et seulement si −a minore −E. En d’autres termes, M (E) = −m(−E). Proposition. Si E ⊂ R possède un maximum (resp. un minimum), alors, pour tout c ≥ 0, cE possède un maximum (resp. un minimum) et max(cE) = c max E, (resp. min(cE) = c min E). Démonstration. c max E (resp. c min E) appartient à cE et majore (resp. minore) cE. 6.1. PARTIES MAJORÉES OU MINORÉES 203 Proposition. Si E ⊂ R possède un maximum (resp. un minimum), alors −E possède un minimum (resp. un maximum) et min(−E) = − max E, (resp. max(−E) = − min E. Démonstration. − max E (resp. − min E) appartient à −E et minore (resp. majore) −E. Ces résultats permettent de déduire aisément du théorème du supremum le théorème de l’infimum. Théorème. Si E est une partie non vide et minorée de R, alors m(E) possède un maximum et max m(E) = − sup(−E). Démonstration. E étant non vide et minoré, −E est non vide et majoré, et dès lors min M (−E) existe. Comme M (−E) = −m(E), on en déduit que m(E) possède un maximum et que max m(E) = − min[−m(E)] = − min[M (−E)] = − sup(−E). Ce résultat et l’unicité du maximum conduisent à la définition suivante. Définition. Soit E une partie non vide de R. Si E est non vide et minorée, on appelle infimum de E, et l’on note inf E, le maximum de m(E), c’està-dire le plus grand minorant de E. Si E est non vide et non minoré, on pose, par extension, inf E = −∞. Si E est vide, on pose, par extension, inf E = +∞. Le théorème de l’infimum affirme donc que si E est une partie non vide et minorée de R, alors inf E = − sup(−E). On en déduit aussitôt que si E est une partie non vide et majorée de R, alors sup E = − inf(−E). En combinant le théorème de l’infimum avec les caractérisations du supremum, on obtient trois caractérisations de l’infimum. Proposition. Soit E une partie non vide et minorée de R. Les quatre propriétés suivantes sont équivalentes. 1. x = inf E. 2. (∀y ∈ E) : y ≥ x et (∀! > 0)(∃z ∈ E) : z < x + !. 204 CHAPITRE 6. FONCTIONS MONOTONES 3. x ∈ adh E ∩ m(E). 4. x ∈ m(E) et il existe une suite (zk )k∈N dans E qui converge vers x. Une conséquence immédiate mais très utile des définitions de supremum et d’infimum est la règle de passage au supremum ou à l’infimum dans une inégalité. Proposition. Soit E une partie non vide de R et c ∈ R. Si, pour tout x ∈ E, on a x ≤ c, alors sup E existe et sup E ≤ c. Si, pour tout x ∈ E, on a x ≥ c, alors inf E existe et inf E ≥ c. Démonstration. Faisons-la, pour fixer les idées, dans le cas du supremum. Par hypothèse, c majore E et dès lors sup E existe. Comme il est le plus petit des majorants de E, on a nécessairement sup E ≤ c. Etudions maintenant le comportement du supremum et de l’infimum par rapport aux opérations d’inclusion, d’homothétie et d’addition introduites sur les ensembles. Proposition. Soient E et F deux parties non vides et majorées de R et soit c ≥ 0. On a les propriétés suivantes. 1. Si E ⊂ F , alors sup E ≤ sup F . 2. sup(cE) = c sup E. 3. sup(E + F ) = sup E + sup F. Démonstration. 1. Si x ∈ E, alors x ∈ F et donc x ≤ sup F ; on déduit de la proposition précédente que sup E existe et que sup E ≤ sup F. 2. Si c = 0, cE = {0} et le résultat est évident; si c > 0, alors M (cE) = cM (E) et sup(cE) = min M (cE) = min[cM (E)] = c min M (E) = c sup E. 3. Soit x ∈ E + F ; alors x = y + z avec y ∈ E et z ∈ F et dès lors x ≤ sup E + sup F ; en conséquence, sup(E + F ) ≤ sup E + sup F. Soient maintenant x ∈ E et y ∈ F ; alors x + y ∈ E + F , et dès lors y + z ≤ sup(E + F ). En particulier, z étant fixé dans F , on a, pour chaque y ∈ E, y ≤ sup(E + F ) − z, et dès lors sup E ≤ sup(E + F ) − z. Par conséquent, pour chaque z ∈ F , on a z ≤ sup(E + F ) − sup E, ce qui entraı̂ne que sup F ≤ sup(E + F ) − sup E, c’est-à-dire sup E + sup F ≤ sup(E + F ). 205 6.2. INTERVALLES Proposition. Soient E et F deux parties non vides et minorées de R et soit c ≥ 0. On a les propriétés suivantes. 1. Si E ⊂ F , alors inf E ≥ inf F . 2. inf(cE) = c inf E. 3. inf(E + F ) = inf E + inf F. Démonstration. Elle est analogue à celle de la proposition précédente. On peut aussi utiliser les relations entre infimum et supremum. 6.2 Intervalles Les résultats des sections précédentes nous permettent de déterminer la structure des intervalles de la droite réelle. Définition. On dit qu’une partie non vide I de R est un intervalle si I n’est pas un singleton et si (∀x ∈ I)(∀y ∈ I : y > x)(∀z ∈ R : x ≤ z ≤ y) : z ∈ I. En d’autres termes, un intervalle est une partie de R différente du vide et d’un singleton qui, dès qu’elle contient deux réels distincts, contient tous les réels compris entre ces deux nombres. Proposition. Si I ⊂ R est un intervalle et est minoré et majoré, alors ] inf I, sup I[ ⊂ I ⊂ [inf I, sup I]. Démonstration. Pour chaque x ∈ I, on a évidemment x ≥ inf I et x ≤ sup I, et l’inclusion de droite s’en déduit aussitôt. Soit maintenant x ∈ ] inf I, sup I[. Comme x > inf I, il existe, par la caractérisation de l’infimum, y ∈ I tel que inf I < y < x, et, comme x < sup I, il existe, par la caractérisation du supremum, z ∈ I tel que x < z < sup I. Comme I est un invervalle, on en déduit que x ∈ I. Corollaire. Si I ⊂ R est un intervalle et est minoré et majoré, alors int I = ] inf I, sup I[ et adh I = [inf I, sup I]. Démonstration. Passer à l’intérieur et à l’adhérence dans les inclusions précédentes. Les intervalles minorés et majorés sont donc les intervalles ouverts, semiouverts ou fermés I = ]a, b[, I = ]a, b], I = [a, b[, I = [a, b] de R, et a = inf I, b = sup I. 206 CHAPITRE 6. FONCTIONS MONOTONES Proposition. Si I ⊂ R est un intervalle majoré et non minoré, alors ] − ∞, sup I[ ⊂ I ⊂ ] − ∞, sup I]. Démonstration. Pour tout x ∈ I, on a x ≤ sup I, et l’inclusion de droite s’en déduit. Si x ∈ ] − ∞, sup I[, alors x < sup I et, par la caractérisation du supremum, il existe z ∈ I tel que x < z < sup I. D’autre part, comme I n’est pas minoré, x ne minore pas I et il existe donc y ∈ I tel que y < x. Comme I est un intervalle, x ∈ I et l’inclusion de gauche est démontrée. Une démonstration tout à fait analogue fournit le résultat suivant. Proposition. Si I ⊂ R est un intervalle minoré et non majoré, alors ] inf I, +∞[ ⊂ I ⊂ [inf I, +∞[. On en déduit évidemment l’analogue du Corollaire ci-dessus. Corollaire. Si I ⊂ R est un intervalle majoré et non minoré, alors int I = ] − ∞, sup I[, adh I = ] − ∞, sup I]. Si I ⊂ R est un intervalle minoré et non majoré, alors int I = ] inf I, +∞[, adh I = [inf I, +∞[. Les intervalles de I minorés et non majorés sont donc les intervalles non majorés ouverts ou fermés ]a, +∞[, [a, +∞[, avec a = inf I, et les intervalles de I majorés et non minorés sont donc les intervalles non minorés ouverts ou fermés ] − ∞, a[, ] − ∞, a] avec a = sup I. Enfin, il n’existe qu’un intervalle de R non minoré et non majoré. Proposition. Si I est un intervalle non minoré et non majoré de R, alors I = R. Démonstration. Soit x ∈ R; comme I n’est pas minoré, il existe y ∈ I tel que y < x, et comme I n’est pas majoré, il existe z ∈ I tel que x < z. I étant un intervalle, on en déduit que x ∈ I. Cette proposition conduit à la notation alternative ] − ∞, +∞[ pour R. La définition de majorant d’une partie E de R entraı̂ne immédiatement que, si E est non vide et majoré, alors M (E) est un intervalle non majoré de R. Le théorème du supremum précise ce résultat en affirmant que M (E) est l’intervalle fermé [sup E, +∞[. De même, la définition de minorant d’une partie E de R entraı̂ne que, si E est non vide et minorée, alors m(E) est un intervalle non minoré de R. Le théorème de l’infimum précise ce résultat en affirmant que m(E) est l’intervalle fermé ] − ∞, inf E]. 207 6.3. APPLICATIONS RÉELLES 6.3 Applications réelles Soit A un ensemble quelconque (n’appartenant pas nécessairement à Rn ) et f une application de A dans R. On dit alors que f est une application réelle. Rappelons qu’on désigne par f (A) la partie de R définie par f (A) = {f (x) : x ∈ A}. L’application à f (A) des notions que nous venons d’introduire pour les parties de R conduit à la terminologie suivante. Définition. On dit que f est majorée (resp. minorée) sur A si f (A) est majorée (resp. minorée). Si f est majorée (resp. minorée) sur A, le supremum (resp. l’infimum) de f sur A est le nombre réel noté sup f ou sup f (x) (resp. inf f ou inf f (x)), A A x∈A x∈A et défini par sup f = sup f (A) = sup{f (x) : x ∈ A} A (resp. inf f = inf f (A) = inf{f (x) : x ∈ A}). A Si f n’est pas majorée sur A, on écrira supA f = +∞ et si f n’est pas minorée sur A, on écrire inf A f = −∞. Lorsque supA f ∈ f (A), c’est-à-dire lorsqu’il existe x ∈ A tel que f (x) = supA f , ou encore lorsque sup f (A) = max f (A), on dit qu’il est le maximum de f sur A, et l’on écrit max f ou max f (x). A x∈A Le point x ∈ A tel que f (x) = maxA f est alors appelé un maximant de f sur A. De même, lorsque inf A f ∈ f (A), c’est-à-dire lorsqu’il existe x ∈ A tel que f (x) = inf A f , ou encore lorsque inf f (A) = min f (A), on dit qu’il est le minimum de f sur A, et l’on écrit min f ou min f (x). A x∈A Le point x ∈ A tel que f (x) = minA f est alors appelé un minimant de f sur A. Cette terminologie et ces notations sont compatibles avec celles introduites précédemment pour une fonction de Rn dans R. Si f et g sont deux applications de A dans R, si c ∈ R, et si l’on définit l’application f +g de A dans R par (f +g)(x) = f (x)+g(x) pour chaque x ∈ A 208 CHAPITRE 6. FONCTIONS MONOTONES et l’application cf de A dans R par (cf )(x) = c[f (x)] pour chaque x ∈ A, avec la notation −f au lieu de (−1)f lorsque c = −1, on déduit aisément des définition ci-dessus et des propriétés de l’infimum et du supremum d’une partie de R les résultats suivants. Proposition. Soit f une application majorée (resp. minorée) de A dans R. On a les propriétés suivantes. 1. −f est minorée (resp. majorée) sur A et supA f = − inf A (−f ). (resp. supA (−f ) = − inf A f ). 2. Si B ⊂ A, alors supB f ≤ supA f (resp. inf B f ≥ inf A f ). 3. Si g est une application de A dans R telle que, pour tout x ∈ A, on a g(x) ≤ f (x) (resp. g(x) ≥ f (x)), alors g est majorée (resp. minorée) sur A et sup g ≤ sup f (resp. inf g ≥ inf f ). A A A A 4. Si g est une application majorée (resp. minorée) sur A, alors f + g est majorée (resp. minorée) et sup(f + g) ≤ sup f + sup g (resp. inf f + inf g ≤ inf (f + g)). A A A A Si, en outre, g est minorée (resp. majorée) sur A, alors sup f + inf f ≤ sup(f + g) (resp. inf (f + g) ≤ inf f + sup g). A A A A A A Remarque. On notera que les inégalités dans la partie 4 de la proposition précédente sont les meilleures possibles et qu’on n’a pas en général les égalités correspondantes (c’est essentiellement dû au fait que (f + g)(A) = {f (x) + g(x) : x ∈ A} est en général strictement inclus dans f (A) + g(A) = {f (x) + g(y) : x ∈ A et y ∈ A}). Par exemple, si A = [0, 1], f = I, g = −I, alors f + g = 0 et dès lors inf (f + g) = 0 = sup(f + g), [0,1] [0,1] et sup f = 1, inf f = 0, inf g = −1, sup g = 0. [0,1] [0,1] [0,1] [0,1] On déduit facilement des caractérisations du supremum et de l’infimum d’une partie de R des caractérisations du supremum et de l’infimum d’une application réelle. 6.4. FONCTIONS MONOTONES 209 Proposition. Soit A un ensemble non vide et f une application de A dans R. Alors a = supA f si et seulement si l’une des deux conditions suivantes est réalisée. 1. (∀x ∈ A : f (x) ≤ a) et (∀! > 0)(∃y ∈ A) : f (y) > a − !. 2. (∀x ∈ A : f (x) ≤ a) et il existe une suite (yk )k∈N dans A telle que (f (yk ))k∈N converge vers a. Une suite (yk )k∈N telle que (f (yk ))k∈N converge vers supA f est appelée une suite maximisante pour f sur A. Proposition. Soit A un ensemble non vide et f une application de A dans R. Alors a = inf A f si et seulement si l’une des deux conditions suivantes est réalisée. 1. (∀x ∈ A : f (x) ≥ a) et (∀! > 0)(∃y ∈ A) : f (y) < a + !. 2. (∀x ∈ A : f (x) ≥ a) et il existe une suite (yk )k∈N dans A telle que (f (yk ))k∈N converge vers a. Une suite (yk )k∈N telle que (f (yk ))k∈N converge vers inf A f est appelée une suite minimisante pour f sur A. 6.4 Fonctions monotones Nous allons étudier dans cette section les fonctions de R dans R qui préservent (ou qui renversent) l’ordre sur R. Définition. Soit f une fonction de R dans R et E ⊂ dom f . On dit que f est croissante sur E si (∀x ∈ E)(∀y ∈ E) : (x − y)[f (x) − f (y)] ≥ 0. On dit que f est décroissante sur E si (∀x ∈ E)(∀y ∈ E) : (x − y)[f (x) − f (y)] ≤ 0. On dit que f est monotone sur E si f est croissante sur E ou est décroissante sur E. On dit que f est strictement croissante sur E si (∀x ∈ E)(∀y ∈ E : y /= x) : (x − y)[f (x) − f (y)] > 0. On dit que f est strictement décroissante sur E si (∀x ∈ E)(∀y ∈ E : y /= x) : (x − y)[f (x) − f (y)] < 0. 210 CHAPITRE 6. FONCTIONS MONOTONES On dit que f est strictement monotone sur E si f est strictement croissante sur E ou est strictement décroissante sur E. Remarques. 1. On vérifiera aisément que les définitions ci-dessus sont équivalentes aux suivantes : f est croissante (resp. décroissante) sur E si et seulement si (∀x ∈ E)(∀y ∈ E : y ≥ x) : f (y) ≥ f (x) (resp. f (y) ≤ f (x)). f est strictement croissante (resp. strictement décroissante) sur E si et seulement si (∀x ∈ E)(∀y ∈ E : y > x) : f (y) > f (x) (resp. f (y) < f (x)). Une fonction croissante (resp. strictement croissante) sur E préserve donc l’ordre (resp. l’ordre strict) sur E. 2. Il résulte aussitôt des définitions que f est croissante (resp. strictement croissante) sur E si et seulement si −f est décroissante (resp. strictement décroissante) sur E. En outre, si f est croissante (resp. décroissante, strictement croissante, strictement décroissante) sur E et si F ⊂ E, alors f est croissante (resp. décroissante, strictement croissante, strictement décroissante) sur F . Exemples. 1. Toute application constante de R dans R est à la fois croissante et décroissante sur R. 2. L’identité sur R est strictement croissante sur R. 3. L’application partie entière définie sur R par E(x) = [x] = le plus grand entier inférieur ou égal à x est croissante sur R. Ce dernier exemple, qui est discontinu en chaque entier, montre qu’une fonction croissante n’est pas nécessairement continue. Toutefois, elle possède en chaque point une limite à gauche et une limite à droite dans E. Proposition. Soit E ⊂ R, f une fonction de R dans R telle que E ⊂ dom f , a ∈ E ∩ adh Ea− ∩ adh Ea+ , où Ea− = {x ∈ E : x < a}, Ea+ = {x ∈ E : x > a}. Si f est croissante sur E, alors lim x→a, x∈Ea− f (x) = sup f ≤ f (a) ≤ Ea− lim x→a, x∈Ea+ f (x) = inf f. Ea+ 211 6.4. FONCTIONS MONOTONES Si f est décroissante sur E, alors lim x→a, x∈Ea− f (x) = inf f ≥ f (a) ≥ Ea− lim x→a, x∈Ea+ f (x) = sup f. Ea+ Démonstration. Il suffit de démontrer le résultat pour une fonction croissante et de l’appliquer à −f si f est décroissante. Nous ne considérerons que le cas de la limite limx→a, x∈Ea− f (x), l’autre étant similaire. Puisque f est croissante sur E, on a, pour tout x ∈ Ea− , f (x) ≤ f (a); donc f est majorée sur Ea− , supEa− f existe et supEa− f ≤ f (a). Posons b = supEa− f et soit ! > 0; en vertu de la caractérisation du supremum, on a (∀x ∈ Ea− : f (x) ≤ b) et (∃y ∈ Ea− ) : b − ! < f (y). En posant δ = a − y > 0 et en utilisant, dans ces inégalités, la croissance de f , on trouve que (∀x ∈ Ea− : x ≥ a − δ) : b − ! < f (a − δ) ≤ f (x) ≤ b, et dès lors (∀x ∈ Ea− : |x − a| ≤ δ) : |f (x) − b| ≤ !. On a des résultats analogues si x tend vers le supremum ou l’infimum de E. Lorsque, le cas échéant, f n’est pas majorée ou n’est pas minorée sur E, les limites correspondantes sont évidemment des limites infinies. Proposition. Soit E une partie non vide de R et f une fonction de R dans R définie sur E. 1. Si E est majoré, a = sup E /∈ E et f croissante sur E, alors lim x→a, x∈E f (x) = sup f. E 2. Si E est majoré, a = sup E /∈ E et f décroissante sur E, alors lim x→a, x∈E f (x) = inf f. E 3. Si E est minoré, a = inf E /∈ E et f croissante sur E, alors lim x→a, x∈E f (x) = inf f. E 212 CHAPITRE 6. FONCTIONS MONOTONES 4. Si E est minoré, a = inf E /∈ E et f est décroissante sur E, alors lim x→a, x∈E f (x) = sup f. E Démonstration. Nous la ferons pour le premier cas, le troisième étant semblable et les deux autres s’en déduisant en appliquant les résultats à −f. Nous supposerons également que f est majorée sur E, l’autre cas étant semblable. Notons tout d’abord que a = sup E entraı̂ne que a ∈ adh E. Comme f est majorée sur E, supE f existe et l’on posera b = supE f . Si ! > 0 est donné, alors la caractérisation du supremum entraı̂ne que (∀x ∈ E : f (x) ≤ b) et (∃y ∈ E) : b − ! < f (y). Comme a /∈ E, on a y < a et, en posant δ = a − y > 0, on déduit des inégalités précédentes et de la croissance de f que et dès lors (∀x ∈ E : x ≥ a − δ) : b − ! < f (a − δ) ≤ f (x) ≤ b, (∀x ∈ E : |x − a| ≤ δ) : |f (x) − b| ≤ !. On a des résultats analogues pour les limites vers +∞ ou −∞ lorsque E est non majoré ou non minoré. Les démonstrations sont laissées comme exercice au lecteur. Proposition. Soit E une partie non vide de R et f une fonction de R dans R définie sur E. 1. Si E est non majoré et f croissante sur E, alors lim x→+∞, x∈E f (x) = sup f. E 2. Si E est non majoré et f décroissante sur E, alors lim x→+∞, x∈E f (x) = inf f. E 3. Si E est non minoré et f croissante sur E, alors lim x→−∞, x∈E f (x) = inf f. E 4. Si E est non minoré et f est décroissante sur E, alors lim x→−∞, x∈E f (x) = sup f. E On peut évidemment considérer le cas particulier où f est une suite réelle (ak )k∈N. Notons tout d’abord la caractérisation simple suivante des suites croissantes ou décroissantes. 213 6.4. FONCTIONS MONOTONES Proposition. Soit (ak )k∈N une suite réelle. Alors (ak )k∈N est croissante (resp. décroissante) si et seulement si, pour tout k ∈ N, on a ak+1 ≥ ak (resp. ak+1 ≤ ak ). En outre, (ak )k∈N est strictement croissante (resp. strictement décroissante) si et seulement si, pour tout k ∈ N, on a ak+1 > ak (resp. ak+1 < ak ). Démonstration. Nous la ferons dans le cas où (ak )k∈N est croissante, l’autre s’y ramenant par changement de signe. Condition nécessaire. Soit k ∈ N; en prenant x = k + 1 et y = k dans la définition, on trouve ak+1 − ak ≥ 0 dans le cas croissant et ak+1 − ak > 0 dans le cas strictement croissant. Condition suffisante. Soient r ≥ q des entiers naturels; alors ar − aq = ar − ar−1 + ar−1 − ar−2 + . . . + aq+1 − aq ≥ 0, l’inégalité étant stricte si ak+1 > ak pour chaque k ∈ N. Donc (ak )k∈N est croissante ou strictement croissante selon le cas. 1 Exemples. 1. La suite ( k+1 )k∈N est strictement décroissante. k 2. Si a > 0, la suite (a )k∈N est strictement croissante si a > 1, strictement décroissante si a ∈ ]0, 1[ et à la fois croissante et décroissante si a = 0 et a = 1. L’application des propositions précédentes au cas d’une suite fournit le résultat suivant, où les limites peuvent être des limites infinies. Corollaire. Soit (ak )k∈N une suite réelle. Si (ak )k∈N est croissante, alors lim ak = sup ak . k→∞ k∈N Si (ak )k∈N est décroissante, alors lim ak = inf ak . k→∞ k∈N On en déduit une caractérisation de la convergence des suites monotones. 214 CHAPITRE 6. FONCTIONS MONOTONES Corollaire. Une suite réelle croissante converge si et seulement si elle est majorée, auquel cas lim ak = sup ak . k→∞ k∈N Une suite réelle décroissante converge si et seulement si elle est minorée, auquel cas lim ak = inf ak . k→∞ k∈N Démonstration. La condition suffisante résulte du Corollaire précédent. Pour la condition nécessaire, en considérant le cas d’une suite croissante convergente et en appelant a sa limite, on a, en prenant par exemple ! = 1 dans la définition de convergence : (∃m ∈ N)(∀k ≥ m) : ak ≤ a + 1. Dès lors, pour tout k ∈ N, on aura ak ≤ max{a1 , a2 , . . . , am−1 , a + 1}, et (ak )k∈N est majorée. 6.5 Fonction exponentielle Nous allons introduire dans cette section l’une des plus importantes des fonctions élémentaires, la fonction exponentielle. Nous aurons besoin plusieurs fois des inégalités élémentaires suivantes. Lemme. Si α ≥ β ≥ 0, on a, pour tout entier k ≥ 1, (α − β)(k + 1)β k ≤ αk+1 − β k+1 ≤ (α − β)(k + 1)αk , avec des inégalités strictes si α > β > 0. Démonstration. En effet, on a l’identité αk+1 − β k+1 = (α − β) k $ αk−j β j , j=0 et les inégalités s’en déduisent aussitôt puisque, pour chaque 0 ≤ j ≤ k, on a β k ≤ αk−j β j ≤ αk , avec des inégalités strictes si α > 0, β > 0 et j > 0. 215 6.5. FONCTION EXPONENTIELLE Pour chaque x ∈ R et chaque k ∈ N∗ , posons 4 fk (x) = 1 + x k 5k . En particulier, fk (0) = 1 pour tout k ∈ N∗ et dès lors lim fk (0) = 1. k→∞ Proposition. Pour chaque x > 0 fixé, la suite réelle (fk (x))k∈N∗ est strictement croissante et majorée. Démonstration. En appliquant l’inégalité de droite du lemme à α = 1+ xk x et β = 1 + k+1 , on trouve 4 fk+1 (x) = 1 + 4 x k 5k+1 − (k + 1) −(k + 1) 1 + 5k 4 1+ x k+1 5k+1 4 > 1+ x k 5k+1 5 = 1+ 5k = 1+ x x −1− k k+1 4 x k 5k 4 x mk = fk (x), et (fk (x))k∈N∗ est strictement croissante. D’autre part, en appliquant la x même inégalité à α = 1 + mk , β = 1, où m ≥ 1 est un entier, on obtient 4 1> 1+ x mk 4 x x 1+ mk mk 5k 4 1− 5 x . m Dès lors, si m ≥ 2x, est fixé, (par exemple m = [2x] + 1, avec [2x] la partie entière de 2x), on trouve 1> c’est-à-dire 4 1 x 1+ 2 mk 4 5k < 2. x mk 5mk x 1+ mk Par conséquent, pour tout k ∈ N∗ , on a 4 fmk (x) = 1 + 5k , < 2m . Pour chaque j ∈ N∗ , il existe k ∈ N∗ tel que (k − 1)m ≤ j ≤ km, 216 CHAPITRE 6. FONCTIONS MONOTONES et, en utilisant la croissance de (fk (x))k∈N∗ , on en déduit que, pour tout j ∈ N∗ , on a fj (x) ≤ fkm (x) < 2m . Donc (fk (x))k∈N∗ est majorée et, en particulier, pour tout k ≥ 1 et tout x > 0, on a fk (x) ≤ 2[2x]+1 . Le critère de convergence d’une suite monotone donné dans la section précédente entraı̂ne que, pour chaque x > 0, la suite (fk (x))k∈N∗ converge et l’on posera (lire exponentielle de x) exp x = lim fk (x) = lim k→∞ k→∞ 4 1+ x k 5k . On a évidemment exp x > 1 pour tout x > 0. On posera e = exp 1. Proposition. Si x < 0, alors (fk (x))k∈N∗ converge vers 1 exp(−x) . Démonstration. Si x < 0, alors x = −|x| et, pour tout k ∈ N∗ , on a 4 x 1+ k 5k En prenant α = 1, β = 1 − k + 1 ≥ |x|, on obtient 1> & |x|2 1− (k + 1)2 4 |x| = 1− k |x|2 (k+1)2 , 'k+1 5k 8 1− = 8 1+ 9 |x|2 k k2 9 . |x| k k dans l’inégalité de droite du lemme et > 1 − (k + 1) |x|2 |x|2 =1− , 2 (k + 1) k+1 ce qui entraı̂ne aussitôt que lim k→∞ & |x|2 1− 2 k 'k = 1, et dès lors, par l’égalité ci-dessus et la proposition précédente, que lim k→∞ 4 x 1+ k 5k = 1 1 = . exp |x| exp(−x) 217 6.5. FONCTION EXPONENTIELLE Cette proposition nous conduit à poser, pour chaque x < 0, exp x = 1 . exp(−x) Définition. La fonction exponentielle est l’application de R dans R définie par 4 5 x k exp : R → R, x 2→ lim 1 + . k→∞ k Corollaire. Pour tout x > 0 et tout k ∈ N∗ , on a 4 exp x ≥ 1 + x k 5k x k 5−k pour tout x < 0 et tout k ∈ N∗ , on a 4 exp x ≤ 1 − , et, pour tout x ∈ R, on a (exp x).[exp(−x)] = exp 0 = 1. Démonstration. La première partie est une conséquence immédiate de la définition. Si x < 0, la proposition précédente montre que (exp x).[exp(−x)] = 1 .[exp(−x)] = 1 = exp 0. exp(−x) Si x > 0, alors (exp x).[exp(−x)] = [exp(−x)].[exp[−(−x)]] = exp 0, et le cas de x = 0 est trivial. Remarque. Le Corollaire montre en particulier que e = exp 1 > 2. Cette quantité joue un rôle fondamental en mathématiques. Une approximation numérique est donnée par e = 2, 71828182845904523536028747135266249775724709366995 . . .. En 1737, Leonard Euler a donné les grandes lignes de la démonstration de l’irrationnalité de e et e2 , un résultat précisé et généralisé à ec pour tout rationnel positif c par Johann Lambert en 1761. Charles Hermite a montré 218 CHAPITRE 6. FONCTIONS MONOTONES en 1873 que e est transcendant et ce résultat a conduit Ferdinand Lindemann à prouver en 1882 que π est également transcendant. Aujourd’hui encore, on ignore si e + π et e.π sont ou non transcendants. Enonçons et démontrons maintenant la propriété essentielle de la fonction exponentielle, à savoir qu’elle fournit un homomorphisme du groupe additif (R, +) sur le groupe multiplicatif (]0, +∞[, ·). Proposition. Pour tout x ∈ R et tout y ∈ R, on a exp(x + y) = (exp x).(exp y). Démonstration. Si x = 0 ou y = 0, le résultat est évident. Considérons tout d’abord le cas où x + y > 0 et xy > 0. En prenant α = 1+ 4 54 1+ 1+ y k+1 x+y xy x = 1+ + 2 k + 1 (k + 1) k+1 5 y x+y , β =1+ , k+1 k+1 dans le lemme ci-dessus, on trouve 4 xy x+y 1+ k+1 k+1 5k ≤ 4 ≤ 1+ x k+1 4 5k+1 4 xy x 1+ k+1 k+1 5k 4 1+ 5k+1 y k+1 5k 4 − 1+ x+y k+1 5k+1 . On en déduit aussitôt, en faisant tendre k vers l’infini, que 0 = [exp x].[exp y] − exp(x + y). Si x + y > 0 et xy < 0, on posera β =1+ 4 x+y x xy = 1+ + 2 k + 1 (k + 1) k+1 54 1+ 5 y x+y , α=1+ , k+1 k+1 et l’on raisonnera # # comme dans le cas précédent avec k suffisamment grand # xy # pour que # (k+1)2 # ≤ 1 + x+y k+1 . Enfin, si x + y < 0, alors, par la Proposition précédente et la première partie de la démonstration, on a exp(x + y) = 1 1 = = [exp x].[exp y]. exp(−x − y) [exp(−x)].[exp(−y)] 219 6.5. FONCTION EXPONENTIELLE Corollaire. La fonction exponentielle est strictement croissante sur R. En outre, on a lim exp x = 0, lim exp x = +∞. x→−∞ x→+∞ Démonstration. Si y > x ≥ 0, on a y − x > 0, donc exp(y − x) > 1 et dès lors, exp y = exp[x + (y − x)] = [exp x].[exp(y − x)] > exp x. Si y > 0 > x, alors, par ce qui précède, exp y > exp 0 = 1, et exp x = 1 < 1 < exp y. exp(−x) Si x < y ≤ 0, on a 0 ≤ −y < −x et dès lors exp x = 1 1 < = exp y. exp(−x) exp(−y) D’autre part, exp n’est pas majorée sur R puisque, pour tout k ∈ N∗ , on a exp k = exp(k.1) = (exp 1)k = ek > 2k . Comme exp est croissante, on en déduit que exp x → +∞ si x → +∞ et que 1 dès lors exp x = exp(−x) → 0 si x → −∞. Etudions maintenant les propriétés de dérivabilité de la fonction exponentielle. Proposition. La fonction exponentielle est dérivable en 0 et (exp)$ (0) = 1. Démonstration. Soit h > 0; en utilisant le lemme avec α = 1 + β = 1, on trouve 4 h h k ≤ 1+ k+1 k+1 et dès lors 5k+1 4 4 h −1 ≤ h 1+ k+1 5k 5 4 h ≤ h 1+ k+1 k+1 h − 1 ≤ h exp h. k+1 En faisant tendre k vers l’infini, on en déduit aussitôt que h≤ 1+ h ≤ exp h − 1 ≤ h exp h. h k+1 5k+1 , et 220 CHAPITRE 6. FONCTIONS MONOTONES En particulier, si 0 < h ≤ 1, on a h ≤ exp h − 1 ≤ eh, ce qui entraı̂ne que exp h → 1 si h → 0 par valeurs positives, et dès lors lim h→0, h>0 exp h − 1 = 1. h Si h < 0, on a 2 3 exp h − 1 1 − exp(−h) exp h[1 − exp(−h)] 1 , = = h h exp(−h) −h et dès lors exp h − 1 = 1. h→0, h<0 h lim Comme les limites du quotient différentiel pour h tendant vers zéro par valeurs positives et par valeurs négatives existent et sont égales à un, la fonction exponentielle est dérivable en 0 et sa dérivée y vaut un. Corollaire. La fonction exponentielle est dérivable (et donc continue) en chaque point x de R et (exp)$ (x) = exp x. Démonstration. Si x ∈ R et h /= 0, on a exp(x + h) − exp x exp h − 1 = exp x , h h et dès lors 2 3 exp(x + h) − exp x exp h − 1 lim = exp x. = lim exp x h→0 h→0 h h 6.6 Fonctions monotones continues On a une caractérisation des fonctions continues strictement monotones sur un intervalle. 221 6.6. FONCTIONS MONOTONES CONTINUES Proposition. Soit I ⊂ R un intervalle et f une fonction de R dans R continue sur I. Alors f est strictement monotone sur I si et seulement si f est injective sur I. Démonstration. Condition nécessaire. Elle résulte immédiatement du fait que toute fonction (continue ou non) strictement monotone sur I est injective sur I. Condition suffisante. Si f , continue et injective sur I, n’est pas strictement monotone sur I, il existera x < y < z dans I tels que f (x) < f (y) et f (y) > f (z) ou f (x) > f (y) et f (y) < f (z). Considérons, pour fixer les idées, le premier cas, l’autre se traitant de même. Si d ∈ ] max{f (x), f (z)}, f (y)[, alors, par le théorème des valeurs intermédiaires, il existera u ∈ ]x, y[ et v ∈ ]y, z[ tels que f (u) = d = f (v), ce qui contredit l’injectivité. Le résultat suivant montre qu’une fonction strictement croissante sur un intervalle a pour image un intervalle de même nature. Proposition. Soit I = ]a, b[ (resp. ]a, b], [a, b[, [a, b]), avec éventuellement a = −∞ (resp. b = +∞) si I est ouvert à gauche (resp. à droite). Si f est strictement croissante sur I, et si l’on pose f (a+) = lim x→a, x∈I f (x), f (b−) = lim x→b, x∈I f (x), on a f (I) = ]f (a+), f (b−)[ (resp. ]f (a+), f (b)], [f (a), f (b−)[, [f (a), f (b)]). Si f est strictement décroissante sur I, on a f (I) = ]f (b−), f (a+)[ (resp. [f (b), f (a+)[, ]f (b−), f (a)], [f (b), f (a)]). Démonstration. Considérons, pour fixer les idées, le cas de I = ]a, b], et f strictement croissante, les autres se traitant de même. Puisque f est continue sur I, il résulte du théorème des valeurs intermédiaires que f (I) est un intervalle. D’ailleurs, pour tout x ∈ ]a, b], on a f (x) ≤ f (b) et f (b) est le maximum de f (I). D’autre part, on a vu que f (a+) = lim x→a, x∈I f (x) = inf f = inf f (I). I S’il existe u ∈ ]a, b] tel que f (u) = inf f (I), alors, pour tout v ∈ ]a, u[, on aura f (v) < f (u) = inf f (I), ce qui est contradictoire. Donc f (u) > inf f (I) pour tout u ∈ I, et f (I) = ]f (a+), f (b)]. 222 CHAPITRE 6. FONCTIONS MONOTONES La fonction réciproque d’une fonction continue et strictement monotone sur un intervalle est continue et strictement monotone. Proposition. Soit I ⊂ R un intervalle et f une fonction continue et strictement monotone sur I. Alors f −1 est strictement monotone et continue sur f (I). Démonstration. f , strictement monotone et continue sur I, est injective sur I et dès lors sa fonction réciproque f −1 est bien définie sur f (I). Supposons, pour fixer les idées, que f soit strictement croissante sur I = ]a, b[, les autres cas se traitant de même. La relation (x − y)[f (x) − f (y)] > 0 si x /= y dans I, entraı̂ne, en posant u = f (x), v = f (y), (u − v)[f −1 (u) − f −1 (v)] > 0 si u /= v dans f (I), et f −1 est strictement croissante sur f (I). Soit d ∈ f (I) et c ∈ I l’unique élément tel que f (c) = d. Soit ! > 0 tel que [c − !, c + !] ⊂ ]a, b[. De la relation c − ! < c < c + !, on tire f (c − !) < d < f (c + !), et il existe dès lors δ > 0 tel que f (c − !) < f (c) − δ < d < f (c) + δ < f (c + !). Comme f −1 est strictement croissante, on en déduit aussitôt que f −1 (d) − ! = c − ! < f −1 (d − δ) < f −1 (d) < f −1 (d + δ) < c + ! = f −1 (d) + !. En conséquence, pour tout x ∈ [d − δ, d + δ] ∩ I, on aura f −1 (d) − ! < f −1 (d − δ) ≤ f −1 (x) ≤ f −1 (d + δ) < f −1 (d) + !. 6.7. FONCTIONS MONOTONES DÉRIVABLES 6.7 223 Fonctions monotones dérivables Le théorème de Lagrange fournit une caractérisation des fonctions monotones et dérivables sur un intervalle. Proposition. Soit I ⊂ R un intervalle ouvert et f une fonction de R dans R dérivable sur I. Alors f est croissante (resp. décroissante) sur I si et seulement si, pour tout x ∈ I, on a f $ (x) ≥ 0 (resp. f $ (x) ≤ 0). Démonstration. Il suffit de considérer le cas de f croissante, l’autre s’en déduisant par application à −f. Condition nécessaire. Si f est croissante et dérivable sur I, on a, pour chaque x ∈ I et chaque y /= x dans I, (y − x)[f (y) − f (x)] ≥ 0, et dès lors f $ (x) = lim y→x, y∈I f (y) − f (x) ≥ 0. y−x Condition suffisante. Si x ∈ I, y ∈ I et y > x, alors, par le théorème de Lagrange, il existe z ∈ ]x, y[ tel que f (y) − f (x) = (y − x)f $ (z), et dès lors (y − x)[f (y) − f (x)] = (y − x)2 f $ (z) ≥ 0. On a également une caractérisation des fonctions dérivables et strictement monotones sur un intervalle. Proposition. Soit I un intervalle ouvert de R et f une fonction de R dans R dérivable sur I. Alors f est strictement croissante (resp. strictement décroissante) sur I si et seulement si f $ (x) ≥ 0 (resp. f $ (x) ≤ 0) pour tout x ∈ I et f $ ne s’annule sur aucun intervalle J ⊂ I. Démonstration. Il suffit de nouveau de considérer le cas où f est strictement croissante. Condition nécessaire. Si f est strictement croissante et dérivable sur I, alors, par la proposition précédente, f $ (x) ≥ 0 pour tout x ∈ I, et s’il existe un intervalle J ⊂ I tel que f $ (x) = 0 pour tout x ∈ J, f sera constante sur J, ce qui contredit son caractère strictement croissant. Condition suffisante. Soient x < y dans I; par le théorème de Lagrange, 224 CHAPITRE 6. FONCTIONS MONOTONES il existe z ∈ ]x, y[ tel que f (y) − f (x) = (y − x)f $ (z). Si f $ (z) = 0, alors, f (y) = f (x) et puisque f est croissante sur I, on aura, pour tout u ∈ [x, y], f (u) = f (x) = f (y), et dès lors f $ (u) = 0, ce qui contredit l’hypothèse sur les zéros de f $ . Donc, f $ (z) > 0 et f (y) > f (x). Le résultat suivant donne des conditions pour que la fonction réciproque d’une fonction dérivable et injective soit dérivable. Proposition. Soit I un intervalle de R et f une fonction de R dans R dérivable et injective sur I. Pour tout a ∈ I tel que f $ (a) /= 0, f −1 est dérivable en f (a) et 1 (f −1 )$ (f (a)) = $ . f (a) Démonstration. Par hypothèse f est continue et injective sur I, et donc strictement monotone. Il existe donc certainement des a ∈ I tels que f $ (a) /= 0. Soit a l’un d’entre eux. Notons que f (x) /= f (a) si x /= a et f −1 (y) /= f −1 (f (a)) si y /= f (a). Comme f (x) − f (a) = f $ (a) /= 0, x→a, x∈I\{a} x−a lim On aura x−a = lim x→a, x∈I\{a} f (x) − f (a) x→a, x∈I\{a} lim 1 f (x)−f (a) x−a = 1 f $ (a) . Dès lors, si ! > 0 est donné, # # (∃η > 0)(∀x ∈ I : 0 < |x − a| ≤ η) : ## # x−a 1 # − $ ## ≤ !. f (x) − f (a) f (a) Par un résultat ci-dessus, f −1 est continue en f (a) et dès lors (∃δ > 0)(∀y ∈ f (I) : |y − f (a)| ≤ δ) : |f −1 (y) − f −1 (f (a)| = |f −1 (y) − a| ≤ η. En conséquence, # # # f −1 (y) − f −1 (f (a)) 1 ## # (∃δ > 0)(∀y ∈ f (I) : 0 < |y − f (a)| ≤ δ) : # − $ # ≤ !. # y − f (a) f (a) # 225 6.8. FONCTIONS CONVEXES OU CONCAVES On a vu que la fonction exponentielle était une application strictement croissante de R dans R, ayant une limite nulle lorsque x tend vers −∞ et tendant vers +∞ lorsque x tend vers +∞. Elle est en outre dérivable en chaque point x de R, sa dérivée étant égale à elle-même. En conséquence, les résultats de cette section et de la précédente entraı̂nent que exp est une bijection de R sur ]0, +∞[ et possède donc une fonction réciproque, définie sur ]0, +∞[, strictement croissante et continue sur cet intervalle, et dérivable en chaque point de cet intervalle. Cette fonction est appelée la fonction logarithme et notée ln ou log. En vertu du théorème que nous venons de démontrer, on aura, pour tout x ∈ ]0, +∞[, (ln)$ (x) = (ln)$ [exp(ln x)] = 1 exp$ (ln x) = 1 1 = . exp(ln x) x D’autre part, pour tout x ∈ ]0, +∞[ et tout y ∈ ]0, +∞[, on a exp(ln x + ln y) = [exp(ln x)].[exp(ln y)] = xy, et dès lors ln(xy) = ln x + ln y. Donc la fonction logarithme fournit un homomorphisme du groupe multiplicatif (]0, +∞[, ·) sur le groupe additif (R, +) et cette propriété remarquable de la fonction logarithme est à la base de son utilisation comme outil de calcul numérique. Si a > 0, on définit la fonction exponentielle de base a x 2→ ax sur R par ax = exp(x ln a). On voit facilement que cette fonction est positive et dérivable en chaque point x de R et que (ax )$ = ax ln a. En particulier, cette fonction sera strictement décroissante sur R si a ∈ ]0, 1[, constante si a = 1 et strictement croissante si a > 1. On a évidemment ex = exp x pour tout x ∈ R. Lorsque a > 0 est différent de un, la fonction réciproque de l’exponentielle de base a est définie sur ]0, +∞[, appelée la fonction logarithme de base a et notée loga . On vérifie aisément que, pour tout x ∈ ]0, +∞[, on a ln x loga x = . ln a 6.8 Fonctions convexes ou concaves Soit f une fonction de R dans R définie sur un intervalle I ⊂ R. Il est intéressant d’étudier les fonctions telles que, pour chaque a ∈ I, le taux de 226 CHAPITRE 6. FONCTIONS MONOTONES variation f (x) − f (a) x−a de f en a est une fonction croissante sur I \ {a} ou une fonction décroissante sur I \ {a}. La caractérisation suivante est bien utile. ∆af : x 2→ Proposition. Soit f une fonction de R dans R définie sur un intervalle I ⊂ R. Alors la fonction ∆a f est, pour chaque a ∈ I, une fonction croissante sur I \ {a} si et seulement si, pour chaque x ∈ I, chaque y ∈ I et chaque λ ∈ [0, 1], on a f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y). Démonstration. Condition nécessaire. Il suffit évidemment de démontrer le résultat lorsque x /= y et λ ∈ ]0, 1[, les autres cas étant triviaux. Si x < y et λ ∈ ]0, 1[, on a x + λ(y − x) < y, et dès lors, par hypothèse, ∆x f (x + λ(y − x)) ≤ ∆x f (y) pour tout y ∈ I tel que y > x, c’est-à-dire f [(1 − λ)x + λy] − f (x) f (y) − f (x) ≤ , λ(y − x) y−x ce qui entraı̂ne facilement que f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y). Si x > y et λ ∈ ]0, 1[, alors, en posant µ = 1 − λ, on a aussi µ ∈ ]0, 1[, et, par la première partie de la démonstration, f [(1−λ)x+λy] = f [(1−µ)y+µx] ≤ (1−µ)f (y)+µf (x) = (1−λ)f (x)+λf (y). Condition suffisante. Si x < y < a appartiennent à I, alors λ= et a−y y−x ∈ ]0, 1[, 1 − λ = , a−x a−x f (y) = f (a+y −a) = f [a+λ(x−a)] = f [(1−λ)a+λx] ≤ (1−λ)f (a)+λf (x); dès lors f (y) − f (a) ≤ λ[f (x) − f (a)], 6.8. FONCTIONS CONVEXES OU CONCAVES c’est-à-dire 227 f (y) − f (a) f (x) − f (a) ≥ . y−a x−a Le cas où a < x < y se traite d’une manière semblable. Si x < a < y appartiennent à I, alors, par la première partie de la démonstration de la condition suffisante, on a f (a) − f (x) f (y) − f (x) ≤ , a−x y−x et dès lors (y − x)[f (a) − f (x)] ≤ (a − x)[f (y) − f (x)] = (a − x)[f (y) − f (a)] + (a − x)[f (a) − f (x)]. On en déduit aussitôt que (y − a)[f (a) − f (x)] ≤ (a − x)[f (y) − f (a)], et donc que f (x) − f (a) f (y) − f (a) ≤ . x−a y−a Remarque. L’examen de la démonstration de la proposition précédente montre que, pour chaque a ∈ I, ∆a f est strictement croissante sur I \ {a} si et seulement si, pour tout x /= y dans I et pour tout λ ∈ ]0, 1[, on a f [(1 − λ)x + λy] < (1 − λ)f (x) + λf (y). On est ainsi conduit à la définition suivante. Définition. Soit f une fonction de R dans R définie sur un intervalle I de R. On dit que f est convexe sur I si, pour tout x ∈ I, tout y ∈ I et tout λ ∈ [0, 1], on a f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y). Elle sera dite strictement convexe sur I si, pour tout x /= y dans I et tout λ ∈ ]0, 1[, on a f [(1 − λ)x + λy] < (1 − λ)f (x) + λf (y). 228 CHAPITRE 6. FONCTIONS MONOTONES Géométriquement, cette définition exprime que, pout tout x ∈ I et pour tout y ∈ I, le graphe de f situé entre (x, f (x)) et (y, f (y) est située “endessous” du segment de droite joignant ces deux points. Par la proposition qui précède, f est convexe (resp. strictement convexe) sur I si et seulement si, pour chaque a ∈ I, la fonction ∆af est croissante (resp. strictement croissante) sur I \ {a}. On a évidemment la situation correspondant au cas où ∆a f est décroissante. Définition. Soit f une fonction de R dans R définie sur un intervalle I de R. On dit que f est concave sur I si, pour tout x ∈ I, tout y ∈ I et tout λ ∈ [0, 1], on a f [(1 − λ)x + λy] ≥ (1 − λ)f (x) + λf (y). Elle sera dite strictement concave sur I si, pour tout x /= y dans I et tout λ ∈ ]0, 1[, on a f [(1 − λ)x + λy] > (1 − λ)f (x) + λf (y). Il est clair que f est concave (resp. strictement concave) sur I si et seulement si −f est convexe (resp. strictement convexe) sur I, et dès lors si et seulement si, pour chaque a ∈ I, ∆af est décroissante sur I \ {a}. Il suffit donc d’étudier les fonctions convexes ou strictement convexes. Exemples. 1. Toute fonction constante sur I est concave et convexe sur I. 2. Toute fonction affine sur R est concave et convexe sur R. 3. Pour tout entier n ≥ 2, la fonction x 2→ xn est strictement convexe sur % k n−1−k R; en effet, pour chaque a ∈ R, ∆a f (x) = n−1 est strictement k=0 a x croissante sur R. Une fonction convexe sur I est continue en tout point intérieur à I. Proposition. Si f est une fonction de R dans R convexe sur l’intervalle I, alors, f est continue en tout point a ∈ int I et les limites fg$ (a) = lim x→a, x<a ∆af (x) et fd$ (a) = lim x→a, x>a ∆af (x) existent et vérifient l’inégalité fg$ (a) ≤ fd$ (a). Démonstration. Soit a ∈ int I. L’existence des limites en question et l’inégalité fg$ (a) ≤ fd$ (a) sont une conséquence de la croissance de ∆a f et des propriétés des fonctions croissantes. D’autre part, lim x→a, x<a [f (x) − f (a)] = lim x→a, x<a (x − a) f (x) − f (a) = 0.fg$ (a) = 0, x−a 6.8. FONCTIONS CONVEXES OU CONCAVES 229 et de même lim x→a, x>a [f (x) − f (a)] = 0. On en déduit aussitôt la continuité de f en a. Remarque. Le résultat ci-dessus n’est pas vrai en une extrémité de I comme le montre l’exemple de la fonction f égale à 1 en 0 et à 0 ailleurs qui est convexe sur [0, 1] et n’est pas continue en 0. Les fonctions convexes vérifient une inégalité de la moyenne en termes des dérivées à gauche fg$ et à droite fd$ . Proposition. Soit f une fonction de R dans R convexe sur un intervalle I. Si a < b sont des points de I tels que fd$ (a) et fg$ (b) existent (en particulier s’ils sont intérieurs à I), alors fd$ (a) ≤ f (b) − f (a) ≤ fg$ (b). b−a Démonstration. Si a < x < b sont intérieurs à I, on a f (a) − f (x) f (b) − f (x) ≤ , a−x b−x et dès lors, en faisant tendre x respectivement vers a et vers b, on obtient fd$ (a) ≤ f (b) − f (a) ≤ fg$ (b). b−a On a une caractérisation intéressante des fonctions convexes dérivables. Proposition. Soit f une fonction de R dans R dérivable en chaque point d’un intervalle I. Les énoncés suivants sont équivalents. 1. f est convexe sur I. 2. Pour tout x ∈ I et tout y ∈ I, on a f (y) ≥ f (x) + f $ (x)(y − x). 3. f $ est croissante sur I. Démonstration. Notons tout d’abord que, f étant dérivable en chaque point de I, on a fg$ (x) = fd$ (x) = f $ (x) pour chaque x ∈ I. Dès lors, la proposition précédente entraı̂ne que 1 ⇒ 2 et la caractérisation de la convexité en termes de ∆a f et de la croissance d’une fonction dérivable entraı̂ne 230 CHAPITRE 6. FONCTIONS MONOTONES que 3 ⇒ 1. Il reste à montrer que 2 ⇒ 3. L’hypothèse 2 entraı̂ne que, pour tout x ∈ I et tout y ∈ I, on a f (y) ≥ f (x) + f $ (x)(y − x) et f (x) ≥ f (y) + f $ (y)(x − y), c’est-à-dire f $ (x)(y − x) ≤ f (y) − f (x) ≤ f $ (y)(y − x), et donc (y − x)[f $ (y) − f $ (x)] ≥ 0. Remarques. 1. On démontre d’une manière analogue l’équivalence, pour une fonction dérivable sur I, entre les énoncés 1. f est strictement convexe sur I. 2. Pour chaque x /= y dans I, on a f (y) > f (x) + f $ (x)(y − x). 3. f $ est strictement croissante sur I. On déduit aisément de cette remarque que la fonction exponentielle est une fonction strictement convexe sur R et la fonction logarithme une fonction strictement concave sur ]0, +∞[. 2. La propriété 2 de la Proposition précédente montre que, si f est convexe sur I, tout point critique de f sur I est un minimant de f sur I. 3. La définition de fonction convexe peut s’étendre aux fonctions de Rn dans R. Si E ⊂ Rn , on dira que E est convexe s’il contient le segment de droite joignant deux quelconques de ses points, c’est-à-dire si, pour tout x ∈ E, tout y ∈ E et tout λ ∈ [0, 1], on a (1 − λ)x + λy ∈ E. Les parties convexes de R sont les intervalles. Une fonction f de Rn dans R sera dite convexe sur E si elle est définie sur E et si, pour tout x ∈ E, tout y ∈ E et tout λ ∈ [0, 1], on a f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y). 6.9 Exercices 1. Si f est une fonction de Rn dans R et si a ∈ dom f, on appelle oscillation de f en a la quantité o(f, a) = lim r→0+ & sup f − inf f B2 [a;r] B2[a;r] ' . Montrer que o(f, a) existe au sens large et que f est continue en a si et seulement si o(f, a) = 0. 231 6.9. EXERCICES 2. Utiliser le lemme de Cousin pour démontrer directement que si f est une fonction de R dans R dérivable en chaque point d’un intervalle I et telle que f $ (x) > 0 pour tout x ∈ I, alors f est strictement croissante sur I. 3. Soit a > 0 et (uk )k∈N la suite réelle définie par u0 > 0 arbitraire et uk+1 = 4 1 a uk + 2 uk 5 , (k ∈ N). Montrer que cette suite est positive, décroissante et donc convergente. Mon√ trer que sa limite est égale à a. (Algorithme de Héron pour l’extraction d’une racine carrée). 4. Soit (ak )k∈N une suite réelle. Pour chaque k ∈ N, posons (au sens large) ak = inf{aj : j ≥ k}, ak = sup{aj : j ≥ k}. a. Montrer que (ak )k∈N est une suite croissante dans R si et seulement si (ak )k∈N est minorée. Si (ak )k∈N n’est pas minorée, on pose lim inf ak = −∞. k→∞ Si (ak )k∈N est minorée, on pose (au sens large) lim inf ak = lim ak = lim inf aj . k→∞ k→∞ k→∞ j≥k b. Montrer que (ak )k∈N est une suite décroissante dans R si et seulement si (ak )k∈N est majorée. Si (ak )k∈N n’est pas majorée, on pose lim sup ak = +∞. k→∞ Si (ak )k∈N est majorée, on pose (au sens large) lim sup ak = lim ak = lim sup aj . k→∞ k→∞ k→∞ j≥k c. On a ainsi attaché à toute suite réelle deux éléments lim inf k→∞ ak et lim supk→∞ ak de R ∪ {−∞} ∪ {+∞} respectivement appelés la limite inférieure et la limite supérieure de la suite (ak )k∈N . Montrer (avec la convention −∞ < a < +∞ pour tout a ∈ R) que l’on a toujours lim inf ak ≤ lim sup ak , k→∞ k→∞ 232 CHAPITRE 6. FONCTIONS MONOTONES et que l’égalité a lieu si et seulement si la suite (ak )k∈N est convergente (au sens large), auquel cas sa limite (au sens large) est égale à la valeur commune de sa limite inférieure et de sa limite supérieure. 5. Soit f une fonction de Rn dans R semi-continue inférieurement en chaque point du fermé E ⊂ Rn . Montrer que f possède un minimum sur E si et seulement si f possède une suite minimisante convergente. 6. Soient A et B deux ensembles non vides et f : A × B → R, (x, y) 2→ f (x, y) une application réelle majorée et minorée. Montrer que sup inf f (x, y) ≤ inf sup f (x, y). x∈A y∈B 6.10 y∈B x∈A Petite anthologie Si la propriété M n’appartient pas à toutes les valeurs d’une grandeur x, mais appartient à toutes celles qui sont plus petites qu’un certain u, alors il existe toujours une grandeur U qui est la plus grande de celles dont on peut affirmer que toutes les valeurs inférieures x possèdent la propriété M. Bernard Bolzano, 1817 Il ne faut pas trop s’étonner que la distinction entre minimum et borne inférieure, ou maximum et borne supérieure, ait été faite si tardivement. C’est qu’elle n’a aucune signification concrète. Qui oserait décider s’il existe une charge maxima que peut supporter un pont, plutôt qu’une charge minima qui le fasse s’écrouler ? Henri Lebesgue Il me semble que la notion de fonction convexe est à peu près aussi fondamentale que celles-ci : fonction positive, fonction croissante. Si je ne me trompe pas en ceci, la notion devra trouver sa place dans les expositions élémentaires de la théorie des fonctions réelles. Johann L.W.V. Jensen, 1906 Chapitre 7 Développement de Taylor et séries 7.1 Dérivées d’ordre supérieur Soit f une fonction de R dans Rp dérivable en au moins un point de R. A chaque point x ∈ R tel que f soit dérivable en x, nous pouvons associer l’élément f $ (x) de Rp et définir ainsi une nouvelle fonction f $ de R dans Rp de domaine dom f $ = {x ∈ R : f est dérivable en x}. Cette fonction s’appelle la fonction dérivée première de f ou, brièvement, la dérivée première de f ou la dérivée de f . On la désigne également par Df df ou par dx . Définition. Soit f une fonction de R dans Rp et a ∈ dom f $ . On dit que f est deux fois dérivable en a si f $ est dérivable en a, auquel cas (f $ )$ (a) est 2 noté f $$ (a), D 2 f (a) ou ddxf2 (a) et appelé le vecteur dérivé deuxième de f en a ou, plus simplement la dérivée deuxième de f en a. On rappellera que l’existence de f $$ (a) requiert que a soit non isolé dans dom f $ et que f $ (x) − f $ (a) lim x→a x−a existe. On sait que, n ≥ 1 étant un entier, l’application f : x 2→ xn est dérivable en chaque x ∈ R et f $ (x) = nxn−1 . En conséquence la dérivée deuxième f $$ (x) existe en chaque x ∈ R et est égale à zéro si n = 1 et à n(n − 1)xn−2 si n ≥ 2. 233 234 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES On peut alors procéder comme avec f $ et définir la fonction dérivée deuxième de f ou, plus brièvement, la dérivée deuxième de f , notée f $$ ou 2 D2 f ou ddxf2 , comme la fonction de R dans Rp de domaine dom f $$ = {x ∈ R : f $ est dérivable en x}, qui, à chaque x ∈ dom f $$ associe f $$ (x). On dira alors que f est trois fois dérivable en a si f $$ est dérivable en a, auquel cas (f $$ )$ (a) est noté f $$$ (a), 3 f (3)(a), D3 f (a) ou ddxf3 (a) et appelé le vecteur dérivée troisième de f en a ou, plus simplement la dérivée troisième de f en a. En continuant de la sorte, si k ≥ 2 est un entier et si f k−1 désigne la fonction dérivée (k − 1)e de f , on dira que f est k fois dérivable en a si la fonction f (k−1) est dérivable en a, auquel cas (f (k−1) )$ (a) est appelé le vecteur dérivée ke de f en a ou plus k simplement la dérivée ke de f en a, et noté f (k) (a) ou D k f (a) ou ddxfk (a). La fonction dérivée ke de f est alors la fonction de R dans Rp de domaine dom f (k) = {x ∈ R : f est k-fois dérivable en x} qui, à chaque x ∈ dom f (k) associe f (k) (x). Ainsi, dans l’exemple ci-dessus où f (x) = xn , un raisonnement par récurrence aisé montre que, pour chaque x ∈ R, f (k) (x) = n(n − 1) . . . (n − k + 1)xn−k si k ≤ n, et f (k) (x) = 0 si k > n. On a bien entendu en général les inclusions dom f (k) ⊂ dom f (k−1) ⊂ dom f, et ces inclusions peuvent être strictes. Ainsi, pour la fonction f de Dirichlet qui associe 1 à chaque x rationnel et 0 à chaque x irrationnel, on a dom f $ = ∅ (et dès lors dom f (k) = ∅ pour tout k ≥ 2), puisque f n’est continue en aucun point de R et donc dérivable en aucun point de R. Karl Weierstrass a donné en 1872 un exemple plus surprenant de fonction continue sur R qui n’est dérivable en aucun point de R. Nous y reviendrons plus loin. On déduit aisément des règles de calcul des dérivées (premières) certaines règles de calcul pour les dérivées d’ordre supérieur. Par exemple, si f et g sont des fonctions de R dans Rp k-fois dérivables en a ∈ R, et si c ∈ R, alors f + g et cf sont k-fois dérivables en a et (f + g)(k)(a) = f (k) (a) + g (k)(a), (cf )(k)(a) = cf (k) (a). Le cas du produit (et dès lors du quotient) de deux fonctions est plus compliqué et porte le nom de formule de Leibniz. 235 7.1. DÉRIVÉES D’ORDRE SUPÉRIEUR Proposition. Soit k ≥ 1 un entier, f une fonction de R dans R (resp. C) et g une fonction de R dans Rp (resp. C) k-fois dérivables en a. Alors, f g est k-fois dérivable en a et (f g)(k)(a) = k $ Ckj f (j) (a)g (k−j)(a), j=0 j où Ck = k! j!(k−j)! . Démonstration. Elle se fait par récurrence sur k. Le résultat a déjà été démontré pour k = 1. S’il est vrai jusqu’à l’ordre k − 1, alors (f g)(k−1)(a) = k−1 $ j Ck−1 f (j) (a)g (k−1−j)(a), j=0 et (f g)(k−1) est dérivable en a puisqu’il en est ainsi de chacune des fonctions f (j) g (k−1−j) (0 ≤ j ≤ k − 1) en vertu de l’hypothèse de récurrence. En outre, par les règles de calcul d’une dérivée première, on a (f g)(k)(a) = [(f g)(k−1)]$ (a) = k−1 $ j Ck−1 [f (j)g (k−1−j) ]$ (a) j=0 = k−1 $ j Ck−1 [f (j+1)(a)g (k−1−j)(a) + f (j) (a)g (k−j)(a)] j=0 = k $ j−1 (j) Ck−1 f (a)g (k−j)(a) + j=1 = f (k) (a)g(a) + k−1 $ j Ck−1 f (j) (a)g (k−j)(a) j=0 k−1 $ j−1 j (Ck−1 + Ck−1 )f (j) (a)g (k−j)(a) + f (a)g (k)(a) j=1 = k $ j=0 j−1 j puisque Ckj = Ck−1 + Ck−1 . Ckj f (k) (a)g (k−j)(a), 236 7.2 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Développement de Taylor Soit f une fonction de R dans Rp et a ∈ dom f . Si f est dérivable en a, alors, pour tout h ∈ (dom f − a) \ {0}, on a f (a + h) = f (a) + hf $ (a) + |h|r(h), où r est une fonction de R dans Rp de domaine au moins égal à (dom f − a) \ {0} telle que r(h) → 0 si h → 0. En d’autres termes, on peut écrire, pour tout h ∈ (dom f − a) \ {0}, f (a + h) = P 1 (h) + |h|r(h), où P 1 (h) est un polynôme de degré un en h dont les coefficients s’expriment en fonction de f (a) et f $ (a) et où r(h) → 0 si h → 0. Lorsque f est une fonction de R dans Rp m-fois dérivable en a, (m ≥ 2), il est naturel de se demander s’il existe un polynôme P m de degré m, dont les coefficients s’expriment en fonction de f (a), f $ (a), . . ., f (m)(a) tel que, pour tout h ∈ (dom f − a) \ {0}, on ait f (a + h) = P m (h) + |h|m r(h) (7.1) où r est une fonction de R dans Rp de domaine au moins égal à (dom f −a)\ {0} telle que r(h) → 0 si h → 0. Avant de donner des conditions suffisantes pour l’existence d’un tel polynôme, montrons qu’il en existe au plus un. Proposition. Soit f une fonction de R dans Rp et a non isolé dans dom f . Il existe au plus un polynôme P m de degré m vérifiant (7.1). % k Démonstration. Supposons que P m (h) = m k=0 ck h vérifie (7.1) et que %m m k Q (h) = k=0 dk h soit tel que, pour tout h ∈ (dom f − a) \ {0}, on ait f (a + h) = Qm (h) + |h|m s(h), où s est une fonction de R dans Rp de domaine au moins égal à (dom f − a) \ {0} telle que s(h) → 0 si h → 0. On en déduit aussitôt, par soustraction, que, pour tout h ∈ (dom f − a) \ {0}, on a Qm (h) − P m (h) = |h|m[r(h) − s(h)] = |h|m q(h), avec q(h) → 0 si h → 0. On déduit aussitôt de (7.2) que d0 − c0 = lim [Qm (h) − P m (h)] = lim |h|mq(h) = 0, h→0 h→0 (7.2) 237 7.2. DÉVELOPPEMENT DE TAYLOR et, pour prouver par récurrence que P m = Qm , il suffit de montrer que si cj = dj pour 0 ≤ j ≤ k − 1 ≤ m − 1, alors ck = dk . Si cj = dj pour 0 ≤ j ≤ k − 1 ≤ m − 1, la condition (7.2) entraı̂ne m $ j=k et dès lors m $ j=k (dj − cj )hj = |h|m q(h), (dj − cj )hj−k = |h|m q(h), hk pour tout h ∈ (dom f − a) \ {0}. En conséquence, dk − ck = lim h→0 puisque la fonction h 2→ k ≤ m. m $ j=k |h|m hk |h|m q(h) = 0, h→0 hk (dj − cj )hj−k = lim est localement bornée en 0 pour chaque 1 ≤ Cherchons maintenant à déterminer la forme de cet unique polynôme de degré m qui vérifie éventuellement la condition (7.1). Pour ce faire, % k considérons le cas particulier trivial où f (x) = m k=0 bk x est elle-même un polynôme de degré m. Dans ce cas, si a ∈ R est donné, la fonction % k h 2→ f (a + h) = m k=0 bk (a + h) est aussi un polynôme de degré m, comme le montre le développement de chaque monôme (a + h)k par la formule du binôme de Newton. Donc f (a + h) est dans ce cas l’unique polynôme % k P m (h) = m k=0 ck h de degré m vérifiant la condition (7.1). De l’identité f (a + h) = m $ ck hk , k=0 on déduit aussitôt, par dérivations des deux membres, que, pour chaque 1 ≤ j ≤ m, on a [f (a + ·)](j)(h) = f (j) (a + h) = m $ k=j ck k(k − 1) . . .(k − j + 1)hk−j , et dès lors, en prenant h = 0, on trouve f (a) = c0 , f (j) (a) = j!cj , (1 ≤ j ≤ m). 238 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Le polynôme de degré m vérifiant les conditions voulues est donc de la forme m $ hj j=0 j! f (j) (a), (avec les conventions habituelles 0! = 1 et f (0) = f ) et s’exprime bien en fonction de f (a), f $ (a), . . ., f (m)(a). Ce résultat suggère l’introduction de la définition suivante. Définition. Soit m ≥ 1 un entier et f une fonction de R dans Rp m fois dérivable en a ∈ R. Le développement de Taylor d’ordre m de f en a est le m polynôme Tf,a de degré m défini par m Tf,a (h) = m $ j=0 hj f (j) (a) . j! Le reste du développement de Taylor d’ordre m de f en a est la fonction p Rm f,a de R dans R de domaine dom f − a définie par m Rm f,a (h) = f (a + h) − Tf,a (h). m est aussi appelé le développement de Maclaurin d’ordre Lorsque a = 0, Tf,0 m de f . Un lemme sera utile pour donner des conditions suffisantes pour que le développement de Taylor d’ordre m de f vérifie la relation (7.1). Lemme. Soit m ≥ 1 un entier et g une fonction de R dans Rp (m − 1)-fois dérivable en chaque point d’un voisinage V de 0 et m fois dérivable en 0 (cette hypothèse se réduisant à la dérivabilité de g en 0 si m = 1). Si g(0) = g $ (0) = . . . = g (m)(0) = 0, alors lim h→0 g(h) = 0. |h|m Démonstration. Elle se fait par récurrence sur m. Le résultat est évidemment vrai pour m = 1 puisque, si g(0) = g $ (0) = 0, alors, g(h) g(h) − g(0) − hg $ (0) = lim = 0, h→0 |h| h→0 |h| lim 7.2. DÉVELOPPEMENT DE TAYLOR 239 puisque g est dérivable en 0. Supposons donc le résultat vrai pour k − 1, où 2 ≤ k ≤ m est un entier, et montrons qu’il est vrai pour k. On a, par hypothèse g(0) = g $ (0) = . . . = g (k)(0) = 0, et la fonction g $ est donc telle que g $ (0) = (g $)$ (0) = . . . = (g $)(k−1) (0) = 0. En conséquence, l’hypothèse de récurrence entraı̂ne que g $ (h) = 0. h→0 |h|k−1 lim (7.3) Si r > 0 est suffisamment petit pour que le voisinage V de 0 contienne B2 [0; r], alors, pour chaque h ∈ [−r, r], le théorème de la moyenne entraı̂ne l’existence d’un θ ∈ ]0, 1[ tel que |g(h)|2 = |g(h) − g(0)|2 ≤ |h||g $(θh)|2 . (7.4) Soit ! > 0; la condition (7.3) entraı̂ne l’existence d’un δ ∈ ]0, r] tel que, pour tout h$ ∈ [−δ, δ], on ait |g $(h$ )|2 ≤ !|h$ |k−1 . Dès lors, pour tout h ∈ [−δ, δ], on aura |θh| ≤ δ, et, par (7.4), |g(h)|2 ≤ |h|!|θh|k−1 ≤ !|h|k . Le résultat suivant, dû à William H. Young, montre qu’il suffit d’ajouter la dérivabilité jusqu’à l’ordre m − 1 sur un voisinage du point a à l’existence de la dérivée me en ce point pour que le développement de Taylor d’ordre m de f en a vérifie la condition (7.1). Proposition. Soit m ≥ 1 un entier, f une fonction de R dans Rp (m − 1)fois dérivable en chaque point d’un voisinage V de a et m-fois dérivable en a (si m = 1 cette hypothèse se réduit à la dérivabilité de f en a). Si Rm f,a est le reste du développement de Taylor d’ordre m de f en a, alors Rm f,a (h) = 0. h→0 |h|m lim 240 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Démonstration. Pour tout h ∈ dom f − a, on a, par définition, m Rm f,a (h) = f (a + h) − Tf,a (h) = f (a + h) − m $ j=0 hj f (j) (a) , j! et dès lors, pour chaque 1 ≤ k ≤ m, (k) (k) (Rm (a + h) − f,a ) (h) = f m $ j=k j(j − 1) . . . (j − k + 1)hj−k f (j) (a) , j! ce qui entraı̂ne immédiatement que m (k) (k) Rm (a)−f (k) (a) = 0, (1 ≤ k ≤ m). f,a (0) = f (a)−f (a) = 0, (Rf,a) (0) = f Il suffit donc d’appliquer le lemme à Rm f,a . Exemples. 1. On a vu que, pour tout x ∈ R, (exp)$ (x) = exp x. En conséquence, pour tout x ∈ R et tout k ∈ N∗ , on a (exp)(k)(x) = exp x. En particulier, (exp)(k) (0) = exp 0 = 1 pour tout k ≥ 1 et dès lors, pour chaque entier m ≥ 1 et chaque x ∈ R, on a exp x = m $ xj j=0 Rm j! + Rm exp,0 (x), (x) avec limx→0 exp,0 = 0. xm 2. On a vu que, pour tout x ∈ ]0, +∞[, (ln)$ (x) = x1 . Dès lors, pour chaque k ≥ 2, on a (ln)(k)(x) = (−1)k−1 (k−1)! (le montrer par récurrence). En xk conséquence, pour chaque h ∈ ] − 1, +∞[, et chaque m ≥ 1, on aura (puisque ln 1 = 0), m $ (−1)j−1 ln(1 + h) = hj + Rm ln,1 (h), j j=1 avec limh→0 7.3 Rm (h) ln,1 hm = 0. Calcul de limites et de dérivées Le théorème de Young fournit un résultat pour le calcul de la limite du quotient de deux fonctions d’une variable dans certains cas où la règle de calcul de la limite d’un quotient et la règle de l’Hospital ne s’appliquent pas. 7.3. CALCUL DE LIMITES ET DE DÉRIVÉES 241 Proposition. Soit m ≥ 2 un entier, f une fonction de Rn dans Rp (resp. C) et g une fonction de Rn dans R (resp. C) (m − 1)-fois dérivables en chaque point d’un voisinage V de a ∈ R et m-fois dérivables en a. Si f (a) = f $ (a) = . . . = f (m−1) (a) = 0, g(a) = g $ (a) = . . . = g (m−1)(a) = 0, et si g (m)(a) /= 0, alors f f (m) (a) (x) = (m) . x→a, x(=a g g (a) lim Démonstration. Par le théorème de Young, on a, pour tout h ∈ (dom f ∩ dom g) − a, f (m) (a) f (a + h) = hm + Rm f,a(h), m! g(a + h) = hm g (m)(a) + Rm g,a (h), m! et Rm Rm f,a (h) g,a (h) = 0, lim = 0. m h→0 h→0 h hm Dès lors, pour tout h ∈ [(dom f ∩ dom g) − a] \ {0}, il vient lim f (a + h) = g = hm f (m) (a) m! hm g (m) (a) m! f (m) (a) m! g (m) (a) m! + + + Rm f,a (h) + Rm g,a (h) Rm f,a (h) hm Rm g,a (h) hm . Par conséquent, la règle usuelle de passage à la limite dans un quotient appliquée au second membre entraı̂ne que f f (a + h) (x) = lim x→a, x(=a g h→0, h(=0 g(a + h) lim = f (m) (a) m! lim h→0, h(=0 g (m) (a) m! + + Rm f,a (h) hm Rm g,a (h) hm = f (m)(a) . g (m)(a) 242 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Exemple. On a (exp x − 1)3 = 1, x→0 x3 lim puisque, si f (x) = (exp x − 1)3 et g(x) = x3 , alors, f $ (x) = 3(exp x − 1)2 , f $$ (x) = 6(exp x − 1), f $$$ (x) = 6 exp x, g $ (x) = 3x2 , g $$ (x) = 6x, g $$$(x) = 6, et dès lors f (0) = f $ (0) = f $$ (0) = g(0) = g $ (0) = g $$(0) = 0, f $$$ (0) = 6, g $$$(0) = 6. Le théorème de Young fournit aussi un moyen rapide de calculer les dérivées d’ordre supérieur de certaines fonctions. Pour chaque entier q ≥ 1 et chaque h /= 1, on a l’identité algébrique q $ 1 hq+1 1 − hq+1 hq+1 hk + = + = . 1−h 1−h 1 − h k=0 1−h Comme hq+1 h = lim = 0, q h→0 (1 − h)h h→0 1 − h lim % on voit que qk=0 hk est le développement de Taylor d’ordre q de la fonction 1 f : x 2→ 1−x en 0, et dès lors, puisque q est arbitraire, on a, pour chaque entier j ∈ N∗ , f (j) (0) = j!. D’ailleurs, l’identité ci-dessus entraı̂ne que, pour tout entier p ≥ 2 et tout h /= 1, on a q $ 1 hp(q+1) kp = h + , 1 − hp 1 − hp k=0 et Comme q $ 1 (−1)q+1 hp(q+1) k kp = (−1) h + . 1 + hp 1 + hp k=0 hp(q+1) = 0, h→0 (1 ± hp )hqp lim 243 7.4. RESTE DE TAYLOR DE FONCTIONS RÉELLES % q 1 1 kp on voit que, si f (x) = 1−x est le développement p et g(x) = 1+xp , k=0 h %q k kp de Taylor d’ordre qp de f en 0 et k=0 (−1) h est le développement de Taylor d’ordre qp de g en 0. On en déduit aussitôt que f (j) (0) = 0 si j n’est pas un multiple de p, f (kp)(0) = (kp)!, et g (j)(0) = 0 si j n’est pas un multiple de p, g (kp)(0) = (−1)k (kp)!. 7.4 Reste de Taylor de fonctions réelles Le théorème de Cauchy permet de préciser l’expression du reste du développement de Taylor d’ordre m en a d’une fonction de R dans R m + 1-fois dérivable sur un voisinage de a. Le résultat le plus général dans cette direction est l’expression de Schlömilch du reste du développement de Taylor. Proposition. Soit m ≥ 1 un entier et f une fonction de R dans R (m + 1)fois dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= 0 tel que a + h ∈ I et g une fonction de R dans R continue sur I, dérivable en chaque point intérieur à I et telle que g $ ne s’annule pas sur l’intervalle ouvert joignant a et a + h. Alors il existe θ ∈ ]0, 1[ tel que Rm f,a (h) 2 g(a + h) − g(a) = g $ (a + θh) 3, - [(1 − θ)h]m f (m+1) (a + θh) . m! Démonstration. Définissons la fonction F de R dans R par m F (y) = f (a + h) − Tf,y (a + h − y). F est définie sur I et, par construction, m F (a + h) = f (a + h) − Tf,a+h (0) = f (a + h) − f (a + h) = 0, m F (a) = f (a + h) − Tf,a (h) = Rm f,a(h). En outre, pour chaque y ∈ I, on a m $ $ f (j) (y) F $ (y) = − (a + h − y)j j! j=0 244 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES = m $ j=1 = (a + h − y)j−1 m−1 $ j=0 (a + h − y)j m $ f (j) (y) f (j+1) (y) − (a + h − y)j (j − 1)! j=0 j! m f (j+1)(y) $ f (j+1) (y) − (a + h − y)j j! j! j=0 f (m+1) (y) . m! Si nous appliquons le théorème de la moyenne Cauchy à F et g sur l’intervalle d’extrémités a et a + h, nous obtenons un θ ∈ ]0, 1[ tel que = −(a + h − y)m [F (a + h) − F (a)]g $ (a + θh) = [g(a + h) − g(a)]F $(a + θh), et dès lors tel que Rm f,a (h) 2 g(a + h) − g(a) = g $ (a + θh) 3, - [(1 − θ)h]m f (m+1) (a + θh) . m! En choisissant convenablement la fonction g dans l’expression de Schlömilch, on obtient des expressions intéressantes du reste. La première, appelée expression de Lagrange du reste du développement de Taylor, constitue une généralisation du théorème de Lagrange. Corollaire. Soit m ≥ 1 un entier et f une fonction de R dans R (m+1)-fois dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= a tel que a + h ∈ I. Alors il existe un θ ∈ ]0, 1[ tel que m+1 Rm f,a (h) = h f (m+1) (a + θh) . (m + 1)! Démonstration. Il suffit de prendre g définie par g(y) = (a + h − y)m+1 dans l’expression de Schlömilch, ce qui donne g(a + h) − g(a) = −hm+1 , g $ (a + θh) = −(m + 1)[(1 − θ)h)]m . Le deuxième cas particulier s’appelle l’expression de Cauchy du reste du développement de Taylor. 245 7.5. EXTRÉMANTS LOCAUX LIBRES Corollaire. Soit m ≥ 1 un entier et f une fonction de R dans R (m+1)-fois dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= a tel que a + h ∈ I. Alors il existe un θ ∈ ]0, 1[ tel que Rm f,a (h) = (1 − θ)m hm+1 f (m+1) (a + θh) . m! Démonstration. Il suffit de prendre g définie par g(y) = a + h − y dans l’expression de Schlömilch. 7.5 Extrémants locaux libres L’expression de Lagrange du reste du développement de Taylor permet de donner des conditions nécessaires et des conditions suffisantes pour qu’un point soit maximant local libre ou minimant local libre d’une fonction de R dans R. Proposition. Soit m ≥ 2 un entier, f une fonction de R dans R m-fois dérivable en chaque point d’un voisinage V d’un point a ∈ R, telle que f (m) soit continue et différente de zéro en a et que f $ (a) = f $$ (a) = . . . = f (m−1) (a) = 0. Si m est impair, a n’est pas un extrémant local libre de f . Si m est pair et si f (m)(a) > 0, alors a est un minimant local libre de f et si m est pair et f (m) (a) < 0, alors a est un maximant local libre de f . Démonstration. Soit r > 0 tel que [a − r, a + r] ⊂ V et tel que, pour tout x ∈ [a−r, a+r], f (m) (x)f (m)(a) > 0 (c’est possible puisque f (m) est continue en a et f (m) (a) /= 0). Soit h ∈ R tel que |h| ≤ r. En vertu des hypothèses et de l’expression de Lagrange du reste du développement de Taylor d’ordre m − 1 en a, il existe θ ∈ ]0, 1[ tel que f (a + h) − f (a) = hm f (m) (a + θh) . m! Dès lors, si m est impair, f (a + h) − f (a) a un signe différent pour h < 0 et h > 0 et a n’est pas un extrémant local libre de f . Si m est pair, alors pour tout h ∈ [−r, r], f (a + h) − f (a) a le signe de f (m) (a) et le résultat s’en déduit aussitôt. 246 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Considérons maintenant le cas d’une fonction f de R dans R qui est mfois dérivable sur un voisinage V d’un point a quel que soit l’entier m ≥ 1. Une telle fonction est appelée indéfiniment dérivable ou de classe C ∞ sur V . Si a est un point critique de f et si toutes ses dérivées en a ne sont pas nulles, la proposition précédente montre que l’examen de la première dérivée non nulle en a permet de discuter complètement la nature du point critique. Il n’en est pas de même si toutes les dérivées sont nulles en a. C’est ce que montre l’étude de la fonction de Cauchy définie par 4 c(x) = exp − 1 x 5 si x > 0, c(x) = 0 si x ≤ 0. Les propriétés de cette fonction résultent des lemmes suivants. Lemme. Pour tout entier m ≥ 0, on a 4 5 = 0. 4 5 =0 1 1 exp − x→0+ xm x lim Démonstration. On a 1 1 exp − x→0+ xm x lim # 4 5# # 1 1 # ⇔ (∀! > 0)(∃δ > 0)(∀x ∈ ]0, δ]) : ## m exp − ## ≤ ! x x # # # ym # ym # ≤ ! ⇔ lim ⇔ (∀! > 0)(∃ρ > 0)(∀y ≥ ρ) : ## = 0. y→+∞ exp(y) exp(y) # En appliquant m fois de suite la règle de L’Hospital, on trouve lim y→+∞ ym my m−1 m! = lim = . . . = lim = 0. y→+∞ exp y exp y y→+∞ exp y Lemme. Pour chaque x > 0 et chaque entier m ≥ 1, c est m-fois dérivable en x et 4 5 4 5 1 1 (m) c (x) = P exp − , x x où P est un polynôme tel que P (0) = 0. Démonstration. Le résultat est vrai pour m = 1 puisque c$ (x) = 4 5 1 1 exp − . 2 x x 247 7.5. EXTRÉMANTS LOCAUX LIBRES Si, pour un entier 2 ≤ k ≤ m, on a c (k−1) (x) = P 4 5 4 5 1 1 exp − , x x avec P un polynôme tel que P (0) = 0, alors 2 c(k) (x) = − 1 $ P x2 4 5 1 1 + 2P x x 4 53 1 x 4 exp − 1 x 5 =Q 4 5 4 5 1 1 exp − , x x avec Q(y) = y 2 [P (y) − P $ (y)] un polynôme tel que Q(0) = 0. Lemme. Pour chaque m ∈ N∗ , c est m-fois dérivable en 0 et c(m)(0) = 0. Démonstration. Procédons par récurrence sur m. On a évidemment lim x→0− c(x) − c(0) = 0, x et, par le premier lemme, 4 c(x) − c(0) 1 1 = lim exp − x→0+ x→0+ x x x lim 5 = 0, ce qui montre que c$ (0) = 0. Supposons que, pour un entier k ≥ 2, on ait c(k−1) (0) = 0. Comme c est identiquement nulle sur ] − ∞, 0], on aura c(k−1) (x) = 0 pour tout x < 0, et dès lors c(k−1)(x) − c(k−1) (0) = 0. x→0− x lim D’ailleurs, par le lemme ci-dessus, on a, pour x > 0, c (k−1) (x) = P 4 5 4 1 1 exp − x x 5 pour un certain polynôme P tel que P (0) = 0, et dès lors, c(k−1) (x) − c(k−1)(0) 1 lim = lim P x→0+ x→0+ x x 4 5 4 1 1 exp − x x 5 = 0, en vertu du premier lemme. Donc c(k)(0) = 0, et le résultat s’en déduit. 248 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES En rassemblant les résultats des lemmes que nous venons de démontrer, on voit que la fonction de Cauchy c est une fonction indéfiniment dérivable sur R (ce qui entraı̂ne que chacune de ses dérivées est continue sur R) telle que, pour tout entier k ≥ 0, on a c(k)(0) = 0. Comme par ailleurs c(x) ≥ 0 pour tout x ∈ R, 0 est un minimant de cette fonction. Par ailleurs, 0 est un maximant pour la fonction −c, qui a aussi toutes ses dérivées nulles à l’origine. Enfin, il est facile de vérifier que la fonction d définie par d(x) = c(x) si x > 0, d(0) = 0 et d(x) = −c(x) si x < 0 a aussi toutes ses dérivées nulles en 0 mais 0 n’est pas un extrémant local libre de d. 7.6 Séries Soit f une fonction de R dans Rp et a ∈ dom f tel que f (k) (a) existe pour chaque entier k ≥ 1. Pour chaque h ∈ R fixé et chaque entier q ≥ 0, on peut q considérer la valeur en h Tf,a (h) du développement de Taylor d’ordre q de f 8 q en a. On obtient ainsi une suite Tf,a (h) 9 q∈N dans Rp et, a priori, les cinq possibilités 8 9suivantes peuvent se présenter : q 1. Tf,a(h) est divergente et a + h /∈ dom f − {a}. 2. 3. 9q∈N q Tf,a(h) 8 9q∈N q Tf,a (h) q∈N 8 est divergente et a + h ∈ dom f − {a}. est convergente, a + h ∈ dom f − {a} et q lim Tf,a (h) = f (a + h). q→∞ 8 q 4. Tf,a (h) 9 q∈N est convergente, a + h ∈ dom f − {a} et q lim Tf,a (h) /= f (a + h). q→∞ 8 q 5. Tf,a (h) 9 q∈N est convergente et a + h /∈ dom f − {a}. La situation 1 se présente pour la fonction f de R dans R définie par f (x) = q 1 1−x pour laquelle on a vu plus haut que, pour chaque q ∈ N, Tf,0 (h) = % q q k k=0 h . Dans ce cas, 1 /∈ dom f et Tf,0 (1) = q + 1. La situation 2 se présente pour la même fonction f au point −1 ∈ dom f puisque, pour chaque % q q ∈ N, on a Tf,0 (−1) = qk=0 (−1)k = 1 si q est pair et 0 si q est impair, 8 q ce qui entraı̂ne la divergence de la suite Tf,0 (−1) 9 q∈N . La situation 3 se 249 7.6. SÉRIES présente pour la même fonction f en chaque h ∈ ] − 1, 1[, puisque, en un tel point, on a, pour chaque q ∈ N, q f (h) = $ 1 hq+1 hk + = 1 − h k=0 1−h q = Tf,0(h) + ainsi qu’on l’a vu plus haut, et dès lors hq+1 , 1−h hq+1 = 0. q→0 1 − h q lim [f (h) − Tf,0 (h)] = lim q→∞ La situation 4 se présente pour la fonction de Cauchy c en a = 0 et h > 0. q En effet, on a vu que Tc,0 (h) = 0 pour tout h ∈ R, alors que c(h) /= 0 pour tout h > 0. La situation 5 se présente pour la fonction f de R dans R définie q x−1 par f (x) = |x−1| pour laquelle Tf,0 (h) = −1 pour tout q ∈ N et dès lors 8 q Tf,0 (1) 9 q∈N converge alors que 1 /∈ dom f. Pour trouver des conditions sur f sous lesquelles la situation83 se présente, 9 q il convient donc au prélable d’étudier la convergence de la suite Tf,a (h) . q∈N On voit que chaque élément de cette suite s’obtient à partir du précédent en ajoutant un terme : il s’agit donc d’une suite de sommes dont le nombre de terme augmente indéfiniment. De telles suites se sont présentées très tôt dans l’histoire des mathématiques en tant que détermination de la “somme d’une infinité de nombres réels”. Il s’agit là d’une opération impossible pour l’arithmétique ou l’algèbre, mais on peut, conformément à la philosophie de l’analyse, chercher à la réaliser de manière approchée avec une erreur aussi petite que l’on veut. Définition. Soit (ak )k∈N une suite dans Rp. Pour chaque q ∈ N, définissons % la q e somme partielle de (ak )k∈N par Aq = qk=0 ak . On appelle série de termes ak la suite (Aq )q∈N des sommes partielles de (ak )k∈N; on la note % k∈N ak pour rappeler son mode de construction en fonctions des données ak . % Exemples. 1. k∈N 1 est la suite (q + 1)q∈N, puisque, pour chaque q ∈ N, k=0 1 = q + 1. 8 9 % (−1)q +1 k 2. (−1) est la suite , puisque, pour chaque q ∈ N, k∈N 2 %q %q k=0 (−1) q∈N k = 1 si q est pair et 0 si q est impair. 250 3. CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES % k∈N k est la suite q(q+1) 2 . 8 9 q(q+1) 2 q∈N % 4. Pour chaque a ∈ C \ {1}, k∈N %q puisque, pour chaque q ∈ N, ak est la suite q+1 8 9 1−aq+1 , 1−a q∈N %q k=0 k = puisque, pour chaque q ∈ N, k=0 ak = 1−a 1−a . On l’appelle la série géométrique de raison a. 8 9 % 1 5. k∈N (k+1)(k+2) est la suite q+1 puisque, pour chaque q ∈ N, q+2 q∈N q $ q 4 $ 1 1 1 = − (k + 1)(k + 2) k + 1 k + 2 k=0 k=0 =1− 5 = q $ q+1 $ 1 1 − k + 1 k=1 k + 1 k=0 1 q+1 = . q+2 q+2 Définition. Si la suite (Aq )q∈N converge vers A ∈ Rp , dit que la série ou est convergente et a pour somme A. Dans ce cas, on k∈N ak converge %∞ % pose A = k=0 ak . Si la suite (Aq )q∈N diverge, on dit que la série k∈N ak diverge ou est divergente. % Le mot “somme” n’a évidemment plus ici l’acception courante; c’est tout simplement, si elle existe, la limite des sommes partielles Aq lorsque q tend vers l’infini. % % % Exemples. Les séries k∈N 1, k∈N (−1)k et k∈N k des exemples 1 à 3 sont % divergentes. La série géométrique k∈N ak de l’exemple 4 converge et a pour 1 somme 1−a lorsque |a| < 1, puisque, dans ce cas, aq → 0 lorsque q → ∞. % 1 Nous verrons plus loin qu’elle diverge si |a| ≥ 1. La série k∈N (k+1)(k+2) de l’exemple 5 converge et a pour somme 1. Les remarques suivantes sont des conséquences immédiates de la définition. % Remarques. 1. Soit k∈N ak une série dans Rp et, pour m ≥ 1 entier fixé, % soit k∈N am+k la série obtenue à partir de la précédente en laissant tomber ses m premiers termes a0 , a1 , . . . , am−1 . Comme les sommes partielles de même indice de ces deux séries diffèrent toutes de la quantité constante % Am−1 = m−1 deux séries convergent ou divergent k=0 ak , il est clair que les % % simultanément. Pour m = 1, la série k∈N a1+k est souvent notée k∈N∗ ak . % % 1 1 Ainsi, la série k∈N (k+1)(k+2) s’écrit également k∈N∗ k(k+1) . % 2. Par définition, la série k∈N ak est la suite (Aq )q∈N. Réciproquement, à % toute suite (bk )k∈N dans Rp on peut associer la série télescopique k∈N (bk − 251 7.6. SÉRIES bk−1 ) (avec la convention b−1 = 0) dont les sommes partielles q $ k=0 (bk − bk−1 ) = q $ k=0 bk − q−1 $ bk = bq k=0 redonnent les termes de la suite de départ. Les règles de calcul des limites et les règles de l’algèbre élémentaire fournissent immédiatement les règles de calcul suivantes des séries dans Rp . % % Proposition. Soient k∈N ak et k∈N bk des séries dans Rp et soit c ∈ R. % % 1. Si k∈N ak converge et a pour somme A et k∈N bk converge et a pour % somme B, alors k∈N (ak + bk ) converge et a pour somme A + B. % % 2. Si k∈N ak converge et a pour somme A, alors k∈N cak converge et a pour somme cA. % 3. a converge et a pour somme A si et seulement si les p séries réelles % k∈N k (a et ont pour sommes respectives Aj (1 ≤ j ≤ p). k∈N k )j convergent% % 4. Si les séries réelles k∈N ak et k∈N bk convergent respectivement vers A et B et sont telles que, pour chaque k ∈ N, on a ak ≤ bk , alors A ≤ B. Ces règles de calcul généralisent aux séries des règles de calcul élémentaires pour les sommes finies. Certaines règles de calcul des sommes finies, comme l’associativité ou la commutativité, ne s’étendent pas aux séries. % Ainsi, la série k∈N (−1)k est divergente (on l’a vu plus haut), alors que la série qui s’en déduit en groupant deux à deux les termes consécutifs est la série de termes nuls, qui est évidemment convergente. Nous donnerons plus loin une classe de séries que l’on peut faire converger vers n’importe quel réel en permutant les termes. On dispose d’une condition nécessaire de convergence d’une série facile à vérifier. Proposition. Si la série (ak )k∈N a pour limite zéro. % k∈N ak converge, alors la suite de ses termes Démonstration. Soit A la somme de la série q ∈ N∗ , on a aq = q $ k=0 et dès lors ak − q−1 $ k=0 % k∈N ak . ak = Aq − Aq−1 , lim aq = lim Aq − lim Aq−1 = A − A = 0. q→∞ q→∞ q→∞ Pour chaque 252 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Cette condition n’est pas suffisante pour la convergence d’une série. Ainsi, la suite des termes de la série $ k∈N 1 1 (k + 1) 2 tend vers zéro mais, pour chaque q ∈ N, on a q $ k=0 1 (k + 1) ≥ 1 2 q $ k=0 1 1 (q + 1) 1 2 = (q + 1) 2 , et la suite des sommes partielles diverge. La forme contraposée de cette condition nécessaire fournit un moyen aisé de vérification de la divergence de certaines séries. Ainsi, lorsque |a| ≥ 1, la série géométrique de raison a diverge puisque la suite de ses termes (ak )k∈N ne converge pas vers zéro en vertu du fait que (|ak |)k∈N = (|a|k )k∈N ne converge pas vers zéro. Le critère de Cauchy de convergence d’une suite fournit immédiatement le critère de Cauchy de convergence d’une série. Proposition. La série dans Rp % k∈N ak converge si et seulement si # # # $ # # r # (∀! > 0)(∃m ∈ N)(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : ## ak ## ≤ !. #k=q+1 # 2 % Démonstration. La convergence de la série k∈N ak équivaut, par définition, à la convergence de la suite (Aq )k∈N de ses sommes partielles. En appliquant le critère de Cauchy à cette suite et en notant qu’on peut toujours, sans perte de généralité, y supposer que r > q, on trouve que (Aq )k∈N converge si et seulement si (∀! > 0)(∃m ∈ N)(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : |Ar − Aq |2 ≤ !, ce qui fournit la thèse puisque Ar − Aq = r $ k=0 ak − q $ k=0 % ak = r $ ak . k=q+1 % 1 Exemples. 1. La série harmonique k∈N k+1 = k∈N∗ En effet, par le critère de Cauchy, il suffit de montrer que 1 k (∃! > 0)(∀m ∈ N)(∃q ∈ N : q ≥ m)(∃r ∈ N : r > q ≥ m) : est divergente. r $ 1 k=q+1 k > !. 253 7.7. SÉRIES ABSOLUMENT CONVERGENTES En prenant, pour chaque m ∈ N∗ , q = m et r = 2m, on a 2m $ k=m+1 2m $ 1 1 m 1 1 ≥ = = > , k k=m+1 2m 2m 2 4 et la négation du critère de Cauchy est satisfaite pour ! = 14 . % k 2. La série harmonique alternée k∈N (−1) k+1 = gente. En effet, pour tout entier q > r, on a # # # $ # # r (−1)k # # # # # #k=q+1 k + 1 # % k∈N∗ (−1)k−1 k est conver- # # #r−q−1 r−q−1 j ## $ # $ (−1) (−1)j #= = ## . # q+1+j # j=0 q + 1 + j # j=0 Dès lors, si r − q est impair, on a # # # r # 5 (r−q−1)/2 4 $ # $ (−1)k # 1 1 1 # #= 1 − ≤ − , # # q+1 q + 2l q + 2l + 1 q + 1 #k=q+1 k + 1 # l=0 et, si r − q est pair, on a # # # r # 5 (r−q−2)/2 4 $ # $ (−1)k # 1 1 1 1 # #= 1 − − ≤ − . # # k + 1 q + 1 q + 2l q + 2l + 1 r q + 1 #k=q+1 # l=0 Dès lors, si ! > 0 est donné, il suffit de prendre m ≥ condition de Cauchy soit satisfaite. 7.7 1 ! − 1 pour que la Séries absolument convergentes Le critère de Cauchy fournit une importante condition suffisante de convergence d’une série dans Rp . % Proposition. Soit k∈N ak une série dans Rp . Si, pour j = 1, 2 ou ∞, la % % série à termes positifs k∈N |ak |j converge, alors k∈N ak converge et #∞ # ∞ #$ # $ # # ak # ≤ |ak |j . # # # k=0 j k=0 254 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES % Démonstration. Il suffit de vérifier que k∈N ak vérifie le critère de Cauchy. Pour tout r > q dans N, on a, si j = 1, 2 ou ∞, en vertu de l’inégalité triangulaire, # # # r # r $ # $ # # ak ## ≤ |aj |j . # #k=q+1 # k=q+1 j D’autre part, en vertu du critère de Cauchy de convergence de si ! > 0 est donné, il existe m ∈ N tel que (∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : r $ k=q+1 % k∈N |ak |j , |ak |j ≤ !, ce qui entraı̂ne aussitôt, par l’inégalité précédente, que # # # r # # $ # # (∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : # ak ## ≤ !. #k=q+1 # j % Donc k∈N ak converge et, en faisant tendre r vers l’infini dans l’inégalité ci-dessus, on trouve facilement #∞ # ∞ #$ # $ # # ak # ≤ |ak |j . # # # k=0 j k=0 % Remarque. Nous montrerons plus loin que la série k∈N ak peut converger % sans que k∈N |ak |j converge. La condition ci-dessus n’est donc pas une condition nécessaire de convergence. On est ainsi conduit à séparer les séries % convergentes en deux classes, selon que k∈N |ak |j converge ou diverge. % % Définition. Soit k∈N ak une série dans Rp. On dit que k∈N ak con% verge absolument ou est absolument convergente si k∈N |ak |2 converge. Si % % % k∈N ak converge et que k∈N |ak |2 diverge, on dit que k∈N ak converge non absolument ou converge simplement. Remarque. En utilisant les inégalités entre normes et le critère de Cauchy, on vérifie sans peine que la définition de convergence absolue est indépendante du choix particulier de la norme | · |2 . Exemples. 1. Toute série convergente à termes positifs est évidemment absolument convergente. 255 7.7. SÉRIES ABSOLUMENT CONVERGENTES % k 2. La série harmonique alternée k∈N (−1) k+1 est convergente mais la série de % 1 ses valeurs absolues k∈N k+1 est la série harmonique qui est divergente. La série harmonique alternée converge donc non absolument. La convergence d’une série absolument convergente et la valeur de sa somme ne dépendent pas de l’ordre dans lequel on prend les termes. % Proposition. Soit k∈N ak une série dans Rp absolument convergente et % soit b : N → N une bijection. Alors la série k∈N ab(k) converge vers la même somme. % Démonstration. Soit ! > 0; par le critère de Cauchy appliqué à la série k∈N |ak |2 , il existe m ∈ N tel que (∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : r $ k=q+1 |ak |2 ≤ ! . 2 Choissons M ∈ N tel que {0, 1, . . ., m} ⊂ {b(0), b(1), . . ., b(M )} (par exemple M = max{b−1 (j) : 1 ≤ j ≤ m}). Pour tout entier q ≥ M, l’expression q $ k=0 ak − q $ ab(k) k=0 ne contiendra pas les termes a0 , a1 , . . . , am (puisqu’ils sont communs aux deux sommes), et dès lors, si q ≥ M , # q # q #$ # $ # # ak − ab(k) # ≤ # # # k=0 k=0 2 q $ k=m+1 On en déduit que lim q→∞ et donc que % k∈N ab(k) |ak |2 + & Aq − $ {1≤k≤q : b(k)>m} q $ ab(k) k=0 converge vers %∞ k=0 ' |ab(k) |2 ≤ ! ! + = !. 2 2 = 0, ak . La convergence absolue d’une série dans Rp revient à l’étude de la convergence d’une série à termes positifs. On possède une intéressante condition nécessaire et suffisante de convergence d’une série à termes positifs. 256 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES % % Proposition. Soit k∈N ak une série à termes positifs. Alors k∈N ak converge si et seulement si la suite (Aq )q∈N de ses sommes partielles est majorée, auquel cas ∞ $ ak = sup Aq . q∈N k=0 Démonstration. Pour chaque q ∈ N, on a Aq+1 = Aq + aq+1 ≥ Aq , ce qui montre que (Aq )q∈N est croissante. La thèse résulte alors de la condition nécessaire et suffisante de convergence d’une suite croissante vue au chapitre précédent. Remarque. La Proposition précédente montre que si l’on regroupe d’une façon arbitraire les termes d’une série absolument convergente, on obtient encore une série absolument convergente. % % 1 1 Exemple. La série k∈N (k+1) 2 = k∈N∗ k2 est convergente. En effet, pour chaque q ∈ N, on a q $ q q 4 $ $ 1 1 1 1 ≤ 1 + = 1 + − 2 (k + 1) k(k + 1) k k + 1 k=0 k=1 k=1 5 = 1+1− 1 ≤2 q +1 et la suite des sommes partielles est majorée par 2. La condition précédente fournit une utile condition suffisante de convergence absolue. % Proposition. Soit k∈N ak une série dans Rp . S’il existe un entier m ≥ 0 tel que, pour tout k ≥ m, on ait 1 |ak+1 |2 ≤ |ak |2 , 2 % alors k∈N ak converge absolument. Démonstration. Si k ≥ 0, on a 1 |am+k |2 ≤ |am+k−1 |2 ≤ . . . ≤ 2 et dès lors, pour tout q ∈ N, on a q $ k=0 |am+k |2 ≤ |am |2 q 4 5k $ 1 k=0 2 = |am |2 4 5k 1 2 1− |am |2 , 8 9q+1 1 2 1− 1 2 ≤ 2|am |2 , % ce qui montre que la suite des sommes partielles de la série k∈N |am+k |2 % est majorée. Donc k∈N am+k converge absolument et il en est de même de % k∈N ak . 257 7.8. SÉRIES NON ABSOLUMENT CONVERGENTES % k Exemple. Pour chaque z ∈ C, la série exponentielle de z k∈N zk! (ainsi appelée parce que, pour z réel, ses sommes partielles sont les valeurs en z des développements de Taylor en 0 d’ordres successifs de la fonction exponentielle) converge absolument. En effet, pour tout k ∈ N, on a # # # z k+1 # |z|k+1 |z| |z|k 1 # # = ≤ # #= # (k + 1)! # (k + 1)! k + 1 k! 2 dès que k ≥ 2|z| − 1. 7.8 Soit # # # zk # # # # # # k! # Séries non absolument convergentes % k∈N ak une série réelle. Pour chaque k ∈ N, posons a+ k = max{ak , 0} = |ak | + ak , 2 a− k = max{−ak , 0} = − min{ak , 0} = |ak | − ak . 2 − Il en résulte aussitôt que, pour chaque k ∈ N, on a ak = a+ k − ak et |ak | = − + a+ k + ak . La suite (ak )k∈N constitue donc la suite des termes positifs de (ak )k∈N et la suite formée des a− k non nuls constitue la suite des opposés des termes strictement négatifs de (ak )k∈N . On a une intéressante condition nécessaire de convergence non absolue d’une série réelle. Proposition. Si la série réelle % + − k∈N ak et k∈N ak divergent. % % k∈N ak converge non absolument, alors % Démonstration. Si, par exemple, k∈N a+ (l’autre cas se traik converge % − + tant de même), alors, comme ak = ak − ak , la série k∈N a− k converge et, % − puisque |ak | = a+ + a , il en sera de même de |a |, en contradiction k k∈N k k avec l’hypothèse. La propriété précédente permet de montrer qu’on peut faire diverger une série réelle non absolument convergente en permutant l’ordre de ses termes. % Proposition. Si la série réelle k∈N ak converge non absolument, alors il % existe une permutation b : N → N telle que k∈N ab(k) diverge. Démonstration. Par la Proposition précédente, les séries à termes posi% % − tifs k∈N a+ lors, par la caractérisation donnée k∈N ak divergent et dès k et % %q − avant, les suites de sommes partielles ( qk=0 a+ k )q∈N et ( k=0 ak )q∈N ne sont 258 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES pas majorées. Effectuons la permutation suivante des termes ak de la série; retenons d’abord, dans l’ordre des indices, les termes positifs jusqu’à ce que leur somme soit supérieure ou égale à 1; prenons alors le premier terme strictement négatif; retenons alors, toujours dans l’ordre des indices, suffisamment de termes positifs non encore utilisés pour que leur somme soit supérieure ou égale à 2; prenons alors le deuxième termes strictement négatif, et continuons de la sorte. On obtient ainsi une permutation b : N → N telle % que la suite des sommes partielles ( qk=0 ab(k) )q∈N contient une sous-suite dont le ke terme est supérieur à k, ce qui entraı̂ne sa divergence. Remarques. 1. Un raffinement du raisonnement précédent a été utilisé dans un travail de Bernhard Riemann publié en 1868 pour montrer que, si % alors, pour chaque k∈N ak est une suite réelle qui converge non absolument, % A ∈ R, il existe une permutation b : N → N telle que k∈N ab(k) converge vers A. Il suffit de remplacer, dans la démonstration précédente, 1, 2, . . . par A et de tenir compte du fait que la suite des ak converge vers zéro. 2. En rapprochant le résultat précédent de la propriété de conservation de convergence d’une série absolument convergente après permutation de ses termes, on voit qu’une série réelle est absolument convergente si et seulement si toute série obtenue en permutant ses termes est convergente. 7.9 Série de Taylor Soit f une fonction de R dans Rp et a ∈ dom f tel que f (k) (a) existe pour chaque k ∈ N, et soit h ∈ R. Définition. On appelle valeur en h de la série de Taylor de f en a, la série dans Rp $ f (k) (a) hk , k! k∈N c’est-à-dire la série dont les sommes partielles sont les valeurs en h des q développements de Taylor Tf,a . On a vu précédemment que cette série pouvait être convergente ou divergente, et, dans le cas de la convergence, sa somme pouvait être égale à f (a + h) ou différente de f (a + h). La formule du reste de Lagrange va nous permettre de donner une condition suffisante de convergence de la série de Taylor d’une fonction réelle vers cette fonction. Proposition. Soit f une fonction de R dans R, a ∈ dom f et r > 0, C ≥ 0, M ≥ 0 tels que f (k) (x) existe pour chaque k ∈ N et chaque x ∈ ]a − r, a + r[ 259 7.9. SÉRIE DE TAYLOR et y vérifie l’inégalité |f (k) (x)| ≤ CM k . Alors, pour chaque h ∈ ] − r, r[, la valeur en h de la série de Taylor de f en a $ hk k∈N converge vers f (a + h). En outre, % f (k) (a) k! k∈N hk f (k) (a) k! converge absolument. Démonstration. Par la formule de Lagrange du reste du développement de Taylor de f en a, on a, pour chaque q ∈ N et chaque h ∈ ] − r, r[, f (a + h) − q $ hk k=0 f (k) (a) hq+1 f (q+1) (a + θq h) = , k! (q + 1)! pour un certain θq ∈ ]0, 1[. En conséquence, on a # # q # (k) $ (a) ## (M |h|)q+1 (M r)q+1 # kf h ≤C , #f (a + h) − #≤C # k! # (q + 1)! (q + 1)! k=0 et, puisque la série exponentielle tend vers zéro et % k∈N hk f (k) (a) k! r > q, on a % kf k∈N h (k) (a) k! % k∈N (M r)k k! converge, la suite de ses termes converge vers f (a + h). Pour montrer que converge absolument, il suffit de noter que, pour tout entier r $ k=q+1 |h|k r $ |f (k) (a)| (M r)k ≤C , k! k! k=q+1 et que, si ! > 0 est donné, la convergence absolue de la série exponentielle entraı̂ne l’existence d’un entier positif m tel que le second membre soit inférieur à ! si r > q ≥ m. Exemple. Puisque, r > 0 étant donné, on a, pour tout x ∈ ] − r, r[ et tout entier k ≥ 0, (exp)(k) (x) = exp x ≤ exp r, on peut prendre C = exp r et M = 0 dans la Proposition précédente et en conclure que, pour tout h ∈ ] − r, r[, exp h = ∞ $ hk k=0 k! . Comme r est arbitraire, cette égalité entre la valeur en h de la fonction exponentielle et la somme de la série exponentielle de h est valable pour tout h ∈ R. 260 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Définition. Soit f une fonction de R dans R, a ∈ int dom f , tels que, pour chaque k ∈ N, f (k) (a) existe. On dit que f est analytique en a s’il existe r > 0 tel que ]a − r, a + r[ ⊂ dom f et tel que, pour tout h ∈ ] − r, r[, on ait f (a + h) = ∞ $ hk k=0 f (k) (a) . k! Ainsi, la fonction exponentielle est analytique en chaque point de R, mais la fonction de Cauchy n’est pas analytique en 0. 7.10 Fonctions trigonométriques Pour chaque x ∈ R, considérons les séries $ (−1)k x2k+1 k∈N et (2k + 1)! $ (−1)k x2k k∈N (2k)! . Puisque, pour tout k ∈ N, on a et # # # # # (−1)k+1 x2(k+1)+1 # # (−1)k x2k+1 # |x|2 # # # # # #= # #, # (2(k + 1) + 1)! # # (2k + 2)(2k + 3) (2k + 1)! # # # # # # (−1)k+1 x2(k+1) # # (−1)k x2k # |x|2 # # # # # #= # #, # (2(k + 1)! # (2k + 1)(2k + 2) # (2k)! # et qu’il existe un entier positif m tel que |x|2 |x|2 1 ≤ ≤ (2k + 2)(2k + 3) (2k + 1)(2k + 2) 2 pour tout entier k ≥ m, on peut appliquer une condition suffisante donnée plus haut pour conclure à la convergence absolue de ses deux séries. On pose alors ∞ $ (−1)k x2k+1 sin x = , (2k + 1)! k=0 261 7.10. FONCTIONS TRIGONOMÉTRIQUES et cos x = ∞ $ (−1)k x2k k=0 (2k)! , ce qui définit respectivement sur R l’application sinus et l’application cosinus, qui sont les fonctions trigonométriques fondamentales. En particulier, on a sin 0 = 0 et cos 0 = 1, et, pour chaque x ∈ R, sin(−x) = − sin x, cos(−x) = cos x. Proposition. Pour chaque x ∈ R, sin et cos sont dérivables en x et (sin)$ (x) = cos x, (cos)$ (x) = − sin x. Démonstration. Soit x ∈ R et q ∈ N; considérons, pour fixer les idées, le cas de sin, l’autre se traitant de manière similaire. Posons, pour chaque x ∈ R et chaque q ∈ N∗ , Sq (x) = q $ (−1)k x2k+1 k=0 et Cq (x) = q $ (−1)k x2k k=0 Un calcul simple montre que (2k + 1)! (2k)! , . Sq$ (x) = Cq (x), Sq$$(x) = −Sq−1 (x). Par la formule de Lagrange du reste du développement de Taylor, il existe, pour chaque h ∈ R, et chaque q ∈ N∗ , un θq ∈ ]0, 1[ tel que Sq (x + h) − Sq (x) = hSq$ (x) + h2 $$ S (x + θq h), 2! q et dès lors tel que, si h /= 0, Sq (x + h) − Sq (x) h = Cq (x) − Sq−1 (x + θq h). h 2 On a lim q→∞ Sq (x + h) − Sq (x) sin(x + h) − sin x = , h h 262 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES et lim Cq (x) = cos x, q→∞ ce qui entraı̂ne que, pour chaque h /= 0, L(x, h) = lim q→∞ 4 5 1 sin(x + h) − sin x cos x − Sq−1 (x + θq h) = − . 2 h2 h D’autre part, pour chaque q ∈ N∗ et chaque h tel que |h| ≤ 1, on a |Sq−1 (x + θq h)| ≤ q−1 $ 2q−1 $ (|x| + 1)j (|x| + |h|)|2k+1 ≤ ≤ exp(|x| + 1), (2k + 1)! j! j=0 k=0 et dès lors, pour ces mêmes valeurs de h, on a |L(x, h)| ≤ exp(|x| + 1). En conséquence, pour tout 0 < |h| ≤ 1, on a # # # sin(x + h) − sin x # # # = |hL(x, h)| ≤ |h| exp(|x| + 1), − cos x # # h ce qui montre que sin(x + h) − sin x = cos x. h→0 h lim Les résultats suivants sont des conséquences de la proposition précédente. Les deux premiers sont immédiats. Corollaire. sin et cos sont continues en chaque x ∈ R. Corollaire. Pour chaque x ∈ R et chaque entier k ≥ 1, sin(k) (x) et cos(k) (x) existent et, si l ∈ N∗ , (sin)(2l)(x) = (−1)l sin x, (sin)(2l−1)(x) = (−1)l−1 cos x, (cos)(2l)(x) = (−1)l cos x, (cos)(2l−1)(x) = (−1)l sin x, et les fonctions sin et cos sont analytiques en chaque point de R. 7.10. FONCTIONS TRIGONOMÉTRIQUES 263 Corollaire. Pour tout x ∈ R, on a sin2 x + cos2 x = 1. Démonstration. Définissons l’application f de R dans R par f (x) = sin x + cos2 x (avec sin2 x = (sin x)2 , cos2 x = (cos x)2 ). f est évidemment dérivable en chaque point x ∈ R et 2 f $ (x) = 2 sin x cos x − 2 cos x sin x = 0. En conséquence, f est constante sur R et, en particulier, pour tout x ∈ R, on a f (x) = f (0) = 1. Ce Corollaire entraı̂ne en particulier que, pour tout x ∈ R, on a | sin x| ≤ 1, | cos x| ≤ 1. Corollaire. Pour tout x ∈ R et tout y ∈ R, on a sin(x + y) = sin x cos y + cos x sin y, cos(x + y) = cos x cos y − sin x sin y. Démonstration. y ∈ R étant fixé, définissons l’application f de R dans R par f (x) = [sin(x+y)−sin x cos y −cos x sin y]2 +[cos(x+y)−cos x cos y +sin x sin y]2 . Cette fonction est évidemment dérivable en tout x ∈ R, et l’on a f $ (x) = 2[sin(x + y) − sin x cos y − cos x sin y][cos(x + y) − cos x cos y + sin x sin y] +2[cos(x + y) − cos x cos y + sin x sin y][− sin(x + y) + sin x cos y + cos x sin y] = 0. Donc f est constante sur R, et en particulier, pour tout x ∈ R, on a f (x) = f (−y) = (0 + sin y cos y − cos y sin y)2 + (1 − cos2 y − sin2 y) = 0, ce qui entraı̂ne aussitôt la thèse. 264 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Ce dernier résultat est appelé la formule d’addition pour les fonctions trigonométriques. Etudions maintenant les zéros des fonctions trigonométriques. Proposition. Il existe un réel π > 0 tel que cos x = 0 ⇔ x = π + kπ, (k ∈ Z), 2 sin x = 0 ⇔ x = kπ, (k ∈ Z), sin(x + π) = − sin x, cos(x + π) = − cos x, (x ∈ R). Démonstration. On sait que cos 0 = 1 > 0. D’autre part, en utilisant la formule du reste de Lagrange du développement de Taylor, pour chaque x ∈ R, il existe θ ∈ ]0, 1[ tel que cos x = 1 − x 2 x4 + cos θx, 2! 4! et dès lors 2 1 cos 2θ ≤ − < 0. 3 3 Le théorème de Bolzano entraı̂ne alors l’existence d’au moins un zéro dans ]0, 2[. L’ensemble Z de ces zéros est fermé, car si (ak )k∈N est une suite dans Z convergeant vers a∗ ∈ R, alors a∗ ∈ [0, 2], et les relations cos 2 = 1 − 2 + cos ak = 0, (k ∈ N), et la continuité de cos entraı̂nent que cos a∗ = 0, et donc a∗ ∈ Z. Par ailleurs, si a ∈ [0, 2] est un zéro de cos, alors (cos)$ (a) = − sin a = ±1, et, par continuité, il existe δ(a) > 0 tel que (cos)$ (x) /= 0 pour tout x ∈ [a − δ(a), a + δ(a)]. En conséquence, cos est injective sur [a − δ(a), a + δ(a)] et a est donc le seul zéro de cos dans [a − δ(a), a + δ(a)]. Le lemme de Cousin appliqué à Z et à la jauge δ entraı̂ne l’existence d’une famille finie A j j B (a , Z ) 1≤j≤m telle que Z= m > j=1 Z j , aj ∈ Z j ⊂ [aj − δ(aj ), aj + δ(aj )], (1 ≤ j ≤ m). Il en résulte que cos possède m zéros sur [0, 2]. Désignons par π2 le plus petit zéro de cos appartenant à ]0, 2[. Comme cos 0 = 1 > 0, on a, par le théorème de Bolzano, cos x > 0 pour tout x ∈ [0, π2 [, et donc pour tout 265 7.10. FONCTIONS TRIGONOMÉTRIQUES x ∈ ] − π2 , π2 [ puisque cos(−x) = cos x. Il en résulte que la fonction sin est strictement croissante sur ] − π2 , π2 [, et donc strictement négative sur ] − π2 , 0[ et strictement positive sur ]0, π2 [, puisque sin 0 = 0. En conséquence, comme sin2 π2 = 1, on doit avoir 4 − sin − π 2 5 = sin π = 1. 2 La formule d’addition entraı̂ne alors que, pour tout x ∈ R, on a 4 cos x + π 2 5 = − sin x, 4 sin x + π 2 5 = cos x, (x ∈ R) 3π ce qui montre que cos x < 0 pour tout x ∈ ] π2 , 3π 2 [, cos 2 = 0, sin x > 0 pour π tout x ∈ ] 2 , π[ et que sin π = 0. On déduit alors de la formule ci-dessus que, pour tout x ∈ R, on a 4 π π sin(x + π) = sin x + + 2 2 4 cos(x + π) = cos x + π π + 2 2 5 5 4 π = cos x + 2 4 = − sin x + 5 π 2 = − sin x, 5 = − cos x, ce qui, combiné avec les propriétés de sin sur [−π, π] et de cos sur [− π2 , π2 ], achève la démonstration. Remarques. 1. Le résultat précédent entraı̂ne évidemment que, pour tout x ∈ R, on a sin(x + 2π) = sin x, cos(x + 2π) = cos x, c’est-à-dire que les fonctions trigonométriques sont périodiques de période 2π. 2. Le réel π ainsi introduit se rencontre dans de très nombreuses questions de mathématique. Johann Lambert a montré en 1767 que π était irrationnel, Adrien-Marie Legendre a montré en 1794 que π 2 l’était aussi. Il a fallu attendre 1882 pour que Ferdinand Lindemann prouve que π était un nombre transcendant, c’est-à-dire qu’il n’était pas racine d’une équation algébrique à coefficients entiers, prouvant ainsi l’impossibilité de la quadrature du cercle. 3. Le calcul des décimales de π peut servir de mesure du progrès des mathématiques et de la science du calcul. Le Livre des Rois de l’Ancien Testament fournit π = 3, Archimède, au 3e siècle avant J.C. fournit 3 décimales exactes π = 3, 141 . . .. 266 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES En 1593, le record était détenu par un professeur de l’Université de Louvain, Adriaen van Roomen ou Romain, avec 15 décimales exactes. En 1873-74, William Shanks calcula 707 décimales de π et il fallut attendre 1945 pour que D.F. Ferguson montre que le calcul de Shanks était faux à partir de la 528e décimale. On entre alors dans l’ère du calcul des décimales de π à l’aide des ordinateurs. On en connaı̂t actuellement plus d’un milliard (la milliardième décimale de π est un 9). Nous nous contenterons ici de donner l’approximation plus modeste π = 3, 14159265358979323846264338327950288419716939937510 . . .. Comme sin est strictement croissante sur l’intervalle ] − π2 , π2 [, avec pour limites respectives −1 et 1 lorsque x tend vers − π2 et vers π2 , elle possède une fonction réciproque, appelée l’arc sinus, notée arcsin et définie sur ] − 1, 1[. Par les résultats sur les fonctions monotones, arc sin sera dérivable en chaque point x ∈ ] − 1, 1[, et 1 (arcsin)$ (x) = = (sin)$ (arcsin x) 1 cos(arcsin x) = 1 1 = . 1/2 (1 − sin (arcsin x)) (1 − x2 )1/2 2 De même, cos étant strictement décroissante sur l’intervalle ]0, π[, avec pour limites respectives 1 et −1 lorsque x tend vers 0 et vers π, elle possède une fonction réciproque, appelée l’arc cosinus, notée arcos et définie sur ] − 1, 1[. Elle est dérivable en chaque x ∈ ] − 1, 1[, et (arcos)$ (x) = =− 1 1 =− (cos)$ (arcos x) sin(arcos x) 1 (1 − cos2 (arcos x))1/2 =− Comme, pour tout x ∈ ] − 1, 1[, on a 1 . (1 − x2 )1/2 (arcsin)$ (x) + (arcos)$ (x) = 0, et que arcsin 0 + arcos 0 = on aura, pour tout x ∈ ] − 1, 1[, arcsin x + arcos x = π , 2 π . 2 267 7.11. EXPONENTIELLES IMAGINAIRES ET COMPLEXES A partir des fonctions sinus et cosinus, on définit la fonction tangente par tg x = sin x . cos x En conséquence, dom tg = {x ∈ R : x /= π + kπ, (k ∈ Z)}, 2 et, pour chaque x ∈ dom tg, on a 1 , cos2 x Il en résulte en particulier que tg est strictement croissante sur ] − π2 , π2 [, avec comme limites respectives −∞ et +∞ lorsque x tend vers − π2 et vers π2 . On peut donc définir sa fonction réciproque, appelée l’arc tangente et notée arctg, sur R, et l’on aura tg (x + π) = tg x, (tg)$ (x) = (arctg)$ (x) = 1 = cos2 (arctg x) (tg)$ (arctg x) 1 , 1 + x2 puisque, pour tout x ∈ dom tg, on a = cos2 x = 7.11 cos2 x 1 = . 2 2 1 + tg 2 x sin x + cos x Exponentielles imaginaires et complexes Il existe une relation remarquable entre les fonctions trigonométriques et la série exponentielle. Proposition. Pour tout x ∈ R, on a ∞ $ (ix)k k=0 k! = cos x + i sin x. Démonstration. On a, en effet, pour tout x ∈ R, puisque i2k = (−1)k et que l’on peut permuter l’ordre des termes dans les séries absolument convergentes, cos x + i sin x = ∞ $ (ix)2j j=0 (2j)! + ∞ $ (ix)2j+1 j=0 (2j + 1)! = ∞ $ (ix)k k=0 k! . 268 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES On est ainsi conduit à définir l’application exponentielle imaginaire de R dans C par ∞ $ (ix)k exp ix = . k! k=0 Elle vérifie donc la relation exp ix = cos x + i sin x, pour tout x ∈ R. En particulier, on a, pour tout x ∈ R, | exp ix| = (cos2 x + sin2 x)1/2 = 1. La fonction exponentielle imaginaire vérifie une formule d’addition semblable à celle de l’exponentielle réelle. Proposition. Pour tout x ∈ R et tout y ∈ R, on a exp i(x + y) = (exp ix).(exp iy). Démonstration. On a, en utilisant la relation précédente et la formule d’addition des fonctions trigonométriques, (exp ix).(exp iy) = (cos x + i sin x)(cos y + i sin y) = cos x cos y − sin x sin y + i(sin x cos y + cos x sin y) = cos(x + y) + i sin(x + y) = exp i(x + y). En particulier, on a, pour tout entier n ≥ 1 et tout x ∈ R, exp(inx) = (exp ix)n , c’est-à-dire cos nx + i sin nx = (cos x + i sin x)n , C’est la formule de Moivre qui permet, en calculant le second membre par la formule du binôme de Newton et en égalant les parties réelles et imaginaires des deux membres, d’exprimer cos nx et sin nx en termes des puissances de sin x et cos x de degré inférieur ou égal à n. L’exponentielle imaginaire possède des propriétés de dérivation intéressantes. 7.11. EXPONENTIELLES IMAGINAIRES ET COMPLEXES 269 Proposition. exp(i·) est dérivable en chaque x ∈ R et D(exp ix) = i exp ix. Démonstration. On a D(exp ix) = D(cos x+i sin x) = − sin x+i cos x = i(cos x+i sin x) = i exp ix. On peut unifier la théorie des fonctions exponentielles et trigonométriques en introduisant de nouvelles fonctions élémentaires de R dans C, les exponentielles complexes. Définition. Soit a = b + ic ∈ C. L’exponentielle complexe exp(a·) est la fonction de R dans C définie, pour chaque x ∈ R par la formule exp ax = (exp bx).(exp icx) = (exp bx).(cos cx + i sin cx). Si a = b est réel, on retrouve l’exponentielle réelle exp(b·) et si a = ic est imaginaire pur, on retrouve le composé de la fonction réelle x 2→ cx avec la fonction exponentielle imaginaire. Nous allons voir que l’exponentielle complexe conserve les propriétés essentielles de l’exponentielle réelle. Proposition. Pour chaque x ∈ R et chaque entier k ≥ 1, exp(a·) est k-fois dérivable en x et l’on a D k [exp(ax)] = ak exp ax. En outre, pour tout x ∈ R, on a | exp ax| = exp bx, et en particulier exp ax /= 0 quel que soit x ∈ R. De plus, pour chaque x ∈ R et chaque y ∈ R, on a exp a(x + y) = (exp ax).(exp ay), ce qui entraı̂ne en particulier que, pour chaque x ∈ R, on a exp(−ax) = (exp ax)−1 . Enfin, pour chaque x ∈ R, on a exp ax = exp āx. 270 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Démonstration. Le fait que exp(a·) soit k fois dérivable en chaque x ∈ R résulte de ce que les fonctions élémentaires réelles exp, cos et sin sont indéfiniment dérivables et des règles de dérivabilité de la somme, du produit et du composé de deux fonctions. D’ailleurs, on a, pour chaque x ∈ R, D[exp(ax)] = (b exp bx). exp icx + (exp bx).(ic) exp icx = (b + ic)(exp bx)(exp icx) = a exp ax, et la formule pour les dérivées d’ordre supérieur s’en déduit aussitôt de proche en proche. En outre, on a | exp ax| = | exp bx|| exp icx| = exp bx, exp a(x + y) = [exp b(x + y)].[exp ic(x + y)] = (exp bx).(exp by).[(exp(icx)).(exp(icy))] = (exp bx).(exp(icx))(exp by).(exp(icy)) = (exp ax).(exp ay), Enfin, (exp ax).[exp(−ax)] = exp a(x − x) = exp 0 = 1. exp ax = (exp bx).(cos cx + i sin cx) = (exp bx).(cos cx − i sin cx) = exp āx. 7.12 Dérivées partielles d’ordre supérieur Soit f une fonction de Rn dans Rp dérivable en au moins un point intérieur à dom f. On peut alors lui associer la fonction df de Rn dans l’ensemble L(Rn , Rp) des applications linéaires de Rn dans Rp de domaine dom df = {x ∈ int dom f : f est dérivable en x}, définie par df (x) = fx$ . Cette fonction s’appelle la fonction différentielle ou la fonction dérivée totale de f et l’on voit que ce n’est plus une fonction de Rn dans Rp mais bien une fonction de Rn dans L(Rn , Rp). Nous ne considérerons pas ici le problème de la continuité et de la dérivabilité d’une telle fonction. Par contre, si j est un entier compris entre 1 et n et si la fonction f de Rn dans Rp est telle que la dérivée partielle Dj f (x) existe en au moins un 7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR 271 point x ∈ Rn , on peut lui associer, comme nous l’avons déjà fait à plusieurs reprises, la fonction Dj f : Rn → Rp, x 2→ Dj f (x), de domaine dom Dj f = {x ∈ dom f : Dj f (x) existe}. ∂f On la note également fj$ ou ∂x ou ∂j f. Si k est un entier compris entre 1 j et n et si la fonction Dj f possède elle-même en x ∈ dom Dj f une dérivée partielle Dk (Dj f )(x) par rapport à la ke variable, on peut définir la fonction dérivée partielle seconde de f par rapport à la j e et puis la ke variable par 2 2 Djk f : x 2→ Djk f (x) = Dk (Dj f )(x). Son domaine est donc l’ensemble des points du domaine de Dj f en lesquels cette fonction possède une dérivée partielle par rapport à la ke variable. 2 f , que l’on note aussi f $$ ou ∂ 2 f 2 Comme Djk jk ∂xk ∂xj ou ∂jk f est elle-même une fonction de Rn dans Rp , on peut évidemment continuer le processus et con3 f de f par rapsidérer, lorsqu’elle existe, la fonction dérivée troisième Dlkj e e e port à la j , puis la k , et puis la l variable, et ainsi de suite, et arriver ainsi, si m est un entier strictement positif et si j1 , j2 , . . ., jm sont des entiers compris entre 1 et n à la fonction dérivée me de f par rapport successivement e aux j1e , j2e , . . . , jm variables. Exemples. 1. Soit f l’application de R2 dans R définie par f (x) = f (x1 , x2 ) = x21 x2 . On a évidemment, pour chaque x = (x1 , x2 ) ∈ R2 , D1 f (x) = 2x1 x2 , D2 f (x) = x21 , et dès lors 2 2 2 2 D11 f (x) = 2x2 , D12 f (x) = 2x1 , D21 f (x) = 2x1 , D22 f (x) = 0, 3 3 3 3 D111 f (x) = 0, D112 f (x) = 2, D121 f (x) = 2, D122 f (x) = 0, 3 3 3 3 D211 f (x) = 2, D212 f (x) = 0, D221 f (x) = 0, D222 f (x) = 0, et dès lors toutes les fonctions dérivées partielles d’ordre supérieur ou égal à quatre seront nulles. On constate sur cet exemple que 2 2 3 3 3 D12 f = D21 f, D112 f = D121 f = D211 f, 272 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES 3 3 3 D122 f = D212 f = D221 f. 2. Soit f l’application de R2 dans R définie par f (0, 0) = 0 et f (x1 , x2 ) = x1 x2 x21 − x22 si (x1 , x2 ) /= (0, 0). x21 + x22 On calcule aisément que D1 f (0, x2 ) = −x2 si x2 /= 0, D1 f (0, 0) = 0, D2 f (x1 , 0) = x1 si x1 /= 0, D2 f (0, 0) = 0, et dès lors D1 f (0, h) − D1 f (0, 0) −h = lim = −1, h→0 h→0 h h 2 D12 f (0, 0) = lim 2 D21 f (0, 0) = lim h→0 D2 f (h, 0) − D2 f (0, 0) h = lim = 1. h→0 h h 2 f (0, 0) /= D 2 f (0, 0). On constate dans ce cas que D12 21 2 2 Ce dernier exemple montre que l’existence de D12 f (a) et D21 f (a) n’entraı̂ne pas leur égalité. Notons que D1 f (a1 , a2 + h2 ) − D1 f (a1 , a2 ) h2 →0 h2 2 D12 f (a) = lim 1 = lim h2 →0 h2 2 lim h1 →0 f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 ) h1 3 f (a1 + h1 , a2 ) − f (a1 , a2 ) = h1 →0 h1 − lim 2 f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 ) − f (a1 + h1 , a2 ) + f (a1 , a2 ) lim lim h2 →0 h1 →0 h1 h2 et que, de même, lim h1 →0 2 2 D21 f (a) = f (a1 + h1 , a2 + h2 ) − f (a1 + h1 , a2 ) − f (a1 , a2 + h2 ) + f (a1 , a2 ) h2 →0 h1 h2 lim 3 3 L’égalité des deux expressions revient donc à la possibilité de permuter l’ordre des limites d’une même fonction de deux variables, et cette permutation n’est assurée que si certaines conditions supplémentaires sont remplies. Un premier résultat dans cette direction est le théorème de Schwarz. 7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR 273 Théorème. Soit f une fonction de Rn dans Rp , 1 ≤ i /= j ≤ n des entiers, 2 f et D 2 f et V un voisinage de a ∈ Rn tels que les fonctions Di f, Dj f, Dij ji 2 2 soient définies sur V . Si Dij f et Dji f sont continues en a, alors 2 2 Dij f (a) = Dji f (a). Démonstration. En passant si nécessaire aux composantes de f, il suffit de démontrer le résultat lorsque p = 1. La thèse revient à démontrer que, pour tout ! > 0, on a 2 2 |Dij f (a) − Dji f (a)| ≤ !. Soit donc ! > 0; par hypothèse, il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel que, pour tout h ∈ R2 vérifiant |h|2 ≤ δ, on ait ! ! 2 2 2 2 |Dij f (a + h) − Dij f (a)| ≤ , |Dji f (a + h) − Dji f (a)| ≤ . 2 2 Si h = hi ei + hj ej ∈ B2 [δ], avec h1 /= 0 et h2 /= 0, on a, en appliquant deux fois le théorème de Lagrange, f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a) = [f (a + hi ei + hj ej ) − f (a + hi ei )] − [f (a + hj ej ) − f (a)] = hi Di [f (a + θi hi ei + hj ej ) − f (a + θi hi ei )] = hi [Di f (a + θi hi ei + hj ej ) − Dif (a + θi hi ei )] 2 = hi hj Dij f (a + θi hi ei + θj hj ej ), pour un certain θi ∈ ]0, 1[ et un certain θj ∈ ]0, 1[. De même, en groupant les termes différemment, f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a) = [f (a + hi ei + hj ej ) − f (a + hj ej )] − [f (a + hi ei ) − f (a)] = hj Dj [f (a + hi ei + θj$ hj ej ) − f (a + θj$ hj ej )] = hj [Dj f (a + hi ei + θj$ hj ej ) − Dj f (a + θj$ hj ej )] 2 = hj hi Dji f (a + θi$ hi ei + θj$ hj ej ), pour un certain θi$ ∈ ]0, 1[ et un certain θj$ ∈ ]0, 1[. Dès lors, 2 Dij f (a + θi hi ei + θj hj ej ) 274 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES = f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a) hi hj 2 = Dji f (a + θi$ hi ei + θj$ hj ej ), avec θi hi ei + θj hj ej ∈ B2 [δ], θi$ hi ei + θj$ hj ej ∈ B2 [δ]. En conséquence, on a 2 2 |Dij f (a) − Dji f (a)| 2 2 = |Dij f (a) − Dij f (a + θi hi ei + θj hj ej ) 2 2 +Dji f (a + θi$ hi ei + θj$ hj ej ) − Dji f (a)| 2 2 ≤ |Dij f (a) − Dij f (a + θi hi ei + θj hj ej )| 2 2 +|Dji f (a + θi$ hi ei + θj$ hj ej ) − Dji f (a)| ≤ ! ! + = !. 2 2 2 2 Une autre condition suffisante pour que Dij f (a) = Dji f (a) est donnée par le théorème de Young. Théorème. Soit f une fonction de Rn dans Rp , 1 ≤ i /= j ≤ n des entiers et V un voisinage de a ∈ Rn tels que les fonctions Di f et Dj f soient définies sur V et (totalement) dérivables en a. Alors 2 2 Dij f (a) = Dji f (a). Démonstration. Comme dans la démonstration du théorème de Schwarz, on introduit la fonction F de R2 dans Rp par F (hi , hj ) = f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a). L’idée consiste ici à montrer que 2 Dij f (a) = lim h→0 F (h, h) 2 = Dji f (a). h2 Soit ! > 0; par hypothèse, il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel que 2 2 |Dif (a + hi ei + hj ej ) − Di f (a) − hi Dii f (a) − hj Dij f (a)|2 275 7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR ! ≤ |(hi , hj )|2 , 2 2 2 |Dj f (a + hi ei + hj ej ) − Dj f (a) − hi Dji f (a) − hj Djj f (a)|2 ! ≤ |(hi , hj )|2 , 2 lorsque |(hi, hj )|2 ≤ δ. Si nous définissons la fonction G de R dans Rp par 2 G(u) = f (a + uei + hj ej ) − f (a + uej ) − uhj Dij f (a), nous pouvons lui appliquer l’inégalité de la moyenne entre 0 et h1 , qui fournit l’existence d’un θi ∈ ]0, 1[ tel que |G(hi) − G(0)|2 ≤ |hi ||G$ (θi hi )|2 , c’est-à-dire, en explicitant et en utilisant la première inégalité ci-dessus, 2 |F (hi , hj ) − hi hj Dij f (a)|2 2 ≤ |hi ||Dif (a + θi hi ei + hj ej ) − Di f (a + θi hi ei ) − hj Dij f (a)|2 2 2 ≤ |hi ||Dif (a + θi hi + hj ej ) − Di f (a) − θi hi Dii f (a) − hj Dij f (a)|2 2 +|hi ||Dif (a + θi hi ei ) − Di f (a) − θi hi Dii f (a)|2 ! ! ≤ |hi ||(θihi , hj )|2 + |hi ||(θi hi , 0)|2 2 2 ≤ !|(hi , hj )|22 . De même, en définissant la fonction H de R dans Rp par 2 H(v) = f (a + hi ei + vej ) − f (a + vej ) − hi vDji f (a), en lui appliquant l’inégalité de la moyenne entre 0 et hj , en explicitant et en utilisant la deuxième inégalité ci-dessus, on obtient 2 |F (hi , hj ) − hj hi Dji f (a)|2 ≤ !|(hi , hj )|22 , lorsque |(hi , hj )|2 ≤ δ. Dès lors, si h ∈ R est tel que 0 < |h| ≤ 0 < |(h, h)|2 ≤ δ, et dès lors c’est-à-dire # # # F (h, h) # 2 # # ≤ !, − D f (a) ij # h2 # 2 # # # F (h, h) # 2 # − Dji f (a)## ≤ !, # h2 2 F (h, h) 2 = Dji f (a). h→0 h2 2 Dij f (a) = lim δ , 21/2 on aura 276 Rp . CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Introduisons maintenant une classe importante de fonctions de Rn dans Définition. Soit f une fonction de Rn dans Rp , E un ouvert non vide de Rn et k ≥ 1 un entier. On dira que f est de classe C k sur E, et l’on écrira f ∈ C k (E; Rp), si f est continue sur E et si toutes les fonctions dérivées partielles de f jusqu’à l’ordre k Di1 f, Di21 i2 f, . . . , Dik1i2 ...ik f, (1 ≤ i1 , . . . , ik ≤ n) sont définies et continues sur E. On notera que si f ∈ C k (E; Rp), alors, pour chaque 1 ≤ j ≤ k, on a évidemment f ∈ C j (E; Rp); en outre, par la condition suffisante de dérivabilité en termes de la continuité des dérivées partielles, la fonction f et toutes les dérivées partielles de f jusqu’à l’ordre k − 1 seront dérivables en chaque point de E; enfin, pour chaque 1 ≤ j ≤ k, chaque dérivée partielle d’ordre j de f sera de classe C k−j sur E. On étend comme suit cette notion au cas où E n’est pas nécessairement ouvert. Définition. Soit f une fonction de Rn dans Rp, E une partie non vide de Rn et k ≥ 1 un entier. On dira que f est de classe C k sur E, et l’on écrira f ∈ C k (E; Rp), s’il existe un ouvert Ẽ ⊃ E et une fonction f˜ ∈ C k (Ẽ; Rp) telle que f˜|E = f. Lorsque f ∈ C k (E; Rp) pour tout entier k ≥ 1, on dit que f est indéfiniment continûment dérivable sur E, et l’on écrit f ∈ C ∞ (E; Rp). Par extension, si f est continue sur E, on dira qu’elle est de classe C 0 sur E, on écrira f ∈ C 0 (E; Rp), et on posera Dj0 f (a) = f (a). Le théorème de Schwarz ou le théorème de Young entraı̂nent, pour une fonction de classe C k (k ≥ 2), l’important théorème d’interversion des dérivées partielles. Théorème. Soit k ≥ 2 un entier et f une fonction de Rn dans Rp de classe C k sur un voisinage ouvert V de a ∈ Rn . Alors, pour tout 1 ≤ i1 , i2 , . . . , ik ≤ n et tout entier 1 ≤ j ≤ k − 1, on a Dik1 i2 ...ij ij+1 ...ik f (a) = Dik1 i2 ...ij+1 ij ...ik f (a). Démonstration. Elle se fait par récurrence sur l’ordre de dérivation. Le résultat est vrai pour k = 2 en vertu du théorème de Schwarz (ou de Young). Supposons maintenant le résultat vrai pour les fonctions de classe l − 1 sur 7.13. DÉVELOPPEMENT DE TAYLOR 277 V , avec 3 ≤ l ≤ k − 1, et montrons qu’il est vrai pour celles de classe l sur V . On a, si 1 ≤ j ≤ l − 2, Dil1 ...ij ij+1 ...il f (a) = Dil (Dil−1 f )(a) 1 ...ij ij+1 ...il−1 = Dil (Dil−1 f )(a) 1 ...ij+1 ij ...il−1 = Dil1 ...ij+1 ij ...il f (a), et, si j = l − 1, Dil1 ...il−1 il f (a) = Di2l−1 il (Dil−2 f )(a) 1 ...il−2 = Di2l il−1 (Dil−2 f )(a) = Dil1...il−2 il il−1 f (a). 1 ...il−2 En vertu de ce résultat, si k ≥ 1 est un entier, f est une fonction de classe C k sur l’ouvert E ⊂ Rn , a ∈ E, et si α = (α1 , α2 , . . . , αn ) ∈ Nn est tel que |α|1 = α1 + α2 + . . . + αn ≤ k, on posera, sans ambiguı̈té, Dα f (a) = ∂ αf (a) = D1α1 D2α2 . . . Dnαn f (a). Cette notation exprime que l’on dérive f α1 fois par rapport à x1 , α2 fois par rapport à x2 , . . . αn fois par rapport à xn . 7.13 Développement de Taylor On peut étendre la notion de développement de Taylor aux fonctions de Rn dans Rp . En passant si nécessaire aux composantes de la fonction, on peut toujours, sans perte de généralité, supposer que p = 1, ce que nous ferons. Nous aurons besoin de la conséquence élémentaire suivante du théorème de dérivation des fonctions composées. Lemme. Soit r > 0, a ∈ Rn et ϕ une fonction de Rn dans R dérivable en chaque point de B2 (a; r). Si, pour chaque h ∈ Rn tel que 0 < |h|2 < r, on définit l’application g par g : R → Rn , t 2→ a + th, alors ϕ ◦ g est dérivable en chaque t ∈ [0, 1], et (ϕ ◦ g)$ (t) = n $ j=1 hj (Dj ϕ ◦ g)(t). 278 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Démonstration. Par le théorème de dérivation des fonctions composées et le lien entre dérivées partielles et dérivée totale ϕ ◦ g est dérivable en t ∈ [0, 1], et (ϕ ◦ g)$ (t) = (ϕ ◦ g)$t(1) = [ϕ$g(t) ◦ gt$ ](1) = ϕg(t)(g $ (t)) = ϕg(t)(h) = n $ j=1 hj (Dj ϕ ◦ g)(t). Nous pouvons maintenant énoncer et démontrer le théorème du développement de Taylor d’ordre m pour une fonction de classe C m . Théorème. Soit m ≥ 1 un entier et f une fonction de Rn dans R de classe C m+1 sur un voisinage ouvert V de a ∈ Rn et soit h ∈ Rn tel que, pour tout t ∈ [0, 1], a + th ∈ V. Alors il existe θ ∈ ]0, 1[ tel que f (a + h) = f (a) + n $ hj1 Dj1 f (a) + j1 =1 n +...+ 1 2 n n $ 1 $ $ ... hj1 hj2 . . . hjm Djm1 j2 ...jm f (a) m! j =1 j =1 j =1 1 + n $ n 1 $ hj hj D 2 f (a) 2! j =1 j =1 1 2 j1 j2 n $ 1 (m + 1)! j n $ 1 =1 j2 =1 m 2 ... n $ hj1 hj2 . . . hjm+1 Djm+1 f (a + θh). 1 j2 ...jm+1 jm+1 =1 Démonstration. Si l’on définit l’application g de R dans Rn par g(t) = a + th, alors f (a + th) = (f ◦ g)(t) est dérivable en chaque point de [0, 1], et, par le lemme, (f ◦ g)$ (t) = n $ hj1 (Dj1 f ◦ g)(t). n $ hj1 (Dj1 f ◦ g)$(t) j1 =1 Comme les fonctions Dj1 f sont dérivables en chaque point de V , on peut aussi leur appliquer le lemme, et dès lors (f ◦ g)$ est dérivable en chaque point de [0, 1], et (f ◦ g)$$(t) = = n $ j1 =1 hj1 n $ j2 =1 j1 =1 hj2 (Dj21 j2 f ◦ g)(t) = n $ n $ j1 =1 j2 =1 hj1 hj2 (Dj21 j2 f ◦ g)(t). 279 7.13. DÉVELOPPEMENT DE TAYLOR En continuant de la sorte, on trouve que, pour chaque 1 ≤ k ≤ m + 1, f ◦ g est k-fois dérivable sur [0, 1] et (f ◦ g)(k)(t) = = n $ n $ ... j1 =1 j2 =1 n $ n $ n $ ... j1 =1 j2 =1 n $ jk =1 hj1 hj2 . . . hjk (Djk1 j2 ...jk f ◦ g)(t) hj1 hj2 . . . hjk Djk1 j2 ...jk f (a + th). jk =1 En conséquence, on peut appliquer à f ◦ g la formule de Lagrange du reste du développement de Taylor d’ordre m d’une fonction d’une variable, ce qui donne f (a + h) = (f ◦ g)(1) = (f ◦ g)(0) + m $ 1 k=1 m! (f ◦ g)k (0) + 1 (f ◦ g)(m+1)(θ), (m + 1)! pour un certain θ ∈ ]0, 1[, et le résultat se déduit du calcul des (f ◦ g)(k)(t). Ce résultat conduit naturellement à la définition suivante. Définition. Soit f une fonction de Rn dans R , a ∈ int dom f et m ≥ 1 un entier tel que toutes les dérivées partielles de f jusqu’à l’ordre m existent en a. On appelle développement de Taylor d’ordre m de f au point a le m défini par polynôme de degré m Tf,a m Tf,a (h) = f (a) + n $ hj1 Dj1 f (a) + j1 =1 n +...+ 1 2 n n $ 1 $ $ ... hj1 hj2 . . . hjm Djm1 j2 ...jm f (a) m! j =1 j =1 j =1 1 La fonction n $ n 1 $ hj hj D 2 f (a) 2! j =1 j =1 1 2 j1 j2 m 2 n n $ 1 $ = f (a) + ... hj1 . . . hjk Djk1 ...jk f (a) . k! j =1 j =1 k=1 Rm f,a m $ 1 k n de R dans R définie par m Rm f,a (h) = f (a + h) − Tf,a (h), s’appelle le reste du développement de Taylor d’ordre m de f en a et elle a pour domaine dom f − a. 280 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES 7.14 Conditions d’existence d’extrémants Le développement de Taylor d’une fonction de plusieurs variables permet de donner d’intéressantes conditions nécessaires ou suffisantes d’existence d’un extrémant local libre pour une fonction de classe C 2 au moins au voisinage de l’extrémant. Soit f une fonction de Rn dans R de classe C 2 sur un voisinage ouvert V d’un point a ∈ Rn . Par le théorème de développement de Taylor de f en a, si h ∈ Rn est tel que a + th ∈ V pour tout t ∈ [0, 1], il existera θ ∈ ]0, 1[ tel que f (a + h) = f (a) + n $ hj Dj f (a) + j=1 = f (a) + n $ n $ n 1$ 2 hj hk Djk f (a + θh) 2 j=1 k=1 hj Dj f (a) + g(a + θh; h), j=1 si nous définissons, sur V × Rn , la fonction g par g(x; h) = n $ n 1$ 2 hj hk Djk f (x). 2 j=1 k=1 On l’appelle la forme hessienne de f en x; la matrice correspondante 8 2 Djk f (x) 9 1≤j,k≤n est appelée la matrice hessienne de f en x. On voit que, pour x ∈ V fixé, g(x; ·) est une forme quadratique. Rappelons qu’une telle forme g(x; ·) est dite définie positive (resp. définie négative) si, pour tout h /= 0, on a g(x; h) > 0 (resp. g(x; h) < 0), et qu’elle est dite semi-définie positive (resp. semi-définie négative) si, pour tout h ∈ Rn , on a g(x; h) ≥ 0 (resp. g(x; h) ≤ 0). Enfin, g(x; ·) est dite indéfinie si elle n’est pas semi-définie. Notons que g est définie négative (resp. semi-définie négative) si et seulement si −g est définie positive (resp. semi-définie positive.) L’algèbre fournit des conditions nécessaires et suffisantes pour qu’une forme quadratique soit de l’un des types que nous venons de définir. Nous aurons besoin de la conséquence suivante du théorème des bornes atteintes de Weierstrass. 281 7.14. CONDITIONS D’EXISTENCE D’EXTRÉMANTS Lemme. Si g(x; ·) définie ci-dessus est définie positive, alors il existe γ > 0 tel que, pour tout h ∈ Rn tel que |h|2 = 1, on ait g(x; h) ≥ γ. Démonstration. On vérifie sans peine que l’ensemble E = {h ∈ Rn : |h|2 = 1} est un fermé borné de Rn et que l’application h → g(x; h) est continue sur Rn . Le théorème de Weierstrass entraı̂ne l’existence d’un point y ∈ E tel que, pour tout h ∈ E, on ait g(x; h) ≥ g(x; y). Comme y /= 0, on a g(x; y) > 0 et il suffit de poser γ = g(x; y). Donnons maintenant une condition nécessaire pour que a soit un extrémant local libre de f . Proposition. Si a est un minimant local libre de f , alors g(a; ·) est semidéfinie positive. Démonstration. Par hypothèse, il existe r > 0 tel que B2 [a; r] ⊂ V et tel que, pour tout x ∈ B2 [a; r], on ait f (x) ≥ f (a). En outre, par le théorème de Fermat, on aura Dj f (a) = 0, (1 ≤ j ≤ n). Dès lors, si h ∈ Rn est tel que |h|2 = r, ces relations et le théorème du développement de Taylor entraı̂nent que, pour chaque entier k ≥ 1, il existera θk ∈ ]0, 1[ tel que 4 f (a) ≤ f a + h k 5 4 = f (a) + g a + θk h h ; k k c’est-à-dire tel que 0≤ 4 5 n $ n 1 $ θk h 2 D f a + hi hj . 2k2 i=1 j=1 ij k On a donc, pour chaque entier k ≥ 1, n 0≤ n 4 5 1 $$ 2 θk h Dij f a + hi hj , 2 i=1 j=1 k 5 282 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES # # # # et, comme 0 ≤ # θkkh # ≤ kr , on voit que les fonctions 2f Dij 2 8 9 θk h k k∈N∗ converge vers zéro. Comme sont continues en a, on en déduit que n 0≤ n 1 $$ 2 hi hj Dij f (a) = g(a; h). 2 i=1 j=1 Si maintenant h /= 0 est quelconque dans Rn , alors h$ = |h$ |2 = r, et dès lors r2 0 ≤ g(a; h$) = g(a; h), |h|22 rh |h|2 est tel que ce qui entraı̂ne aussitôt que g(a; h) ≥ 0, et achève la démonstration, puisque le résultat est trivial pour h = 0. Proposition. Si a est un maximant local libre de f , alors g(a; ·) est semidéfinie négative. Démonstration. Il suffit d’appliquer le résultat précédent à −f . Ces résultats fournissent immédiatement une condition suffisante pour que le point critique a soit un col. Proposition. Si a est un point critique de f tel que g(a; ·) soit indéfinie, alors a est un col de f . Donnons maintenant des conditions suffisantes d’existence d’un extrémant local libre de f . Proposition. Si a est un point critique de f tel que g(a; ·) soit définie positive, alors a est un minimant local libre de f . Démonstration. Soit γ > 0 donné par le Lemme ci-dessus. Puisque f est de classe C 2 sur V , il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel que, pour tout h ∈ B2 [δ], on a n $ n $ j=1 k=1 2 2 |Djk f (a + h) − Djk f (a)| ≤ γ. Si h ∈ B2 [δ] \ {0}, le théorème de Taylor entraı̂ne l’existence d’un θ ∈ ]0, 1[ tel que 4 f (a + h) − f (a) = g(a + θh; h) = |h|22 g a; h |h|2 5 + [g(a + θh; h) − g(a; h)]. 283 7.15. EXERCICES En conséquence, f (a + h) − f (a) ≥ γ|h|22 − |g(a + θh; h) − g(a; h)| ≥ γ|h|22 − n $ n 1$ 2 2 |hj ||hk ||Djk f (a + θh) − Djk f (a)| 2 j=1 k=1 1 γ ≥ γ|h|22 − |h|2∞ γ ≥ |h|22 > 0. 2 2 Proposition. Si a est un point critique de f tel que g(a; ·) soit définie négative, alors a est un maximant local libre de f . Démonstration. Il suffit d’appliquer le résultat précédent à −f. 7.15 Exercices 1. Soit f une fonction de R dans R deux fois dérivable sur un intervalle I de R. Montrer que f est convexe sur I si et seulement si, pour tout x ∈ I, on a f $$ (x) ≥ 0. 2. Soit f une fonction de Rn dans R dont les dérivées partielles du premier et du second ordre existent et sont continues en a, et soient α, β et γ des fonctions de Rn dans Rn dérivables en a. Montrer que les dérivées de Lie vérifient les propriétés suivantes : Lβ (Lαf )(a) − Lα (Lβ f )(a) = Lδ f (a), L[[α,β],γ]f (a) = Lγ L[α,β]f (a) − L[α,β]Lγ f (a). où δ = [α, β] est le crochet de Poisson de α et β défini par [α, β] = n $ j=1 (βj Dj α − αj Dj β), En déduire l’identité de Jacobi ? @ L[[α,β],γ] + L[[β,γ],α] + L[[γ,α],β] f (a) = 0. 3. Considérons l’équation des ondes 2 2 Dtt u(t, x) − c2 Dxx u(t, x) = 0, 284 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES où c est un nombre réel différent de zéro. Montrer que, si f : R → R et g : R → R sont deux fonctions deux fois dérivables sur R, alors la fonction u de R2 dans R définie par u(t, x) = f (x − ct) + g(x + ct) est solution de l’équation des ondes. 4. Si n ≥ 2 est un entier et u est une application de Rn dans R deux fois dérivable en chaque point de Rn , on définit le laplacien ∆u de u par la relation n ∆u(x) = $ 2 Djj u(x). j=1 Montrer que si u(x) = v(|x|2) (fonction radiale), où v est une application de ]0, +∞[ dans R deux fois dérivable en chaque point de ]0, +∞[, alors, pour tout x ∈ Rn \ {0}, on a ∆[v(|x|2)] = v $$(|x|2 ) + Comme, pour tout r > 0, on a v $$ (r) + n−1 $ v (|x|2 ). |x|2 n−1 $ v (r) = 0 ⇔ r n−1 v $$ (r) + (n − 1)r n−2 v $ (r) = 0 r ⇔ [r n−1 v $ (r)]$ = 0 ⇔ v $ (r) = Ar 1−n , où A est une constante réelle arbitraire, en déduire que u(x) = v(|x|2 ) est une solution radiale sur Rn \ {0} de l’équation de Laplace ∆u(x) = 0, si et seulement si et u(x) = A log |x|2 + B si n = 2, u(x) = A|x|2−n + B si n ≥ 3, 2 où B est une constante réelle arbitraire. % 5. Soit k∈N ck hk une série, où ck ∈ Rp et h ∈ R, et f une fonction de R % dans Rp définie sur ]a − r, a + r[. On dit que k∈N ck hk est un développement asymptotique de f au voisinage de a si, pour chaque entier q ∈ N, on a %q f (a + h) − lim h→0 |h|q k k=0 ck h = 0. 285 7.16. PETITE ANTHOLOGIE Montrer que si f est une fonction de classe C ∞ sur ]a − r, a + r[, alors la série (k) % de Taylor de f en a k∈N hk f k!(a) est un développement asymptotique de f au voisinage de a. 7.16 Petite anthologie Si, pour des accroissements tendant vers zéro, les fluxions qui leur sont proportionnelles sont écrites, les quantités v, v $, v $$ , . . . étant maintenant toutes prises égales à v, alors lorsque z, variant uniformément, devient z + v, la v2 variable x deviendra x + ẋ 1.vż + ẍ 1.2. ż2 + etc. Brook Taylor, 1715 Ce qu’on appelle la somme d’une suite, c’est la limite de la somme de ses différents termes, c’est-à-dire une quantité dont on approche aussi près qu’on veut, en prenant toujours dans la suite un nombre de termes de plus en plus grand. Nous croyons devoir faire cette remarque en passant, pour fixer l’idée nette du mot somme d’une suite. Jean Le Rond d’Alembert, 1789 Mais, pour notre objet, il importe moins de connaı̂tre les restes exacts de la série développée jusqu’à un terme quelconque que d’avoir des limites de ces restes pour pouvoir apprécier l’erreur qu’on peut commettre en ne tenant compte que de quelques-uns des premiers termes. Joseph-Louis Lagrange, 1808 On appelle série une suite indéfinie de quantités u0 , u1 , u2 , u3 , etc. . . . qui dérivent les uns des autres suivant une loi déterminée. Ces quantités elles-mêmes sont les différents termes de la série que l’on considère. Soit sn = u0 + u1 + u2 + . . . + un−1 la somme des n premiers termes, n désignant un nombre entier quelconque. Si, pour des valeurs de n toujours croissantes, la somme sn s’approche indéfiniment d’une certaine limite s, la série sera dite convergente, et la limite en question s’appellera la somme de la série. Au contraire, si, tandis que n croı̂t indéfiniment, la somme sn ne s’approche d’aucune limite fixe, la série sera dite divergente, et n’aura plus de somme. Augustin Cauchy, 1821 286 CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES Nous sommes donc conduits à envisager une relation d’une nature nouvelle qui peut exister entre une fonction de x et de µ que nous appellerons ϕ(x, µ) et une série divergente ordonnée suivant les puissances de µ f0 + µf1 + µ2 f2 + . . . + µp fp + . . . , où les coefficients f0 , f1 , . . . peuvent être des fonctions de x seulement indépendantes de µ, ou bien dépendre à la fois de x et de µ. Posons ϕp = f0 + µf1 + µ2 f2 + . . . + µp fp . Si l’on a lim ϕ − ϕp = 0 pour µ = 0, µp je dirai que la série ci-dessus représente asymptotiquement la fonction ϕ. . . . Il est clair que, si µ est très petit, la différence ϕ − ϕp sera ausi très petite et, bien que la série ci-dessus soit divergente, la somme de ses p + 1 premiers termes représente très approximativement la fonction ϕ. Henri Poincaré, 1893 Pour rien au monde je ne consacrerai de longues heures à établir que ∂ 2u = ∂y∂x et autres belles et grandes choses de même genre. ∂ 2u ∂x∂y Charles Hermite, 1884 Chapitre 8 Equations différentielles linéaires 8.1 Opérateurs différentiels linéaires Dans un bouillon de culture en quantité suffisante, la vitesse de reproduction des bactéries est proportionnelle à leur nombre. Si r désigne le coefficient de proportionnalité et que l’on interpole la fonction décrivant le nombre de bactéries en fonction du temps par une fonction n dérivable de R dans R+ , la loi de reproduction se traduit par l’équation n$ (t) = rn(t), où n(t) désigne le nombre de bactéries à l’instant t. La hauteur h(t) à l’instant t d’un point matériel de masse m en chute libre et soumis à une résistance de frottement proportionnelle à sa vitesse vérifie, en vertu de la loi fondamentale de la mécanique, l’équation mh$$ (t) + rh$ (t) = −mg, où g désigne l’accélération de la pesanteur et r le coefficient de la force de frottement. Dans un circuit électrique oscillant de résistance R, de capacité C et d’inductance L, l’intensité I(t) à l’instant t du courant électrique vérifie l’équation LI $$ (t) + RI $ (t) + (1/C)I(t) = 0. Ces différents problèmes conduisent donc à la question suivante. Si l’on se donne un entier n ≥ 1, des éléments aj , (0 ≤ j ≤ n) de K tels que an /= 0, 287 288 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES avec K = R ou C, et une fonction f de R dans K, il s’agit de déterminer les applications y dans K n fois dérivables sur R telles que, pour tout x ∈ R, on ait n $ aj y (j)(x) = f (x). j=0 (on utilise la convention y (0) = y). Une telle équation dont l’inconnue est une application y de R dans K est appelée une équation différentielle linéaire d’ordre n à coefficients constants dans K et toute fonction y vérifiant l’équation sur R une solution sur R de l’équation. Lorsque les coefficients aj sont réels, une solution réelle de l’équation sera une solution y à valeurs dans R. Lorsque f = 0 l’équation différentielle correspondante n $ aj y (j)(x) = 0. (8.1) j=0 est appelée une équation différentielle linéaire homogène d’ordre n à coefficients constants. Sinon, elle est dite non homogène. Nous commencerons par l’étude de l’équation homogène. Montrons d’abord que toute solution éventuelle de l’équation (8.1) est indéfiniment dérivable sur R. Proposition. Toute solution de l’équation (8.1) est indéfiniment dérivable sur R. Démonstration. On va le démontrer par récurrence sur l’ordre de dérivabilité. Soit y une solution de (8.1); on a donc y (n) = −a−1 n n−1 $ aj y (j) , (8.2) j=0 ce qui montre que y (n) est égale à une fonction dérivable sur R, c’est-à-dire que y est n + 1 fois dérivable sur R. Si l’on suppose maintenant y n + k fois dérivable sur R et que l’on égale les dérivées ke des deux membres de (8.2), on obtient y (n+k) = −a−1 n n−1 $ aj y (j+k) , (8.3) j=0 et, en raisonnant sur (8.3) comme on l’a fait sur (8.2), on déduit que y (n+k) est dérivable sur R, donc que y est n + k + 1 fois dérivable sur R. En conséquence, y possède des dérivées de tous les ordres en chaque point de R et la démonstration est complète. 289 8.1. OPÉRATEURS DIFFÉRENTIELS LINÉAIRES Nous allons montrer que la résolution de l’équation (8.1) se ramène à un problème essentiellement algébrique par l’introduction des opérateurs différentiels à coefficients constants. Désignons par C ∞ = C ∞ (R, K) l’ensemble des fonctions à valeurs dans K indéfiniment dérivables sur R. C’est évidemment un espace vectoriel sur K. Pour chaque y ∈ C ∞ , la fonction dérivée y $ appartient aussi à C ∞ et nous pouvons donc introduire l’application D : C ∞ → C ∞ , y 2→ y $ . Les propriétés de la dérivée entraı̂nent que, si y et z appartiennent à C ∞ et si c ∈ K, alors on a D(y + z) = (y + z)$ = y $ + z $ = Dy + Dz, D(cy) = (cy)$ = cy $ = c(Dy), ce qui montre que D est une application linéaire de C ∞ dans C ∞ , c’est-à-dire un endomorphisme de C ∞ . On peut dès lors définir de proche en proche, pour tout entier m ≥ 1, l’endomorphisme Dm de C ∞ par D 0 = I (identité sur C ∞ ) et D m y = D[D m−1 y] pour tout y ∈ C ∞ , c’est-à-dire D composé m fois avec lui-même, et l’on a évidemment D m y = y (m). Si L est le polynôme à coefficients dans K défini par L(z) = n $ aj z j , j=0 où chaque aj ∈ K et an /= 0, nous pouvons lui associer l’endomorphisme L(D) de C ∞ défini par L(D)y = n $ j=0 aj D j y = n $ aj y (j), j=0 pour tout y ∈ Un tel L(D) est appelé un opérateur différentiel linéaire d’ordre n à coefficients dans K. On voit que la résolution de l’équation différentielle homogène (8.1) revient à la détermination du noyau de l’endomorphisme L(D) de C ∞ . Cette détermination repose sur l’étude des propriétés algébriques de L(D). % j Si M (D) = m j=0 bj D est un autre opérateur différentiel linéaire à coefficients dans K, la somme L(D) + M (D) de L(D) et M (D) sera l’endomorphisme défini, pour tout y ∈ C ∞ , par C∞. [L(D) + M (D)]y = L(D)y + M (D)y = n $ j=0 aj D j y + m $ j=0 bj D j y, 290 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES tandis que le produit cL(D) de L(D) par c ∈ K sera l’endomorphisme de C ∞ défini, pour tout y ∈ C ∞ par j (aj + bj )D j y, [cL(D)]y = n $ [cL(D)]y = c[L(D)y] = c n $ j=0 On constate aussitôt que [L(D) + M (D)]y = p $ aj D y . j=0 (caj )D j y, (8.4) j=0 avec p = max(n, m) et aj = 0 pour j > n, bj = 0 pour j > m, c’est-à-dire que L(D) + M (D) = (L + M )(D), cL(D) = (cL)(D). (8.5) Le composé de M (D) et L(D) est l’endomorphisme de C ∞ défini, pour tout élément y ∈ C ∞ par [M (D) ◦ L(D)]y = M (D)[L(D)y] = = n $ m $ bk aj D k+j y = k=0 j=0 n+m $ l=0 & m $ k=0 m $ j=0 ' bk D k n $ j=0 aj D j y bl−j aj D l y. On le notera simplement M (D)L(D) et l’on voit immédiatement que M (D) ◦ L(D) = (M L)(D), (8.6) où M L désigne le produit usuel du polynôme L par le polynôme M . Par exemple, si L(D) = D − r1 I et M (D) = D − r2 I avec r1 , r2 ∈ C, on a, pour tout y ∈ C ∞ , M (D)L(D)y = (D − r2 I)(Dy − r1 y) = D 2 y − r1 Dy − r2 Dy + r1 r2 y 8 9 = D 2 − (r1 + r2 )D + r1 r2 I y. Les relations (8.5) et (8.6) montrent que la somme et le produit de deux opérateurs différentiels à coefficients dans K, ainsi que le produit d’un tel opérateur par un élément de K sont encore des opérateurs différentiels linéaires à coefficients dans K, ce qui permet de définir, de proche en proche, la 8.1. OPÉRATEURS DIFFÉRENTIELS LINÉAIRES 291 somme et le produit d’un nombre quelconque de tels opérateurs. En outre, les relations (8.5) et (8.6) et les propriétés des polynômes montrent que L(D) + M (D) = M (D) + L(D), M (D)L(D) = L(D)M (D), si l’on définit l’égalité L(D) = M (D) entre deux opérateurs différentiels linéaires à coefficients dans K par la relation L(D)y = M (D)y pour tout y ∈ C ∞ , c’est-à-dire [L(D)y](x) = [M (D)y](x), pour tout y ∈ C ∞ et tout x ∈ R. Cette égalité équivaut à l’identité, au sens algébrique, des polynômes L et M , ainsi que cela résulte de la proposition suivante. Proposition. Si 0 désigne l’endomorphisme nul dans C ∞ , alors L(D) = 0 si et seulement si le polynôme L(z) = n). %n j=0 aj z j est tel que aj = 0, (0 ≤ j ≤ Démonstration. La condition suffisante est évidente. Pour démontrer la condition nécessaire, notons que si L(D)y = 0 pour tout y ∈ C ∞ , alors, en prenant y = 1, on trouve a0 = 0. Raisonnant par récurrence et supposant que a0 = a1 = . . . = ak−1 = 0, on trouve, en prenant y(x) = xk , k!ak = 0, et la démonstration est complète. Tous ces résultats montrent que l’ensemble des opérateurs différentiels à coefficients dans K est isomorphe à l’ensemble des polynômes sur K. En particulier à toute identité L = M entre deux polynômes algébriques L et M correspond l’égalité L(D) = M (D) pour les opérateurs différentiels à coefficients constants correspondants. En guise d’application, rappelons que le théorème fondamental de l’algèbre appliqué au polynôme L(z) nous apprend que si r1 , r2, . . . , rq désignent les zéros complexes distincts de L et m1 , m2, . . . , mq leurs multiplicités respectives, de telle sorte que 1 ≤ q ≤ n et m1 + . . . + mq = n, on a l’identité L(z) = an (z − r1 )m1 (z − r2 )m2 . . . (z − rq )mq , 292 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES l’ordre des facteurs étant évidemment indifférent dans le second membre. Cela entraı̂ne aussitôt, pour les opérateurs différentiels correspondants, l’égalité L(D) = an (D − r1 I)m1 (D − r2 I)m2 . . . (D − rq I)mq , l’ordre des facteurs étant de nouveau indifférent dans le second membre, et (D − rI)m désignant le composé des m opérateurs (D − rI) . . .(D − rI). 8.2 Equation homogène complexe Nous allons déterminer la structure de l’ensemble des solutions de l’équation différentielle linéaire homogène à coefficients constants dans K an y (n) + an−1 y (n−1) + . . . + a1 y $ + a0 y = 0, (8.7) où n ∈ N∗ , aj ∈ K, (0 ≤ j ≤ n), an /= 0. Si L(D) est l’opérateur différentiel à coefficients constants correspondant défini par L(D) = n $ aj D j , j=0 le problème revient donc à déterminer la structure du noyau ker L(D) de l’endomorphisme L(D) de C ∞ . Définition. On appelle polynôme caractéristique de l’équation différentielle (8.7) le polynôme L sur C défini par L(z) = n $ aj z j , j=0 qui s’obtient à partir de (8.7) en remplaçant y (j) par z j . Les zéros distincts r1 , r2 , . . . , rq du polynôme caractéristique P (z) sont appelés les racines caractéristiques de l’équation différentielle (8.7) et nous désignerons par m1 , . . ., mq leurs multiplicités respectives. La discussion de la section 1 montre que l’opérateur différentiel L(D) peut s’écrire L(D) = an (D − r1 I)m1 (D − r2 I)m2 . . . (D − rq I)mq , l’ordre des facteurs du second membre étant indifférent. Il est évident que tout élément du noyau de (D − rj I)mj appartiendra au noyau de L(D). On 8.2. EQUATION HOMOGÈNE COMPLEXE 293 est donc amené à étudier d’abord la structure du noyau de (D − rI)m, où r ∈ K et m ≥ 1 est un entier. La détermination du noyau de D −rI équivaut à la résolution de l’équation différentielle élémentaire y $ (x) = ry(x). (8.8) Si nous définissons la nouvelle fonction inconnue z par y(x) = z(x) exp rx, c’est-à-dire z(x) = y(x) exp(−rx), nous voyons que y est solution de l’équation différentielle (8.8) si et seulement si z $ (x) exp rx = 0, c’est-à-dire, puisque exp rx /= 0 pour tout x ∈ R, si et seulement si z $ (x) = 0. Les solutions de cette équation sont les fonctions constantes z(x) = c, x ∈ R. Par conséquent, les solutions de (8.8) sont les fonctions y(x) = c exp rx où c ∈ K est arbitraire. Supposons maintenant que m soit un entier positif quelconque et considérons d’abord le cas particulier où r = 0. Lemme. y ∈ C ∞ appartient à ker Dm si et seulement si y(x) = P (x), x ∈ R, où P est un polynôme arbitraire sur K de degré inférieur ou égal à m − 1. Démonstration. On vérifie immédiatement que tout polynôme sur K de degré inférieur ou égal à m−1 appartient au noyau de Dm . Réciproquement, si y est réel et Dm y = 0, alors, le reste de Lagrange du développement de Taylor d’ordre m − 1 de y autour de 0 est identiquement nul et l’on a donc y(x) = m−1 $ k=0 D k y(0) k x , k! ce qui montre que y est un polynôme sur K de degré inférieur ou égal à m − 1. Le cas de y complexe s’en déduit en passant aux composantes. 294 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES Le résultat suivant permet de ramener la recherche de la structure du noyau de (D − rI)m à celle du noyau de Dm . Lemme. Si r ∈ C et m ∈ N∗ alors, pour toute fonction g à valeurs dans K m-fois dérivable sur R, on a (D − rI)m g(x) = (exp rx). Dm [g(x) exp(−rx)], (8.9) c’est-à-dire [exp(−rx)].(D − rI)mg(x) = D m [g(x) exp(−rx)]. Démonstration. Notons que la fonction g. exp(−r.) est m fois dérivable sur R puisqu’il en est ainsi de g et de exp(−r.). La formule à démontrer est vraie pour m = 1 puisque (exp rx).D[g(x). exp(−rx)] = Dg(x) − rg(x) = (D − rI)g(x). Montrons par récurrence que si elle est vraie jusqu’à l’ordre k − 1 ≤ m − 1, elle est vraie à l’ordre k. En fait, on a (D − rI)k g(x) = (D − rI)[(D − rI)k−1 g(x)] = (D − rI){(exp rx).Dk−1 [g(x). exp(−rx)]} = (exp rx).D{[exp(−rx)].(exp rx).Dk−1 [g(x). exp(−rx)]} = (exp rx).Dk [g(x). exp(−rx)]. Proposition. Si r ∈ C et m ∈ N∗ , alors y : R → C appartient au noyau de (D − rI)m si et seulement si y est de la forme y(x) = P (x) exp rx, où P est un polynôme arbitraire sur C de degré inférieur ou égal à m − 1. Démonstration. Comme exp(−rx) /= 0 et exp rx /= 0 quel que soit x ∈ R, la formule (8.9) et le lemme qui précède entraı̂nent que y ∈ ker(D − rI)m ⇔ (exp rx).Dm[y(x) exp(−rx)] = 0 ⇔ D m [y(x) exp(−rx)] = 0 ⇔ y(x) exp(−rx) = P (x) ⇔ y(x) = P (x) exp rx, où P est un polynôme sur C de degré inférieur ou égal à m − 1. 8.2. EQUATION HOMOGÈNE COMPLEXE 295 Remarque. Lorsque r ∈ R, le raisonnement du lemme précédent montre que les éléments de ker(D − rI)m à valeurs réelles s’obtiennent en prenant pour P les polynômes sur R de degré inférieur ou égal à m − 1. Lorsque r est complexe non réel, disons r = b + ic avec c /= 0, alors P (x) exp rx est réel si et seulement si P (x) exp rx = P (x) exp r̄x, c’est-à-dire si et seulement si [P (x) − P (x)] cos cx = −i[P (x) + P (x)] sin cx, ou encore [9P (x)] cos cx = [8P (x)] sin cx, pour tout x ∈ R, ce qui n’est possible que si P = 0. Ainsi donc, pour r non réel, les éléments du noyau de (D − rI)m sont nécessairement à valeurs complexes non réelles. Pour chaque q ∈ N et chaque s ∈ C, désignons par E q,s l’ensemble E q,s = {y : R → C : y(x) = P (x) exp sx et P est un polynôme sur C de degré inférieur ou égal à q}. Des fonctions de ce type s’appellent des exponentielles-polynômes et comme la bijection B : P 2→ P (·) exp(s·) définit un isomorphisme entre E q,s et l’espace vectoriel sur C des polynômes sur C de degré inférieur ou égal à q, qui est de dimension q + 1, on voit que E q,s est un espace vectoriel sur C de dimension q + 1 contenu dans C ∞ . L’étude du comportement de l’opérateur linéaire D − rI sur E q,s va nous fournir la structure des éléments de ker L(D). Comme, pour tout polynôme P de degré inférieur ou égal à q, tout r ∈ C et tout s ∈ C, on a (D − rI)[P (x) exp sx] = [P $ (x) + (s − r)P (x)] exp sx, on voit que D − rI est un endomorphisme de E q,s. On a un résultat plus précis si r /= s. Lemme. Si r /= s sont des nombres complexes, alors, pour chaque q ∈ N, D − rI est un automorphisme de E q,s . Démonstration. Puisque E q,s est de dimension finie, il suffit de vérifier que D − rI est injectif, c’est-à-dire que ker(D − rI) ∩ E q,s = {0}. Si (D − rI)[P (x) exp sx] = 0, 296 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES % pour tout x ∈ R, où P (x) = qk=0 ck xk , alors, en vertu de la formule (8.9), on a 0 = (exp rx).D[P (x) exp(s − r)x], ou encore P $ (x) + (s − r)P (x) = 0, c’est-à-dire (s − r)cq xq + q−1 $ k=0 [(s − r)ck + (k + 1)ck+1 ]xk = 0, quel que soit x ∈ R. Le polynôme du premier membre doit donc avoir ses coefficients nuls, c’est-à-dire cq = 0, ck = − k+1 ck+1 , (0 ≤ k ≤ q − 1), s−r ce qui entraı̂ne, de proche en proche ck = 0, (0 ≤ k ≤ q) et achève la démonstration. Nous pouvons maintenant énoncer et démontrer le théorème de structure de l’ensemble des solutions complexes d’une équation différentielle linéaire homogène à coefficients dans K. Théorème. Si r1 , . . . , rq désignent les racines distinctes de l’équation caractéristique L(z) ≡ n $ aj z j = 0 j=0 et m1 , . . . , mq leurs multiplicités respectives, alors y est solution de l’équation différentielle n $ j=0 aj y (j) ≡ L(D)y = 0 si et seulement si y(x) = q $ j=1 Pj (x) exp rj x, x ∈ R, (8.10) où Pj est un polynôme arbitraire de degré inférieur ou égal à mj − 1 à coefficients dans C (1 ≤ j ≤ q). Démonstration. La Proposition ci-dessus entraı̂ne que le résultat est vrai si q = 1. Pour démontrer le résultat par récurrence, supposons le 297 8.2. EQUATION HOMOGÈNE COMPLEXE vrai pour k − 1 racines caractéristiques distinctes et montrons qu’il est vrai pour k racines caractéristiques distinctes. On a, en vertu de l’hypothèse de récurrence, k 6 j=1 k−1 6 (D − rj I)mj y = 0 ⇔ j=1 ⇔ (D − rk I)mk y(x) = (D − rj I)mj (D − rk I)mk y = 0 k−1 $ j=1 Qj (x) exp rj x, x ∈ R, (8.11) où Qj est un polynôme sur C de degré inférieur ou égal à mj − 1, (1 ≤ j ≤ k − 1). Le dernier Lemme montre que (D − rk I)mk est un automorphisme de E mj −1,rj pour chaque 1 ≤ j ≤ k − 1, et il existe donc pour chaque 1 ≤ j ≤ k − 1, un polynôme Pj sur C de degré inférieur ou égal à mj − 1 tel que Qj (x) exp rj x = (D − rk I)mk [Pj (x) exp rj x]. Dès lors, par la formule (8.11) et la linéarité de l’opérateur (D − rk I)mk , on a (D − rk I)mk y(x) − k−1 $ j=1 Pj (x) exp rj x = 0, ce qui équivaut, par la Proposition ci-dessus, à y(x) − k−1 $ Pj (x) exp rj x = Pk (x) exp rk x, j=1 où Pk est un polynôme sur C de degré inférieur ou égal à mk − 1. Le résultat est donc vrai pour un nombre quelconque q de racines distinctes du polynôme caractéristique. Remarque. Si nous explicitons les polynômes Pj dans (8.10) en écrivant Pj (x) = mj −1 $ pjk xk , k=0 nous voyons que la forme générale des solutions complexes de l’équation différentielle (8.7) est donnée par y(x) = q m$ j −1 $ j=1 k=0 pjk xk exp rj x, x ∈ R, 298 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES % et elle contient les n = qj=1 mj constantes complexes arbitraires pjk . Cette formule exprime aussi que la famille de fonctions F = {x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1, 1 ≤ j ≤ q} constitue une famille génératrice du sous-espace vectoriel ker L(D) ⊂ C ∞ des solutions de l’équation différentielle (8.7). Le lemme qui suit permet de montrer que cette famille est libre et constitue donc une base de ker L(D). Lemme. Si p1 , . . ., pl sont des entiers naturels et r1 , . . . , rl des nombres complexes tels que ri /= rj pour 1 ≤ i /= j ≤ l, alors (E p1,r1 + . . . + E pl−1,rl−1 ) ∩ E pl,rl = {0}. Démonstration. Si y ∈ (E p1,r1 + . . . + E pl−1 ,rl−1 ) ∩ E pl,rl , alors, pour chaque x ∈ R, on a y(x) = l−1 $ P j (x) exp rj x = P l (x) exp rl x, j=1 où chaque polynôme P j est de degré inférieur ou égal à pj (1 ≤ j ≤ l). Dès lors, par le lemme de structure du noyau de (D − rI)p+1 , on a 0= l−1 6 k=1 (D − rk I)pk +1 = l−1 $ j=1 P j (x) exp rj x = l−1 6 k=1 (D − rk I)pk +1 [P l (x) exp rl x]. pk +1 Comme l−1 est un automorphisme de E pl,rl , on en déduit k=1 (D − rk I) que P l exp(rl ·) = 0 et donc que y = 0. Ce lemme et le théorème de structure montrent que ker L(D) est la somme directe des sous-espaces vectoriels de dimension mj E mj −1,rj , (1 ≤ j ≤ q). Donc ker L(D) est de dimension n et comme la famille de fonctions {x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1} constitue une base de E mj −1,rj , (1 ≤ j ≤ q), la famille F ci-dessus constituera une base de ker L(D). On a donc prouvé le résultat suivant. 299 8.3. EQUATIONS NON HOMOGÈNES Corollaire. L’ensemble des solutions complexes de l’équation différentielle (8.7) est le sous-espace vectoriel de C ∞ de dimension n engendré par la famille de fonctions F = {x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1, 1 ≤ j ≤ q}, où les rj sont les racines caractéristiques et mj leurs multiplicités. Exemple. Considérons l’équation différentielle linéaire homogène du second ordre a2 y $$ (x) + a1 y $ (x) + a0 y(x) = 0, (8.12) où les aj ∈ C, (0 ≤ j ≤ 2). L’équation caractéristique correspondante est a2 z 2 + a1 z + a0 = 0. Dès lors, si a21 − 4a2 a0 /= 0, les racines caractéristiques r1 = −a1 − G a21 − 4a2 a0 2a2 , r2 = −a1 + G a21 − 4a2 a0 2a2 , sont simples (m1 = m2 = 1), et les solutions de (8.12) sont donc les fonctions de la forme y(x) = c1 exp r1 x + c2 exp r2 x, où c1 et c2 sont des nombres complexes arbitraires. Si a21 − 4a2 a0 = 0, l’équation caractéristique possède la racine double r1 = − a1 2a2 (m1 = 2) et les solutions de (8.12) sont les fonctions de la forme y(x) = (c1 + c2 x) exp r1 x, où c1 et c2 sont des nombres complexes arbitraires. 8.3 Equations non homogènes Si les aj ∈ K, (0 ≤ j ≤ n) avec an /= 0 et si f est une application de R dans K, considérons maintenant l’équation différentielle non homogène L(D)y ≡ n $ j=0 aj y (j)(x) = f (x). (8.13) 300 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES L’équation (8.7) L(D)y ≡ n $ aj y (j) (x) = 0 j=0 est appelée l’équation homogène associée à (8.13). Le résultat suivant montre que la détermination de toutes les solutions de (8.13) revient à celle de toutes les solutions de l’équation homogène associée et d’une solution de l’équation (8.13). Proposition. Soit v une solution de l’équation (8.13). Alors toute solution y de l’équation (8.13) est de la forme y = u+v où u est solution de l’équation homogène associée à (8.13). Démonstration. Soient v et y deux solutions de (8.13); on a donc n $ aj v (j)(x) = f (x), j=0 n $ aj y (j)(x) = f (x), j=0 pour tout x ∈ R, et dès lors, par soustraction membre à membre, n $ j=0 aj (y − v)(j)(x) = 0, pour tout x ∈ R, ce qui montre que y − v est une solution u de l’équation homogène associée. Il résulte de cette proposition que la détermination de la forme générale de la solution de l’équation (8.13) revient à la détermination de la forme générale de l’équation homogène associée à (8.13), problème résolu au paragraphe précédent, et à celle d’une solution particulière de l’équation (8.13). Le raisonnement fait dans le cas homogène pour démontrer la régularité des solutions s’étend immédiatement au cas non homogène. Les détails sont laissés au lecteur. Proposition. Si la fonction f est indéfiniment dérivable sur R, alors toute solution de l’équation (8.13) est indéfiniment dérivable sur R. Enfin, l’obtention d’une solution de (8.13) est souvent facilitée par le résultat suivant. Proposition. Si les applications fj de R dans K sont telles que f = et si yj est solution de l’équation différentielle L(D)(y) = fj , %s j=1 fj , 301 8.3. EQUATIONS NON HOMOGÈNES (1 ≤ j ≤ s), alors y = %s j=1 yj est solution de (8.13). Démonstration. On a, par linéarité de l’opérateur L(D), s s s $ $ $ L(D)y = L(D) yj = L(D)yj = fj = f. j=1 j=1 j=1 La recherche d’une solution particulière de (8.13) lorsque f est donné est un problème difficile sur lequel nous reviendrons par la suite. Nous allons le résoudre dans cette section dans le cas particulier où f est une exponentiellepolynôme, c’est-à-dire lorsque f (x) = Qp(x) exp(rx), où Qp est un polynôme à coefficients dans C de degré inférieur ou égal à p et r ∈ C. Nous aurons besoin pour ce faire de quelques résultats préliminaires de nature algébrique. Soit s ∈ C, q ∈ N, m ∈ N et soit E m,q,s ⊂ E m+q,s l’ensemble défini par E m,q,s = {y : R → C : y(x) = xm P (x) exp sx où P est un polynôme sur C de degré inférieur ou égal à q}. On vérifie sans peine que E m,q,s est un espace vectoriel sur C de dimension q + 1 et que E 0,q,s = E q,s . Lemme. Pour chaque m ≥ 1, D − sI est un isomorphisme de E m,q,s sur E m−1,q,s. Démonstration. Comme dim E m,q,s = dim E m−1,q,s, il suffit de démontrer que D − sI applique E m,q,s dans E m−1,q,s et est injectif. Si y(x) = xm P (x) exp sx, avec P un polynôme sur C de degré inférieur ou égal à q, alors, par la formule (8.9), on a (D − sI)[xmP (x) exp sx] = (exp sx)D[xm P (x)] = (exp sx)[mxm−1 P (x) + xm P $ (x)], ce qui entraı̂ne que (D − sI)y ∈ E m−1,q,s et, si (D − sI)y = 0, que xm P (x) = c, x ∈ R, où c est une constante complexe; en faisant x = 0, on trouve c = 0 et donc y = 0. 302 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES On en déduit aussitôt le résultat suivant. Corollaire. Pour chaque m ≥ 1, (D − sI)m est un isomorphisme de E m,q,s sur E q,s. Considérons maintenant l’équation différentielle L(D)y(x) = Qp (x) exp rx, (8.14) où r ∈ C et Qp est un polynôme à coefficients dans C de degré p. Convenons aussi de dire que r ∈ C est racine caractéristique de multiplicité zéro de l’équation algébrique L(z) = 0 si r n’est pas racine de cette équation. Théorème. L’équation différentielle non homogène (8.14) possède toujours une solution particulière de la forme y(x) = xm Rp (x) exp rx, où m est la multiplicité de r comme racine de l’équation caractéristique L(z) = 0 de l’équation homogène associée à (8.13) et Rp (x) est un certain polynôme complexe de degré inférieur ou égal à p dont les coefficients dépendent linéairement de ceux de Qp. Démonstration. L’équation (8.14) peut évidemment s’écrire sous la forme équivalente q 6 j=1 (D − rj I)mj y(x) = a−1 n Qp (x) exp rx, où les rj sont les racines caractéristiques, de multiplicités respectives mj , de l’équation homogène associée (1 ≤ j ≤ q). Supposons tout d’abord que r ne soit pas racine de l’équation caractéristique L(z) = 0. Alors, on a vu plus = haut que l’opérateur qj=1 (D − rj I)mj est un automorphisme de E p,r et il existera donc un unique élément Rp (·) exp(r·) ∈ E p,r tel que q 6 j=1 (D − rj I)mj [Rp(x) exp rx] = a−1 n Qp (x) exp rx. En conséquence, y = Rp (·) exp(r·) est une solution de (1.14) et l’on déterminera les coefficients de Rp par la méthode des coefficients indéterminés en insérant cette solution dans l’équation (8.14), en identifiant les coefficients de même puissance des polynômes après simplification des deux membres par exp(r.), et en résolvant le système linéaire en les coefficients de Rp ainsi obtenu. 303 8.3. EQUATIONS NON HOMOGÈNES Si r est racine de l’équation caractéristique L(z) = 0, on peut toujours renuméroter les racines caractéristiques pour que r = rq . L’équation (8.14) peut s’écrire q−1 6 j=1 (D − rj I)mj (D − rq I)mq y(x) = a−1 n Qp (x) exp rx. Comme (D − rq I)mq est un isomorphisme de E mq ,p,rq sur E p,rq et rj I)mj un automorphisme de E p,rq , q−1 6 j=1 =q−1 j=1 (D − (D − rj I)mj (D − rq I)mq sera un isomorphisme de E mq ,p,rq sur E p,rq et il existera un élément unique (·)mq Rp (·) exp(rq ·) ∈ E mq ,p,rq tel que q−1 6 j=1 (D − rj I)mj (D − rq I)mq [xmq Rp (x) exp(rq x)] = a−1 n Qp (x) exp rq x. Donc, y(x) = xmq Rp(x) exp(rq x) est une solution particulière de (8.14) et l’on pourra également déterminer les coefficients de Rp par la méthode des coefficients indéterminés. Exemple. Considérons l’équation différentielle non homogène du second ordre a2 y $$ (x) + a1 y $ (x) + a0 y(x) = (b0 + b1 x) exp rx, où les aj , bk et r sont des nombres complexes. Utilisons les notations introduites dans l’étude du cas homogène. Si r /∈ {r1 , r2 }, nous savons qu’il existera une solution de la forme y(x) = (c0 + c1 x) exp rx. Introduisons cette expression dans l’équation différentielle, nous trouvons, après simplification des deux membres par exp rx, (2a2 r + a1 )c1 + (a2 r 2 + a1 r + a0 )c0 + (a2 r 2 + a1 r + a0 )c1 x = b0 + b1 x, et dès lors, puisque a2 r 2 + a1 r + a0 = L(r) /= 0, c1 = b1 b0 L(r) − b1 L$ (r) . , c0 = L(r) [L(r)]2 304 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES Si r = r1 /= r2 , alors r est racine de L(z) = 0 de multiplicité un et nous savons qu’il existera une solution de la forme y(x) = x(c0 + c1 x) exp rx. Introduisant cette expression dans l’équation différentielle, nous obtenons, après simplification, et en notant que L(r) = 0, 2a2 c1 + (a1 + r1 )c0 + 2L$ (r)c1 x = b0 + b1 x, et dès lors, r étant racine simple, on a L$ (r) /= 0 et c1 = b1 b0 L$ (r) − a2 b1 , c0 = . $ 2L (r) [L$ (r)]2 Il reste à discuter le cas où r = r1 = r2 est racine double de l’équation caractéristique. Nous savons alors qu’il existera une solution de la forme y(x) = x2 (c0 + c1 x) exp rx. Procédant encore de même et tenant compte du fait que L(r) = L$ (r) = 0, car r est racine double de L(z) = 0, on trouve 2a2 c0 + 6a2 c1 x = b0 + b1 x, et dès lors c0 = 8.4 1 b1 , c1 = . 2a2 6a2 Solutions réelles Considérons tout d’abord le cas de l’équation linéaire homogène (8.7) et supposons les aj réels (0 ≤ j ≤ n). C’est évidemment un cas particulier de celui traité et les solutions complexes de (8.7) sont données par les fonctions complexes y définies par y(x) = q $ Pj (x) exp rj x, j=1 où les rj sont les racines caractéristiques de (8.7) et les Pj des polynômes arbitraires à coefficients complexes de degré inférieur ou égal à mj − 1, mj étant la multiplicité de rj . On sait que le caractère réel des aj n’implique 305 8.4. SOLUTIONS RÉELLES pas le caractère réel des racines caractéristiques rj et l’on a vu que si rj est non réelle, il ne suffit donc pas de choisir tous les Pj réels pour obtenir une solution réelle de (8.7). Si r est une racine non réelle de l’équation caractéristique L(z) = 0, alors, en prenant le conjugué des deux membres de cette équation, on voit que le conjugué r̄ de r est également racine de l’équation caractéristique L(z) = 0, avec la même multiplicité que r. En conséquence, les racines distinctes de l’équation caractéristique pourront toujours être numérotées comme suit r1 , r2 , . . . , rp, s1 , s2 , . . ., st , s1 , s2 , . . . , st, avec les multiplicités respectives m1 , m2 , . . ., mp, n1 , n2 , . . ., nt , n1 , n2 , . . . , nt, où les rj , (1 ≤ j ≤ p) sont des nombres réels, sk , (1 ≤ k ≤ t) sont des nombres complexes non réels et où les entiers 0 ≤ p ≤ q, 0 ≤ t = (q − p)/2, mj (1 ≤ j ≤ p) et nk (1 ≤ k ≤ t) sont tels que m1 + . . . + mp + 2(n1 + . . . + nt ) = n. Si nous posons sk = bk + ick , alors sk = bk − ick , (1 ≤ k ≤ t). La solution générale complexe de (8.7) peut donc s’écrire y(x) = p $ j=1 Pj (x) exp rj x + t $ Qk (x) exp sk x + k=1 t $ Rk (x) exp sk x, k=1 où les Pj , Qk , Rk sont des polynômes sur C de degrés inférieurs ou égaux à mj − 1, nk − 1 et nk − 1 respectivement. Dès lors, y(x) = p $ Pj (x) exp rj x j=1 + t $ k=1 {[Qk (x) + Rk (x)] cos ck x + i[Qk (x) − Rk (x)] sin ck x} exp bk x. Cette solution sera réelle si nous choisissons les polynômes Pj , Qk + Rk et i(Qk − Rk ) réels, c’est-à-dire tels que Pj = Pj , (1 ≤ j ≤ p), Qk + Rk = Qk + Rk , i(Qk − Rk ) = i(Qk − Rk ), (1 ≤ k ≤ t), 306 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES ce qui équivaut à prendre Pj réel (1 ≤ j ≤ p) et Qk et Rk complexes conjugués (1 ≤ k ≤ t). Réciproquement, si la solution y est réelle, alors on a y(x) = y(x) pour tout x ∈ R, et dès lors, en utilisant son expression donnée ci-dessus, et le fait que exp ax = exp āx, on obtient p $ j=1 [Pj (x) − Pj (x)] exp rj x + + t $ k=1 Puisque la famille t $ k=1 [Qk (x) − Rk (x)] exp sk x [Rk (x) − Qk (x)] exp sk x = 0, x ∈ R. F = {x 2→ xl exp rj x : 0 ≤ l ≤ mj − 1, 1 ≤ j ≤ p; x 2→ xl exp sk x : 0 ≤ l ≤ nk − 1, 1 ≤ k ≤ t; x 2→ xl exp sk x : 0 ≤ l ≤ nk − 1, 1 ≤ k ≤ t}, est libre, on déduit aussitôt de l’identité précédente que, pour toute solution réelle y de (8.7), on a Pj = Pj , (1 ≤ j ≤ p), Qk = Rk , (1 ≤ k ≤ t), qui est par conséquent une condition nécessaire et suffisante pour que y soit réelle. Si cette condition est vérifiée, alors on a y(x) = p $ Pj (x) exp rj x + 28[ j=1 t $ Qk (x) exp sk x], k=1 où les Pj sont des polynômes réels arbitraires de degré inférieur ou égal à mj − 1 (1 ≤ j ≤ p) et les Qk sont des polynômes complexes arbitraires de degré inférieur ou égal à nk − 1 (1 ≤ k ≤ t). Les Qk peuvent donc toujours s’écrire sous la forme Qk (x) = (1/2)[Bk (x) − iCk (x)] où les Bk et Ck sont des polynômes réels arbitraires de degré inférieur ou égal à nk − 1 (1 ≤ k ≤ t), ce qui donne finalement la formule générale y(x) = p $ j=1 Pj (x) exp rj x + t $ [Bk (x) cos ck x + Ck (x) sin ck x] exp bk x, k=1 et achève la démonstration du résultat suivant. 307 8.4. SOLUTIONS RÉELLES Proposition. Si tous les coefficients aj sont réels dans l’équation (8.7), alors y est une solution réelle de (8.7) si et seulement si elle est de la forme y(x) = p $ Pj (x) exp rj x + j=1 t $ [Bk (x) cos ck x + Ck (x) sin ck x] exp bk x, k=1 où les rj sont les racines réelles, de multiplicités respectives mj , de l’équation caractéristique (1 ≤ j ≤ p), bk et ck sont respectivement les parties réelles et imaginaires des racines non réelles, de multiplicités respectives nk , de l’équation caractéristique (1 ≤ k ≤ t) et où les Pj , Bk et Ck sont des polynômes arbitraires à coefficients réels de degrés respectivement inférieurs ou égaux à mj − 1, nk − 1 et nk − 1, (1 ≤ j ≤ p, 1 ≤ k ≤ t). Remarque. On vérifie sans peine que si y est solution d’une équation différentielle linéaire homogène à coefficients réels, alors ȳ l’est aussi. Dès lors, puisque l’ensemble des solutions complexes de (8.7) est un espace vectoriel sur C et que 8y = (1/2)(y + ȳ), 9y = (1/2i)(y − ȳ), on voit que 8y et 9y seront aussi solutions de (8.9) et seront des solutions réelles. Cette remarque peut faciliter la détermination des solutions réelles d’une équation différentielle homogène à coefficients réels. Exemple. Revenons à l’équation différentielle linéaire homogène du second ordre (8.12) a2 y $$ (x) + a1 y $ (x) + a0 y(x) = 0, mais supposons maintenant que les coefficients aj (0 ≤ j ≤ 2) sont réels. L’équation caractéristique correspondante est a2 z 2 + a1 z + a0 = 0. Dès lors, si a21 − 4a2 a0 > 0, les racines caractéristiques r1 = −a1 − G a21 − 4a2 a0 2a2 , r2 = −a1 + G a21 − 4a2 a0 2a2 , sont toutes deux réelles et simples (m1 = m2 = 1), et les solutions réelles de (8.12) sont donc les fonctions de la forme y(x) = c1 exp r1 x + c2 exp r2 x, 308 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES où c1 et c2 sont des nombres réels arbitraires. Si a21 − 4a2 a0 < 0, les racines caractéristiques r1 = G −a1 − i 4a2 a0 − a21 2a2 , r2 = G −a1 + i 4a2 a0 − a21 2a2 = r1 , sont complexes conjuguées non réelles et simples (m1 = m2 = 1), et en posant r1 = b − ic, r2 = b + ic, les solutions réelles de (8.12) sont les fonctions de la forme y(x) = [c1 cos cx + c2 sin cx] exp bx, où c1 et c2 sont des nombres réels arbitraires. Si a21 − 4a2 a0 = 0, l’équation caractéristique possède la racine réelle double r1 = − a1 2a2 (m1 = 2) et les solutions réelles de (8.12) sont les fonctions de la forme y(x) = (c1 + c2 x) exp r1 x, où c1 et c2 sont des nombres réels arbitraires. Passons maintenant au cas d’une équation différentielle linéaire non homogène L(D)y ≡ n $ aj y (j) (x) = f (x), j=0 dont nous supposons les coefficients aj réels. Si y est solution de cette équation, alors, en conjugant les deux membres, on trouve L(D)ȳ = f¯, ce qui entraı̂ne aussitôt, par combinaison linéaire de ces deux équations, que L(D)(8y) = 8f, L(D)(9y) = 9f. En d’autres termes, si y est solution de l’équation différentielle non homogène L(D)y = f et si les coefficients de L(D) sont réels, alors 8y et 9y seront respectivement des solutions réelles des équations non homogènes réelles L(D)y = 8f, L(D)y = 9f. En conséquence, si une équation différentielle non homogène L(D)y = g 309 8.4. SOLUTIONS RÉELLES dont les coefficients et le second membre sont réels, est telle que g puisse s’écrire g = 8f ou g = 9f pour une certaine exponentielle-polynôme complexe f , et si l’on a déterminé une solution v de l’équation L(D)y = f , alors 8v ou 9v sera une solution de L(D)y = g. Cette remarque peut faciliter l’obtention d’une solution particulière réelle lorsque g est le produit d’un polynôme par une fonction trigonométrique. Exemple. Considérons par exemple l’équation différentielle y $$ (x) + γy(x) = cos ωx, où γ est un réel et ω > 0. Comme cos ωx = 8 exp iωx, une solution particulière réelle de cette équation s’obtiendra en prenant la partie réelle d’une solution particulière complexe de l’équation y $$ (x) + γy(x) = exp iωx. Les racines caractéristiques de l’équation caractéristique de l’équation homogène associée sont données par √ r1 = − −γ = −r2 si γ < 0, par r1 = r2 = 0 si γ = 0 et par √ r1 = −i γ = −r2 si γ > 0. La méthode des exponentielles-polynômes développée dans la section précédente fournit donc la solution particulière complexe suivante : y(x) = si γ /= ω 2 et 1 exp iωx γ − ω2 x exp iωx 2iω si γ = ω 2 , ce qui donne, en prenant la partie réelle, les solutions particulières réelles de l’équation de départ y(x) = y(x) = si γ /= ω 2 et 1 cos ωx, γ − ω2 y(x) = x sin ωx 2ω 310 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES si γ = ω 2 . Ce dernier cas illustre le phénomène bien connu de résonance en mécanique et en physique : lorsque γ = ω 2 , la fréquence ω de l’excitation √ extérieure cos ωx est égale à la fréquence propre γ de l’oscillateur régi par l’équation différentielle homogène associée y $$ + γy = 0, et, puisque la solution réelle générale est donnée par y(x) = c1 cos ωx + c2 sin ωx + x sin ωx, 2ω la présence du facteur x montre que l’amplitude des oscillations augmentera indéfiniment lorsque x tend vers +∞. 8.5 Problème de Cauchy Soit maintenant A une application linéaire de Kn dans Kn , f une application continue de R dans Kn . Définition. On appelle système différentiel linéaire sous forme normale toute équation différentielle de la forme z $ (x) = Az(x) + f (x), x ∈ R. (8.15) dont l’inconnue est une fonction z de R dans Kn . Une solution sur R de (8.15) est une application z de R dans Kn dérivable sur R et vérifiant l’équation en chaque x ∈ R. Si n $ aj y (j)(x) = h(x) (8.16) j=0 est une équation différentielle linéaire d’ordre n à coefficients dans K, on peut la ramener à un système différentiel linéaire sous forme normale en posant y(x) = z1 (x), y $ (x) = z2 (x), y $$ (x) = z3 (x), . . . , y (n−1) (x) = zn (x), ce qui entraı̂ne les relations $ z1$ = z2 , z2$ = z3 , . . . , zn−1 = zn , 311 8.5. PROBLÈME DE CAUCHY et, en utilisant l’équation, la relation n−1 $ aj zj+1 (x) + an zn$ (x) = h(x). j=0 Dès lors, si y est solution de (8.16), la fonction z(x) = (z1 (x), . . ., zn (x)) vérifie le système différentiel (8.15) avec et Az = z2 , z3 , . . . , zn, − 4 f (x) = 0, . . . , 0, n $ aj−1 j=1 an zj 5 h(x) . an Réciproquement, on vérifie sans peine que si z est solution de (8.15) pour l’application A et l’application f ci-dessus, sa première composante z1 sera solution de (8.16). Définition. Etant donné le système (8.15), x0 ∈ R et z0 ∈ Kn , on appelle problème de Cauchy de condition initiale z0 en x0 la recherche d’une solution z sur R de (8.15) telle que z(x0 ) = z0 . Dans le cas de l’équation différentielle linéaire à coefficients constants d’ordre n (8.13), le problème de Cauchy revient, comme on le vérifie immédiatement, à rechercher une solution de l’équation telle que y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1 , où les yj , (0 ≤ j ≤ n − 1) sont donnés dans K. Montrons que le problème de Cauchy a au plus une solution. Proposition. Pour chaque x0 ∈ R et chaque z0 ∈ Kn , il existe au plus une solution du problème de Cauchy pour l’équation (8.15). Démonstration. En passant aux parties réelles et imaginaires des composantes de z, le cas où K = C se ramène au cas où K = R avec n remplacé par 2n. Il suffit donc de considérer le cas où K = R. Si z et w sont solutions du problème de Cauchy pour (8.15) de condition initiale z0 en x0 , alors, par soustraction, la fonction u = z − w sera solution du problème de Cauchy u$ (x) = Au(x), (x ∈ R), u(x0 ) = 0. 312 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES Dès lors, par les propriétés élémentaires de la dérivée , on aura (|u(x)|22)$ = 2(u(x)|u$(x)) = 2(Au(x)|u(x)), x ∈ R. L’inégalité de Cauchy et les propriétés des applications linéaires entraı̂nent que |(Au(x)|u(x))| ≤ |Au(x)|2|u(x)|2 ≤ K|u(x)|22, x ∈ R, pour une certaine constante positive K, et dès lors, en posant v(x) = |u(x)|22, x ∈ R, on aura −2Kv(x) ≤ v $ (x) ≤ 2Kv(x), x ∈ R. L’inégalité de droite entraı̂ne v $ (x) exp(−2Kx) − 2Kv(x) exp(−2Kx) ≤ 0, c’est-à-dire [v(x) exp(−2Kx)]$ ≤ 0. En conséquence, v(·) exp(−2K·) est décroissante et, par construction, positive. Comme elle s’annule en x = x0 , elle doit être nulle pour tout x ≥ x0 et dès lors v(x) et u(x) sont nuls pour x ≥ x0 . De même, l’inégalité de gauche entraı̂ne v $ (x) exp(2Kx) + 2Kv(x) exp(2Kx) ≥ 0, c’est-à-dire [v(x) exp(2Kx)]$ ≥ 0. En conséquence, v(·) exp(2K·) est croissante et, par construction, positive. Comme elle s’annule en x = x0 , elle doit être nulle pour tout x ≤ x0 et dès lors v(x) et u(x) sont nuls pour x ≤ x0 . Donc z(x) = w(x) pour tout x ∈ R et la démonstration est complète. Corollaire. Si h est une application continue de R dans K, a ∈ R et yj ∈ K, (0 ≤ j ≤ n − 1), le problème de Cauchy n $ j=0 aj y (j) (x) = h(x), x ∈ R, y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1 possède au plus une solution sur R. En combinant ce corollaire avec les théorèmes d’existence obtenus plus haut, on obtient le théorème d’existence et d’unicité suivant. 8.5. PROBLÈME DE CAUCHY 313 Corollaire. Si h est une combinaison linéaire d’exponentielles-polynômes de R dans K, x0 ∈ R et yj ∈ K, (0 ≤ j ≤ n − 1), le problème de Cauchy n $ j=0 aj y (j) (x) = h(x), x ∈ R, y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1 possède une solution unique sur R. Remarque. Si I est un intervalle de R, x0 ∈ I, y0 ∈ Rn et f une application continue de I × Rn dans Rn , le problème de Cauchy (local) de condition initiale y0 en x0 pour le système différentiel sous forme normale y $ (x) = f (x, y(x)), est la détermination d’un sous-intervalle J ⊂ I contenant x0 et d’une solution y du système différentiel définie sur J et telle que y(x0 ) = y0 . Dans le cas d’une équation différentielle du second ordre décrivant le mouvement d’un point matériel, u$$ (x) = g(x, u(x), u$(x)), et qui peut évidemment s’écrire sous la forme normale équivalente y1$ (x) = y2 (x), y2$ (x) = g(x, y1(x), y2 (x)), en posant y1 = u, y2 = u$ , la donnée des conditions de Cauchy revient à la donnée de la position et de la vitesse à l’instant initial. Le raisonnement fait plus haut dans le cas d’un système linéaire à coefficients constants montre que le problème de Cauchy y $ (x) = f (x, y(x)), y(x0 ) = y0 , possède au plus une solution sur tout sous-intervalle J de I contenant x0 lorsque f vérifie sur chaque ensemble du type I × B, où B est un borné de Rn , la condition de Lipschitz |f (x, y) − f (x, z)|2 ≤ LB |y − z|2 , où LB ≥ 0 est une constante ne dépendant que de B. Le théorème de la moyenne montre que cette condition de Lipschitz sera satisfaite lorsque f possède sur I × Rn des dérivées partielles par rapport aux yj qui sont bornées sur les ensembles I × B. Les méthodes du Chapitre 18 permettront de démontrer l’existence de cette solution. 314 8.6 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES Exercices 1. Montrer que si l’on introduit les fonctions sinus hyperbolique sinh et cosinus hyperbolique cosh par sinh x = exp x − exp(−x) exp x + exp(−x) , cosh x = , 2 2 alors, si a > 0, les solutions réelles de l’équation différentielle y (4)(x) − a4 y(x) = 0, (qui intervient en théorie de l’élasticité) sont données par y(x) = A sin ax + B cos ax + C sinh ax + D cosh ax, où A, B, C, D sont des nombres réels arbitraires. 2. Montrer que, si a ∈ R et T > 0, l’équation différentielle y $$ (x) + ay(x) = 0 possède une solution non nulle vérifiant les conditions aux limites de Dirichlet y(0) = y(T ) = 0, si et seulement si aT 2 = k2 π 2 , (k ∈ N∗ ), et qu’elle possède une solution non nulle vérifiant les conditions aux limites de Neumann y $ (0) = y $ (T ) = 0, si et seulement si aT 2 = k2 π 2 , (k ∈ N). 3. Montrer que si a ∈ R et T > 0, l’équation différentielle y $$ (x) + ay(x) = 0 possède une solution non nulle telle que y(x) = y(x + T ) pour tout x ∈ R (solution T-périodique) si et seulement si aT 2 = 4k2 π 2 , (k ∈ N). 315 8.6. EXERCICES 4. On appelle équation différentielle d’Euler toute équation différentielle de la forme an xn y (n) (x) + an−1 xn−1 y (n−1) (x) + . . . + a1 xy $ (x) + a0 y(x) = 0, où n ≥ 1 est un entier et aj ∈ C, (0 ≤ j ≤ n). Une solution sur ]0, +∞[ de l’équation d’Euler est une fonction y n-fois dérivable sur ]0, +∞[ vérifiant cette équation sur cet intervalle. Montrer que le changement de variable défini par t = log x (et donc x = exp t) transforme l’équation d’Euler en une équation différentielle linéaire homogène d’ordre n à coefficients constants pour la nouvelle fonction inconnue z définie par z(t) = y(exp t). 5. Utiliser les résultats de l’exercice précédent pour montrer que, si n ≥ 2 est un nombre réel, les solutions sur ]0, +∞[ de l’équation différentielle y $$ (x) + n−1 $ y (x) = 0, x sont données par y(x) = A + B xn−2 si n > 2, et y(x) = A + B log x si n = 2. 6. On dit que l’équation différentielle linéaire à coefficients constants dans C n $ aj y (j) (x) = 0 j=0 est stable si toutes ses solutions sont bornées sur [0, +∞[. Montrer que l’équation différentielle est stable si et seulement si les deux conditions suivantes sont remplies : a) toutes les racines caractéristiques de l’équation ont une partie réelle négative; b) les racines caractéristiques purement imaginaires sont simples. On dit que l’équation différentielle ci-dessus est asymptotiquement stable si toutes ses solutions tendent vers zéro lorsque x tend vers +∞. Montrer que l’équation différentielle est asymptotiquement stable si et seulement si toutes ses racines caractéristiques ont une partie réelle strictement négative. 316 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES 7. On considère l’équation de la chaleur 2 Dtu(t, s) − Dss u(t, s) = 0, dont les solutions sont des fonction u de R2 dans R de classe C 2 sur R2 . Cette équation décrit la propagation de la chaleur dans un fil. Déterminer les solutions de l’équation de la chaleur qui sont de la forme u(t, s) = y(at + s), avec a un réel non nul et y une fonction de classe C 2 sur R (ondes progressives). (La fonction y est solution de l’équation différentielle linéaire à coefficients constants −y $$ (x) + ay $ (x) = 0, ce qui donne u(t, s) = A + B exp(a2 t + as)). 8. On considère l’équation des télégraphistes 2 2 Dtt u(t, s) − Dss u(t, s) + cDtu(t, s) = 0, (c > 0), dont les solutions sont des fonction u de R2 dans R de classe C 2 sur R2 . Cette équation décrit la propagation des ondes électromagnétiques dans un fil conducteur. Déterminer les solutions de l’équation des télégraphistes qui sont de la forme u(t, s) = y(at + s), avec a un réel non nul et y une fonction de classe C 2 sur R (ondes progressives). (La fonction y est solution de l’équation différentielle linéaire à coefficients constants (a2 − 1)y $$ (x) + cay $ (x) = 0, ce qui donne u(t, s) = A si a = ±1 et 4 u(t, s) = A + B exp − si a /= ±1). 9. On considère l’équation différentielle ca (at + s) 2 a −1 5 mh$$ (x) + rh$ (x) = −mg, introduite au premier paragraphe, où m > 0, r > 0 et g > 0. Déterminer les solutions et montrer que, pour toute solution h de cette équation, on a lim h$ (x) = − x→+∞ mg . r (Vitesse limite de chute en présence d’un frottement sous l’action de la pesanteur). 10. On considère l’équation différentielle y $$ (x) + by $ (x) + ay(x) = A sin ωx, 317 8.7. PETITE ANTHOLOGIE où a > 0, b > 0, ω > 0 et A ∈ R. Déterminer les solutions réelles de cette équation et montrer que si θ est déterminé par la relation tg θ = bω , a − ω2 et si y est une solution quelconque de l’équation différentielle, alors 2 3 A lim y(x) − sin(ωx − θ) = 0. 2 2 x→∞ [(a − ω ) + ω 2 b2 ]1/2 On dit que les solutions de cette équation s’approchent du régime stationnaire donné par ys (x) = [(a−ω2 )2A+ω2 b2 ]1/2 sin(ωx − θ). 11. Montrer que, si ω et Ω sont des nombres réels, les systèmes d’équations différentielles réelles u$$ (x) + ωv $ (x) = 0, v $$(x) − ωu$ (x) = 0, et u$$ (x) + 2ωv $ (x) + Ω2 u(x) = 0, v $$ (x) − 2ωu$ (x) + Ω2 v(x) = 0, peuvent se résoudre par la méthode introduite dans ce chapitre. Suggestion. En posant y = u + iv, les ramener respectivement aux équations différentielles linéaires complexes y $$ (x) − iωy $ (x) = 0, y $$ (x) − 2iωy $ (x) + Ω2 y(x) = 0. Discuter la nature géométrique de la solution dans le plan complexe. Ces systèmes interviennent dans différents problèmes de mécanique et de physique mathématique (pendule de Foucault, précession de Larmor). 8.7 Petite anthologie Monsieur Euler est même parvenu à . . . résoudre l’équation générale a dn y dn−1 y + b + . . . + X = 0. dxn dxn−1 Il se sert à cet effet de la substitution adroite de la quantité exponentielle Acf x (où c est la quantité dont le logarithme est égal à 1), et de ses différentielles successives, au lieu de y, dy, ddy, etc.; cette substitution transforme 318 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES l’équation proposée en une autre, qui devient une simple équation finie, telle que (1 + bf + af 2 ) = 0, lorsque n = 2, ou (1 + cf + bf 2 + af 3 ) = 0, si n = 3, etc. Ayant donc trouvé les différentes valeurs de f suivant le degré de l’équation, et mettant ces différentes valeurs au lieu de f, dans Acf x , on aura autant de valeurs de y, puisque y = Acf x ; et ces différentes valeurs jointes ensemble donneront l’intégrale complète de l’équation proposée. Il y a, à la vérité, ici quelques cas qui pourroient embarrasser, savoir quand quelques-unes des valeurs de f sont, ou égales, ou imaginaires; mais Euler résout ces difficultés. Euler avoit d’abord été arrêté par la limitation que X fut égal à zéro; mais dans la suite, il surmonta cette difficulté; en perfectionnant sa méthode, il montra comment on pouvoit résoudre complètement l’équation ci-dessus, X étant une fonction quelconque de x; mais la méthode est trop compliquée, quoique sûre et complète, pour en pouvoir donner ici même une esquisse. Jean-Etienne de Montucla, 1802 L’oscillateur harmonique que nous allons étudier possède des équivalents très proches dans beaucoup de domaines; bien que partant de l’exemple mécanique d’un poids au bout d’un ressort, ou de petites oscillations d’un pendule, ou encore d’autres appareils mécaniques, nous ne faisons en réalité qu’étudier une certaine équation différentielle. Cette équation apparaı̂t très souvent en physique comme dans d’autres sciences, et de fait, elle est sousjacente à tant de phénomènes que cela vaut bien la peine de l’étudier. Parmi ces phénomènes, il y a les oscillations d’une masse accrochée à un ressort; les oscillations des charges allant et venant dans un circuit électrique; les vibrations d’un diapason créant des ondes sonores, les vibrations analogues des électrons dans un atome engendrant des ondes lumineuses; les équations de fonctionnement d’un servo-mécanisme comme un thermostat régulant la température; des interactions compliquées au sein de réactions chimiques; la croissance d’une population de bactéries en interaction avec l’apport de nourriture et les poisons produits par ces bactéries; des renards mangeant des lapins mangeant de l’herbe, etc. Tous ces phénomènes suivent des équations qui sont très semblables les unes aux autres. Ces équations sont appelées équations différentielles linéaires à coefficients constants. Richard P. Feynman, 1963 8.7. PETITE ANTHOLOGIE 319 Les équations linéaires [à coefficients constants] constituent pratiquement l’unique importante classe d’équations différentielles dont la théorie est relativement complète. Cette théorie qui en fait est une branche de l’algèbre linéaire permet de résoudre totalement les équations linéaires autonomes. La théorie des équations linéaires est par ailleurs utile comme première approximation dans la résolution de problèmes non linéaires. Elle permet entre autres d’étudier la stabilité de l’équilibre dans les cas génériques. Vladimir I. Arnold, 1974 Une intelligence qui, pour un instant donné, connaı̂trait toutes les forces dont la nature est animée et la situation respective des êtres qui la composent, si d’ailleurs elle était assez vaste pour soumettre ces données à l’Analyse, embrasserait dans la même formule les mouvements des plus grands corps de l’univers et ceux du plus léger atome; rien ne serait incertain pour elle, et l’avenir, comme le passé, serait présent à ses yeux. Simon de Laplace, 1795 Dans mes leçons données à l’Ecole Polytechnique, comme dans la plupart des Ouvrages ou Mémoires que j’ai publié sur le Calcul intégral, j’ai cru devoir renverser cet ordre et placer en premier lieu la recherche, non pas des intégrales générales, mais des intégrales particulières; en sorte que la détermination des constantes ou des fonctions arbitraires ne fut plus séparée de la recherche des intégrales. ... Les constantes arbitraires, que doivent renfermer les intégrales générales d’un système d’équations différentielles du premier ordre, se trouvent remplacées par des valeurs particulières des inconnues, correspondant à une valeur particulière de la variable indépendante, et par conséquent le problème de l’intégration se trouve réduit à un problème complètement déterminé. Augustin Cauchy, 1842 Une cause très petite, qui nous échappe, détermine un effet considérable que nous ne pouvons pas ne pas voir, et alors nous disons que cet effet est dû au hasard. Si nous connaissions exactement les lois de la nature et la situation de l’univers à l’instant initial, nous pourrions prédire exactement la situation de ce même univers à un instant ultérieur. Mais, lors même que les lois naturelles n’auraient plus de secret pour nous, nous ne pourrons connaı̂tre la situation initiale qu’approximativement. Si cela nous permet de prévoir la situation ultérieure avec la même approximation, c’est tout ce 320 CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES qu’il nous faut, nous disons que le phénomène a été prévu, qu’il est régi par des lois; mais il n’en est pas toujours ainsi, il peut arriver que de petites différences dans les conditions initiales en engendrent de très grandes dans les phénomènes finaux; une petite erreur sur les premières produirait une erreur énorme sur les derniers. La prédiction devient impossible et nous avons le phénomène fortuit. Henri Poincaré, 1907 Le problème de Cauchy apparaı̂t en mécanique : le mouvement d’un système mécanique doit être calculé à partir des lois du mouvement, qui forment un système différentiel, et des positions et vitesses initiales, qui sont les données définissant une solution particulière de ce système. Le problème de Cauchy pour les systèmes différentiels ordinaires a été, bien entendu, le plus important problème mathématique tant que l’artillerie a régi le monde, tant que la mécanique céleste a été la théorie scientifique principale et triomphante. Jean Leray, 1963 Chapitre 9 Fonctions primitivables 9.1 Fonctions primitivables et primitives Le chapitre précédent a montré comment déterminer les solutions d’équations différentielles linéaires de la forme L(D)y(x) ≡ n $ aj y j (x) = f (x), j=0 lorsque les aj sont des nombres complexes et f une exponentielle-polynôme. Le problème de la détermination des solutions de telles équations pour des classes plus générales de seconds membres f est un problème difficile (et parfois impossible), même dans le cas le plus simple où l’équation se réduit à y $ (x) = f (x), c’est-à-dire lorsqu’il s’agit de déterminer les fonctions qui sont les dérivées d’une fonction donnée (problème inverse de la dérivation). Soit I un intervalle et f une fonction de R dans Rp définie sur I. Définition. On dit que f est primitivable sur I s’il existe une fonction F de R dans Rp dérivable sur I et telle que F $ (x) = f (x) pour chaque x ∈ I. Une telle fonction s’appelle une primitive de f sur I. Pour rappeler la contribution fondamentale d’Isaac Newton à l’élaboration et à l’étude de cette notion, on désignera par N (I, Rp) l’ensemble des 321 322 CHAPITRE 9. FONCTIONS PRIMITIVABLES fonctions f de R dans Rp qui sont primitivables sur I. Comme la fonction nulle sur I admet toute fonction constante sur I comme primitive sur I, on voit que N (I, Rp) n’est pas vide. On voit aussi que, si la primitive de f sur I existe, elle n’est pas nécessairement unique. En traduisant, en termes de primitives, le fait qu’une fonction a une dérivée nulle sur un intervalle si et seulement si elle y est constante, on obtient le résultat suivant. Proposition. Soit f une fonction de R dans Rp primitivable sur l’intervalle I. Si F est une primitive de f sur I, alors la fonction G de R dans Rp est une primitive de f sur I si et seulement si la fonction F − G est constante sur I. Démonstration. La condition suffisante est facile puisque, pour tout x ∈ I, on a, si F − G est constante sur I, G$ (x) = F $ (x) + (G − F )$ (x) = F $ (x) = f (x). En ce qui concerne la condition nécessaire, on a, par hypothèse, pour tout x ∈ I, (F − G)$ (x) = F $ (x) − G$ (x) = f (x) − f (x) = 0, et dès lors F − G est constante sur I. Corollaire. Soit f une fonction de R dans Rp primitivable sur l’intervalle I. Pour chaque a ∈ I et chaque c ∈ Rp il existe une primitive unique F de f telle que F (a) = c. Démonstration. Si G est une primitive de f sur I vérifiant la même condition, alors, par la proposition précédente, F − G est constante sur I et, par hypothèse, F (a) − G(a) = 0. Donc F = G sur I et l’unicité est démontrée. En particulier, l’unique primitive F de f sur I telle que F (a) = 0 sera H désignée par Fa ou a· f . Les primitives de f sur I seront donc toutes de la forme Fa + c où c ∈ Rp est arbitraire et, si G est une primitive quelconque de f sur I, on a évidemment Fa = G − G(a). La proposition ci-dessus nous conduit à introduire sur l’ensemble des fonctions de R dans Rp définies sur l’intervalle I la relation = définie comme suit. 9.1. FONCTIONS PRIMITIVABLES ET PRIMITIVES 323 Définition. Si g et h sont deux fonctions de R dans Rp définies sur l’intervalle I, on écrira g=h si g − h est constante sur I. On vérifie sans peine que = est une relation d’équivalence sur l’ensemble des fonctions de R dans Rp définies sur I. Si fI et gI sont deux classes d’équivalence pour = contenant respectivement les fonctions f et g, on pourra définir la somme fI+ gI par la classe d’équivalence contenant f + g (on voit sans peine que cette définition ne dépend pas du choix des représentants f et g), et l’on définira, pour c ∈ R, cfI comme étant la classe d’équivalence de cf . La proposition ci-dessus exprime donc qu’à toute fonction f primitivable sur I correspond une et une seule classe d’équivalence pour = de l’ensemble des fonctions de RHdans Rp définies sur I. On désigne en général cette classe d’équivalence par f ou D −1 f et il faut signaler l’abus de notation, consacré par l’usage, consistant parfois à désigner par le même symbole un élément choisi dans cette classe d’équivalence, c’est-à-dire une primitive de f sur I. De nombreuses fonctions élémentaires sont désignées en pratique par leur valeur en un point x de leur domaine de définition (ainsi l’on parle de la fonction x2 pour la fonction qui à x associe x2 ) et la notation ci-dessus est mal adaptée pour de telles fonctions; on utilise alors la notation J f (x) dx ou J f (t) dt ou J f (u) du. Avec l’abus de notation signalé plus haut, chacune de ces expressions désigne aussi une primitive de f sur I et non sa valeur en un point x (ou t ou u) ! C’est le rôle du symbole dx ou dt ou du d’annuler l’apparente dépendance des expressions ci-dessus par rapport à x, t ou u. Les symboles x, t ou u jouent dans ces formules un rôle “muet” analogue à celui de l’indice dans une formule sommatoire. Par exemple, on vérifie sans peine que la fonction H x 2→ x3 /3 est une primitive sur R de la fonction x 2→ x2 . Dès lors, x2 dx représente la classe d’équivalence des fonctions f + c où f (x) = x3 /3 et c est une constante réelle. Signalons également que deux primitives d’une fonctions donnée sur un intervalle donné, qui diffèrent entre elles par une constante additive, peuvent avoir des expressions qui dissimulent sournoisement cette relation simple. x−c Ainsi, pour chaque c ∈ R, les fonctions x 2→ sin x et x 2→ 2 sin x+c 2 cos 2 sont deux primitives sur R de la fonction x 2→ cos x, puisque la seconde 324 CHAPITRE 9. FONCTIONS PRIMITIVABLES fonction n’est rien d’autre que la fonction x 2→ sin x + sin c et celle-ci diffère de la fonction x 2→ sin x par la constante sin c. Les fonctions primitivables et leurs primitives possèdent les propriétés élémentaires suivantes. Proposition. Si f ∈ N (I, Rp) et g ∈ N (I, Rp), on a les propriétés suivantes. 1. f ∈ N (J, Rp) pour tout intervalle J ⊂ I et la restriction à J de toute primitive sur I de f est une primitive sur J de f . 2. f + g ∈ N (I, Rp) et J (f + g) = J f+ H J g. H 3. cf ∈ N (I, Rp) pour tout c ∈ R et cf = c f. H 4. Chaque composante fj de f appartient à N (I, R), 1 ≤ j ≤ p et fj est la classe d’équivalence de la jème composante d’une primitive quelconque de f sur I. 5. Si f ∈ N (I, C), c’est-à-dire si f ∈ N (I, R2) avec R2 muni de la structure de corps, alors, cf ∈ N (I, C) pour tout c ∈ C et J cf = c J f. Démonstration. Les propriétés 1 à 5 sont des conséquences immédiates des définitions et des propriétés élémentaires des dérivées. Cette proposition montre que N (I, Rp) (resp. N (I, C)) est un espace vectoriel sur R (resp. C). Elle nous permet de trouver des classes de fonctions primitivables sur I par combinaison linéaire de fonctions élémentaires primitivables sur I. De telles fonctions s’obtiennent facilement en lisant “de droite à gauche” un tableau donnant les dérivées de fonctions élémentaires. On obtient ainsi le tableau suivant de fonctions appartenant à N (R, R). Fonctions x 2→ xm , m ∈ N x 2→ exp x x 2→ sin x x 2→ cos x 1 x 2→ 1+x 2 1 x 2→ √1+x 2 x 2→ sinh x x 2→ cosh x Primitives m+1 x 2→ xm+1 + c x 2→ exp x + c x 2→ − cos x + c x 2→ sin x + c x 2→ arctg x + c x 2→ arcsinh x + c x 2→ cosh x + c x 2→ sinh x + c 9.1. FONCTIONS PRIMITIVABLES ET PRIMITIVES 325 On déduit aussitôt de ce tableau et de la proposition précédente que si K désigne R ou C, les fonctions polynômiales de R dans K appartiennent à N (R, K). Les fonctions élémentaires suivantes appartiennent à N (R∗+ , R) et à N (R∗− , R) : Fonctions Primitives −m+1 −m x 2→ x , m /= 1 x 2→ x−m+1 + c x 2→ x−1 x 2→ ln |x| + c Enfin, les fonctions x 2→ xa , a /∈ Z sont dans N (R∗+ , R) et ont pour primitives a+1 les fonctions x 2→ xa+1 + c, (c ∈ R), les fonctions x 2→ exp ax, où a ∈ K, sont dans N (R, K) et ont pour primitives les fonctions x 2→ a−1 exp ax+c, (c ∈ K) 1 et la fonction x 2→ √1−x 2 appartient à N (] − 1, 1[, R) et a pour primitives les fonctions x 2→ arcsin x + c(c ∈ R). On trouvera de nombreux autres exemples dans les tables de primitives, également appelées, pour des raisons que nous verrons plus loin, tables d’intégrales. Nous reviendrons plus tard sur l’obtention de classes de fonctions appartenant à N (I, Rp) pour un certain intervalle I. En particulier, nous montrerons que toute fonction de R dans Rp continue sur I appartient à N (I, Rp). Par ailleurs, N (I, Rp) contient des fonctions non continues sur I. Ainsi, la fonction F de R dans R définie par F (x) = x2 sin 1 si x /= 0, F (0) = 0, x2 possède en chaque point x /= 0 la dérivée F $ (x) = 2x sin 1 2 1 − cos 2 x2 x x et en 0 la dérivée F $ (0) = 0, ainsi qu’on le vérifie aisément. Mais la fonction f = F $ , primitivable sur R, n’est pas continue en 0 puisque limx→0 f (x) n’existe pas. On notera en outre que la fonction f n’est bornée sur aucun intervalle contenant l’origine. Donc N (I, Rp) contient des fonctions non bornées. On peut se demander s’il existe des fonctions réelles définies sur R et qui n’appartiennent pas à N (R, R). La réponse affirmative résultera aisément de la propriété de valeur intermédiaire ou propriété de continuité de Darboux qui est une condition nécessaire pour qu’une fonction soit primitivable sur un intervalle. 326 CHAPITRE 9. FONCTIONS PRIMITIVABLES Proposition. Soit I ⊂ R un intervalle et f ∈ N (I, R). Alors f vérifie la propriété de valeur intermédiaire sur I. En d’autres termes, pour chaque x ∈ I, chaque y ∈ I tel que x < y et chaque v compris entre f (x) et f (y), il existe un z ∈ [x, y] tel que f (z) = v. Démonstration. Comme dans la démonstration du théorème de Bolzano, on peut, sans perte de généralité, supposer que f (x) < v < f (y). Soit F une primitive de f sur I et soit G la fonction de R dans R définie par G(t) = F (t) − vt. G est évidemment dérivable sur I et G$ (t) = f (t) − v, pour chaque t ∈ I, ce qui entraı̂ne en particulier que G$ (x) < 0 < G$ (y). " En prenant ! = − G 2(x) dans la définition de la dérivée de G en x, on trouve un δ ∈ ]0, y − x] tel que, pour tout t ∈ ]x, x + δ], on a et dès lors G$ (x) G(t) − G(x) G$ (x) ≤ − G$ (x) ≤ − , 2 t−x 2 G(t) − G(x) G$ (x) ≤ < 0, t−x 2 ce qui implique, pour chaque t ∈ ]x, x + δ], l’inégalité G(t) < G(x). En procédant d’une manière similaire en y, on trouve un δ $ ∈ ]0, y − x] tel que G(t) < G(y) pour tout t ∈ [y − δ $ , y[. Comme G, dérivable sur [x, y], y est continue, le théorème des bornes atteintes de Weierstrass entraı̂ne l’existence d’un minimant z de G sur [x, y] et les deux inégalités que nous venons d’obtenir montrent que, nécessairement, z ∈ ]x, y[, et est donc intérieur au domaine de G. Le théorème de Fermat entraı̂ne alors que G$ (z) = 0, c’est-à-dire que f (z) = v. 327 9.2. RÈGLES DE PRIMITIVATION Remarque. Le résultat que nous venons de démontrer montre que la propriété de valeur intermédiaire, vérifiée par les fonctions réelles continues sur un intervalle, peut également l’être par des fonctions non continues sur cet intervalle, et ne peut donc être prise, ainsi qu’on l’a fait parfois dans le passé, comme définition de fonction continue sur un intervalle. En fait, on sait maintenant qu’une fonction ayant la propriété de valeur intermédiaire sur R peut être discontinue en chaque point de R ! Il résulte de la proposition précédente que toute fonction qui, sur un intervalle I de R, prend un nombre fini strictement supérieur à un de valeurs réelles ne peut appartenir à N (I, R) puisqu’elle ne peut vérifier la propriété de valeur intermédiaire. Ainsi, la fonction sgn x (signe de x) définie par sgn x = −1 pour x < 0, sgn 0 = 0 et sgn x = +1 pour x > 0 n’est primitivable sur aucun intervalle contenant l’origine. 9.2 Règles de primitivation Les règles de dérivation des fonctions composées et du produit de deux fonctions se traduisent, dans le langage des primitives, en conditions suffisantes de primitivabilité et en règles de calcul des primitives. Le premier résultat s’appelle la règle de primitivation par substitution. Proposition. Soit g une fonction réelle dérivable sur l’intervalle I ⊂ R et f une fonction de R dans Rp primitivable sur g(I). Alors (f ◦ g)g $ ∈ N (I, Rp) et J J (f ◦ g)g $ = ( f ) ◦ g. Démonstration. Si F désigne une primitive de f sur g(I), le théorème de dérivation des fonctions composées entraı̂ne la dérivabilité sur I de la fonction F ◦ g et la relation (F ◦ g)$ = (F $ ◦ g)g $ = (f ◦ g)g $, ce qui montre que (f ◦ g)g $ ∈ N (I, Rp) et que la formule de l’énoncé est satisfaite. Exemple. Si f ∈ N ([−1, 1], Rp), alors les fonctions x 2→ f (sin x) cos x et x 2→ f (cos x) sin x appartiennent à N (R, Rp) et leurs primitives sont données respectivement par F ◦ sin +c et F ◦ cos +c où F est une primitive de f sur [−1, 1]. 328 CHAPITRE 9. FONCTIONS PRIMITIVABLES Corollaire. Si f ∈ N (I, Rp), alors pour tout réel a /= 0, la fonction f (a·) : x 2→ f (ax) est primitivable sur a−1 I et l’on a J f (a·) = a−1 4J 5 f (a·). Démonstration. Il suffit d’appliquer la proposition précédente avec g définie par g(x) = ax et le fait que N (a−1 I, Rp) est un espace vectoriel. Une autre conséquence du théorème de dérivation des fonctions composées est la règle de primitivation par changement de variable. Proposition. Soient I et J deux intervalles de R et h une bijection de J sur I telle que h et h−1 soient dérivables sur J et I respectivement. Si f est une fonction de R dans Rp définie sur I et si (f ◦ h)h$ est primitivable sur J, alors f est primitivable sur I et J f= 4J 5 (f ◦ h)h$ ◦ h−1 . Démonstration. Par hypothèse, si G désigne une primitive de (f ◦ h)h$ sur J, le théorème de dérivation des fonctions composées appliqué à G ◦ h−1 entraı̂ne sa dérivabilité sur I et la formule [G ◦ h−1 ]$ = (G$ ◦ h−1 )(h−1 )$ = f.(h$ ◦ h−1 ).(h−1 )$ = f, puisque, de l’identité h ◦ h−1 = I sur I, on déduit, par le théorème de dérivation des fonctions composées, 1 = (h ◦ h−1 )$ = (h$ ◦ h−1 )(h−1 )$ . Donc f est primitivable sur I et la formule de l’énoncé est satisfaite. Remarque. Avec les notations de la Proposition ci-dessus, on vérifie aisément que la formule J f= 4J 5 (f ◦ h)h$ ◦ h−1 reste valable si h−1 n’est plus supposé dérivable sur I à condition de supposer que f est primitivable sur I. Exemple. Si P est un polynôme de R dans C et si f est définie par f (x) = √ P ( x), alors f ∈ N (R∗+ ) et J √ f = Q( ·), 329 9.2. RÈGLES DE PRIMITIVATION pour toute primitive Q du polynôme P̃ : y 2→ 2yP (y). En effet, l’application h : R∗+ → R∗+ , y 2→ y 2 est une bijection dérivable ainsi que sa réciproque, et h$ (y) = 2y. Dès lors, f (h(y))h$ (y) = 2yf (y 2 ) = 2yP (y) = P̃ (y) pour tout y strictement positif, ce qui entraı̂ne que (f ◦h)h$ , égal sur R∗+ à un polynôme de R dans C, y est primitivable. Par la proposition ci-dessus, f est primitivable sur R∗+ et ses primitives sont données par la formule annoncée. Le résultat suivant, qui s’appelle la règle de primitivation par parties, découle du théorème de dérivation d’un produit de fonctions. Proposition. Soient f et g deux fonctions à valeurs dans K dérivables sur un intervalle I ⊂ R. Alors f $ g ∈ N (I, K) si et seulement si f g $ ∈ N (I, K), auquel cas l’on a J J f $g = f g − f g $. Démonstration. Le théorème de dérivation d’un produit de fonctions entraı̂ne la dérivabilité de f g sur I et la formule (f g)$ = f $ g + f g $ . Comme (f g)$ est évidemment primitivable sur I, avec f g comme primitive, il suffit d’utiliser le caractère d’espace vectoriel de N (I, K) pour achever la démonstration. Exemples. 1. La fonction ln est primitivable sur tout intervalle I ⊂ R∗+ et ses primitives sont données par les fonctions x 2→ x ln x − x + c. En effet, en prenant f (x) = x, g(x) = ln x, on voit que, pour tout x ∈ R∗+ , on a ln x = f $ (x)g(x), f (x)g(x) = x ln x et f (x)g $ (x) = 1; donc f g $ est primitivable sur I et ses primitives sont données par la formule ci-dessus. 2. Si P est un polynôme de R dans K et a ∈ K \ {0}, toute exponentiellepolynôme f : x 2→ P (x). exp ax est primitivable sur R. Pour le montrer, on procède par récurrence sur le degré du polynôme P . C’est évidemment vrai, par les résultats qui précèdent, si P est un polynôme de degré zéro. Supposons le résultat vrai pour un polynôme de degré n−1 et soit P un polynôme de degré n. Alors P $ est un polynôme de degré n−1 et P $ (·). exp(a·) est primitivable sur R par l’hypothèse de récurrence. Il en sera de même, par la règle de primitivation par parties, pour la fonction P (·).(exp(a·))$ = aP (·). exp(a·) et dès lors pour P (·). exp(a·). En outre, on a J P (·). exp(a·) = a−1 P (·). exp(a·) − a−1 J P $ (·). exp(a·), 330 CHAPITRE 9. FONCTIONS PRIMITIVABLES et en appliquant cette formule successivement à P $ (·). exp(a·), P $$(·). exp(a·), . . . et en recombinant les résultats, on obtient la formule J P (·). exp(a·) = [a−1 P (·)−a−2 P $ (·)+. . .+(−1)n−1 a−n P (n−1) (·)+(−1)na−n−1 P (n) (·)] exp(a·). Montrons enfin que la théorie des primitives fournit une expression du reste du développement de Taylor d’une fonction réelle d’une variable. Proposition. Si m ≥ 0 est un entier et si f est une fonction réelle (m + 1)fois dérivable sur un intervalle I, alors, pour chaque a ∈ I, et chaque h ∈ I −a différent de 0, l’application φh : I → R, y 2→ f (m+1) (y) (a + h − y)m m! est primitivable sur I et sa primitive Φh,a qui s’annule en a est égale à la m valeur Rm f,a (h) en h du reste du développement de Taylor Tf,a d’ordre m de f autour de a. Démonstration. Définissons l’application g de I dans R par g(y) = m $ f (j) (y) j=0 j! (a + h − y)j . m Par hypothèse, g est dérivable sur I, g(a) = Tf,a (h), g(a + h) = f (a + h) et, pour chaque y ∈ I, on a g $ (y) = m $ f (j+1)(y) j=0 j! (a + h − y)j − m $ f (j) (y) (j − 1)! j=1 (a + h − y)j−1 f (m+1) (y) (a + h − y)m = φh (y). m! Donc φh est primitivable et la valeur en a + h de sa primitive s’annulant en a est donnée par = m g(a + h) − g(a) = f (a + h) − Tf,a (h) = Rm f,a(h). 9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES 9.3 331 Primitivation des fonctions rationnelles Soit f une fonction rationnelle de R dans K, où K = R ou C, c’est-àdire une fonction de la forme f = PQ où P et Q sont des polynômes d’une variable réelle à coefficients dans K. Si le degré de P est supérieur ou égal au degré de Q, on peut toujours écrire, en utilisant l’algorithme de division des polynômes, P R =S+ Q Q où S et R sont des polynômes d’une variable réelle à valeurs dans K tels que le degré de R est strictement inférieur à celui de Q. Comme S est P primitivable et que l’on possède une formule pour calculer sa primitive, Q sera primitivable si et seulement s’il en est de même de R Q ; il suffit donc d’étudier la primitivabilité de f sous l’hypothèse que le degré de P est P strictement inférieur à celui de Q. Rappelons aussi que Q est définie sur P le complémentaire dom Q dans R de l’ensemble des zéros réels de Q et qu’il faut donc entendre par primitivabilité de PQ sa primitivabilité sur chacun des intervalles ouverts qui forment dom PQ . Enfin, si m désigne le degré de Q, c’est-à-dire si l’on peut écrire Q(x) = m $ aj xj j=0 avec am /= 0, alors, comme on l’a déjà signalé, le théorème fondamental de l’algèbre affirme l’existence de q ≤ m nombres complexes distincts s1 , . . ., sq les racines de l’équation Q(x) = 0, et de q entiers m1 , . . . , mq supérieurs ou égaux à un, leurs multiplicités, tels que, pour tout x ∈ R, on a Q(x) = am (x − s1 )m1 (x − s2 )m2 . . . (x − sq )mq . Enfin, rappelons que l’ensemble des polynômes de R dans K de degré inférieur ou égal à m, muni des lois habituelles d’addition des polynômes et de multiplication d’un polynôme par un élément de K, forme un espace vectoriel sur K de dimension m+1 dont une base évidente est donnée par les monômes 1, x, . . ., xm. Une autre base très utile est donnée par le résultat d’algèbre suivant, qui se démontre par récurrence. Lemme. Si Q est le polynôme de R dans C de degré effectif m donné par Q(x) = am (x − s1 )m1 (x − s2 )m2 . . . (x − sq )mq , 332 CHAPITRE 9. FONCTIONS PRIMITIVABLES alors les polynômes Qj,k de R dans C donnés par Qj,k (x) = am (x − s1 )m1 . . . (x − sj )mj −k . . . (x − sq )mq , (1 ≤ k ≤ mj , 1 ≤ j ≤ m), et obtenus en divisant Q respectivement par (x − sj )k , 1 ≤ k ≤ mj , 1 ≤ j ≤ m, forment une base de l’espace vectoriel des polynômes de R dans C de degré inférieur ou égal à m − 1. Une conséquence facile de ce lemme est le résultat suivant. Corollaire. Si Q est donné par le lemme précédent et si P est un polynôme de R dans C de degré inférieur ou égal à m − 1, il existe une famille unique de nombres complexes cj,k , (1 ≤ k ≤ mj , 1 ≤ j ≤ m) telle que, pour tout x ∈ dom PQ , on a , - mj q P (x) $ $ cj,k (x − sj )−k . = Q(x) j=1 k=1 Ce corollaire entraı̂ne que la primitivabilité de PQ , et le calcul de ses primitives, revient à celle des fonctions rationnelles particulières du type g(x) = (x − s)−k où s ∈ C et k ∈ N∗ . On vérifie sans peine que, pour k ≥ 2, on a, sur chaque intervalle de R \ {s}, g(x) = G$ (x) pour G(x) = c + (1 − k)−1 (x − s)−k+1 , c étant un nombre complexe arbitraire. Par conséquent, une telle fonction rationnelle f est primitivable sur chaque intervalle en question et ses primitives sont données par la formule ci-dessus. Si nous posons s = u + iv avec u la partie réelle de s et v la partie imaginaire de s, les primitives G de g peuvent encore s’écrire, avec s̄ = u − iv, F (x) = c + (1 − k)−1 (x − s̄)k−1 . [(x − u)2 + v 2 ]k−1 Si k = 1 et s = 0, g est primitivable sur R∗− et sur R∗+ et ses primitives G y sont données par la formule G(x) = c + ln |x|, 333 9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES où c est une constante complexe arbitraire. Si k = 1 et s = u est réel, g est primitivable sur R∗− et sur R∗+ et ses primitives G y sont données par la formule G(x) = c + ln |x − u|. Enfin, si k = 1 et v /= 0, alors, pour tout x ∈ R, on a x−u iv g(x) = + 2 2 (x − u) + v (x − u)2 + v 2 2 3 @ d ? d x−u (1/2) ln[(x − u)2 + v 2 ] + i arctg dx dx v en utilisant les règles de dérivation des fonctions élémentaires et le théorème de dérivation des fonctions composées. En conséquence, les primitives G de g sont données par la formule x−u G(x) = c + (1/2) ln[(x − u)2 + v 2 ] + i arctan . v En conclusion, quels que soient s ∈ C et k ∈ N∗ , la fonction g est primitivable sur chaque intervalle contenu dans son domaine et les formules ci-dessus fournissent les primitives dans les différents cas. Ces résultats, joints au corollaire ci-dessus et au caractère d’espace vectoriel de N (I, K), impliquent la primitivabilité de PQ sur tout intervalle I contenu dans son domaine et fournissent explicitement ses primitives. La méthode que nous venons de développer s’applique bien entendu au cas particulier des fonctions rationnelles de R dans R mais l’on sait que les zéros sj d’un polynôme Q réel peuvent être complexes non réels ainsi que les coefficients cj,k donnés par le corollaire ci-dessus. Si PQ est une fonction rationnelle de R dans R, il est intéressant d’exprimer ses primitives en termes purement réels. Pour ce faire, rappelons que si Q est réel et si sj est un zéro non réel de Q de multiplicité mj , alors sj sera également un zéro de Q de même multiplicité mj . En conséquence, les zéros de Q pourront être rangés comme suit r1 , . . . , rl , t1 , . . . , tn , t1 , . . . , tn , = avec les multiplicités respectives m1 , . . . , ml , m$1 , . . . , m$n, m$1 , . . . , m$n , où les rj sont réels, les tj sont complexes non réels, l + 2n = q et % 2 nj=1 m$j = m. On a donc, par le corollaire ci-dessus l mj n m"j %l j=1 mj + $$ P (x) $ $ cj,k (x − rj )−k + [c$j,k (x − tj )−k + c$$j,k (x − tj )−k ], = Q(x) j=1 k=1 j=1 k=1 334 CHAPITRE 9. FONCTIONS PRIMITIVABLES les constantes complexes cj,k , c$j,k et c$$j,k étant univoquement déterminées. En égalant le complexe conjugué des deux membres de cette égalité et en utilisant le caractère réel de x, P (x), Q(x) et rj , on obtient m"j mj l $ n $D E $ P (x) $ = cj,k (x − rj )−k + c$j,k (x − tj )−k + c$$j,k (x − tj )−k , Q(x) j=1 k=1 j=1 k=1 et dès lors l’unicité des constantes cj,k , c$j,k et c$$j,k entraı̂ne que cj,k = cj,k , (1 ≤ k ≤ mj ; 1 ≤ j ≤ l), c$j,k = c$$j,k , (1 ≤ k ≤ m$j ; 1 ≤ j ≤ l). Les fonctions cj,k (x − rj )−k sont réelles et primitivables sur ] − ∞, rj [ et ]rj , +∞[, et y ont comme primitives les fonctions x 2→ c + cj,k (1 − k)−1 (x − rj )−k+1 , si k /= 1, et x 2→ c + cj,k ln |x − rj |, si k = 1, où c est une constante réelle arbitraire. Par ailleurs, les fonctions x 2→ c$j,k (x − tj )−k + c$$j,k (x − tj )−k = c$j,k (x − tj )−k + c$j,k (x − tj )−k = c$j,k (x − tj )k + c$j,k (x − tj )k [(x − uj )2 + vj2 ]k = Pk (x) , [(x − uj )2 + vj2 ]k où l’on a posé tj = uj + ivj et où Pk désigne un polynôme réel de degré inférieur ou égal à k, se ramènent, après division du polynôme Pk par le polynôme [(x − uj )2 + vj2 ]p où p est le plus grand entier tel que 2p ≤ k, à des fonctions hr du type hr (x) = a + bx , [(x − uj )2 + vj2 ]r où r est un entier compris entre 1 et k, vj /= 0 et a, b ∈ R. Si b = 0, la primitivation de hr se ramène, par changement de variable y = x − uj , à 1 la primitivation de fonctions du type gr (y) = (y2 +v 2 )r . Pour r = 1, g1 est primitivable sur R et ses primitives sont les fonctions G1 données par G1 (y) = 1 y arctg . v v 335 9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES Pour r > 1, comme v 2 gr (y) = on aura J (y 2 + v 2 ) − y 2 y2 = gr−1 (y) − 2 , 2 2 r (y + v ) (y + v 2 )r gr = v −2 J gr−1 − v −2 J Mais, (y 2 y2 dy. + v 2 )r 2 3 y2 1 1 d =− , y 2 (y + v 2 )r 2r − 2 dy (y 2 + v 2 )r−1 et la formule de primitivation par parties entraı̂ne la relation J y2 1 dy = −H + 2 2 r (y + v ) 2r − 2 = −H + où H est définie par H(y) = Dès lors, J gr = v 1 2r − 2 J J (y 2 1 dy + v 2 )r−1 gr−1 , 1 y . 2 2r − 2 (y + v 2 )r−1 −2 2 2r − 3 2r − 2 J 3 gr−1 + H , H ce qui permet, de proche en proche, de ramener le calcul de gr à celui, H connu, de g1 . Lorsque b /= 0, la primitivation de la fonction hr se ramène à la primitivation d’une fonction de type précédent et d’une fonction fr de la forme x fr (x) = . [(x − uj )2 + vj2 ]r Le changement de variable y = (x − uj )2 + vj2 ramène le calcul de cette primitive à celui de la fonction y 2→ y −r , considéré plus haut. En rassemblant ces résultats, on obtient une primitive réelle de PQ sur tout intervalle contenu dans le domaine de la fonction. 336 9.4 CHAPITRE 9. FONCTIONS PRIMITIVABLES Fonctions irrationnelles, transcendantes Nous allons indiquer dans ce paragraphe quelques types de fonctions irrationnelles ou transcendantes élémentaires dont la primitivation se ramène, par un changement de variable adéquat à celle de fonctions rationnelles. La liste donnée est loin d’être exhaustive et l’on pourra consulter à ce sujet les tables de primitives. Soit P un polynôme irréductible de R2 dans R et C la courbe algébrique d’équation P (x, y) = 0. On appelle intégrale abélienne attachée à la courbe C (on devrait plutôt dire primitive abélienne mais l’usage a consacré la terminologie précédente) toute primitive d’une fonction (de x) du type R(x, y) où R est une fonction rationnelle de R2 dans R et où y est remplacé par une des racines y(x) de l’équation ci-dessus. Si l’on peut trouver deux fonctions rationnelles M et N et un intervalle I tels que cette équation soit satisfaite si et seulement si x = M (t), y = N (t), (t ∈ I), on dit que la courbe C est unicursale et l’intégrale abélienne attachée à C se ramène à la primitive de la fonction rationnelle t 2→ R[M (t), N (t)]M $(t). L’obtention des fonctions M et N (c’est-à-dire l’uniformisation de C par des fonctions rationnelles) est un problème difficile. Nous nous contenterons de donner quelques exemples simples. 8 G 9 2 a. f (x) = R x, m ax+b cx+d où R est une fonction rationnelle de R dans K, m ∈ N∗ , a, b, c, , d ∈ R. Si m est pair, on doit bien entendu se limiter aux valeurs de x pour lesquelles ax+b cx+d ≥ 0. Il s’agit d’une intégrale abélienne avec P (x, y) ≡ (cx + b)y m − (ax + b). Introduisons le changement de variable x = h(t) défini par la relation −1 t=h (x) = K m ax + b , cx + d ce qui donne x = h(t) = − b − dtm $ mtm−1 (ad − bc) , h (t) = , a − ctm (ctm − a)2 9.4. FONCTIONS IRRATIONNELLES, TRANSCENDANTES y= K m 337 ah(t) + b = t. ch(t) + d En conséquence, (f ◦ h)h$ est une fonction rationnelle de R dans K, donc primitivable; dès lors, par le théorème de changement de variable, f sera primitivable sur tout intervalle I = h(J) tel que h soit injective sur J et l’on pourra calculer les primitives par les méthodes de la section précédente. 8 √ 9 b. f (x) = R x, ax2 + bx + c où R est une fonction rationnelle de R2 dans K, a, b, c ∈ R, a /= 0. Il s’agit d’une intégrale abélienne avec P (x, y) ≡ y 2 − ax2 − bx − c. On se limitera aux valeurs de x pour lesquelles ax2 + bx + c ≥ 0 et l’on peut exclure le cas où la fonction x 2→ ax2 + bx + c a un zéro double puisqu’alors f est une fonction rationnelle. 1. Si a > 0 et b2 − 4ac /= 0, on introduit le changement de variable x = h(t) par la relation L √ t = h−1 (x) = ax + ax2 + bx + c, ce qui donne √ √ t2 − c 2( at2 + bt + ac) $ √ x = h(t) = √ , , h (t) = 2 at + b (2 at + b)2 y= G √ √ a[h(t)]2 + bh(t) + c = t − (2 at + b)−1 a(t2 − c). En conséquence, (f ◦ h)h$ est une application rationnelle de R dans K et elle est donc primitivable sur R. Par le théorème de changement de variable, f sera primitivable sur tout intervalle I = h(J) tel que h soit injective sur J, et les primitives F de f seront obtenues en composant les primitives de √ √ (f ◦ h)h$ avec la fonction x 2→ ax + ax2 + bx + c. 2. Si a < 0, il faut que b2 − 4ac > 0 et que x ∈ ]p, q[ où p < q sont les zéros distincts du polynôme ax2 + bx + c. On a, pour tout x ∈ ]p, q[, L ax2 + bx + c = G a(x − p)(x − q) = (x − p) K a(x − q) . x−p Le changement de variables x = h(t) défini par la relation t = h−1 (x) = K a(x − q) , x−p 338 CHAPITRE 9. FONCTIONS PRIMITIVABLES et qui donne x = h(t) = G pt2 − aq $ 2at(q − p) , , h (t) = 2 2 t −a (t − a)2 a(p − q)t , t2 − a est tel que (f ◦h)h$ est une fonction rationnelle de R dans K. Par le théorème du changement de variable, f sera primitivable sur tout intervalle I = h(J) tel que h soit injective sur J et les primitives F de f seront G obtenues en $ composant les primitives de (f ◦ h)h avec la fonction x 2→ a(x−q) x−p . y= a[h(t)]2 + bh(t) + c = 8 L 9 Remarque. Les primitives des fonctions de type f (x) = R x, P (x) lorsque P est un polynôme de degré p ≥ 3 et R une fonction rationnelle ne peuvent pas en général s’exprimer au moyen des fonctions élémentaires et conduisent à des fonctions transcendantes nouvelles appelées intégrales elliptiques si p = 3, 4 et intégrales hyperelliptiques lorsque p ≥ 5. L’étude de ces intégrales et des fonctions réciproques correspondantes (en particulier des fonctions elliptiques) doit se faire dans le cadre de la théorie des fonctions complexes d’une variable complexe. c. f (x) = R(cos x, sin x, cos 2x, sin 2x, . . ., cos mx, sin mx), m ∈ N∗ , où R est une fonction rationnelle de R2m dans K. En utilisant les formules trigonométriques classiques exprimant cos kx et sin kx comme polynôme en cos x et sin x, on peut exprimer f sous la forme f (x) = S(cos x, sin x), où S est une fonction rationnelle de R2 dans K. En utilisant les relations trigonométriques connues cos x = 1 − tg 2 (x/2) 2tg (x/2) , sin x = , 1 + tg 2 (x/2) 1 + tg 2 (x/2) on obtient S(cos x, sin x) = T [tg (x/2)], où T est une fonction rationnelle de R dans K. Le changement de variable x = h(t) défini par la relation t = h−1 (x) = tg (x/2), et donc tel que x = h(t) = 2arctg t, h$ (t) = 2 , 1 + t2 9.5. CALCUL APPROCHÉ DES PRIMITIVES 339 montre que (f ◦ h)h$ = T h$ est une fonction rationnelle de R dans K. Le théorème de changement de variable assure donc la primitivabilité de f sur tout intervalle I = h(J) tel que h est injective sur J et les primitives de (t) f s’obtiennent en composant les primitives de la fonction t 2→ 2T avec la 1+t2 fonction t = tg (x/2). Les quelques exemples que nous venons de donner montrent que, pour une fonction primitivable sur un intervalle I, le calcul effectif peut être extrêmement compliqué et aucune méthode générale n’existe. Il faudrait d’ailleurs d’abord s’entendre sur ce que l’on appelle “calcul effectif”. Au XIXe siècle, Joseph Liouville donna à cette question la forme classique suivante : étant donné un ensemble de fonctions réelles d’une variable réelle appelées fonctions élémentaires, et formé des fonctions qui peuvent s’écrire en itérant, à partir de la variable x et de constantes, les quatre opérations d’addition, soustraction, multiplication, division ainsi que la prise de logarithmes, d’exponentielles ou l’extraction de racines de polynômes, calculer sa primitive ou démontrer qu’elle n’est pas une fonction élémentaire. Liouville donna, entre 1833 et 1841, plusieurs contributions fondamentales à ce problème qui est encore ouvert. Il a fallu attendre les travaux de Maxwell Rosenlicht en 1968 pour obtenir une formulation algébrique précise du problème et des généralisations des résultats de Liouville. Robert Risch en 1969 a prouvé l’existence d’un algorithme répondant à la question ci-dessus pour le sous-ensemble des fonctions élémentaires dites “purement transcendantes” et J.H. Davenport en 1979 a fait de même pour la sous-classe des fonctions élémentaires algébriques. En outre, pour des sous-ensembles importants de fonctions, ces algorithmes ont été respectivement programmés dans le cadre des méthodes de calcul symbolique sur ordinateur MACSYMA et REDUCE, mais le problème général correspondant reste ouvert. 9.5 Calcul approché des primitives L’impossibilité de la détermination explicite des primitives d’une fonction primitivable nous suggère de retourner à l’idée fondamentale de “résolution approchée indéfiniment précise d’un problème dont la solution exacte est impossible” qui sous-tend de nombreux concepts fondamentaux de l’analyse mathématique. Nous allons démontrer qu’étant donné une fonction f primitivable sur un intervalle I, un point a de I, un point x > a de I et un nombre ! > 0, il est possible d’obtenir (au moins théoriquement) une valeur approchée de Fa (x) avec une erreur inférieure ou égale à !. C’est l’importante 340 CHAPITRE 9. FONCTIONS PRIMITIVABLES propriété d’approximation des primitives. Proposition. Soit f une fonction de R dans Rp primitivable sur l’intervalle I, a ∈ I et Fa la primitive de f qui s’annule en a. Pour chaque x ∈ I tel que x > a et chaque ! > 0, il existe une jauge δ sur [a, x] telle que, pour toute A B P-partition δ-fine Π = (xj , ]aj−1 , aj ]) 1≤j≤m avec a = a0 < a1 < . . . < am−1 < am = x, on a # # # # m $ # # j j j−1 # #Fa (x) − f (x )(a − a )# ≤ !. # # # j=1 2 Démonstration. Soit ! > 0; pour chaque y ∈ I, Fa$ (y) = f (y) et il existe donc un δ(y) > 0 tel que, pour chaque u ∈ I ∩ [y − δ(y), y + δ(y)], on a |Fa (u) − Fa (y) − f (y)(u − y)|2 ≤ ! |u − y|; x−a dès lors, si u et v appartiennent à I et sont tels que y − δ(y) ≤ u ≤ y ≤ v ≤ y + δ(y), on aura |Fa (v) − Fa (u) − f (y)(v − u)|2 = |Fa (v) − Fa (y) − f (y)(v − y) − [Fa (u) − Fa (y) − f (y)(u − y)]|2 ≤ |Fa (v) − Fa (y) − f (y)(v − y)|2 + |Fa (u) − Fa (y) − f (y)(u − y)|2 ! ! ! ≤ (|v − y| + |u − y|) = (v − y + y − u) = (v − u). x−a x−a x−a Soit δ : y 2→ δ(y) la jauge ainsi définie sur I, et donc sur [a, x]. Si Π = A j B (x , ]aj−1 , aj ]) 1≤j≤m avec a = a0 < a1 < . . . < am−1 < am = x, est une P-partition δ-fine de ]a, x], alors on a xj − δ(xj ) ≤ aj−1 ≤ xj ≤ aj ≤ xj + δ(xj ), (1 ≤ j ≤ m), et dès lors, en utilisant l’inégalité ci-dessus, # # # # #Fa (aj ) − F (aj−1 ) − f (xj )(aj − aj−1 )# ≤ 2 Comme on a évidemment Fa (x) = m D $ j=1 ! (aj − aj−1 ), (1 ≤ j ≤ m). x−a E F (aj ) − F (aj−1 ) , 341 9.5. CALCUL APPROCHÉ DES PRIMITIVES on en déduit # # # # m $ # # j j j−1 # #Fa (x) − f (x )(a − a )# # # # j=1 2 # # #m D E## #$ j j−1 j j j−1 = ## Fa (a ) − Fa (a ) − f (x )(a − a ) ## # #j=1 2 ≤ m # $ j=1 m # $ # # #Fa (aj ) − Fa (aj−1 ) − f (xj )(aj − aj−1 )# ≤ 2 ! (aj − aj−1 ) = !. x − a j=1 Lorsque f est à valeurs positives sur [a, x], les expressions m $ j=1 f (xj )(aj − aj−1 ) associées à la P-partition Π par le résultat précédent représentent la somme des aires de rectangles de base [aj−1 , aj ] et de hauteur f (xj ) et peuvent donc être considérées comme une approximation de l’aire de la figure plane E(f ) définie par E(f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [a, x]}, c’est-à-dire du polygone curviligne délimité par l’intervalle [a, x] de l’axe des x1 , par les parallèles à l’axe des x2 menées par les points (a, 0) et (x, 0) et par le graphe de f . Cette approximation consiste à remplacer l’aire de chaque figure curviligne constituante Ej (f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [aj−1 , aj ]} (1 ≤ j ≤ m) par celle du rectangle de même base et de hauteur f (xj ). Par conséquent, la quantité Fa (x) approchée indéfiniment par ces expressions sera un candidat naturel pour la valeur de l’aire de la figure curviligne E(f ). On obtient ainsi un lien étonnant entre le concept de primitive, directement issu du concept de dérivée, c’est-à-dire, géométriquement, et la notion de tangente au graphe de f , de celui d’aire de la figure plane curviligne E(f ) associée à f . C’est la découverte de ce lien par Isaac Newton et par Gottfried Leibniz, il y a plus de trois cents ans, qui a donné naissance au calcul différentiel et intégral. 342 CHAPITRE 9. FONCTIONS PRIMITIVABLES 9.6 Exercices 1. Montrer que si f et g sont deux fonctions réelles primitivables sur l’intervalle I et telles que, pour tout x ∈ I, on Hait f (x)H ≤ g(x), alors, pour tout a ∈ I et tout x ≥ a appartenant à I, on a ax f ≤ ax g. 2. Soient I ⊂ R un intervalle, a ∈ I, f une fonction réelle d’une variable réelle, g une fonction positive d’une variable réelle et C ≥ 0. Si f g et g sont primitivables sur I et si, pour tout x ≥ a appartenant à I, on a J f (x) ≤ C + x f g, a alors, pour les mêmes valeurs de x, on a f (x) ≤ C exp 4J x 5 g . a (Lemme de Gronwall). Ce lemme, qui transforme une inéquation sur f en une inégalité sur f, joue un rôle important dans l’étude des équations différentielles. Suggestion. Utiliser l’hypothèse pour montrer que 2 4 J D exp − x g a 5J x a 3 4 f g ≤ Cg(x) exp − J x 5 g . a En déduire par l’exercice 1 que 4 exp − J x g a 5J x a fg ≤ C J 4 x a g exp − J 553 2 · a 5 g . Noter que J x a 4 g exp − En déduire J a · 5 g = J x a J x a 2 4 4 J f g ≤ C exp 4J −D exp − 2 · g a x a 5 4 = C 1 − exp − 3 J a x g 53 . g −1 , et introduire cette dernière inégalité dans l’hypothèse. 3. Montrer que si a ∈ R∗ , alors, sur tout intervalle de R ne contenant pas ±a, on a # # J #x − a# dx 1 # # = log #x + a# . x2 − a2 2a 343 9.7. PETITE ANTHOLOGIE 4. Utiliser la formule de primitivation par parties pour montrer que, si n ≥ 2 est un entier, alors J sinn x dx = − J sin x cosn−1 x n − 1 cos x dx = + n n cos x sinn−1 x n − 1 − n n n J J sinn−2 x dx, cosn−2 x dx. 5. Utiliser les identités trigonométriques (qui se déduisent facilement de la formule de Moivre) cos mx cos nx = 1 [cos(m + n)x + cos(m − n)x], 2 1 [cos(m − n)x − cos(m + n)x], 2 1 sin mx cos nx = [sin(m + n)x + sin(m − n)x], 2 où m et n sont des entiers positifs, pour calculer les primitives des premiers membres. sin mx sin nx = 9.7 Petite anthologie Dans des lettres échangées il y a une dizaine d’années avec le très habile géomètre G.W. Leibniz, je lui ai fait savoir que j’étais en possession d’une méthode pour déterminer les maxima et les minima, mener les tangentes et traiter les autres questions semblables, méthode qui servait aussi bien dans le cas des racines que dans celui des expressions rationnelles; je lui cachais cette méthode dans la phrase suivante écrite en lettres transposées : Etant donnée une équation contenant un nombre quelconque de quantités variables ou fluentes, trouver leurs fluxions et inversement. Cet homme illustre me répondit qu’il était aussi tombé sur une méthode analogue et il me communiqua cette méthode qui s’écarte à peine de la mienne, sauf dans les termes et les notations. Isaac Newton, 1687 Considérant que les grandeurs qui croissent dans des temps égaux sont plus grandes ou moindres suivant qu’elles croissent avec une vitesse plus grande ou plus petite, je cherchai une méthode pour déterminer les grandeurs 344 CHAPITRE 9. FONCTIONS PRIMITIVABLES d’après les vitesses des mouvements ou accroissements qui les engendrent; en nommant fluxions les vitesses de ces mouvements ou accroissement, tandis que les grandeurs engendrées prendraient le nom de fluentes, je suis tombé, vers les années 1665 et 1666, sur la méthode des fluxions, dont je ferai usage dans la quadrature des courbes. Les fluxions sont, d’aussi près que possible, proportionnelles aux accroissements des fluentes, engendrés dans des intervalles de temps égaux et aussi petits que possible; elles sont dans la raison première des accroissements naissants et peuvent être représentées par des lignes qui leur soient proportionnelles. Isaac Newton, 1704 Mais d’après ce que j’ai montré dans ma méthode des tangentes, on voit H que d( 12 xx) = x dx, et donc inversement 12 xx = x dx (car à l’exemple des puissances et des racines dans le calcul ordinaire, dans mon calcul, sommes H et différences, c’est-à-dire et d, sont réciproques). Gottfried W. Leibniz, 1686 Les intégrales des différentielles sont ces quantités dont ces différentielles proviennent par différentiation. Jean Bernoulli, 1691 Le calcul intégral est la méthode par laquelle, à partir d’une relation entre les différentielles, on retrouve la relation entre les quantités elles-mêmes. Leonard Euler, 1768 Chapitre 10 Fonctions intégrables 10.1 Intégrabilité sur un pavé On a vu au chapitre précédent que si f est une fonction de R dans Rp primitivable sur un intervalle I et si a < b appartiennent à I, les expressions m $ j=1 f (xj )(aj − aj−1 ) A B associées à la P-partition Π = (xj , ]aj−1 , aj ]) 1≤j≤m de ]a, b] deviennent arbitrairement proche d’un élément de Rp (à savoir F (b)−F (a) où F désigne une primitive de f sur I), lorsque Π est “suffisamment fine”. Nous avons également vu l’interprétation de ce résultat en termes d’aire de la figure plane E(f ) définie par E(f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [a, b]}, lorsque f est une fonction positive. Par ailleurs, cette propriété de “convergence” des expressions m $ j=1 f (xj )(aj − aj−1 ) est également vérifiée pour des fonctions qui ne sont pas primitivables sur I. Ainsi, on sait que la fonction f définie sur R par f (x) = 1 si x < 0, f (x) = 2 si x ≥ 0, n’est primitivable sur aucun intervalle Bcontenant l’origine. Pourtant, si ! > 0 A est donné et si Π = (xj , ]aj−1 , aj ]) 1≤j≤m est une P-partition δ-fine de 345 346 CHAPITRE 10. FONCTIONS INTÉGRABLES ] − 1, 1] pour la jauge constante δ, on aura, si k est le plus grand entier entre 1 et m tel que ak < 0, m $ j=1 = k $ j=1 f (xj )(aj − aj−1 ) (aj − aj−1 ) + f (xk+1 )(ak+1 − ak ) + 2 m $ j=k+2 (aj − aj−1 ) = ak + 1 + f (xk+1 )(ak+1 − ak ) + 2(1 − ak+1 ). Dès lors, 3 − ak+1 = ak + 1 + (ak+1 − ak ) ≤ m $ j=1 f (xj )(aj − aj−1 ) ≤ ak + 1 + 2(ak+1 − ak ) = 3 − ak , ce qui entraı̂ne aussitôt que # # #m # #$ # j j j−1 # # ≤ max{−ak , ak+1 } ≤ 2δ ≤ !, f (x )(a − a ) − 3 # # #j=1 # si l’on choisit δ = !/2. On notera que 3 mesure l’aire de la figure plane (formée de deux rectangles) comprise entre le graphe de f , l’axe des x et les parallèles à l’axe des y menées par les points (−1, 0) et (1, 0). Dans le cas d’une fonction de R2 dans R positive sur l’adhérence I¯ d’un semi-pavé de R2 (pour laquelle aucune notion de primitive n’a été définie !), on peut encore considérer le problème de la définition et de la détermination du volume du solide correspondant ¯ G(f ) = {(x1 , x2 , x3 ) ∈ R3 : 0 ≤ x3 ≤ f (x1 , x2 ), (x1 , x2 ) ∈ I}. Le volume sera cette fois approché par des sommes de volumes de parallélépipèdes rectangles de base I j et de hauteur f (xj ), où {I 1 , . . . , I m} est une partition de I en semi-pavés I j = ]aj1 , bj1]× ]aj2 , bj2] et où xj ∈ I¯j , (1 ≤ j ≤ m), c’est-à-dire par des expressions du type m $ j=1 f (xj )(bj1 − aj1 )(bj2 − aj2 ). 347 10.1. INTÉGRABILITÉ SUR UN PAVÉ Plus généralement encore, on pourra chercher à définir et à déterminer l’hypervolume d’un ensemble de Rn+1 du type ¯ H(f ) = {x ∈ Rn+1 : 0 ≤ xn+1 ≤ f (x1 , . . . , xn ), (x1 , . . . , xn ) ∈ I}, ¯ lorsque I est un semi-pavé de Rn et f une fonction définie et positive sur I. Les expressions approchées seront de la forme m $ j=1 f (xj ) n 6 i=1 (bji − aji ), où {I 1 , . . . , I m} est une partition de I en semi-pavés I j = ]aj1 , bj1] × . . . × ]ajn , bjn], et xj = (xj1 , . . . , xjn ) ∈ I¯j , (1 ≤ j ≤ m). Ces exemples suggèrent qu’il peut être intéressant d’étudier en toute généralité la classe des fonctions de Rn dans Rp pour lesquelles les sommes %m j j j =n n j=1 f (x ) i=1 (bi − ai ) associées aux P-partitions d’un semi-pavé I ⊂ R convergent, au sens de la propriété d’approximation des primitives, vers un élément de Rp. Soit I = I1 × . . . × In , avec Ik = ]ak , bk ], (1 ≤ k ≤ n) un semi-pavé et I = I1 × . . . × In le pavé correspondant. Définition. On appelle mesure de I (longueur si n = 1, aire si n = 2, volume si n = 3), et l’on note µ(I), le réel strictement positif défini par µ(I) = (b1 − a1 )(b2 − a2 ) . . . (bn − an ) = n 6 i=1 (bi − ai ). Une conséquence immédiate de cette définition est que, si K et I sont des semi-pavés de Rn tels que K ⊂ I, alors µ(K) ≤ µ(I), l’égalité ayant lieu si et seulement si K = I. On vérifie sans peine que si I et K sont deux semi-pavés de Rn , alors I ∩ K est vide ou est un semi-pavé. Dans ce dernier cas, on pourra donc parler de la mesure µ(I ∩ K) du semi-pavé I ∩ K. On notera que, par contre, I ∪ K n’est pas en général un semi-pavé. Toutefois, si I 1 , . . . , I l sont des 348 CHAPITRE 10. FONCTIONS INTÉGRABLES semi-pavés mutuellement disjoints de Rn , on pourra définir, conformément ! à l’idée intuitive de mesure, la mesure de lj=1 I j par µ l > j=1 Soit enfin I0 I j = l $ µ(I j ). j=1 ! I deux semi-pavés. Si I 0 = I10 × . . . In0 , I = I1 × . . . × In , avec Ii0 = ]ci , di], Ii = ]ai, bi], ai ≤ ci ≤ di ≤ bi , (1 ≤ i ≤ n), l’une des inégalités entre ai et ci ou di et bi au moins étant stricte, et si l’on pose, pour chaque 1 ≤ i ≤ n, Ii1 = ]ai, ci] ou ∅ selon que ai < ci ou ai = ci , Ii2 = ]di , ci] ou ∅ selon que di < bi ou di = bi, alors on a Ii = Ii0 ∪ Ii1 ∪ Ii2 , (1 ≤ i ≤ n). En conséquence, la famille finie {I i1 ,i2 ,...,in = I1i1 × I2i2 × . . . × Inin : I i1 ,i2 ,...,in /= ∅, 0 ≤ i1 ≤ 2, . . . , 0 ≤ in ≤ 2}, constitue une partition de I en semi-pavés et I 0 = I 0,0,...,0. Il en résulte que I \ I0 = et l’on posera µ(I \ I 0 ) = > I i1 ,...,in , {0≤i1 ,...,in ≤2 : i1 +...+in >0} $ µ(I i1 ,...,in ) {0≤i1 ,...,in ≤2 : i1 +...+in >0, I i1 ,...,in (=∅} = µ(I) − µ(I 0 ). On montre de même que si I 1 , . . . , I l sont des semi-pavés disjoints contenus dans I, alors I \ (I 1 ∪ . . . ∪ I l ) est une union de semi-pavés mutuellement disjoints et l’on posera µ[I \ (I 1 ∪ . . . ∪ I l )] = µ(I) − l $ µ(I j ). j=1 Etendons maintenant aux fonctions de dans Rp les expressions qui interviennent à la fois dans l’approximation de la valeur d’une primitive et l’approximation de l’aire d’une figure plane ou du volume d’un solide. Rn 10.1. INTÉGRABILITÉ SUR UN PAVÉ 349 Définition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp définie A j j B sur I¯ et Π = (x , I ) 1≤j≤m une P-partition de I. On appelle somme de Riemann associée à I, f et Π l’élément S(I, f, Π) de Rp défini par S(I, f, Π) = m $ µ(I j )f (xj ). j=1 On vérifiera sans peine que si f et g sont deux fonctions de Rn dans Rp ¯ si c ∈ R et si Π est une P-partition de I, alors on a définies sur I, S(I, f + g, Π) = S(I, f, Π) + S(I, g, Π), S(I, cf, Π) = cS(I, f, Π), (S(I, f, Π))k = S(I, fk , Π), (1 ≤ k ≤ p), |S(I, f, Π)|j ≤ S(I, |f |j , Π), (j = 1, 2, ∞), ¯ on a tandis que si p = 1 et f (x) ≥ g(x) pour tout x ∈ I, S(I, f, Π) ≥ S(I, g, Π). Nous pouvons maintenant introduire l’importante classe de fonctions qui vérifient la propriété introduite au début de la section. Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp ¯ On dit que f est intégrable au sens de Denjoy-Perron sur définie sur I. ¯ ou DP-intégrable sur I¯ ou plus simplement intégrable sur I¯ s’il existe un I, J ∈ Rp ayant la propriété suivante: pour chaque ! > 0, il existe une jauge δ sur I¯ telle que, pour toute P-partition δ-fine Π de I, on ait |S(I, f, Π) − J|2 ≤ !. Cette définition a un sens puisque, par le théorème de Cousin, l’existence ¯ On notera aussi d’une P-partition δ-fine est garantie pour toute jauge δ sur I. que sa structure est semblable à celle de la définition de limite des valeurs d’une fonction, et que la définition ne dépend pas du choix de la norme | · |2 pour l’estimation de S(I, f, Π) − J. Enfin la terminologie “intégrable au sens de Denjoy-Perron” vient de ce que, pour n = 1, cette classe de fonctions fut introduite pour la première fois indépendamment par Arnaud Denjoy en 1912 et par Oskar Perron en 1914. Leurs définitions sont différentes et distinctes de celle donnée ici, découverte indépendamment, en 1957 par Jaroslav Kurzweil et en 1960 par Ralph Henstock. ¯ Rp) l’ensemble des fonctions de Rn dans Rp intéOn désignera par P (I, ¯ grables sur l’adhérence I d’un semi-pavé I de Rn . Montrons qu’il ne peut exister plus d’un J vérifiant les conditions de la définition. 350 CHAPITRE 10. FONCTIONS INTÉGRABLES Proposition. Il existe au plus un J ∈ Rp vérifiant les conditions de la ¯ définition d’intégrabilité sur I. Démonstration. Soit J donné par la définition et soit J $ ∈ Rp tel que, pour chaque ! > 0, il existe une jauge δ $ sur I¯ telle que, pour chaque Ppartition δ $ -fine Π$ de I, on ait |S(I, f, Π$) − J $ |2 ≤ !. On va prouver que J = J $ en montrant que |J − J $ |2 ≤ ! pour chaque ! > 0. Soient en effet δ et δ $ les jauges associées à !/2 par les définitions de J et J $ ; alors l’application δ $$ définie sur I¯ par δ $$ (x) = min[δ(x), δ $(x)] est une jauge sur I¯ et si Π$$ est une P-partition δ $$ -fine de I, elle sera à la fois δ-fine et δ $ -fine. En conséquence, on aura |J − J $ |2 ≤ |J − S(I, f, Π$$)|2 + |S(I, f, Π$$) − J $ |2 ≤ !, et la démonstration est complète. La définition suivante est donc justifiée. ¯ l’unique Définition. Si f est une fonction de Rn dans Rp intégrable sur I, élément J vérifiant la définition ci-dessus est appelé l’intégrale de f sur I¯ et noté J J J J f, f (x) µ(dx), f (x) dx ou f dµ, I¯ I¯ I¯ I¯ pour rappeler son mode de construction par les sommes de Riemann. Une telle intégrale est dite simple si n = 1 et multiple si n ≥ 2 (double pour n = 2 et triple pour n = 3). Dans le cas de l’intégrale simple de f sur [a, b], on utilise aussi les notations J b f ou a J b f (x) dx. a Enfin, il est commode de poser également J b a f =− J a b f et J a f = 0. a La propriété d’approximation de la primitive s’annulant en un point d’une fonction primitivable fournit directement une classe importante de fonctions intégrables sur un intervalle fermé et borné de R. 10.1. INTÉGRABILITÉ SUR UN PAVÉ 351 Théorème. Si f est une fonction de R dans Rp primitivable sur un intervalle fermé et borné [a, b], alors f est intégrable sur [a, x] pour chaque a < x ≤ b et, F désignant une primitive quelconque de f sur [a, b], on a, pour chaque x ∈ ]a, b], J x a et en particulier J b a f = F (x) − F (a), f = F (b) − F (a). Démonstration. Il suffit de noter que si f est primitivable sur [a, b], elle l’est aussi sur [a, x] quel que soit a < x < b et la propriété d’approximation de la primitive Fa de f s’annulant en a équivaut à l’intégrabilité de f sur [a, x]. On sait enfin que si F est une primitive quelconque de f sur [a, b], on a Fa = F (·) − F (a). Le théorème que nous venons de démontrer s’appelle le théorème fondamental du calcul différentiel et intégral. Il fournit un moyen étonnamment simple pour calculer l’intégrale sur intervalle fermé [a, b] (donc en particulier de l’aire de E(f )) de toute fonction f dont une primitive est connue: il suffit de faire la différence entre la valeur d’une primitive entre l’extrémité et l’origine de l’intervalle considéré. Le théorème fondamental du calcul différentiel et intégral montre que N ([a, b], Rp) ⊂ P ([a, b], Rp). On peut encore l’énoncer sous la forme équivalente suivante, qui fait intervenir f $ et f au lieu de f et F . Corollaire. Si f est une fonction de R dans Rp dérivable sur [a, b], alors f $ est intégrable sur [a, b] et J b a f $ = f (b) − f (a). ¯ Il existe une condition nécessaire de Cauchy d’intégrabilité sur I. Proposition. Si f est une fonction de Rn dans Rp intégrable sur l’adhérence I¯ d’un semi-pavé I de Rn , alors, pour chaque ! > 0, il existe une jauge δ sur I¯ telle que, pour chaque P-partition δ-fine Π et chaque P-partition δ-fine Π̃ de I, on a |S(I, f, Π) − S(I, f, Π̃)|2 ≤ !. 352 CHAPITRE 10. FONCTIONS INTÉGRABLES Démonstration. Soit ! > 0 et δ une jauge sur I¯ associée par la définition d’intégrabilité à !/2. Alors, si Π et Π̃ sont des P-partitions δ-fines, on a, H avec J = I¯ f, |S(I, f, Π) − S(I, f, Π̃)|2 ≤ |S(I, f, Π) − J|2 + |J − S(I, f, Π̃)|2 ≤ !. Le cas particulier consistant à imposer pour chaque ! > 0, dans la définition d’intégrabilité, l’existence d’une jauge constante est historiquement et numériquement important, même si son rôle dans l’analyse moderne s’est singulièrement réduit. Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp ¯ On dit que f est intégrable au sens de Riemann sur I, ¯ ou définie sur I. ¯ R-intégrable sur I ou plus explicitement uniformément intégrable sur I¯ s’il existe un J ∈ Rp ayant la propriété suivante: pour chaque ! > 0, on peut trouver une jauge constante δ sur I¯ telle que, pour toute P-partition δ-fine Π de I, on ait |S(I, f, Π) − J|2 ≤ !. La caractérisation suivante des fonctions R-intégrables, dont on établira sans peine l’équivalence avec la définition donnée ici, est souvent prise comme définition des fonctions R-intégrables dans la littérature mathématique. Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp ¯ Alors f est R-intégrable sur I¯ si et seulement s’il existe un définie sur I. p J ∈ R ayant la propriété suivante: pour chaque ! > 0, il existe une constante η > 0 telle que, pour chaque partition {I 1 , . . . , I m} de I en semi-pavés tels que max (bji − aji ) ≤ η, 1≤j≤m; 1≤i≤n et toute famille {x , . . . , xm} de points tels que xj ∈ I¯j , (1 ≤ j ≤ m), on a 1 |S(I, f, Π) − J|2 ≤ !. Le résultat suivant est une conséquence facile de la définition et de l’unicité de l’intégrale. Proposition. Toute fonction f R-intégrable sur I¯ est intégrable sur I¯ et le H J donné dans la définition de R-intégrabilité est égal à I¯ f. Exemple. Si I est un semi-pavé de Rn , toute application constante c de Rn dans Rp est R-intégrable sur I¯ et J I¯ c = µ(I)c. 353 10.1. INTÉGRABILITÉ SUR UN PAVÉ En effet, pour toute P-partition Π = {(x1 , I 1 ), . . ., (xm, I m)} de I, on a S(I, f, Π) = m $ µ(I j )c = µ(I)c, j=1 et ! > 0 étant donné, n’importe quelle jauge constante convient dans la définition de R-intégrabilité. En procédant comme pour l’intégrabilité, on obtient évidemment une condition nécessaire de Cauchy de R-intégrabilité. Proposition. Si f est une fonction de Rn dans Rp R-intégrable sur l’adhérence I¯ d’un semi-pavé I de Rn , alors, pour chaque ! > 0, il existe une jauge constante δ sur I¯ telle que, pour chaque P-partition δ-fine Π et chaque P-partition δ-fine Π̃ de I, on a |S(I, f, Π) − S(I, f, Π̃)|2 ≤ !. Montrons que les fonctions R-intégrables sur I¯ y sont nécessairement bornées. Proposition. Toute fonction f de Rn dans Rp R-intégrable sur l’adhérence ¯ I¯ d’un semi-pavé I de Rn est bornée sur I. Démonstration. Soit J = δ sur I¯ telle que # H I¯ f et ! = 1. Il existe donc une jauge constante # #m # #$ # j j # # µ(I )f (x )# ≤ |J|2 + 1, # #j=1 # 2 pour toute P-partition δ-fine Π = une partition de I en semi-pavés {(x1 , I 1 ), . . ., (xm, I m)} de I. Soit {K 1 , . . . , K m} K j = ]cj1 , dj1 ] × . . . × ]cjn , djn] tels que dji − cji ≤ δ, (1 ≤ i ≤ n, 1 ≤ j ≤ m). A B Alors, pour chaque xj ∈ K j , (1 ≤ k ≤ m), Π̃ = (xj , K j ) 1≤j≤m est une P¯ Il existera au partition δ-fine de I. Supposons que f ne soit pas bornée sur I. l l moins un K tel que f ne soit pas bornée sur K̄ , et donc tel que pour chaque r > 0, il existe un y r ∈ K̄ l tel que |f (y r )|2 > r. En prenant successivement r = k, (k ∈ N∗ ), on obtient une suite (y k )k∈N∗ dans K̄ l telle que |f (y k )|2 > k, (k ∈ N∗ ). 354 CHAPITRE 10. FONCTIONS INTÉGRABLES Si dès lors nous fixons xj ∈ K̄ j pour chaque 1 ≤ j ≤ m tel que j /= l, et que nous prenons les P-partitions δ-fines {(x1 , K 1 ), . . ., (xl−1, K l−1), (y k , K l ), (xl+1 , K l+1 ) . . . , (xm, K m)}, k ∈ N∗ , nous obtenons les inégalités # # # # $ # # l k j j #µ(K )f (y ) + # ≤ |J|2 + 1, (k ∈ N∗ ), µ(K )f (x ) # # # # {1≤j≤m : j(=l} 2 et dès lors # # # # $ # # kµ(K l ) < µ(K l )|f (y k )|2 ≤ |J|2 + 1 + ## µ(K j )f (xj )## , (k ∈ N∗ ), #{1≤j≤m : j(=l} # 2 ce qui est contradictoire dès que k ≥ [µ(K )] l # # # # $ # # j j # |J|2 + 1 + # µ(K )f (x )## . #{1≤j≤m : j(=l} # −1 2 La fonction f : x 2→ 2x sin 1 2 1 − cos 2 , x /= 0, f (0) = 0, 2 x x x donnée au Chapitre 9, qui est primitivable sur tout intervalle contenant l’origine sans y être bornée, est donc un exemple de fonction qui n’est pas R-intégrable sur un tel intervalle, alors qu’elle y est intégrable en vertu du théorème fondamental du calcul différentiel et intégral. L’exemple suivant montre qu’il existe même des fonctions bornées et intégrables sur un intervalle fermé et qui n’y sont pas R-intégrables. Exemple. La fonction de Dirichlet d, définie au chapitre 2 par d(x) = 1 si x est rationnel et d(x) = 0 si x est irrationnel, est bornée sur R et donc sur tout intervalle fermé. Montrons que d n’est pas R-intégrable sur [0, 1]. Il suffit de montrer qu’elle ne vérifie pas la condition de Cauchy de R-intégrabilité. Soit δ > 0 et {I 1 , . . ., I m} une partition de ]0, 1] en semi-intervalles telle que µ(I j ) ≤ δ, (1 ≤ j ≤ m). On sait que chaque I j contient au moins un rationnel xj et au moins un irrationnel x̃j . Dès lors, les P-partitions de ]0, 1] A j j B 1 1 m m Π = {(x , I ), . . . , (x , I )}, Π̃ = (x̃ , I ) 1≤j≤m sont δ-fines et, puisque d(xj ) = 1, d(x̃j ) = 0, (1 ≤ j ≤ m), 355 10.1. INTÉGRABILITÉ SUR UN PAVÉ ces P-partitions sont telles que |S(]0, 1], d, Π) − S(]0, 1], d, Π̃)| = $ µ(I j ) = µ(]0, 1]) = 1. j=1 La négation de la condition de Cauchy de R-intégrabilité est donc satisfaite. Montrons maintenant que la fonction de Dirichlet est intégrable sur [0, 1] et que son intégrale y est nulle. Notons tout d’abord que Q ∩ [0, 1] est dénombrable et peut donc s’écrire sous la forme {rk : k ∈ N}, où l’application k 2→ rk est une bijection de N sur Q ∩ [0, 1]. Soit ! > 0; associons-lui la jauge δ sur [0, 1] définie comme suit. Si x ∈ [0, 1] \ Q, on prend δ(x) = 1; si ! x ∈ Q ∩ [0, 1], il existe un unique rk tel que x = rk et l’on prend δ(x) = 2k+2 . 1 1 m m Soit Π = {(x , I ), . . ., (x , I )} une P-partition δ-fine de ]0, 1]. Comme d(x) = 0 si x est irrationnel, on a S(]0, 1], d, Π) = m $ $ d(xj )µ(I j ) = j=1 {1≤j≤m : µ(I j ). xj ∈Q} Soit q ∈ N tel que {xj ∈ Q : 1 ≤ j ≤ m} ⊂ {r0 , . . . , rq }. Alors, $ {1≤j≤m q $ µ(I j ) = : xj ∈Q} ≤ q $ k=0 k=0 ! 2k+1 = $ {1≤j≤m : xj =r k} µ(I j ) ! 1 − (1/2)q+1 ≤ !, 2 1 − (1/2) puisque, pour tous les j tels que xj = rk , les I j correspondants forment une famille formée d’un ou deux intervalles disjoints de ]0, 1] contenus dans ! ! [rk − 2k+2 , rk + 2k+2 ], ce qui entraı̂ne $ µ(I ) ≤ µ j {1≤j≤m : xj =rk } 42 rk − ! 2k+2 , rk + ! 2k+2 35 = ! . 2k+1 En conséquence, et en notant que S(I, f, Π) est positive et donc égale à sa valeur absolue, on a |S(I, f, Π)| ≤ ! pour toutes les P-partitions δ-fines de ]0, 1] et le résultat est démontré. On a vu qu’une fonction primitivable sur un intervalle fermé n’y est pas nécessairement R-intégrable. L’exemple de la fonction f (x) = −1 si x < 0, f (x) = 1 si x ≥ 0, 356 CHAPITRE 10. FONCTIONS INTÉGRABLES considéré au début de la section, qui est R-intégrable sur [−1, 1], sans vérifier la propriété de Darboux, montre l’existence de fonctions R-intégrables sur un intervalle fermé qui n’y sont pas primitivables. ¯ Rp) l’ensemble des fonctions de Rn dans Rp RSi l’on désigne par R(I, intégrables sur l’adhérence I¯ du semi-pavé I de Rn on a donc les inclusions (strictes) ¯ Rp) ! P (I, ¯ Rp), N ([a, b], Rp) ! P ([a, b], Rp) R(I, alors que R([a, b], Rp) \ N ([a, b], Rp) et N ([a, b], Rp) \ R([a, b], Rp) sont non vides. L’ensemble des fonctions intégrables contient donc différentes classes de fonctions intéressantes. La discussion qui précède montre que le concept d’intégrabilité que Bernard Riemann a introduit en 1854 est trop faible pour intégrer, sur un pavé, les fonctions non bornées (en particulier certaines fonctions primitivables) ainsi que des fonctions très discontinues comme la fonction de Dirichlet. Vito Volterra a même donné en 1881 un exemple de fonction bornée, primitivable mais non R-intégrable sur un intervalle. On peut chercher la raison de ces limitations de l’intégrale de Riemann dans le fait que, ! > 0 étant donné, la condition imposée aux P-partitions pour lesquelles la somme de Riemann doit approcher la valeur de l’intégrale à ! près, est d’être δ-fine pour une jauge constante δ, c’est-à-dire pour une jauge qui ne force aucunement la P-partition à être particulièrement “fine” au voisinage des points de I¯ où la fonction a un comportement peu régulier (discontinuités, limites à gauche ou à droite infinies, oscillations non bornées...). Une définition mieux adaptée à des fonctions présentant ces caractéristiques doit “forcer” les Ppartitions acceptables pour un ! > 0 donné à être plus “fines” aux endroits pathologiques, afin de permettre aux sommes de Riemann d’épouser mieux la quantité qu’elles sont censées approcher. C’est une idée que Leonard Euler avait déjà exprimée, sans l’exploiter, en 1768. Près de deux siècles plus tard, Jaroslav Kurzweil et Ralph Henstock ont refait, indépendamment, cette observation. Ils ont proposé une modification formelle simple mais fondamentale de la définition de Riemann, qui conduit à une intégrale conservant, pour la partie élémentaire de la théorie, le support intuitif et la simplicité conceptuelle de l’approche de Riemann, mais qui s’avère suffisamment puissante pour intégrer à la fois les fonctions primitivables et les fonctions R-intégrables (et, comme on le verra, bien d’autres encore!). 10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE 10.2 357 Propriétés élémentaires de l’intégrale Soit I un semi-pavé de Rn , f et g des fonctions de Rn dans Rp définies sur ¯ I. ¯ alors f + g est intégrable sur Proposition. Si f et g sont intégrables sur I, ¯ I et J J J (f + g) = f + g. I¯ Démonstration. Posons J1 = jauge δ1 sur I¯ telle que H I¯ f I¯ I¯ et J2 = H I¯ g et soit ! > 0. Il existe une |S(I, f, Π1) − J1 |2 ≤ !/2 pour toute P-partition δ1 -fine Π1 de I et une jauge δ2 sur I¯ telle que |S(I, g, Π2) − J2 |2 ≤ !/2 pour toute P-partition δ2 -fine Π2 de I. Définissant sur I¯ la jauge δ par δ(x) = min[δ1 (x), δ2(x)], et notant que toute P-partition δ-fine Π de I sera à la fois δ1 -fine et δ2 -fine, on aura, pour une telle P-partition, |S(I, f + g, Π) − (J1 + J2 )|2 = |S(I, f, Π) + S(I, g, Π) − J1 − J2 |2 ≤ |S(I, f, Π) − J1 |2 + |S(I, g, Π) − J2 |2 ≤ !/2 + !/2 = !, et la démonstration est complète. Proposition. Si f est intégrable sur I¯ et c ∈ R, alors cf est intégrable sur I¯ et 4J 5 J (cf ) = c f . I¯ I¯ Démonstration. Le résultat est évident si c = 0. Pour c /= 0, posons H J = I¯ f et soit ! > 0. Il existe donc une jauge δ sur I¯ telle que |S(I, f, Π) − J|2 ≤ !/|c|, pour toute P-partition δ-fine Π de I. En consequence, pour une telle Ppartition, on a |S(I, cf, Π) − cJ|2 = |c[S(I, f, Π) − J]|2 ≤ |c|(!/|c|) = !, et la démonstration est complète. 358 CHAPITRE 10. FONCTIONS INTÉGRABLES ¯ Rp) est un espace vectoriel sur R Ces deux résultats montrent que P (I, H ¯ Rp) dans et que l’application f 2→ I¯ f est une application linéaire de P (I, p R (et en particulier une fonctionnelle linéaire si p = 1). On démontre d’une ¯ Rp) est un sous-espace vectoriel de manière tout à fait identique que R(I, p ¯ P (I, R ). La propriété suivante généralise aux intégrales le fait que la norme d’une somme est inférieure ou égale à la somme des normes. Proposition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp et g une fonction de Rn dans R+ définies sur I¯ et telles que |f (x)|i ≤ g(x), ¯ (i = 1, 2 ou ∞). Si f et g sont intégrables sur I, ¯ alors on a pour tout x ∈ I, #J # J # # # f# ≤ g, (i = 1, 2 ou ∞), # ¯ # ¯ I I i ¯ on a En particulier, si f et |f |i sont intégrables sur I, #J # J # # # f# ≤ |f |i , (i = 1, 2 ou ∞). # ¯ # ¯ I I i Démonstration. On va montrer que #J # J # # # f# ≤ g+! # ¯ # ¯ I I i pour chaque ! > 0. Pour un tel ! > 0, il existe une jauge δ $ et une jauge δ $$ sur I¯ telles que # # J # J # # # # # #S(I, f, Π$) − f # ≤ !/2, #S(I, g, Π$$) − g # ≤ !/2. # # ¯ # ¯ # I I i Définissant la jauge δ sur I¯ par δ(x) = et choisissant une P-partition δ-fine Π de I, on a, en utilisant les propriétés des sommes de Riemann et le fait que Π est à la fois δ $ -fine et δ $$ -fine, min{δ $ (x), δ $$(x)}, #J # #J # # # # # # f # ≤ # f − S(I, f, Π)# + |S(I, f, Π)|i # ¯ # # ¯ # I i I i ≤ !/2 + |S(I, f, Π)|i ≤ !/2 + S(I, |f |i, Π) ≤ !/2 + S(I, g, Π) # J # J J # # # ≤ !/2 + g + #S(I, g, Π) − g ## ≤ !/2 + g + !/2 = g + !. ¯ ¯ ¯ ¯ J I I I I Pour obtenir la deuxième inégalité, il suffit de prendre g = |f |i. 359 10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE Une conséquence aisée de la proposition précédente est le fait que l’intégrale préserve les relations d’ordre entre deux fonctions réelles. Corollaire. Si I est un semi-pavé de Rn et f une fonction réelle intégrable ¯ alors sur I¯ et telle que f (x) ≥ 0 pour tout x ∈ I, J I¯ f ≥ 0. Démonstration. Il suffit de prendre f = 0 et g = f dans la Proposition précédente. Corollaire. Si I est un semi-pavé de Rn et si f et g sont deux fonctions ¯ alors on a réelles intégrables sur I¯ et telles que f (x) ≤ g(x) pour tout x ∈ I, J I¯ f≤ J I¯ g. Démonstration. Il suffit d’appliquer le corollaire précédent à la fonction g − f et d’utiliser la linéarité de l’intégrale. Le résultat suivant montre que la théorie et le calcul de l’intégrale d’une fonction de Rn dans Rp peuvent toujours se ramener au cas d’une fonction à valeur réelle. Proposition. Rp définie sur composante fk Soit I un semi-pavé de Rn et f une fonction de Rn dans ¯ Alors f est intégrable sur I¯ si et seulement si chaque I. de f est intégrable sur I¯ (1 ≤ k ≤ p), auquel cas on a 4J I¯ f 5 k = J I¯ fk , (1 ≤ k ≤ p). Démonstration. La condition nécessaire résulte aisément des définitions et du fait que, pour toute P-partition Π de I, et tout 1 ≤ k ≤ p, on a # 4J 5 # #S(I, fk, Π) − f # ¯ I k # # #= # #2 J 3 # # S(I, f, Π) − f # ¯ I k H # # J # # # # # ≤ #S(I, f, Π) − f # . # # ¯ # I 2 Pour la condition suffisante, si nous posons Jk = I¯ fk , (1 ≤ k ≤ p) et si ! > 0 étant donné, nous désignons par δk une jauge sur I¯ telle que la définition ! d’intégrabilité de fk sur I¯ soit vérifiée pour p1/2 , il est facile de voir que la définition d’intégrabilité de f sur I¯ relative à ! sera vérifiée pour le choix de la jauge δ définie sur I¯ par δ(x) = min1≤k≤p δk (x). 360 CHAPITRE 10. FONCTIONS INTÉGRABLES Les propriétés qui suivent montrent le comportement de l’intégrale par rapport à une translation ou une homothétie du domaine d’intégration. Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans ¯ Alors, pour tout a ∈ Rn , f (· − a) est intégrable sur Rp intégrable sur I. ¯ et a + I¯ = {a + x : x ∈ I} J a+I¯ f (x − a) dx = J I¯ f. Démonstration. Soit ! > 0 et δ une jauge sur I¯ telle que # J # # # #S(I, f, Π) − f # ≤ ! # ¯ # I 2 pour toute P-partition δ-fine Π de I. On définit la jauge η sur a + I¯ par A j j B η = δ(· − a). Soit Πa = (x , I ) 1≤j≤m une P-partition η-fine de a + I = A B {a + x : x ∈ I}. Alors Π = (xj − a, −a + I j ) 1≤j≤m , où −a + I j = {−a + x : x ∈ I j }, est une P-partition δ-fine de I puisque les relations I j ⊂ B∞ [xj ; η(xj )], (1 ≤ j ≤ m), entraı̂nent évidemment −a + I j ⊂ B∞ [xj − a; δ(xj − a)], (1 ≤ j ≤ m). En conséquence, puisque µ(−a + I j ) = µ(I j ), (1 ≤ j ≤ m), on a # # #$ # J # J # #m # # # #S(a + I, f (. − a), Πa ) − f # = # µ(I j )f (xj − a) − f ## # # # I¯ 2 I¯ # #j=1 2 # # #m # J # J # #$ # # # = ## µ(−a + I j )f (xj − a) − f ## = ##S(I, f, Π) − f ## ≤ !, I¯ # I¯ 2 #j=1 2 et la démonstration est complète. Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans ¯ Alors, pour chaque r > 0, f (r·) est intégrable sur Rp intégrable sur I. −1 −1 ¯ ¯ et r I = {r x : x ∈ I} J r −1 I¯ f (rx) dx = r −n J I¯ f. 361 10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE Démonstration. Soit ! > 0 et δ une jauge sur I¯ telle que # J # # # #S(I, f, Π) − f # ≤ !r n # ¯ # I 2 A B pour toute P-partition δ-fine Π de I. Soit Πr = (xj , I j ) 1≤j≤m une PA B partition (δ/r)-fine de r −1 I = {r −1 x : x ∈ I}. Alors Π = (rxj , rI j ) 1≤j≤m est une P-partition δ-fine de I puisque les relations xj ∈ I¯j , I j ⊂ B∞ [xj ; δ(xj )/r], (1 ≤ j ≤ m), entraı̂nent évidemment rxj ∈ r I¯j , rI j ⊂ B∞ [rxj ; δ(xj )], (1 ≤ j ≤ m). Dès lors, puisque µ(rI j ) = r n µ(I j ), on aura # # #m # J # J # $ # # # # #S(r −1 I, f (r·), Πr) − r −n f # = r −n # µ(rI j )f (rxj ) − f ## # # # ¯ ¯ I I # #j=1 2 2 # J # # # = r −n ##S(I, f, Π) − f ## ≤ !, ¯ I 2 et la démonstration est complète. Donnons maintenant deux propriétés utiles de l’intégrale simple. La première s’appelle la formule d’intégration par parties. Proposition. Soient f et g deux fonctions de R dans K dérivables sur [a, b]. Alors f $ g est intégrable sur [a, b] si et seulement si f g $ est intégrable sur [a, b], auquel cas on a J b a f $ g = f (b)g(b) − f (a)g(a) − J b a f g $. Démonstration. Par la formule de dérivation d’un produit de fonctions, on a f $ g = (f g)$ − f g $ , et, par le théorème fondamental du calcul différentiel et intégral, la fonction (f g)$ est intégrable sur [a, b] et J b a (f g)$ = f (b)g(b) − f (a)g(a). La thèse résulte alors de la linéarité de l’intégrale. 362 CHAPITRE 10. FONCTIONS INTÉGRABLES La deuxième propriété s’appelle la formule d’intégration par substitution. Proposition. Soit g une fonction de R dans R non constante et dérivable sur [a, b] et h une fonction de g([a, b]) dans Rp primitivable sur g([a, b]). Alors (h ◦ g)g $ est primitivable sur [a, b] et J b a (h ◦ g)g $ = J g(b) h. g(a) Démonstration. Soit H une primitive de h sur g([a, b]); par le théorème de primitivation par substitution, (h◦g)g $ = (H $ ◦g)g $ = (H ◦g)$ est primitivable sur [a, b] et H ◦g en est une primitive. Par le théorème fondamental du calcul différentiel et intégral, (h ◦ g)g $ est donc intégrable sur [a, b] et J b a (h ◦ g)g $ = H[g(b)] − H[g(a)]. Le même théorème appliqué à h montre que cette fonction est intégrable sur tout intervalle fermé de g([a, b]), et en particulier à l’intervalle fermé d’extrémités g(a) et g(b), et que J g(b) g(a) h = H[g(b)] − H[g(a)], ce qui achève la démonstration. 10.3 Additivité de l’intégrale Le but de cette section est de montrer que l’intégrale d’une fonction sur l’adhérence d’un semi-pavé pavé I est égale à la somme des intégrales de cette fonction sur les adhérences de semi-pavés formant une partition finie de I. Pour démontrer cette propriété, nous aurons besoin d’un résultat technique qui nous servira souvent par la suite, et que nous nommerons le lemme des P-partitions subordonnées. Lemme. Soit I un semi-pavé de Rn , {K 1 , . . . , K l } une partition de I en ¯ Il existe une jauge δ sur I¯ vérifiant la relasemi-pavés et δ0 une jauge sur I. ¯ et telle que, si Π = {(x1 , I 1 ), . . ., (xm, I m)} tion δ(x) ≤ δ0 (x) pour tout x ∈ I, est une P-partition δ-fine de I, chaque famille Π̃i = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m} 363 10.3. ADDITIVITÉ DE L’INTÉGRALE est une P-partition δ-fine de K i , (1 ≤ i ≤ l), la famille Π̃ = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m, 1 ≤ i ≤ l, } est une P-partition δ-fine de I et l’on a S(I, f, Π) = S(I, f, Π̃) = l $ S(K i, f, Π̃i ) i=1 ¯ pour toute fonction f de Rn dans Rp définie sur I. ¯ ApDémonstration. Construisons la jauge δ comme suit. Soit x ∈ I. 7 i pelons J(x) l’ensemble {1 ≤ i ≤ l : x /∈ K }. Soit E(x) = i∈J(x) !K i si J(x) /= ∅ et E(x) = Rn si J(x) = ∅. Comme E(x) est ouvert et x ∈ E(x), il existe r(x) > 0 tel que B∞ [x; r(x)] ⊂ E(x). Ce choix de r(x) assure que B∞ [x; r(x)] ne rencontre que des K i dont l’adhérence contient x. En d’autres termes, si i est tel que B∞ [x : r(x)] ∩ K i /= ∅, alors x ∈ K i (car B∞ [x; r(x)] ∩ K i /= ∅, et donc i /∈ J(x)). Soit δ la jauge définie sur I¯ par δ(x) = min{δ0 (x), r(x)} et soit Π = 1 {(x , I 1 ), . . ., (xm, I m)} une P-partition δ-fine de I. Alors, pour chaque 1 ≤ i ≤ l, la famille Π̃i = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m} est une P-partition de K i . En effet, I j ∩ K i /= ∅ ⇒ B∞ [xj ; δ(xj )] ∩ K i /= ∅ ⇒ B∞ [xj ; r(xj )] ∩ K i /= ∅ ⇒ xj ∈ K i ⇒ xj ∈ K i ∩ I j , et dès lors xj ∈ K i ∩ I j puisque K i ∩ I j = K i ∩ I j lorsque I j ∩ K i /= ∅ (le Mi est évidemment δ-fine puisque Π vérifier). En outre, chaque P-partition Π l’est. Bien entendu, la famille N = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m, 1 ≤ i ≤ l} Π Mi est une P-partition δ-fine de I. formée de la réunion des éléments des Π ¯ alors Enfin, si f est une fonction de Rn dans Rp définie sur I, S(I, f, Π) = m $ j=1 µ(I j )f (xj ) 364 CHAPITRE 10. FONCTIONS INTÉGRABLES = m $ j=1 µ(I j ∩ l > K i )f (xj ) = i=1 m $ $ j=1 {1≤i≤l : I j ∩K i(=∅} N = = S(I, f, Π) l $ $ i=1 {1≤j≤m : I j ∩K i (=∅} l $ = i=1 8 9 µ I j ∩ K i f (xj ) µ(I j ∩ K i )f (xj ) Mi ). S(K i, f, Π Le nom de ce lemme vient de ce que toute P-partition δ-fine pour la jauge ainsi construite peut être remplacée, sans changer la somme de Riemann correspondante, par une P-partition δ-fine que l’on dit subordonnée à la partition {K 1 , . . . , K l }, puisque chacun de ses semi-pavés est contenu dans l’un des semi-pavés K i . Enonçons et démontrons maintenant la propriété d’additivité de l’intégrale. Proposition. Soit I un semi-pavé de Rn , {K 1 , . . . , K l } une partition de I en semi-pavés K i , (1 ≤ i ≤ l) et soit f une fonction de Rn dans Rp définie ¯ Si f est intégrable sur chaque K̄ i , (1 ≤ i ≤ l), alors f est intégrable sur I. ¯ sur I et J I¯ f= l J $ i i=1 K̄ f. Démonstration. Si ! > 0 est donné, il existe une jauge δi sur K̄ i telle que # J # #S(K i, f, Πi) − # K̄ i # # f ## ≤ !/l, 2 pour toute P-partition δi -fine Πi de K i (1 ≤ i ≤ l). Soit δ0 la jauge définie sur I¯ par δ0 (x) = min{δi (x) : x ∈ K̄ i , 1 ≤ i ≤ l}, et soit δ la jauge donnée par le lemme des P-partitions subordonnées à partir de δ0 et {K 1 , . . . , K l }. Si Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition δ-fine de I et Π̃i (1 ≤ i ≤ l) et Π̃ sont les P-partitions qui lui sont associées par le lemme des P-partitions subordonnées, on a # # # # l J l J # # # # $ $ # # # # f # = #S(I, f, Π̃) − f# #S(I, f, Π) − # # K̄ i # K̄ i # i=1 2 i=1 2 10.4. CRITÈRE DE CAUCHY D’INTÉGRABILITÉ 365 # 3## J l 2 #$ # # =# S(K i, f, Π̃i ) − f # ≤ l(!/l) = !, # # i K̄ i=1 2 puisque par construction chaque Π̃i est δ i -fine (1 ≤ i ≤ l). Remarques. 1. La propriété d’additivité est également vraie pour l’intégrabilité au sens de Riemann mais la démonstration est différente et plus longue, car le lemme qui précède n’a pas d’équivalent pour l’intégration au sens de Riemann. Nous ne la donnerons pas ici car nous n’aurons pas à l’utiliser explicitement. 2. La propriété d’additivité possède une réciproque, dont la démonstration nécessite la démonstration du caractère suffisant de la condition de Cauchy d’intégrabilité. 10.4 Critère de Cauchy d’intégrabilité Montrons que la condition d’intégrabilité de Cauchy est également suffisante, ce qui permettra de prouver l’intégrabilité de fonctions sans connaı̂tre la valeur de leur intégrale. Théorème. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp ¯ Si, pour chaque ! > 0, il existe une jauge δ sur I¯ telle que, définie sur I. pour toute P-partition δ-fine Π de I et toute P-partition δ-fine Π$ de I, on a |S(I, f, Π) − S(I, f, Π$)|2 ≤ !, ¯ alors f est intégrable sur I. Démonstration. Construisons tout d’abord un candidat pour la valeur ¯ En prenant ! = 1 dans la condition de Cauchy, on de l’intégrale de f sur I. peut trouver une jauge δ1 sur I¯ telle que |S(I, f, Π) − S(I, f, Π$)|2 ≤ 1 lorsque Π et Π$ sont des P-partitions δ1 -fines de I. En prenant ! = 1/2, on ¯ que l’on peut toujours choisir telle peut trouver de même une jauge δ2 sur I, ¯ pour laquelle que δ2 (x) ≤ δ1 (x) pour tout x ∈ I, |S(I, f, Π) − S(I, f, Π$)|2 ≤ 1 , 2 366 CHAPITRE 10. FONCTIONS INTÉGRABLES lorsque Π et Π$ sont des P-partitions δ2 -fines de I. En continuant de la sorte avec ! = 1/k, k ≥ 2 entier, on trouve une suite (δk )k∈N∗ de jauges sur I¯ telles ¯ et chaque k ∈ N∗ , on ait que, pour chaque x ∈ I, δk+1 (x) ≤ δk (x), et pour lesquelles 1 , k lorsque Π et Π$ sont des P-partitions δk -fines de I. Fixons, pour chaque k ∈ N∗ une P-partition δk -fine Πk de I et montrons que la suite |S(I, f, Π) − S(I, f, Π$)|2 ≤ (S(I, f, Πk))k∈N∗ est une suite de Cauchy dans Rp. Par la propriété de décroissance de la suite (δk (x))k∈N∗ , toute P-partition δq -fine sera δk -fine lorsque k ≤ q. Dès lors, si q ≥ k sont des entiers supérieurs ou égaux à un, Πk et Πq seront δk -fines et l’on a, par construction, |S(I, f, Πk) − S(I, f, Πq)|2 ≤ 1 . k En conséquence, si ! > 0 est donné, et si m ∈ N∗ est tel que 1/m ≤ !, il suffira de prendre q ≥ k ≥ m pour que |S(I, f, Πk) − S(I, f, Πq)|2 ≤ 1 1 ≤ ≤ !. k m Donc (S(I, f, Πk))k∈N∗ , suite de Cauchy dans Rp , est convergente et nous désignerons sa limite par J. En faisant tendre q vers l’infini dans l’inégalité ci-dessus, on obtient |S(I, f, Πk) − J|2 ≤ 1 , (k ∈ N∗ ). k Pour montrer que f est intégrable sur I¯ et que son intégrale y vaut J, soit 1 ! > 0 et soit m ∈ N∗ tel que m ≤ !. Si Π est une P-partition δm -fine de I, et si, pour tout q ≥ m, Πq est définie dans la première partie de la définition, on a 1 |S(I, f, Π) − S(I, f, Πq)|2 ≤ ≤ !. m Dès lors, si l’on fait tendre q vers l’infini, on obtient |S(I, f, Π) − J|2 ≤ !, et la démonstration est complète. 10.4. CRITÈRE DE CAUCHY D’INTÉGRABILITÉ 367 Remarque. En remplaçant partout, dans l’énoncé et la démonstration, jauge par jauge constante, on obtient une condition suffisante de Cauchy pour la R-intégrabilité. Une conséquence importante de la condition suffisante d’intégrabilité de Cauchy est la propriété de restriction de l’intégrale qui assure ¯ l’intégrabilité sur les sous-pavés de I¯ lorsqu’on a l’intégrabilité sur I. Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp ¯ Alors f est intégrable sur K̄ pour chaque semi-pavé K ⊂ I. intégrable sur I. Démonstration. On peut évidemment supposer que K ! I. On sait que I \ K peut alors s’écrire sous la forme I \K = q > K i, i=1 où les K i sont des semi-pavés mutuellement disjoints contenus dans I. Soit ! > 0; on va montrer que f vérifie la condition de Cauchy d’intégrabilité ¯ elle y vérifie la condition de Cauchy sur K̄. Comme f est intégrable sur I, d’intégrabilité, et il existe donc une jauge δ sur I¯ telle que |S(I, f, Π) − S(I, f, Π$)|2 ≤ !, lorsque Π et Π$ sont des P-partitions δ-fines de I. Bien entendu, la restriction de δ à K̄ et aux K̄ i définit une jauge sur ces ensembles. Pour chaque 1 ≤ i ≤ q, fixons une P-partition δ-fine Πi de K i , et soient ΠK et Π$K deux Ppartitions δ-fines de K. Alors la famille Π formée par la réunion des éléments de ΠK et de ceux des Πi , (1 ≤ i ≤ q) et la famille Π$ formée par la réunion des éléments de Π$K et de ceux des Πi , (1 ≤ i ≤ q) sont des P-partitions δ-fines de I telles que S(I, f, Π) − S(I, f, Π$) = S(K, f, ΠK ) − S(K, f, Π$K ), puisque les autres termes sont communs à S(I, f, Π) et à S(I, f, Π$). En conséquence, |S(K, f, ΠK) − S(K, f, Π$K )|2 = |S(I, f, Π) − S(I, f, Π$)|2 ≤ !, et la démonstration est complète. Remarque. La même démonstration montre évidemment que la propriété de restriction est vraie pour la R-intégrabilité. Nous pouvons maintenant énoncer et démontrer la réciproque de la propriété d’additivité de l’intégrale. 368 CHAPITRE 10. FONCTIONS INTÉGRABLES Corollaire. Soit I un semi-pavé de Rn , {K 1 , . . . , K q } une partition de I ¯ Alors f est en semi-pavés et f une fonction de Rn dans Rp intégrable sur I. i intégrable sur chaque K et J I¯ f= q J $ i i=1 K f. ¯ l’est sur chaque K i par la propriété Démonstration. f , intégrable sur I, de restriction, et la formule se déduit alors de la propriété d’additivité de la section précédente. 10.5 Fonctions continues ou monotones Le critère de Cauchy permet de démontrer la R-intégrabilité sur I¯ d’une ¯ fonction continue sur I. Proposition. Toute fonction f de Rn dans Rp continue sur l’adhérence I¯ ¯ d’un semi-pavé I de Rn est R-intégrable sur I. Démonstration. On va montrer que f vérifie la condition de Cauchy de R¯ Pour ce faire, notons d’abord que si Π = {(x1 , I 1 ), . . ., (xm, I m)} intégrabilité sur I. 8 9 et Π̃ = (x̃k , Ĩ k ) sont deux P-partitions de I et si l’on pose I j,k = 1≤k≤m̃ ! !m̃ j ˜k I j ∩ I˜k , (1 ≤ j ≤ m; 1 ≤ k ≤ m̃), alors, comme I = m j=1 I = k=1 I , on a évidemment I =I ∩ j j & m̃ > I˜k k=1 I˜k = I˜k ∩ m > j=1 ' = Ij = m̃ > I j,k , (1 ≤ j ≤ m), m > I j,k , (1 ≤ k ≤ m̃), k=1 j=1 et, puisque les I j sont mutuellement disjoints et les I˜k sont mutuellement disjoints, on aura µ(I j ) = $ µ(I j,k ), (1 ≤ j ≤ m); $ µ(I j,k ), (1 ≤ k ≤ m̃). {1≤k≤m̃ : I j,k (=∅} µ(I˜k ) = {1≤j≤m : I j,k (=∅} 369 10.5. FONCTIONS CONTINUES OU MONOTONES Dès lors, en désignant par y j,k , pour chaque (j, k) tel que I j,k /= ∅, un élément arbitrairement fixé de I j,k , on a |S(I, f, Π) − S(I, f, Π̃)|2 # # #m # m̃ $ $ $ #$ # j,k j j,k k = ## µ(I )f (x ) − µ(I )f (x̃ )## #j=1 {1≤k≤m̃ : I j,k (=∅} # k=1 {1≤j≤m : I j,k (=∅} 2 # # # # $ # # = ## µ(I j,k )[f (xj ) − f (x̃k )]## #{1≤j≤m; 1≤k≤m̃ : I j,k (=∅} # ≤ $ {1≤j≤m; 1≤k≤m̃ : 2 µ(I I j,k (=∅} j,k )[|f (x ) − f (y j j,k )|2 + |f (y j,k ) − f (x̃k )|2 ]. La continuité de f sur le fermé borné I¯ entraı̂ne sa continuité uniforme sur ¯ Dès lors, si ! > 0 est donné, il existe un δ > 0 tel que, pour chaque x ∈ I¯ I. et chaque y ∈ I¯ ∩ B∞ [x; δ], on ait |f (y) − f (x)|2 ≤ ! . 2µ(I) ¯ on voit, en utilisant les inégalités Prenant ce δ comme jauge constante sur I, ci-dessus, que si Π et Π̃ sont des P-partitions δ-fines de I, on aura évidemment y j,k ∈ I j ⊂ B∞ [xj ; δ], y j,k ∈ I˜k ⊂ B∞ [x̃k ; δ], et dès lors |S(I, f, Π)−S(I, f, Π̃)|2 ≤ $ {1≤j≤m; 1≤k≤m̃ : I j,k (=∅} µ(I j,k ) 2 3 ! ! + =! 2µ(I) 2µ(I) et la démonstration est complète. Le même critère de Cauchy permet de montrer qu’une fonction de R dans R monotone sur [a, b] y est R-intégrable. Proposition. Toute fonction f de R dans R monotone sur [a, b] y est Rintégrable. Démonstration. Il suffit évidemment de prouver le résultat pour une fonction croissante, puisque f et −f sont simultanément R-intégrables sur [a, b]. Si f (a) = f (b), alors f est constante sur [a, b]A et le résultat Best déjà connu. Supposons donc f (b) − f (a) > 0. Soient Π = (xj , ]aj−1 , aj ]) 1≤j≤m , 370 CHAPITRE 10. FONCTIONS INTÉGRABLES et Π̃ = 8 (x̃k , ]ãk−1 , ãk ]) 9 1≤k≤m̃ , avec a0 = ã0 = a, am = ãm̃ = b, deux P-partitions de ]a, b] telles que S(I, f, Π) − S(I, f, Π̃) ≥ 0. En vertu de la croissance de f , on a |S(I, f, Π) − S(I, f, Π̃)| = S(I, f, Π) − S(I, f, Π̃) = m $ j=1 ≤ m $ j=1 f (xj )(aj − aj−1 ) − f (aj )(aj − aj−1 ) − m̃ $ k=1 m̃ $ k=1 f (x̃k )(ãk − ãk−1 ) f (ãk−1 )(ãk − ãk−1 ). Si l’on pose I } = {a0 , . . . , am } ∪ {ã0 , . . . , ãm̃ }, Im {I a0 , . . . , a avec et I = b, I0 < a I1 < . . . < a Im a=a I j = ]aj−1 , aj ], (1 ≤ j ≤ m), I˜k = ]ãk−1 , ãk ], (1 ≤ k ≤ m̃), I IIl = ]I al−1, I al ], (1 ≤ l ≤ m), alors la croissance de f entraı̂ne les inégalités m̃ $ k=1 ≥ f (ãk )(ãk − ãk−1 ) = $ {1≤k≤m̃; 1≤l≤m I : IIl ⊂I˜k } = ≥ $ $ {1≤k≤m̃; 1≤l≤m I : IIl ⊂I˜k } Il−1 ) = f (I al )(I al − a $ {1≤j≤m; 1≤l≤m I : IIl ⊂I j } {1≤j≤m; 1≤l≤m I : IIl ⊂I j } f (ãk )(I al − I al−1 ) m I $ l=1 f (I al )(I al − I al−1 ) Il−1 ) f (I al )(I al − a f (aj−1 )(I al − I al−1 ) = $ j=1 f (aj−1 )(aj − aj−1 ). 371 10.5. FONCTIONS CONTINUES OU MONOTONES Par conséquent, |S(I, f, Π) − S(I, f, Π̃)| ≤ + $ f (aj )(aj − aj−1 ) − m̃ $ f (ãk )(ãk − ãk−1 ) − j=1 k=1 = m $ j=1 m̃ $ f (ãk−1 )(ãk − ãk−1 ) m $ f (aj−1 )(aj − aj−1 ) m̃ $ [f (ãk ) − f (ãk−1 )](ãk − ãk−1 ). k=1 [f (aj ) − f (aj−1 )](aj − aj−1 ) + j=1 k=1 ! > 0 étant donné, choisissons la jauge constante δ = ! 4[f (b)−f (a)] . Si les P- partitions Π et Π̃ sont δ-fines et (sans perte de généralité) choisies de telle sorte que S(I, f, Π) − S(I, f, Π̃) ≥ 0, on aura, en utilisant l’inégalité qui précède et le fait que aj − aj−1 ≤ ! , (1 ≤ j ≤ m), 2[f (b) − f (a)] ãk − ãk−1 ≤ ! , (1 ≤ k ≤ m̃), 2[f (b) − f (a)] l’inégalité |S(I, f, Π) − S(I, f, Π̃)| m m̃ $ $ ! ≤ [f (aj ) − f (aj−1 )] + [f (ãk ) − f (ãk−1 )] 2[f (b) − f (a)] j=1 k=1 = ! [f (b) − f (a) + f (b) − f (a)] = !, 2[f (b) − f (a)] et la démonstration est complète. ¯ Rp) l’ensemble des fonctions de Rn dans Remarque. En désignant par C(I, p R continues sur I¯ et par M ([a, b], R) l’ensemble des fonctions de R dans R définies et monotones sur [a, b], on a donc démontré les inclusions ¯ Rp) ⊂ R(I, ¯ Rp) et M ([a, b], R) ⊂ R([a, b], R). C(I, 372 10.6 CHAPITRE 10. FONCTIONS INTÉGRABLES Intégrale indéfinie Soit f une fonction de R dans Rp intégrable sur [a, b]. Par la propriété de Ha restriction et la convention a f = 0, f sera intégrable sur [a, x] quel que soit x ∈ [a, b], ce qui permet de définir une application de [a, b] dans Rp par x 2→ J x f. a Cette application est appelée l’intégrale indéfinie de f sur I¯ et est notée J · f ou a J · f (t) dt a pour rappeler son mode de construction. Dans la seconde notation, la variable t peut évidemment être remplacée par n’importe quelle autre lettre. On évitera cependant d’utiliser x car alors, dans la valeur en x J x f (x) dx a de l’intégrale indéfinie, la lettre x aurait ou n’aurait pas de signification selon sa position ! Lorsque f est une fonction de R dans Rp intégrable sur tout intervalle fermé et borné contenu dans un intervalle quelconque I, on peut fixer un élément a ∈ I et utiliser la convention de notation des intégrales simples pour définir l’intégrale indéfinie de f correspondante comme étant l’application de I dans Rp J · J x f : x 2→ f. a a L’additivité de l’intégrale entraı̂ne aussitôt que deux intégrales indéfinies H· f et f de f sur I associées à des choix différents de a diffèrent par une " a a constante. Montrons maintenant que, pour une fonction f primitivable sur I, les intégrales indéfinies de f ne sont rien d’autre que ses primitives. H· Proposition. Si f est une Hfonction de R dans Rp primitivable sur un inH tervalle I et si a ∈ I, alors a· f = Fa . En particulier, a· f est dérivable en chaque point x de I et l’on a 4J · a f 5$ (x) = f (x). 373 10.6. INTÉGRALE INDÉFINIE Démonstration. Notons tout d’abord que, par le théorème fondamental du calcul différentiel et intégral, f est intégrable sur tout intervalle fermé borné contenu dans I, et si a ∈ I, x ∈ I avec x /= a, F désigne une primitive quelconque de f sur I et Fa désigne la primitive de f sur I qui s’annule en a, on a J x a f = F (x) − F (a) = Fa (x), (x ∈ I). Comme la fonction définie par le second membre de cette égalité est dérivable sur I et a pour dérivée f , la démonstration est complète. Remarque. Ce résultat explique l’abus (regrettable) de langage qui consiste à utiliser parfois le terme “intégrale indéfinie” et même le terme “intégrale” H au lieu du terme “primitive”. Il explique la similitude du symbole (un S allongé) utilisé pour les deux concepts. Lorsque f ∈ P ([a, b], Rp) \ N ([a, b], Rp), son intégrale indéfinie n’est plus nécessairement dérivable en chaque point de [a, b] et, lorsqu’elle est dérivable en x, sa dérivée n’est plus nécessairement égale à f (x). C’est ce que montrent les exemples suivants. Exemples. 1. En utilisant l’analogue d’un exemple antérieur et l’additivité de l’intégrale, on sait que la fonction f définie par f (x) = 0 si x ≤ 0 et f (x) = 1 si x > 0 est intégrable sur [−1, 1] sans y être primitivable et son intégrale indéfinie se calcule aisément : J x −1 f = 0 si x ∈ [−1, 0], J x −1 f = x si x ∈ ]0, 1]. Elle n’est pas dérivable en 0. 2. La fonction de Dirichlet est intégrable, sans être primitivable, sur [0, x] quel que soit x > 0 et son intégrale indéfinie est l’application nulle, dont la dérivée, qui est l’application nulle, n’est pas égale à la fonction de Dirichlet. Montrons maintenant qu’en chaque point de continuité d’une fonction intégrable, la dérivée de l’intégrale indéfinie existe et est égale à la valeur de la fonction en ce point. Proposition. Soit f une fonction de R dans Rp intégrable sur [a, b], et soit c ∈ [a, b] tel que f soit continue en c. Alors l’intégrale indéfinie de f est dérivable en c et 4J 5$ · (c) = f (c). f a Démonstration. Il faut donc démontrer que lim h→0, c+h∈[a,b] −1 h &J c+h a f− J c a f ' = f (c), 374 CHAPITRE 10. FONCTIONS INTÉGRABLES ou encore que lim h→0, c+h∈[a,b] ,J −1 h c+h a f− J c a - f − hf (c) = 0. Pour tout h ∈ R tel que c + h ∈ [a, b], on a, en vertu de l’additivité de l’intégrale J a c+h f− J c a f − hf (c) = = J c+h a J c+h c f (x) dx + J c a f (x) dx − J c c+h f (c) dx [f (x) − f (c)] dx. Soit ! > 0; f étant continue en c, il existe un δ > 0 tel que, pour tout x ∈ [a, b] vérifiant |x − c| ≤ δ, on a |f (x) − f (c)|2 ≤ !. Dès lors, si h est tel que c + h ∈ [a, b] et |h| ≤ δ, on a, pour tout x compris entre c et c + h, |x − c| ≤ |h| ≤ δ et donc |f (x) − f (c)|2 ≤ !. Comme f (·) − f (c) et la fonction constante ! sont intégrables sur l’intervalle fermé d’extrémités c et c + h, on en déduit que #J # #J # # c+h # # c+h # # # # # [f (x) − f (c)] dx# ≤ # ! dx# = !|h|, # # c # # c # 2 et dès lors, si 0 < |h| ≤ δ et c + h ∈ [a, b], on a # ;J <# # # c+h # # −1 [f (x) − f (c)] dx # ≤ !, #h # # c 2 et la démonstration est complète. Corollaire. Si f est une fonction de R dans Rp continue sur un intervalle I, chaque intégrale indéfinie de f est dérivable sur I et, pour chaque a ∈ I, on a 4J 5 · a f $ (x) = f (x), (x ∈ I). Démonstration. Il suffit de noter que toute fonction continue sur I est Rintégrable sur tout intervalle fermé et borné de I et d’appliquer la proposition précédente en chaque point de I. 375 10.7. EQUATIONS DIFFÉRENTIELLES SIMPLES Une conséquence importante de ce corollaire est la primitivabilité sur un intervalle I des fonctions continues sur I. Corollaire. Toute fonction f de R dans Rp continue sur un intervalle I est primitivable sur I. Démonstration. L’intégrale indéfinie de f est, en vertu du corollaire précédent, une primitive de f sur I. On a donc, pour les fonctions d’une variable, les inclusions strictes C([a, b], Rp) ! N ([a, b], Rp) ! P ([a, b], Rp), C([a, b], Rp) ! R([a, b], Rp) ! P ([a, b], Rp), M ([a, b], Rp) ! R([a, b], Rp) ! P ([a, b], Rp). 10.7 Equations différentielles simples La résolution de certaines équations différentielles simples se ramène à des intégrations indéfinies. Définition. Soit I un intervalle, f et g des fonctions réelles continues sur I. On appelle équation différentielle linéaire du premier ordre toute équation différentielle de la forme y $ (x) = f (x)y(x) + g(x), (10.1) dont l’inconnue y est une fonction réelle dérivable sur I. Une solution sur I de cette équation différentielle sera toute application réelle y dérivable sur I et vérifiant l’équation en chaque point de I. L’équation est dite homogène si g = 0 et non homogène sinon. Puisque f est continue sur I, elle y est primitivable et chaque intégrale indéfinie de f est dérivable, et donc continue sur I. Si a ∈ I est fixé, la fonction 4 J x 5 x 2→ exp − f a est donc strictement positive et dérivable sur I. L’équation (10.1) est donc équivalente à l’équation 4 y $ (x) exp − J x a f 5 4 = f (x)y(x) exp − J a x f 5 4 + g(x) exp − J a x 5 f , 376 CHAPITRE 10. FONCTIONS INTÉGRABLES c’est-à-dire à l’équation 2 4 y(x) exp − J x f a 53$ 4 = g(x) exp − J 5 x f . a Le second membre étant continu, dont primitivable sur I, les solutions de cette équation seront données par 4 y(x) exp − J x f a 5 = c+ J x a 2 4 g(y) exp − J y f a 53 dy, où c est une constante réelle arbitraire, et dès lors les solutions de l’équation linéaire (10.1) seront les fonctions y données par U y(x) = c + = c exp J x a 4J 2 x f a 4 g(y) exp − 5 + J a x2 J a exp y f 53 4J y x V dy exp 5 3 4J x a f 5 f g(y) dy. Exemple. Considérons l’équation différentielle 1 y $ (x) = y(x) + x x sur l’intervalle I = ]0, +∞[. Prenant par exemple a = 1, on a J x 1 dy = ln x, exp(ln x) = x, y 1 et dès lors les solutions sont données par les fonctions y définies par 2 y(x) = c + où c est un réel arbitraire. J 1 x 3 dy x = [c + (x − 1)]x, Définition. Soit I un intervalle, f une fonction réelle continue sur I et h une application continue de R dans R. On appelle équation différentielle du premier ordre à variables séparées toute équation différentielle de la forme y $ (x) = f (x)h(y(x)), (10.2) où l’inconnue y est une fonction réelle. Si J ⊂ I est un intervalle, on appelle solution sur J de cette équation différentielle toute application réelle y dérivable sur J et vérifiant l’équation pour chaque x ∈ J. La terminologie “variables séparées” vient de ce que le second membre de l’équation est le produit d’une fonction de x seulement par une fonction de y seulement. Ainsi, une équation différentielle linéaire du premier ordre est à variables séparées si elle est homogène ou si f et g sont constantes. Notons tout d’abord le résultat simple suivant. 10.7. EQUATIONS DIFFÉRENTIELLES SIMPLES 377 Proposition. Pour tout y ∗ tel que h(y ∗ ) = 0, l’application constante y ∗ sur I est une solution sur I de (10.2). Démonstration. On a en effet, pour tout x ∈ I, (y ∗ )$ = 0 = f (x)h(y ∗ ). Supposons maintenant que h vérifie une condition de Lipschitz sur chaque borné de R. Ce sera en particulier le cas si h est de classe C 1 sur R. On sait alors que, pour chaque x0 ⊂ I et chaque y0 ∈ R, le problème de Cauchy correspondant y $ (x) = f (x)h(y(x)), y(x0) = y0 possède au plus une solution. Dès lors, si y ∗ est un zéro de h et y une solution de l’équation différentielle (10.2) telle que y(x0 ) = y ∗ pour un certain x0 , l’unicité de la solution du problème de Cauchy entraı̂ne que y(x) = y ∗ pour chaque x ∈ I. Par conséquent, chaque solution de (10.2) différente d’un zéro de h prendra ses valeurs dans un et un seul des intervalles ouverts de R déterminés par les zéros de h. Soit K un tel intervalle. La fonction h1 est donc continue sur K et y : I → K est solution de l’équation différentielle (10.2) si et seulement si elle vérifie l’équation y $ (x) = f (x), h(y(x)) ou encore, fixant a ∈ I et utilisant le théorème de dérivation des fonctions composées et les propriétés de l’intégrale indéfinie, si et seulement si elle vérifie l’équation &J '$ y(x) dt = f (x). h(t) a Comme le second membre est continu, donc primitivable sur I, cette dernière équation équivaut à J y(x) a dt =c+ h(t) J x f (t) dt, a où c est une constante réelle arbitraire. Pour chaque valeur fixée de c, la solution y s’obtiendra donc explicitement en résolvant alors le problème de fonction implicite G(y, x) − c = 0, où G est définie par G(x, y) = J a y dt − h(t) J x f (t) dt. a Comme G est de la forme G(y, x) = M (y)−F (x) où M est une fonction con1 tinue et strictement monotone, puisque M $ (y) = h(y) est de signe constant 378 CHAPITRE 10. FONCTIONS INTÉGRABLES sur K, cette équation aura une solution unique y(x) pour chaque x ∈ I tel que F (x) appartienne à M (K). On notera que la fonction G(x, y(x)) conserve une valeur constante c si y est solution de l’équation différentielle (10.2). On dit que G est une intégrale première de l’équation différentielle (10.2). Exemples. 1. Considérons l’équation différentielle à variables séparées y $ (x) = 2x[y(x)]2. Notons tout d’abord que y = 0 est une solution sur R et recherchons maintenant les solutions à valeurs strictement positives ou à valeurs strictement négatives. Les solutions sous forme implicite sont données, en prenant par exemple a = 1, par J y(x) J x dt =c+ 2t dt, t2 1 1 c’est-à-dire par 1 1− = c + x2 − 1, y(x) ce qui peut encore s’écrire, puisque c est une constante arbitraire, y(x) = 1 . c − x2 Dès lors, pour c < 0, cette solution est strictement négative et définie sur R. Pour c = 0, cette formule fournit une solution strictement négative définie sur ] − ∞, 0[ et une solution strictement négative définie sur ]0, +∞[. Pour c > 0, √ la formule fournit une solution strictement négative définie sur ] − ∞, − c[, √ √ une solution strictement positive définie sur ] − c, + c[ et une solution √ strictement négative définie sur ] c, +∞[. On voit que, contrairement au cas de l’équation linéaire, les intervalles de définition des solutions peuvent être strictement compris dans l’intervalle de définition de l’équation différentielle (ici R) et peuvent dépendre de la solution elle-même. 2. L’équation différentielle 2 y(x) y (x) = ay(x) 1 − b $ 3 où a > 0 et b > 0, fut proposée en 1838 par le mathématicien belge PierreFrançois Verhulst pour remplacer la loi y $ (x) = ay(x) 10.8. LEMME DE SAKS-HENSTOCK 379 donnée en 1798 par Thomas R. Malthus pour décrire l’évolution d’une population. La loi de Malthus n’a évidemment, à côté de la solution constante y(x) = 0, que des solutions exponentielles y(x) = c exp ax, c ∈ R∗ . L’équation de Verhulst possède les deux solutions constantes y(x) = 0 et y(x) = b données par les zéros de la fonction h(y) = y(1 − yb ). On vérifie aisément, en utilisant la méthode exposée plus haut, que les autres solutions sont les fonctions y définies par y(x) = bc , c ∈ R \ {0, b}. c + (b − c) exp(−ax) Si c > b, la solution correspondante est strictement décroissante sur ]a−1 ln(1 − bc ), +∞[ tend vers +∞ si x tend vers a−1 ln(1 − bc ) et tend vers b lorsque x tend vers +∞. Si c ∈ ]0, b[ , la solution est strictement croissante sur R, avec limx→−∞ y(x) = 0, limx→+∞ y(x) = b. Enfin, si c < 0, la solution (négative et donc sans intérêt pour la démographie !) est strictement décroissante sur ] − ∞, a−1 ln(1 − bc )[ et elle tend vers 0 si x tend vers −∞ et vers −∞ si x tend vers a−1 ln(1 − bc ). La courbe décrite par cette solution lorsque 0 < c < b est appelée la courbe logistique et joue un grand rôle dans la description des phénomènes biologiques et sociologiques. Contrairement au modèle de Malthus, qui mène à une croissance exponentielle, le modèle de Verhulst conduit à une saturation de la population. 10.8 Lemme de Saks-Henstock Le résultat technique suivant, qui porte le nom de lemme de Saks-Henstock, joue un rôle essentiel dans la démonstration de plusieurs résultats importants en théorie de l’intégration. Il exprime essentiellement que, pour une fonction f intégrable sur l’adhérence I¯ d’un semi-pavé I, la somme de Riemann associée àH un “morceau” d’une P-partition Π dont la somme de Riemann approche I¯ f à ! près est elle-même une approximation à ! près de la somme des intégrales sur les adhérences des pavés constituant le morceau. Lemme. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp intégra¯ Soit ! > 0 et δ une jauge sur I¯ telle que ble sur I¯ et J son intégrale sur I. l’on ait |S(I, f, Π) − J|2 ≤ !, pour toute P-partition δ-fine Π de I. Alors, pour toute famille {(x1 , K 1 ), . . ., (xq , K q )} 380 CHAPITRE 10. FONCTIONS INTÉGRABLES formée de semi-pavés K j mutuellement disjoints contenus dans I et de points xj ∈ K̄ j tels que K j ⊂ B∞ [xj , δ(xj )], (1 ≤ j ≤ q), on a # # # q 2 3# J #$ # j j # µ(K )f (x ) − f ## ≤ !. # K̄ j #j=1 # 2 Démonstration. On va montrer que # # # q 2 3# J #$ # j j # µ(K )f (x ) − f ## ≤ ! + η, # j K̄ #j=1 # 2 !q quel que soit η > 0. On sait que I \ j=1 K j peut s’écrire sous la forme k k k=1 L , où les L (1 ≤ k ≤ r) sont des semi-pavés contenus dans I et ¯ l’est aussi sur mutuellement disjoints. Bien entendu, f , intégrable sur I, k chaque L , et !r J I¯ f= q J $ j j=1 K̄ f+ r J $ k k=1 L̄ f. En conséquence, si η > 0 est donné, il existera une jauge δk sur L̄k , que l’on peut toujours choisir telle que δk (x) ≤ δ(x), (x ∈ L̄k , 1 ≤ k ≤ r), ayant la propriété que # # J # # η #S(Lk , f, Πk ) − f ## ≤ , # k r L̄ 2 pour toute P-partition δk -fine Πk de Lk , (1 ≤ k ≤ r). Par conséquent, la famille finie Π formée des (xj , K j ), (1 ≤ j ≤ k), et des éléments des familles Πk , (1 ≤ k ≤ r) constitue une P-partition δ-fine de I telle que S(I, f, Π) = q $ µ(K j )f (xj ) + j=1 r $ S(Lk , f, Πk ). k=1 On aura donc, par hypothèse, # # # q 2 3# J #$ # j j # µ(K )f (x ) − f ## # j K̄ #j=1 # 2 # J r r J # $ $ # = #S(I, f, Π) − S(Lk , f, Πk ) − f + # I¯ L̄k k=1 k=1 # # # f# # 2 381 10.8. LEMME DE SAKS-HENSTOCK # # J ≤ ##S(I, f, Π) − I¯ # # f ## + 2 ≤ !+r J r ## $ #S(Lk , f, Πk ) − # L̄k k=1 η = ! + η, r # # f ## 2 et la démonstration est complète. Corollaire. Dans les conditions du lemme de Saks-Henstock, si f est réelle, on a # J q # $# #µ(K j )f (xj ) − # K̄ j j=1 # f ## ≤ 2!. Démonstration. Soient K j1 , . . . , K jl (resp. K jl+1 , . . ., K jq ) les K j tels que µ(K )f (x ) − j j J f ≥ 0, (resp. µ(K )f (x ) − j K̄ j j J K̄ j f < 0). Le théorème précédent s’applique à chaque famille {(xji , K ji ) : 1 ≤ i ≤ l} et {(xji , K ji ) : l + 1 ≤ i ≤ q} et fournit les inégalités J l ## $ #µ(K ji )f (xji ) − # K̄ ji i=1 et J q # $ # #µ(K ji )f (xji ) − # K̄ ji i=l+1 # # f ## = # # l 2 $ i=1 f ## = − µ(K ji )f (xji ) − q 2 $ i=l+1 J K̄ ji µ(K ji )f (xji ) − J 3 f ≤ !, K̄ ji 3 f ≤ !. La thèse résulte de l’addition membre à membre de ces inégalités. Le résultat correspondant pour une fonction à valeurs dans Rp s’en déduit aisément. Corollaire. Dans les conditions du lemme de Saks-Henstock, on a, avec i = 1, 2 ou ∞, J q # $ # #µ(K j )f (xj ) − # K̄ j j=1 # # f ## ≤ 2p!. i Démonstration. En appliquant le corollaire précédent à chaque composante fk de f , qui vérifie aussi les conditions du lemme de Saks-Henstock, on obtient # # J q $ # #µ(K j )fk (xj ) − # j=1 K̄ j # fk ## ≤ 2!, (1 ≤ k ≤ p). 382 CHAPITRE 10. FONCTIONS INTÉGRABLES Dès lors, si i = 1, 2 ou ∞, on a J q # $ # #µ(K j )f (xj ) − # K̄ j j=1 = # J q # $ # # # #µ(K j )f (xj ) − f# ≤ # i K̄ j j=1 J q $ p # $ # #µ(K j )fk (xj ) − # K̄ j j=1 k=1 # # # # f ## 1 fk ## ≤ 2p!. Enfin, la conséquence suivante du lemme de Saks-Henstock va nous conduire à la notion d’intégrabilité absolue. Corollaire. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp ¯ Soit ! > 0 et δ une jauge sur I¯ telle intégrable sur I¯ et J son intégrale sur I. que l’on ait |S(I, f, Π) − J|2 ≤ !, pour toute P-partition δ-fine Π de I. Alors, pour ces mêmes P-partitions Π = {(x1 , I 1), . . . , (xm, I m)}, on a, si i = 1, 2 ou ∞, # # m #J $ # # #S(I, |f |i, Π) − # # # ¯j # j=1 I # # f ## # # # # ≤ 2p!. # i# Démonstration. En appliquant les inégalités classiques sur les normes et le corollaire précédent à la famille Π = {(x1 , I 1 ), . . ., (xm, I m)}, on obtient ≤ 10.9 # # m #J $ # # #S(I, |f |i, Π) − # # # ¯j # j=1 I # # f ## #J m # $ # # #µ(I j )|f (xj )|i − # # # ¯j j=1 I # # # #= # i# ## ## # #m 2 #J #$ # j j # µ(I )|f (x )|i − ## # I¯j #j=1 f ## ## ≤ i J m # $ # #µ(I j )f (xj ) − # ¯j j=1 I # # # # f ## # 3# # # # i # f ## ≤ 2p!. i L-intégrabilité sur un pavé L’intégrabilité d’une fonction f sur un pavé I¯ de Rn n’entraı̂ne pas nécessairement l’intégrabilité de |f |i sur I¯ et l’intégrabilité de |f |i sur I¯ n’entraı̂ne pas nécessairement celle de f sur I¯ (i = 1, 2 ou ∞). Nous donnerons plus loin 383 10.9. L-INTÉGRABILITÉ SUR UN PAVÉ des exemples justifiant cette assertion. On va voir que la classe des fonctions f telles que f et |f |i sont toutes deux intégrables sur I¯ est un sous-ensemble ¯ de particulièrement important de l’ensemble des fonctions intégrables sur I, la même manière que le sous-ensemble des séries absolument convergentes constitue un sous-ensemble particulièrement intéressant de l’ensemble des séries convergentes. Le dernier corollaire du lemme de Saks-Henstock montre que, ! > 0 étant donné et δ étant une jauge associée à cet ! par l’intégrabilité ¯ les sommes de Riemann S(I, |f |i, Π) relatives à |f |i et aux Pde f sur I, partitions δ-finesHΠ = {(x1 , I 1 ), . . ., (xm, I m)} diffèreront de moins de 2p! des % quantités m j=1 | I¯j f |i . Cette observation suggère la condition nécessaire et ¯ Rp) soit telle que |f |i ∈ suffisante suivante pour qu’une fonction f ∈ P (I, p ¯ R ). P (I, Proposition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp intégrable sur I¯ et i = 1, 2 ou ∞. Alors, |f |i est intégrable sur I¯ si et seulement si le sous-ensemble de R+ ; q #J $# # Si = # K̄ l=1 < # # 1 q # f # : {K , . . ., K } ∈ P(I) , l i est majoré, où P(I) désigne l’ensemble de toutes les partitions {K 1 , . . ., K q } de I en un nombre fini de semi-pavés. En outre, si Si est majoré, alors J I¯ |f |i = sup Si = sup {K 1 ,...,K q }∈P (I) & q #J $ # # # K̄ l=1 #' # f ## . l i Démonstration. Condition nécessaire. Soit i = 1, 2 ou ∞. Si f et ¯ et si {K 1 , . . . , K q } ∈ P(I), alors f et |f |i sont |f |i sont intégrables sur I, l intégrables sur chaque K et #J # # # K̄ l # # f ## ≤ i J K̄ l |f |i, (1 ≤ l ≤ q). Dès lors, en vertu de l’additivité de l’intégrale, on a q #J $ # # # l=1 K̄ l # # f ## ≤ i q J $ l=1 K̄ l |f |i = H J I¯ |f |i , ce qui montre que Si est majoré par I¯ |f |i . Condition suffisante. i = 1, 2 ou ∞ étant fixé, posons Ai = sup Si = sup {K 1 ,...,K q }∈P (I) & q #J $ # # # l=1 K̄ #' # f ## . l i 384 CHAPITRE 10. FONCTIONS INTÉGRABLES Soit ! > 0 donné. Par la caractérisation du supremum, il existe {K 1 , . . . , K q } ∈ P(I) tel que # q #J # ! $ ## Ai − ≤ f # ≤ Ai . 2 l=1 # K̄ l #i Par l’intégrabilité de f sur I¯ et le lemme des P-partitions subordonnées, il existe une jauge δ sur I¯ telle que # J # # # #S(I, f, Π) − f # ≤ ! # # 4p I¯ 2 pour toute P-partition δ-fine Π de I et telle que, pour chacune de ces Ppartitions Π = {(x1 , I 1 ), . . ., (xm, I m)}, la famille Π̃ = {(xj , I j ∩ K l ) : I j ∩ K l /= ∅, 1 ≤ l ≤ q, 1 ≤ j ≤ m} est une P-partition δ-fine de I pour laquelle S(I, |f |i, Π) = S(I, |f |i, Π̃). En conséquence, on a q ≤ q $ # # J q # $ $ # # # f ## = # l j K̄ l i l=1 #{1≤j≤m : I j ∩K l (=∅} K ∩I #J ! $ ## Ai − ≤ 2 l=1 # $ l=1 {1≤j≤m : I j ∩K l (=∅} #J # # # K l ∩I # # f ## ≤ Ai , j # # # f ## # i i et, en vertu du dernier corollaire du lemme de Saks-Henstock, # # # #J ## $ # # ## ! #S(I, |f |i, Π̃) − # ## # # l j f# # ≤ 2. K ∩I # i# {1≤j≤m, 1≤l≤q : I j ∩K l (=∅} En conséquence, si Π est une P-partition δ-fine de I, on a |S(I, |f |i, Π) − Ai | = |S(I, |f |i, Π̃) − Ai | # # # #J ## $ # # ## # ## ≤ ##S(I, |f |i, Π̃) − # l j f# # K ∩I # i# {1≤j≤m, 1≤l≤q : I j ∩K l (=∅} # # # # #J # $ # # # # ! ! # # # # +# # l j f # − Ai # ≤ 2 + 2 = !. #{1≤j≤m, 1≤l≤q : I j ∩K l (=∅} K ∩I # i 10.9. L-INTÉGRABILITÉ SUR UN PAVÉ 385 Remarque. Les inégalités bien connues entre les trois types de normes d’un élément de Rp montrent que si Si est majorée pour une des normes, il ¯ l’est pour les deux autres. En conséquence, lorsque f est intégrable sur I, l’intégrabilité de l’une des fonctions |f |i entraı̂nera celle des deux autres, ce qui justifie l’indépendance de la définition qui suit par rapport au choix de la norme | · |2 . Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp ¯ On dit que f est absolument intégrable sur I¯ ou intégrable définie sur I. au sens de Lebesgue sur I¯ ou encore L-intégrable sur I¯ si f et |f |2 sont ¯ intégrables sur I. L’appellation “intégrable au sens de Lebesgue” vient de ce que cette classe de fonctions fut introduite pour la première fois en 1902 par Henri Lebesgue à partir d’une définition différente de celle utilisée ici. Toute fonction L-intégrable sur I¯ y est donc évidemment intégrable. En d’autres ¯ Rp) l’ensemble des fonctions de Rn dans Rp termes, si l’on désigne par L(I, ¯ on a l’inclusion L-intégrables sur I, ¯ Rp) ⊂ P (I, ¯ Rp). L(I, On montrera plus loin que l’inclusion est stricte. Bien entendu, par définition, l’intégrabilité et la L-intégrabilité coı̈ncident pour des fonctions positives ¯ sur I. Une conséquence simple mais importante de la proposition que nous venons de démontrer est le test de comparaison de L-intégrabilité suivant. Corollaire. Soit I un semi-pavé de Rn et g une fonction positive intégrable ¯ Alors, toute fonction f de Rn dans Rp intégrable sur I¯ et telle que, sur I. ¯ on ait pour i = 1, 2 ou ∞ et chaque x ∈ I, |f (x)|i ≤ g(x), ¯ et l’on a est L-intégrable sur I, J I¯ |f |i ≤ J I¯ g. Démonstration. Par hypothèse et par la propriété de restriction, f et g sont intégrables sur K̄ pour tout semi-pavé K ⊂ I, on a, #J # # # K̄ # # f ## ≤ i J K̄ g. 386 CHAPITRE 10. FONCTIONS INTÉGRABLES Dès lors, si {K 1 , . . . , K q } ∈ P(I), on aura, en utilisant l’additivité de l’intégrale, q #J $ # # # l=1 H K̄ l # # f ## ≤ i q J $ l l=1 K̄ g= J I¯ g. Donc I¯ g majore l’ensemble Si et la proposition ci-dessus entraı̂ne l’intégrabilité de |f |i sur I¯ et l’inégalité J I¯ |f |i ≤ J I¯ g. Ce test de comparaison a plusieurs conséquences intéressantes. La premi¯ entre l’intégrabilité et ère est l’équivalence, pour les fonctions bornées sur I, la L-intégrabilité. Corollaire. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp ¯ Alors f est L-intégrable sur I¯ si et seulement si f définie et bornée sur I. ¯ est intégrable sur I. Démonstration. La condition nécessaire est évidente. Pour la condition suffisante, il existe par hypothèse une constante M ≥ 0 telle que |f (x)|2 ≤ M ¯ Comme la fonction constante M est intégrable sur I, ¯ la pour tout x ∈ I. thèse résulte du test de comparaison. ¯ on déduit de Comme toute fonction R-intégrable sur I¯ est bornée sur I, ¯ En ce corollaire la L-intégrabilité sur I¯ de toute fonction R-intégrable sur I. d’autres termes, on a l’inclusion ¯ Rp) ⊂ L(I, ¯ Rp), R(I, et l’inclusion est stricte puisque la fonction de Dirichlet, positive et intégrable sur [0, 1], y est évidemment L-intégrable. Le corollaire montre aussi que c’est parmi les fonctions non bornées sur I¯ qu’il faudra chercher les éléments ¯ Rp) \ L(I, ¯ Rp). de P (I, Une autre conséquence du test de comparaison est le caractère d’espace ¯ Rp). vectoriel de L(I, 10.9. L-INTÉGRABILITÉ SUR UN PAVÉ 387 Corollaire. Si I est un semi-pavé de Rn , si f et g sont des fonctions de Rn dans Rp L-intégrables sur I¯ et si c ∈ R, alors f + g et cf sont L-intégrables ¯ sur I. ¯ et Démonstration. Par hypothèse, f , g, |f |2 et |g|2 sont intégrables sur I, ¯ Rp ) il en est dès lors de même de f + g, |f |2 + |g|2 , cf et |c||f |2, puisque P (I, ¯ on a est un espace vectoriel. D’ailleurs, pour chaque x ∈ I, |(f + g)(x)|2 ≤ |f (x)|2 + |g(x)|2 = |f |2 (x) + |g|2(x), |cf (x)|2 ≤ |c||f (x)|2 = |c||f |2(x). La thèse résulte alors du test de comparaison. Le test de comparaison montre aussi que les composantes d’une fonction L-intégrable sur I¯ y sont L-intégrables. Corollaire. Si I est un semi-pavé de Rn et f une fonction de Rn dans Rp ¯ Alors f est L-intégrable si et seulement si chaque composante définie sur I. fk de f est L-intégrable sur I¯ (1 ≤ k ≤ p). Démonstration. Condition nécessaire. Par hypothèse et par les pro¯ priétés de l’intégrale, f , fk , (1 ≤ k ≤ p) et |f |2 sont intégrables sur I. Comme on a |fk (x)| ≤ |f (x)|2 , ¯ la thèse résulte du pour chaque entier k compris entre 1 et p et tout x ∈ I, test de comparaison. Condition suffisante. Par hypothèse, chaque fk et chaque |fk | est inté¯ (1 ≤ k ≤ p), et dès lors, par les propriétés de l’intégrabilité, il grable sur I, % en est de même de f et de |f |1 = pk=1 |fk |, et donc de f et de |f |2 . On peut donc ramener l’étude de la L-intégrabilité sur I¯ des fonctions de Rn dans Rp à celle de fonctions réelles. Pour celles-ci, on possède une version raffinée du test de comparaison. Proposition. Soit f une fonction réelle intégrable sur l’adhérence I¯ d’un semi-pavé I de Rn . Alors f est L-intégrable sur I¯ si et seulement s’il existe une fonction réelle g L-intégrable sur I¯ et telle que l’une des conditions suivantes f (x) ≤ g(x) ou f (x) ≥ g(x) ¯ soit satisfaite pour tout x ∈ I. Démonstration. Condition nécessaire. Il suffit évidemment de prendre g = f. 388 CHAPITRE 10. FONCTIONS INTÉGRABLES Condition suffisante. Le deuxième cas se ramène au premier en considérant −f au lieu de f . On a f = g − (g − f ) avec g L-intégrable sur I¯ et ¯ donc L-intégrable sur I. ¯ Comme L(I, ¯ R) g − f positive et intégrable sur I, est un espace vectoriel, le résultat est démontré. Enfin, une application directe de la définition et de la propriété d’additivité des fonctions intégrables fournit la propriété d’additivité pour les fonctions L-intégrables. Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp ¯ Etant donné {K 1 , . . ., K q } ∈ P(I), f est L-intégrable sur I¯ si définie sur I. et seulement si f est L-intégrable sur chaque K̄ l (1 ≤ l ≤ q). 10.10 Exercices 1. Montrer que si f est une fonction de R dans Rp R-intégrable sur [a, b], on a 4 5 J b m b−a $ (j − 1)(b − a) f = lim f a+ . m→∞ m m a j=1 2. Si f et g sont deux fonctions de R dans R telles que f soit continue sur [a, b], g intégrable et positive sur [a, b] et f g intégrable sur [a, b], montrer qu’il existe c ∈ [a, b] tel que J b a f g = f (c) J a b g. (Premier théorème de la moyenne du calcul intégral). Suggestion : par le théorème de Weierstrass, il existera y et z dans [a, b] tels que f (y) J b a g≤ J b a f g ≤ f (z) J b g, a et la thèse résulte du théorème des valeurs intermédiaires appliqué à la foncH tion continue ( ab g)f. Le cas particulier où g = 1 est intéressant. 3. Montrer que si f est uneH fonction réelle définie et croissante sur [a, b], alors son intégrale indéfinie a· f est convexe sur [a, b]. 4. Soit I un semi-pavé de Rn et ϕ une application positive définie sur l’ensemble des semi-pavés contenus dans I et étendue à toute union finie 389 10.10. EXERCICES I 1 ∪ . . . ∪ I r de semi-pavés contenus dans I et mutuellement disjoints par la relation ϕ r > j=1 I j = r $ ϕ(I j ). j=1 Montrer que la mesure µ d’un semi-pavé de Rn vérifie cette condition. Si f est une fonction de Rn dans Rp définie sur I, on dit que f est intégrable sur I au sens de Perron-Stieltjes par rapport à ϕ s’il existe J ∈ Rp tel que, pour chaque ! >A0, on puisse trouver une jauge δ sur I tel que, pour toute B P-partition Π = (xj , I j ) 1≤j≤m δ-fine de I, on ait # # #m # #$ # j j # # ≤ !. ϕ(I )f (x ) − J # # #j=1 # 2 %m L’expression S(I, ϕ, f, Π) = j=1 ϕ(I j )f (xj ) s’appelle la somme de Riemann-Stieltjes relative à I, ϕ, f et Π. Montrer qu’il existe au plus un J vérifiant la définition ci-dessus. On l’appelle l’intégrale de Perron-Stieltjes de f sur I par rapport à ϕ, et on le note J I¯ f dϕ ou J I¯ f (x) dϕ(x) ou J I¯ f (x)ϕ(dx). Si l’on peut prendre la jauge δ constante dans la définition précédente, on parle d’intégrale de Riemann-Stieltjes. Etudier les propriétés de l’intégrale qui restent valables dans ce cadre plus général. Un cas particulier important est celui où n = 1 et où, si I j = ]aj , bj ], on prend ϕ(I j ) = g(bj ) − g(aj ), où g est une fonction réelle définieH et croissante sur [a, b]. L’intégrale correspondante est alors souvent notée ab f dg. 5. Si f est une fonction de Rn dans Rp continue sur l’adhérence I¯ du semipavé I de Rn , et si J I¯ |f |2 = 0, ¯ On procédera par l’absurde en notant que l’existenmontrer que f = 0 sur I. ¯ ce d’un y ∈ I tel que |f (y)|2 > 0 et la continuité de f entraı̂nent l’existence ¯ On a donc, d’un semi-pavé J ⊂ I tel que |f (x)|2 ≥ 12 |f (y)|2 pour tout x ∈ J. si I = J ∪ I 1 ∪ I 2 ∪ . . . ∪ I r , où les I j sont des semi-pavés mutuellement 390 CHAPITRE 10. FONCTIONS INTÉGRABLES ¯ disjoints de I \ J, 0= J I¯ J |f |2 = r J $ ¯j j=1 I |f |2 + J J¯ |f |2 J 1 µ(J) ≥ |f |2 ≥ |f (y)|2 = |f (y)|2 > 0, ¯ ¯ 2 2 J J ce qui est contradictoire. 6. Soient a > 0 et b > 0 des nombres réels. Démontrer la formule de Gauss ∞ $ (−1)k k=0 a + bk = J 1 0 xa−1 dx. 1 + xb Suggestion : on part de l’identité, valable pour tout x ≥ 0 et tout entier n ≥ 1, n−1 $ xa−1 (−1)n xa−1+bn a−1 = x (−xb )k + , b 1+x 1 + xb k=0 et l’on intègre les deux membres sur [0, 1], ce qui donne J 1 0 où n−1 $ (−1)k xa−1 dx = + Rn , 1 + xb a + bk k=0 # # J 1 nb+a−1 # # x # # n |Rn | = #(−1) dx #≤ b # # 1+x 0 #J # # # 1 x nb+a−1 0 # # 1 dx## = . a + bn Donc Rn → 0 lorsque n → ∞. On en déduit en particulier la formule de Mercator 1 1 (−1)k log 2 = 1 − + − . . . + + . . .. 2 3 k+1 7. Si c /= 1 est un réel et si a et b sont deux applications de l’intervalle I ⊂ R dans R, montrer que l’application y : I → R∗+ est solution de l’équation différentielle de Bernoulli y $ (x) = a(x)y(x) + b(x)y(x)c, si et seulement si l’application z = y 1−c est solution sur I de l’équation différentielle linéaire z $ (x) = (1 − c)a(x)z(x) + (1 − c)b(x). 391 10.11. PETITE ANTHOLOGIE 8. Soit I ⊂ R un intervalle et g une application continue de I dans R. Montrer que toute solution y sur I de l’équation différentielle y $$ (x) = g[y(x)], (c’est-à-dire toute application y de I dans R deux fois dérivable sur I vérifiant cette relation sur I) vérifie l’équation différentielle du premier ordre [y $ (x)]2 = 2[G(y(x)) + C], où G est une primitive de g sur I et C une constante réelle arbitraire. 9. Montrer que l’équation fonctionnelle de Cauchy f (x + y) = f (x) + f (y), (x ∈ R, y ∈ R), où l’inconnue f est une fonction continue, a pour solutions les fonctions f (x) = cx, (c ∈ R). Suggestion. En prenant x = y = 0, on voit que f (0) = 0. En intégrant les deux membres de l’égalité par rapport à y, x étant fixé, on trouve J 1 f (x + y) dy = f (x) + 0 J 1 f (y) dy, 0 et donc, par l’invariance de l’intégrale pour une translation, f (x) = J x+1 x f (u) du− J 1 f (y) dy = 0 J x+1 0 Donc f est dérivable et, pour tout x ∈ R, f (u) du− J x 0 f (u) du− J 1 f (y) dy. 0 f $ (x) = f (x + 1) − f (x) = f (1), ce qui entraı̂ne f (x) = f (1)x. 10.11 Petite anthologie Je ne ferai d’aucune difficulté d’user de cette expression la somme des ordonnées qui semble ne pas être géométrique à ceux qui n’entendent pas la doctrine des indivisibles, et qui s’imaginent que c’est pécher contre la géométrie que d’exprimer un plan par un nombre infini de lignes; ce qui ne vient que de leur manque d’intelligence puisqu’on n’entend autre chose par là sinon la somme d’un nombre indéfini de rectangles faits de chaque ordonnée avec de petites portions égales du diamètre, dont la somme est certainement un plan, qui ne diffère de l’espace du demi-cercle que d’une quantité moindre qu’aucune donnée. 392 CHAPITRE 10. FONCTIONS INTÉGRABLES Blaise Pascal, 1660 Nous avons déjà noté que les distances aj − aj−1 , par lesquelles x est supposé croı̂tre successivement, doivent être prises très petites pour que les valeurs correspondantes f (aj−1 ), f (aj ) ne diffèrent à leur tour guère l’une de l’autre; à partir de cela, il faut juger si les intervalles a1 − a, a2 − a1 , . . . doivent être pris égaux ou inégaux. En fait, là où la valeur de f (x) ne change guère lorsque x varie, l’intervalle par lequel x croı̂t peut être pris grand sans danger. D’autre part, là où des changements peu importants de x conduisent à des variations violentes de f (x), on devra prendre l’intervalle très petit. Leonhard Euler, 1768 Je considère chaque intégrale comme étant juste la somme des valeurs infiniment petites de l’expression différentielle placée sous le signe intégrale, qui correspond aux différentes valeurs de la variable incluses entre les limites en question. Quand on adopte cette manière de regarder l’intégrale définie, on prouve aisément qu’une telle intégrale a une valeur unique et finie lorsque, les deux limites de la variable étant finie, les intégrands restent finis et continus entre ces limites. Il me semble que cette manière de regarder une intégrale définie devrait être adoptée de préférence, comme je l’ai fait, parce qu’elle vaut également pour tous les cas, même ceux dans lesquels nous ne pouvons pas passer généralement de la fonction sous le signe intégral à la fonction primitive. Augustin Cauchy, 1823 L’incertitude qui règne encore sur quelques points fondamentaux de la théorie des intégrales définies nous oblige à placer ici quelques remarques sur la notion de l’intégrale définie, et sur Hla généralité dont elle est susceptible. Et d’abord que doit-on entendre par ab f (x) dx? Pour répondre à cette question, prenons entre a et b une série de valeurs x1 , x2 , . . . , xn−1 rangées par ordre de grandeur, depuis a jusqu’à b, et désignons pour abréger x1 − a par δ1 , x2 − x1 par δ2 , . . ., b − xn−1 par δn ; soient en outre !i des nombres positifs plus petits que l’unité. Il est clair que la valeur de la somme S = δ1 f (a + !1 δ1 ) + δ2 f (x1 + !2 δ2 ) + . . . + δn f (xn−1 + !n δn ) dépendra du choix des intervalles δ et des fractions !. Si elle a la propriété, de quelque manière que les δ et les ! puissent être choisis, de s’approcher indéfiniment d’une limite fixe A, quand les δ Htendent tous vers zéro, cette limite s’appelle la valeur de l’intégrale définie ab f (x) dx. 10.11. PETITE ANTHOLOGIE 393 Bernard Riemann, 1854 Dans le cas des fonctions continues, il y a identité entre les notions d’intégrale et de fonction primitive. Riemann a défini l’intégrale de certaines fonctions discontinues, mais toutes les fonctions dérivées ne sont pas intégrables au sens de Riemann. Le problème des fonctions primitives n’est donc pas résolu par l’intégration, et l’on peut désirer une définition de l’intégrale comprenant comme cas particulier celle de Riemann et permettant de résoudre le problème des fonctions primitives. Henri Lebesgue, 1901 Un caractère important de la définition de Riemann est le suivant: la division en intervalles est entièrement indépendante des propriétés de la fonction; si l’on considère deux fonctions différentes, on prendra pour ces fonctions les mêmes intervalles, c’est-à-dire qu’on leur appliquera un procédé de calcul uniforme. C’est évidemment là un grand avantage pour le calcul; mais c’est en même temps un inconvénient : un tel procédé qui ne tient pas compte des propriétés particulières de la fonction à laquelle il s’applique peut être comparé à ces vêtements confectionnés, qui ne sauraient être exactement ajustés, surtout s’il s’agit d’habiller un individu difforme : certaines fonctions singulières ont pu être justement comparées aux types monstrueux de la biologie. Emile Borel, 1909 Intégrer, c’est pousser à l’infini les deux règles conjointes de Descartes : d’abord diviser la difficulté pour la mieux résoudre, ensuite recomposer cette désagrégation préliminaire. Dans une masse étendue, une cause s’exerce, un effet s’accomplit. Si l’intensité des phénomènes était constante aux divers points, les résultats se manifesteraient proportionnels à cette intensité et à cette masse à la fois. Un simple produit des facteurs les livrerait. Mais si ces intensités sont fluctuantes, comment évaluer leur concours total ? Par la pensée, on partage le corps en éléments tellement réduits et ainsi disposés que sur chacun d’entre eux l’action et sa conséquence, rapportées l’une et l’autre à la mesure de la parcelle, ne présentent plus de variation appréciable. Les évaluer est donc immédiat. Additionner ensemble des infiniment petits, pour calculer le phénomène total, c’est procéder à une intégration. Le tout est de prendre la partition préalable par le bon biais. Arnaud Denjoy, 1920 394 CHAPITRE 10. FONCTIONS INTÉGRABLES Presque tout étudiant de premier cycle en mathématique, physique ou sciences de l’ingénieur étudie assez d’analyse pour rencontrer les intégrales de Riemann, les intégrales “impropres”, les intégrales de lignes et de surfaces, bref, tous les types d’intégration du dix-neuvième siècle. Mais le vingtième siècle a produit des progrès en théorie de l’intégration qui furent indispensables pour l’analyse et se révélèrent plus tard magnifiquement adaptés à la théorie des probabilités et à des applications comme la théorie quantique, la théorie de la communication et le contrôle optimal de systèmes perturbés de manière aléatoire. Pour toutes ces applications et pour beaucoup d’autres, il convient de connaı̂tre les idées associées à la théorie de l’intégrale de Lebesgue. Une solution logiquement fondée mais pédagogiquement inacceptable consiste à écarter l’intégrale de Riemann et enseigner l’intégrale de Lebesgue dès le début du cours d’analyse. Mais ce choix ignore l’évidence expérimentale que les différentes manières usuelles d’introduire l’intégrale de Riemann sont toutes considérées par les étudiants comme plus naturelles et plus facilement comprises que n’importe laquelle des manières usuelles d’introduire l’intégrale de Lebesgue. Une voie pour sortir de cette impasse apparente fut ouverte en 1957, lorsque J. Kurzweil publia pour l’intégrale d’une fonction d’une variable une définition qui ressemblait fortement à celle de Riemann, et était pourtant plus générale; en fait, l’intégrale de Kurzweil est plus générale que celle de Lebesgue. Edward J. McShane, 1983 Chapitre 11 Intégrale sur un intervalle et séries 11.1 Théorème de Hake Soit I = ]a, b] un semi-intervalle de R et f une fonction de R dans Rp ¯ Montrons d’abord que son intégrale indéfinie est continue intégrable sur I. ¯ sur I. Proposition. Si f est intégrable sur [a, b], alors H· af est continue sur [a, b]. Démonstration. Soit c ∈ [a, b] et ! > 0; il faut montrer l’existence d’un η > 0 tel que #J x J c # # # # f− f ## ≤ ! # a a 2 lorsque x ∈ [a, b] et |x−c| ≤ η, c’est-à-dire, en vertu des propriétés d’additivité de l’intégrale, tel que #J # # # # x c # f ## ≤ !, 2 pour ces mêmes x. Pour cet ! > 0, il existe une jauge δ sur [a, b] telle que # J b ## # # # f # ≤ !/2 #S(I, f, Π) − # # a 2 pour toute P-partition δ-fine Π de I. Prenons U η = min δ(c), V ! , 2[1 + |f (c)|2 ] 395 396 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES et soit x ∈ [a, b] tel que |x − c| ≤ η. Alors, si x < c, on a [x, c] ⊂ [c − η, c] ⊂ [c − δ(c), c + δ(c)], et, pour x > c, on a de même [c, x] ⊂ [c, c + η] ⊂ [c − δ(c), c + δ(c)]. Le lemme de Saks-Henstock appliqué, selon le cas, à {(c, ]x, c])} ou à {(c, ]c, x])} entraı̂ne que #J # # # c x ou #J # # # c d’où l’on déduit aussitôt #J # # # c x x # # f − f (c)(c − x)## ≤ !/2, 2 # # f − f (c)(x − c)## ≤ !/2, 2 # # !|f (c)|2 f ## ≤ !/2 + |f (c)|2 |x − c| ≤ !/2 + < !, 2[1 + |f (c)|2] 2 et la démonstration est complète. Cette proposition et la propriété de restriction de l’intégrale impliquent aussitôt que si f est intégrable sur [a, b], alors f est intégrable sur [a, c] pour chaque c ∈ ]a, b[ et l’on a lim J c c→b− a f= J b f. a Nous allons montrer que cette condition nécessaire d’intégrabilité sur [a, b] est également suffisante. Ce résultat, qui est très utile pour l’obtention de tests pratiques d’intégrabilité sur un intervalle, porte le nom de théorème de Hake. Il n’est pas valable pour la R-intégrabilité ou la L-intégrabilité car l’existence de la limite du membre de gauche dans l’égalité ci-dessus n’entraı̂ne pas nécessairement la R- ou la L-intégrabilité sur [a, b] de f , c’est-à-dire l’existence du membre de droite. Dans le cadre de ces types d’intégration, cette limite doit être et est appelée intégrale impropre ou intégrale généralisée. 397 11.1. THÉORÈME DE HAKE Théorème. Soit f une fonction de R dans Rp définie sur [a, b]. Si f est intégrable sur [a, c] pour chaque c ∈ ]a, b[ et si lim J c c→b− a f = J, alors f est intégrable sur [a, b] et J b f = J. a Démonstration. Soit ! > 0; nous allons construire une jauge δ sur [a, b] telle que |S(]a, b], f, Π) − J|2 ≤ ! dès que Π est une P-partition δ-fine de ]a, b]. Si nous posons aj = b − 2−j (b − a), (j ∈ N), alors a0 = a, a < aj < aj+1 < b pour chaque j ∈ N∗ et [a, b[ = > [aj , aj+1 [. j∈N Dès lors, la fonction f est intégrable sur [aj , aj+1 ] pour chaque j ∈ N et il existe donc une jauge δj sur [aj , aj+1 ] telle que # J aj+1 ## # ! # # f # ≤ j+2 , #S(]aj , aj+1 ], f, Πj ) − # # 2 aj 2 pour toute P-partition δj -fine Πj de ]aj , aj+1 ], (j ∈ N). D’ailleurs, puisque f (b)(b − c) → 0 si c → b, c < b, il existe, par hypothèse, un η > 0 tel que #J # # # a c # # f − J + f (b)(b − c)## ≤ !/2, 2 pour tout c ∈ [b − η, b[. Définissons comme suit la jauge δ sur [a, b] : δ(a) = min[δ0 (a), a1 − a], δ(x) = min[δj (x), x − aj , aj+1 − x] si x ∈ ]aj , aj+1 [, (j ∈ N), δ(aj ) = min[δj−1 (aj ), δj (aj ), aj − aj−1 ], (j ∈ N∗ ), δ(b) = η. 398 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES Par un raisonnement strictement analogue à celuiA utilisé Bdans le lemme des P-partitions subordonnées, on voit que si Π = (xj , I j ) 1≤j≤m est une Ppartition δ-fine de ]a, b] telle que xj ≤ xj+1 , (1 ≤ j ≤ m − 1), alors, pour chaque k ∈ N, Πk = {(xj , I j ∩ ]ak , ak+1 ]) : I j ∩ ]ak , ak+1 ] /= ∅, 1 ≤ j ≤ m} est une P-partition δk -fine de ]ak , ak+1 ] et $ S(]ak , ak+1 ], f, Πk ) = {1≤j≤m:I j ∩ ]ak ,ak+1 ](=∅} µ(I j ∩ ]ak , ak+1 ])f (xj ). D’autre part, pour toute P-partition δ-fine Π de ]a, b] comme ci-dessus, on a nécessairement xm = b puisque, si xm < b il existera r ∈ N tel que xm ∈ [ar , ar+1 [, et donc, par construction de la jauge δ, tel que I m = ]d, b] ⊂ [ar−1 , ar+1 ] ⊂ [ar−1 , b[, ce qui est contradictoire. Désignons par q le plus petit entier naturel tel que m−1 > j=1 On a donc I j ⊂ ]a, aq+1 ]. # # #m # #$ # |S(I, f, Π) − J|2 = ## µ(I j )f (xj ) − J ## #j=1 # # #q−1 $ #$ = ## #k=0 {1≤j≤m:I j ∩ ]a + $ {1≤j≤m:I j ∩ − k ,ak+1 ](=∅} ]aq ,d](=∅} µ(I j ∩ ]ak , ak+1 ])f (xj ) µ(I j ∩ ]aq , d])f (xj ) + (b − d)f (b) q−1 $ J ak+1 k=0 ak 2 f− J d aq f+ J a d # # # f − J ## # 2 # # #q−1 2 J ak+1 3# #$ # ≤ ## S(]ak , ak+1 ], f, Πk ) − f ## ak #k=0 # 2 # # # J d # $ # # j j + ## µ(I ∩ ]aq , d])f (x ) − f ## aq # #{1≤j≤m:I j ∩ ]aq ,d](=∅} 2 11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 399 #J # # d # # # +# f − J + (b − d)f (b)# . # a # 2 Le premier et le dernier terme de cette expression ont déjà été estimés. Pour celui du milieu, il suffit de remarquer que la famille {(xj , I j ∩ ]aq , d]) : I j ∩ ]aq , d] /= ∅, 1 ≤ j ≤ m} vérifie les conditions du lemme de Saks-Henstock pour f et δq sur ]aq , aq+1 ]. En conséquence, on aura q−1 $ |S(I, f, Π) − J|2 ≤ k=0 ! 2k+2 + ! 2q+2 + ! < !, 2 et la démonstration est complète. On démontre d’une manière strictement analogue le théorème de Hake correspondant à l’autre extrémité de l’intervalle. Théorème. Soit f une fonction de R dans Rp définie sur [a, b]. Si f est intégrable sur [c, b] pour chaque c ∈ ]a, b[ et si lim J c→a+ c b f = J, alors f est intégrable sur [a, b] et J b f = J. a 11.2 Intégrale sur un intervalle borné Il est important de noter que les hypothèses du théorème de Hake ne font pas intervenir, dans le premier cas, la valeur de la fonction f en b et, dans le second cas, la valeur de f en a. Par conséquent, si f est une fonction de R dans Rp définie sur I = [a, b[ ou sur I = ]a, b], chaque prolongement de f à [a, b] sera intégrable sur [a, b] si un seul d’entre eux l’est, et tous auront la même intégrale. Cette remarque justifie la définition suivante d’intégrabilité sur un semi-intervalle borné [a, b[ ou ]a, b]. Définition. Soit f une fonction de R dans Rp définie sur [a, b[ (resp. ]a, b]). On dira que f est intégrable sur [a, b[ (resp. ]a, b]) s’il existe un prolongement 400 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES f˜ de f à [a, b] qui est intégrable sur [a, b], auquel cas l’intégrale de f sur [a, b[ H H H Hb ˜ (resp. ]a, b]) sera définie par [a,b] f et notée [a,b[ f (resp. ]a,b] f ) ou a f . H Il n’y a pas d’ambiguité dans la notation ab f puisque, lorsque f est définie et intégrable sur [a, b], les trois notions coı̈ncident. Exemples. 1. Soit b ∈ R et f la fonction définie par f (x) = (b − x)−p , où p > 0. La fonction f est primitivable sur ]−∞, b[ et l’une de ses primitives est donnée par la fonction F définie par F (x) = (p − 1)−1 (b − x)1−p si p /= 1 et F (x) = − ln(b − x) si p = 1. En conséquence, si a < b est donné, f est intégrable sur [a, c] quel que soit c ∈ ]a, b[ et J c a f = (p − 1)−1 [(b − c)1−p − (b − a)1−p ] si p /= 1 et J c a f = ln(b − a) − ln(b − c) si p = 1. Le théorème de Hake montre alors que f est intégrable sur [a, b[ si et seulement si p < 1, auquel cas J b a (b − x)−p dx = (1 − p)−1 (b − a)1−p. 2. Soit a ∈ R et f la fonction définie par f (x) = (x − a)−p , où p > 0. La fonction f est primitivable sur ]a, +∞[ et l’une de ses primitives est donnée par la fonction F définie par F (x) = (1 − p)−1 (x − a)1−p si p /= 1 et F (x) = ln(x − a) si p = 1. En conséquence, si b > a est donné, f est intégrable sur [c, b] quel que soit c ∈ ]a, b[ et J c si p /= 1 et b f = (1 − p)−1 [(b − a)1−p − (c − a)1−p ] J c b f = ln(b − a) − ln(c − a) 11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 401 si p = 1. Le théorème de Hake montre alors que f est intégrable sur ]a, b] si et seulement si p < 1, auquel cas J b a (x − a)−p dx = (1 − p)−1 (b − a)1−p . On peut également définir l’intégrabilité d’une fonction définie sur un intervalle ouvert borné ]a, b[. Définition. Soit f une fonction de R dans Rp définie sur un intervalle ouvert borné ]a, b[. On dit que f est intégrable sur ]a, b[ s’il existe un c ∈]a, b[ tel que f soit intégrable sur ]a, c] et intégrable sur [c, b[. S’il en est ainsi, l’intégrale H H de f sur ]a, b[ est notée ]a,b[ f ou ab f et définie par J b a f= J c a f+ J b c f. L’additivité de l’intégrale usuelle entraı̂ne aisément que si un c ∈ ]a, b[ existe pour lequel la condition de la définition est vérifiée, alors elle le sera pour tout autre c$ ∈ ]a, b[, avec la même valeur de l’intégrale. On peut aussi vérifier aisément que f est intégrable sur ]a, b[ si et seulement si f est intégrable sur [c, d] quels que soient c < d contenus dans ]a, b[ et J lim (c,d)→(a,b),c>a,d<b c d f existe. Les propriétés élémentaires de l’intégrale (linéarité, propriétés d’ordre, passage aux composantes, comportement par rapport à une translation ou une homothétie) et les propriétés d’additivité et de restriction s’étendent immédiatement, à partir des définitions et des propriétés correspondantes de l’intégrale ordinaire, aux intégrales sur un semi-intervalle ou sur un intervalle ouvert bornés. Le théorème fondamental du calcul différentiel et intégral peut être étendu à l’intégration sur un intervalle borné quelconque. Proposition. Soit f une fonction de R dans Rp primitivable sur ]a, b[ et F une primitive de f sur ]a, b[. Si lim F (c) et lim F (c) c→a+ c→b− existent, alors f est intégrable sur ]a, b[ et J b a f = lim F (c) − lim F (c). c→b− c→a+ 402 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES Démonstration. La fonction f , primitivable sur ]a, b[, l’est sur [c, c$] quels que soient c < c$ dans ]a, b[ et dès lors, par le théorème fondamental du calcul différentiel et intégral et l’additivité de l’intégrale, si d ∈ ]a, b[ est fixé et si c < d < c$ , f est intégrable sur [c, d] et sur [d, c$] et l’on a J d c f = F (d) − F (c), J c" d f = F (c$ ) − F (d). Comme, par hypothèse, lim J d c→a+ c et lim " J c" c →b− d f = lim [F (d) − F (c)] = F (d) − lim F (c), c→a+ c→a+ f = "lim [F (c$ ) − F (d)] = "lim F (c$ ) − F (d), c →b− c →b− le théorème de Hake entraı̂ne l’intégrabilité de f sur ]a, d] et sur [d, b[, avec J a d f = F (d) − lim F (c), c→a+ J d b f = "lim F (c$ ) − F (d), c →b− et la thèse résulte de la définition de l’intégrabilité de f sur ]a, b[ et de celle de son intégrale sur cette intervalle. Exemple. Les considérations que nous venons de développer permettent de donner un exemple de fonction intégrable sur un intervalle sans y être L-intégrable. Soit f la fonction de R dans R définie par f (x) = 2x sin 1 2 1 − cos 2 si x /= 0, f (0) = 0. x2 x x On a vu précédemment que f était la dérivée de la fonction F définie par F (x) = x2 sin 1 si x /= 0, F (0) = 0. x2 En particulier, f est intégrable sur [0, b] quel que soit b > 0 et J 0 b f = b2 sin 1 . b2 Si nous définissons les fonctions g et h sur R par g(x) = 2 1 cos 2 si x /= 0, g(0) = 0, x x 403 11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ h(x) = 2x sin 1 si x /= 0, h(0) = 0, x2 nous constatons immédiatement que h, continue sur R, sera intégrable sur [0, b] quel que soit b > 0, et il en sera dès lors de même de g = h − f. En particulier, g est intégrable sur [0, 1]. Nous allons montrer que |g| n’est pas intégrable sur [0, 1], ce qui entraı̂nera que g ∈ P ([0, 1], R) \ L([0, 1], R). Notons tout d’abord que |g|, continue sur [c, 1] quel que soit c ∈ ]0, 1[, est primitivable sur [c, 1]. Le théorème d’intégration par substitution s’applique donc à |g| sur chaque intervalle [((k + 1)π)−1/2, (kπ)−1/2], (k ∈ N∗ ), et fournit, en effectuant la substitution x2 2→ y1 , J # (kπ)−1/2 ((k+1)π)−1/2 D’autre part, J # 2 ## 1# cos 2 ## dx = x# x | cos y| 1 dy ≥ y (k + 1)π (k+1)π kπ = 2 π J J J kπ (k+1)π kπ J dy 2 ≥ k+1 π k+2 k+1 (k+1)π | cos y| dy. y | cos y| dy = k+2 k+1 2 (k + 1)π dy . y Dès lors, pour tout entier n ≥ 0, on a J 1 ((n+1)π)−1/2 ≥ J 1 π−1/2 |g| + |g| = J 1 π−1/2 |g| + n J $ (kπ)−1/2 −1/2 k=1 ((k+1)π) |g| J 1 J n J k+2 dy 2$ 2 n+2 dy |g| + = π k=1 k+1 y π 2 y π−1/2 = J 1 π−1/2 |g| + H 4 5 n+2 2 . ln π 2 Il en résulte aussitôt que limc→0+ c1 |g| n’existe pas et |g| n’est pas intégrable sur [0, 1]. On peut aussi étendre à l’intégrabilité sur un intervalle borné quelconque la formule d’intégration par parties. Nous traiterons le cas de l’intégration sur ]a, b[, l’adaptation à ]a, b] ou à [a, b[ étant aisée. 404 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES Proposition. Soient f et g deux fonctions de R dans K dérivables sur ]a, b[. Si f $ g est intégrable sur ]a, b[ et si limx→a+ f (x)g(x) et limx→b− f (x)g(x) existent, alors f g $ est intégrable sur ]a, b[ et l’on a J b a J f g $ = lim f (c)g(c) − lim f (c)g(c) − c→a+ c→b− b a f $ g. Démonstration. Soit d ∈ ]a, b[ fixé et soient c et c$ tels que a < c < d < c < b. Par hypothèse, f $ g est intégrable sur [c, d] et sur [d, c$] et la formule d’intégration par parties entraı̂ne l’intégrabilité de f g $ sur ces intervalles et les formules J J $ d c J c" d f g $ = f (d)g(d) − f (c)g(c) − f g $ = f (c$ )g(c$) − f (d)g(d) − Par hypothèse, on a alors lim J d c→a+ c lim " J c" c →b− d d c J f $ g, c" d f $ g. f g $ = f (d)g(d) − lim f (c)g(c) − c→a+ J f g $ = "lim f (c$ )g(c$) − f (d)g(d) − c →b− d a J d f $ g, b f $ g. L’intégrabilité de f g $ sur ]a, b[ et la formule correspondante d’intégration par parties résulte alors d’une double application du théorème de Hake et de la définition d’intégrabilité sur ]a, b[. Exemple. La fonction h définie sur R∗+ par h(x) = ln x est intégrable sur ]0, b] quel que soit b > 0. En effet, ln x = (x)$ ln x et dès lors si l’on pose f (x) = ln x et g(x) = x, on a h = f g $ et (f $ g)(x) = 1, (f g)(x) = x ln x pour tout x. Donc f $ g est intégrable sur [0, b] et, par le théorème de l’Hospital, lim (f g)(x) = 0, x→0+ tandis que f g est continue en b. Par conséquent, ln est intégrable sur [0, b] et J b ln x dx = b ln b − b. 0 On peut évidemment définir une notion de L-intégrabilité sur des intervalles bornés quelconques. 11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 405 Définition. Soit I = [a, b[, ]a, b], ou ]a, b[ et f une fonction de R dans Rp définie sur I. On dira que f est intégrable au sens de Lebesgue ou Lintégrable ou absolument intégrable sur I si f et |f |2 sont intégrables sur I. Les propriétés élémentaires de la L-intégrale, ainsi que les propriétés d’additivité et de restriction s’étendent immédiatement à ce nouveau type d’intégrale. Bien que le théorème de Hake ne soit pas vrai, comme on l’a déjà remarqué plus haut, pour la L-intégrabilité, c’est-à-dire si l’on remplace partout “intégrable” par “L-intégrable”, il en existe une version plus restrictive qui fait intervenir l’intégrale indéfinie de |f |2 . Donnons ce théorème de Hake pour la L-intégrabilité, pour fixer les idées, dans le cas d’un intervalle de type [a, b[, les autres cas étant analogues. Proposition. Soit f une fonction de R dans Rp définie sur [a, b[. Alors f est L-intégrable sur [a, b[ si et seulement si f est L-intégrable sur [a, c] quel que soit c ∈ ]a, b[ et si lim J c→b− a c |f |2 existe. Démonstration. Condition nécessaire. Si f est L-intégrable sur [a, b[, alors, par définition, il existe un prolongement f˜ de f à [a, b] tel que f˜ ˜ 2 soient intégrables sur [a, b]. En conséquence, par la continuité de et |f| H H l’intégrale indéfinie, limc→b− ac |f |2 = limc→b− ac |f˜|2 existe. Condition suffisante. Par le théorème de Hake, il suffit de montrer que Hc limc→b− a f existe, ce qui sera le cas si la condition de Cauchy correspondant à cette limite est vérifiée. Or, si a < c < c$ < b, on a #J " # J c" # c # # # f# ≤ |f |2 , # # c # c 2 et la thèse résulte de ce que l’intégrale indéfinie de |f |2 vérifie la condition de Cauchy pour la limite en b. On a un test de comparaison pour la L-intégrabilité sur [a, b[. Proposition. Soit g une fonction de R dans R+ intégrable sur [a, b[ et f une fonction de R dans Rp définie sur [a, b[ et intégrable sur [a, c] quel que soit c ∈ ]a, b[. Si |f (x)|2 ≤ g(x) 406 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES pour tout x ∈ [a, b[, alors f est L-intégrable sur [a, b[. Démonstration. La dernière hypothèse et le test de comparaison classique entraı̂nent la L-intégrabilité de f sur [a, c] quel que soit c ∈ ]a, b[. En outre, quels que soient c < c$ dans ]a, b[, on a J c c" |f |2 ≤ J c c" g. H Comme g est intégrable sur [a, b[, limc→b− ac g existe et la condition de Cauchy correspondante est donc satisfaite. En conséquence, elle l’est aussi pour l’intégrale indéfinie de |f |2 et la thèse résulte de la proposition précédente. On démontre d’une manière strictement analogue le résultat pour ]a, b] et le cas de ]a, b[ s’en déduit alors aisément. Proposition. Soit g une fonction de R dans R+ intégrable sur ]a, b] et f une fonction de R dans Rp définie sur ]a, b], intégrable sur [c, b] quel que soit c ∈ ]a, b[. Si |f (x)|2 ≤ g(x) pour tout x ∈ ]a, b], alors f est L-intégrable sur ]a, b]. Proposition. Soit g une fonction de R dans R+ intégrable sur ]a, b[ et f une fonction de R dans Rp définie sur ]a, b[, intégrable sur [a, c] quel que soit c ∈ ]a, b[. Si |f (x)|2 ≤ g(x) pour tout x ∈ ]a, b[, alors f est L-intégrable sur ]a, b[. Une première conséquence du test de comparaison est le résultat suivant. Corollaire. Soit I = [a, b[ (resp. ]a, b]) et f une fonction de R dans Rp définie sur I et intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ ]a, b[. Si, pour i = 1, 2 ou ∞, |f |i est intégrable sur I, alors f est L-intégrable sur I. Démonstration. Il suffit de prendre g = |f |i dans le test de comparaison. Une deuxième conséquence du test de comparaison est le test de la limite pour l’intégrabilité de fonctions positives. 11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ 407 Corollaire. Soit I = [a, b[ (resp. ]a, b]) et f et g deux fonctions de R dans R+ définies sur I et intégrables sur [a, c] (resp. [c, b]) quel que soit c ∈ ]a, b[. Supposons que, pour tout x ∈ I, on ait g(x) > 0 et que f (x) (resp. x→b− g(x) lim f (x) ) x→a+ g(x) lim existe au sens large et soit notée d. 1. Si d = 0 et si g est intégrable sur I, alors f est intégrable sur I. 2. Si d > 0 est fini, alors f est intégrable sur I si et seulement si g est intégrable sur I. 3. Si d = +∞ et si f est intégrable sur I, alors g est intégrable sur I. Démonstration. Considérons, pour fixer les idées, le cas où I = [a, b[, l’autre se traitant de même. Dans le cas de l’hypothèse 1, il existe c ∈ ]a, b[ (x) tel que, pour tout x ∈ [c, b[, on ait fg(x) ≤ 1 et dès lors 0 ≤ f (x) ≤ g(x). Par hypothèse et par le test de comparaison, f est alors intégrable sur [c, b[, et donc sur [a, b[ puisqu’elle l’est déjà sur [a, c]. Dans le cas de l’hypothèse 2, en prenant ! = d/2 dans la définition de la limite, il existe c ∈ ]a, b[ tel que, pour tout x ∈ [c, b[, on ait − et dès lors 0≤ d f (x) d ≤ −d≤ , 2 g(x) 2 4 5 d g(x) ≤ f (x) ≤ 2 4 5 3d g(x). 2 Comme les fonctions ( d2 )g, ( 3d 2 )g et g sont simultanément intégrables sur I, la thèse en résulte en appliquant deux fois le test de comparaison. Enfin, dans le cas de l’hypothèse 3, il existe c ∈ ]a, b[ tel que, pour tout x ∈ [c, b[, on ait f (x) > 0. En outre, l’hypothèse équivaut à g(x) = 0, x→b− f (x) lim et il suffit d’appliquer la première partie du résultat en permutant le rôle de f et g. Exemple. Si a > 0 et b > 0, la fonction f donnée par f (x) = xa−1 (1 − x)b−1 408 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES est définie sur ]0, 1[ et telle que f (x) f (x) = 1, lim = 1. a−1 x→0+ x x→1− (1 − x)b−1 lim On a vu précédemment que la fonction x 2→ xa−1 est intégrable sur ]0, 1] et que la fonction x 2→ (1 − x)b−1 est intégrable sur [0, 1[. Le test de la limite entraı̂ne alors l’intégrabilité de f sur ]0, d] et sur [d, 1[ quel que soit d ∈ ]0, 1[, et donc l’intégrabilité de f sur ]0, 1[. L’intégrale correspondante J 0 1 xa−1 (1 − x)b−1 dx s’appelle l’intégrale d’Euler de première espèce et se note B(a, b) (lire “bêta majuscule” de (a, b)). On notera que, quels que soient c < d dans ]0, 1[, le changement de variable x = 1 − y sur [c, d] entraı̂ne l’égalité J c d xa−1 (1 − x)b−1 dx = J 1−c 1−d (1 − y)a−1y b−1 dy, et dès lors, si c → 0+ et d → 1−, on obtient l’égalité B(a, b) = B(b, a) quels que soient a > 0 et b > 0. On peut combiner le test de comparaison que nous venons d’obtenir avec la formule d’intégration par parties pour obtenir d’utiles tests d’intégrabilité pour des produits de fonctions. Ils se fondent sur le lemme suivant. Lemme. Soit I = [a, b[ (resp. ]a, b]), f et g des fonctions de R dans K définies sur I et vérifiant les conditions suivantes. 1. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[. H 2. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f ) est bornée sur I. 3. g est dérivable sur I. 4. g $ est L-intégrable sur I. Alors f g est intégrable sur I si et seulement si 5. limc→b− F (c)g(c) (resp. limc→a+ F (c)g(c)) existe. Démonstration. Considérons, pour fixer les idées, le cas où I = [a, b[. Par la formule d’intégration par parties sur [a, c], avec c ∈ ]a, b[, on a J c a f g = F (c)g(c) − F (a)g(a) − J c a F g$. 409 11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ L’hypothèse 2 entraı̂ne l’existence d’un M ≥ 0 tel que |F (x)| ≤ M pour tout x ∈ I, et dès lors, pour les mêmes x, |F (x)g $(x)| ≤ M |g $ (x)|. Comme M |g $ | est intégrable sur I par l’hypothèse 4, le test de comparaison entraı̂ne la L-intégrabilité de F g $ sur I, et dès lors l’existence de la limite du dernier terme du membre de droite lorsque c tend vers b dans ]a, b[. L’hypothèse 1, la continuité de l’intégrale indéfinie et le théorème de Hake permettent alors de conclure. On déduit de ce lemme quatre tests pratiques d’intégrabilité. Les deux premiers requièrent l’intégrabilité de f sur I. Le premier s’appelle le test d’intégrabilité de Du Bois-Reymond. Corollaire. Soit I = [a, b[ (resp. ]a, b]), f et g des fonctions de R dans K définies sur I et vérifiant les conditions suivantes. a. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[. H b. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f ) est telle que lim F (c) (resp. lim F (c)) c→a+ c→b− existe. c. g est dérivable sur I. d. g $ est L-intégrable sur I. Alors f g est intégrable sur I. Démonstration. Par l’hypothèse b, |F | est majorée sur [c, b[ (resp. ]a, c]) pour un certain c ∈ ]a, b[. Comme F est continue sur [a, c] (resp. [c, b]), |F | y est également majorée. Enfin, par le théorème fondamental du calcul différentiel et intégral et la continuité de l’intégrale indéfinie, on a 2 lim g(c) = lim g(a) + c→b− c→b− J c a 2 (resp. lim g(c) = lim g(b) + c→a+ c→a+ 3 g $ = g(a) + J b c 3 J b a g $ = g(b) − g $, J b a g $ ), ce qui assure l’existence de la limite correspondante pour F g. Le deuxième test s’appelle le test d’intégrabilité d’Abel. Corollaire. Soit I = [a, b[ ou ]a, b], f une fonction de R dans K et g une fonction de R dans R vérifiant les hypothèses (a), (b), (c) du test de du Bois-Reymond. Si en outre 410 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES d$ . g est monotone et bornée sur I, alors f g est intégrable sur I. Démonstration. Comme g est monotone sur I, g $ y est de signe constant et la L-intégrabilité de g $ sur I équivaut à son intégrabilité. Celle-ci résulte de la forme généralisée du théorème fondamental du calcul différentiel et intégral puisque g, bornée et monotone sur I, possède une limite pour x tendant vers b ou a selon que I = [a, b[ ou ]a, b]. Il suffit alors d’appliquer le test de Du Bois-Reymond. Exemple. Comme la fonction f définie par f (x) = x2 cos x12 est intégrable sur ]0, 1] et la fonction g définie parE g(x) = ln(x + 1) est croissante et bornée D sur ]0, 1], la fonction x 2→ 2 ln(x+1) cos x12 est également intégrable sur ]0, 1]. x Les deux derniers tests ne requièrent plus l’intégrabilité de f sur I. Le premier s’appelle le test d’intégrabilité de Dedekind. Corollaire. Soit I = [a, b[ (resp. ]a, b]), f , g des fonctions de R dans K définies sur I et telles que les conditions suivantes soient vérifiées. A. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[. H B. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f ) est bornée sur I. C. g est dérivable sur I. D. g $ est L-intégrable sur I. E. limx→b− g(x) = 0 (resp. limx→a+ g(x) = 0). Alors f g est intégrable sur I. Démonstration. Elle résulte directement du lemme si l’on note que, par les hypothèses B et E, on a lim F (x)g(x) = 0 (resp. x→b− lim F (x)g(x) = 0). x→a+ Le deuxième test s’appelle le test d’intégrabilité de Dirichlet. Corollaire. Soit I = [a, b[ ou ]a, b], f une fonction de R dans K et g une fonction de R dans R vérifiant les hypothèses A, B, C, E du test de Dedekind. Si en outre D $ . g est monotone sur I, alors f g est intégrable sur I. Démonstration. On montre, comme dans le test d’Abel, que les hypothèses D $ et E entraı̂nent l’hypothèse D. 11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ 411 Exemple. Pour tout α ∈ [0, 2[, la fonction h : x 2→ x−α cos x1 est intégrable sur ]0, 1]. En effet, elle peut s’écrire h = f g avec f (x) = x−2 cos 4 1 1 = − sin x x 5$ , g(x) = x2−α, qui vérifient les conditions du test de Dirichlet. 11.3 Intégrale sur un intervalle non borné Soient a et b des nombres réels, I = [a, +∞[ (resp. ]a, +∞[, ] − ∞, b], ] − ∞, b[) un intervalle non borné. Soit f une fonction de R dans Rp définie sur I. La condition nécessaire et suffisante d’intégrabilité sur un intervalle borné donnée par le théorème de Hake et sa réciproque suggère la définition suivante d’intégrabilité de f sur I. Définition. On dit que f est intégrable sur I si f est intégrable sur I ∩ [a, b] quel que soit b > a et si lim J lim J b f b→+∞ a ou b a→−∞ a f existe selon que I est non majoré ou non minoré, auquel cas cette limite est H appelée l’intégrale de f sur I et notée I f ou, plus explicitement, pour les quatre choix de I, J f ou +∞ f, a [a,+∞[ J J f ou ]−∞,b] J J f ou −∞ f, J +∞ f, a ]a,+∞[ b J f ou ]−∞,b[ J b −∞ f, ou encore par les variantes faisant intervenir f (x) dx. On peut également définir la notion d’intégrale sur R =] − ∞, +∞[. Définition. Soit f une application de R dans Rp. On dit que f est intégrable sur R s’il existe c ∈ R tel que f soit Hintégrable sur ] − ∞, c] et sur Hc p [c, +∞[, auquel cas l’élément de R −∞ f + c+∞ f est appelé l’intégrale de f sur R et noté J R f ou J +∞ −∞ f ou J R f (x) dx ou J +∞ −∞ f (x) dx. 412 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES On vérifiera sans peine que si la condition de la définition ci-dessus est satisfaite pour un élément c de R, elle le sera pour n’importe quel d ∈ R avec la même valeur de l’intégrale. Il est également facile de montrer que f est intégrable sur R si et seulement si f est intégrable sur [a, b] quels que soient a < b dans R et si J b lim (a,b)→(−∞,+∞) a f existe, auquel cas cette limite est l’intégrale de f sur R. On peut également vérifier sans peine que si f est une fonction de R dans Rp définie sur [a, b] et si l’on définit l’application f[a,b] de R dans Rp par f[a,b](x) = f (x) si x ∈ [a, b] et f[a,b] (x) = 0 si x ∈ R \ [a, b], alors f est intégrable sur [a, b] si et seulement si f[a,b] est intégrable sur R. Définition. Soit I l’un des intervalles non bornés considérés dans les définitions précédentes et soit f une fonction de R dans Rp définie sur I. On dit que f est intégrable au sens de Lebesgue ou L-intégrable ou absolument intégrable sur I si f et |f |2 sont intégrables sur I. Exemples. 1. Si a > 0, la fonction f : x 2→ x−c est L-intégrable sur I = [a, +∞[ si et seulement si c > 1. En effet, f étant positive sur l’intervalle considéré, elle y est L-intégrable si et seulement si elle y est intégrable. En outre, f est primitivable sur I, une primitive étant donnée par F (x) = (1 − c)−1 x1−c si c /= 1 et par F (x) = ln x si c = 1. Dès lors, si b > a, on a J a b b f = (1 − c)−1 (b1−c − a1−c ) ou ln , a H selon que c /= 1 ou c = 1, et par conséquent limb→+∞ ab f existe si et seulement si 1 − c < 0. On énoncera et démontrera aisément le résultat correspondant pour le cas de ] − ∞, a] lorsque a < 0. 2. Aucune fonction constante non nulle n’est intégrable sur ] − ∞, a] ou [a, +∞[. De même, la fonction cos n’est pas intégrable sur ces intervalles H puisque, par exemple, la fonction b 2→ ab cos x dx = sin b − sin a n’a pas de limite lorsque b → +∞. 3. La fonction f : x 2→ exp(−|x|) est L-intégrable sur R. En effet, f positive et continue, et donc primitivable sur R, est L-intégrable sur [a, 0] et sur [0, b] quels que soient a < 0 < b et l’on a J 0 a f= J a 0 exp x dx = 1 − exp a, J 0 b f= J 0 b exp(−x) dx = 1 − exp(−b), 11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ 413 ce qui entraı̂ne la L-intégrabilité de f sur ] − ∞, 0] et sur [0, +∞] avec J 0 −∞ exp(−|x|) dx = 1, J +∞ exp(−|x|) dx = 1, 0 et dès lors J R exp(−|x|) dx = 2. Les propriétés élémentaires de l’intégrale et de la L-intégrale, ainsi que les propriétés d’additivité et de restriction de ces intégrales s’étendent immédiatement au cas d’un intervalle non borné. Il en est de même, avec des démonstrations strictement analogues, pour l’extension du théorème du calcul différentiel et intégral, de la formule d’intégration par parties, du test de comparaison de L-intégrabilité, du test de la limite et des tests de Du Bois-Reymond, Abel, Dedekind et Dirichlet pour l’intégrabilité d’un produit. Exemples. 1. Si c > 0, la fonction f définie sur ]0, +∞[ par f (x) = xc−1 exp(−x) est continue (donc primitivable) et telle que lim x→0+ f (x) = 1, xc−1 lim x→+∞ f (x) = 0, exp(−x/2) puisque lim x→+∞ 2 3 f (x) x = lim exp − + (c − 1) ln x = exp(−x/2) x→+∞ 2 4 lim exp − x→+∞ 5 2 3 x ln x . 1 − 2(c − 1) = 0. 2 x Dès lors, par le test de la limite et l’intégrabilité de la fonction x 2→ xc−1 sur ]0, 1] et de la fonction x 2→ exp(− x2 ) sur [1, +∞[, on voit que l’intégrale J 0 +∞ xc−1 exp(−x) dx existe pour chaque c > 0. Elle s’appelle l’intégrale d’Euler de deuxième espèce et sa valeur est notée Γ(c). En intégrant par parties, on trouve aisément, pour c > 1, Γ(c) = (c − 1)Γ(c − 1), et, comme Γ(1) = 1, on en déduit aussitôt que, pour chaque n ∈ N∗ , on a Γ(n) = (n − 1)!. 414 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES 2. On appelle intégrales trigonométriques les intégrales de la forme J +∞ g(x) cos λx dx ou 0 J +∞ g(x) sin λx dx, 0 où λ > 0 et g est une fonction définie au moins sur ]0, +∞[. Si f désigne l’une des fonctions cos(λ·) ou sin(λ·), alors f est continue sur R et #J # # # 0 x # # cos λt dt## = # # J # x # | sin λx| |1 − cos λx| sin λt dt## = ≤ λ−1 , ## ≤ 2λ−1 . λ λ 0 Dès lors, en appliquant le test de Dirichlet, l’existence des intégrales trigonométriques sera assurée si l’on suppose que g est dérivable et décroissante sur [0, +∞[, et telle que limx→+∞ g(x) = 0. Ce sera en particulier le cas pour les intégrales J +∞ J +∞ cos λx sin λx dx et dx, p x xp 0 0 lorsque 0 < p < 1, et pour l’intégrale J 0 +∞ sin λx dx. x En effet, le test de Dirichlet s’applique à l’intégrale de ces fonctions sur [c, +∞[ lorsque c > 0 et, sur ]0, c], # # # cos λx # −p # # # xp # ≤ x , et, comme on l’a vu au paragraphe précédent, le second membre est intégrable sur ]0, c], tandis que la fonction x 2→ sinxpλx , qui peut être prolongée continûment en 0 en lui donnant la valeur 0 si p < 1 et λ si p = 1, est alors R-intégrable sur [0, c]. Lorsque p = 1/2, ces intégrales portent le nom d’intégrales de Fresnel et elles jouent un rôle important en optique. Notons √ que la substitution y = x transforme, pour chaque a < b strictement positifs, J b J b sin λx cos λx √ dx et √ dx x x a a respectivement en 2 J b2 a2 sin λy 2 dy et 2 J b2 a2 cos λy 2 dy, 11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ 415 et dès lors, en faisant tendre a vers 0 et b vers +∞ et en utilisant les définitions, on trouve J +∞ 0 et J 0 +∞ sin λx √ dx = 2 x J cos λx √ dx = 2 x J +∞ sin λy 2 dy 0 +∞ cos λy 2 dy. 0 On notera finalement qu’un raisonnement analogue à celui utilisé dans l’exemple de fonction intégrable et non L-intégrable sur un intervalle borné montre que chaque intégrand des intégrales trigonométriques ci-dessus est intégrable sur ]0, +∞[ sans y être L-intégrable. Remarque. Le lecteur peut s’être posé la question de savoir si l’intégrabilité d’une fonction f sur un intervalle non borné pouvait être définie en termes de sommes de Riemann. La réponse est positive et, pour [a, +∞[ par exemple, la définition est la suivante. Définition. Soit f une fonction de R dans Rp dit que f est intégrable sur I s’il existe J ∈ Rp pour chaque ! > 0, il existe une jauge δ sur I pour chaque b ≥ B et chaque P-partition δ-fine définie sur I = [a, +∞[. On ayant la propriété suivante: et il existe B > a tels que, Π de ]a, b], on ait |S(]a, b], f, Π) − J|2 ≤ !. On peut alors démontrer, à partir de cette définition, l’analogue du théorème de Hake sur [a, +∞[ et montrer ainsi que cette définition est équivalente à celle que nous avons adoptée ici pour court-circuiter cette démonstration. Le cas de I = ] − ∞, b] est évidemment analogue et celui des intervalles ouverts se traite par la technique de prolongement. Enfin, la définition d’intégrabilité sur R en termes de sommes de Riemann est la suivante. Définition. Soit f une fonction de R dans Rp définie sur R. On dit que f est intégrable sur R s’il existe J ∈ Rp ayant la propriété suivante : pour chaque ! > 0, il existe une jauge δ sur I et il existe ρ > 0 tels que, pour chaque a ≤ −ρ, chaque b ≥ ρ et chaque P-partition δ-fine Π de ]a, b], on ait |S(]a, b], f, Π) − J|2 ≤ !. 416 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES 11.4 Tests de convergence des séries Montrons tout d’abord que l’étude de la convergence d’une série dans Rp équivaut à l’étude de l’intégrabilité sur [0, +∞[ d’une certaine fonction de R dans Rp construite à partir des termes de la série. % Soit k∈N ak une série dans Rp . Associons à la suite (ak )k∈N de ses termes l’application a[·] : R+ → Rp , x 2→ a[x], où [x] désigne le plus grand entier inférieur ou égal à x. C’est donc l’application définie pour chaque x ∈ R+ par a[x] = ak si x ∈ [k, k + 1[, (k ∈ N). Proposition. Pour chaque b ≥ 1, la fonction a[·] est intégrable sur [0, b] et l’on a J 0 b [b]−1 a[x] dx = $ k=0 ak + (b − [b])a[b]. Démonstration. En vertu de l’additivité de l’intégrale, il suffit de montrer que a[.] est intégrable sur [0, 1], [1, 2], . . ., [[b]−1, [b]] et sur [[b], b] (si ce dernier intervalle n’est pas réduit à un point) et que J k+1 k a[x] dx = ak , (0 ≤ k ≤ [b] − 1), J b [b] a[x] dx = (b − [b])a[b]. C’est évident pour la dernière intégrale puisque a[·] a sur [[b], b] la valeur constante a[b] . Pour l’intervalle [k, k + 1], la fonction a[·] a, sur [k, k + 1[ la valeur constante ak et dès lors J c k a[x] dx = (c − k)ak , pour tout c ∈ ]k, k + 1[, ce qui entraı̂ne que lim J c c→(k+1)− k a[x] dx = ak . L’intégrabilité de a[·] sur [k, k + 1] et la valeur de l’intégrale correspondante résultent alors du théorème de Hake. Remarque. On notera que a[·] , bornée sur chaque sous-intervalle borné de [0, +∞[, y est en fait L-intégrable. Nous pouvons maintenant démontrer les deux résultats fondamentaux ramenant la convergence d’une série à l’intégrabilité de la fonction associée. 11.4. TESTS DE CONVERGENCE DES SÉRIES 417 % Proposition. La série k∈N ak converge si et seulement si la fonction associée a[·] est intégrable sur [0, +∞[, auquel cas l’on a ∞ $ ak = k=0 J ∞ 0 a[x] dx. Démonstration. Condition nécessaire. Soit A la somme de la série con% vergente k∈N ak . Par la proposition précédente, il suffit de montrer que H % limb→+∞ 0b a[x] dx = A. Si Aq = qk=0 ak , (q ∈ N), on a, pour chaque b ≥ 1, #J # # b # # # a[x] dx − A# = |A[b]−1 − A + (b − [b])a[b]|2 ≤ |A[b]−1 − A|2 + |a[b]|2 , # # 0 # 2 puisque 0 ≤ b − [b] < 1. Si ! > 0 est donné, il existe m ∈ N tel que |A − Ak |2 ≤ !/2, |ak |2 ≤ !/2, pour chaque k ≥ m, et dès lors, si b ≥ m + 1, on aura [b] − 1 ≥ m et #J # # b # # # a[x] − A# ≤ !/2 + !/2 = !. # # 0 # 2 Condition suffisante. Puisque limb→+∞ J lim b→+∞,b∈N 0 b Hb 0 a[x] dx existe, a[x] dx existe aussi, avec la même valeur, et comme, pour tout q ∈ N, on a Aq = J q+1 0 on voit que lim Aq = lim q→∞ et la démonstration est complète. a[x] dx, J b→+∞ 0 b a[x] dx, % Proposition. La série k∈N ak converge absolument si et seulement si la fonction associée a[·] est L-intégrable sur [0, +∞[. Démonstration. On vérifie immédiatement que |a[·]|2 est la fonction as% sociée à la série k∈N |ak |2 . La thèse résulte alors de la proposition précédente appliquée à a[·] et à |a[·] |2 . 418 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES Il est maintenant facile de traduire dans le langage des séries, via les propositions précédentes et la fonction associée, un certain nombre de résultats d’intégrabilité obtenus dans la section précédente. Le premier fournit un test de comparaison pour la convergence absolue d’une série. % % Proposition. Si la série k∈N ak dans Rp et la série k∈N bk dans R+ sont telles que, pour un certain entier q ≥ 0 et chaque entier k ≥ q, on ait et si la série % |ak |2 ≤ bk , k∈N bk converge, alors la série % k∈N ak converge absolument. Le deuxième est le test de la limite pour la convergence des séries à termes positifs. % % Corollaire. Soit k∈N ak et k∈N bk deux séries réelles pour lesquelles il existe un entier q ≥ 1 tel que ak ≥ 0 et bk > 0 si k ≥ q. Supposons en outre que limk→+∞ abkk existe au sens large, et notons la d. % % 1. Si d = 0 et si k∈N bk converge, alors k∈N ak converge. % % 2. Si d > 0 est fini, k∈N ak et k∈N bk convergent et divergent simultanément. % % 3. Si d = +∞ et si k∈N ak converge, alors k∈N bk converge. Le test de comparaison permet de démontrer le test intégral de Maclaurin-Cauchy pour la convergence de séries positives dont les termes sont donnés par la restriction à N d’une fonction positive et décroissante sur [0, +∞[. Proposition. Soit f une fonction réelle définie, positive et décroissante sur % [0, +∞[. Alors la série k∈N f (k) converge si et seulement si f est intégrable sur [0, +∞[. Démonstration. Notons tout d’abord que f , décroissante sur [0, +∞[, est R-intégrable sur [0, b] quel que soit b > 0, et dès lors l’intégrabilité de f H sur [0, +∞[ équivaut à l’existence de la limite limb→+∞ 0b f. Par ailleurs, les % % séries k∈N f (k) et k∈N f (k + 1) convergent et divergent simultanément. % Soit fˆ : x 2→ f ([x]) la fonction associée à la série k∈N f (k) et fˇ : x 2→ % f ([x] + 1) la fonction associée à la série k∈N f (k + 1). Par la décroissance de f , on a évidemment 0 ≤ fˇ(x) = f ([x] + 1) ≤ f (x) ≤ f ([x]) = fˆ(x), pour tout x ∈ [0, +∞[, et le test de comparaison montre alors que f, fˆ et % fˇ sont simultanément intégrables sur [0, +∞[. En conséquence, k∈N f (k) converge si et seulement si f est intégrable sur [0, +∞[. 419 11.4. TESTS DE CONVERGENCE DES SÉRIES Remarques. 1. L’inégalité entre f, fˆ et fˇ montre que ∞ $ k=1 f (k) ≤ J +∞ f≤ 0 ∞ $ f (k), k=0 dès que l’un des trois termes existe. % 2. La convergence de k∈N∗ f (k) équivaut évidemment à l’intégrabilité de f sur [1, +∞[. % Exemples. 1. La série de Riemann k∈N∗ k−c , où c ≥ 0, converge si c > 1 et diverge si c ∈ [0, 1]. En effet, les termes de cette série sont les valeurs de la restriction à N∗ de la fonction f définie sur [1, +∞[ par f (x) = x−c , qui est positive et décroissante sur cet intervalle. On a vu au paragraphe précédent que cette fonction était intégrable sur [1, +∞[ si et seulement si c > 1. On en déduit en particulier une nouvelle preuve de la divergence de % la série harmonique k∈N∗ k1 . Cette série “diverge très lentement”, puisque l’inégalité, déduite des considérations qui précèdent, q $ 1 k=1 J ≥ k q 1 dx = ln q, x montre qu’il faudra plus de exp 10 = 22.026 termes pour que les sommes partielles dépassent 10 ! La différence q $ 1 k=1 k − ln q entre la q e somme partielle de la série harmonique et ln q = puisque q q $ $ k ln q = [ln k − ln(k − 1)] = ln , k−1 k=2 k=2 à 1+ q 4 $ 1 k=2 k − ln Hq dx 1 x est égale, 5 k . k−1 D’autre part, en utilisant l’expression de Lagrange du reste du développement de Taylor, il existera, pour chaque entier k ≥ 2, un θk ∈ ]0, 1[ tel que − ln 4 k 1 = ln 1 − k−1 k 5 = ln 1 − 1 − k 4 54 1 2 5 1 1 8 9 . 2 k θk 2 1− k 420 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES Par conséquent, q $ q $ 4 54 1 1 − ln q = 1 + k 2 k=1 k=2 Comme lim 2 k→∞ ( 12 )( k12 ) 1 1 8 9 . 2 k θk 2 1− k 1 k 4 5 1 θ (1− kk )2 5 = 2, % le test de la limite et la convergence de la série de Riemann k∈N∗ k12 entraı̂ne % k la convergence de la série 1+ k≥2 ( k1 −ln k−1 ), et donc l’existence de la limite lim q→∞ , q $ 1 k=1 k - − ln q . Cette limite est appelée la constante d’Euler, désignée par C et joue un grand rôle dans différentes questions d’analyse et de théorie analytique des nombres. Sa valeur approximative est C = 0, 577215664901532860606512090082.... On ignore toujours si la constante d’Euler est un nombre rationnel ou un nombre irrationnel, un nombre algébrique ou un nombre transcendant. Pour s > 1, la somme de la série de Riemann, que l’on désigne par ζ(s), peut se calculer, par des moyens qui sortent du cadre de ce chapitre, lorsque s est 2 4 π6 pair. Ainsi, ζ(2) = π6 , ζ(4) = π90 , ζ(6) = 945 . Plus généralement, Leonard Euler a montré que, pour chaque entier positif k, ζ(2k) = ak π 2k pour un certain nombre rationnel ak . On peut en déduire que ζ(2k) est toujours irrationnel, et même transcendant. Par contre on ignore si ζ(2k + 1) est ou non irrationnel lorsque k ≥ 2. Ce n’est qu’en 1978 que Roger Apery a démontré que ζ(3) était irrationnel. % 1 2. La série d’Abel k≥2 k ln k est telle que 1 k 1 k→∞ k ln k lim = +∞ tandis que, pour chaque c > 1, 1 kc 1 k→∞ k ln k lim = 0. 421 11.5. TESTS DE LA RACINE ET DU QUOTIENT Le test de la limite combiné aux résultats sur la convergence de la série de Riemann ne permettent donc pas de décider de sa convergence. Mais, pour tout x ≥ 2, on a J 2 x dy = y ln y J ln x ln 2 dt = ln(ln x) − ln(ln 2), t 1 et la fonction décroissante x 2→ x ln x n’est pas intégrable sur [2, +∞[. Le test de Maclaurin-Cauchy montre aussitôt que la série d’Abel est divergente. % Par contre, le même test montre que, pour tout a > 1, la série k≥2 k(ln1k)a est convergente. 11.5 Tests de la racine et du quotient Des combinaisons judicieuses du test de comparaison et des résultats sur la convergence de la série géométrique fournissent d’utiles tests de convergence absolue. Le premier s’appelle le test de la racine de Cauchy. % Proposition. Soit k∈N ak une série dans Rp . Posons L = +∞ si la suite 1/k (|ak |2 )k∈N n’est pas majorée et L = lim q→∞ & sup {k∈N:k≥q} 1/k |ak |2 ' , sinon. % 1. Si L < 1, la série k∈N ak converge absolument. % 2. Si L > 1, la série k∈N ak diverge. % 3. Si L = 1, on ne peut pas conclure, c’est-à-dire la série k∈N ak peut converger ou diverger. 8 Démonstration. 9Notons tout d’abord que, si elle est définie, la suite 1/k sup{k∈N:k≥q} |ak |2 est décroissante et positive, et sa limite L existe q∈N bien. Si l’hypothèse 1 est satisfaite, choisissons ! > 0 tel que L + ! < 1 (par exemple ! = 1−L 2 ). Il existera dès lors un m ∈ N tel que L−! ≤ sup {k∈N:k≥q} 1/k |ak |2 ≤ L + !, 1/k pour tout q ≥ m, et dès lors, pour tout k ≥ m, on aura |ak |2 ≤ L + !, % c’est-à-dire |ak |2 ≤ (L + !)k . Comme la série géométrique k∈N (L + !)k est convergente, la thèse résulte du test de comparaison. 422 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES Supposons maintenant que L > 1 et considérons le cas où L est fini (on procède de même pour L = +∞). La décroissance de la suite & sup {k∈N:k≥q} entraı̂ne que, pour tout q ∈ N, on a sup {k∈N:k≥q} 1/k |ak |2 1/k |ak |2 ' q∈N ≥ L > 1. Choisissons ! > 0 tel que L−! > 1 (par exemple ! = L−1 2 ). La caractérisation du supremum appliquée à l’inégalité ci-dessus entraı̂ne alors l’existence, pour chaque q ∈ N, d’un entier kq ≥ q tel que 1/kq |akq |2 ≥ 1/k sup {k∈N:k≥q} |ak |2 − ! ≥ L − ! > 1, et donc tel que |akq |2 > 1. Par conséquent, la suite (ak )k∈N des termes de % la série ne tend pas vers zéro et la série k∈N ak diverge. Enfin, la série de % Riemann k∈N∗ k1c , avec c > 0 est telle que (k−c )1/k = [k1/k ]−c . Par ailleurs, l’étude élémentaire du comportement de la fonction x 2→ x1/x montre que cette fonction décroı̂t pour x ≥ e et tend vers 1 lorsque x tend vers l’infini (calculer la dérivée et utiliser la règle de l’Hospital). En conséquence, la suite ([k1/k ]−c )k≥3 est croissante et a pour limite 1, ce qui entraı̂ne, puisque sup ([k1/k ]−c ) = 1, {k∈N:k≥q} dès que q ≥ 3, que L = 1. Or la série de Riemann diverge pour c ≤ 1 et converge pour c > 1. Le résultat qui suit simplifie fortement, lorsqu’il s’applique, le calcul de L. Proposition. Avec les notations du test de la racine de Cauchy, si 1/k limk→∞ |ak |2 existe, alors L est égal à cette limite. 1/k Démonstration. Soit a = limk→∞ |ak |2 et soit ! > 0. Il existe donc m ∈ N tel que, pour tout entier k ≥ m, on ait 1/k a − ! ≤ |ak |2 et dès lors, pour tout q ≥ m, on a 1/q a − ! ≤ |aq |2 ce qui implique L = a. ≤ ≤ a + !, sup {k∈N:k≥q} 1/k |ak |2 ≤ a + !, 11.5. TESTS DE LA RACINE ET DU QUOTIENT 423 Le deuxième test s’appelle le test du quotient de d’Alembert. % Proposition. Soit k∈N ak une série dans Rp telle que ak /= 0 pour tout |a |2 k ∈ N. Si la suite ( |ak+1 )k∈N n’est pas majorée, posons Q2 = +∞. Sinon, k |2 posons & ' |ak+1 |2 Q2 = lim sup , q→∞ {k∈N:k≥q} |ak |2 Q1 = lim q→∞ % & |ak+1 |2 inf {k∈N:k≥q} |ak |2 ' . 1. Si Q2 < 1, la série k∈N ak converge absolument. % 2. si Q1 > 1, la série k∈N ak diverge. % 3. Si Q1 ≤ 1 ≤ Q2 , le test ne peut conclure, c’est-à-dire la série k∈N ak peut converger ou diverger. Démonstration. Notons tout d’abord que, lorsqu’elle est définie, la suite & |ak+1 |2 sup {k∈N:k≥q} |ak |2 ' q∈N est décroissante et positive, donc convergente, et chacun de ses termes majore le terme correspondant de la suite croissante et positive & |ak+1 |2 inf {k∈N:k≥q} |ak |2 ' , q∈N qui convergera donc également. En conséquence, Q2 et Q1 existent et Q1 ≤ Q2 . Dans le cas de l’hypothèse 1, soit ! > 0 tel que Q2 + ! < 1. Il existera un entier naturel m tel que |ak+1 |2 ≤ Q2 + !, {k∈N:k≥q} |ak |2 sup pour tout q ≥ m et donc tel que |ak+1 |2 (Q2 + !)k+1 ≤ Q2 + ! = , |ak |2 (Q2 + !)k pour tout k ≥ m. Pour ces mêmes k, on a donc |ak+1 |2 |ak |2 ≤ , k+1 (Q2 + !) (Q2 + !)k 424 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES et la suite 8 k ≥ m, on a |ak |2 (Q2+!)k 9 k≥m est donc décroissante. Par conséquent, pour tout |ak |2 ≤ Cm (Q2 + !)k , % |2 k avec Cm = (Q|a2m k∈N (Q2 + !) converge, +!)m . Comme la série géométrique le test de comparaison et l’inégalité ci-dessus entraı̂nent aussitôt la conver% gence absolue de k∈N ak . Si Q1 > 1, (et nous nous contenterons de traiter explicitement le cas où Q1 est fini, l’autre étant semblable), il existe ! > 0 tel que Q1 − ! > 1. Pour cet !, il existe un entier naturel m tel que Q1 − ! ≤ |ak+1 |2 ≤ Q1 + !, {k∈N:k≥q} |ak |2 inf si q ≥ m, et donc tel que, pour tout k ≥ m, 1< |ak+1 |2 . |ak |2 En conséquence, on a, pour tout k ≥ m, |ak+1 |2 ≥ |ak |2 ≥ |am |2 > 0, et la suite (ak )k∈N ne tend pas vers zéro, ce qui entraı̂ne la divergence de % k∈N ak . Enfin, on montre aisément que la série de Riemann fournit, quel que soit c > 0, les valeurs Q1 = Q2 = 1 et l’on sait qu’elle diverge pour c ≤ 1 et converge pour c > 1. Le résultat suivant facilite, lorsqu’il s’applique, le calcul des expressions Q1 et Q2 . Sa démonstration, semblable au résultat analogue pour le critère de Cauchy, est laissée au lecteur. Proposition. Avec les notations du test du quotient de d’Alembert, si |a |2 limk→∞ |ak+1 existe, alors Q1 = Q2 et leur valeur commune est égale à k |2 cette limite. Remarque. Le test du quotient est en général plus facile à appliquer que le test de la racine, car il est en général plus facile de calculer des quotients que des racines. Cependant, le test de la racine est plus général que le test du quotient dans le sens suivant : si le test du quotient entraı̂ne la convergence ou la divergence, il en est de même du test de la racine; si le test de la racine ne peut conclure, il en est du même du test du quotient. Ce fait résulte des inégalités ci-dessous, dont le lecteur vérifiera aisément la validité pour toute suite strictement positive (ck )k∈N : lim q→∞ 4 inf k≥q ck+1 ck 5 ≤ lim q→∞ 4 1/k inf ck k≥q 5 , 425 11.6. SÉRIES POTENTIELLES lim q→∞ 11.6 & 1/k sup ck k≥q ' ≤ lim q→∞ & ck+1 sup k≥q ck ' . Séries potentielles Une application importante des tests de la racine et du quotient est fournie par l’étude des séries potentielles, qui constituent la généralisation naturelle des polynômes sur C. Définition. Etant donnés une suite (ck )k∈N dans C et deux nombres complexes a et z, on appelle série potentielle ou série de puissances ou série % entière une série de la forme k∈N ck (z − a)k . % Les sommes partielles de la série potentielle k∈N ck (z − a)k sont les % polynômes qk=0 ck (z − a)k . Ces expressions ont un sens quel que soit z ∈ % C. L’exemple de la série géométrique k∈N z k de raison z ∈ C qui ne converge que pour |z| < 1 montre que la somme d’une série potentielle n’est pas nécessairement définie pour tout z ∈ C. On a dans cette direction l’important théorème de convergence d’une série potentielle. % Théorème. Considérons la série potentielle k∈N ck (z − a)k . Si la suite (|ck |1/k )k∈N n’est pas majorée, posons C = +∞. Sinon, posons C = lim q→∞ & sup {k∈N:k≥q} |ck | 1/k ' . % 1. Si C > 0 est fini, et si l’on pose R = 1/C, la série k∈N ck (z −a)k converge absolument si |z − a| < R et diverge si |z − a| > R. % 2. Si C = 0, la série k∈N ck (z − a)k converge absolument pour tout z ∈ C. % 3. si C = +∞, la série k∈N ck (z − a)k converge absolument pour z = a et diverge pour tout z /= a. Démonstration. Appliquons le test de la racine de Cauchy à la série $ k∈N ck (z − a)k . Comme |ck (z − a)k | = |ck ||z − a|k pour chaque k ∈ N, on a # #1/k # # = |ck |1/k |z − a|, #ck (z − a)k # 426 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES 8 et, pour z /= a, la suite |ck (z − a)k |1/k la suite (|ck | 1/k 9 k∈N∗ est majorée si et seulement si )k∈N∗ l’est. Dans ce cas, on a, pour chaque q ∈ N, sup {k∈N:k≥q} # #1/k # # = #ck (z − a)k # = |z − a| sup {k∈N:k≥q} sup {k∈N:k≥q} |ck |1/k |z − a| |ck |1/k , et dès lors L = |z − a|C. Dès lors, si C > 0 est fini, L < 1 si et seulement si |z − a| < 1/C = R et L > 1 si et seulement si |z − a| > 1/C = R, et la thèse résulte du critère de la racine de Cauchy. Si C = 0, L = 0 quel que soit z ∈ C et le critère de la racine de Cauchy permet encore de conclure. Si C = +∞, alors, pour chaque z /= a, L = +∞ et la série diverge. Sa convergence pour z = a est triviale puisque ses termes sont nuls dès que k ≥ 1. Lorsque C > 0 est fini, le nombre R = 1/C s’appelle le rayon de con% vergence de la série k∈N ck (z − a)k et le disque ouvert de centre a et de rayon R s’appelle son disque de convergence. Lorsque limk→∞ |ck |1/k existe et est strictement positive, les résultats de la section précédente entraı̂nent évidemment que le rayon de convergence est égal à l’inverse de cette limite. En utilisant un cas particulier du critère du quotient de d’Alembert, on peut obtenir un théorème de convergence moins général, mais souvent plus facile à appliquer que le précédent. % Proposition. Soit k∈N ck (z − a)k une série potentielle telle que ck /= 0 |c | pour chaque k ∈ N. Si la limite limk→∞ |ck+1 existe et est strictement k| positive, elle est égale à l’inverse du rayon de convergence de la série. Si elle est nulle, la série converge absolument pour tout z ∈ C. Si elle est égale à +∞, la série diverge pour tout z /= a. Démonstration. Etudions la convergence absolue de la série $ k∈N ck (z − a)k par le test du quotient de d’Alembert. On a et dès lors |ck+1 ||z − a|k+1 |ck+1 | = |z − a| , |ck ||z − a|k |ck | lim k→∞ |ck+1 ||z − a|k+1 = |z − a|r, |ck ||z − a|k 427 11.6. SÉRIES POTENTIELLES |c | si r = limk→∞ |ck+1 . La thèse se déduit alors du cas particulier du test de k| d’Alembert où Q1 = Q2 . Exemples. 1. Rappelons que si z ∈ C, la série exponentielle de z est la % k série potentielle k∈N zk! . Puisque 1 (k+1)! lim 1 k→∞ k! = lim k→∞ 1 = 0, k+1 la proposition précédente montre que cette série converge absolument pour tout z ∈ C. On montre de même que les séries potentielles $ (−1)k k∈N $ z 2k z 2k+1 et (−1)k (2k)! (2k + 1)! k∈N convergent pour chaque z ∈ C. On les appelle respectivement la série potentielle cosinus de z et la série potentielle sinus de z et leurs sommes respectives sont désignées par cos z et sin z. % 2. La série potentielle k∈N∗ kk z k est telle que 8 lim kk k→∞ 91/k = lim k = +∞, k→∞ et dès lors elle converge pour z = 0 et diverge pour z /= 0. % k 3. La série potentielle k∈N∗ zkc où c ∈ R est telle que 1 (k+1)c 1 k→∞ kc lim = lim k→∞ 4 k k+1 5c = 1, et dès lors elle converge absolument pour |z| < 1 et diverge pour |z| > 1. Le théorème fondamental de convergence d’une série entière ne fournit aucune information sur sa convergence lorsque |z| = 1 et il faut étudier chaque ∗ série cas # k #par cas. Si nous remarquons que, pour |z| = 1 et chaque k ∈ N , #z # 1 on a # kc # = kc , le test de comparaison et la convergence de la série de Riemann pour c > 1 entraı̂nent dans ce cas la convergence absolue de la % k série potentielle k∈N∗ zkc pour chaque z tel que |z| = 1. Lorsque c ∈ ]0, 1], et z = 1, la série potentielle se réduit à la série de Riemann divergente % 1 k∈N∗ kc , et l’on montrera plus loin qu’elle converge pour les autres valeurs ∗ #dek #z telles que |z| = 1. Enfin, si c ≤ 0, on a, pour |z| = 1 et k ∈ N , #z # # kc # = k |c| et la série diverge puisque la suite de ses termes ne tend pas vers zéro. On voit donc qu’une série potentielle peut converger en tous les points 428 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES tels que |z − a| soit égal au rayon de convergence, diverger en tous ces points, ou encore converger en certains de ces points et diverger en d’autres. Nous reviendrons sur cette question dans la section suivante. On peut associer à une série potentielle une famille d’autres séries potentielles ayant le même rayon de convergence. Définition. On appelle série dérivée de la série potentielle la série potentielle $ k∈N∗ kck (z − a)k−1 = $ k∈N % k∈N ck (z − a) k (k + 1)ck+1 (z − a)k , dont chaque terme est la valeur en z de la C-dérivée par rapport à z du terme correspondant de la série originelle. Ainsi, la série dérivée de la série géométrique $ k∈N∗ kz k−1 = $ k∈N∗ k k∈N z k est la série (k + 1)z k . k∈N La série dérivée de la série exponentielle de z $ % % zk k∈N k! est la série $ $ zk z k−1 zk (k + 1) = = , k! (k + 1)! k∈N k! k∈N c’est-à-dire la série exponentielle de z elle-même. La série dérivée de la série cosinus de z est égale à moins la série sinus de z et la série dérivée de la série sinus de z est égale à la série cosinus de z. Proposition. Une série potentielle et sa série dérivée ont le même rayon de convergence. Démonstration. Notons tout d’abord que, pour z /= a, les termes de % % la série dérivée k∈N∗ kck (z − a)k−1 et ceux de la série k∈N∗ kck (z − a)k ne diffèrent que par un facteur constant z − a et les deux séries convergent ou divergent donc simultanément. Pour étudier la convergence de la série % k 1/k pour q ≥ 1. k∈N∗ kck (z − a) , il faut étudier les quantités supk≥q (k|ck |) On a vu précédemment que la fonction x 2→ x1/x décroı̂t monotonément vers 1 dès que x ≥ e. En conséquence, on aura, pour tout k ≥ q ≥ 3, |ck |1/k ≤ (k|ck |)1/k = k1/k |ck |1/k ≤ q 1/q |ck |1/k , et dès lors sup |ck |1/k ≤ sup (k|ck |)1/k ≤ sup q 1/q |ck |1/k = q 1/q sup |ck |1/k . k≥q≥3 k≥q≥3 k≥q≥3 k≥q≥3 429 11.7. SÉRIES TRIGONOMÉTRIQUES On en déduit aussitôt que les suites correspondantes sont simultanément majorées, et que, s’il en est ainsi, C = lim q→∞ ≤ lim q→∞ & q & sup |ck | 1/k k≥q≥3 1/q sup |ck | 1/k k≥q≥3 = lim ' q→∞ & ≤ lim , sup (k|ck |) 1/k q→∞ k≥q≥3 ' = lim q 1/q q→∞ sup |ck |1/k k≥q . lim q→∞ ' & - = C$ sup |ck | 1/k k≥q ' = C, et dès lors C = C $ . On peut évidemment itérer le processus de passage à la série dérivée et considérer la série dérivée de la série dérivée $ k≥2 (k − 1)kck (z − a)k−2 = $ k∈N (k + 1)(k + 2)ck+2 (z − a)k , que l’on appellera la série dérivée seconde de la série potentielle $ k∈N ck (z − a)k . En continuant de la sorte, on définira, pour chaque entier m ≥ 1, la série % dérivée me de k∈N ck (z − a)k comme étant la série $ k≥m = $ k∈N (k − m + 1) . . . (k − 1)kck (z − a)k−m (k + 1)(k + 2) . . .(k + m)ck+m (z − a)k . Toutes ces séries dérivées ont évidemment le même rayon de convergence % que la série k∈N ck (z − a)k . 11.7 Séries trigonométriques % Soit k∈N ck (z −a)k une série potentielle et R > 0 son rayon de convergence. Les points z tels que |z − a| = R, peuvent s’écrire z = a + R exp it, t ∈ R, et, % en ces points, la série potentielle prend la forme k∈N ck Rk exp ikt, avec lim q→∞ & sup (|ck |R ) k≥q≥1 k 1/k ' = R lim q→∞ & sup |ck | k≥q≥1 1/k ' = 1. 430 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES % Il s’agit d’un cas particulier de séries de la forme k∈N dk exp ikt où t ∈ R et (dk )k∈N est une suite de nombres complexes. Ces séries s’appellent des % séries trigonométriques et elles sont du type k∈N ak bk avec bk = dk et ak = exp ikt. Pour de tels ak , on a pour chaque q ∈ N, Aq = q $ exp ikt = k=0 1 − exp[i(q + 1)t] si t /= 2πm, m ∈ Z 1 − exp it et Aq = q + 1 si t = 2πm, m ∈ Z. En conséquence, pour chaque t /= 2 2πm, m ∈ Z et chaque q ∈ N, on a |Aq | ≤ |1−exp . Nous allons voir qu’il % it| est possible d’obtenir pour les séries de type k∈N ak bk pour lesquelles la suite (|Aq |)q∈N est majorée d’intéressants résultats de convergence qui sont l’analogue de tests d’intégrabilité obtenus précédemment pour des produits de fonctions. Ces résultats reposent sur la proposition suivante, appelée le lemme d’Abel. Lemme. Soient (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les conditions suivantes. %q 1. La suite (Aq )q∈N des sommes partielles Aq = k=0 ak est bornée. % 2. La série k∈N(bk − bk+1 ) converge absolument. % Alors la série k∈N ak bk converge si et seulement si limq→∞ Aq bq existe. Démonstration. La démonstration utilise la transformation d’Abel qui est l’analogue, pour les séries, de l’intégration par parties : q $ k=0 ak bk = a0 b0 + q $ k=1 (Ak − Ak−1 )bk = A0 b0 + = Aq bq + q−1 $ k=0 q $ k=1 Ak bk − q−1 $ Ak bk+1 k=0 Ak (bk − bk+1 ) (q ∈ N). Si M > 0 est tel que |Ak | ≤ M pour chaque k ∈ N, alors |Ak (bk − bk+1 )| ≤ M |bk − bk+1 | % pour chaque k ∈ N et, comme la série k∈N M |bk − bk+1 | converge par l’hypothèse 2, le test de comparaison entraı̂ne la convergence absolue de la % série k∈N Ak (bk − bk+1 ). La thèse résulte alors facilement de la formule d’Abel. On déduit de ce lemme des tests de convergence utiles. Les deux premiers % requièrent la convergence de k∈N ak . On a d’abord le test de convergence de Du Bois-Reymond. 431 11.7. SÉRIES TRIGONOMÉTRIQUES Corollaire. Soit (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les conditions suivantes. % a. La série k∈N ak converge. % b. La série k∈N (bk − bk+1 ) converge absolument. % Alors la série k∈N ak bk converge. Démonstration. Par l’hypothèse a, la suite des sommes partielles (Aq )q∈N est convergente, et donc bornée. Les sommes partielles de la série % k∈N (bk − bk+1 ) sont données par q $ k=0 (bk − bk+1 ) = q $ k=0 bk − q+1 $ k=1 bk = b0 − bq+1 . Par l’hypothèse b, la suite (b0 − bq+1 )q∈N converge, et il en est donc de même de (Aq bq )q∈N. Le lemme d’Abel permet de conclure. Le deuxième résultat s’appelle le test de convergence d’Abel. Corollaire. Soit (ak )k∈N une suite dans K et (bk )k∈N une suite dans R vérifiant les conditions suivantes. % a. La série k∈N ak converge. b$ . La suite (bk )k∈N est monotone et convergente. % Alors la série k∈N ak bk converge. Démonstration. Comme (bk )k∈N est monotone, les expressions bk − bk+1 % ont toutes le même signe et la série k∈N (bk − bk+1 ) converge absolument si et seulement si elle converge, ce qui est le cas puisque, comme on l’a montré plus haut, la suite de ses sommes partielles est la suite (b0 − bq+1 )q∈N qui converge par l’hypothèse b’. Les test suivants ne requièrent plus la convergence de d’abord le test de convergence de Dedekind. % k∈N ak . On a Corollaire. Soit (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les conditions suivantes. A. La suite (Aq )q∈N est bornée. % B. La série k∈N (bk − bk+1 ) converge absolument. C. La suite (bk )k∈N converge vers zéro. % Alors la série k∈N ak bk converge. Démonstration. Si M majore tous les |Aq |, on a |Aq bq | ≤ M |bq | pour tout q ∈ N, et dès lors limq→∞ Aq bq = 0. La thèse résulte du lemme d’Abel. 432 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES On a enfin le test de convergence de Dirichlet. Corollaire. Soit (ak )k∈N une suite dans K et (bk )k∈N une suite dans R vérifiant les conditions suivantes. A. La suite (Aq )q∈N est bornée. B $ . La suite (bk )k∈N est monotone et converge vers zéro. % Alors la série k∈N ak bk converge. Démonstration. On montre, comme dans le test d’Abel, que la condition B’ entraı̂ne l’hypothèse B du test de Dedekind. Exemples. 1. Le test de Dirichlet s’applique aux séries trigonométriques % k∈N dk exp ikt pour t /= 2πm, m ∈ Z, lorsque la suite (dk )k∈N est décroissante et a une limite nulle. Ce sera en particulier le cas pour les séries $ k−c exp(ikt) k∈N quel que soit c > 0 et t /= 2πm, m ∈ Z. On en déduit en particulier la % convergence de la série potentielle k∈N k−c z k considérée plus haut pour tout z /= 1 tel que |z| = 1 et tout c ∈ ]0, 1]. Rappelons qu’on avait déjà démontré la convergence absolue de cette série pour tout z tel que |z| = 1 et tout c > 1. 2. Une autre classe intéressante de séries auxquelles le test de Dirichlet % s’applique est celle des séries alternées k∈N (−1)k bk où les bk sont réels et positifs. En posant ak = (−1)k , on trouve aussitôt que A2q = 1, A2q+1 = 0, et donc |Aq | ≤ 1 quel que soit q ∈ N. Le test de Dirichlet entraı̂ne alors que la série alternée converge dès que la suite (bk )k∈N décroit vers zéro. Ce sera en particulier le cas pour les séries de Riemann alternées % (−1)k qui convergent quel que soit c > 0. On savait déjà qu’elles k∈N∗ kc convergeaient absolument si et seulement si c > 1. Elles sont donc non absolument convergente pour c ∈ ]0, 1]. C’est en particulier le cas pour la k % série harmonique alternée k∈N∗ (−1) k . Remarque. On appellera plus généralement série trigonométrique toute série de la forme $ [d−k exp(−ikt) + dk exp(ikt)] k∈N où les d−k et dk sont des nombres complexes et t ∈ R. Lorsque d−k = dk pour chaque k ∈ N, la série est réelle et peut encore s’écrire a0 + $ (ak cos kt + bk sin kt) k∈N 433 11.8. EXERCICES avec ak = dk + d−k , bk = i(dk − d−k ), (k ∈ N). Si l’on pose Ak = (a2k + b2k )1/2 et θk = arctan abkk , cette dernière série prend la forme équivalente $ Ak sin(kt + θk ). k∈N L’étude de la convergence des séries trigonométriques est l’un des chapitres les plus importants et les plus délicats de l’analyse. 11.8 Exercices 1. Utiliser le théorème de Hake, la convergence de la série harmonique alternée et la divergence de la série harmonique pour montrer que la fonction f de R dans R définie par f (0) = 0 et f (x) = (−1)[ x ] 1 2 3 1 , x pour x ∈ ]0, 1] (où [u] désigne la partie entière de u) est intégrable sur [0, 1] mais n’y est pas L-intégrable. 2. Soit g une fonction de R dans R de classe C 1 sur R et a− , a+ deux zéros consécutifs de g entre lesquels g est strictement positive. Utiliser le théorème de Lagrange et le test de la limite d’intégrabilité pour montrer que, si a− et a+ sont des zéros simples de g (c’est-à-dire des zéros tels que g $ (a− ) /= 0 et g $ (a+ ) /= 0) alors la fonction x 2→ √ 1 est intégrable sur ]a− , a+ [. Ce type g(x) d’intégrale intervient dans la discussion, à partir de l’intégrale d’énergie, du mouvement d’un système mécanique conservatif à un degré de liberté. 3. Montrer que la fonction f de R dans R définie par f (0) = 0 et f (x) = x1 si x /= 0 n’est pas intégrable sur ]a, b[ lorsque a < 0 < b. Montrer toutefois que ,J J b −c dx dx b lim = log . + c→0+ x |a| a c x Cette limite s’appelle la valeur principale de Cauchy de l’“intégrale” de f sur ]a, b[ et s’écrit J b dx b vp = log . |a| a x 4. Soit p ≥ 1 un entier, f une fonction de R dans R de classe C p sur [0, 1], et α ∈ ]0, 1[. En utilisant le reste de Lagrange du développement de Taylor 434 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES et le test d’intégrabilité de la limite, montrer que la fonction x 2→ p−1 f (x) − Tf,0 (x) xp+α est intégrable sur [0, 1]. Son intégrale est appellée la partie finie de l’“inté(x) grale” de la fonction x 2→ xfp+α , et notée Pf J 0 1 f (x) dx. xp+α En particulier, montrer que Pf J 1 0 1+x 1 dx = . x1+α 1−α 5. Démontrer le théorème de Kummer : la série à termes strictement positifs k∈N ak converge si et seulement s’il 8 existe une suite 9 (bk )k∈N de nombres ak strictement positifs tels que limk→∞ bk ak+1 − bk+1 > 0. Suggestion: pour % %q la condition nécessaire, si A = ∞ k=0 ak , et Aq = k=0 ak , il suffit de prendre A−Ak bk = ak ; pour la condition suffisante, il existe h > 0 et m ∈ N tels que % bk ak − bk+1 > h, ak+1 pour tout k ≥ m. on en déduit aisément que, pour tout k ≥ m, on a h(Ak − Am ) < bmam − bk ak < bm am , et dès lors la suite (Ak )k≥m est majorée par Am + bmham . En déduire le test k de Raabe : si limk→∞ k( aak+1 − 1) > 1, alors la série à termes strictement % positifs k∈N ak converge. % m(m−1)...(m−k+1) k 6. Montrer que, si m ∈ R, la série binomiale k∈N z a un k! rayon de convergence égal à un. Cette série se réduit au développement de (1 + z)m par le binôme de Newton si m ≥ 1 est un entier. 11.9 Petite anthologie Si on élève 1 + µ à la puissance m, le terme ne de la série sera µn−1 m(m − 1) . . .(m − n + 2) , 2.3.4. . . ..(n − 1) 435 11.9. PETITE ANTHOLOGIE et le suivant, c’est-à-dire le (n + 1)e , sera µn m(m − 1) . . . (m − n + 2)(m − n + 1) ; 2.3.4. . . .(n − 1).n donc le rapport du (n + 1)e terme au ne sera µ (m−n+1) ; or pour que la série n soit convergente, il faut que ce rapport (abstraction faite du signe qu’il doit avoir) soit plus petit que l’unité. Jean Le Rond d’Alembert, 1768 Lorsque la série u0 , u1 , u2 , . . . , un , etc, . . . a tous ses termes positifs, on peut ordinairement décider si elle est convergente ou divergente, à l’aide du théorème suivant. Théorème. Cherchez la limite ou les limites vers lesquelles converge, tandis que n croı̂t indéfiniment, l’expression (un )1/n ; et désignez par k la plus grande de ces limites, ou, en d’autres termes, la limite des plus grandes valeurs de l’expression dont il s’agit. La série sera convergente, si l’on a k < 1, et divergente, si l’on a k > 1. Augustin Cauchy, 1821 Soit a0 , a1 x, a2 x2 , . . . , an xn , etc . . . , une série ordonnée suivant les puissances entières et ascendantes de la variable x. Théorème. Soit A la limite vers laquelle converge, pour des valeurs croissantes de n, la racine ne des plus grandes valeurs numériques de an . La série sera convergente pour toutes les valeurs de x comprises entre les limites 1 1 x=− , x=+ , A A et divergentes pour toutes les valeurs de x situées hors des mêmes limites. Augustin Cauchy, 1821 Etant donné une série a0 + a1 x + . . . + am xm + . . . , on peut se proposer de déterminer, s’il y a lieu, son cercle de convergence. Cette question a été traitée par M. Lecornu (Comptes rendus, 7 février 1887) 436 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES 1/m dans le cas où le module de am+1 a une limite. Cette limite am ou celui de am est alors l’inverse du rayon de convergence. L’objet de la présente note est de résoudre le problème dans tous les cas. Pour cela, je rappellerai quelques principes relatifs aux suites infinies. Soit une suite infinie de nombres positifs u0 , u1 , . . . , um, . . . . Il peut arriver, comme premier cas, que cette suite contienne des termes supérieures à tout nombre donné A. S’il n’en est pas ainsi, il y a lieu de distinguer deux classes de nombres. Dans la première, on mettra tout nombre A tel qu’il existe dans la suite des termes d’un rang aussi élevé qu’on le veut supérieurs à A; dans la seconde, tout nombre B, tel que tous les termes de la suite, à partir d’un certain rang, soient moindres que B. Il est clair que si un nombre A appartient à la première classe, il en est de même de tous les nombres inférieurs, et que si un nombre B est de la seconde classe, il en est de même de tous les nombres supérieurs. La supposition que nous avons faite au commencement de cet alinée consiste dans l’existence des nombres de la seconde classe. Il est alors facile de définir, par des procédés bien connus, un nombre α, tel que la première classe soit composée des nombres plus petits que α, et la seconde, des nombres plus grands que α; en sorte que α − !(! > 0) appartiendra à la première classe, et α + ! à la seconde. Pour abréger, nous appellerons ce nombre α la limite supérieure de la suite. Cette limite est nulle dans le cas où la suite tend vers 0, et dans ce cas seulement. Cela posé, pour rechercher le cercle de convergence de la série donnée, il suffira de considérer la suite |a1 |, |a2|1/2, . . . , |am|1/m, . . . . 1. Si cette suite contient des termes supérieurs à toute quantité donnée, la série n’est jamais convergente; 2. Si cette suite ne renferme pas de termes augmentant indéfiniment, elle admet une limite supérieure α. Le rayon de convergence de la série est alors ρ = α1 . 3. La condition nécessaire et suffisante pour que la série soit convergente dans tout le plan et représente une fonction entière est que |am |1/m tende vers zéro. Jacques Hadamard, 1888 Chapitre 12 Suites et séries de fonctions 12.1 Convergence ponctuelle De nombreuses fonctions intervenant en analyse s’obtiennent comme limites de suites de fonctions plus simples. Le but de ce chapitre est d’étudier la conservation éventuelle, après passage à la limite, de différentes propriétés des fonctions de la suite. Nous allons voir que cette conservation dépend du mode de passage à la limite. Soit (fk )k∈N une suite de fonctions de Rn dans Rp, c’est-à-dire une application de N dans l’ensemble des fonctions de Rn dans Rp , soit E une partie de Rn contenue dans dom fk pour chaque k ∈ N et soit f une application de E dans Rp . Définition. On dit que la suite (fk )k∈N converge simplement ou ponctuellement sur E vers f si, pour chaque x ∈ E, la suite (dans Rp) (fk (x))k∈N converge vers f (x). Cette définition et l’unicité de la limite d’une suite dans Rp entraı̂nent aussitôt qu’il existe au plus une application f de E dans Rp vérifiant les conditions de cette définition. Lorsqu’elle existe, cette application s’appelle la limite ponctuelle sur E de la suite (fk )k∈N. En explicitant la définition de convergence d’une suite dans Rp, on trouve immédiatement que (fk )k∈N converge ponctuellement sur E vers f si et seulement si (∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |fk (x) − f (x)|2 ≤ !, (12.1) la norme | · |2 pouvant évidemment être remplacée par une autre. On voit que le m donné dans (12.1) dépendra en général d’ ! et de x. Il est évident 437 438 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS que, si G ⊂ E, la convergence ponctuelle sur E vers f de la suite (fk )k∈N entraı̂ne la convergence ponctuelle de cette suite sur G vers la restriction de f à G. Exemples. 1. Si E = [0, 1], la suite de fonctions réelles (fk )k∈N définies par fk (x) = xk converge ponctuellement sur E vers l’application réelle f définie par f (x) = 0 si x ∈ [0, 1[ et f (1) = 1. Pour chaque 0 < ! < 1 et chaque x ∈ [0, 1], le plus petit entier m = m(!, x) pour lequel (12.1) est satisfaite est ln ! donné par m(!, 0) = 0, m(!, 1) =D 0 et, pour 0 < x < 1, m(!, x) = ln x si ce E ln ! dernier nombre est entier et par ln x + 1, s’il ne l’est pas, où [y] désigne la partie entière du réel y. On voit donc que m(!, x) tend vers l’infini lorsque x tend vers 1 par valeurs strictement inférieures à un. 2. Considérons la suite (fk )k∈N de fonctions réelles d’une variable réelle 1 définies par fk (x) = 1+(x−k) 2 . Pour chaque k ∈ N, on vérifie facilement que lim k→∞ 1 = 0. 1 + (x − k)2 Par conséquent, cette suite converge ponctuellement sur R vers l’application nulle. Le lecteur vérifiera facilement que la quantité m(!, x) introduite dans l’exemple précédent tend vers +∞ lorsque x tend vers l’infini. 3. Si E = R, la suite de fonctions réelles (fk )k∈N définies par f0 (x) = 0 et fk (x) = k−1/2 sin kx pour k ≥ 1 converge ponctuellement sur R vers l’application nulle sur R. La conséquence immédiate suivante de la définition et des propriétés des suites dans Rp montre qu’on peut se ramener à l’étude de la convergence ponctuelle des suites de fonctions réelles. Proposition. La suite (fk )k∈N converge ponctuellement sur E vers f si et seulement si chaque suite de fonctions réelles (pq ◦fk )k∈N converge ponctuellement sur E vers pq ◦ f . Le critère de Cauchy de convergence d’une suite dans Rp appliqué à chaque suite (fk (x))k∈N fournit évidemment un critère de Cauchy de convergence ponctuelle sur E. Proposition. La suite (fk )k∈N converge ponctuellement sur E si et seulement si (∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |fk (x) − fq (x)|2 ≤ !. On peut évidemment considérer aussi des séries de fonctions. 439 12.1. CONVERGENCE PONCTUELLE Définition. On appelle série de fonctions de termes fk , k ∈ N, et l’on note % k∈N fk , la suite de fonctions (Fq )q∈N , où chaque fonction somme partielle Fq est définie par Fq = q $ fk . k=0 Définition. Soit F une application de E dans Rp . On dit que la série k∈N fk converge simplement ou ponctuellement sur E vers F si la suite (Fq )q∈N converge ponctuellement sur E vers F . % Si elle existe, l’unique application F vérifiant cette définition s’appelle % % alors la somme de la série de fonctions k∈N fk et se note ∞ k=0 fk . Il résulte % immédiatement de la définition que k∈N fk converge ponctuellement sur E % vers F si et seulement si, pour chaque x ∈ E, la série (dans Rp ) k∈N fk (x) converge vers F (x). Exemple. Si, pour chaque k ∈ N, la fonction réelle d’une variable réelle fk est définie par fk (x) = xk /k, on a vu en étudiant les séries entières que la % série k∈N fk converge ponctuellement sur [−1, 1[. La notion de convergence absolue d’une série dans Rp conduit à un second type de convergence pour une série de fonctions. % Définition. On dit que la série de fonctions k∈N fk converge absolument % sur E si, pour chaque x ∈ E, la série numérique k∈N |fk (x)|2 converge, % c’est-à-dire si, pour chaque x ∈ E, la série (dans Rp) k∈N fk (x) converge absolument. La propriété suivante est une conséquence immédiate de la définition et d’une propriété connue des séries dans Rp . Proposition. Si la série de fonctions elle converge ponctuellement sur E. % k∈N fk converge absolument sur E, Exemples. 1. Soit fk les fonctions réelles d’une variable réelle définies par % fk (x) = k−x et soit E =]1, +∞[. La série k∈N fk converge absolument sur E et sa somme est la restriction à ]1, +∞[ d’une fonction complexe d’une variable complexe appelée la fonction zeta (ζ). Cette fonction joue un grand rôle en théorie analytique des nombres. Bernhard Riemann a conjecturé en 1859 que les zéros non triviaux de cette fonction ont tous une partie réelle égale à 1/2. Vérifiée pour les quelques premiers millions de zéros de la fonction, cette hypothèse de Riemann attend encore sa démonstration. Celle-ci permettrait de préciser le théorème des nombres premiers, conjecturé en 1792 par Karl-Friedrich Gauss et seulement démontré en 1896 (indépendamment) par 440 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS Jacques Hadamard et Charles-Jean de La Vallée Poussin . Ce théorème affirme que le nombre π(k) de nombre premiers inférieurs ou égaux à un entier positif k est tel que π(k) lim = 1. k→∞ k/ ln k 2. Soit fk les fonctions complexes d’une variable complexe définies par fk (z) = z k et considérée comme fonction de R2 dans R2 . En vertu des % résultats sur la convergence de la série géométrique, la série k∈N fk converge 1 absolument sur B2 (0; 1) vers l’application F définie par F (z) = 1−z . 3. Si les fonctions réelles d’une variable réelle fk sont définies par fk (x) = x(1 − x)k , alors, pour chaque q ∈ N, on a Fq (0) = 0 et Fq (x) = 1 − (1 − x)q+1 si x /= 0. Par conséquent, puisque fk (x) = |fk (x)| pour chaque x ∈ [0, 1], la % % k série k∈N fk converge absolument sur [0, 1] et ∞ k=1 x(1 − x) = 0 si x = 0 et est égale à 1 si x ∈]0, 1]. Enfin, on traduit aisément dans le langage des séries les critères de Cauchy de convergence ponctuelle et de convergence absolue. % Proposition. La série de fonctions absolument) sur E si et seulement si k∈N fk converge ponctuellement (resp. (∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m) : # # # q # # $ # # # ≤ !. (resp. f (x) j # # #j=k+1 # 2 q $ j=k+1 |fj (x)|2 ≤ !.) L’exemple 1 de suite de fonctions et l’exemple 3 de série de fonctions montrent que la limite ponctuelle d’une suite de fonctions continues ou la somme d’une série absolument convergente de fonctions continues n’est pas nécessairement continue sur l’ensemble de convergence. D’ailleurs, dans ces exemples, les fonctions sont indéfiniment dérivables et la limite ou la somme ne l’est évidemment pas. La limite ponctuelle sur un ensemble d’une suite de fonctions bornées sur cet ensemble n’y est pas nécessairement bornée. Ainsi, pour chaque k ∈ N, la fonction réelle d’une variable réelle fk définie sur R∗+ par k fk (x) = , kx + 1 est bornée sur R+ par k et la suite converge ponctuellement sur R∗+ vers l’application f définie par f (x) = 1/x qui n’est pas bornée sur R∗+ . Enfin, la convergence ponctuelle ne préserve pas non plus l’intégrabilité. Dans 441 12.2. CONVERGENCE UNIFORME l’exemple précédent, chaque fk est intégrable sur ]0, 1] alors que f ne l’est pas, ainsi que cela se vérifie en utilisant le théorème de Hake. Si l’on note que les propriétés des fonctions que nous venons d’analyser expriment une certaine “solidarité” entre les valeurs de la fonction et que la convergence ponctuelle (c’est-à-dire “point par point”) est un concept tout à fait “individualiste”, on ne doit pas s’étonner trop que ces propriétés ne subsistent pas nécessairement après passage à la limite. Il convient donc d’introduire une notion de convergence plus globale si l’on veut que la fonction limite conserve de telles propriétés. 12.2 Convergence uniforme Soit (fk )k∈N une suite de fonctions de Rn dans Rp , soit E une partie de Rn contenue dans dom fk pour chaque k ∈ N et soit f une application de E dans Rp . Nous allons introduire un type de convergence plus restrictif que la convergence ponctuelle en imposant que la quantité m figurant dans la définition (12.1) puisse être choisie indépendamment de x dans E. Définition. On dit que la suite (fk )k∈N converge uniformément sur E vers f si (∀! > 0)(∃m ∈ N)(∀x ∈ E)(∀k ∈ N : k ≥ m) : |fk (x) − f (x)|2 ≤ !. (12.2) Bien entendu, si G ⊂ E, la convergence uniforme vers f de (fk )k∈N sur E entraı̂ne la convergence uniforme sur G de (fk )k∈N vers la restriction de f à G. Les propriétés du supremum entraı̂nent aussitôt le résultat suivant. Proposition. Les propositions suivantes sont équivalentes : 1. (fk )k∈N converge uniformément sur E vers f . 2. (∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : sup |fk (x) − f (x)|2 ≤ !. (12.3) x∈E 3. La suite réelle (supx∈E |fk (x) − f (x)|2 )k∈N converge vers zéro. Exemple. Dans l’exemple 3 de suite de fonctions donné dans la section précédente, il y a converge uniforme sur R vers l’application nulle puisque la suite 4 5 −1/2 sup |k sin kx| = (k−1/2)k∈N∗ R k∈N∗ converge vers zéro. Signalons une autre conséquence immédiate de la définition. 442 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS Proposition. Si (fk )k∈N converge uniformément sur E vers f , alors (fk )k∈N converge ponctuellement sur E vers f . L’unicité de la limite ponctuelle entraı̂ne alors qu’il existe au plus un f vérifiant (12.2). On l’appelle souvent la limite uniforme de (fk )k∈N sur E et elle est nécessairement égale à sa limite ponctuelle. L’exemple 2 de suite de fonctions donné dans la section précédente montre que la convergence ponctuelle sur un ensemble n’entraı̂ne pas nécessairement la convergence uniforme sur cet ensemble. En effet, la suite de fonctions donnée dans cet exemple converge ponctuellement sur R vers l’application nulle alors que la suite & # #' # # 1 # # sup # 1 + (x − k)2 # x∈R , k∈N qui est la suite constante 1, ne converge évidemment pas vers zéro. On dispose d’un critère de Cauchy de convergence uniforme. Théorème. La suite de fonctions (fk )k∈N converge uniformément sur E si et seulement si (∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m)(∀x ∈ E) : (12.4) |fk (x) − fq (x)|2 ≤ !, ou encore si et seulement si, (∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : sup |fk (x) − fq (x)|2 ≤ !. x∈E Démonstration. Condition nécessaire. Si ! > 0 est donné, alors, par définition, (∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E) : |fk (x) − f (x)|2 ≤ !/2. Dès lors, pour tout k ≥ m, tout q ≥ m et tout x ∈ E, on a |fk (x) − fq (x)|2 ≤ |fk (x) − f (x)|2 + |f (x) − fq (x)|2 ≤ !/2 + !/2 = !. Condition suffisante. Construisons tout d’abord un candidat pour l’application limite f . Si la suite (fk )k∈N vérifie la condition de Cauchy (12.4), alors, pour chaque x ∈ E, la suite (fk (x))k∈N est une suite de Cauchy dans 12.2. CONVERGENCE UNIFORME 443 Rp et elle converge dès lors vers un élément de Rp que nous désignerons par f (x). On obtient ainsi une application f de E dans Rp . Montrons maintenant que (fk )k∈N converge uniformément sur E vers f . Si ! > 0 est donné, la condition (12.4) implique que (∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E)(∀q ∈ N : q ≥ m) : |fk (x) − fq (x)|2 ≤ !. En faisant tendre q vers l’infini, on obtient alors, par continuité de l’application norme et conservation des inégalités par passage à la limite (∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E) : |fk (x) − f (x)|2 ≤ !, et la démonstration est complète. Le critère de Cauchy permet de prouver la convergence uniforme sur adh E de certaines suites de fonctions convergeant uniformément sur E. Proposition. Soit (fk )k∈N une suite de fonctions de Rn dans Rp continues sur adh E \ E qui converge uniformément sur E. Alors (fk )k∈N converge uniformément sur adh E. Démonstration. On peut évidemment supposer que adh E /= E. Si ! > 0 est donné, le critère de Cauchy de convergence uniforme sur E entraı̂ne l’existence d’un m ∈ N tel que (∀y ∈ E)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |fk (y) − fq (y)|2 ≤ !/3. D’autre part, pour chaque x ∈ adh E \ E, la continuité de chaque fonction fk au point x entraı̂ne l’existence d’un δ = δ(k, x) > 0 tel que (∀y ∈ E : |y − x|2 ≤ δ(k, x)) : |fk (y) − fk (x)|2 ≤ !/3. Dès lors, pour chaque x ∈ adh E \ E, k ≥ m et chaque q ≥ m, si nous choisissons (ce qui est toujours possible puisque x ∈ adh E \ E) un y ∈ E tel que |y − x|2 ≤ min[δ(k, x), δ(q, x)], nous obtenons |fk (x) − fq (x)|2 ≤ |fk (x) − fk (y)|2 + |fk (y) − fq (y)|2 + |fq (y) − fq (x)|2 ≤ !/3 + !/3 + !/3 = !, ce qui entraı̂ne la convergence uniforme de (fk )k∈N sur adh E puisque la condition de Cauchy était déjà satisfaite, avec le même m, pour chaque x ∈ E. 444 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS Une forme contraposée et affaiblie de cette proposition est souvent utile. Corollaire. Soit (fk )k∈N une suite de fonctions de Rn dans Rp continues sur adh E. Si cette suite ne converge pas uniformément sur adh E, alors elle ne converge pas uniformément sur E. Passons maintenant à la convergence uniforme des séries de fonctions. % Soit k∈N fk une série dont les termes sont des fonctions définies sur E ⊂ Rn et F une application de E dans Rp. % Définition. On dit que la série de fonctions k∈N fk converge uniformément sur E vers F si la suite (Fq )q∈N des sommes partielles converge uniformément sur E vers F . % Définition. On dit que la série de fonctions k∈N fk converge absolument % uniformément sur E si la série de fonctions positives k∈N |fk |2 converge uniformément sur E. On notera que cette notion est plus forte que celle de convergence absolue % et uniforme de k∈N fk sur E. % Exemple. Considérons la série k∈N fk de fonctions complexes d’une variable complexe fk définies par fk (z) = z k . On a vu que cette série converge 1 ponctuellement sur B2 (0; 1) vers l’application F : z 2→ 1−z . Elle ne converge pas uniformément sur B2 (0; 1) vers F car, pour chaque q ∈ N, on a sup z∈B2 (0;1) |Fq (z) − F (z)| = Toutefois, pour chaque r < 1, vers F puisque sup z∈B2 [0;r] % |z|q+1 = +∞. z∈B2 (0;1) |1 − z| k∈N fk |Fq (z) − F (z)| = sup converge uniformément sur B2 [0; r] |z|q+1 r q+1 = , 1−r z∈B2 [0;r] |1 − z| sup et que le dernier terme peut être rendu inférieur ou égal à ! > 0 donné en prenant q ≥ m pour m tel que r m+1 ≤ !(1 − r). Le même raisonnement % % appliqué à la série k∈N |z|k montre que k∈N fk converge en fait absolument et uniformément sur B2 [0; r]. On traduit sans peine, dans le langage des séries, le critère de Cauchy de convergence uniforme (resp. de convergence absolue uniforme). 445 12.2. CONVERGENCE UNIFORME % Corollaire. La série de fonctions k∈N fk converge uniformément (resp. absolument uniformément) sur E si et seulement si (∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m)(∀x ∈ E) : # # # q # # $ # # fj (x)## ≤ !, (resp. # #j=k+1 # 2 q $ j=k+1 |fj (x)|2 ≤ !), ou, d’une manière équivalente, si et seulement si (∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m) : # # # q # q $ # $ # sup ## fj (x)## ≤ !. (resp. sup |fj (x)|2 ≤ !). # x∈E #j=k+1 x∈E j=k+1 2 En particulier, puisqu’on a toujours l’inégalité sup x∈E q $ j=k+1 |fj (x)|2 ≤ q $ sup |fj (x)|2 , j=k+1 x∈E on voit qu’il y aura toujours convergence absolue uniforme sur E pour la série % % de fonctions k∈N fk si la série à termes positifs k∈N supx∈E |fk (x)|2 est de Cauchy, c’est-à-dire est convergente. Cette remarque suggère l’introduction d’un nouveau type de convergence pour une série de fonctions. % Définition. On dit que la série k∈N fk de fonctions de Rn dans Rp con% verge normalement sur E si la série à termes positifs k∈N supx∈E |fk (x)|2 converge. Par la remarque que nous venons de faire, la convergence normale sur E entraı̂ne évidemment la convergence absolue uniforme sur E. On a l’intéressant test de comparaison de Weierstrass pour la convergence normale. % Théorème. Considérons la série k∈N fk de fonctions de Rn dans Rp . S’il % existe une série convergente à termes positifs k∈N Mk telle que, pour chaque k ∈ N et chaque x ∈ E on ait alors la série % |fk (x)|2 ≤ Mk , k∈N fk est normalement convergente sur E. Démonstration. Pour chaque k ∈ N, on a, par hypothèse, sup |fk (x)|2 ≤ Mk , x∈E 446 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS et la thèse résulte de la définition et du test de comparaison pour les séries numériques. Exemple. Soit s > 1 et fk la fonction complexe d’une variable réelle définie par fk (x) = (k + 1)−s exp i(k + 1)x. Pour chaque k ∈ N et chaque x ∈ R, on a |fk (x)| ≤ (k + 1)−s % et la série numérique k∈N (k + 1)−s est convergente. Donc la série est normalement convergente sur R. 12.3 % k∈N fk Régularité de la limite uniforme Le résultat suivant est fondamental pour étudier la continuité et la dérivabilité de la limite uniforme d’une suite de fonctions continues ou dérivables. Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies sur E, f une application de E dans Rp et a ∈ adh E. Si les conditions suivantes sont réalisées 1. La suite (fk )k∈N converge uniformément sur E vers f . 2. Pour chaque k ∈ N, limx→a, x∈E fk (x) = bk . Alors la suite (bk )k∈N converge et lim x→a, x∈E f (x) = lim bk . k→∞ En d’autres termes, lim 2 3 lim fk (x) = lim x→a, x∈E k→∞ 2 lim k→∞ x→a, x∈E 3 fk (x) . Démonstration. Pour montrer que la suite (bk )k∈N converge, il suffit de montrer qu’elle est une suite de Cauchy. Si ! > 0 est donné, la condition de Cauchy de convergence uniforme de (fk )k∈N sur E entraı̂ne l’existence d’un m ∈ N tel que (∀k ≥ m)(∀q ≥ m)(∀x ∈ E) : |fk (x) − fq (x)|2 ≤ !. Dès lors, en faisant tendre x vers a et en utilisant la conservation d’une inégalité par passage à la limite et la continuité de la fonction | · |2 , on obtient |bk − bq |2 ≤ !, 447 12.3. RÉGULARITÉ DE LA LIMITE UNIFORME pour tout k ≥ m et tout q ≥ m, et (bk )k∈N est une suite de Cauchy dans Rp. Si nous désignons sa limite par b, il reste à montrer que lim x→a, x∈E f (x) = b. Etant donné un ! > 0, la convergence de (bk )k∈N vers b et la convergence uniforme de (fk )k∈N vers f entraı̂nent respectivement l’existence d’un m$ ∈ N et d’un m$$ ∈ N tels que, si m = max(m$ , m$$), on a |bm − b|2 ≤ !/3 et |fm (x) − f (x)|2 ≤ !/3 quel que soit x ∈ E. D’autre part, puisque limx→a, x∈E fm (x) = bm , il existe un δ > 0 tel que |fm (x) − bm|2 ≤ !/3 pour tout x ∈ E tel que |x − a|2 ≤ δ. Pour ces mêmes x, on aura donc |f (x) − b|2 ≤ |f (x) − fm (x)|2 + |fm (x) − bm |2 + |bm − b|2 ≤ !/3 + !/3 + !/3 = !, et la démonstration est complète. On a un résultat similaire pour les séries de fonctions. % Corollaire. Soit k∈N fk une série de fonctions de Rn dans Rp définies sur E, F une application de E dans Rp et a ∈ adh E. Si les conditions suivantes sont satisfaites : % 1. La série k∈N fk converge uniformément sur E vers F . 2. Pour chaque k ∈ N, limx→a, x∈E fk (x) = bk . % Alors la série k∈N bk converge et lim x→a, x∈E F (x) = ∞ $ bk . k=0 En d’autres termes, lim x→a, x∈E , ∞ $ k=0 - fk (x) = ∞ 2 $ k=0 lim x→a, x∈E 3 fk (x) . 448 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS Démonstration. En vertu des définitions, il suffit d’appliquer le théorème ci-dessus à la suite des sommes partielles (Fq )q∈N et de noter que, par suite des propriétés des limites des valeurs d’une fonction, on a, pour chaque q ∈ N, lim x→a, x∈E Fq (x) = lim x→a, x∈E , q $ - fk (x) = k=0 q 2 $ k=0 lim x→a, x∈E 3 fk (x) = q $ bk . k=0 % Remarque. La convergence uniforme de la série k∈N fk sur E autorise % donc la permutation des symboles limx→a, x∈E et ∞ k=0 . Les résultats suivants sont des conséquences immédiates du théorème et du corollaire précédents et de la définition de continuité. Corollaire. Si (fk )k∈N converge uniformément sur E vers f et si chaque fonction fk est continue sur E, alors f est continue sur E. % Corollaire. Si k∈N fk converge uniformément sur E vers F et si chaque fonction fk est continue sur E, alors F est continue sur E. Considérons maintenant le problème de la conservation de la dérivabilité par passage à la limite. La convergence uniforme d’une suite de fonctions dérivables ne suffit pas à assurer la dérivabilité de la limite. Ainsi, la suite k+2 (fk )k∈N de fonctions réelles d’une variable réelle définies par fk (x) = |x| k+1 et dérivables en chaque point de R converge uniformément sur [−1, 1] vers la fonction valeur absolue qui n’est pas dérivable à l’origine. Il peut arriver aussi que la limite soit dérivable mais ne soit pas égale à la limite des dérivées des fonctions de la suite. Le résultat suivant fournit des conditions sous lesquelles de telles conclusions sont exclues. Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies sur un ouvert E et soit f une application de E dans Rp . Supposons satisfaites les conditions suivantes. 1. La suite (fk )k∈N converge ponctuellement sur E vers f . 2. Il existe 1 ≤ j ≤ n tel que, pour chaque k ∈ N, la dérivée partielle Dj fk (x) existe pour chaque x ∈ E. 3. La suite de fonctions (Dj fk )k∈N converge uniformément sur E. Alors Dj f (x) existe pour chaque x ∈ E et est égale à limk→∞ Dj fk (x). En d’autres termes, on a Dj 4 5 lim fk (x) = lim Dj fk (x). k→∞ k→∞ 449 12.3. RÉGULARITÉ DE LA LIMITE UNIFORME Démonstration. Soit x ∈ E fixé, r > 0 tel que Ix = [−r, r] ⊂ Ex = {h ∈ R : x + hej ∈ E}, et φ, φk les fonctions définies pour chaque k ∈ N par les quotients différentiels φ(h) = f (x + hej ) − f (x) fk (x + hej ) − fk (x) , φk (h) = . h h Par construction, les fonctions φ et φk sont définies sur Ix \ {0} et sont telles que lim φk (h) = Dj fk (x), k ∈ N, h→0, h∈Ix et lim φk (h) = φ(h), h ∈ Ix \ {0}. k→∞ D’autre part, en appliquant l’inégalité de la moyenne à fk − fq , on trouve, pour chaque h ∈ Ix \ {0}, chaque k ∈ N et chaque q ∈ N, |φk (h) − φq (h)|2 = |h|−1 |fk (x + hej ) − fq (x + hej ) − [fk (x) − fq (x)]|2 ≤ |Dj fk (x + h$ ej ) − Dj fq (x + h$ ej )|2 , pour un certain h$ tel que 0 < |h$ | < |h|. Si ! > 0 est donné, la condition de Cauchy de convergence uniforme sur E de (Dj fk )k∈N entraı̂ne l’existence d’un m ∈ N tel que, pour chaque k ≥ m, chaque q ≥ m et chaque y ∈ E, on ait |Dj fk (y) − Dj fq (y)|2 ≤ !. Dès lors, puisque x + h$ ej ∈ E si h ∈ Ix \ {0}, on aura, pour chaque k ≥ m, chaque q ≥ m et chaque h ∈ Ix \ {0}, |φk (h) − φq (h)|2 ≤ !. En conséquence, la suite de fonctions (φk )k∈N converge uniformément sur Ix \ {0} vers φ et, en lui appliquant le premier théorème de cette section, on en déduit que lim 2 3 lim φk (h) = lim h→0, h∈Ix k→∞ 2 lim k→∞ h→0, h∈Ix c’est-à-dire, par des calculs faits plus haut, que lim h→0, h∈Ix φ(h) = lim Dj fk (x). k→∞ Donc Dj f (x) existe et est égal à limk→∞ Dj fk (x). 3 φk (h) , 450 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS On a évidemment un résultat analogue pour les séries. % Corollaire. Soit k∈N fk une série de fonctions de Rn dans Rp dont les termes sont définis sur un ouvert E et soit F une application de E dans Rp. Supposons satisfaites les conditions suivantes. % 1. La série k∈N fk converge ponctuellement sur E vers F . 2. Il existe 1 ≤ j ≤ n tel que, pour chaque k ∈ N, la dérivée partielle Dj fk (x) existe pour chaque x ∈ E. % 3. La série de fonctions k∈N Dj fk converge uniformément sur E. % Alors Dj F (x) existe pour chaque x ∈ E et est égale à ∞ k=0 Dj fk (x). En d’autres termes, on a Dj & ∞ $ k=0 ' fk (x) = ∞ $ Dj fk (x). k=0 Démonstration. Elle consiste à appliquer le théorème précédent à la suite des sommes partielles. Les détails sont laissés au lecteur. Montrons maintenant que la limite uniforme d’une suite de fonctions bornées est bornée. Proposition. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies sur E et soit f une application de E dans Rp . Supposons satisfaites les conditions suivantes. 1. La suite (fk )k∈N converge uniformément sur E vers f . 2. Pour chaque k ∈ N, il existe Mk ≥ 0 tel que |fk (x)|2 ≤ Mk , pour tout x ∈ E. Alors il existe M ≥ 0 tel que |f (x)|2 ≤ M pour tout x ∈ E. Démonstration. En prenant ! = 1 dans la définition de convergence uniforme de (fk )k∈N sur E, on obtient un entier positif m tel que, pour chaque x ∈ E, on a |fm (x) − f (x)|2 ≤ 1, ce qui entraı̂ne |f (x)|2 = |f (x) − fm (x) + fm (x)|2 ≤ 1 + |fm (x)|2 ≤ 1 + Mm pour tout x ∈ E et achève la démonstration. Remarque. On pourrait démontrer maintenant que la limite uniforme sur un pavé d’une suite de fonctions intégrables (resp. L-intégrables, Rintégrables) sur ce pavé y est également intégrable (resp. L-intégrable, 451 12.4. UNE FONCTION CONTINUE SANS DÉRIVÉE R-intégrable). Mais on trouvera plus loin des résultats plus généraux sur l’intégrabilité ou la L-intégrabilité de la limite d’une suite de fonctions intégrables. 12.4 Une fonction continue sans dérivée Les résultats que nous venons de développer permettent de construire un exemple, donné par Henri Lebesgue en 1940, de fonction réelle d’une variable réelle continue partout et dérivable nulle part. Considérons la série de % fonctions k∈N∗ fk où, pour chaque k ∈ N∗ , fk est l’application de R dans R définie par 2 sin 2k x fk (x) = . 2k Chaque fk est évidemment continue sur R et telle que sup |fk (x)| ≤ x∈R 1 . 2k % Le test de Weierstrass assure donc la convergence normale de k∈N∗ fk sur R et la somme F de cette série sera une application continue de R dans R. D’autre part, on aura, pour tout x ∈ R et tout h /= 0, ∞ ∞ $ F (x + h) − F (x) sin 2k (x + h) − sin 2k x $ gk (x, h), = = h 2k h k=1 k=1 2 2 et dès lors, par le théorème de Lagrange, on aura, pour tout k ∈ N∗ , tout x ∈ R et tout h /= 0, 2 |gk (x, h)| ≤ 2k −k = ak . Comme ak < 12 ak+1 , on a, pour tout entier m ≥ 2, m−1 $ ak < am−1 k=1 1 − (1/2)m−1 2 2 < 2am−1 = 2(m−1) −(m−1)+1 = 2m −3m+3 . 1 − (1/2) Donnons à h les quatre suites suivantes de valeurs tendant vers zéro lorsque m tend vers l’infini h1,m = π π 3π 3π , h2,m = − m2 +1 , h3,m = m2 +1 , h4,m = − m2 +1 . 2 2m +1 2 2 2 452 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS 2 Pour chaque m ∈ N∗ fixé, et chaque 1 ≤ j ≤ 4, 2k hj,m sera un multiple de 2π lorsque k > m, et dès lors gk (x, hj,m ) = 0. Pour k = m, on a, en posant 2 xk = 2k x, 4 gm (x, h1,m) = sin xm + 4 π 2 gm (x, h3,m) = sin xm + 3π 2 4 gm (x, h4,m) = sin xm − 5 5 gm (x, h2,m) = sin xm − 4 Comme π 2 − sin xm = − cos xm − sin xm , 5 3π 2 − sin xm = cos xm − sin xm , − sin xm = − cos xm − sin xm , 5 − sin xm = cos xm − sin xm . (cos xm − sin xm )2 + (cos xm + sin xm )2 = 2, la valeur absolue d’un des termes au moins est supérieure ou égale à un, et dès lors, pour les deux termes correspondants gm (x, hj,m), (avec j = 1, 4 ou j = 2, 3), on aura |gm(x, hj,m )| ≥ 1 2m 3π 2 2m +1 = 2 −m+1 2m 3π . En outre les termes correspondants seront de signe contraire. En résumé, on aura donc # # 2 # F (x + h ) − F (x) # 2 2m −m+1 # # j,m − 2m −3m+3 . # #> # # hj,m 3π Comme le membre de droite tend vers l’infini avec m, on pourra donc toujours trouver une suite (hjm ,m )m∈N∗ tendant vers zéro telle que la suite correspondante #' &# # F (x + h # # jm ,m ) − F (x) # , # # # # hjm ,m m∈N∗ tende vers l’infini, et de telle sorte que pour chaque m le quotient différentiel ait un signe choisi d’avance. En conséquence, la fonction F ainsi construite n’a de dérivée (ni même de dérivée au sens large) en aucun point de R. On notera que chaque somme partielle de la suite dont F est la limite est de classe C ∞ ! 453 12.5. SOMME D’UNE SÉRIE ENTIÈRE Jusqu’à la moitié du XIXe siècle, les mathématiciens pensaient qu’une fonction continue admet une dérivée sauf en quelques point exceptionnels. Après un exemple partiellement discuté par Bernard Bolzano en 1830, et un travail non publié de Charles Cellérier, le premier traitement rigoureux d’un exemple de fonction continue non dérivable fut publié par Karl Weierstrass en 1872; il s’agit de la somme de la série trigonométrique F (x) = ∞ $ ak cos(bk πx), k=0 où b est un entier impair et a un réel tel que 0 < a < 1 et ab > 1 + (3/2)π. Godefrey Harold Hardy a d’ailleurs montré en 1916 que la dernière condition pouvait être remplacée par ab ≥ 1. De nombreux autres exemples ont alors été proposés. Le graphe de telles fonctions constitue un ensemble fractal dans la terminologie de Benoı̂t Mandelbrot. Après n’avoir été pendant de nombreuses années que des “monstres mathématiques”, ces ensembles, souvent caractérisés par des propriétés d’auto-similarité quelle que soit l’échelle à laquelle on les examine, sont depuis quelques années l’objet d’un intérêt croissant et leur champ d’application aux sciences de la nature ne cesse d’augmenter. Felix Hausdorff a introduit en 1919 une notion de dimension qui redonne respectivement, pour les courbes, surfaces ou volumes “réguliers”, les valeurs usuelles un, deux ou trois mais attribue, aux ensembles fractals, des valeurs non entières! On sait que la dimension de Hausdorff du graphe de la fonction de Weierstrass est strictement comprise entre un et deux, mais on ignore toujours sa valeur exacte. 12.5 Somme d’une série entière % Soit k∈N ck (z − a)k une série entière, avec z ∈ C, a ∈ C, , ck ∈ C pour chaque k ∈ N. Si R = 1/C avec , 8 C = lim sup |ck | q→∞ k≥q 1/k 9 - , désigne le rayon de convergence de cette série entière, elle convergera absolument sur son disque de convergence B2 (a; R), avec la convention B2 (a; R) = {a} si R = 0 et B2 (a; R) = C si R = +∞. On peut évidemment con% sidérer aussi cette série comme une série k∈N fk de fonctions complexes d’une variable complexe fk définies par fk (z) = ck (z − a)k . On la notera 454 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS % % alors k∈N ck (· − a)k . L’exemple de la série géométrique k∈N z k considérée plus haut montre qu’une série entière peut ne pas converger uniformément sur son disque de convergence. On va montrer qu’elle converge normalement sur tout disque fermé centré en a et de rayon strictement inférieur au rayon de convergence. Proposition. Soit R le rayon de convergence de la série entière $ k∈N ck (z − a)k . Alors la série de fonctions correspondante converge absolument sur B2 (a; R) et normalement sur B2 [a; r] pour tout r ∈]0, R[. Démonstration. La convergence absolue sur B2 (a; R) n’est qu’une reformulation du théorème fondamental de convergence d’une série entière. Soit r ∈]0, R[; pour chaque k ∈ N, on a sup z∈B2 [a;r] |ck (z − a)k | = |ck |r k . % D’autre part, la série numérique k∈N |ck |r k est convergente en vertu du critère de la racine de Cauchy, puisque , 8 lim sup |ck |r q→∞ k≥q k 91/k - , 8 = r lim sup |ck | q→∞ k≥q 1/k 9 - = r < 1. R La thèse résulte alors du test de comparaison de Weierstrass. Etudions maintenant les propriétés de la somme d’une série entière sur son disque de convergence, c’est-à-dire les propriétés de l’application F : B2 (a; R) → C définie par F (z) = ∞ $ k=0 ck (z − a)k . Proposition. F est continue sur B2 (a; R). Démonstration. Notons tout d’abord que chaque terme fk de la série entière est un polynôme de C dans C et est donc continu sur C. Soit maintenant z ∈ B2 (a; R) fixé et r > 0 tel que |z − a| < r < R. Evidemment, z ∈ int B2 [a; r] et, puisque la série converge uniformément sur B2 [a; r], sa somme est continue sur cette boule et en particulier au point z. 455 12.5. SOMME D’UNE SÉRIE ENTIÈRE Considérant maintenant la série entière comme une série de fonctions de dans R2 , nous pouvons étudier l’existence des dérivées partielles de sa somme. Notons tout d’abord que chaque terme fk étant un polynôme sur C, il sera C-dérivable en chaque point de C et vérifiera les conditions de Cauchy-Riemann R2 D1 fk (z) = (1/i)D2fk (z) = fk$ (z) = kck (z − a)k−1 (12.5) pour chaque z ∈ C et chaque k ∈ N∗ . On notera que le dernier terme de ces égalités est le terme général de la série dérivée de la série entière de départ. Proposition. En chaque point z ∈ B2 (a; R), la somme F de la série entière k k∈N ck (z − a) possède des dérivées partielles premières qui vérifient les égalités % D1 F (z) = (1/i)D2F (z) = ∞ $ k=1 kck (z − a)k−1 . Démonstration. Pour appliquer le théorème de dérivabilité de la somme d’une série de fonctions, il suffit de remarquer que la série entière considérée converge ponctuellement sur B2 (a; R), que chaque terme fk possède en chaque point z ∈ C des dérivées partielles premières par rapport à toutes les variables vérifiant les conditions (12.5) et que les séries des dérivées partielles % qui sont respectivement égales à la série dérivée de k∈N ck (z − a)k et au produit de cette série par 1/i ont le même rayon de convergence R que la série % k k∈N ck (z − a) et convergent donc normalement sur B2 [a; r] quel que soit r ∈]0, R[. Dès lors, pour obtenir la dérivabilité partielle de F en z ∈ B2 (a; R), % il suffit d’appliquer le théorème général à la série k∈N ck (z −a)k sur l’ouvert B2 (a, r) où r ∈]0, R[ est tel que |z − a| < r. On a aussitôt D1 F (z) = ∞ $ D1 fk (z) = k=1 = ∞ $ (1/i)D2fk (z) = (1/i)D2 k=1 et la démonstration est complète. ∞ $ k=1 , ∞ $ k=1 kck (z − a)k−1 - fk (z) = (1/i)D2F (z), Corollaire. En chaque point z ∈ B2 (a; R), la somme F de la série entière % k C-dérivable et sa C-dérivée F $ (z) est égale à la valeur en z k∈N ck (z−a) est% k−1 . La fonction F est dès lors indéfiniment de la série dérivée ∞ k=1 kck (z−a) 456 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS C-dérivable et, pour chaque j ∈ N∗ , on a F (j) (z) = ∞ $ k=j k(k − 1) . . .(k − j + 1)ck (z − a)k−j . Démonstration. C’est une conséquence immédiate de la Proposition précédente, de la condition nécessaire et suffisante de C-dérivabilité de Fréchet-Young et du fait que le rayon de convergence reste le même quand on passe d’une série entière à sa série dérivée. Ainsi, la fonction exponentielle exp de C dans C définie pour chaque z ∈ C comme somme de la série exponentielle de z est C-dérivable en chaque point z de C et (exp)$ (z) = exp z. De même, la fonction sinus (resp. cosinus) sin (resp. cos) de C dans C définie en chaque z ∈ C par la somme de la série sinus (resp. cosinus) est C-dérivable en chaque z ∈ C et (sin)$ (z) = cos z (resp. (cos)$ (z) = − sin z). Si α, β et γ sont des nombres complexes et si γ n’est pas un entier strictement négatif, la somme de la série hypergéométrique 1+ $ α(α + 1) . . . (α + k − 1)β(β + 1) . . .(β + k − 1) k∈N∗ k!γ(γ + 1) . . .(γ + k − 1) zk , définit sur son disque de convergence B2 (0; 1) une fonction indéfiniment Cdérivable que l’on appelle la fonction hypergéométrique et dont la valeur en z ∈ B2 (0; 1) est notée F (α, β; γ; z). Désignons par C(a; R) la frontière du disque B2 (a; R), c’est-à-dire l’ensemble {z ∈ C : |z − a| = R}. Le résultat suivant, qui porte le nom de théorème d’Abel, fournit des compléments d’information sur la convergence d’une série entière et sur la régularité de sa somme lorsqu’il y a convergence en un point de C(a; R). % Proposition. Si la série entière k∈N ck (z − a)k possède un rayon de con% vergence R > 0 et s’il existe u ∈ C(a; R) tel que la série k∈N ck (u − a)k % converge, alors la série k∈N ck (.−a)k converge uniformément sur l’ensemble [a, u] = {a + t(u − a) : t ∈ [0, 1]} et, si F désigne sa somme sur B2 (a; R), alors lim z→u,z∈[a,u]\{u} F (z) = ∞ $ k=0 ck (u − a)k . Démonstration. Pour démontrer la convergence uniforme de la série sur [a, u], on utilise le critère de Cauchy et la transformation d’Abel. Si nous 457 12.5. SOMME D’UNE SÉRIE ENTIÈRE % posons, pour chaque q ∈ N, Sq = qk=0 ck (u − a)k , alors, en notant que ck (u − a)k = Sk − Sk−1 pour k ≥ 1, nous obtenons, pour tout r > q ≥ 0, r $ k=q+1 = r $ ck [a + t(u − a) − a]k = k=q+1 = r $ k=q+1 = r−1 $ k=q+1 = r−1 $ k=q+1 tk (Sk − Sk−1 ) = tk Sk − r−1 $ tk+1 Sk = k=q (Sk − Sq )(tk − tk+1 ) + r−1 $ k=q+1 k=q+1 r−1 $ k=q+1 (Sk − Sq )(tk − tk+1 ) + = r $ r−1 $ k=q+1 k=q+1 ck tk (u − a)k tk Sk − r $ tk Sk−1 k=q+1 Sk (tk − tk+1 ) + Sr tr − Sq tq+1 k=q+1 r−1 $ r $ Sq (tk − tk+1 ) + Sr tr − Sq tq+1 Sq tk − r−1 $ k=q+1 Sq tk+1 + Sr tr − Sq tq+1 (Sk − Sq )(tk − tk+1 ) + (Sr − Sq )tr . % Par hypothèse, la suite (Sq )q∈N des sommes partielles de k∈N ck (u − a)k converge et est donc de Cauchy; pour ! > 0 donné, il existe donc m ∈ N ne dépendant que d’! tel que |Sk − Sq | ≤ !/2 si k ≥ q ≥ m. Dès lors, en introduisant cette inégalité dans l’égalité ci-dessus et en notant que 0 ≤ tk − tk+1 = tk (1 − t) ≤ 1 et 0 ≤ tr ≤ 1, on obtient # # # r # r−1 $ # $ # k# # ck [a + t(u − a) − a] # ≤ |Sk − Sq |(tk − tk+1 ) + |Sr − Sq |tr # #k=q+1 # k=q+1 ≤ (!/2) r−1 $ k=q+1 (tk − tk+1 ) + (!/2) = (!/2)(tq+1 − tr ) + (!/2) = (!/2)[tq+1 (1 − tr−q−1 ) + 1] ≤ !. 458 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS En conséquence, il existe m ∈ N tel que, pour tout r > q ≥ m et tout z ∈ [a, u], on ait # # # $ # # r # k# # c (z − a) k # # ≤ !, #k=q+1 # ce qui implique la convergence uniforme de la série entière sur [a, u]. La restriction à [a, u] de chaque terme de la série y étant continue, l’application % G définie sur [a, u] par G(z) = k∈N ck (z − a)k sera continue sur [a, u]. Mais comme [a, u] \ {u} ⊂ B2 (a; R), on a nécessairement G(z) = F (z) pour tout z ∈ [a, u] \ {u}, et dès lors ∞ $ k=0 ck (u − a)k = G(u) = lim z→u,z∈[a,u]\{u} G(z) = lim z→u,z∈[a,u] G(z) = lim z→u,z∈[a,u]\{u} F (z), et la démonstration est complète. 12.6 Equations différentielles linéaires Les propriétés des séries entières permettent de rechercher des solutions de certaines équations différentielles linéaires à coefficients variables. A titre d’exemple, considérons l’équation différentielle d’Hermite y $$ (z) − 2zy $ (z) + 2νy(z) = 0, où ν est un nombre réel, et voyons si elle possède des solutions qui peuvent s’écrire comme somme d’une série entière dont le disque de convergence n’est pas réduit à un point. Si y(z) = ∞ $ ck z k k=0 est une telle solution, alors on aura, par les résultats de la section précédente, y $ (z) = ∞ $ kck z k−1 , y $$ (z) = k=1 ∞ $ k=2 (k − 1)kck z k−2 , et, en introduisant ces expressions dans l’équation on obtient ∞ $ k=2 (k − 1)kck z k−2 − 2 ∞ $ k=1 kck z k + 2ν ∞ $ k=0 ck z k = 0, 459 12.6. EQUATIONS DIFFÉRENTIELLES LINÉAIRES c’est-à-dire, en regroupant les coefficients des termes de même puissance de z, 2(c2 + νc0 ) + ∞ $ k=1 [(k + 1)(k + 2)ck+2 − 2(k − ν)ck ]z k = 0. Cette relation sera évidemment satisfaite si les ck sont tels que (k + 1)(k + 2)ck+2 = 2(k − ν)ck , (k ∈ N). Partant d’un c0 arbitraire et résolvant de proche en proche, on obtient c2k = 2k (−ν)(2 − ν)(4 − ν) . . . (2k − 2 − ν) c0 , (k ∈ N∗ ) (2k)! et c2k+1 = 2k (1 − ν)(3 − ν) . . . (2k − 1 − ν) c1 , (k ∈ N∗ ). (2k + 1)! Posant u = z 2 , il est facile de voir que ces deux séries convergent pour tout z ∈ C. Par conséquent, les calculs précédents sont justifiés pour ces séries et chaque fonction de la forme cj yj où cj ∈ C est arbitraire et, j = 1, 2, y1 est la somme de la série entière y1 (z) = 1 + ∞ k $ 2 (−ν)(2 − ν)(4 − ν) . . . (2k − 2 − ν) k=1 (2k)! z 2k et y2 est la somme de la série entière y2 (z) = 1 + ∞ k $ 2 (1 − ν)(3 − ν) . . . (2k − 1 − ν) k=1 (2k + 1)! z 2k+1 , est une solution de l’équation différentielle donnée définie sur C. Il en est dès lors de même pour c1 y1 + c2 y2 . Lorsque ν est un entier positif, il est immédiat que l’une des fonctions yj se réduit à un polynôme en z, que l’on appelle polynôme d’Hermite et qui joue un grand rôle en analyse. La méthode peut encore fournir des solutions de ce type pour des équations différentielles linéaires singulières en 0, c’est-à-dire dont le coefficient de la dérivée d’ordre le plus élevé s’annule en z = 0. Par exemple, si a et b sont des nombres complexes tels que a ne soit pas nul et b ne soit pas égal à un entier négatif, considérons l’équation différentielle zy $$ (z) + (b − z)y $ (z) − ay(z) = 0 460 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS et recherchons ses solutions pouvant s’écrire sous la forme de la somme d’une série entière y(z) = ∞ $ ck z k . k=0 Procédant comme ci-dessus, on trouve, en introduisant cette expression dans l’équation différentielle et en regroupant les coefficients des mêmes puissances de z que l’on doit avoir ∞ $ k=0 [(k + 1)(k + b)ck+1 − (k + a)ck ]z k = 0, ce qui sera le cas si les coefficients ck vérifient les relations ck+1 = a+k ck , k ∈ N, (b + k)(k + 1) qui fournissent aisément l’expression ck = (a + k − 1)(a + k − 2) . . .a c 0 , k ∈ N∗ . k!(b + k − 1)(b + k − 2) . . . b On vérifie aisément que la série entière $ (a + k − 1)(a + k − 2) . . .a k!(b + k − 1)(b + k − 2) . . . b k∈N zk a un disque de convergence égal à C et dès lors sa somme, que l’on appelle la fonction hypergéométrique confluente de Kummer et que l’on désigne par M (a, b; z) est telle que, pour chaque c ∈ C, cM (a, b; ·) est une solution sur C de l’équation différentielle donnée. On peut montrer de la même manière que, pour chaque n ∈ N fixé, l’équation différentielle de Bessel z 2 y $$ (z) + zy $ (z) + (z 2 − n2 )y(z) = 0 possède les solutions cy où c ∈ C est arbitraire et y est la somme de la série entière $ (−1)k z n+2k , n+2k k!(n + k)! 2 k∈N dont le disque de convergence est égal à C. La fonction définie par la somme de cette série entière s’appelle la fonction de Bessel d’ordre n et se note Jn . On vérifiera aisément qu’on a la relation J0$ (z) = −J1 (z). 461 12.7. SOMME D’UNE SÉRIE TRIGONOMÉTRIQUE Les fonctions de Bessel jouent un grand rôle en analyse et dans ses applications à la physique. Une équation différentielle linéaire importante est l’équation hypergéométrique de Gauss z(1 − z)y $$ (z) + [γ − (α + β + 1)z]y $ (z) − αβy(z) = 0 où α, β et γ sont des nombres complexes. La méthode que nous venons de développer permet de montrer que si γ n’est pas un entier négatif, la somme F (α, β; γ; z) de la série hypergéométrique 1+ $ α(α + 1) . . . (α + k − 1)β(β + 1) . . .(β + k − 1) k!γ(γ + 1) . . .(γ + k − 1) k∈N∗ zk , est solution, sur son disque de convergence B2 (0, 1), de l’équation hypergéométrique de Gauss. En fait, pour des valeurs particulières de α, β et γ, la série hypergéométrique fournit comme cas particulier ou comme cas limite la plupart des fonctions élémentaires et de nombreuses fonctions transcendantes comme par exemple les fonctions de Bessel et les fonctions de Kummer considérées plus haut. Carl-Friedrich Gauss a démontré l’importante formule F (α, β, γ; 1) = Γ(γ)Γ(γ − α − β) , si 8(γ − α − β) > 0, Γ(γ − α)Γ(γ − β) reliant la valeur de la somme de la série hypergéométrique au point 1 de la frontière de son disque de convergence à la fonction Γ. 12.7 Somme d’une série trigonométrique On a vu précédemment qu’une série trigonométrique est une série de la forme $ (ak cos kx + bk sin kx) k∈N où x ∈ R et les ak et bk sont des nombres réels. Bien entendu, une série trigonométrique peut également s’écrire sous la forme complexe $ [c−k exp(−ikx) + ck exp ikx] k∈N avec c−k = (1/2)(ak + ibk ) = ck , k ∈ N, 462 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS ce qui conduit aussi à considérer les séries trigonométriques complexes quelconques $ [c−k exp(−ikx) + ck exp ikx] k∈N où les c−k et ck sont des nombres complexes arbitraires. On a vu que de telles séries trigonométriques apparaissaient lorsqu’on étudiait la convergence d’une série entière sur la frontière de son disque de convergence. Une série trigonométrique peut évidemment être considérée comme une série % de fonctions k∈N fk où les fonctions fk définies par fk (x) = c−k exp(−ikx) + ck exp ikx sont indéfiniment dérivables et 2π-périodiques sur R, c’est-à-dire telles que fk (x + 2π) = fk (x) pour tout x ∈ R. On ne dispose pas, comme pour les séries entières, de résultat général pour la convergence uniforme des séries trigonométriques. Toutefois, les résultats généraux sur la continuité et la dérivabilité des sommes de séries de fonctions fournissent les conditions suffisantes suivantes. % Proposition. Si la série numérique k∈N(|ak | + |bk |) (resp. |ck |) converge, alors la série de fonctions $ % k∈N (|c−k | + [ak cos(k·) + bk sin(k·)] k∈N (resp. $ k∈N [c−k exp(−ik·) + ck exp(ik·)]) converge normalement sur R et sa somme est une fonction continue et 2πpériodique sur R. Démonstration. Si nous considérons, pour fixer les idées, le premier cas, l’autre se traitant de même, nous voyons que, pour chaque k ∈ N et chaque x ∈ R, on a |fk (x)| = |ak cos kx + bk sin kx| ≤ |ak | + |bk |, et la convergence normale sur R découle de l’hypothèse et du test de comparaison de Weierstrass. Comme la convergence normale entraı̂ne la convergence uniforme sur R de la série et que chaque fk est continue sur R, sa somme sera également continue sur R. Enfin, la convergence ponctuelle sur R et les égalités Fq (x + 2π) = Fq (x) valables pour chaque x ∈ R et chaque somme partielle Fq entrainent la propriété de 2π-périodicité pour la somme de la série. 463 12.7. SOMME D’UNE SÉRIE TRIGONOMÉTRIQUE Exemple. Pour chaque réel s > 1, la série trigonométrique $ k−s [cos(k·) + sin(k·)] k∈N∗ converge normalement sur R vers une fonction continue et 2π-périodique. On a la condition suffisante suivante de dérivabilité de la somme d’une série trigonométrique. Proposition. S’il existe un entier m ≥ 1 tel que la série numérique $ k∈N (resp. $ k∈N km (|ak | + |bk |) km (|c−k | + |ck |)) converge, alors la somme F de la série trigonométrique $ [ak cos(k·) + bk sin(k·)] k∈N (resp. $ k∈N [c−k exp(−ik·) + ck exp(ik·)]) est m-fois continûment dérivable sur R et, pour chaque x ∈ R, et chaque 1 ≤ j ≤ m, la dérivée j-ème s’obtient en dérivant j fois sous le signe somme. Démonstration. Il est aisé de voir que le résultat pour m ≥ 2 découle aisément, par récurrence, du résultat pour m = 1 et il suffit de démontrer ce dernier. Nous le ferons dans le cas d’une série trigonométrique réelle. Pour chaque k ∈ N, et chaque x ∈ R, on a |fk$ (x)| = | − kak sin kx + kbk cos kx| ≤ k(|ak | + |bk |), et un argument semblable à celui de la Proposition précédente montre que la % série k∈N fk$ converge normalement sur R et que sa somme est une fonction continue. D’ailleurs, comme |ak | + |bk | ≤ k(|ak | + |bk |) % pour tout k ∈ N , la Proposition précédente montre que la série k∈N fk converge aussi normalement sur R. Les conditions du théorème de dérivabilité de la somme d’une série de fonctions sont donc satisfaites. Donc F est dérivable sur R et ∗ F $ (x) = ∞ $ k=0 fk$ (x), 464 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS ce qui montre que F est continûment dérivable et achève la démonstration. Exemple. Si s > 2, la somme de la série trigonométrique $ k−s [cos(k·) + sin(k·)] k∈N∗ est m-fois continûment dérivable sur R, où m désigne la partie entière de s − 1. 12.8 Convergence monotone Soit (fk )k∈N une suite de fonctions réelles définies sur E ⊂ Rn . Définition. On dit que (fk )k∈N est une suite croissante (resp. décroissante) sur E de fonctions réelles si, pour chaque x ∈ E, la suite réelle (fk (x))k∈N est croissante (resp. décroissante), c’est-à-dire si, pour chaque x ∈ E et chaque k ∈ N, on a fk+1 (x) ≥ fk (x). (resp. fk+1 (x) ≤ fk (x)). Une suite de fonctions réelles sur E qui est croissante ou qui est décroissante est appelée une suite monotone sur E de fonctions réelles. Bien entendu, (fk )k∈N est croissante si et seulement si (−fk )k∈N est décroissante. Définition. On dit que (fk )k∈N est une suite majorée (resp. minorée) sur E de fonctions réelles s’il existe une application g de E dans R telle que, pour chaque k ∈ N et chaque x ∈ E, on ait fk (x) ≤ g(x). (resp. fk (x) ≥ g(x)). Il est clair que (fk )k∈N est minorée sur E si et seulement si (−fk )k∈N est majorée sur E et que (fk )k∈N est majorée (resp. minorée) sur E si et seulement si la suite réelle (fk (x))k∈N est majorée (resp. minorée) pour chaque x ∈ E. En combinant cette remarque à la condition nécessaire et suffisante de convergence d’une suite réelle monotone, on obtient immédiatement un critère de convergence ponctuelle d’une suite monotone de fonctions réelles. Proposition. Une suite croissante (resp. décroissante) sur E de fonctions réelles converge ponctuellement sur E si et seulement si elle est majorée (resp. minorée) sur E. On a vu plus haut que la convergence uniforme sur un ensemble était une condition suffisante pour que la continuité des fonctions de la suite se 12.8. CONVERGENCE MONOTONE 465 transmette à la fonction limite. L’exemple de la suite (fk )k∈N de fonctions continues définies par 1 fk (x) = 1 + (x − k)2 qui converge ponctuellement (mais non uniformément) sur R vers la fonction continue zéro montre que la convergence uniforme n’est pas nécessaire pour que la limite soit continue. Le théorème de Dini ou théorème de convergence monotone pour les fonctions continues montre que lorsque E est fermé borné et que la suite est monotone, la convergence uniforme est une condition nécessaire et suffisante pour que la limite d’une suite de fonctions continues sur E soit continue sur E. Théorème. Soit E ⊂ Rn un fermé borné, (fk )k∈N une suite de fonctions réelles définies sur E et f une application de E dans R vérifiant les conditions suivantes. 1. La suite (fk )k∈N converge ponctuellement sur E vers f . 2. Chaque fonction fk est continue sur E. 3. La suite (fk )k∈N est monotone sur E. Alors f est continue sur E si et seulement si (fk )k∈N converge uniformément sur E vers f . Démonstration. Condition suffisante. C’est une conséquence immédiate de la préservation de la continuité par la convergence uniforme. Condition nécessaire. On peut, sans perte de généralité, supposer que (fk )k∈N est croissante. On a donc fq (x) ≥ fk (x), pour chaque entier q ≥ k et chaque x ∈ E, ce qui entraı̂ne, en faisant tendre q vers l’infini, que f (x) ≥ fk (x) pour chaque entier k ∈ N et chaque x ∈ E. Si ! > 0 est donné, l’hypothèse 1 entraı̂ne que (∀x ∈ E)(∃m ∈ N)(∀k ∈ N : k ≥ m) : 0 ≤ f (x) − fk (x) ≤ !/2. (12.6) Pour chaque x ∈ E, désignons par m(x) le plus petit entier positif m pour lequel la condition (12.6) est satisfaite. L’hypothèse 2, la continuité de f sur E, le caractère fermé borné de E et le théorème de Heine entraı̂nent la continuité uniforme de chaque fonction f − fk sur E. En conséquence, (∀k ∈ N)(∃δk > 0)(∀x ∈ E)(∀y ∈ E : |y − x|∞ ≤ δk ) : 0 ≤ f (y) − fk (y) ≤ f (x) − fk (x) + !/2. Si nous définissons la jauge δ sur E par la relation δ(x) = δm(x) , x ∈ E, (12.7) 466 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS A le théorème de Cousin entraı̂ne l’existence d’une division (xj , E j ) telle que q > j=1 B (1≤j≤q) E j = E, xj ∈ E j ⊂ B∞ [xj ; δ(xj )] = B∞ [xj ; δm(xj ) ], 1 ≤ j ≤ q. Posons m = max m(xj ), 1≤j≤q et soit y ∈ E. Il existe donc un entier j compris entre 1 et q tel que y ∈ E j et donc tel que y ∈ B∞ [xj ; δm(xj ) ]. En conséquence, en utilisant (12.6), (12.7) et la croissance de (fk )k∈N , on trouve, pour tout k ≥ m, 0 ≤ f (y) − fk (y) ≤ f (y) − fm(xj ) (y) ≤ f (xj ) − fm(xj ) (xj ) + !/2 ≤ !/2 + !/2 = !, et la démonstration est complète. % En se rappelant que la suite des sommes partielles d’une série k∈N fk de fonctions fk positives sur un ensemble E dès que k ≥ 1 est nécessairement croissante sur E, on a évidemment une formulation du théorème de Dini pour ce type de séries. % Corollaire. Soit E ⊂ Rn un fermé borné, k∈N fk une série de fonctions définies sur E et F une application de E dans R vérifiant les conditions suivantes. % 1. La série k∈N fk converge ponctuellement sur E vers F . 2. Chaque fonction fk est continue sur E. 3. fk est positive sur E pour chaque k ≥ 1. % Alors F est continue sur E si et seulement si k∈N fk converge uniformément sur E vers F . On possède, pour une suite monotone de fonctions intégrables, un théorème dont la forme est analogue à celle du théorème de Dini. C’est l’important théorème de Levi ou théorème de convergence monotone pour les fonctions intégrables. Théorème. Soit I ⊂ Rn un semi-pavé, (fk )k∈N une suite de fonctions réelles définies sur I¯ et f une application de I¯ dans R vérifiant les conditions suivantes. 1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f . ¯ 2. Chaque fonction fk est intégrable sur I. 467 12.8. CONVERGENCE MONOTONE ¯ 3. La suite (fk )k∈N est monotone sur I. H ¯ Alors f est intégrable sur I si et seulement si la suite réelle ( I¯ fk )k∈N converge, auquel cas l’on a J I¯ c’est-à-dire J f = lim J k→∞ I¯ fk , lim fk = lim I¯ k→∞ J k→∞ I¯ fk . Démonstration. Sans perte de généralité, on peut supposer que la suite ¯ auquel cas on a évidemment (fk )k∈N est croissante sur I, fk (x) ≤ fk+1 (x) ≤ f (x) ¯ pour chaque k ∈ N et chaque x ∈ I. ¯ l’inégalité ci-dessus enCondition nécessaire. Si f est intégrable sur I, traı̂ne aussitôt que J I¯ H fk ≤ J I¯ fk+1 ≤ J I¯ f. Dès lors, la suite réelle ( I¯ fk )k∈N , croissante et majorée, est convergente. H Condition suffisante. Par hypothèse, la suite réelle ( I¯ fk )k∈N est croissante et convergente, et nous poserons J = lim J k→∞ I¯ fk . Il faut donc démontrer que f est intégrable sur I¯ et que son intégrale vaut J. En d’autres termes, ! > 0 étant donné, il faut construire une jauge δ sur I¯ pour laquelle la définition d’intégrabilité sur I¯ est satisfaite pour f . Soit donc ! > 0 donné. Il existera un entier naturel q1 tel que, pour tout entier k ≥ q1 , on ait 0≤J− J I¯ fk ≤ !/3. D’autre part, puisque la suite (fk )k∈N converge ponctuellement sur I¯ vers f , on aura ¯ (∀x ∈ I)(∃q(x) ∈ N, q(x) ≥ q1 )(∀k ∈ N : k ≥ q(x)) : ! |fk (x) − f (x)| ≤ . 3µ(I) (12.8) 468 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS Si maintenant Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition quelconque de I, on aura # # #m # #$ # j j j |S(I, f, Π) − J| ≤ ## [f (x ) − fq(xj ) (x )]µ(I )## #j=1 # # # # # #m 2 # 3# # $ J m J #$ # # # + ## fq(xj ) (xj )µ(I j ) − fq(xj ) ## + ## fq(xj ) − J ## . I¯j #j=1 # # #j=1 I¯j Comme # # #$ # $ m #m # j j j # [f (x ) − f j (x )]µ(I )# ≤ |f (xj ) − fq(xj ) (xj )|µ(I j ) q(x ) # # #j=1 # j=1 ≤ et que, si m ! $ µ(I j ) = !/3 3µ(I) j=1 r = min q(xj ), s = max q(xj ), 1≤j≤m 1≤j≤m on a q1 ≤ r ≤ s et donc, en utilisant la croissance de (fk )k∈N, 0≤J− ≤J− on obtient m J $ ¯j j=1 I J I¯ fs = J − fq(xj ) ≤ J − m J $ ¯j j=1 I m J $ ¯j j=1 I fs fr = J − J I¯ fr ≤ !/3, # # #m 2 3# J #$ # |S(I, f, Π) − J| ≤ 2!/3 + ## fq(xj ) (xj )µ(I j ) − fq(xj ) ## . I¯j #j=1 # Il nous reste maintenant à construire une jauge δ sur I¯ telle que le dernier terme de l’inégalité soit majoré par !/3 lorsque la P-partition Π est δ-fine. Pour ce faire, notons que si nous groupons dans la somme ci-dessus les termes pour lesquels les q(xj ) sont égaux à une même valeur k, nous obtenons, # # #m 2 3# J #$ # # fq(xj ) (xj )µ(I j ) − fq(xj ) ## # j ¯ I #j=1 # 469 12.8. CONVERGENCE MONOTONE # # # s 2 3# J $ #$ # = ## fk (xj )µ(I j ) − fk ## j I¯ #k=r {1≤j≤m : q(xj )=k} # # # 2 3# J s ## $ $ # # ≤ fk (xj )µ(I j ) − fk ## . # j ¯ I # k=r #{1≤j≤m : q(xj )=k} Puisque chaque somme partielle regroupe tous les indices q(xj ) ayant la même valeur k, on peut lui appliquer le lemme de Saks-Henstock relatif à la ¯ il existera fonction fk . Comme, pour chaque k ∈ N, fk est intégrable sur I, une jauge ηk sur I¯ telle que # # J # # #S(I, fk , Πk ) − fk # ≤ 1 # ¯ # 2k I pour toute P-partition ηk -fine Πk de I. Choisissons un entier positif q2 tel que l $ 1 ≤ !/3 2j j=k dès que l ≥ k ≥ q2 . C’est toujours possible en vertu du critère de Cauchy % appliqué à la série géométrique convergente k∈N (1/2)k. Choisissons main¯ le plus petit entier q(x) ≥ max(q1 , q2 ) qui vérifie tenant, pour chaque x ∈ I, la relation (12.8) et définissons la jauge δ sur I¯ par la relation ¯ δ(x) = ηq(x)(x), x ∈ I. Si la P-partition Π = {(x1 , I 1), . . . , (xm, I m)} est δ-fine, alors chaque famille {(xj , I j ) : q(xj ) = k, 1 ≤ j ≤ m} sera telle que I j ⊂ B∞ [xj ; δ(xj )] = B∞ [xj ; ηq(xj ) (xj )] = B∞ [xj ; ηk (xj )], et, par le lemme de Saks-Henstock, on aura # # # 2 3# J $ # # j j # fq(xj )(x )µ(I ) − fq(xj ) ## # I¯j #{1≤j≤m : q(xj )=k} # # # # 2 3# J $ # # 1 j j = ## fk (x )µ(I ) − fk ## ≤ k , j ¯ 2 I # #{1≤j≤m : q(xj )=k} 470 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS et par conséquent, # # 2 3# J s # $ $ # # # fq(xj ) (xj )µ(I j ) − fq(xj ) ## # I¯j # k=r #{1≤j≤m : q(xj )=k} ≤ On aura donc dès que Π est δ-fine. s $ 1 k=r 2k ≤ !/3. |S(I, f, Π) − J| ≤ 2!/3 + !/3 = !, Le théorème de Levi est vrai pour la L-intégrabilité. Corollaire. Soit I ⊂ Rn un semi-pavé, (fk )k∈N une suite de fonctions réelles définies sur I¯ et f une application de I¯ dans R vérifiant les conditions suivantes. 1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f . ¯ 2. Chaque fonction fk est L-intégrable sur I. ¯ 3. La suite (fk )k∈N est monotone sur I. H Alors f est L-intégrable sur I¯ si et seulement si la suite réelle ( I¯ fk )k∈N converge, auquel cas l’on a J I¯ c’est-à-dire J f = lim J k→∞ I¯ lim fk = lim I¯ k→∞ fk , J k→∞ I¯ fk . Démonstration. Supposons pour fixer les idées que (fk )k∈N soit croissante ¯ La condition nécessaire se démontre exactement de la même manière. sur I. Pour la condition suffisante, notons tout d’abord que la croissance de la suite (fk )k∈N entraı̂ne la positivité des fonctions fk − f0 . D’autre part, la suite (fH k − f0 )k∈N vérifie les conditions 1 àH3 du théorème de Levi et la suite réelle ( I¯(fk − f0 ))k∈N converge vers J − I¯ f0 . Le théorème de Levi appliqué à cette suite entraı̂ne l’intégrabilité de sa limite f − f0 qui est une fonction ¯ Donc f − f0 est L-intégrable sur I¯ et comme f0 l’est aussi positive sur I. par hypothèse, il en est de même de f = (f − f0 ) + f0 . En remarquant que les sommes partielles d’une série de fonctions fk intégrables sur I¯ forment une suite croissante de fonctions intégrables sur I¯ si elles sont positives pour k ≥ 1, on déduit facilement des résultats précédents un théorème de convergence monotone de Levi pour les séries de fonctions intégrables positives. 471 12.8. CONVERGENCE MONOTONE % Corollaire. Soit I ⊂ Rn un semi-pavé, k∈N fk une série de fonctions réelles définies sur I¯ et F une application de I¯ dans R vérifiant les conditions suivantes. % 1. La série k∈N fk converge ponctuellement sur I¯ vers F . ¯ 2. Chaque fonction fk est intégrable (resp. L-intégrable) sur I. 3. fk est positive sur I¯ pour chaque k ≥ 1. Alors F est Hintégrable (resp. L-intégrable) sur I¯ si et seulement si la série % réelle k∈N I¯ fk converge, auquel cas l’on a J I¯ c’est-à-dire F = J $ ∞ I¯ k=0 ∞ J $ ¯ k=0 I fk = fk , ∞ J $ ¯ k=0 I fk . On a également un théorème de convergence monotone de Levi pour l’intégrabilité sur un intervalle non borné de R. Corollaire. Soit U un intervalle non borné de R, (fk )k∈N une suite de fonctions réelles définies sur U et f une application de U dans R vérifiant les conditions suivantes. 1. La suite (fk )k∈N converge ponctuellement sur U vers f . 2. Chaque fonction fk est intégrable sur U . 3. La suite (fk )k∈N est monotone sur U . H Alors f est intégrable sur U si et seulement si la suite réelle ( U fk )k∈N converge, auquel cas l’on a J f = lim U c’est-à-dire J J k→∞ U lim fk = lim U k→∞ fk , J k→∞ U fk . Démonstration. Sans perte de généralité, on peut supposer que la suite (fk )k∈N est croissante sur U et, en considérant (fk −f0 )k∈N au lieu de (fk )k∈N, on peut supposer que chaque fonction fk est positive sur U . Enfin, on se limitera au cas où U = [a, +∞[, les autres se traitant de même. La condition nécessaire se démontre comme dans le cas classique. Pour la condition suffisante, il faut donc prouver que f Hest intégrable sur [a,H b] pour chaque b > a et que, si l’on pose J = limk→∞ U fk , alors limb→+∞ ab f = J. 472 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS H Soit donc b > a;Hla suite réelle ( ab fk )k∈N est croissante et majorée par la suite convergente ( U fk )k∈N, donc est convergente, et le théorème de Levi appliqué à la restriction à [a, b] de la suite (fk )k∈N entraı̂ne son intégrabilité sur [a, b] et la relation J b J f = lim b k→∞ a a (12.9) fk . Pour chaque k ∈ N, l’intégrale indéfinie de fk est croissante sur U , puisque fk est positive sur U , et dès lors, pour tout b > a, on a J b J fk ≤ lim b b→+∞ a a fk = J U fk , ce qui implique, par (12.9), que, pour tout b > a, on a J b a J f ≤ lim k→∞ U fk = J. (12.10) Par conséquent, l’intégrale indéfinie de f , croissante sur U puisque f y est positive, est majorée, et possède donc une limite inférieure ou égale à J. Donc f est intégrable sur U et, pour tout b > a, on a J b a f≤ J (12.11) f ≤ J. U Il reste à montrer qu’on a en fait l’égalité. Soit ! > 0; comme fk = lim & J − (!/2) ≤ lim J J = lim J k→∞ U k→∞ il existera r ∈ N tel que lim J b b→+∞ a ' fk , b b→+∞ a fk ≤ J dès que k ≥ r. En particulier, il existera c ∈ U tel que, pour tout b ≥ c, on a J b H J −! ≤ a fr ≤ J. Comme la suite ( ab fk )k∈N est croissante et majorée par J, on aura donc, pour tout k ≥ r et tout b ≥ c, J −! ≤ J a b fk ≤ J, 12.9. CONVERGENCE MAJORÉE ET MINORÉE 473 ce qui implique, en faisant tendre k vers l’infini, et en utilisant (12.9), que J −! ≤ J a b f ≤J dès que b ≥ c, et la démonstration est complète. Nous laisserons au lecteur le soin de formuler le résultat correspondant pour une série de fonctions. 12.9 Convergence majorée et minorée On a vu dans la section précédente que la convergence ponctuelle sur E d’une suite monotone sur E de fonctions réelles pouvait se caractériser en termes de majoration ou de minoration sur E. Nous allons démontrer dans cette section un important résultat sur la conservation de l’intégrabilité (ou de la L-intégrabilité) de la limite d’une suite de fonctions intégrables qui n’est plus nécessairement monotone mais est maintenant minorée et majorée sur E. La démonstration de ce résultat repose sur le théorème de Levi et sur une étude préliminaire de la conservation de l’intégrabilité par passage au maximum ou au minimum de deux fonctions réelles intégrables. Rappelons que si f et g sont deux fonctions réelles, les fonctions max(f, g) et min(f, g) sont les fonctions réelles de domaine dom f ∩ dom g définies respectivement par max(f, g)(x) = max(f (x), g(x)), min(f, g)(x) = min(f (x), g(x)), et que l’extension se fait facilement, de proche en proche, à un nombre fini quelconque de fonctions. On vérifie facilement qu’on a aussi max(f, g) = (1/2)(f + g + |f − g|), min(f, g) = (1/2)(f + g − |f − g|). En particulier, min(f, g) = − max(−f, −g), et dès lors, si f et g sont intégrables sur un pavé fermé, min(f, g) le sera si et seulement si max(f, g) 474 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS l’est. On ne peut pas espérer que le maximum et le minimum de deux fonctions intégrables mais non L-intégrables sur un pavé fermé soient toujours intégrables sur ce pavé fermé, puisqu’un tel resultat appliqué à une fonction f intégrable mais non L-intégrable et à la fonction g = 0 entraı̂nerait l’intégrabilité de |f | = max(f, 0) − min(f, 0). Par contre, ces opérations préservent toujours la L-intégrabilité. Proposition. Si I est un semi-pavé de Rn et f et g des fonctions réelles ¯ alors max(f, g) et min(f, g) sont L-intégrables sur I. ¯ L-intégrables sur I, Démonstration. Par hypothèse, f + g et f − g sont L-intégrables sur I¯ et donc |f − g| l’est aussi. La thèse résulte alors des formules ci-dessus. On en déduit aisément une condition suffisante pour que l’intégrabilité soit préservée. Proposition. Si I est un semi-pavé de Rn et f, g et h sont des fonctions réelles intégrables sur I¯ telles que f et g soient toutes deux minorées ou ¯ alors max(f, g) et min(f, g) sont intégrables sur I¯ et majorées par h sur I, J I¯ max(f, g) ≥ max 4J I¯ f, J I¯ 5 J g , I¯ min(f, g) ≤ min 4J I¯ f, J I¯ 5 g . Démonstration. Par hypothèse, f − h et g − h sont de signe constant et intégrables sur I¯ et y sont donc L-intégrables. Il en est dès lors de même, par la proposition précédente, pour max(f − h, g − h) = max(f, g) − h et min(f − h, g − h) = min(f, g) − h, ce qui entraı̂ne aussitôt l’intégrabilité sur I¯ de max(f, g) et min(f, g). Les deux propositions ci-dessus s’étendent immédiatement à un nombre fini de fonctions et au cas de l’intégrale sur un intervalle non borné. Définition. Si f est une fonction réelle, on définit la partie positive f + de f par f + = max(f, 0) et la partie négative f − de f par f − = max(−f, 0) = − min(f, 0). En conséquence, f + et f − sont deux fonctions positives telles que f = f + − f − , |f | = f + + f − , f + = (1/2)(|f | + f ), f − = (1/2)(|f | − f ). Ces formules fournissent une intéressante caractérisation de la L-intégrabilité pour les fonctions réelles. 475 12.9. CONVERGENCE MAJORÉE ET MINORÉE Proposition. Soit I un semi-pavé de Rn et f une fonction réelle définie sur ¯ Alors f est L-intégrable sur I¯ si et seulement si f + et f − sont intégrables I. ¯ sur I. Démonstration. Cela résulte des égalités |f | = f + 2f − = 2f + − f et de la définition de L-intégrabilité. Corollaire. Soit I un semi-pavé de Rn et f une fonction réelle définie sur ¯ Si f est intégrable sur I¯ et n’est pas L-intégrable sur I, ¯ alors f + et f − I. ¯ ne sont pas intégrables sur I. Nous pouvons maintenant énoncer et démontrer l’important théorème de Lebesgue ou théorème de convergence majorée et minorée pour les suites de fonctions réelles intégrables. Théorème. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions réelles définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les conditions suivantes. 1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f . ¯ 2. Chaque fonction fk est intégrable sur I. 3. Il existe des fonctions réelles g et h intégrables sur I¯ et telles que g(x) ≤ fk (x) ≤ h(x) ¯ pour chaque k ∈ N et chaque x ∈ I. Alors f est intégrable sur I¯ et l’on a J I¯ c’est-à-dire J f = lim J k→∞ I¯ lim fk = lim I¯ k→∞ fk , J k→∞ I¯ fk . Démonstration. k et q étant des entiers naturels, posons φk,q = min(fk , fk+1 , . . ., fk+q ), Φk,q = max(fk , fk+1 , . . . , fk+q ). En vertu des hypothèses 2 et 3 et de la discussion qui précède, φk,q et Φk,q sont intégrables sur I¯ pour chaque entier naturel k et q et, par construction, ¯ on a, pour tout k, tout q ≥ 1 et tout x ∈ I, g(x) ≤ φk,q+1 (x) ≤ φk,q (x) ≤ φk+1,q−1 (x) ≤ fk+1 (x) ≤ Φk+1,q−1 (x) ≤ Φk,q (x) ≤ Φk,q+1 (x) ≤ h(x). (12.12) 476 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS Dès lors, pour chaque k ∈ N fixé, la suite de fonctions réelles (φk,q )q∈N (resp. ¯ et (Φk,q )q∈N) est décroissante et minorée (resp. croissante et majorée) sur I, ¯ elle converge donc ponctuellement sur I vers une application φk (resp. Φk ) de I¯ dans R. On déduit de (12.12), en faisant tendre q vers l’infini, que l’on a g(x) ≤ φk (x) ≤ φk+1 (x) ≤ fk+1 (x) ≤ Φk+1 (x) ≤ Φk (x) ≤ h(x), (12.13) pour chaque x ∈ I¯ et chaque k ∈ N. D’ailleurs, par intégration sur I¯ des inégalités (12.12), on voit que, pour chaque k ∈ N fixé, la suite réelle H H H ( I¯ φk,q )q∈N (resp. ( I¯ Φk,q )Hq∈N) est décroissante et minorée par I¯ g (resp. croissante et majorée par I¯ h), et est donc convergente. On peut donc appliquer le théorème de convergence monotone de Levi aux deux suites (φk,q )q∈N et (Φk,q )q∈N et en déduire, pour chaque k ∈ N, l’intégrabilité sur I¯ de φk et Φk et les relations lim J q→∞ I¯ φk,q = J I¯ φk , lim J q→∞ I¯ Φk,q = J I¯ Φk . (12.14) D’autre part, la relation (12.13) montre que la suite de fonctions (φk )k∈N (resp. (Φk )k∈N) est croissante et majorée par h (resp. décroissante et minorée ¯ En fait, on a, pour chaque par g), et donc ponctuellement convergente, sur I. ¯ x ∈ I, lim φk (x) = lim Φk (x) = lim fk (x) = f (x), k→∞ k→∞ k→∞ (12.15) ¯ l’hypothèse 1 entraı̂ne l’existence puisque, si ! > 0 est donné et si x ∈ I, d’un entier naturel m tel que f (x) − ! ≤ fk (x) ≤ f (x) + ! si k ≥ m. Par conséquent, pour tout k ≥ m et tout q ∈ N, on a aussi f (x) − ! ≤ φk,q (x) ≤ fk (x) ≤ Φk,q (x) ≤ f (x) + !, et dès lors, en faisant tendre q vers l’infini, on a, pour chaque k ≥ m, f (x) − ! ≤ φk (x) ≤ fk (x) ≤ Φk (x) ≤ f (x) + !, ce qui prouve (12.15). Par intégration sur I¯ des inégalités (12.13), on voit que H H la suite réelle ( I¯ φk )k∈N (resp. ( I¯ Φk )k∈N ) est croissante et majorée (resp. décroissante et minorée), et donc convergente. En appliquant le théorème 477 12.9. CONVERGENCE MAJORÉE ET MINORÉE de convergence monotone de Levi aux suites (φk )k∈N et (Φk )k∈N, on voit que f est intégrable sur I¯ et que, par suite de (12.15), J I¯ f = lim J k→∞ I¯ J φk = lim k→∞ I¯ Φk . Mais, en intégrant (12.13) sur I¯ et en passant à la limite, on trouve que J I¯ f = lim J k→∞ I¯ φk ≤ lim J k→∞ I¯ fk ≤ J I¯ Φk = J I¯ f, ce qui achève la démonstration. Remarque. Le théorème de convergence majorée et minorée de Lebesgue et sa démonstration restent valables pour l’intégration sur un intervalle non borné. Le théorème de convergence majorée et minorée de Lebesgue est vrai pour la L-intégrabilité, avec une conclusion un peu plus forte. Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions réelles définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les conditions suivantes. 1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f . ¯ 2. Chaque fonction fk est L-intégrable sur I. ¯ telles que 3. Il existe deux fonctions réelles g et h L-intégrables sur I, g(x) ≤ fk (x) ≤ h(x) ¯ pour chaque k ∈ N et chaque x ∈ I. ¯ Alors f est L-intégrable sur I et l’on a J I¯ c’est-à-dire J f = lim k→∞ I¯ lim fk = lim I¯ k→∞ et J lim J k→∞ I¯ fk , J k→∞ I¯ fk , |f − fk | = 0. ¯ En Démonstration. Par le théorème précédent, f est intégrable sur I. outre, l’hypothèse 3 entraı̂ne que g(x) ≤ f (x) ≤ h(x) 478 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS pour tout x ∈ I¯ et dès lors, f − g, positive et intégrable sur I¯ y est Lintégrable. Par conséquent, f = (f − g) + g est également L-intégrable sur ¯ Dès lors, la suite de fonctions (|f − fk |)k∈Nconverge ponctuellement sur I¯ I. vers zéro et est formée de fonctions L-intégrables sur I¯ telles que min(g − f, f − h)(x) ≤ |f (x) − fk (x)| ≤ max(h − f, f − g) ¯ avec min(g − f, f − h) et max(h − f, f − g) L-intégrables sur pour tout x ∈ I, ¯ I. Il suffit de lui appliquer le théorème de convergence majorée et minorée de Lebesgue pour obtenir la conclusion finale. Une conséquence de cette version du théorème de Lebesgue est ce que l’on appelle parfois le théorème de convergence dominée de Lebesgue pour des suites de fonctions pouvant avoir des valeurs vectorielles. Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions de Rn dans Rp définies sur I¯ et f une application de I¯ dans Rp . Supposons satisfaites les conditions suivantes. 1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f . ¯ 2. Chaque fonction fk est L-intégrable sur I. ¯ telle que 3. Il existe une fonction réelle g L-intégrable sur I, |fk (x)|2 ≤ g(x) ¯ pour chaque k ∈ N et chaque x ∈ I. ¯ Alors f est L-intégrable sur I et l’on a J I¯ c’est-à-dire J f = lim J k→∞ I¯ lim fk = lim I¯ k→∞ fk , J k→∞ I¯ fk . Démonstration. Il suffit de passer aux composantes des fk et de f et de noter que, pour chaque 1 ≤ j ≤ p, la suite des composantes (pj ◦ fk )k∈N et fj vérifient les conditions du Corollaire précédent, puisqu’on a |pj ◦ fk (x)| ≤ |fk (x)|2 ≤ g(x), et dès lors −g(x) ≤ pj ◦ fk (x) ≤ g(x), ¯ chaque k ∈ N et chaque 1 ≤ j ≤ p. pour chaque x ∈ I, 12.9. CONVERGENCE MAJORÉE ET MINORÉE 479 Remarque. Un cas particulier important du corollaire précédent est celui où, dans les hypothèse 3, g est une constante. On l’appelle parfois le théorème de convergence bornée de Lebesgue. Le théorème de Lebesgue permet de démontrer que la convergence uniforme préserve l’intégrabilité et la L-intégrabilité. Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions réelles définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les conditions suivantes. 1. La suite (fk )k∈N converge uniformément sur I¯ vers f . ¯ 2. Chaque fonction fk est intégrable (resp. L-intégrable) sur I. ¯ Alors f est intégrable (resp. L-intégrable) sur I et l’on a J I¯ c’est-à-dire J f = lim J k→∞ I¯ lim fk = lim I¯ k→∞ fk , J k→∞ I¯ fk . Démonstration. Par hypothèse, la suite (fk )k∈N vérifie la condition de Cauchy de convergence uniforme sur I¯ et il existe donc un entier naturel m tel que, pour tout entier k ≥ m, on ait fm (x) − 1 ≤ fk (x) ≤ fm (x) + 1. Il suffit donc d’appliquer la version correspondante du théorème de convergence minorée et majorée de Lebesgue à la suite (fk )k≥m avec le choix g = fm − 1 et h = fm + 1. Enfin, il est facile de déduire des résultats précédents les versions du théorème de convergence majorée et minorée de Lebesgue pour une série de fonctions. On obtient en particulier le résultat suivant. % Corollaire. Soit I un semi-pavé de Rn , k∈N fk une série de fonctions réelles définies sur I¯ et F une application de I¯ dans R. Supposons satisfaites les conditions suivantes. % 1. La série k∈N fk converge ponctuellement sur I¯ vers F . ¯ 2. Chaque fonction fk est intégrable sur I. 3. Il existe des fonctions réelles g et h intégrables sur I¯ et telles que g(x) ≤ q $ k=0 fk (x) ≤ h(x) 480 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS ¯ pour chaque q ∈ N et chaque x ∈ I. ¯ Alors F est intégrable sur I et l’on a J I¯ c’est-à-dire F = J $ ∞ I¯ k=0 12.10 ∞ J $ ¯ k=0 I fk = fk , ∞ J $ ¯ k=0 I fk . Exercices 1. Soit (fk )k∈N la suite d’applications de R dans R définies par fk (x) = lim [cos(k!πx)]2j . j→∞ Montrer que fk (x) = 1 si (k!x) ∈ Z et 0 si (k!x) /∈ Z. Montrer que (fk )k∈N converge ponctuellement sur R vers la fonction de Dirichlet. On notera que, si x /∈ Q, k!x /∈ Z, et fk (x) = 0 pour tout k ∈ N; si x ∈ Q, avec pq comme représentation irréductible, alors k! pq ∈ Z, ce qui entraı̂ne fk (x) = 1 dès que k ≥ q. % z2k+1 2. Montrer que la série entière k∈N∗ (2k+1)(2k−1) admet 1 comme rayon de convergence et converge uniformément sur la boule fermée B2 [1]. 3. Montrer que l’équation différentielle linéaire zy $$ (z) − y(z) = 0 admet des solutions sur C de la forme , - ∞ $ zk y(z) = c , [(k − 1)!]2 k k=1 où c est une constante complexe arbitraire. 12.11 Petite anthologie Convergence ponctuelle et uniforme % Lorsque les différents termes de la série un sont des fonctions d’une même variable x, continues par rapport à cette variable dans le voisinage d’une valeur particulière pour laquelle la série est convergente, la somme s de la série est aussi, dans le voisinage de cette valeur particulière, fonction continue de x. 481 12.11. PETITE ANTHOLOGIE Augustin Cauchy, 1821 Où cela est-t-il prouvé que l’on obtient la dérivée d’une série infinie en prenant la dérivée de chaque terme ? Niels Henrik Abel, 1839 Si une série convergente de fonctions continues est discontinue au point x0 , alors, dans le voisinage immédiat de x0 , il y a des valeurs de x pour lesquelles la série converge aussi lentement que l’on veut. Philipp Ludwig von Seidel, 1847 On dit ici que la convergence devient infiniment lente si, n étant le nombre de termes qu’on doit prendre de façon que la somme des termes négligés soit en valeur absolue plus petite qu’une quantité e donnée, qu’on peut prendre aussi petite que l’on veut, n croı̂t indéfiniment lorsque x décroı̂t indéfiniment. Georges Stokes, 1847 Fonctions continues non dérivables On peut même dire que le rapport de deux choses homogènes ne dépendant ni de leur nature, ni de leurs grandeurs absolues, par la définition même du rapport, la quantité (Dy/Dx) a toujours une limite; et c’est ce que la considération d’une courbe et de sa tangente, dont l’existence n’est pas douteuse, fait voir d’ailleurs avec la dernière évidence. Louis Poinsot, 1815 On peut demander si une fonction continue quelconque a une dérivée. Nous répondrons d’abord qu’en fait nous allons trouver, dans les paragraphes suivants, les dérivées des principales fonctions; ce qui démontrera leur existence a posteriori. Comme en chaque point une courbe continue a une tangente bien déterminée, la fonction admet une dérivée. Joseph Bertrand, 1878 Considérons la fonction donnée par la série suivante $ sin an x sin ax sin a2 x sin a3 x + + . . . = , + a a2 a3 an dans laquelle a est un entier constant que nous supposerons positif et très grand. Cette série nous fournira un exemple soit d’une fonction qui n’a jamais de dérivée, soit d’une fonction qui n’a jamais aucune période de croissance ou de décroissance. f (x) = 482 CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS Charles Cellerier, s.d. Je me détourne avec effroi et horreur de cette plaie lamentable des fonctions continues qui n’ont point de dérivée. Charles Hermite, 1893 Suites de fonctions intégrables Si une suite de fonctions sommables, ayant des intégrales, f1 , f2 , f3 , . . . a une limite f et si |f − fn | reste, quel que soit n, inférieure à un nombre fixe M , f a une intégrale qui est la limite des intégrales des fonctions fn . Le cas particulier le plus intéressant de ce théorème, celui où f et les fi sont des fonctions continues, a déjà été obtenu, à l’aide de considérations toutes différentes, par Mr. Osgood. Henri Lebesgue, 1902 Chapitre 13 Fonctions et ensembles mesurables 13.1 Intégrale sur un borné Le but de cette section est d’étendre la notion d’intégrale au cas d’un borné quelconque de Rn . Pour ce faire, nous aurons besoin d’une conséquence du théorème de Levi, montrant que l’intégrabilité d’une fonction sur un pavé fermé et la valeur de l’intégrale ne dépendent pas des valeurs prises par la fonction sur la frontière du pavé. Lemme. Soit Q =]c1 , d1 ]×. . . ×]cn , dn] un semi-pavé de Rn et g une fonction de Rn dans Rp définie sur Q̄. Si g(x) = 0 pour tout x ∈ int Q, alors g est L-intégrable sur Q̄ et J J g = 0, Q̄ Q̄ |g|2 = 0. Démonstration. Comme on a |S(Q, g, Π)|2 ≤ S(Q, |g|2, Π), A B pour toute P-partition Π = (xj , Qj ) 1≤j≤m de Q, il suffit évidemment de H montrer que |g|2 est intégrable sur Q̄ et que Q̄ |g|2 = 0. Démontrons d’abord le résultat sous l’hypothèse supplémentaire que g soit bornée sur Q̄ et soit M > 0 tel que |g(x)|2 ≤ M, x ∈ Q̄. Soit ! > 0 et cherchons à déterminer une jauge constante δ, telle que S(Q, |g|2, Π) ≤ !, 483 484 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES A si Π = (xj , Qj ) S(Q, |g|2, Π) = B 1≤j≤m est δ-fine. On a, puisque g(x) = 0 pour x ∈ int Q, $ {1≤j≤m : xj ∈f r Q} |g(xj )|2 µ(Qj ) ≤ M $ {1≤j≤m : xj ∈f r µ(Qj ). Q} Mais, comme Π est δ-fine, on a > {1≤j≤m : xj ∈f r Q} Qj ⊂ Q̄ \ Qδ , où Qδ = ]c1 + δ, d1 − δ[ × . . . × ]cn + δ, dn − δ[, avec la convention ]cj + δ, dj − δ[ = ∅ si cj + δ ≥ dj − δ. Dès lors, les Qj étant mutuellement disjoints, on a $ {1≤j≤m : xj ∈f r Q} où S=2 n $ µ(Qj ) ≤ 2 6 n $ k=1 k=1 {1≤i≤n : i(=k} δ 6 {1≤i≤n : i(=k} (di − ci ) = 2 (di − ci ) = δS, n $ µ(Q) k=1 dk − ck est la somme des (n-1)-mesures des faces de Q̄ qui constituent fr Q. En conséquence, S(Q, |g|2, Π) ≤ δM S ≤ !, à condition de prendre δ = !/M S. Soit maintenant g une fonction quelconque de Rn dans Rp telle que Q̄ ⊂ dom g et g(x) = 0 si x ∈ int Q. Pour chaque k ∈ N, définissons gk par gk (x) = min(|g(x)|2, k), x ∈ Q̄. Par construction, la suite de fonctions de Rn dans R+ est croissante sur Q̄, 0 ≤ gk (x) ≤ k pour chaque k ∈ N et chaque x ∈ Q̄, et, si x ∈ int Q, gk (x) = min{0, k} = 0, k ∈ N. En vertu du résultat de la première partie de la démonstration appliqué à gk , on voit donc que gk est L-intégrable sur Q̄ et J Q̄ gk = 0, k ∈ N. D’autre part, pour chaque x ∈ Q̄, on a gk (x) = |g(x)|2 dès que k ≥ |g(x)|2, ce qui montre la convergence ponctuelle de la suite (gk )k∈N vers |g(x)|2 sur 485 13.1. INTÉGRALE SUR UN BORNÉ Q̄. Le théorème de convergence monotone de Levi entraı̂ne alors que |g|2 est L-intégrable sur Q̄ et que J Q̄ |g|2 = lim J k→∞ Q̄ gk = 0, et la démonstration est complète. Si f est une fonction de Rn dans Rp et si A ⊂ dom f , nous désignerons par fA l’application de Rn dans Rp définie par fA (x) = f (x) si x ∈ A, fA (x) = 0 si x ∈ Rn \ A. En particulier, nous appellerons fonction caractéristique de A ⊂ Rn , et nous désignerons par 1A , l’application de Rn dans R définie par 1A (x) = 1 si x ∈ A, 1A (x) = 0 si x ∈ Rn \ A. Lemme. Soit I ⊂ Rn un semi-pavé et h une fonction de Rn dans Rp définie ¯ Alors h est intégrable (resp. L-intégrable) sur I¯ si et seulement si h ¯ sur I. I est intégrable (resp. L-intégrable) sur J¯ pour tout semi-pavé J ⊂ Rn tel que I¯ ⊂ J, auquel cas on a J J hI¯ J¯ = I¯ h. Démonstration. Soit J ⊂ Rn un semi-pavé tel que I¯ ⊂ J. Alors I ⊂ J et l’on a & r ' J =I∪ > Ii , i=1 où est une partition de J en semi-pavés. Comme I¯ ∩ int I i = ∅ pour chaque 1 ≤ i ≤ r, on a hI¯(x) = 0 pour tout x ∈ int I i, 1 ≤ i ≤ r, et le lemme précédent entraı̂ne la L-intégrabilité de hI¯ sur chaque I¯i avec {I, I 1, . . ., I r } J I¯i hI¯ = 0, 1 ≤ i ≤ r. Combinant ces résultats avec la propriété d’additivité de l’intégrale, on voit que hI¯ sera intégrable (resp. L-intégrable) sur J¯ si et seulement si hI¯ est ¯ c’est-à-dire (puisque h ¯ = h sur I) ¯ si et intégrable (resp. L-intégrable) sur I, I 486 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES ¯ auquel cas on aura, seulement si h est intégrable (resp. L-intégrable) sur I, en outre, J J¯ hI¯ = J I¯ hI¯ + et la démonstration est complète. r J $ ¯i i=1 I hI¯ = J I¯ h, Soit A une partie bornée de Rn et f une fonction de Rn dans Rp définie sur A. La définition suivante est naturelle. Définition. On dit que f est intégrable sur A (resp. L-intégrable sur A) s’il existe un semi-pavé I ⊂ Rn tel que A ⊂ I¯ et telHque fA soit intégrable (resp. H ¯ L-intégrable) sur I, auquel cas I¯ fA est notée A f et appelée l’intégrale de f sur A. Cette définition et la terminologie seront justifiées si l’intégrabilité (resp. H la L-intégrabilité) de fA sur I¯ et la valeur de I¯ fA ne dépendent pas du choix de I. Cette indépendance résulte de la proposition suivante. Proposition. Si I ⊂ Rn est un semi-pavé tel que A ⊂ I¯ et tel que fA soit ¯ alors, pour tout semi-pavé K ⊂ Rn tel intégrable (resp. L-intégrable) sur I, H H que A ⊂ K̄, fA est intégrable (resp. L-intégrable) sur K̄ et K̄ fA = I¯ fA . Démonstration. Soit J ⊂ Rn un semi-pavé tel que I¯ ⊂ J et K̄ ⊂ J. Notons tout d’abord que (fA )I¯ = (fA )K̄ = fA puisque A ⊂ I¯ ∩ K̄. Par le second lemme ci-dessus et l’intégrabilité (resp. L-intégrabilité) de fA sur ¯ (fA ) ¯ = fA est intégrable (resp. L-intégrable) sur J¯ et H ¯ fA = H ¯ fA . Par I, I I J ce même lemme, l’intégrabilité (resp. la L-intégrabilité) de (fA )K̄ = fA sur J¯ entraı̂ne l’intégrabilité (resp. la L-intégrabilité) de fA sur K̄ et l’égalité H H f = f ¯ A K̄ J A. Remarques. 1. La proposition ci-dessus montre encore que la définition et la notation que nous venons d’introduire sont compatibles, lorsque A est l’adhérence I¯ d’un semi-pavé I de Rn , avec la définition et la notation ¯ puisque f ¯ = f originales d’intégrabilité (resp. de L-intégrabilité) sur I, I ¯ et avec les notions d’intégrabilité (resp. de L-intégrabilité) sur des sur I, intervalles non fermés. En outre, la même proposition montre que si B ⊂ A, alors f est intégrable (resp. L-intégrable) sur B si et seulement si fB est intégrable (resp. L-intégrable) sur A. 2. Il résulte aisément de la définition ci-dessus que les propriétés élémentaires de l’intégrale (sauf celles de restriction et d’additivité), le test de comparaison de L-intégrabilité, l’identité entre les fonctions intégrables et L-intégrables lorsqu’elles sont bornées ou positives, le 13.2. BORNÉS INTÉGRABLES ET LEUR MESURE 487 théorème de Levi et le théorème de Lebesgue s’étendent à l’intégrabilité (resp. L-intégrabilité) sur un borné A de Rn en remplaçant simplement I¯ par A. En particulier, l’ensemble P (A; Rp) (resp. L(A; Rp)) des fonctions de Rn dans Rp intégrables (resp. L-intégrables) sur A forme un espace vectoriel sur R. On verra plus loin que l’extension des propriétés de restriction et d’additivité est plus délicate. Elle nécessite l’introduction de la notion de partie n-intégrable de Rn . 13.2 Bornés intégrables et leur mesure Soit A une partie bornée de Rn . Définition. On dit que A est n-intégrable si la fonction constante 1 est H intégrable sur A, auquel cas le nombre positif ou nul A 1 est appelé la nmesure (de Lebesgue) de A et noté µ(A). On dit aussi longueur de A pour n = 1, aire d’un ensemble plan de A pour n = 2 et volume de A pour n = 3. H On a donc, par définition, µ(A) = I¯ 1A pour tout semi-pavé I ⊂ Rn tel ¯ En particulier, l’adhérence I¯ de tout semi-pavé I = ]a1 , b1 ] × que A ⊂ I. . . . × ]an , bn] de Rn est n-intégrable et a pour n-mesure de Lebesgue ¯ = µ(I) J I¯ 1I¯ = J I¯ 1= n 6 i=1 (bi − ai ). En utilisant le premier lemme de cette section, on voit aussi que fr I = I¯ \ int I et I¯ \ I sont n-intégrables et que µ(fr I) = µ(I¯ \ I) = 0, puisque 1fr I (x) = 1I\I ¯ (x) = 0 si x ∈ int I. Comme 1int I = 1I¯ − 1fr I et 1I = 1I¯ − 1I\I ¯ , on en déduit aussitôt la n-intégrabilité de int I et de I et les relations ¯ = µ(int I) = µ(I) = µ(I) n 6 i=1 (bi − ai ), qui montrent la compatibilité de la nouvelle notation avec la notation µ(I) introduite précédemment pour désigner le dernier terme de l’égalité. Les propriétés élémentaires de la n-mesure résultent aisément de la définition et des propriétés élémentaires de l’intégrale. 488 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES Proposition. Si A, B, A1 , . . . , Aq sont des parties bornées n-intégrables de Rn , on a les propriétés suivantes. 1. Si B ⊂ A, alors µ(B) ≤ µ(A) (monotonie). ! 7 2. qk=1 Ak et qk=1 Ak sont n-intégrables, µ & q > Ak k=1 ' ≤ q $ µ(Ak ) (sous-additivité), k=1 et si les Ak sont mutuellement disjoints (Aj ∩ Ak = ∅ si j /= k), µ & q > Ak k=1 ' = q $ µ(Ak ) (additivité). k=1 3. µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B), 4. A \ B est n-intégrable et, si B ⊂ A, µ(A \ B) = µ(A) − µ(B). Démonstration. Il suffit d’appliquer à la définition les propriétés élémentaires de l’intégrale en tenant compte des propriétés suivantes des fonctions caractéristiques, que l’on démontre aisément: 1) B ⊂ A si et seulement si 1B (x) ≤ 1A (x) pour tout x ∈ Rn . 2) 1!q Ak = max1≤k≤q 1Ak , 17q Ak = min1≤k≤q 1Ak , et 1!q Ak = %q k=1 k=1 k=1 1Ak si les Ak sont mutuellement disjoints. 3) 1A∪B = 1A + 1B − 1A∩B . 4) A \ B = A ∩ (Rn \ B) et, si B ⊂ A, 1A\B = 1A − 1B . En particulier, 1Rn \B = 1 − 1B . k=1 Le théorème de Levi permet de généraliser la propriété 2 de la proposition ci-dessus aux familles dénombrables d’ensembles. Un résultat préliminaire est nécessaire. Lemme. Si (Ak )k∈N est une suite croissante (resp. décroissante) de parties de Rn , alors la suite de fonctions (1Ak )k∈N converge ponctuellement sur Rn vers 1! Ak (resp. 17 Ak ). k∈N k∈N Démonstration. Si, pour fixer les idées, on suppose (Ak )k∈N croissante, ! et si x /∈ A = k∈N Ak , x n’appartient à aucun Ak et on a donc lim 1Ak (x) = 0 = 1A (x). k→∞ Si x ∈ A, il existe un m ∈ N tel que x ∈ Am . Comme (Ak )k∈N est croissante, on aura donc x ∈ Ak pour tout k ≥ m, et dès lors lim 1Ak (x) = 1 = 1A (x). k→∞ Le cas d’une suite décroissante se démontre de la même manière. 489 13.2. BORNÉS INTÉGRABLES ET LEUR MESURE Proposition. Soit (Ak )k∈N une suite croissante de parties bornées et n! intégrables de Rn telles que A = k∈N Ak soit bornée. Alors A est nintégrable et µ(A) = lim µ(Ak ) = sup µ(Ak ). k→∞ k∈N ¯ Par hypothèse, Démonstration. Soit I un semi-pavé de Rn tel que A ⊂ I. (1Ak )k∈N est une suite croissante de fonctions intégrables sur I¯ qui, en vertu du lemme précédent, converge ponctuellement vers 1A . En outre, la suite H (µ(Ak ))k∈N = ( I¯ 1Ak )k∈N est croissante et majorée par µ(I), donc convergente. On déduit aussitôt du théorème de Levi que 1A = limk→∞ 1Ak est intégrable sur I¯ (donc que A est n-intégrable) et que µ(A) = J I¯ 1A = lim J k→∞ I¯ 1Ak = lim µ(Ak ) = sup µ(Ak ). k→∞ k∈N Proposition. Soit (Ak )k∈N une suite décroissante de parties bornées et n7 intégrables de Rn . Alors A = k∈N Ak est n-intégrable et µ(A) = lim µ(Ak ) = inf µ(Ak ). k→∞ k∈N ¯ Par hypothèse, Démonstration. Soit I un semi-pavé de Rn tel que A0 ⊂ I. (1Ak )k∈N est une suite décroissante de fonctions intégrables sur I¯ qui, en vertu du lemme précédent, converge ponctuellement vers 1A . En outre, la H suite (µ(Ak ))k∈N = ( I¯ 1Ak )k∈N est décroissante et minorée par 0, donc convergente. On déduit aussitôt du théorème de Levi que 1A = limk→∞ 1Ak est intégrable sur I¯ (donc que A est n-intégrable) et que µ(A) = J I¯ 1A = lim J k→∞ I¯ 1Ak = lim µ(Ak ) = inf µ(Ak ). k→∞ k∈N Un lemme est nécessaire pour démontrer l’importante propriété d’additivité complète de la mesure. Lemme. Si (Ak )k∈N est une suite de parties de Rn mutuellement disjointes, % alors la série de fonctions k∈N 1Ak converge ponctuellement vers 1! Ak . k∈N Démonstration. Comme les Ak sont mutuellement disjoints, on a, pour tout q ∈ N, 1!q k=0 Ak = q $ k=0 1Ak . 490 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES ! Si x /∈ A = k∈N Ak , alors x /∈ Ak pour tout k ∈ N et tout q ∈ N. En conséquence, q $ lim q→∞ %q k=0 1Ak (x) = 0 pour 1Ak (x) = 0 = 1A (x). k=0 Si x ∈ A, il existe un (et un seul) entier m tel que x ∈ Am . Dès lors, pour tout q ≥ m, on a q $ 1Ak (x) = 1Am (x) = 1, k=0 et lim q→∞ q $ 1Ak (x) = 1 = 1A (x). k=0 Nous pouvons maintenant démontrer la propriété d’additivité complète de la mesure. Proposition. Si (Ak )k∈N est une suite de parties de Rn bornées, n-intégra! bles, mutuellement disjointes et telles que A = k∈N Ak soit bornée, alors A % est n-intégrable, la série k∈N µ(Ak ) converge et µ(A) = ∞ $ µ(Ak ). k=0 ¯ Par hypothèse, Démonstration. Soit I un semi-pavé de Rn tel que A ⊂ I. ¯ k∈N 1Ak est une série de fonctions positives et intégrables sur I et, par le lemme, cette série converge ponctuellement sur Rn vers 1A . En outre, la série à termes positifs J % $ ¯ k∈N I 1Ak = $ µ(Ak ) k∈N est convergente, puisque, pour tout q ∈ N, on a q $ µ(Ak ) = µ k=0 & q > k=0 Ak ' ≤ µ(I). Par le théorème de Levi pour les séries de fonctions, la fonction 1A est intégrable sur I¯ et µ(A) = J I¯ 1A = ∞ J $ ¯ k=0 I 1Ak = ∞ $ k=0 µ(Ak ). 13.3. ADDITIVITÉ COMPLÈTE DE LA L-INTÉGRALE 13.3 491 Additivité complète de la L-intégrale On sait que l’intégrabilité (resp. la L-intégrabilité) d’une fonction sur un pavé fermé I¯ entraı̂ne son intégrabilité (resp. sa L-intégrabilité) sur tout ¯ On pourrait penser que l’intégrabilité d’une pavé fermé contenu dans I. fonction sur une partie bornée A entraı̂ne son intégrabilité sur toute partie de A. Qu’il n’en soit rien résulte de l’existence de parties bornées de Rn qui ne sont pas n-intégrables, un résultat fondé sur l’axiome du choix et qui est esquissé dans les exercices. En effet, si B est un tel ensemble borné et non ¯ la fonction constante 1 est n-intégrable, et I un semi-pavé tel que B ⊂ I, intégrable sur I¯ et ne l’est pas sur B. On peut alors penser que l’intégrabilité d’une fonction sur une partie bornée A entraı̂ne son intégrabilité sur toute partie n-intégrable de A. Ce résultat est faux pour les fonctions intégrables mais non L-intégrables sur A. En effet, si f ∈ P (A; R) \ L(A; R), on a vu précédemment que f + et f − ne sont pas intégrables sur A. Dès lors, si A+ = {x ∈ A : f (x) ≥ 0}, on a f + (x) = fA+ (x) pour tout x ∈ A et f n’est pas intégrable sur A+ . Dans le cas de f (x) = (2/x) cos(1/x2) si x /= 0 et f (0) = 0, qui est un élément de P ([0, 1], R) \ L([0, 1], R), il est facile de voir que A+ est une union dénombrable d’intervalles fermés bornés mutuellement disjoints contenus dans [0, 1], donc que A+ est 1-intégrable. On ne connaı̂t pas de classe intéressante, autre que l’union finie de pavés, pour laquelle l’intégrabilité d’une fonction intégrable mais non L-intégrable sur un borné A se transmette à une partie de A appartenant à cette classe. C’est évidemment un handicap important de l’extension de la notion d’intégrabilité à une partie bornée quelconque. La situation est meilleure pour la L-intégrabilité sur une partie bornée qui se transmet à tout sous-ensemble n-intégrable. C’est la propriété de restriction de la L-intégrale sur un borné. Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp définie et L-intégrable sur A. Alors, pour toute partie n-intégrable B de A, f est L-intégrable sur B. Démonstration. En passant aux composantes fj de f et puis en notant que fj = fj+ − fj− , on voit qu’il suffit de démontrer le résultat pour une fonction f de Rn dans R+ , ce que nous supposerons. Soit B ⊂ A n-intégrable ¯ Définissons sur A la suite (fk )k∈N et I un semi-pavé de Rn tel que A ⊂ I. 492 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES de fonctions de Rn dans R+ par fk (x) = min[f (x), k.1B (x)], k ∈ N. Chaque fk est telle que 0 ≤ fk (x) ≤ f (x), pour x ∈ A, et est L-intégrable sur A puisqu’il en est ainsi de f et de k.1B . En outre, (fk )k∈N converge ponctuellement sur A vers fB . En effet, si x ∈ B, k.1B (x) = k et dès lors fk (x) = f (x) = fB (x) dès que k ≥ fB (x), tandis que, si x ∈ A\B, k.1B (x) = 0 pour tout k ∈ N, et dès lors fk (x) = 0 = fB (x) pour tout k ∈ N. Le théorème de convergence majorée et minorée de Lebesgue entraı̂ne alors la L-intégrabilité de fB sur A, c’est-à-dire la L-intégrabilité de f sur B. On en déduit aisément la propriété d’additivité finie pour la Lintégrale sur un borné. Proposition. Soit A un borné de Rn , {A1 , . . . , Aq } une partition de A en un nombre fini de parties n-intégrables, et f une fonction de Rn dans Rp définie sur A. Alors f est L-intégrable sur A si et seulement si f est L-intégrable sur chaque Ak , 1 ≤ k ≤ q, auquel cas on a J f= A q J $ f. k=1 Ak Démonstration. Si f est L-intégrable sur A, la propriété de restriction que nous venons de démontrer entraı̂ne sa L-intégrabilité sur chaque Ak , 1 ≤ k ≤ q, et donc l’intégrabilité de chaque fAk sur A. Comme en outre f= q $ fAk , k=1 la formule cherchée s’en déduit par intégration sur A. Réciproquement, si f est L-intégrable sur chaque Ak , 1 ≤ k ≤ q, fAk est L-intégrable sur A, et la formule ci-dessus entraı̂ne que f est L-intégrable sur A. Le théorème de Levi pour les séries de fonctions positives fournit la propriété d’additivité complète pour la L-intégrale sur un borné. Proposition. Soit A un borné de Rn , (Ak )k∈N une suite de parties nintégrables de A telle que {A0 , A1 , . . .} forme une partition de A et f une fonction de Rn dans Rp définie sur A. Alors, f est L-intégrable sur A si 493 13.4. EXEMPLES DE BORNÉS INTÉGRABLES et seulement si f est L-intégrable sur chaque Ak , k ∈ N et converge, auquel cas J f= A ∞ J $ % H k∈N Ak |f |2 f. k=0 Ak Démonstration. Comme ci-dessus, on peut se ramener au cas où f est à valeurs positives. Comme, pour chaque x ∈ A, on a % fAk (x) = f (x).1Ak (x) ≥ 0, % on voit que la série k∈N fAk = f.( k∈N 1Ak ) converge ponctuellement sur A vers f.1A = fA . On peut donc appliquer le théorème de convergence de Levi pour les séries de fonctions positives, qui assure Hl’intégrabilité de f sur H % % A si et seulement si la série k∈N A f.1Ak = k∈N Ak f converge, auquel cas on a J J f= A ∞ $ f. k=0 Ak Enfin, le théorème de Levi pour une suite croissante de fonctions fournit à son tour une condition nécessaire et suffisante du type de Hake pour la L-intégrabilité sur une partie bornée. Proposition. Soit (Ak )k∈N une suite croissante de parties bornées et n! intégrables telle que A = k∈N Ak soit bornée, et soit f une fonction de Rn dans Rp définie sur A. Alors f est L-intégrable sur A si et seulement si f est H L-intégrable sur chaque Ak , k ∈ N et la suite ( Ak |f |2 )k∈N est convergente, auquel cas on a J J f = lim A k→∞ Ak f. Démonstration. On peut de nouveau, sans perte de généralité, se ramener au cas d’une fonction f positive et l’on procède comme dans la démonstration précédente. 13.4 Exemples de bornés intégrables Le premier résultat, qui porte le nom d’inégalité de Tchebycheff, associe à une fonction positive intégrable sur un borné A une intéressante classe de parties intégrables de A. 494 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES Proposition. Soit A un borné de Rn et f une fonction de Rn dans R+ intégrable sur A. Alors, pour chaque r > 0, l’ensemble Ar = {x ∈ A : f (x) > r} est n-intégrable et µ(Ar ) ≤ r −1 J f. A ¯ Démonstration. Soit r > 0 et I un semi-pavé de Rn tel que A ⊂ I; n définissons sur R la suite d’applications (fk )k∈N par fk (x) = min[1, k. max(fA (x) − r, 0)], k ∈ N, x ∈ Rn . Chaque fk est intégrable sur I¯ et telle que 0 ≤ fk (x) ≤ 1, k ∈ N, x ∈ Rn . En outre, la suite (fk )k∈N converge ponctuellement sur Rn vers 1Ar . En effet, si x ∈ Rn \ Ar , alors fA (x) − r ≤ 0 et fk (x) = 0 pour tout k ∈ N, ce qui entraı̂ne que fk (x) → 0 = 1Ar (x) si k → ∞. Si x ∈ Ar , fk (x) = min[1, k(f (x) − r)] et dès lors fk (x) = 1 dès que k ≥ 1/(f (x) − r); donc fk (x) → 1 = 1Ar (x) si k → ∞. On peut donc appliquer le théorème de convergence majorée et mi¯ c’est-à-dire la norée de Lebesgue pour obtenir l’intégrabilité de 1Ar sur I, n-intégrabilité de Ar . Par la propriété de restriction (puisque, f étant positive, son intégrabilité équivaut à sa L-intégrabilité), f sera alors intégrable sur Ar et comme r.1Ar (x) ≤ fAr (x) ≤ f (x), x ∈ A, on en déduit, par intégration sur A que rµ(Ar ) ≤ J Ar f≤ J f, A et la démonstration est complète. Remarque. La fonction df : R∗+ → R+ , r 2→ µ(Ar ) définie par la Proposition précédente s’appelle la fonction de distribution de f et joue un grand rôle en analyse. 495 13.4. EXEMPLES DE BORNÉS INTÉGRABLES Corollaire. Dans les conditions de la proposition précédente, l’ensemble A∗r = {x ∈ A : f (x) ≥ r} est n-intégrable et µ(A∗r ) ≤r −1 J f. A Démonstration. Avec les notations de la Proposition précédente, on a A∗r = " Ar−(1/k). {k∈N:k>r −1 } Comme Ar−(1/k) ⊃ Ar−(1/k+1) pour k ≥ 1 et comme, par la proposition précédente, chaque Ar−(1/k) est n-intégrable, on en déduit que A∗r est nintégrable et que µ(A∗r ) = lim µ(Ar−(1/k)) ≤ lim k→∞ k→∞ 4 r− 1 k 5−1 J A f = r −1 J A f. Corollaire. Si A est un borné de Rn et si f est une fonction de Rn dans Rp L-intégrable sur A, alors l’ensemble S(f ) = {x ∈ A : f (x) /= 0} est n-intégrable. Démonstration. On a S(f ) = {x ∈ A : |f (x)|2 > 0} = > Sk , k∈N∗ où Sk = {x ∈ A : |f (x)|2 > 1/k}. Par le théorème de Tchebycheff, chaque Sk est n-intégrable et, par construction, Sk ⊂ Sk+1 ⊂ A pour tout k ∈ N∗ . La n-intégrabilité de S(f ) en découle aussitôt. L’obtention de classes concrètes d’ensembles n-intégrables repose sur le lemme de recouvrement suivant. Proposition. Soit I un semi-pavé de Rn , E une partie non vide 8 de I et9δ une jauge sur E. Alors il existe une famille au plus dénombrable (xk , J k ) , k∈M avec M = {0, 1, . . . , s} ou N, telle que chaque J k est un semi-pavé contenu dans I et semblable à I, J k ∩J l = ∅ si j /= l, xk ∈ E ∩J k , J k ⊂ B∞ [xk ; δ(xk )] pour chaque k ∈ M, l ∈ M, et E⊂ > k∈M J k ⊂ I. 496 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES Démonstration. Effectuons des divisions successives de I en 2n , 22n , . . ., 2kn , . . . semi-pavés congruents par bissection des intervalles dont I est le produit cartésien, et appelons respectivement D1 , D2 , . . ., Dk , . . . les collections finies de semi-pavés ainsi obtenues. Chaque Dk constitue évidemment une partition de I en semi-pavés congruents semblables à I. Posons E1 = {J ∈ D1 : il existe x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]}, E2 = {J ∈ D2 : J n’est pas contenu dans un semi-pavé de E1 et il existe x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]}, et, d’une manière générale, pour chaque k ∈ N∗ , ! Ek = {J ∈ Dk : J n’est pas contenu dans un semi-pavé de k−1 j=1 Ej et il existe x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]}. ! Posons E = k∈N∗ Ek . C’est une famille au plus dénombrable de semi-pavés contenus dans I et mutuellement disjoints. Montrons que tout point de E appartient à l’un au moins de ces semi-pavés. Soit x ∈ E et δ(x) la valeur correspondante de la jauge. Il existe un entier k1 ≥ 1 tel que, pour tout k ≥ k1 , le semi-pavé Jk,x de Dk qui contient x soit contenu dans B∞ [x; δ(x)], et dès lors Jk1 ,x vérifie la deuxième condition de définition de Ek1 . Par conséquent, ou ! 1 −1 bien Jk1 ,x ∈ Ek1 , ou bien Jk1 ,x est contenu dans un semi-pavé de kj=1 Ej . Par conséquent, x appartient à un semi-pavé de la famille E. Si nous désignons les semi-pavés de cette famille par (Jk )k∈M , avec M = {0, 1, . . ., s} un ensemble fini ou M = N, nous avons par construction, pour 8 chaque 9 k ∈ M, k k k k k k k un x ∈ E ∩ J tel que J ⊂ B∞ [x ; δ(x )]. La famille (x , J ) a les k∈M propriétés voulues. Le lemme de recouvrement fournit un intéressant résultat sur la structure des ouverts bornés de Rn . Proposition. Soit E un ouvert borné non vide de Rn et I un semi-pavé tel que E ⊂ I. Il existe une suite (J k )k∈N de semi-pavés contenus dans I et semblables à I qui partitionne E. Démonstration. Puisque E est ouvert, il existe, pour chaque x ∈ E, un δ(x) > 0 tel que B∞ [x; δ(x)] ⊂ E, ce qui nous définit une jauge δ sur E. Par le lemme de 9recouvrement, on peut trouver une famille au plus 8 k dénombrable (x , J k ) où chaque J k est un semi-pavé contenu dans I k∈M et semblable à I, les J k sont mutuellement disjoints, xk ∈ E ∩ J k , J k ⊂ ! B∞ [xk ; δ(xk )], k ∈ M, et E ⊂ k∈M J k . Comme, pour chaque k ∈ M , on ! a J k ⊂ B∞ [xk ; δ(xk )] ⊂ E, on en déduit que k∈M J k ⊂ E, et donc que ! k k k∈M J = E. Comme une union finie de semi-pavés J ne peut donner un ouvert, on a nécessairement M = N et la démonstration est complète. 13.4. EXEMPLES DE BORNÉS INTÉGRABLES 497 On en déduit aussitôt l’intégrabilité de tout ouvert borné. Proposition. Tout ouvert borné de Rn est n-intégrable. Démonstration. C’est trivial si l’ouvert est vide. Si E est un ouvert non vide de Rn , et I un semi-pavé qui le contient, E peut s’écrire, par la Proposition précédente, comme une union dénombrable de semi-pavés J k mutuellement disjoints et contenus dans I. E est donc n-intégrable par la propriété d’additivité complète, puisque chaque J k l’est. On ne s’étonnera pas que la propriété s’étende aux fermés bornés. Proposition. Tout fermé borné de Rn est n-intégrable. Démonstration. Soit F un fermé borné de Rn et I un semi-pavé tel que F ⊂ int I. Alors E = (Rn \ F ) ∩ int I est un ouvert borné de Rn et est donc n-intégrable. Comme F = int I \ E, F est également n-intégrable. Terminons par une intéressante propriété d’approximation des bornés n-intégrables par une union au plus dénombrable de semi-pavés mutuellement disjoints. Proposition. Soit A une partie bornée et n-intégrable de Rn et I un semipavé contenant A. Pour chaque ! > 0, il existe une famille au plus dénombrable (J k )k∈M de semi-pavés mutuellement disjoints contenus dans I et tels ! que A ⊂ k∈M J k et $ µ(J k ) ≤ µ(A) + !. k∈M Démonstration. Si ! > 0 est donné, il existe une jauge δ sur I¯ telle que, pour toute P-partition δ-fine Π de I, on ait |S(I, 1A, Π) − µ(A)| ≤ !. 8 9 Pour cette jauge δ et l’ensemble A, soit (xk , J k ) la famille au plus k∈M dénombrable donnée par le lemme de recouvrement. En vertu du lemme de Saks-Henstock, on aura, pour chaque q ∈ M , # q 2 3## J #$ # # k k 1A (x )µ(J ) − 1A # ≤ !, # # # k ¯ J k=1 c’est-à-dire, puisque xk ∈ A, k ∈ M , # q 2 3## J #$ # # k µ(J ) − 1A # ≤ !. # # # J¯k k=1 498 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES En conséquence, on a, pour tout q ∈ M , q $ k=1 µ(J ) ≤ k q J $ ¯k k=1 J 1A + ! ≤ J I¯ 1A + ! = µ(A) + !, et le résultat s’en déduit en faisant tendre q vers l’infini dans le cas où M = N. 13.5 Ensembles négligeables On a vu plus haut qu’une fonction de Rn dans Rp définie sur l’adhérence I¯ d’un semi-pavé I de Rn et nulle sur int I est L-intégrable sur I¯ et son ¯ intégrale est nulle. Toutes ces fonctions ont donc la même intégrale sur I. On avait vu également que l’intégrale d’une fonction sur un intervalle ne dépendait pas de sa valeur aux extrémités de l’intervalle. Ce sont là des manifestations particulières d’un phénomène général en théorie de l’intégration: l’indépendance de la propriété d’intégrabilité et de la valeur de l’intégrale sur un ensemble par rapport aux valeurs prises par la fonction sur des parties suffisamment “petites” de l’ensemble d’intégration. Dans cette section, ces parties suffisamment “petites” pour pouvoir être négligées dans l’opération d’intégration vont être caractérisées d’une manière indépendante de la théorie de l’intégrale et de la mesure. Nous en déduirons alors une extension des notions d’intégrabilité et de L-intégrabilité facilitant la démonstration de l’intégrabilité d’une fonction ou d’un ensemble, et une généralisation des théorèmes de convergence monotone et dominée. La propriété d’approximation des parties bornées n-intégrables donnée dans la section précédente suggère la définition suivante. Définition. On dit que E ⊂ Rn est n-négligeable si, pour chaque ! > 0, il existe une famille au plus dénombrable (Ek )k∈M de semi-pavés de Rn , avec M = {0, 1, . . ., s} ou N, telle que les propriétés suivantes soient satisfaites : ! 1. E ⊂ k∈M Ek . % 2. k∈M µ(Ek ) ≤ !. Exemples. 1. ∅ est n-négligeable. 2. Tout singleton {a} de Rn est n-négligeable. En effet, si ! > 0 est donné, il suffit de prendre M = {0} et E0 = n 6 i=1 ]ai − (1/2)!1/n, ai + (1/2)!1/n]. 499 13.5. ENSEMBLES NÉGLIGEABLES 3. Toute partie dénombrable de Rn est n-négligeable. En effet, une telle partie peut s’écrire E = {ak : k ∈ N} et, si ! > 0 est donné, il suffit de prendre M = N et Ek = n 6 i=1 ]aki − (1/2)(!/2k+1 )1/n, aki + (1/2)(!/2k+1 )1/n], k ∈ N, ce qui donne E ⊂ ! k∈N Ek ∞ $ et µ(Ek ) = k=0 ∞ $ (!/2k+1 ) = !. k=0 En particulier, N, Z et Q sont 1-négligeables, ce qui montre qu’une partie n-négligeable n’est pas nécessairement bornée. 4. Tout hyperplan de Rn de la forme E = R × . . . × {ci} × . . . × R est n-négligeable. En effet, si ! > 0 est donné, il suffit de prendre M = N et, pour k ∈ N, 3 Ek =]−(k +1), k +1]×. . .× ci − ! ! , ci + n+k+1 n+k+1 n−1 2 (k + 1) 2 (k + 1)n−1 3 × . . . × ] − (k + 1), k + 1], ce qui entraı̂ne aussitôt que E ⊂ ∞ $ ! k∈N Ek µ(Ek ) = 2! k=0 & ∞ $ k=0 et 2 −k−2 ' = !. Les propriétés suivantes des ensembles n-négligeables permettent d’en construire d’autres. Proposition. Si E est une partie n-négligeable de Rn et si F ⊂ E, alors F est n-négligeable. Démonstration. Immédiat. Ainsi, toute partie du type [a1 , b1 ] × . . . × {ci } × . . . × [an , bn] sera nnégligeable. En particulier, les faces et la frontière d’un pavé de Rn sont n-négligeables. 500 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES Proposition. Si (Fj )j∈N est une suite de parties n-négligeables de Rn , alors ! j∈N Fj est n-négligeable. Démonstration. Soit ! > 0. Pour chaque j ∈ N, il existe une famille (Ekj )k∈Mj de semi-pavés de Rn , avec Mj = {0, 1, . . ., sj } ou N, telle que Fj ⊂ > $ Ekj , k∈Mj k∈Mj µ(Ekj ) ≤ !/2j+1 . Dès lors, (Ekj )k∈Mj ;j∈N est une famille dénombrable de semi-pavés de Rn telle que > > > Fj ⊂ Ekj , j∈N j∈N k∈Mj et, dès lors, $ µ(Ekj ) = ∞ $ j=0 k∈Mj ;j∈N $ k∈Mj µ(Ekj ) ≤ ∞ $ (!/2j+1 ) = !, j=0 puisque tout réarrangement d’une série convergente à termes positifs converge vers la même somme. Ainsi, Qn est n-négligeable. La Proposition suivante établit l’identité, parmi les ensembles bornés, entre les parties n-négligeables et les parties n-intégrables de n-mesure nulle. Proposition. Toute partie bornée de Rn est n-négligeable si et seulement si elle est n-intégrable et de n-mesure nulle. Démonstration. Condition nécessaire. Soit E un borné n-négligeable de ¯ Il faut montrer que la fonction 1E est Rn et I un semi-pavé telH que E ⊂ I. intégrable sur I¯ et que I¯ 1E = 0. Soit ! > 0; par hypothèse, il existe une famille au plus dénombrable (Ek )k∈M de semi-pavés de Rn telle que E⊂ > k∈M Ek , $ k∈M µ(Ek ) ≤ !/2. Soit (Fk )k∈M une famille de semi-pavés tels que Ek ⊂ int Fk , k ∈ M, $ k∈M µ(Fk ) ≤ !. Une telle famille est facile à construire en agrandissant légèrement les Ek . ¯ Si x ∈ I¯ \ E, prenons δ(x) = 1. Si Définissons comme suit une jauge δ sur I. 501 13.5. ENSEMBLES NÉGLIGEABLES x ∈ E, il existe un Ek tel que x ∈ Ek et donc tel que x ∈ int Fk . Désignons par k(x) le plus petit entier appartenant à M tel que x ∈ int Fk , et soit δ(x) > 0 tel que B∞ [x; δ(x)] ⊂ Fk(x) ; ce δ(x) fournit la valeur de la jauge pour un tel x. Soit Π = {(x1 , I 1), . . . , (xm, I m)} une P-partition δ-fine de I; alors, S(I, 1E, Π) = m $ 1E (xj )µ(I j ) = j=1 $ µ(I j ). {1≤j≤m : xj ∈E} Mais, si xj ∈ E, on a I j ⊂ B∞ [xj ; δ(xj )] ⊂ Fk(xj ), et dès lors, en posant r = max{k(xj ) : xj ∈ E, 1 ≤ j ≤ m} et en regroupant, dans la dernière somme, les termes pour lesquels k(xj ) prend la valeur i, on obtient S(I, 1E , Π) = r $ i=1 ≤ r $ i=1 $ {1≤j≤m : k(xj )=i} µ(Fi ) ≤ µ(I j ) $ µ(Fi ) ≤ !, $ µ(J k ) ≤ !, i∈M et la démonstration est complète. Condition suffisante. Soit E un borné de Rn n-intégrable et de n-mesure nulle et soit ! > 0. Par la propriété d’approximation des parties bornées et nintégrables, il existe une famille au plus dénombrable (J k )k∈M de semi-pavés mutuellement disjoints et tels que E⊂ > Jk, k∈M k∈M et le résultat s’en déduit aussitôt. Terminons par une condition nécessaire utile pour qu’une partie bornée soit de n-mesure nulle. Proposition. Soit E une partie bornée et n-intégrable de Rn . Si E est de n-mesure nulle, alors int E = ∅. Démonstration. On démontre le contraposé. Si int E /= ∅, il existe a ∈ E et r > 0 tels que B∞ [a; r] ⊂ E, et dès lors 0 < (2r)n ≤ µ(E). 502 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES Etudions maintenant l’intégrabilité d’une fonction sur une partie bornée n-négligeable. Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp définie sur A. Alors f est L-intégrable sur A et J |f |2 = 0 A si et seulement si l’ensemble S(f ) = {x ∈ A : f (x) /= 0} est n-négligeable, auquel cas on a H Af = 0. Démonstration. Notons tout d’abord que S(f ) = {x ∈ A : |f (x)|2 > 0} = où > Sk , k∈N∗ Sk = {x ∈ A : |f (x)|2 > k−1 } ⊂ Sk+1 , k ∈ N∗ . En conséquence, S(f ) sera n-intégrable et de n-mesure nulle si et seulement s’il en est ainsi de chaque Sk . H Condition nécessaire. Si f est L-intégrable sur A et A |f |2 = 0, alors, en appliquant l’inégalité de Tchebycheff à |f |2 , on voit que chaque Sk est n-intégrable et que J 0 ≤ µ(Sk ) ≤ k A |f |2 = 0, ce qui montre que chaque Sk est de n-mesure nulle. Condition suffisante. Démontrons-la tout d’abord sous l’hypothèse supplémentaire que f soit bornée sur A, et soit r > 0 tel que |f (x)|2 ≤ r pour ¯ et montrons que tout x ∈ A. Soit I un semi-pavé de Rn tel que A ⊂ I, H fA est L-intégrable sur I¯ et que I¯ |fA |2 = 0. Soit ! > 0; puisque S(f ) est n-intégrable et de n-mesure nulle, il existe une jauge δ sur I¯ telle que S(I, 1S(f ), Π) = m $ 1S(f )(xj )µ(I j ) = j=1 $ {1≤j≤m : xj ∈S(f )} µ(I j ) ≤ !/r, pour toute P-partition δ-fine Π = {(x1 , I 1 ), . . ., (xm , I m)} de I, et dès lors |S(I, fA, Π)|2 ≤ S(I, |fA|2 , Π) = $ {1≤j≤m : xj ∈S(f )} |f (xj )|2 µ(I j ) 503 13.5. ENSEMBLES NÉGLIGEABLES ≤ $ {1≤j≤m : xj ∈S(f )} rµ(I j ) ≤ !. H On voit donc que fA et |fA |2 sont L-intégrables sur I¯ et que I¯ |f |2 = 0. Passons maintenant au cas d’une fonction f quelconque. Pour chaque k ∈ N, posons gk = min(|f |2 , k). Chaque fonction gk est bornée sur A, et la suite (gk )k∈N est croissante sur A. On vérifie comme d’habitude que (gk )k∈N converge ponctuellement sur A vers |f |2 . En outre, gk (x) = |f (x)|2 dès que k ≥ |f (x)|2, ce qui entraı̂ne aussitôt que, pour chaque k ∈ N, S(gk ) = S(f ) est de n-mesure nulle. Le résultat de la première partie de la démonstration entraı̂ne la L-intégrabilité H de chaque gk sur A et les relations A gk = 0, k ∈ N. Une application du théorème de Levi entraı̂ne alors l’intégrabilité de |f |2 sur A et l’égalité J |f |2 = lim J k→∞ A A gk = 0. Comme on l’a vu précédemment, cela implique l’intégrabilité de f sur A et la démonstration est complète. Corollaire. Si A est une partie bornée et n-négligeable de Rn , toute fonction f de Rn dans Rp définie sur A est L-intégrable sur A et J f = 0, A J A |f |2 = 0. Démonstration. On a S(f ) = {x ∈ A : f (x) /= 0} ⊂ A, et S(f ) est donc n-négligeable. Introduisons maintenant une terminologie utile. Définition. Soit A une partie non vide de Rn . On dit qu’une propriété est vraie presque partout sur A (en abrégé p.p. sur A) ou pour presque tout point de A, s’il existe un ensemble E ⊂ A n-négligeable tel que la propriété soit vraie sur A \ E. Exemples. Soit f une fonction de Rn dans Rp. 1. f est définie p.p. sur A si A \ dom f est n-négligeable. 2. f est continue p.p. sur A s’il existe E ⊂ A n-négligeable tel que f soit continue en chaque point de A \ E. 504 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES 3. Si g est une fonction de Rn dans Rp , f = g p.p. sur A si l’ensemble des points x de A pour lesquels f (x) /= g(x) est n-négligeable. On vérifie aisément que l’égalité p.p. de deux fonctions sur un ensemble est une relation d’équivalence. On notera la différence entre une fonction continue p.p. sur A et une fonction égale p.p. sur A à une fonction continue. Ainsi, 1Q n’est continue en aucun point de R, alors qu’elle est égale p.p. sur R à la fonction continue zéro. 4. Considérons une suite (fk )k∈N de fonctions de Rn dans Rp définies p.p. sur A ⊂ Rn . Pour chaque k ∈ N, il existe Ek ⊂ A n-négligeable tel que fk soit ! définie sur A \ Ek , et comme E = k∈N Ek est encore n-négligeable, chaque fonction fk est définie sur A\E. On dira que (fk )k∈N converge ponctuellement p.p. sur A vers une fonction f de Rn dans Rp s’il existe une partie nnégligeable F de A telle que la suite converge ponctuellement vers f sur A \ (E ∪ F ). L’intégrabilité des fonctions sur un ensemble borné n-négligeable donnée plus haut se formule de manière très suggestive dans la terminologie “presque partout”. Proposition. Soit A un borné de Rn et f uneH fonction de Rn dans Rp définie sur A. Alors f est L-intégrable sur A et A |f |2 = 0 si et seulement si f est égale à zéro presque partout sur A. On en déduit aussitôt le résultat suivant. Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp intégrable (resp. L-intégrable) sur A. Alors toute fonction g de Rn dans Rp définie sur A et égale p.p. sur A à f est intégrable (resp. L-intégrable) sur A et J J f= g. A A Démonstration. Par hypothèse, la fonction h = g − f est définie sur A et égale à zéro p.p. sur A. Elle est donc L-intégrable sur A et J h = 0. A En conséquence, g = f + h est intégrable (resp. L-intégrable) sur A et J A g= J f+ A J A h= J A f. 505 13.5. ENSEMBLES NÉGLIGEABLES Notons en passant que, I¯ \ I étant n-négligeable pour tout semi-pavé I de Rn , une fonction de Rn dans Rp sera définie p.p. sur I si et seulement si ¯ On pourra donc utiliser indifféremment l’une ou elle est définie p.p. sur I. l’autre terminologie. Nous pouvons maintenant étendre les notions d’intégrabilité et de Lintégrabilité sur un borné A de Rn aux fonctions définie p.p. sur A. Cette extension utile se fonde sur le résultat suivant. Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp définie p.p. sur A. Si f possède un prolongement f˜ à A qui est intégrable (resp. L-intégrable) sur A, alors tout autre prolongement fˆ de f à A sera intégrable (resp. L-intégrable) sur A et l’on aura J A fˆ = J f˜. A Démonstration. Comme f est définie p.p. sur A, il existe E ⊂ A nnégligeable tel que A \ E ⊂ dom f. Par conséquent, pour tout x ∈ A \ E, on a fˆ(x) − f˜(x) = f (x) − f (x) = 0, ce qui montre que fˆ = f˜ p.p. sur A. La thèse résulte alors de la Proposition précédente. La définition suivante est donc justifiée. Définition. Soit A un borné de Rn et f une fonction de Rn dans Rp définie p.p. sur A. On dit que f est intégrable (resp. L-intégrable) sur A s’il existe un prolongement f˜ de f à A qui soit intégrable (resp. L-intégrable) surH A, H ˜ auquel cas A f , qui ne dépend pas du prolongement f˜ choisi, est noté A f et appelé l’intégrale de f sur A. On en déduit aussitôt que deux fonctions de Rn dans Rp définies p.p. et égales p.p. sur un borné A de Rn sont simultanément intégrables (resp. L-intégrables) sur A, auquel cas leurs intégrales sur A sont égales. Les propriétés élémentaires de l’intégrale, le test de comparaison, les théorèmes de Levi et Lebesgue, les propriétés de restriction et d’additivité et les inégalités de Tchebycheff s’étendent à la nouvelle définition avec des affaiblissements évidents des hypothèses. A titre indicatif, donnons la forme généralisée du théorème de convergence majorée et minorée de Lebesgue. 506 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES Théorème. Soit A un borné de Rn , (fk )k∈N une suite de fonctions de Rn dans R et f une fonction de Rn dans R. Supposons satisfaites les conditions suivantes. 1. Chaque fk est définie p.p. et intégrable sur A. 2. La suite (fk )k∈N converge ponctuellement p.p. sur A vers f . 3. La suite (fk )k∈N est minorée p.p. sur A par une fonction h de Rn dans R définie p.p. et intégrable sur A, et majorée p.p. sur A par une fonction H de Rn dans R définie p.p. et intégrable sur A. Alors f est intégrable sur A et J f = lim J k→∞ A A fk . La convergence de la suite des intégrales sur un ensemble d’une suite de fonctions n’entraı̂ne évidemment pas la convergence ponctuelle des fonctions sur cet ensemble. On construira facilement des contre-exemples. Pour une suite monotone, elle entraı̂ne toutefois la convergence ponctuelle presque partout. Proposition. Soit A un borné de Rn et (fk )k∈N une suite de fonctions de Rn dans R. Supposons satisfaites les conditions suivantes. 1. Chaque fk est définie p.p. et intégrable sur A. 2. La suite (fk )k∈NH est monotone p.p. sur A. 3. La suite réelle ( A fk )k∈N converge. Alors la suite de fonctions (fk )k∈N converge ponctuellement p.p. sur A. Démonstration. Supposons, pour fixer les idées, que (fk )k∈N soit croissante p.p. sur A; en considérant si nécessaire la suite (fk − f0 )k∈N au lieu de (fk )k∈N , on peut, sans perte de généralité, supposer que fk (x) ≥ 0 pour H chaque k ∈ N et presque tout x ∈ A. Puisque la suite ( A fk )k∈N est croissante et convergente, elle est majorée et nous désignerons par M un de ses majorants. D’ailleurs, la suite réelle (fk (x))k∈N est croissante pour presque tout x ∈ A, ce qui implique, pour presque tout x ∈ A, l’existence au sens 7 large de sa limite. Posons F = k∈N dom fk et E = {x ∈ A ∩ F : lim fk (x) = +∞}. k→∞ La Proposition revient à montrer que E est de n-mesure nulle. Comme on a E = {x ∈ A ∩ F : (∀j ∈ N∗ )(∃m ∈ N∗ )(∀k ≥ m) : fk (x) ≥ j}, E= " j∈N∗ > m∈N∗ " k≥m Fkj , 507 13.5. ENSEMBLES NÉGLIGEABLES où l’on a posé Fkj = {x ∈ A ∩ F : fk (x) ≥ j}, pour tous les j et k dans N∗ . Par l’hypothèse 1 et l’inégalité de Tchebycheff, chaque Fkj est n-intégrable et µ(Fkj ) ≤ j −1 D’autre part, on a J A fk ≤ j −1 M. j Fkj+1 ⊂ Fkj ⊂ Fk+1 , ce qui entraı̂ne " j j Fk = Fm , k≥m pour tous les j et k dans N∗ . Pour chaque j ∈ N∗ fixé, la suite " Fkj k≥m j = (Fm )m∈N∗ m∈N∗ est donc une suite croissante de parties n-intégrables de A. Il en résulte que > m∈N∗ " Fkj = > j Fm m∈N∗ k≥m est également n-intégrable et, pour chaque j ∈ N∗ , µ > " m∈N∗ k≥m Fkj Si nous posons maintenant F j = j = lim µ(Fm ) ≤ j −1 M. m→∞ ! m∈N∗ E= " j , alors Fm Fj, j∈N∗ avec chaque F n-intégrable et tel que j µ(F j ) ≤ j −1 M. j entraı̂nent les relations Enfin, les propriétés des Fm F j+1 = > m∈N∗ j+1 Fm ⊂ > j Fm = Fj, m∈N∗ pour chaque j ∈ c’est-à-dire la décroissance de la suite (F j )j∈N∗ . Par 7 conséquent, E = j∈N∗ F j est n-intégrable et N∗ , 0 ≤ µ(E) = lim µ(F j ) ≤ lim j −1 M = 0; j→∞ la démonstration est complète. j→∞ 508 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES En combinant ce résultat à l’extension de la notion d’intégrale que nous venons de donner et au théorème de Levi, nous obtenons l’intéressante généralisation du théorème de convergence monotone de Levi. Théorème. Soit A un borné de Rn et (fk )k∈N une suite de fonctions de Rn dans R. Supposons satisfaites les conditions suivantes. 1. Chaque fk est définie p.p. et intégrable (resp. L-intégrable) sur A. 2. La suite (fH k )k∈N est monotone p.p. sur A. 3. La suite ( A fk )k∈N converge. Alors la suite (fk )k∈N converge ponctuellement p.p. sur A vers une fonction f définie p.p. et intégrable (resp. L-intégrable) sur A et l’on a J A f = lim J k→∞ A fk . Le lecteur formulera aisément la version correspondante pour une série de fonctions. 13.6 Intégrabilité sur une partie non bornée L’extension de la notion d’intégrale de Denjoy-Perron à des parties non bornées de Rn lorsque n ≥ 2 est un problème délicat qui attend encore sa solution définitive. Nous nous contenterons dès lors de développer cette extension dans l’important cas particulier de la L-intégrabilité, en modelant la définition sur une condition nécessaire et suffisante de L-intégrabilité sur un borné obtenue dans l’étude de l’additivité complète. Définition. Soit A une partie non bornée de Rn et f une fonction de Rn dans Rp définie p.p. sur A. On dit que f est L-intégrable sur A si les conditions suivantes sont satisfaites. 1. f est L-intégrable sur Ak = A ∩ B∞ [0; k] pour chaque k ∈ N∗ . H 2. limk→∞ Ak |f |2 existe. La définition de l’intégrale de f sur A requiert le résultat suivant. Proposition. Si f est L-intégrable sur l’ensemble non borné A de Rn , alors H limk→∞ Ak f existe. Démonstration. Pour chaque 1 ≤ j ≤ p et chaque x ∈ dom f, on a 0 ≤ fj+ (x) ≤ |fj (x)| ≤ |f (x)|2 , 0 ≤ fj− (x) ≤ |fj (x)| ≤ |f (x)|2 , 13.6. INTÉGRABILITÉ SUR UNE PARTIE NON BORNÉE 509 et, puisque chacune de ces fonctions est L-intégrable sur Ak quel que soit k ∈ N∗ , on a 0≤ J Ak fj+ ≤ J |f |2 , 0 ≤ Ak J Ak fj− ≤ J Ak |f |2 , quels que soient k ∈ N∗ et 1 ≤ j ≤ p. Comme Ak ⊂ Ak+1 pour tout k ∈ N∗ , les suites 4J 5 4J 5 4J 5 fj+ , fj− , |f |2 , Ak Ak k∈N∗ k∈N∗ Ak k∈N∗ sont croissantes pour chaque 1 ≤ j ≤ p et la dernière est convergente par hypothèse. La convergence des autres découle alors du test de comparaison H et entraı̂ne la convergence de chaque suite ( Ak fj )k∈N∗ , (1 ≤ j ≤ p), puisque J Ak fj = J Ak (fj+ − fj− ), 1 ≤ j ≤ p. Définition. Si f est L-intégrable sur l’ensemble non borné A de RnH , l’intéH grale de f sur A, notée A f est l’élément de Rp défini par limk→∞ Ak f. Exemples. 1. La fonction constante 1 n’est pas L-intégrable sur Rn . Pour H ∗ chaque k ∈ N , on a B∞ [0;k] 1 = (2k)n, et (2k)n → ∞ si k → ∞. 2. La fonction f de Rn dans R définie par f (x) = 1, x ∈ B∞ [0; 1], 1 , x ∈ B∞ [0; k] \ B∞ [0; k − 1], k ≥ 2, kn est L-intégrable sur Rn . En effet, on a f (x) = J J f= B∞ [0;k] = 2 +k n et dès lors −n B∞ [0;1] J f = 2n , f+ B∞ [0;1] k $ j=2 (2j) − n lim J k $ j=2 k J $ f j=2 B∞ [0;j]\B∞[0;j−1] (2(j − 1)) k→∞ B∞ [0;k] n f = 2n+1 . = 2n+1 − 2n k−n , 510 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES Les propriétés élémentaires de la L-intégrale sur un borné, ainsi que le test de comparaison s’étendent aussitôt, via la définition ci-dessus, à l’intégrale sur une partie non bornée. Montrons qu’il en est de même pour le théorème de convergence monotone de Levi. Théorème. Soit A une partie non bornée de Rn et (fk )k∈N une suite de fonctions de Rn dans R. Supposons satisfaites les conditions suivantes. 1. Chaque fk est définie p.p. et L-intégrable sur A. 2. La suite de fonctions (fk )k∈N est monotone p.p. sur A. H 3. La suite réelle ( A fk )k∈N converge. Alors la suite de fonctions (fk )k∈N converge ponctuellement p.p. sur A vers une fonction f définie p.p. et L-intégrable sur A, et l’on a J f = lim J k→∞ A A fk . Démonstration. Supposons pour fixer les idées que (fk )k∈N soit croissante. En considérant la suite (fk − f0 )k∈N au lieu de (fk )k∈N , on peut toujours, sans perte de généralité, supposer que fk (x)H ≥ 0 pour presque tout x ∈ A et chaque k ∈ N. Si nous posons J = limk→∞ A fk , alors J = lim k→∞ & lim J q→∞ Aq ' fk . Pour chaque q ∈ N∗ fixé, la convergence de la suite croissante ( résulte des inégalités J J fk ≤ fk , k ∈ N, Aq H Aq fk )k∈N A et de l’hypothèse 3. On peut donc appliquer le théorème de Levi sur un borné à la suite (fk )k∈N restreinte à Aq et en déduire l’existence d’une fonction f q définie p.p. et L-intégrable sur Aq , telle que (fk )k∈N converge ponctuellement p.p. sur Aq vers f q et telle que J Aq f q = lim J k→∞ Aq fk ≤ lim J k→∞ A fk = J. Notons aussi qu’on a nécessairement f q+1 = f q p.p. sur Aq pour chaque q ∈ N∗ et que l’on peut ainsi définir p.p. sur A une fonction f par la relation f = f q p.p. sur Aq , q ∈ N∗ . Cette fonction fH est évidemment supérieure H ou égale à zéro p.p. sur A et, comme la suite ( Aq f )q∈N∗ = ( Aq f q )q∈N∗ est croissante et majorée par J, elle converge et l’on a lim J q→∞ Aq f ≤ J. 13.6. INTÉGRABILITÉ SUR UNE PARTIE NON BORNÉE Il reste à démontrer que lim J q→∞ Aq 511 f = J. Soit ! > 0; par l’expression de J comme double limite donnée plus haut, il existe m ∈ N∗ tel que J J − (!/2) ≤ lim q→∞ Aq fk ≤ J, lorsque k ≥ m. En conséquence, il existe r ∈ N∗ tel que J −! ≤ J Aq fm ≤ J, dès que q ≥ r. La croissance de la suite (fk )k∈N entraı̂ne alors que pour tout q ≥ r et tout k ≥ m, on a J−!≤ J Aq dès lors, pour tout q ≥ r, on aura J − ! ≤ lim J fk ≤ J; k→∞ Aq fk ≤ J, et la démonstration est complète. Comme la définition et les propriétés correspondantes de l’intégration sur un borné impliquent aisément que max(f, g) et min(f, g) sont L-intégrables sur un non-borné de Rn lorsque les fonctions réelles f et g le sont, on peut étendre à l’intégrale sur une partie non bornée la méthode utilisée dans le cas d’un pavé fermé pour déduire le théorème de convergence majorée et minorée de Lebesgue du théorème de Levi. Le théorème de convergence majorée et minorée de Lebesgue tel qu’il est énoncé dans la section précédente reste donc valable lorsque A est non borné. Etendons maintenant la notion d’ensemble n-intégrable au cas non borné. Définition. Soit A une partie non bornée de Rn . On dit que A est nintégrable si sa fonction caractéristique 1A est L-intégrable sur Rn , auquel H cas le nombre positif Rn 1A est noté µ(A) et appelé sa n-mesure (sa longueur si n = 1, son aire d’un ensemble plan si n = 2, son volume si n = 3). Exemple. Soit A la partie non bornée de R2 définie par A = ({0} × [0, 1]) ∪ {(x, y) : 0 ≤ y ≤ 1/k2 si x ∈]k − 1, k], k ∈ N∗ }. 512 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES Pour chaque k ∈ N∗ , on a Ak = ({0} × [0, 1]) ∪ {(x, y) : 0 ≤ y ≤ 1/j 2 si x ∈]j − 1, j], 1 ≤ j ≤ k}, % et dès lors Ak est 2-intégrable avec µ(Ak ) = kj=1 (1/j 2). Comme la série % 2 j∈N∗ (1/j ) converge, A est 2-intégrable. Les propriétés élémentaires des parties n-intégrables bornées ainsi que les propriétés d’intégrabilité de l’intersection d’une suite décroissante de parties bornées n-intégrables s’étendent aussitôt, avec le même énoncé, au cas non borné. Dans le cas d’une suite croissante (Ak )k∈N de ! parties non bornées, il faut remplacer l’hypothèse que k∈N Ak soit bornée par la condition que (µ(Ak ))k∈N soit majorée et utiliser dans la démonstration la version que nous venons de donner du théorème de Levi. On en déduit la sous-additivité complète de la mesure: si (Ak )k∈N est une % ! suite de parties n-intégrables et si n∈N µ(Ak ) converge, alors k∈N Ak est ! % n-intégrable et µ( k∈N Ak ) ≤ k∈N µ(Ak ). On vérifie également que les propriétés de L-intégrabilité pour la restriction à une partie n-intégrable bornée ou non d’une fonction L-intégrable sur un ensemble non borné, l’additivité finie ou complète de la L-intégrale et l’inégalité de Tchebycheff s’étendent sans peine au cas non borné. Il en est de même des propriétés des ensembles de n-mesure nulle et de l’équivalence entre une partie n-négligeable et une partie de n-mesure nulle. 13.7 Ensembles et fonctions mesurables L’extension suivante de la classe des parties n-intégrables de Rn joue un grand rôle en analyse. Définition. On dit qu’une partie A de Rn est n-mesurable si Ak = A ∩ B∞ [0; k] est n-intégrable pour chaque k ∈ N∗ . A est donc n-mesurable si et seulement si la fonction 1A est intégrable sur B∞ [0; k] pour chaque k ∈ N∗ . Toute partie n-intégrable de Rn est évidemment n-mesurable, mais Rn , qui est évidemment n-mesurable puisque chaque fermé borné B∞ [0; k] est n-intégrable, n’est pas n-intégrable puisque µ(B∞ [0; k]) = (2k)n tend vers l’infini si k tend vers l’infini. Pour les parties bornées, il y a évidemment identité entre les parties n-intégrables et les parties n-mesurables. Proposition. Tout ouvert de Rn est n-mesurable. 13.7. ENSEMBLES ET FONCTIONS MESURABLES 513 Démonstration. Si E ⊂ Rn est ouvert et si k ∈ N∗ , alors Ek = E ∩ B∞ [0; k] = (E ∩ B∞ (0; k)) ∪ (E ∩ fr B∞ [0; k]) est l’union d’un ouvert borné et d’une partie n-négligeable et est par conséquent n-intégrable. Proposition. Tout fermé de Rn est n-mesurable. Démonstration. Si F ⊂ Rn est fermé et si k ∈ N∗ , alors F ∩ B∞ [0; k] est fermé et borné, et donc n-intégrable. Corollaire. L’intérieur, l’adhérence et la frontière d’une partie quelconque de Rn sont n-mesurables. Donnons quelques propriétés élémentaires des ensembles n-mesurables. Proposition. Si A, B et Ak , k ∈ N sont des parties n-mesurables de Rn , ! 7 alors A \ B, k∈N Ak et k∈N Ak sont n-mesurables. Démonstration. Conséquence immédiate de la définition et des propriétés des parties n-intégrables. Proposition. Toute partie n-mesurable contenue dans une partie n-intégrable est n-intégrable. Démonstration. Soit A n-mesurable contenue dans B n-intégrable. Si Ak = A ∩ B∞ [0; k], on a 1Ak (x) ≤ 1B (x) pour chaque x ∈ Rn , la suite (1Ak )k∈N converge ponctuellement sur Rn vers 1A et 1B est L-intégrable sur Rn . La thèse résulte du théorème de convergence majorée et minorée de Lebesgue. L’inégalité de Tchebycheff suggère l’introduction d’une classe de fonctions réelles qui sera aux fonctions réelles L-intégrables ce que les parties n-mesurables sont aux parties n-intégrables. Définition. Soit f une fonction de Rn dans R définie p.p. sur A ⊂ Rn . On dit que f est n-mesurable sur A si, pour chaque r ∈ R l’ensemble A[f > r] = {x ∈ A : f (x) > r} est n-mesurable. Proposition. Si f est n-mesurable sur A, alors A est n-mesurable. Démonstration. On a A = −k] est n-mesurable. ! k∈N A[f > −k] et chaque ensemble A[f > 514 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES On étend la définition aux fonctions à valeurs dans Rp en passant aux composantes. Définition. Soit f une fonction de Rn dans Rp définie p.p. sur A ⊂ Rn . On dit que f est n-mesurable sur A si chaque composante fj de f est n-mesurable sur A. Il suffit donc d’étudier la n-mesurabilité des fonctions réelles. La terminologie est justifiée par le résultat suivant. Proposition. Une partie A de Rn est n-mesurable si et seulement si la fonction constante 1 est n-mesurable sur A. Démonstration. La condition suffisante résulte de la Proposition qui précède. Pour la condition nécessaire, A[1 > r], égal à A si r < 1 et vide si r ≥ 1 est n-mesurable pour tout r ∈ R. Les caractérisations suivantes des fonctions n-mesurables sont souvent utiles. Proposition. Soit f une fonction réelle définie p.p. sur une partie nmesurable A de Rn . Les quatre conditions suivantes sont équivalentes. 1. A[f > r] = {x ∈ A : f (x) > r} est n-mesurable pour chaque r ∈ R. 2. A[f ≥ r] = {x ∈ A : f (x) ≥ r} est n-mesurable pour chaque r ∈ R. 3. A[f < r] = {x ∈ A : f (x) < r} est n-mesurable pour chaque r ∈ R. 4. A[f ≤ r] = {x ∈ A : f (x) ≤ r} est n-mesurable pour chaque r ∈ R. Démonstration. C’est une conséquence facile des relations, aisément vérifiées, A[f ≥ r] = A[f ≤ r] = " k∈N∗ " k∈N∗ A[f > r − (1/k)], A[f < r] = A \ A[f ≥ r], A[f > r + (1/k)], A[f > r] = A \ A[f ≤ r], et des propriétés élémentaires des parties n-mesurables. Le résultat suivant montre que l’ensemble des fonctions n-mesurables est stable pour de très nombreuses opérations d’algèbre et d’analyse. Proposition. Si f et g sont des fonctions réelles n-mesurables sur A ⊂ Rn , et si (fk )k∈S est une famille finie ou une suite de telles fonctions, on a les propriétés suivantes. 1. cf + b est n-mesurable sur A pour chaque b, c ∈ R. 2. f + g est n-mesurable sur A. 13.7. ENSEMBLES ET FONCTIONS MESURABLES 515 3. f 2 est n-mesurable sur A. 4. f g est n-mesurable sur A. 5. f est n-mesurable sur B pour toute partie n-mesurable B de A. 6. 1/f est n-mesurable sur A si f (x) /= 0 p.p. sur A. 7. La fonction supk∈S fk donnée par [supk∈S fk ](x) = supk∈S [fk (x)] est nmesurable sur A lorsqu’elle y est définie p.p.. 8. La fonction inf k∈S fk donnée par [inf k∈S fk ](x) = inf k∈S [fk (x)] est nmesurable sur A lorsqu’elle y est définie p.p.. 9. Si (fk )k∈N converge ponctuellement p.p. sur A vers f , alors f est nmesurable sur A. 10. f + , f − et |f |s sont n-mesurables sur A pour tout s > 0. Démonstration. 1. Si c = 0, A[b > r] = A si r < b et est vide si r ≥ b; il est donc n-mesurable. Si c > 0, on a A[cf + b > r] = A[f + (b/c) > r/c] = A[f > (r − b)/c] qui est n-mesurable quel que soit r ∈ R. Si c < 0 on a A[cf + b > r] = A[f + (b/c) < r/c] = A[f < (r − b)/c] et l’on conclut de même. 2. Pour tout r ∈ R, on a A[f + g > r] = A[f > r − g]. Si f (x) > r − g(x), il existe un rationnel q tel que f (x) > q > r − g(x), et réciproquement, s’il existe un rationnel q tel que f (x) > q et r − g(x) < q, alors f (x) > r − g(x). Par conséquent, A[f > r − g] = > (A[f > q] ∩ A[r − g < q]), q∈Q et le résultat découle des propriétés des parties n-mesurables puisque Q est dénombrable et les ensembles A[f > q] et A[r − g < q] sont n-mesurables. 3. Résulte de ce que A[f 2 > r] = A si r < 0 et A[f 2 > r] = A[f > r 1/2] ∪ A[f < −r 1/2] si r ≥ 0. 4. On a f g = (1/2)[(f +g)2 −f 2 −g 2 ] et le résultat découle des propriétés 1, 2 et 3. 5. Pour tout r ∈ R, B[f > r] = B ∩ A[f > r] est n-mesurable. 6. Notons tout d’abord que A[f = 0] = {x ∈ A : f (x) = 0} est nnégligeable et donc de n-mesure nulle, et dès lors A[f /= 0] = {x ∈ A : f (x) /= 0} = A\A[f = 0] est n-mesurable. En outre, si r > 0, A[(1/f ) > r] = A[f /= 0] ∩ A[f < (1/r)] est n-mesurable tandis que si r < 0, A[(1/f ) > r] = A[(1/f ) > 0] ∪ A[f < (1/r)] est également n-mesurable. Enfin, A[(1/f ) > 0] = A[f > 0] est n-mesurable et le résultat s’ensuit. 516 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES ! 7. Montrons que A[supk∈S fk > r] = k∈S A[fk > r] pour tout r ∈ R. Si [supk∈S fk ](x) > r, il existe, par la caractérisation du supremum (ou trivialement si S est fini) un k0 ∈ S tel que fk0 (x) − r > 0 et dès lors x ∈ A[fk0 > r]. Réciproquement, si fk (x) > r pour un certain k ∈ S, alors [supk∈S fk ](x) > r. La thèse en résulte aisément. 8. Soit r ∈ R. On montre comme ci-dessus que A[inf k∈S fk < r] = ! k∈S A[fk < r] et l’on conclut de la même manière. 9. Un argument utilisé dans l’étude des tests de la racine ou du quotient montre que, pour presque tout x ∈ A, on a f (x) = inf ∗ sup fk (x) = sup inf fk (x), m∈N k≥m m∈N∗ k≥m et la thèse résulte alors des propriétés 7 et 8. 10. On a f + = max(f, 0), f − = max(−f, 0), |f | = f + + f − , et la thèse résulte des propriétés 7 et 2 et du raisonnement fait en 3 pour le cas de |f |s. Donnons maintenant deux classes importantes de fonctions n-mesurables. Proposition. Toute fonction réelle continue p.p. sur une partie n-mesurable A de Rn est n-mesurable sur A. Démonstration. Si f est une telle fonction, sa continuité sur A \ B avec B de n-mesure nulle entraı̂ne que pour chaque r ∈ R, (A \ B)[f > r] = (A \ B) ∩ E pour un certain ouvert E de Rn . Comme tout ouvert est nmesurable, le résultat s’ensuit. Proposition. Toute fonction réelle définie p.p. et L-intégrable sur une partie n-mesurable A de Rn est n-mesurable sur A. Démonstration. Si f est une telle fonction, on peut toujours, en passant à f et f − , supposer sans perte de généralité que f (x) ≥ 0 pour presque tout x ∈ A. Par hypothèse, f est L-intégrable sur l’ensemble n-mesurable Ak = A ∩ B∞ [0; k] pour chaque k ∈ N∗ . Dès lors, si r > 0, l’inégalité de Tchebycheff entraı̂ne la n-intégrabilité, et donc la n-mesurabilité de Ak [f > r]; d’autre part, si r ≤ 0, Ak [f ≥ r] = Ak est également n-mesurable. Il en ! résulte aussitôt que A[f ≥ r] = k∈N∗ Ak [f ≥ r] est n-mesurable quel que soit r ∈ R. + La réciproque de cette proposition est fausse : la fonction constante 1 est n-mesurable sur Rn sans y être L-intégrable. Même si A est n-intégrable, une fonction peut-être n-mesurable sur A sans y être L-intégrable. Ainsi, la 13.7. ENSEMBLES ET FONCTIONS MESURABLES 517 fonction f définie sur ]0, 1] par f (x) = 1/x est 1-mesurable sur ]0, 1] puisque qu’elle y est continue alors qu’une application facile du théorème de Hake montre qu’elle n’est pas intégrable sur ]0, 1]. Nous allons toutefois établir un important test de comparaison de L-intégrabilité sur A pour les fonctions n-mesurables sur A. Sa démonstration nécessite l’introduction de quelques concepts et résultats préliminaires. Définition. Soit E une partie de Rn et s une fonction de Rn dans Rp . On dit que s est simple sur E si s est définie sur E et si s(E) est une partie finie de Rp. Si s est simple sur E, si s(E) = {y 1 , . . . , y r } et si Ej = s−1 ({y j }) = {x ∈ E : s(x) = y j }, 1 ≤ j ≤ r, on aura, pour tout x ∈ E, s(x) = r $ 1Ej (x).y j . j=1 Par conséquent, toute fonction simple sur E peut s’écrire comme une somme finie de produits, par des éléments de Rp , de fonctions caractéristiques de parties de E qui partitionnent cet ensemble. Nous allons montrer que toute fonction réelle définie sur un ensemble est la limite ponctuelle sur cet ensemble d’une suite de fonctions simples. Proposition. Soit f une fonction réelle définie sur une partie E de Rn . Alors il existe une suite (sk )k∈N∗ de fonctions simples sur E qui converge ponctuellement sur E vers f et une suite (tk )k∈N∗ croissante sur E de fonctions simples et positives sur E convergeant ponctuellement sur E vers |f |. Si f est bornée sur E, la suite ainsi obtenue converge uniformément sur E vers f . Démonstration. Supposons tout d’abord que f (x) ≥ 0 pour tout x ∈ E. Définissons Ekj et Fk pour 1 ≤ j ≤ k.2k , k ∈ N∗ par Ekj = {x ∈ E : 2−k (j − 1) ≤ f (x) < 2−k j}, Fk = {x ∈ E : f (x) ≥ k}, et sk : Rn → R par sk (x) = k k.2 $ j=1 2−k (j − 1).1E j (x) + k.1Fk (x). k Etant donnés x ∈ E et ! > 0, choisissons m ∈ N∗ tel que m > f (x) et 2−m ≤ !; on aura donc f (x) < k pour tout k ≥ m et il existera donc un 518 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES 1 ≤ j ≤ k.2k tel que x ∈ Ekj . En conséquence, et donc sk (x) = 2−k (j − 1), 2−k (j − 1) ≤ f (x) < 2−k j, 0 ≤ f (x) − sk (x) < 2−k ≤ 2−m ≤ !. On voit ainsi que la suite (sk )k∈N∗ converge ponctuellement sur E vers f . Notons en outre que si f est majorée par M sur E, la convergence sera uniforme sur E puisqu’on pourra toujours prendre m > M et 2−m ≤ ! dans le raisonnement ci-dessus. Montrons maintenant que la suite (sk )k∈N∗ est croissante sur E. Soient x ∈ E et k ∈ N∗ ; si f (x) ≥ k + 1, alors, puisque f (x) > k, on a sk+1 (x) = k + 1 > k = sk (x); si k ≤ f (x) < k + 1, il existe 2k+1 k ≤ j ≤ 2k+1 (k + 1) tel que k ≤ 2−k−1 (j − 1) ≤ f (x) < 2−k−1 j, et dès lors sk+1 (x) = 2−k−1 (j − 1) ≥ k = sk (x); enfin, si f (x) < k, il existera 1 ≤ j < k.2k+1 tel que 2−k−1 (j − 1) ≤ f (x) < 2−k−1 j, et il existera 1 ≤ l < k.2k tel que 2−k (l − 1) ≤ f (x) < 2−k l, ce qui entraı̂ne Comme sk+1 (x) = 2−k−1 (j − 1), sk (x) = 2−k (l − 1). 2(l − 1)2−k−1 ≤ f (x) < (2l)2−k , on a et par conséquent, 2l − 2 = 2(l − 1) ≤ j − 1 < j ≤ 2l, sk+1 (x) = 2−k−1 (j − 1) ≥ 2−k−1 2(l − 1) = 2−k (l − 1) = sk (x); la croissance est démontrée. Lorsque f (x) n’est pas positive pour tout x ∈ E, on applique séparément la construction ci-dessus à f + et à f − et comme les suites associées respectivement à f + et à f − sont croissantes, leur somme sera croissante et convergera ponctuellement sur E vers |f |. 13.7. ENSEMBLES ET FONCTIONS MESURABLES 519 Corollaire. Si f est une fonction réelle n-mesurable sur E ⊂ Rn , alors les suites de fonctions simples construites dans la proposition précédente sont formées de combinaisons linéaires de fonctions caractéristiques de parties n-mesurables de E et sont donc n-mesurables sur E. Démonstration. Supposons tout d’abord que f (x) ≥ 0 pour tout x ∈ E et reprenons les notations de la démonstration de la proposition précédente. Pour chaque r ≥ 0, posons Fr = {x ∈ E : f (x) ≥ r}, ce qui entraı̂ne aussitôt que Fs ⊂ Fr si s > r, et Ekj = F2−k (j−1) \ F2−k j . On en déduit aussitôt que, pour chaque k ∈ N∗ et chaque x ∈ Rn , on a k sk (x) = 2 k $ j=1 2−k (j − 1)[1F2−k (j−1) − 1F2−k j (x)] = k 2 k $ j=2 2−k (j − 1)[1F2−k (j−1) − 1F2−k j (x)]. En vertu de la n-mesurabilité de f sur E, chaque fonction 1F2−k j et 1Fk est n-mesurable, et le résultat s’en déduit. Si f n’est pas positive sur E, il suffit de considérer séparément f + et f − . Nous pouvons maintenant énoncer et démontrer un très utile test de comparaison pour la L-intégrabilité des fonctions n-mesurables. Théorème. Soit f une fonction réelle définie p.p. et n-mesurable sur A ⊂ Rn . S’il existe une fonction positive g L-intégrable sur A et telle que, pour presque tout x ∈ A, on ait |f (x)| ≤ g(x), alors f est L-intégrable sur A. Démonstration. Supposons tout d’abord que f soit positive p.p. sur A. Par le corollaire ci-dessus, il existe une suite croissante (sk )k∈N∗ de fonctions positives p.p. et n-mesurables sur A, explicitement donnée dans le corollaire, qui converge ponctuellement p.p. sur A vers f . En outre, si l’on pose Fr = {x ∈ A : f (x) ≥ r} et Gr = {x ∈ A : g(x) ≥ r}, on aura évidemment Fr ⊂ Gr pour chaque r ∈ R. Comme l’inégalité de Tchebycheff entraı̂ne la nintégrabilité de Gr pour chaque r > 0, chaque ensemble Fr sera également nintégrable pour chaque r > 0. Dès lors, chaque fonction sk sera L-intégrable sur A et telle que, pour presque tout x ∈ A, on a 0 ≤ sk (x) ≤ f (x) ≤ g(x), k ∈ N∗ , 520 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES Le théorème de convergence majorée et minorée de Lebesgue entraı̂ne alors la L-intégrabilité de f sur A. Si f n’est pas positive p.p. sur A, on applique le résultat que nous venons de démontrer séparément à f + et f − et la démonstration est complète. Corollaire. Toute fonction réelle n-mesurable sur A ⊂ Rn dont la valeur absolue est L-intégrable sur A, est elle-même L-intégrable sur A. Démonstration. Prendre g = |f | dans le test de comparaison. On a aussi un intéressant résultat sur la L-intégrabilité d’un produit de fonctions. Corollaire. Si f est une fonction réelle L-intégrable sur A ⊂ Rn et g une fonction réelle n-mesurable et bornée p.p. sur A, alors f g est L-intégrable sur A. Démonstration. On sait que f g est n-mesurable sur A et si M est un majorant p.p. de |g| sur A, on aura, pour presque tout x ∈ A, |f (x)g(x)| ≤ M |f (x)|, et le test de comparaison permet de conclure puisque M |f | est L-intégrable sur A. Exemple. Soit f une fonction réelle L-intégrable sur I = [0, 2π]. Le dernier corollaire implique que, pour chaque k ∈ N, les fonctions x 2→ f (x) cos kx et x 2→ f (x) sin kx sont également L-intégrables sur I. Les nombres réels a0 , ak , bk , k ∈ N∗ définis par les formules a0 = (2π)−1 J 0 2π f (x) dx, ak = π −1 bk = π −1 J 2π 0 J 2π f (x) cos kx dx, 0 f (x) sin kx dx, k ∈ N∗ , sont appelés les coefficients de Fourier de f , et la série trigonométrique correspondante $ a0 + (ak cos kx + bk sin kx) k∈N∗ s’appelle la série de Fourier de f . L’étude de la convergence de cette série est un problème délicat qui ne sera pas abordé ici. Ainsi, Andrej N. Kolmogorov a donné en 1926 un exemple de fonction L-intégrable sur I dont la série de Fourier diverge partout sur I ! Il a fallu attendre 521 13.7. ENSEMBLES ET FONCTIONS MESURABLES 1966 pour que Lennart Carleson démontre que la série de Fourier de f converge ponctuellement p.p. sur I vers f sous l’hypothèse plus forte que f soit 1-mesurable sur I et f 2 soit L-intégrable sur I (ce qui entraı̂ne la L-intégrabilité de f sur I par le test de comparaison ci-dessus puisque |f (x)| ≤ (1/2)(1 + |f (x)|2 )). Ce résultat avait été conjecturé par Nicolas N.Lusin en 1913 ! Même pour le cas encore plus particulier d’une fonction f continue sur I, on n’a pas nécessairement convergence ponctuelle partout sur I de la série de Fourier de f vers f . Par contre, si f est de classe C 1 sur I et si f (0) = f (2π), on peut démontrer que la série de Fourier de f converge uniformément sur I vers f . La théorie des séries de Fourier et ses diverses extensions ont joué et jouent encore un rôle absolument fondamental dans le développement des mathématiques pures et appliquées. Une autre conséquence utile du test de comparaison est le résultat suivant. Corollaire. Si f est une fonction réelle continue sur un fermé borné A de Rn , alors f est L-intégrable sur A. Démonstration. A, fermé et borné, est n-intégrable et f , continue sur A, y est n-mesurable. D’autre part, le théorème de Weierstrass entraı̂ne que f est bornée sur A et la thèse résulte du test de comparaison ci-dessus et du fait que toute fonction constante sur A y est L-intégrable. Les notions de fonctions L-intégrables et n-mesurables permettent d’introduire de nouvelles notions de convergence pour les suites de fonctions: la convergence en moyenne et la convergence en moyenne quadratique. Définition. Si (fk )k∈N est une suite de fonctions de Rn dans Rp L-intégrables sur A (resp. n-mesurables sur A et telles que chaque |fk |22 soit Lintégrable sur A), et si f est une fonction de Rn dans Rp L-intégrable sur A (resp. n-mesurable sur A et telle que |f |22 soit L-intégrable sur A), on dit que (fk )k∈N converge en moyenne sur A (resp. converge en moyenne quadratique sur A) vers f si la suite 4J A |fk − f |2 5 k∈N (resp. 4J A |fk − f |22 5 ) k∈N converge vers zéro. On a également une notion importante de convergence pour les suites de fonctions n-mesurables: la convergence en mesure. Définition. Si (fk )k∈N est une suite de fonctions de Rn dans R n-mesurables sur A, on dit que (fk )k∈N converge en mesure sur A vers f si, pour 522 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES chaque k ∈ N suffisamment grand et chaque ! > 0, l’ensemble {x ∈ A : |fk (x) − f (x)| ≥ !} est n-intégrable et si lim µ ({x ∈ A : |fk (x) − f (x)| ≥ !}) = 0. k→∞ Cette notion joue un rôle important en calcul des probabilités. Le lien entre ces types de convergence et ceux déjà introduits sera étudié au Chapitre 17. 13.8 Exercices 1. Montrer que tout borné n-intégrable de mesure non nulle contient un ensemble qui n’est pas n-intégrable. Suggestion : soit E ⊂ B∞ [ρ] ⊂ Rn un tel borné et définissons-y la relation d’équivalence x = y si et seulement si x − y ∈ Qn ; soit (Eα)α∈A la partition correspondante de E en classes d’équivalence; si x ∈ Eα, alors Eα = (x + Qn ) ∩ E est dénombrable et donc n-négligeable; en déduire que A est non dénombrable (puisque µ(E) > 0); par l’axiome du choix, on choisit, pour chaque α ∈ A, un xα ∈ Eα et l’on définit F par F = {xα : α ∈ A}; F n’est pas dénombrable et, pour r ∈ Qn , on pose Fr = r + F (noter que Fr ∩ Fr" = ∅ si r /= r $ ) et G= > > Fr = r∈Qn ; |r|∞ ≤2ρ > (xα + r) ⊃ E; r∈Qn ; |r|∞ ≤2ρ α∈A si F est n-intégrable, G l’est aussi et dès lors, si µ(F ) = 0, alors µ(E) = $ µ(Fr ) = 0, r∈Qn , |r|∞ ≤2ρ (contradiction), tandis que si µ(F ) > 0, alors µ(G) ≤ $ µ(Fr ) = +∞, r∈Qn , |r|∞ ≤2ρ (contradiction); donc F n’est pas n-intégrable. 2. Soit f une fonction de Rn dans R et A ∈ Rn . Montrer que si |f | (resp. f 2 ) est n-mesurable sur A, f ne l’est pas nécessairement. Suggestion. Si E ⊂ Rn est une partie non n-intégrable (voir exercice précédent), alors f = 1E − 1Rn \E n’est pas n-mesurable sur Rn alors que |f | = 1 et f 2 = 1 le sont. 523 13.8. EXERCICES 3. Montrer que l’ensemble de Cantor défini aux Exercices du Chapitre 4 est 1-négligeable. Cela fournit un exemple d’ensemble 1-négligeable et non dénombrable. 4. Montrer que si (fk )k∈N est une suite de fonctions de Rn dans R intégrables sur A ⊂ Rn et telles que, pour presque tout x ∈ A, on ait, pour une certaine fonction g de Rn dans R intégrable sur A, fk (x) ≥ g(x) (resp. fk (x) ≤ g(x)), (k ∈ N), alors, si lim inf k→∞ J A fk (resp. lim sup k→∞ J A fk ), existe et si la fonction lim inf k→∞ fk (resp. lim supk→∞ fk ) existe, cette fonction est intégrable sur A et l’on a J lim inf fk ≤ lim inf A k→∞ (resp. J A k→∞ J A fk , lim sup fk ≥ lim sup k→∞ k→∞ J A fk ). Ce résultat s’appelle le lemme de Fatou. Considérant, pour fixer les idées, le cas de lim inf et travaillant sur fk − g au lieu de fk , on peut supposer les fk positives p.p. sur A. On notera que l’on a, p.p. sur A, lim inf fk = lim k→∞ k→∞ 4 inf fj j≥k 5 = lim 2 lim k→∞ l→∞ 4 min fj k≤j≤l 53 , et le lemme de Fatou se déduit de deux applications successives du théorème de convergence monotone de Levi. 5. Montrer que si f est une fonction de Rn dans R et A une partie de Rn telles que f soit mesurable sur A et |f |2 soit intégrable sur A, alors, pour tout r > 0, on a, si Ar = {x ∈ A : |f (x)| > r}, µ(Ar ) ≤ 1 r2 J A |f |2 . (Inégalité de Tchebycheff pour les fonctions de carré intégrable). Cette inégalité joue un grand rôle en calcul des probabilités: en appliquant ce H 8 1 1 résultat à f − f , où f = µ(A) A f, et en posant σ(f ) = µ(A) on trouve µ{x ∈ A : |f (x) − f | > tσ(f )} 1 ≤ 2, µ(A) t H A |f − f |2 91/2 , 524 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES ce qui donne une limite à la dispersion, autour de sa moyenne f , d’une variable aléatoire f admettant un écart quadratique moyen σ(f ), et permet de prouver la loi faible des grands nombres. 6. Montrer que si f est une fonction de Rn dans Rp L-intégrable sur Rn , alors f n’a pas nécessairement de limite à l’infini, et n’est même pas nécessairement bornée au voisinage de l’infini. Suggestion. Utiliser le théorème de Hake pour montrer que la fonction de R dans R définie par f (x) = ∞ $ k=1 2k 1Yk− 1 2k ,k+ 1 2k : est L-intégrable sur R alors qu’elle n’est pas bornée au voisinage de l’infini. 7. Montrer que si f est une fonction de Rn dans Rp L-intégrable sur Rp et si limx→∞ f (x) existe, alors cette limite est nulle. Suggestion. Si L = limx→∞ f (x) /= 0, il existe m ∈ N tel que |f (x)|2 ≥ |L|2 2 pour tout x ∈ Rn tel que |x|∞ ≥ m. En conséquence, pour tout k ≥ m, J B∞ [k] ≥ |f |2 = J B∞ [m] J B∞ [m] |f |2 + |f |2 + J B∞ [k]\B∞[m] |f |2 |L|2 [(2k)n − (2m)n ] , 2 H ce qui montre que limk→∞ B∞ [k] |f |2 = ∞. On comparera utilement les résultats des exercices 6 et 7 à ceux correspondants pour une série. 13.9 Petite anthologie Tous les ensembles que nous considérerons seront formés de points compris entre 0 et 1. Lorsqu’un ensemble sera formé de tous les points compris dans une infinité dénombrable d’intervalles n’empiétant pas les uns sur les autres et ayant une longueur totale s, nous dirons que l’ensemble a pour mesure s. Lorsque deux ensembles n’ont pas de points communs, et que leurs mesures sont s et s$ , l’ensemble obtenu en les réunissant, c’est-à-dire leur somme, a pour mesure s + s$ . D’ailleurs il importe peu que dans la définition de la mesure d’un ensemble, ou dans celle de la somme de deux ensembles, qu’on néglige ou qu’on tienne tel compte qu’on veut des extrémités des intervalles, en infinité dénombrable. Plus généralement, si l’on a une infinité dénombrable d’ensembles n’ayant deux à deux aucun point commun 13.9. PETITE ANTHOLOGIE 525 et ayant respectivement pour mesures s1 , s2 , . . ., sn , . . . , leur somme (ou ensemble formé par leur réunion) a pour mesure s1 + s2 + . . . + sn + . . . . Tout cela est une conséquence de la définition de la mesure. Voici maintenant des définitions nouvelles : si un ensemble E a pour mesure s, et contient tous les points d’un ensemble E $ dont la mesure est s$ , l’ensemble E − E $ , formé des points de E qui n’appartiennent pas à E $ , sera dit avoir pour mesure s − s$ ; de plus, si un ensemble est la somme d’une infinité dénombrable d’ensembles sans partie commune, sa mesure sera la somme des mesures de ses parties et enfin les ensembles E et E $ ayant, en vertu de ces définitions, s et s$ comme mesures, et E renfermant tous les points de E $ , l’ensemble E − E $ aura pour mesure s − s$ . Emile Borel, 1898 Nous nous proposons d’attacher à chaque ensemble borné un nombre positif ou nul que nous appellerons sa mesure et satisfaisant aux conditions suivantes : 1. Il existe des ensembles dont la mesure n’est pas nulle. 2. Deux ensembles égaux ont même mesure. 3. La mesure de la somme d’un nombre fini ou d’une infinité dénombrable d’ensembles, sans points communs deux à deux, est la somme des mesures de ces ensembles. Nous ne résoudrons ce problème de la mesure que pour les ensembles que nous appellerons mesurables. Henri Lebesgue, 1902 Une fonction sera dite sommable si, quels que soient a et b, l’ensemble des valeurs de x pour lesquelles on a a < f (x) < b est mesurable. Les fonctions continues par rapport à l’ensemble des variables sont sommables. La somme, le produit de deux fonctions sommables, la limite d’une suite de fonctions sommables sont des fonctions sommables. Donc les fonctions discontinues que Mr. Baire appelle fonctions de première classe, de seconde classe, etc. sont sommables. Les fonctions de n variables continues par rapport à chacune d’elles sont de n − 1e classe au plus, donc elles sont sommables. Henri Lebesgue, 1902 526 CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES La question de l’existence des classes d’ensembles se ramène à celle des classes de fonctions et réciproquement. ... Commençons par montrer la dépendance des deux classifications. Soit E un ensemble mesurable (B). Définissons une fonction φ(x) égale à 1 dans E et à 0 dans !E. Nous l’appellerons la fonction caractéristique de E. Charles-Jean de La Vallée Poussin, 1915 Chaque progrès avait consisté à estimer la mesure d’un ensemble E au moyen de la longueur totale d’un ensemble d’intervalles couvrant E. Mais on avait toujours pris ces intervalles parmi des intervalles choisis d’avance. Borel a écrit lui-même que son point de départ a été de prendre, pour chaque ensemble, des intervalles non seulement couvrant l’ensemble, mais dépendant directement de cet ensemble. En prenant comme intervalles ceux qu’on obtient en divisant un segment en parties égales, Jordan arrivait à la conclusion que l’ensemble R des points d’abscisse rationnelle entre 0 et 1 avait pour mesure l’unité. En attachant, avec Borel, à chaque point d’abcisse rationnelle rn un segment de longueur !/n2 , on constate que R est couvert % par un ensemble d’intervalles dont la longueur totale est ! n12 ; sa mesure devant intuitivement être inférieure à ce total est aussi petite que l’on veut avec !. Borel arrivait ainsi à cette conclusion, qui, à l’époque, a paru surprenante, que l’ensemble des nombres rationnels, pourtant dense partout, était de mesure nulle. C’est par cet exemple que Borel a été conduit à la notion générale de mesure. Maurice Fréchet, 1965 Chapitre 14 Représentations et transformations 14.1 Limites et continuité Si f est une fonction de R dans R intégrable sur [a, b],H on sait que son intégrale indéfinie est l’application F : [a, b] → R, x 2→ ax f (t) dt. Si nous définissons g : [a, b] × [a, b] → R, (x, t) 2→ 1[a,x]f (t), l’intégrale indéfinie de f peut encore se définir par la formule F (x) = J b a g(x, t) dt. On a vu précédemment que la fonction Gamma d’Euler était définie pour chaque x ∈ ]0, ∞[ par la formule Γ(x) = J +∞ 0 tx−1 exp(−t) dt. Si f est une fonction de Rn dans C L-intégrable sur Rn , la transformée de Fourier de f est la fonction de Rn dans C définie par la formule fˆ(x) = J Rn exp[−2iπ(x|y)]f (y) dy. Plus généralement, si, pour p = (ξ1 + iη1 , . . . , ξn + iηn ) ∈ Cn , 527 528 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS % et y ∈ Rn , on pose (p|y) = nj=1 pj yj , et si f est une fonction de Rn dans C, la transformée de Laplace de f est la fonction de Cn dans C définie sur Γf = {p ∈ Cn : exp[−(p|·)]f est intégrable sur Rn } par Lf (p) = J Rn exp[−(p|y)]f (y) dy. Le potentiel du champ de gravitation créé par un corps matériel M de densité variable ρ en un point x ∈ R3 extérieur à M est donné par la formule V (x) = −G J M ρ(y) dy, |x − y|2 où G désigne la constante de gravitation. Les fonctions données dans tous ces exemples ont en commun d’être définies à partir d’une fonction de plusieurs variables que l’on intègre, sur un ensemble fixe, par rapport à une partie des variables seulement. On les appelle des représentations intégrales, des intégrales paramétriques ou des fonctions définies par une intégrale. Dans toute ce chapitre, sauf mention contraire, l’expression “intégrable sur B” devra se lire “L-intégrable sur B” lorsque B est une partie non bornée contenue dans un espace vectoriel de dimension supérieure ou égale à 2. Si q ≥ 1 et s ≥ 1 sont des entiers tels que q + s = n, nous écrirons Rn sous la forme Rq × Rs avec l’écriture correspondante x = (y, z) pour chaque élément x de Rn . Définition. Soit f une fonction de Rn dans Rp , A une partie de Rq et B une partie de Rs . Si, pour chaque y ∈ A (resp. pour presque tout y ∈ A), la fonction f (y, ·) de Rs dans Rp est intégrable sur B, alors l’application F de A dans Rp définie (resp. définie p.p.) par F (y) = J f (y, z) dz B est appelée une intégrale paramétrique ou une application définie par une intégrale. On dit aussi que le membre de droite est une représentation intégrale de F. Dans le cas particulier important où h est une fonction de Rs dans C et K une fonction de Rn dans C telles que, pour chaque y ∈ A (resp. pour presque tout y ∈ A), la fonction f (y, ·), avec f définie (resp. définie 529 14.1. LIMITES ET CONTINUITÉ p.p.) sur A par f (y, z) = K(y, z)h(z), soit intégrable sur B, l’application correspondante H définie (resp. définie p.p.) sur A par H(y) = J K(y, z)h(z)dz B est appellée la transformée intégrale de h de noyau K. Lorsque g et h sont des fonctions de Rq dans C telles que, pour presque tout y ∈ Rq , la fonction f (y, ·), avec f définie par f (y, z) = g(y − z)h(z), est L-intégrable sur Rq , l’application correspondante g ∗ h définie p.p. sur Rq par (g ∗ h)(y) = H Rq g(y − z)h(z) dz s’appelle le produit de convolution de g et h. Comme pour les fonctions définies par la limite d’une suite de fonctions ou la somme d’une série de fonctions, il est intéressant de savoir sous quelles conditions certaines propriétés de la fonction f sont conservées par F . En passant, si nécessaire, aux composantes de F et f , on peut, sans perte de généralité, supposer que p = 1. Considérons tout d’abord le problème fondamental de l’existence d’une limite pour F (y) lorsque y tend vers a ∈ adh A ou tend vers l’infini. Proposition. Soit a ∈ adh A (resp. A non borné) et supposons satisfaites les conditions suivantes. 1. f (y, ·) est intégrable sur B pour chaque y ∈ A. 2. limy→a, y∈A f (y, z) (resp. limy→∞, y∈A f (y, z)) existe pour presque tout z ∈ B. 3. Il existe r > 0 et des fonctions réelles g et h intégrables sur B telles que, pour tout y ∈ A ∩ B∞ [a; r] (resp. y ∈ !B∞ [0; r] ∩ A) et presque tout z ∈ B, on a g(z) ≤ f (y, z) ≤ h(z). Alors la fonction ϕ définie presque partout sur B par ϕ(z) = lim y→a, y∈A f (y, z) (resp. lim y→∞, y∈A f (y, z)) est intégrable sur B et lim y→a, y∈A F (y) = J ϕ(z) dz (resp. B lim y→∞, y∈A F (y) = J ϕ(z) dz). B En d’autres termes, on a lim y→a, y∈A 2J B 3 f (y, z) dz = J 2 lim B y→a, y∈A 3 f (y, z) dz 530 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS (resp. lim y→∞, y∈A 2J 3 f (y, z) dz = B J 2 B lim y→∞, y∈A 3 f (y, z) dz. Démonstration. Considérons, pour fixer les idées, le cas où y → a. Soit (yk )k∈N une suite dans A∩B∞ [a; r] qui converge vers a. La suite (f (yk , ·))k∈N de fonctions intégrables sur B converge ponctuellement p.p. sur B vers ϕ et est telle que g(z) ≤ f (yk , z) ≤ h(z) pour tout k ∈ N et presque tout z ∈ B. Le théorème de convergence majorée et minorée de Lebesgue entraı̂ne alors l’intégrabilité de ϕ sur B et les relations J J lim F (yk ) = lim f (yk , z) dz = ϕ(z) dz. k→∞ k→∞ B B La proposition résulte du caractère local de la notion de limite et de sa caractérisation par les suites. Une conséquence facile de cette proposition est la continuité de F en a lorsque f (·, z) est continue en a pour presque tout z ∈ B et que les hypothèses 1 et 3 sont vérifiées. Corollaire. Supposons satisfaites les conditions suivantes. 1. f (y, ·) est intégrable sur B pour chaque y ∈ A. 2. f (·, z) est continue en a ∈ A pour presque tout z ∈ B. 3. Il existe r > 0 et des fonctions réelles g et h intégrables sur B tels que, pour tout y ∈ B∞ [a; r] ∩ A et presque tout z ∈ B, on ait g(z) ≤ f (y, z) ≤ h(z). Alors F est continue en a. Corollaire. Si f est continue sur A × B, A est ouvert et B est fermé et borné, alors F est continue sur A. Démonstration. Par hypothèse, f (y, ·) est continue sur B, et donc intégrable sur B pour chaque y ∈ A, et f (·, z) est continue sur A pour chaque z ∈ B. D’autre part, si a ∈ A, il existe r > 0 tel que B∞ [a; r] ⊂ A et dès lors, f étant continue sur le fermé borné B∞ [a; r] × B, il existe C > 0 tel que −C ≤ f (y, z) ≤ C pour tout (y, z) ∈ B∞ [a; r] × B. Il suffit donc de prendre g = −C = −h dans la Proposition précédente. 531 14.2. RÈGLE DE LEIBNIZ 14.2 Règle de Leibniz Passons maintenant à la dérivabilité d’une fonction définie par une intégrale. Le résultat suivant s’appelle la règle de Leibniz de dérivation sous le signe d’intégration. Proposition. Supposons que int A /= ∅ et que les conditions suivantes soient satisfaites. 1. f (y, ·) est intégrable sur B pour chaque y ∈ A. 2. Il existe un entier 1 ≤ i ≤ q, un point a ∈ int A et un réel r > 0 tels que B∞ [a; r] ⊂ A et tels que f (·, z) possède pour presque tout z ∈ B une dérivée partielle par rapport à yi en chaque point y ∈ B∞ [a; r]. 3. Il existe deux fonctions réelles g et h intégrables sur B telles que, pour tout y ∈ B∞ [a; r] et presque tout z ∈ B, on ait g(z) ≤ Dyi f (y, z) ≤ h(z). Alors F possède en a une dérivée partielle par rapport à yi , Dyi f (a, ·) est intégrable sur B et J Di F (a) = Dyi f (a, z) dz. B En d’autres termes, Di 2J 3 f (a, z) dz = B J B Dyi f (a, z) dz. Démonstration. Soit ψ la fonction définie sur ([−r, r] \ {0}) × B par le quotient différentiel ψ(h, z) = h−1 [f (a + hei , z) − f (a, z)]. Par construction, ψ(h, ·) est intégrable sur B pour chaque h ∈ [−r, r] \ {0} et lim ψ(h, z) = Dyi f (a, z) h→0, h(=0 pour presque tout z ∈ B. En outre, en appliquant le théorème de Lagrange à la fonction h → f (a + hei , z), on obtient, pour chaque h ∈ [−r, r] et pour presque tout z ∈ B un h$ ∈ R tel que 0 < |h$ | < |h| et f (a + hei , z) − f (a, z) = hDyi (a + h$ ei , z). En conséquence, par l’hypothèse 3, on a g(z) ≤ ψ(h, z) ≤ h(z) 532 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS pour tout h ∈ [−r, r]\{0} et presque tout z ∈ B. On peut donc appliquer à ψ la Proposition relative à la limite d’une intégrale paramétrique, qui implique l’intégrabilité de Dyi f (a, ·) sur B et l’égalité J lim h→0, h(=0 B ψ(h, z) dz = J B Dyi f (a, z) dz. Comme on a évidemment lim J h→0, h(=0 B ψ(h, z) dz = = lim 1 h→0, h(=0 h h→0, h(=0 lim J B [f (a + hei , z) − f (a, z)] dz h−1 [F (a + hei ) − F (a)], on voit que DiF (a) existe et vaut H B Dyi f (a, z) dz. Corollaire. Si A est ouvert, B est fermé borné et s’il existe 1 ≤ i ≤ q tel que, pour chaque (y, z) ∈ A × B, f possède une dérivée partielle par rapport à yi en (y, z) et si la fonction dérivée partielle Dyi f est continue sur A × B, alors F possède en chaque y ∈ A une dérivée partielle par rapport yi , la fonction dérivée partielle Di F est continue sur A et l’on a, pour chaque y ∈ A, J Di F (y) = B Dyi f (y, z) dz. Démonstration. Soit a ∈ A et r > 0 tels que B∞ [a; r] ⊂ A. Pour chaque y ∈ B∞ [a; r], la fonction Dyi f (y, ·) est continue, et donc intégrable, sur B et, Dyi f étant continue sur le fermé borné B∞ [a; r] × B, il existera C > 0 tel que −C ≤ Dyi f (y, z) ≤ C pour tout (y, z) ∈ B∞ [a; r] × B. Les conditions de la Proposition précédente sont donc satisfaites. Le seul point qui n’en découle pas, à savoir la continuité de DiF , est une conséquence de la formule de Leibniz et du Corollaire cidessus sur la continuité d’une intégrale paramétrique. La règle de Leibniz peut être utilisée pour calculer certaines intégrales. Pour montrer, par exemple que, si a et b sont strictement positifs, on a J 0 +∞ exp(−ax) − exp(−bx) b dx = ln x a il suffit de noter tout d’abord que les deux membres, considérés comme fonctions de b, sont tous deux égaux (à zéro) si b = a. Ces fonctions seront 533 14.2. RÈGLE DE LEIBNIZ donc égales pour tout b > 0 si leurs dérivées sont égales pour tout b > 0. Celle du deuxième membre est égale à 1/b. En utilisant la règle de Leibniz (vérifier H les hypothèses!), celle du premier membre est égale à 0+∞ exp(−bx) dx, et donc à 1/b. Comme autre exemple, montrons que cette règle jointe aux résultats sur la limite d’une intégrale paramétrique permet de calculer l’intégrale de Poisson J ∞ exp(−x2 ) dx, 0 qui joue un rôle important en analyse et en calcul des probabilités. Cette intégrale existe évidemment puisque l’intégrand est continu et tel que, pour tout x ≥ 1, on a exp(−x2 ) ≤ exp(−x), le second membre de l’inégalité étant évidemment intégrable. Posons f (y) = 4J y exp(−z ) dz 2 0 52 , g(y) = J 1 0 exp[−y 2 (z 2 + 1)] dz. z2 + 1 Il est facile de voir que ces fonctions sont définies et continues pour tout y ≥ 0, et que f (0) = 0, g(0) = J 0 1 dz π = arctg 1 = . z2 + 1 4 On a, par les propriétés de dérivabilité d’une intégrale indéfinie et par la règle de Leibniz (vérifier que les hypothèses sont satisfaites) f $ (y) = 2 J 0 y exp[−(y 2 + z 2 )] dz, g $ (y) = −2 J 1 y exp[−y 2 (z 2 + 1)] dz. 0 En particulier, si y > 0, on trouve, en posant t = zy, que g $ (y) = −2 J 0 y exp[−(y 2 + t2 )] dt = −f $ (y). Donc la fonction f + g est constante sur ]0, +∞[, et comme elle est continue en 0, on aura, pour tout y ≥ 0, π f (y) + g(y) = f (0) + g(0) = , 4 ce qui entraı̂ne particulier que (justifier le passage à la limite sous le signe intégral) π = lim [f (y) + g(y)] y→+∞ 4 534 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS = 4J ∞ 0 = 4J ∞ 52 + lim 52 + exp(−z 2 ) dz exp(−z 2 ) dz 0 4J = J exp[−y 2 (z 2 + 1)] dz z2 + 1 1 y→+∞ 0 ∞ J 1 lim [ 0 y→+∞ exp[−y 2 (z 2 + 1)] ] dz z2 + 1 exp(−z 2 ) dz 0 52 . On en déduit aussitôt la valeur de l’intégrale de Poisson J ∞ exp(−x ) dx = 2 √ 0 14.3 π . 2 Théorème de Fubini Passons maintenant au problème de l’intégrabilité d’une fonction définie par une intégrale. Les “hypothèses naturelles” pour la validité de l’intégrabilité (c’est-à-dire l’analogue des “hypothèses naturelles” 1 et 2 des résultats sur l’existence de la limite ou des dérivées pour F ) sont évidemment les suivantes: 1. f (y, ·) est intégrable sur B pour presque tout y ∈ A. 2. f (·, z) est intégrable sur A pour presque tout z ∈ B. En tenant compte de la symétrie de ces hypothèses par rapport aux deux groupes de variables, la conclusion souhaitée,H qui doit évidemment respecter cette symétrie, est que la fonction F : y 2→ B f (y, z) dz soit intégrable sur H A, que la fonction G : z 2→ A f (y, z) dy soit intégrable sur B et que l’on ait l’égalité J F (y) dy = A c’est-à-dire J 2J A B J G(z) dz, B 3 f (y, z) dz dy = J 2J B A 3 f (y, z) dy dz. Comme pour la limite et la dérivabilité, ces “hypothèses naturelles” ne suffisent pas à assurer la validité du résultat, ainsi que le montre l’exemple suivant. Exemple. Soit f la fonction réelle définie comme suit sur [0, 1] × [0, 1] : f (y, z) = z −2 si 0 < y < z < 1, f (y, z) = −y −2 si 0 < z < y < 1 535 14.3. THÉORÈME DE FUBINI et f (y, z) = 0 ailleurs dans [0, 1] × [0, 1]. On vérifie facilement que, pour chaque 0 < z < 1, on a J 1 f (y, z) dy = 0 et dès lors J 0 J z 0 1 2J 1 dy − z2 3 f (y, z) dy dz = 0 1 0 et dès lors, J 0 1 f (y, z) dz = − 2J 1 3 J 0 y z J dz + y2 f (y, z) dz dy = 0 1 1 dy = 1, y2 1 dz = 1. 0 De même, on a, pour chaque 0 < y < 1, J J J 0 1 J y 1 dz = −1, z2 (−1) dy = −1. Il faut donc remplacer l’hypothèse “naturelle” par une hypothèse plus forte. Celle-ci s’exprime dans le théorème de Fubini que nous commencerons par énoncer et démontrer dans le cas où A et B sont des pavés fermés. L’importance de ce théorème proviendra également de ce qu’il nous permettra de ramener le calcul d’une intégrale sur un pavé de Rn à une succession de n intégrales sur des intervalles de R. Soit I = J × K un semi-pavé de Rn , avec J ⊂ Rq et K ⊂ Rs des semipavés, q + s = n, et soit f une fonction de Rn dans R. Notons tout d’abord que {y} × K̄ étant de n-mesure nulle pour chaque y ∈ J¯, toute fonction f intégrable sur I¯ le reste, avec la même intégrale, si, pour un nombre fini et même une infinité dénombrable de y, on remplace f (y, ·) par une fonction quelconque de z, et en particulier une fonction non intégrable sur K̄. Par conséquent, cette fonction modifiée montre que l’intégrabilité de f sur I¯ n’entraı̂ne pas celle de f (y, ·) sur K̄ pour tout y ∈ J¯. Le résultat qui suit montre cependant que cette conclusion est valide pour presque tout y ∈ J¯. Théorème. Si f est intégrable sur I¯ et si l’on pose T = {y ∈ J¯ : f (y, ·) n’est pas intégrable sur K̄}, alors T est de q-mesure nulle. Démonstration. Par la condition nécessaire et suffisante de Cauchy pour l’intégrabilité de f (y, ·) sur K̄, on a 536 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS T = {y ∈ J¯ : il existe ! > 0 tel que, pour toute jauge δK sur K̄, il existe deux P-partitions δK -fines ΠK et Π̃K de K telles que S(K, f (y, ·), ΠK) − S(K, f (y, ·), Π̃K) > !}. Si dès lors, pour chaque i ∈ N∗ , on pose Ti = {y ∈ J¯ : pour toute jauge δK sur K̄, il existe deux P-partitions δK -fines ΠK et Π̃K de K telles que S(K, f (y, ·), ΠK ) − S(K, f (y, ·), Π̃K) > 1i }, ! alors Ti ⊂ Ti+1 ⊂ J¯, (i ∈ N∗ ), et T = i∈N∗ Ti . Par les propriétés de la mesure, il suffit donc de prouver que chaque ensemble Ti est de q-mesure nulle. Soit i ∈ N∗ et ! > 0 fixés. Nous allons montrer qu’il existe une jauge δJ¯ sur J¯ telle que, pour toute P-partition δJ¯-fine Π de J, on a S(J, 1Ti , Π) ≤ !. Pour cet !, la condition nécessaire et suffisante de Cauchy d’intégrabilité de f sur I¯ entraı̂ne l’existence d’une jauge δ sur I¯ telle que ! |S(I, f, Π) − S(I, f, Π̃)| ≤ , i lorsque Π et Π̃ sont des P-partitions δ-fines de I. Pour chaque y ∈ J¯, δ(y, ·) est une jauge sur K̄. Si y ∈ Ti , la définition de Ti implique l’existence de deux P-partitions δ(y, ·)-fines de K ΠyK = {(zyj , Kyj ) : 1 ≤ j ≤ my }, Π̃yK = {(z̃yl , K̃yl ) : 1 ≤ l ≤ m̃y }, telles que 1 S(K, f (y, ·), ΠyK ) − S(K, f (y, ·), Π̃yK) ≥ . i Posons δJ (y) = min[ min δ(y, zyj ), min δ(y, z̃yl )]. 1≤j≤my Si y ∈ J¯ \ Ti , prenons y 1≤l≤m̃y y ΠK = Π̃K = {(zyj , Kyj ) : 1 ≤ j ≤ my }, avec ΠyK une P-partition δ(y, ·)-fine quelconque de K, et posons δJ (y) = min δ(y, zyj ). 1≤j≤my 8 Nous avons ainsi défini une jauge δJ sur J¯. Soit ΠJ = (y h , J h ) P-partition δJ -fine de J. Par construction et choix de la jauge, Π= ?8 9 9 (y h , zyj h ), J h × Kyjh : 1 ≤ j ≤ myh , 1 ≤ h ≤ m 1≤h≤m @ une 537 14.3. THÉORÈME DE FUBINI et Π̃ = ?8 9 (y h , z̃yj h ), J h × K̃yjh : 1 ≤ j ≤ m̃yh , 1 ≤ h ≤ m sont des P-partitions δ-fines de I = J × K. Dès lors, on trouve @ ! ≥ |S(I, f, Π) − S(I, f, Π̃)| i # m # m̃y h # # m yh $ $ # #$ j j h h h l l # # =# µ(J ) f (y , zyh )µ(Kyh ) − f (y , z̃yh )µ(K̃yh ) # # #h=1 j=1 l=1 # m # m̃y h # # yh $ $ $ # # j j h h h l l = ## µ(J ) f (y , zyh )µ(Kyh ) − f (y , z̃yh )µ(K̃yh )## # #{1≤h≤m : yh ∈T } j=1 l=1 i # # # # $ # # h h = ## µ(J h )[S(K, f (y h, ·), ΠyK ) − S(K, f (y h, ·), Π̃yK )]## #{1≤h≤m : yh ∈T } # i $ = h {1≤h≤m : yh ∈Ti} ≥ 1 i h µ(J h )[S(K, f (y h, ·), ΠyK ) − S(K, f (y h, ·), Π̃yK )] $ µ(J h ) = {1≤h≤m : yh ∈Ti } m 1$ 1 1Ti (y h )µ(J h ) = S(J, 1Ti , ΠJ ). i j=1 i On a donc, 0 ≤ S(J, 1Ti , ΠJ ) ≤ !, et la démonstration est complète. Le théorème queH nous venons de démontrer montre que la fonction F ¯ La deuxième partie donnée par F (y) = K̄ f (y, z) dz est définie p.p. sur J. du théorème de Fubini consiste à prouver l’intégrabilité de F sur J¯ et l’égalité H H J¯ F = I¯ f. ¯ alors la fonction F définie p.p. sur J¯ Théorème. Si f est intégrable sur I, par J F (y) = f (y, z) dz K̄ est intégrable sur J¯ et J J¯ F = J I¯ f, ce qui s’écrit encore J 2J J¯ K̄ 3 f (y, z) dz dy = J ¯ K̄ J× f. 538 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS Démonstration. Soit ! > 0. L’intégrabilité de f sur I¯ entraı̂ne l’existence d’une jauge δ sur I¯ telle que, si Π et Π̃ sont des P-partitions δ-fines de I, on a # J # # # #S(I, f, Π) − f # ≤ !/4, # # I¯ et |S(I, f, Π) − S(I, f, Π̃)| ≤ !/4. Avec les notations du théorème précédent, et en désignant encore par F une extension quelconque de F à J¯, soit y ∈ T et soit Π̄yK = {(z̄yj , K̄yj ) : 1 ≤ j ≤ my } une P-partition fixée δ(y, ·)-fine de K. Posons δ̃J (y) = min δ(y, z̄yj ), 1≤j≤my Q1 = {y ∈ T : |F (y)| + |S(K, f (y, ·), Π̄yK)| ≤ 1}, Qk = {y ∈ T : k − 1 < |F (y)| + |S(K, f (y, ·), Π̄yK)| ≤ k}, k = 2, 3, . . ., ce qui implique T = > k∈N∗ Qk , Qk ∩ Ql = ∅ si k /= l. On a donc, pour tout k ∈ N∗ et tout y ∈ Rq , 1Qk (y) ≤ 1T (y), et dès lors, pour toute P-partition ΠJ de J, on a 0 ≤ S(J, 1Qk , ΠJ ) ≤ S(J, 1T , ΠJ ). Par le théorème précédent, il existe une jauge δJk sur J¯ telle que, pour toute A i i B P-partition ΠJ = (y , J ) 1≤i≤m δJk -fine de J, on ait, S(J, 1T , ΠJ ) ≤ ! , k.2k+2 et dès lors 0≤ $ {1≤i≤m : y∈Qk } µ(J i ) = S(J, 1Qk , ΠJ ) ≤ ! . k.2k+2 539 14.3. THÉORÈME DE FUBINI Si y ∈ T , il existe un et un seul Qk tel que y ∈ Qk ; on posera δJ (y) = min{δ̃J (y), δJk (y)}. Soit maintenant y ∈ J¯ \ T et soit Π̃yK = {(z̃yj , K̃yj ) : 1 ≤ j ≤ m̃y } une P-partition δ(y, ·)-fine de K; puisque f (y, ·) est intégrable sur K̄ et a F (y) comme intégrale, on peut choisir une P-partition Π̂ = {(ẑyl , K̂yl ) : 1 ≤ l ≤ m̂y } δ(y, ·)-fine de K telle que |S(K, f (y, ·), Π̂yK) − F (y)| ≤ (1/2)|S(K, f (y, ·), Π̃yK) − F (y)|. Posons δJ (y) = min U V min δ(y, z̃yj ), min δ(y, ẑyl ) , 1≤j≤m̃y 1≤l≤m̂y ¯ ce qui achève de définir uneA jauge δBJ sur J. i i Soit maintenant ΠJ = (y , J ) 1≤i≤m une P-partition δJ -fine de J. Si i y ∈ T , posons i i i i ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̄yK et Si y i ∈ J¯ \ T et posons Π̆yK = {(z̆yj i , K̆yji ) : 1 ≤ j ≤ m̆yi } = Π̄yK . i S(K, f (y i, ·), Π̃yK ) − F (y i ) > 0, i i ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̃yK , yi j yi j Π̆K = {(z̆yi , K̆yi ) : 1 ≤ j ≤ m̆yi } = Π̂K , tandis que si y i ∈ J¯ \ T et i S(K, f (y i, ·), Π̃yK ) − F (y i ) ≤ 0, posons i i ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̂yK , 540 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS i Par construction, i Π̆yK = {(z̆yj i , K̆yji ) : 1 ≤ j ≤ m̆yi } = Π̃yK . j Π = {((y i, zyi ), J i × Kyi ) : 1 ≤ j ≤ myi , 1 ≤ i ≤ m} et Π̆ = {((y i, z̆yi ), J i × K̆yji ) : 1 ≤ j ≤ m̆yi , 1 ≤ i ≤ m} sont des P-partitions δ-fines de I, ainsi qu’on le vérifie aisément, et dès lors |S(I, f, Π) − S(I, f, Π̆)| ≤ !/4. D’ailleurs, par construction on a aussi S(I, f, Π) = m $ S(K, f (y i, ·), ΠyK )µ(J i ) m $ S(K, f (y i, ·), Π̆yK )µ(J i ). i=1 et S(I, f, Π̆) = i=1 D’autre part, on a i i |S(I, f, Π) − S(J, F, ΠJ )| = |S(I, 1T f, Π) + S(I, 1J̄\T f, Π) − S(J, 1T F, ΠJ ) − S(J, 1J\T ¯ F, ΠJ )| ≤ |S(I, 1T f, Π) − S(J, 1T F, ΠJ )| + |S(I, 1J̄\T f, Π) − S(J, 1J\T ¯ F, ΠJ )|. Mais, |S(I, 1T f, Π) − S(J, 1T F, ΠJ )| ≤ # # # # $ # # i = ## [S(K, f (y i, ·), ΠyK ) − F (y i )]µ(J i )## #{1≤i≤m : yi ∈T } # ∞ D E $ $ i k=1 ≤ {1≤i≤m : yi ∈Qk } ∞ $ k=1 $ |S(K, f (y {1≤i≤m : yi ∈Qk } D’ailleurs, si y i ∈ J¯ \ T et si , ·), ΠyK )| i kµ(J i ) ≤ ! i ∞ $ + |F (y )| µ(J ) k=1 i 1 2k+2 S(K, f (y i, ·), Π̃yK ) − F (y i ) > 0, = !/4. i 541 14.3. THÉORÈME DE FUBINI alors i i S(K, f (y i, ·), Π̂yK ) − F (y i ) ≤ (1/2)[S(K, f (y i, ·), Π̃yK ) − F (y i )], et donc i i 0 < S(K, f (y i, ·), ΠyK ) − F (y i ) = S(K, f (y i, ·), Π̃yK ) − F (y i ) i i ≤ 2[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )], tandis que si y i ∈ J¯ \ T et si i S(K, f (y i, ·), Π̃yK ) − F (y i ) ≤ 0, alors i i −S(K, f (y i, ·), Π̂yK ) + F (y i ) ≤ (1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )]; cela entraı̂ne en particulier que i i (−1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )] ≤ S(K, f (y i, ·), Π̂yK ) − F (y i ), et dès lors, i i |S(K, f (y i, ·), ΠyK ) − F (y i )| = |S(K, f (y i, ·), Π̂yK ) − F (y i )| i ≤ (1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )] i i i i ≤ S(K, f (y i, ·), Π̂yK ) − S(K, f (y i, ·), Π̃yK ) = S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK ). En résumé, si y i ∈ J¯ \ T, on a i i i |S(K, f (y i, ·), ΠyK ) − F (y i )| ≤ 2[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )]. i i Comme, pour y i ∈ T, on a par construction Π̆yK = ΠyK , on a S(I, f, Π) − S(I, f, Π̆) = S(I, 1J̄\T f, Π) − S(I, 1J̄\T f, Π̆) = $ i i [S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )]µ(J i ). ¯ } {1≤i≤m : yi ∈J\T 542 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS D’autre part, |S(I, 1J̄\T f, Π) − S(J, 1J\T ¯ F, ΠJ )| ≤2 # # # # $ # # i = ## [S(K, f (y i, ·), ΠyK ) − F (y i )]µ(J i )## #{1≤i≤m : yi ∈J\T # ¯ } $ i i [S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )]µ(J i ) ¯ } {1≤i≤m : yi ∈J\T = 2[S(I, f, Π) − S(I, f, Π̆)] ≤ !/2. Dès lors, |S(I, f, Π) − S(J, F, ΠJ )| ≤ !/4 + !/2 = 3!/4, et par conséquent, #J # #J # # # # # # f − S(J, F, ΠJ )# ≤ # f − S(I, f, Π)# + |S(I, f, Π) − S(J, F, ΠJ )| # ¯ # # ¯ # I I ≤ !/4 + 3!/4 = !. En inversant le rôle des variables y et z, on obtient évidemment la version duale du théorème de Fubini. Théorème. Si f est intégrable sur I¯ et si l’on pose S = {z ∈ K̄ : f (·, z) n’est pas intégrable sur J¯}, alors S est de s-mesure nulle, la fonction G définie p.p. sur K̄ par J G(z) = J¯ est intégrable sur K̄ et f (·, z) = J G= K̄ J J I¯ J¯ f (y, z) dy f, ce qui s’écrit encore J K̄ 2J J¯ 3 f (y, z) dy dz = J I¯ f. Le résultat suivant montre que le calcul d’un intégrale sur un pavé de Rn se ramène au calcul de n intégrales successives sur un intervalle fermé. 543 14.3. THÉORÈME DE FUBINI Corollaire. Si f est une fonction de Rn dans Rp intégrable sur I¯ = I¯1 × . . . × I¯n , alors, pour toute permutation {i1 , . . . , in} de {1, . . ., n}, on a J I¯ f= J I¯in ,J I¯in−1 , ... ,J I¯i1 - - - f (x1 , . . ., xn )dxi1 . . . dxin−1 dxin . Démonstration. Elle consiste en des applications successives du théorème de Fubini pour différentes décompositions de I¯ : J I¯ = = J J I¯i1 +1 ×...×I¯n I¯i1 +1 ×...×I¯n = J ,J f= ,J J (I¯1 ×...×I¯i1 )×(I¯i1 +1 ×...×I¯n ) I¯1 ×...×I¯i1 I¯1 ×...×I¯i1 −1 ,J I¯i1 I¯1 ×...×I¯i1 −1 ×I¯i1 +1 ×...×I¯n f - f (x) dx1 . . . dxi1 dxi1 +1 . . . dxn - - f (x) dxi1 dx1 . . . dxi1 −1 dxi1 +1 . . . dxn ,J I¯i1 - Zi . . . dxn , f (x) dxi1 dx1 . . . dx 1 Z signifie que l’expression dx manque. En écrivant où dx i1 i1 I¯1 × . . . × I¯i1 −1 × I¯i1 +1 × . . . × I¯n sous la forme (I¯1 × . . . × I¯i2 ) × (I¯i2 +1 × . . . × I¯n ) avec le terme I¯i1 omis dans celui des deux facteurs où il se trouve, on obtient, en procédant exactement comme ci-dessus pour i1 , J I¯ f= avec J ,J J¯ I¯i2 ,J I¯i1 - - " f (x) dxi1 dxi2 dx1 . . . dx" min(i1 ,i2 ) . . . dxmax(i1 ,i2 ) . . . dxn , ",i ) × . . . × Imax(i ",i ) × . . . × In . J = I1 × . . . × Imin(i 1 2 1 2 En continuant de la sorte jusqu’à in , on obtient le résultat. Remarque. Le théorème de Fubini est valable si l’on remplace partout intégrable par L-intégrable. Pour le démontrer, il suffit d’appliquer les théorèmes ci-dessus à f et à |f |. Nous allons maintenant étendre le théorème de Fubini au cas de l’intégrale sur une partie quelconque de Rn . Comme plus haut, dans le cas d’une 544 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS partie non bornée de Rn , intégrable signifiera L-intégrable. Fixons tout d’abord les notations. Si C ⊂ Rn = Rq × Rs , posons A = {y ∈ Rq : ∃z ∈ Rs : (y, z) ∈ C}, B = {z ∈ Rs : ∃y ∈ Rq : (y, z) ∈ C}. Ce sont respectivement les projections orthogonales de C sur Rq et sur Rs . Pour chaque y ∈ A, posons B(y) = {z ∈ Rs : (y, z) ∈ C}, et pour chaque z ∈ B, posons A(z) = {y ∈ Rq : (y, z) ∈ C}. On notera que C = {(y, z) : y ∈ A et z ∈ B(y)} = {(y, z) : z ∈ B et y ∈ A(z)}, et dès lors, pour tout x = (y, z) ∈ Rn = Rq × Rs , on a 1C (x) = 1C (y, z) = 1A (y)1B(y)(z) = 1A (z)(y)1B (z). Nous pouvons maintenant énoncer et démontrer le théorème de Fubini pour l’intégration sur une partie quelconque de Rn . Théorème. Si f est intégrable (resp. L-intégrable) sur C ⊂ Rn , et si, avec les notations ci-dessus, on pose à = {y ∈ A : f (y, ·) n’est pas intégrable (resp. L-intégrable) sur B(y)}, B̃ = {z ∈ B : f (·, z) n’est pas intégrable (resp. L-intégrable) sur A(z)}, alors à est de q-mesure nulle, B̃ est de s-mesure nulle, la fonction F définie p.p. sur A par J F (y) = f (y, z) dz B(y) est intégrable (resp. L-intégrable) sur A, la fonction G définie p.p. sur B par J G(z) = f (y, z) dy A(z) est intégrable (resp. L-intégrable) sur B, et l’on a J A F = J B G= J C f, 545 14.3. THÉORÈME DE FUBINI ce qui s’écrit encore J ,J A - f (y, z) dz dy = B(y) J ,J B - f (y, z) dy dz = A(z) J f. C Démonstration. Supposons tout d’abord que C soit borné et soit I = ¯ Démontrons le résultat J × K un semi-pavé de Rn = Rq × Rs tel que C ⊂ I. sous l’hypothèse d’intégrabilité, le cas de la L-intégrabilité s’obtenant en remplaçant partout “intégrable” par “L-intégrable” dans l’argument. Si f˜ ¯ on a, pour presque tout x ∈ I, ¯ est un prolongement arbitraire de f à I, ˜ fC (x) = 1C (x)f(x), ¯ Par ailleurs, et dès lors 1C .f˜ est intégrable sur I. ˜ ·) n’est pas intégrable sur K̄} T = {y ∈ J¯ : 1C (y, ·)f(y, ˜ ·) n’est pas intégrable sur K̄} = {y ∈ J¯ : 1A (y).1B(y)(·).f(y, ˜ ·) n’est pas intégrable sur B(y)} = {y ∈ J¯ : 1A (y).f(y, = {y ∈ A : f (y, ·) n’est pas intégrable sur B(y)} = Ã. Par le théorème de Fubini pour un pavé fermé, T est de q-mesure nulle et il en est donc de même pour Ã. L’autre cas se traite de manière analogue. En appliquant la seconde partie du théorème de Fubini pour un pavé fermé, on trouve que la fonction F̃ définie par F̃ (y) = = 1A (y) J J K̄ ˜ z) dz = 1A (y) 1C (y, z)f(y, B(y) f˜(y, z) dz = 1A (y) est intégrable sur J¯ et que J , J¯ 1A (y) J J B(y) J K̄ ˜ z) dz 1B(y)(z)f(y, f (y, z) dz = 1A (y)F (y) - f (y, z) dz dy = B(y) J I¯ fC . En d’autres termes, F est intégrable sur A et l’on a J ,J A B(y) - f (y, z) dz dy = J f. C L’autre cas se traite d’une manière strictement analogue. Enfin, le cas de f L-intégrable sur un ensemble C non borné se déduit aisément de la définition de l’intégrale et du résultat pour le cas d’un ensemble borné. 546 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS L’application du théorème de Fubini à la fonction caractéristique d’un ensemble fournit immédiatement le résultat suivant, où l’on conserve les mêmes notations que ci-dessus. Corollaire. Si C est une partie n-intégrable de Rn , et si l’on pose à = {y ∈ A : B(y) n’est pas n-intégrable}, B̃ = {z ∈ B : A(z) n’est pas n-intégrable}, alors à est de q-mesure nulle, B̃ est de s-mesure nulle, la fonction définie p.p. sur A par y 2→ µ(B(y)) est intégrable sur A, la fonction définie p.p. sur B par z 2→ µ(A(z)) est intégrable sur B et l’on a J µ(B(y)) dy = A J µ(A(z)) dz = µ(C). B Exemple. Si C = B2 (0; r) ⊂ R2 , alors 3 G A = ] − r, r[, B(y) = − L r2 G − y2 , r2 − y2 2 , et dès lors µ(B(y)) = 2 r 2 − y 2 et l’aire de B2 (0, r) vaut µ(B2 (0, r)) = 2 J r −r G r 2 − y 2 dy = 2r 2 J π/2 −π/2 G 1 − sin2 t cos t dt = πr 2 . Montrons enfin que l’emploi simultané du théorème de Fubini et du test de comparaison pour les fonctions n-mesurables conduit à un critère utile de L-intégrabilité sur un ensemble pour des fonctions réelles n-mesurables sur cet ensemble. C’est le critère de L-intégrabilité de Tonelli. Théorème. Si f est une fonction réelle n-mesurable sur A ⊂ Rn et s’il existe un groupement (y1 , y2 , . . . , yr ) de (x1 , x2, . . . , xn ) tel que l’expression J A1 ,J A2 (y1 ) ... ,J Ar−1 (y1 ,...,yr−2 ) ,J Ar (y1 ,...,yr−1 ) - - - |f | dyr dyr−1 . . . dy2 dy1 ait un sens (c’est-à-dire telle que chacune des intégrales successives à partir du centre existe), où, pour chaque 1 ≤ k ≤ r, Ak (y1 , . . . , yk−1 ) = {yk : (y1 , . . . , yk , yk+1 , . . ., yr ) ∈ A pour un (yk+1 , . . . , yr ) au moins}, 547 14.3. THÉORÈME DE FUBINI alors f est L-intégrable sur A. Démonstration. Soit (fk )k∈N la suite de fonctions réelles définies p.p. sur A par fk = min(|f |, k)1Ak , k ∈ N, où Ak = A ∩ B∞ [k]. Cette suite converge ponctuellement p.p. sur A vers |f | et l’on a 0 ≤ fk (x) ≤ fk+1 (x) ≤ |f (x)| pour presque tout x ∈ A et tout k ∈ N. En outre, chaque fonction fk est n-mesurable et bornée p.p. sur Ak par k. Elle est donc L-intégrable sur Ak en vertu du test de comparaison pour les fonctions mesurables, et donc L-intégrable sur A puisqu’elle est nulle sur l’ensemble n-mesurable A \ Ak . . Enfin, par le théorème de Fubini, on a J A = J A1 ≤ J A1 ,J ... A2 (y1 ) ,J ... A2 (y1 ) ,J Ar−1 (y1 ,...,yr−2 ) ,J Ar−1 (y1 ,...,yr−2 ) fk ,J Ar (y1 ,...,yr−1 ) ,J Ar (y1 ,...,yr−1 ) - - - fk dyr dyr−1 . . . dy2 dy1 - - - |f | dyr dyr−1 . . . dy2 dy1 , H pour chaque k ∈ N, ce qui montre que la suite croissante ( A fk )k∈N est majorée, et donc convergente. Le théorème de convergence monotone de Levi entraı̂ne donc l’intégrabilité sur A de |f | et, comme f est n-mesurable sur A, un Corollaire du test de comparaison pour les fonctions mesurables entraı̂ne sa L-intégrabilité. Exemple. En guise d’application du critère de Tonelli, montrons que si g et h sont des fonctions de Rn dans C L-intégrables sur Rn , alors leur produit de convolution g ∗ h est défini p.p. sur Rn et est L-intégrable sur Rn . Par hypothèse, g et h sont n-mesurables sur Rn et il en résulte que la fonction f : (y, z) 2→ g(y − z)h(z) est 2n-mesurable sur R2n . D’autre part, en utilisant l’invariance de l’intégrale pour une translation, on a, pour presque tout z ∈ Rn , J J Rn |g(y − z)| dy = Rn |g|, et dès lors J Rn |h(z)| 4J Rn |g(y − z)| dy 5 dz = J Rn h(z) 4J Rn 5 |g| dz 548 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS = 4J Rn |h| 5 4J Rn 5 |g| . Par le critère de Tonelli, f est L-intégrable sur R2n et, par le théorème de Fubini, pour presque tout y ∈ Rn , la Hfonction z 2→ f (y − z)g(z) est Lintégrable sur Rn et la fonction g∗h : y 2→ Rn g(y−z)h(z) dz est L-intégrable sur Rn , avec 4J 5 4J 5 J Rn 14.4 g∗h= g Rn Rn h . Transformations affines Nous avons étudié précédemment l’effet d’un changement de variables sur l’existence et le calcul des primitives d’une fonction de R dans Rp et nous en avons déduit une formule donnant l’effet d’un changement de variable sur le calcul de l’intégrale sur un intervalle fermé d’une fonction primitivable. Nous allons étudier l’extension de ce résultat aux intégrales multiples. Nous commencerons par le cas d’une transformation affine et considérerons tout d’abord une translation dans Rn , c’est-à-dire une application du type ta : Rn → Rn , x 2→ x + a, pour un certain a ∈ Rn fixé. On notera que, pour tout x ∈ Rn , on a det(ta )$x = det I = 1, et l’on désignera par Jta (jacobien de ta ) l’application de Rn dans R définie par Jta (x) = det(ta )$x. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp définie et H ¯ Nous poserons J = ¯ f et nous désignerons par I − a le intégrable sur I. I translaté I − a = {x − a ∈ Rn : x ∈ I} = t−1 a (I) de I par a. C’est évidemment un semi-pavé de Rn . Le résultat suivant a été démontré parmi les propriétés élémentaires de l’intégrale. ¯ alors f ◦ ta = (f ◦ ta )|Jta | Proposition. Si f est définie et intégrable sur I, −1 ¯ ¯ est intégrable sur ta (I) = I − a et J ¯ I−a J f (· + a) = ¯ t−1 a (I) J ¯ t−1 a (I) f ◦ ta = (f ◦ ta )|Jta | = J I¯ f. 549 14.4. TRANSFORMATIONS AFFINES Passons maintenant au cas d’un automorphisme de Rn . Nous aurons besoin des résultats suivants d’algèbre linéaire. Lemme. Tout automorphisme de Rn peut s’obtenir comme composé d’un nombre fini d’automorphismes élémentaires appartenant aux types suivants: a. hr : x 2→ (rx1 , x2 , . . . , xn ), (r > 0); b. s : x 2→ (−x1 , x2 , . . ., xn ); c. pkl : x = (x1 , . . . , xk , . . . , xl , . . . , xn ) 2→ (x1 , . . ., xl , . . ., xk , . . . , xn); d. r : x 2→ (x1 + x2 , x2 , . . . , xn). Lemme. Si L1 , . . . , Lm sont des endomorphismes de Rn ,, alors det(L1 ◦ . . . ◦ Lm ) = (det L1 ). . . ..(det Lm ). On notera que, pour tout x ∈ Rn , on a Jhr (x) = det(hr )$x = det hr = r, Js (x) = det s$x = det s = −1, Jpkl (x) = det(pkl )$x = det pkl = −1, Jr (x) = det rx$ = det r = 1. La démonstration des formules de changement de variables pour les transformations hr , s et pkl est similaire. Considérons tout d’abord le cas de hr . ¯ alors r.(f ◦hr) = (f ◦hr )|Jr | Proposition. Si f est définie et intégrable sur I, ¯ est intégrable sur h−1 ( I) et on a r J ¯ h−1 r (I) r.(f ◦ hr ) = J ¯ h−1 r (I) (f ◦ hr )|Jhr | = J I¯ f. Démonstration. On notera tout d’abord que puisque −1 h−1 r : x 2→ (r x1 , x2 , . . ., xn ), n ¯ h−1 r (I) est un semi-pavé de R . Soit ! > 0; il existe une jauge δ sur I telle que |S(I, f, Π) − J|2 ≤ !. −1 −1 ¯ Soit δ̃ la jauge définie sur 8 hr (I) 9 = hr (I) par δ̃ = c.(δ ◦ hr ) où c = −1 j ˜j min(1, r ), et soit Π̃ = (x̃ , I ) une P-partition δ̃-fine de h−1 r (I). Posons 1≤j≤m xj = hr (x̃j ), I j = hr (I˜j ), (1 ≤ j ≤ m). 550 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS Par construction, xj ∈ I¯j , (1 ≤ j ≤ m) et hr (I˜j ) est un semi-pavé contenu dans I. En outre, puisque hr est une bijection de Rn sur Rn et que les j I˜j , (1 ≤ j ≤ m) partitionnent h−1 r (I), les I , (1 ≤ j ≤ m) partitionnent I. Enfin, les relations I˜j ⊂ B∞ [x̃j ; δ̃(x̃j )], (1 ≤ j ≤ m), entraı̂nent, si I˜j = I˜1j × . . . × I˜nj et I j = I1j × . . . × Inj , les inclusions I˜kj ⊂ [x̃jk − δ(x̃j ), x̃jk + δ(x̃j )], (1 ≤ k ≤ n, 1 ≤ j ≤ m). Dès lors, si 2 ≤ k ≤ n, on a Ikj = I˜kj ⊂ [x̃jk − δ̃(x̃j ), x̃jk + δ̃(x̃j )] = [xjk − cδ(hr (x̃j )), xjk + cδ(hr (x̃j ))] j j j j = [xk − cδ(xj ), xk + cδ(xj ))] ⊂ [xk − δ(xj ), xk + δ(xj )], tandis que, si k = 1, on a I1j = r I˜1j ⊂ [rx̃j − r δ̃(x̃j ), rx̃j + r δ̃(x̃j )] = [xj1 − δ(xj ), xj1 + δ(xj )]. Dès lors I j ⊂ B∞ [xj ; δ(xj )] pour chaque 1 ≤ j ≤ m et Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition δ-fine de I. En conséquence, si l’on note en outre que µ(I j ) = rµ(I˜j ) pour chaque 1 ≤ j ≤ m, on obtient # # #$ # m # # −1 j j ˜ # |S(hr (I), r.(f ◦ hr ), Π̃) − J|2 = # rf (hr (x̃ ))µ(I ) − J ## #j=1 # 2 # # #m # #$ # j j = ## f (x )µ(I ) − J ## = |S(I, f, Π) − J|2 ≤ !, #j=1 # 2 et la démonstration est complète. Considérons maintenant le cas des transformations de type s. ¯ alors f ◦ s = (f ◦ s)|Js | Proposition. Si f est définie et P-intégrable sur I, −1 ¯ est P-intégrable sur s (I) et l’on a J ¯ s−1 (I) f ◦s= J ¯ s−1 (I) (f ◦ s)|Js | = J I¯ f. Démonstration. Notons tout d’abord que si I = I1 × . . . × In avec Ii = ]ai , bi], 1 ≤ i ≤ n, alors, puisque s−1 = s, on a s−1 (I) = s(I) = (−I1 ) × I2 × . . . × In = [−b1 , −a1 [ ×I2 × . . . × In , 551 14.4. TRANSFORMATIONS AFFINES n’est pas un semi-pavé, mais ¯ = s−1 (I) = K̄, s−1 (I) si K = K 1 × . . . × K n désigne le semi-pavé ] − b1 , −a1 ] × I2 × . . . × In . Il ¯ remplacé par K̄. Si ! > 0 suffit donc de démontrer le théorème avec s−1 (I) est donné, il existe une jauge δ sur I¯ telle que |S(I, f, Π) − J|2 ≤ ! pour toute P-partition δ-fine BΠ de I. Définissons la jauge δ̃ sur K̄ par A δ̃ = δ ◦ s, et soit Π̃ = (x̃j , K j ) 1≤j≤m une P-partition δ̃-fine de K̄. On peut, sans perte de généralité, supposer les K j = K1j × . . .× Knj numérotés de telle sorte que K1j =]cj , cj+1 ], avec c1 = −b1 , cm+1 = −a1 , cj < cj+1 , (1 ≤ j ≤ m). Posons, pour chaque 1 ≤ j ≤ m, j j xj = s(x̃j ), I j = I1 × . . . × Inj = ] − cj+1 , −cj ] × I2 × . . . × Inj . De la relation −b1 = c1 < c2 < . . . < cm < cm+1 = −a1 , on tire aussitôt a1 = −cm+1 < −cm < . . . < −c2 < −c1 = b1 , et les I j , (1 ≤ j ≤ m) partitionnent I. D’ailleurs, par construction, xj ∈ I¯j pour chaque 1 ≤ j ≤ m et, des relations K j ⊂ B∞ [x̃j ; δ̃(x̃j )], 1 ≤ j ≤ m, on déduit aisément, pour 2 ≤ k ≤ n, Ikj = Kkj ⊂ [x̃jk − δ̃(x̃j ), x̃jk + δ̃(x̃j )] = [xjk − δ(s(x̃j )), xjk + δ(s(x̃j ))] et, pour k = 1, = [xjk − δ(xj ), xjk + δ(xj )], I1j =] − cj+1 , −cj ] ⊂ [−cj+1 , −cj ] = −K1j = −K1j ⊂ [−x̃j1 − δ̃(x̃j ), −x̃j1 + δ̃(x̃j )] 552 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS = [xj1 − δ(s(x̃j )), xj1 + δ(s(x̃j ))] = [xj1 − δ(xj ), xj1 + δ(xj )]. Donc Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition δ-fine de I telle que, pour chaque 1 ≤ j ≤ m, on a µ(I j ) = µ(I˜j ). En conséquence, # # #m # #$ # |S(K, f ◦ s, Π̃) − J|2 = ## f (s(x̃j ))µ(I j ) − J ## #j=1 # 2 # # #$ # #m # j j = ## f (x )µ(I ) − J ## = |(S(I, f, Π) − J|2 ≤ !, #j=1 # 2 et la démonstration est complète. n. Considérons pour suivre le cas de la transformation pkl avec 1 ≤ k < l ≤ ¯ alors f ◦pkl = (f ◦pkl )|Jp | Proposition. Si f est définie et intégrable sur I, kl −1 ¯ est intégrable sur pkl (I) et l’on a J ¯ p−1 (I) kl f ◦ pkl = J ¯ p−1 (I) kl f ◦ pkl |Jpkl | = J I¯ f. Démonstration. Notons tout d’abord que p−1 kl = pkl et dès lors, si I = I1 × . . . × In , alors p−1 kl (I) = I1 × . . . × Il × . . . × Ik × . . . × In est un semi-pavé de Rn . Soit ! > 0 et δ une jauge sur I¯ telle que |S(I, f, Π)− J|2 ≤ ! pour toute P-partition δ-fine Π de I. Définissons la 9jauge δ̃ sur 8 −1 −1 ¯ j ˜j pkl (I) = pkl (I) par la relation δ̃ = δ ◦ pkl , et soit Π̃ = (x̃ , I ) une P-partition δ̃-fine de p−1 kl (I). Posons, pour chaque 1 ≤ j ≤ m, 1≤j≤m j j j xj = pkl (x̃j ), I j = pkl (I j ) = I˜1 × . . . × I˜l × . . . × I˜k × . . . × I˜nj , ce qui implique aussitôt µ(I j ) = µ(I˜j ) et xj ∈ I¯j , 1 ≤ j ≤ m. D’ailleurs, puisque pkl est une bijection de Rn sur Rn et que les I˜j partitionnent p−1 kl (I), les I j partitionnent I. Enfin, puisque I˜j ⊂ B∞ [x̃j ; δ̃(x̃j )], 1 ≤ j ≤ m, on a, pour chaque i /= k et /= l compris entre 1 et n, Iij = I˜ij ⊂ [x̃ji − δ̃(x̃j ), x̃ji + δ̃(x̃j )] = [xji − δ(pkl (x̃j )), xji + δ(pkl (x̃j ))] = [xji − δ(xj ), xji + δ(xj )], 553 14.4. TRANSFORMATIONS AFFINES tandis que, si i = k, j j j j j j Ik = I˜l ⊂ [x̃l − δ̃(x̃j ), x̃l + δ̃(x̃j )] = [xK − δ(xj ), xk + δ(xj )], et de même, Ilj ⊂ [xjl − δ(xj ), xjl + δ(xj )]. Donc Π = {(x1 , I 1 ), . . ., (xm, I m)} est une P-partition δ-fine de I, ce qui entraı̂ne # # #m # $ # # −1 j j # ˜ |S(pkl (I), f ◦ pkl , Π̃) − J|2 = # f (pkl (x̃ ))µ(I ) − J ## #j=1 # 2 # # #m # #$ # j j # =# f (x )µ(I ) − J ## = |S(I, f, Π) − J|2 ≤ !, #j=1 # 2 et achève la démonstration. Le cas de la transformation r diffère substantiellement des précédents par le fait que, si I = I1 × . . . × In , l’adhérence de r −1 (I) = {x ∈ Rn : x1 + x2 ∈ I1 , x2 ∈ I2 , . . . , xn ∈ In } n’est pas un pavé fermé de Rn , ce qui exclut un traitement direct à partir de la définition d’intégrabilité sur un pavé fermé. En fait, on peut construire un exemple de fonction f de R2 dans R qui est intégrable (mais non Lintégrable) sur l’adhérence I¯ d’un semi-pavé I de R2 et telle que f ◦ r ne ¯ (c’est-à-dire telle que f ◦ r ne soit intégrable soit pas intégrable sur r −1 (I) ¯ sur aucun pavé fermé contenant r −1 (I)). On a toutefois une formule de changement de variable pour une transformation de type r lorsque f est ¯ L-intégrable sur I. ¯ alors f ◦ r = (f ◦ r)|Jr | est LProposition. Si f est L-intégrable sur I, −1 ¯ intégrable sur r (I) et l’on a J ¯ r −1 (I) f ◦r = J ¯ r −1 (I) (f ◦ r)|Jr | = J I¯ f. ¯ sont nDémonstration. Les fonctions f et |f |2 , L-intégrables sur I, ¯ ¯ mesurables sur I et dès lors f ◦ r et |f ◦ r|2 sont n-mesurables sur r −1 (I). En vertu du théorème de Fubini, on a J I¯ f= J I¯2 ×...×I¯n 2J I¯1 3 f (x1 , x2 , . . . , xn ) dx1 dx2 . . . dxn , 554 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS et pour les (x2 , . . ., xn ) pour lesquels f (·, x2 , . . ., xn ) est L-intégrable sur I¯1 , la première proposition de cette section entraı̂ne la L-intégrabilité sur I¯1 −x2 de la fonction f (· + x2 , x2 , . . . , xn ) et les égalités J I¯1 f (x1 , x2 , . . ., xn ) dx1 = = J I¯1 −x2 J I¯1 −x2 f (x1 + x2 , x2 , . . . , xn) dx1 (f ◦ r)(x1 , . . ., xn ) dx1 . Par conséquent, (f ◦r)(·, x2, . . . , xn ) est L-intégrable sur I¯1 −x2 pour presque tout (x2 , . . . , xn) ∈ I¯2 × . . . × I¯n et l’on a l’égalité J I¯ f= J I¯2 ×...×I¯n 2J I¯1 −x2 3 (f ◦ r)(x1 , . . . , xn) dx1 dx2 . . . dxn . On montre de la même manière que |f ◦ r|2 (·, x2, . . . , xn ) est L-intégrable sur I¯1 − x2 pour presque tout (x2 , . . . , xn ) ∈ I¯2 × . . . × I¯n et que J I¯ |f |2 = J I¯2 ×...×I¯n 2J I¯1 −x2 3 |f ◦ r|2 (x1 , . . . , xn) dx1 dx2 . . . dxn . Le critère de Tonelli implique alors que f ◦ r est L-intégrable sur l’ensemble ¯ {x ∈ Rn : x1 ∈ I¯1 − x2 , x2 ∈ I¯2 , . . . , xn ∈ I¯n } = r −1 (I), H et la dernière formule obtenue pour I¯ f avec une nouvelle application du ¯ fournit l’égalité théorème de Fubini à la fonction f ◦ r sur r −1 (I) J ¯ r −1 (I) la démonstration est complète. f ◦r = J I¯ f; En combinant les résultats d’algèbre linéaire rappelés plus haut et les propositions que nous venons de démontrer, nous obtenons aussitôt le théorème du changement de variable affine dans une intégrale suivant. Théorème. Si f est L-intégrable sur I¯ et si g : Rn → Rn , x 2→ g(x) = a + A(x) avec a ∈ Rn et A est un automorphisme de Rn , alors (f ◦g)|Jg | = (f ◦g)| det A| ¯ et l’on a est L-intégrable sur g −1 (I) J ¯ g −1 (I) (f ◦ g)|Jg | = J I¯ f. Une conséquence utile de ce théorème fournit une expression pour la mesure du transformé d’un pavé fermé par une application affine. 555 14.5. DIFFÉOMORPHISMES Corollaire. Si I est un semi-pavé de Rn et h : Rn → Rn , x 2→ a + A(x) est ¯ est n-intégrable et l’on une application affine telle que det A /= 0, alors h(I) a ¯ = | det A|µ(I) ¯ = |Jh |µ(I). ¯ µ(h(I)) Démonstration. Appliquons le théorème précédent à f = 1 et g = h−1 . On a donc, pour tout x ∈ Rn , g(x) = −A−1 a + A−1 (x), et dès lors Jg (x) = det A−1 = (det A)−1 , f ◦ g = 1 ◦ g = 1. Par le théorème précédent, (f ◦ g)|Jg | = | det A|−1 (et donc toute fonction ¯ = h(I) ¯ et l’on a constante) est L-intégrable sur g −1 (I) J ¯ h(I) | det A| −1 = J I¯ 1. ¯ est n-intégrable et Par conséquent, h(I) ¯ = | det A|µ(I). ¯ µ(h(I)) 14.5 Difféomorphismes L’extension du théorème de changement de variables à certaines transformations non affines requiert quelques résultats préliminaires. Définition. Soit E un ouvert non vide de Rn et g une application de E dans Rn . On dit que g est un difféomorphisme de E sur g(E) si g est une bijection de E sur l’ouvert g(E) telle que g et g −1 soient de classe C 1 sur E et g(E) respectivement. Soit E un ouvert non vide de Rn , g un difféomorphisme de E sur g(E). Comme g −1 ◦ g = I entraı̂ne Jg−1 (x).Jg (x) = 1, on aura Jg (x) /= 0 pour tout x ∈ E. 556 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS Lemme. Soit η > 0 donné. Pour chaque a ∈ E, il existe δ(a) > 0 tel que, pour tout semi-cube I de côté c pour lequel a ∈ I¯ ⊂ B∞ [a; δ(a)], on a g(I) ⊂ h(I $ ), où h est l’application affine de Rn dans Rn définie par h(x) = g(a) + ga$ (x − a), et I $ est le semi-cube de Rn concentrique à I et de côté (1 + η)c. Démonstration. Puisque (ga$ )−1 existe et est linéaire, il existe une constante b = b(a) > 0 telle que |(ga$ )−1 (x)|∞ ≤ b|x|∞ pour tout x ∈ Rn . Soit σ ∈ ]0, η/2b[ ; comme g est dérivable en a, il existe δ(a) > 0 (que l’on peut toujours supposer suffisamment petit pour que B∞ [a; δ(a)] ⊂ E puisque E est ouvert) tel que |g(x) − h(x)|∞ = |g(x) − g(a) − ga$ (x − a)|∞ ≤ σ|x − a|∞ pour tout x ∈ B∞ [a; δ(a)]. Soit I un semi-cube tel que a ∈ I¯ ⊂ B∞ [a; δ(a)], et soit y ∈ g(I). Il existe un et un seul x ∈ I ⊂ B∞ [a; δ(a)] tel que y = g(x) et, h étant une bijection de Rn sur Rn , il existe un et un seul u ∈ Rn tel que y = h(u). Si nous posons v = h(x), nous obtenons et dès lors y − v = h(u) − h(x) = ga$ (u − x), |u − x|∞ = |(ga$ )−1 (y − v)|∞ ≤ b|y − v|∞ = b|g(x) − h(x)|∞ ≤ bσ|x − a|∞ . ¯ on a |x − a|∞ ≤ c, et dès lors Mais, puisque x ∈ I et a ∈ I, |u − x|∞ ≤ bσc < (η/2)c, ce qui implique, si w désigne le centre de I, que |u − w|∞ ≤ |u − x|∞ + |x − w|∞ < (η/2)c + c/2 = (c/2)(1 + η). Donc u appartient au semi-cube I $ de centre w et de côté (1 + η)c et y = h(u) ∈ h(I $ ). 557 14.5. DIFFÉOMORPHISMES Lemme. Soit f une fonction de Rn dans R+ continue sur g(E) et soit ! > 0. Pour chaque a ∈ E, il existe δ(a) > 0 tel que B∞ [a; δ(a)] ⊂ E et tel que, pour tout semi-cube I vérifiant les relations a ∈ I¯ ⊂ B∞ [a; δ(a)], la fonction f est L-intégrable sur g(I) et l’on a J g(I) f≤ J (f ◦ g)|Jg | + !µ(I). I¯ Démonstration. Notons tout d’abord que la fonction (f ◦ g)|Jg | continue sur E, est L-intégrable sur tout pavé fermé I¯ contenu dans E et dès lors l’intégrale du membre de droite dans l’inégalité ci-dessus existe. D’autre part, pour tout semi-pavé I = ]a1 , b1] × . . . × ]an , bn] contenu dans E, on a I = I¯ \ n > i=1 (K i ∪ Li ), où K i = [a1 , b1 ] × . . . × {ai } × . . . × [an , bn], Li = [a1 , b1] × . . . × {bi } × . . . × [an , bn]. Dès lors, g étant injective, on a ¯ \g g(I) = g(I) , n > i=1 - (K ∪ L ) , i i ¯ et g[!n (K i ∪Li )] ⊂ g(I) ¯ sont des fermés bornés et et g étant continue, g(I) i=1 ! la fonction continue f y est L-intégrable. Comme 1g(I) = 1g(I) ¯ −1 n (K i ∪Li) i=1 on en déduit aussitôt la L-intégrabilité de f sur g(I). Soit maintenant a ∈ E, b = g(a), et posons A = f (b) = (f ◦ g)(a) ≥ 0, B = |Jg (a)| > 0. Définissons la fonction réelle ψ sur R2 par ψ(ξ, η) = (A − ξ)(B − ξ) − (A + ξ)B(1 + η)n; elle est continue sur R2 et telle que ψ(0, 0) = 0; en conséquence, pour l’! donné dans l’énoncé, on pourra trouver un δ $ > 0 tel que pour tout ξ vérifiant |ξ| ≤ δ $ et tout η vérifiant |η| ≤ δ $ , on aura |ψ(ξ, η)| ≤ !. 558 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS En particulier, si ξ ∈ ]0, b[ ∩ ]0, δ $ [ et si η ∈ ]0, δ $[ sont fixés, on a (A + ξ)B(1 + η)n ≤ (A − ξ)(B − ξ) + !. D’autre part, f étant continue en b, il existera un δ $$ > 0 (que l’on peut toujours choisir suffisamment petit pour que B∞ [b; δ $$] ⊂ g(E)) tel que A − ξ ≤ f (y) ≤ A + ξ pour tout y ∈ B∞ [b; δ $$]. Enfin, g et |Jg | étant continues en a, il existera δ(a) > 0 (que l’on peut toujours choisir inférieur ou égal au δ(a) associé à η par le lemme précédent et suffisamment petit pour que B∞ [a; δ(a)] ⊂ E) tel que |g(x) − g(a)|∞ = |g(x) − b|∞ ≤ δ $$ et |Jg (x)| ≥ B − ξ, pour tout x ∈ B∞ [a; δ(a)]. En conséquence, si I est un semi-cube tel que a ∈ I¯ ⊂ B∞ [a; δ(a)], on obtient, en vertu du lemme précédent et du corollaire du théorème de changement de variables affine, J g(I) f ≤ (A + ξ)µ(g(I)) ≤ (A + ξ)µ(h(I $)) = (A + ξ)|Jg (a)|µ(I $) = (A + ξ)B(1 + η)n cn = (A + ξ)B(1 + η)nµ(I). D’autre part, pour tout x ∈ B∞ [a; δ(a)], on a, par les inégalités qui précèdent, f (g(x))|Jg(x)| ≥ (A − ξ)(B − ξ), et dès lors J (f ◦ g)|Jg | ≥ (A − ξ)(B − ξ)µ(I) I¯ ≥ (A + ξ)B(1 + η)nµ(I) − !µ(I) ≥ ce qui achève la démonstration. J g(I) f − !µ(I), Lemme. Soit f une fonction de Rn dans R+ continue sur g(E). Pour tout semi-cube I tel que I¯ ⊂ E, on a J g(I) f≤ J (f ◦ g)|Jg |. I¯ 559 14.5. DIFFÉOMORPHISMES Démonstration. L’existence des deux intégrales a déjà été prouvée dans la première partie de la démonstration du lemme précédent. Si ! > 0 est donné, l’application strictement positive δ définie pour chaque a ∈ E par le δ(a) fournit par le lemme précédent est évidemment une jauge sur E. Soit I un semi-cube tel que I¯ ⊂ E. Par le théorème de Cousin, il existe une P-partition régulière et δ-fine Π = {(x1 , I 1 ), . . ., (xm, I m)} de I; les I j sont donc des semi-cubes partitionnant I et tels que xj ∈ I¯j ⊂ B∞ [xj ; δ(xj )], 1 ≤ j ≤ m. Dès lors, par le lemme précédent, on a J g(I j ) f≤ J (f ◦ g)|Jg | + !µ(I j ), 1 ≤ j ≤ m. I¯j D’autre part, g étant injective, les g(I j ) partitionnent g(I); dès lors, si K est un semi-pavé tel que g(I) ⊂ K̄, on a J f= g(I) m J $ j j=1 g(I ) J K̄ f≤ 1g(I)f = m J $ j j=1 I J K̄ m $ j=1 1g(I j ) f = (f ◦ g)|Jg| + ! m $ j=1 m 4J $ K̄ j=1 µ(I j ) = J 1g(I j ) f 5 = (f ◦ g)|Jg | + !µ(I). I¯ Comme ! > 0 est arbitraire, la thèse en résulte. Nous pouvons maintenant énoncer et démontrer le théorème du changement de variables dans l’intégrale sur un fermé borné d’une fonction réelle continue. Théorème. Soit f une fonction réelle continue sur g(E) et F ⊂ g(E) un fermé borné. Alors on a J F f= J g −1 (F ) (f ◦ g)|Jg |. Démonstration. Notons tout d’abord que les deux membres de la formule ont un sens puisque, F et g −1 (F ) étant des fermés bornés et f et (f ◦ g)|Jg | des fonctions continues sur ces ensembles, elles y seront L-intégrables. Soit I un semi-cube tel que G = g −1 (F ) ⊂ int I, ce qui implique en outre que F ⊂ g(I). Le théorème de structure des ouverts bornés qui suit le lemme de recouvrement et le fait que int I \ G soit un ouvert borné entraı̂nent l’existence d’une suite (gk )k∈N de fonctions réelles et d’une suite 560 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS k ({I1k , . . . , Im })k∈N de partitions de I en semi-cubes telles que chaque gk soit k constante p.p. sur Ijk , 1 ≤ j ≤ mk , et telle que, pour tout x ∈ I, on ait 0 ≤ gk (x) ≤ gk+1 (x) ≤ 1, lim gk (x) = 1G (x). k→∞ Dès lors, en utilisant le théorème de Levi, le lemme qui précède et le caractère injectif de g, on trouve, en désignant par xk,l un élément arbitraire de Ilk et en supposant provisoirement que f est une fonction de Rn dans R+ , J g −1 (F ) = = lim k→∞ J 4 I¯ k→∞ = lim k→∞ = lim J mk $ gk (xk,j ) k j=1 g(Ij ) k→∞ g(I) 1G .(f ◦ g)|Jg | J k→∞ I¯ gk .(f ◦ g)|Jg | = lim j=1 mk J $ I¯ lim gk .(f ◦ g)|Jg| = lim ¯k j=1 Ij ≥ lim 5 k→∞ mk J $ (f ◦ g)|Jg | = J gk (g −1 J g(Ijk ) (g(x (gk ◦ g −1 )f = On a donc J k→∞ mk $ k→∞ gk (xk,j ) j=1 f = lim k,j gk .(f ◦ g)|Jg | mk J $ k j=1 g(Ij ) )))f = lim k→∞ mk J $ lim [(gk ◦ g −1 )f ] = g −1 (F ) (f ◦ g)|Jg | ≥ J I¯jk J (f ◦ g)|Jg | gk (xk,j )f k j=1 g(Ij ) g(I) k→∞ J J (gk ◦ g g(I) −1 1F f = J )f f. F f. F En appliquant cette inégalité avec g, F, f respectivement remplacés par g −1 , g −1 (F ), (f ◦ g)|Jg |, on obtient J g −1 (F ) ≤ J (g −1 )−1 (g −1 (F )) = J F (f ◦ g)|Jg | ((f ◦ g) ◦ g −1 ).|Jg | ◦ g −1 .|Jg−1 | f.|(Jg ◦ g −1 ).Jg−1 | = J F f, 561 14.5. DIFFÉOMORPHISMES puisque, de l’identité sur g(E), g ◦ g −1 = I, on déduit, par le théorème de dérivation des fonctions composées, pour tout y ∈ g(E), I = (g ◦ g −1 )$y = gg$ −1 (y) ◦ (g −1 )$y , et dès lors, en prenant les déterminants, 8 9 D 1 = det gg$ −1 (y) ◦ (g −1 )$y = det gg$ −1 (y) D ED det(g −1 )$y ) E E = Jg (g −1 (y)).Jg−1 (y) = (Jg ◦ g −1 ).Jg−1 (y). En conséquence, on a, pour une fonction continue et positive sur g(E), J f= F J g −1 (F ) (f ◦ g)|Jg |. Si maintenant f est une fonction réelle continue sur g(E), alors f = f + − f − avec f + et f − des fonctions réelles positives L-intégrables sur g(E) et, puisque |Jg | est une fonction à valeurs strictement positives, on trouve aisément que [(f ◦ g)|Jg|]+ = (f + ◦ g)|Jg |, [(f ◦ g)|Jg |]− = (f − ◦ g)|Jg |. Dès lors, en appliquant le résultat à f + et f − et en recombinant, on obtient le résultat désiré. Remarque. La formule que nous venons de démontrer s’étend facilement au cas d’une fonction continue sur un fermé non borné en utilisant la définition de L-intégrabilité sur un ensemble non borné et le théorème précédent. Terminons cette section en énonçant, sans démonstration, le théorème général de changement de variables dans une intégrale multiple. Théorème. Soit g un difféomorphisme de l’ouvert E de Rn sur l’ouvert g(E) de Rn et soit f une fonction de Rn dans Rp définie p.p. sur une partie A de g(E). Alors f est L-intégrable sur A si et seulement si (f ◦ g)|Jg | est L-intégrable sur g −1 (A), auquel cas on a la formule J A f= J g −1 (A) (f ◦ g)|Jg |. 562 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS Ce théorème peut se démontrer à partir du cas particulier traité ici en utilisant un théorème d’approximation, pour la convergence en moyenne, des fonctions L-intégrables par des fonctions continues, que nous n’avons pas démontré ici. Dans le cas particulier où n = 1 et où A = [a, b], l’hypothèse faite sur g entraı̂ne que g est strictement croissante ou strictement décroissante. Dans le premier cas, g $ est strictement positive, g −1 ([a, b]) = [g −1 (a), g −1 (b)] et la formule devient J b f= a J g −1 (b) g −1 (a) (f ◦ g)g $. Dans le deuxième cas, g $ est strictement négative, g −1 ([a, b]) = [g −1 (b), g −1(a)] et la formule devient J b a f =− J g −1 (a) g −1 (b) (f ◦ g)g $ = J g −1 (b) g −1 (a) (f ◦ g)g $. On retrouve donc bien la formule démontrée dans le cas des fonctions primitivables. Les théorèmes de Fubini, Tonelli et du changement de variable fournissent une autre méthode pour calculer l’intégrale de Poisson I= J ∞ exp(−x2 ) dx. 0 On a, par les théorèmes de Tonelli et Fubini, I = 2 = J 0 ∞ 2J ∞ 0 4J 0 ∞ exp(−x ) dx 2 3 5 4J exp[−(x + y )] dx dy = 2 2 0 ∞ exp(−y ) dy J ]0,∞ × ]0,∞[ 2 5 exp[−(x2 + y 2 )] dx dy. La transformation g (passage aux coordonnées polaires) définie par g(ρ, θ) = (ρ cos θ, ρ sin θ) 563 14.6. EXERCICES est un difféomorphisme de ]0, ∞[ × ]0, π2 [ sur ]0, ∞[ × ]0, ∞[ et l’on calcule aisément que Jg (ρ, θ) = ρ. En conséquence, le théorème du changement de variables et le théorème de Fubini entraı̂nent J ]0,∞[ × ]0,∞[ = = π 2 J exp[−(x2 + y 2 )] dx dy J ]0,∞[ × ]0, π [ 2 π 4 exp(−ρ2 )ρ dρ = ]0,∞[ d’où l’on déduit aussitôt la valeur 14.6 exp(−ρ2 )ρ dρ dθ √ π 2 J ∞ exp(−t) dt = 0 π , 4 de l’intégrale de Poisson. Exercices 1. Soit f une fonction continue de R2 dans R possédant une dérivée partielle par rapport à la première variable continue sur R et soient a et b deux fonctions dérivables de R dans R. Si F est l’application de R dans R définie par F (y) = J b(y) f (y, z) dz, a(y) montrer que F est dérivable en tout point de R et que $ $ $ F (y) = f (y, b(y))b (y) − f (y, a(y))a (y) + J b(y) a(y) D1 f (y, z) dz. Pour ce faire, on définira l’application H de R3 dans R par H(u, v, y) = J v f (y, z) dz, u qui est donc telle que F (y) = H(a(y), b(y), y), et on calculera F $ (y) utilisant le théorème de dérivation des fonctions composées et la règle Leibniz. 2. Utiliser la règle de Leibniz pour montrer que le potentiel V du champ gravitation créé par un corps matériel M de densité continue ρ vérifie, tout point x n’appartenant pas à M , l’équation de Laplace ∆V (x) ≡ 3 $ j=1 2 Djj V (x) = 0. en de de en 564 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS 3. Pour chaque n ∈ N, soit Jn la fonction définie par l’intégrale Jn (x) = 1 π J 0 π cos(nt − x sin t) dt. En utilisant la règle de Leibniz, montrer que Jn vérifie l’équation différentielle de Bessel. On notera que Dt[cos(nt − x sin t)] = −[sin(nt − x sin t)](n − x cos t) = −n sin(nt − x sin t) + xDx[cos(nt − x sin t)]. En déduire que le membre de droite de cette expression constitue une représentation intégrale de la fonction de Bessel Jn . 4. Soit v : R → R une fonction L-intégrable. Montrer que la fonction u donnée par 1 u(t, x) = √ 2 πt J , - , - (x − y)2 1 (·)2 exp − v(y) dy = √ exp − ∗ v, 4t 4t 2 πt −∞ ∞ est bien définie sur ]0, ∞[ ×R. Montrer que, pour chaque x ∈ R, on a lim u(t, x) = v(x), t→0+ et, en utilisant la règle de Leibniz, montrer que u vérifie sur ]0, ∞[ ×R, l’équation de la chaleur 2 Dt u(t, x) − Dxx u(t, x) = 0. 5. Soit E ⊂ Rn un ensemble n-intégrable et f et g des fonctions de Rn dans R intégrables sur E et telles que la fonction de Rn × Rn dans R définie par (x, y) 2→ [f (x) − f (y)][g(x) − g(y)] soit intégrable sur E × E. Utiliser le théorème de Fubini pour montrer que f g est intégrable sur E et que l’on a l’identité de Tchebycheff 1 2 J E×E [f (x) − f (y)][g(x) − g(y)] dx dy = µ(E) J E fg − 4J E f 5 4J E 5 g . Si n = 1, E est un intervalle et si f et g sont toutes deux croissantes sur E ou décroissantes sur E, en déduite l’inégalité de Tchebycheff J E fg ≥ 1 µ(E) 4J E f 5 4J E 5 g . 565 14.6. EXERCICES 6. Soit E ⊂ Rn et f et g des fonctions de Rn dans R telles que f 2 et g 2 soient intégrables sur E et telles que la fonction de Rn × Rn dans R définie par (x, y) 2→ [f (x)g(y) − f (y)g(x)]2 soit intégrable sur E × E. Utiliser le théorème de Fubini pour montrer que f g est intégrable sur E et que l’on a l’identité de Lagrange 1 2 J E×E [f (x)g(y) − f (y)g(x)] dx dy = 2 4J f 2 E 5 4J g E 2 5 − 4J E fg 52 . En déduire l’inégalité de Cauchy-Schwarz-Bouniakowsky 4J E fg 52 ≤ 4J f2 E 5 4J 5 g2 . E 7. Soit I = ]0, b]× ]0, d] un semi-pavé de R2 et P une partition de I en un nombre fini de semi-pavés. Montrer que si chaque semi-pavé de P possède un côté de longueur entière, alors I possède un côté de longueur entière. On notera que J β α sin 2πx dx = 1 [sin π(β + α). sin π(β − α)], π et que dès lors cette intégrale est nulle si et seulement si β + α ou β − α est entier. D’autre part, le théorème de Fubini entraı̂ne que si f (x, y) = sin 2πx. sin 2πy, et si K = ]α, β]× ]γ, δ], alors J K̄ f (x, y) dx dy = 1 [sin π(β + α). sin π(β − α)][sin π(δ + γ). sin π(δ − γ)]. π2 Cette intégrale est donc nulle si l’un des côtés de K a une longueur entière. D’ailleurs, si P = {I 1 , . . . , I m}, on a, par le calcul ci-dessus, l’additivité de l’intégrale et l’hypothèse sur les I j , 1 sin2 πb sin2 πd = π2 J I¯ f= m J $ ¯j j=1 I f = 0, ce qui entraı̂ne que b ou d est entier. 8. Les coordonnées polaires dans Rn (qui généralisent les coordonnées polaires dans R2 et les coordonnées sphériques dans R3 ) sont définies par les relations x1 = r cos ϕ1 , 566 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS x2 = r sin ϕ1 cos ϕ2 , ... xn−1 = r sin ϕ1 sin ϕ2 . . . sin ϕn−2 cos ϕn−1 , xn = r sin ϕ1 sin ϕ2 . . . sin ϕn−2 sin ϕn−1 . Montrer que si g est l’application de E =]0, ∞[ × ]0, π[n−2 × ]0, 2π[ dans Rn définie par le second membre de ces relations, alors g est un difféomorphisme de E sur g(E) et Jg (r, ϕ1, . . . , ϕn−1 ) = r n−1 sinn−2 ϕ1 sinn−3 ϕ2 . . . sin ϕn−2 . En déduire que si f est une fonction de ]0, ∞[ dans R, alors la fonction radiale x 2→ f (|x|2 ) est L-intégrable sur Rn si et seulement si la fonction r 2→ r n−1 f (r) est L-intégrable sur ]0, ∞[, auquel cas l’on a J Rn f (|x|2) dx = ωn J ∞ f (r)r n−1 dr, 0 où ωn est une constante positive ne dépendant que de n (en fait, ωn = 14.7 2πn/2 ). Γ( n ) 2 Petite anthologie Si la fonction donnée est telle que tous les ensembles e$p soient mesurables (B), auquel cas on pourra dire que la fonction est sommable (B), la formule se simplifie et devient J 0ACB ϕ(x, y) dx dy = J 0 A &J 0 B ϕ(x, y) dy ' dx. C’est la formule classique. On sait que cette formule doit être remplacée par une formule plus compliquée, analogue à celle que nous avons obtenue, quand on s’occupe de l’intégration, au sens de Riemann, appliquée dans toute sa généralité. Henri Lebesgue, 1902 M. Lebesgue a traité le problème de la réduction des intégrales doubles dans son mémoire des Annali di Matematica de 1902. Pour faire cette réduction, M. Lebesgue définit ce qu’il appelle les intégrales supérieure et 567 14.7. PETITE ANTHOLOGIE inférieure d’une fonction. Quand la fonction est mesurable, les deux intégrales coı̈ncident et réciproquement. M. Lebesgue étend, sans nouvelle démonstration, cette formule aux intégrales de fonctions non bornées, pourvu que celles-ci existent. M. Fubini a montré que l’introduction des intégrales supérieures et inférieures est inutile et que la réduction peut toujours se faire à l’aide des intégrales ordinaires. De plus, il a donné la démonstration de la formule pour le cas où f est sommable dans Γ sans être bornée. Si on laisse de côté cette dernière démonstration, on peut observer que le théorème de M. Fubini peut se déduire, sans autre examen, de la formule de M. Lebesgue. ... La formule de M. Lebesgue prend donc la forme définitive J J f dx dy = J dx J f dy. Mais il faut négliger au second membre l’ensemble (de mesure nulle) des valeurs de x pour lesquelles l’intégrale intérieure n’existerait pas. C’est le résultat indiqué par M. Fubini. A cause de son importance, nous allons démontrer à nouveau cette formule de réduction par la voie qui nous paraı̂t la plus naturelle. Cette démonstration détaillée, où nous ne ferons appel à aucun théorème étranger, aura peut-être l’avantage de préciser sur certains points les conditions de validité de la formule. Charles-Jean de La Vallée Poussin, 1910 L’approximation par des sommes intégrales (qui est analogue à l’approche usuelle de l’intégrale de Riemann) est utilisée pour obtenir le théorème de Fubini pour l’intégrale de Perron dans une forme générale; on trouve des conditions nécessaires et suffisantes pour l’existence de l’intégrale itérée. Jaroslav Kurzweil, 1973 Parlons d’abord du changement de variables dans les intégrales multiples. La véritable origine de la formule obtenue est dans le fait que le jacobien d’une transformation ponctuelle, pris en valeur absolue, représente le rapport de deux aires infiniment petites correspondantes, ou, s’il s’agit d’intégrales triples, de deux volumes infiniment petits correspondants. ... Ce résultat conduit évidemment à écrire la formule classique pour le changeH H ment de variables sous le signe . Il n’en constitue pas cependant une démonstration satisfaisante, au moins au premier abord, et l’on a, jusqu’ici, présenté la démonstration autrement. Deux méthodes sont connues : l’une consistant à faire successivement un changement de variable sur x seul et un changement de variable sur y seul; l’autre dans laquelle on obtient l’aire S 568 CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS de l’image d’une portion s du premier plan en la ramenant à une intégrale étendue à la frontière de s et établissant ainsi la formule S = sj $ , où j $ est compris entre le minimum et le maximum du jacobien j dans l’aire s : formule qui entraı̂ne, sans nouvelle difficulté, celle du changement de variables. Ne peut-on obtenir une démonstration rigoureuse de la formule du changement de variables en partant de ce fait fondamental ? Jacques Hadamard, 1938 L’idée la plus naı̈ve (pour démontrer le théorème de changement de variables dans un intégrale multiple) serait de diviser D1 en parallélipipèdes rectangles “infinitésimaux”, d’observer que l’image par h d’un tel parallélipipède rectangle est un parallélipipède rectangle infinitésimal, de calculer le volume de ce parallélipipède, de sommer tous les infinitésimaux produits de cette manière, et ainsi d’arriver à la formule. ... Transformer cette approche heuristique en une démonstration rigoureuse n’est pas entièrement trivial. Cela est seulement fait, à ma connaissance, en deux places : le Cours d’Analyse de Jordan et le Differential-und Integralrechnung unter besondere Berucksichtigung neuere Ergebnisse de Haupt. Dans chacune de ces démonstrations, un petit rectangle C est considéré et, par une construction soignée, deux parallélipipèdes, le premier contenant h(C) et le second entièrement contenu dans h(C) sont obtenus. De cette manière, on trouve pour le volume de h(C) des bornes suffisamment exactes pour que la formule puisse s’obtenir par passage à la limite. La principale difficulté de cette démonstration est l’obtention du parallélipipède intérieur à h(C), car le parallélipipède extérieur peut s’obtenir sans difficulté. Jacob T. Schwartz, 1954 Chapitre 15 Analyse vectorielle et extérieure 15.1 Intégrale sur une courbe Soit C ⊂ Rn non vide et image d’une application Γ : [a, b] → Rn continue sur [a, b], injective sur [a, b[ et telle que Γ(a) = Γ(b), ou injective sur [a, b]. En géométrie différentielle, C s’appelle le support ou la trace d’un arc de courbe simple (fermée dans le premier cas), et Γ est une représentation paramétrique de C. Un exemple extrêmement simple est celui du segment de droite [c, d] joignant c ∈ Rn à d ∈ Rn , défini par [c, d] = {c + t(d − c) : t ∈ [0, 1]}, et muni de sa représentation paramétrique canonique Σ : [0, 1] → Rn , t 2→ c + t(d − c). Il est alors naturel d’appeler longueur de [c, d] (pour la représentation paramétrique Σ) le nombre positif L([c, d]) = |d−c|2 = |T ([c, d])|2, où T ([c, d]) = d − c est le vecteur tangent à [c, d]. Si nous voulons donner un sens à la notion de longueur de C (dans la représentation paramétrique Γ), il est naturel, comme nous l’avons fait dans la discussion de la notion d’aire d’une figure plane servant à motiver la notion d’intégrale, de considérer une partition {I 1 , . . . , I m} de I = ]a, b] en semi-intervalles consécutifs I j = ]aj−1 , aj ], 1 ≤ j ≤ m, et de considérer les “valeurs approchées” de la longueur données par les “sommes de Riemann” 569 570 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE du type m $ j=1 |T ([Γ(aj−1 ), Γ(aj )])|2 = = m $ j=1 m $ j=1 |Γ(aj ) − Γ(aj−1 )|2 (15.1) L([Γ(aj−1 ), Γ(aj )]), où L([Γ(aj−1 ), Γ(aj )]) = |Γ(aj ) − Γ(aj−1 )|2 est la longueur, au sens considéré plus haut, du segment de droite [Γ(aj−1 ), Γ(aj )]. On est alors amené à dire que le nombre positif L est la longueur de C (dans la représentation paramétrique Γ) si toutes les expressions (15.1) peuvent être rendues arbitrairement proches de L en prenant des partitions de pas max (aj − aj−1 ) 1≤j≤m suffisamment petit. Plus généralement, soit f une fonction de Rn dans Rp définie sur C et Γ une représentation paramétrique de C. Certains problèmes de mathématique, de science ou de technique, et en particulier celui de la détermination de la masse d’un fil dont on connaı̂t la densité linéaire, conduisent à considérer des “sommes de Riemann” du type SL (Γ, f, Π) = = m $ j=1 f (Γ(tj ))|Γ(aj ) − Γ(aj−1 )|2 f (Γ(tj ))L([Γ(aj−1 ), Γ(aj )]) = j=1 A m $ m $ (15.2) f (Γ(tj ))|T ([Γ(aj−1 ), Γ(aj )])|2, j=1 B où Π = (tj , I j ) 1≤j≤m est une P-partition de I, avec I j = ]aj−1 , aj ]. Le cas particulier f = 1 correspond évidemment au problème de la longueur analysé plus haut et celui de la détermination de la masse d’un fil dont on connaı̂t la densité linéaire correspond à p = 1. La somme de Riemann revient à approcher l’arc de courbe par une ligne brisée et à supposer que, sur chaque segment, la densité est constante et égale à sa valeur en un point de la partie de la courbe approchée par le segment de droite. Il est alors assez naturel d’obtenir la masse du fil par un processus de passage à la limite sur ces sommes de Riemann analogue à celui introduit pour le concept d’intégrale. Cela conduit à la définition suivante. 571 15.1. INTÉGRALE SUR UNE COURBE Définition. On dit que f est L−intégrable sur l’arc de courbe simple C de représentation paramétrique Γ s’il existe J ∈ Rp tel que, pour chaque ! > 0, il existe une jauge δ sur I¯ telle que, pour chaque P-partition δ−fine A j j B Π = (t , I ) 1≤j≤m de I, on ait |SL (Γ, f, Π) − J|2 ≤ !. Comme précédemment, on montre facilement l’unicité d’un tel J, on l’appelle l’intégrale de f sur l’arc de courbe simple C de représentation paramétrique Γ, et on le note J C f L(dΓ) ou J f dL(Γ) ou C J f dL ou CΓ J CΓ f |dT |2 , H pour rappeler son mode de construction. En particulier, si C dL(Γ) existe, on l’appelle la longueur de l’arc de courbe simple C de représentation paramétrique Γ, et on la note L(CΓ ). On peut bien entendu, à partir de cette définition, construire une théorie de l’intégration sur un arc de courbe analogue à celle que nous avons développée pour l’intégrale ordinaire. Dans ce cours, nous nous contenterons de montrer qu’en se limitant aux fonctions f bornées sur C et aux arcs de courbe C dont la représentation paramétrique Γ est de classe C 1 sur [a, b], l’intégrale que nous venons d’introduire se ramène à une intégrale ordinaire sur I¯ d’une expression faisant intervenir f, Γ et Γ$ , et à laquelle nous pourrons donc appliquer tous les résultats obtenus pour l’intégrale d’une fonction sur un intervalle fermé. La Proposition suivante est à la base de ce résultat. Pour la motiver, notons que si Γ est dérivable sur ]a, b[, on a, en utilisant le théorème de Lagrange, SL (Γ, f, Π) = = m $ m $ f (Γ(t )) j j=1 i=1 f (Γ(t )) j j=1 = m $ , n $ [Γi (a ) − Γi (a j (Γ$i (tji ))2 (aj i=1 f (Γ(t )) j j=1 j ti ; n $ , n $ (Γ$i (tji ))2 i=1 j−1 ) j−1 2 −a -1/2 )] 2 <1/2 -1/2 (aj − aj−1 ), j où ∈ ]a , a [, 1 ≤ j ≤ m, 1 ≤ i ≤ n. Si on remplace ti par tj dans la dernière expression, elle devient j−1 j m $ j=1 f (Γ(t )) j , n $ i=1 (Γ$i (tj ))2 -1/2 (aj − aj−1 ) 572 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE = m $ j=1 f (Γ(tj ))|Γ$ (tj )|2 (aj − aj−1 ) = S(I, (f ◦ Γ)|Γ$ |2 , Π), où le second membre est une somme de Riemann usuelle. Le problème est donc de voir sous quelles conditions sur f et sur Γ ce remplacement est licite. Proposition. Si f est bornée sur C et si Γ est de classe C 1 sur [a, b], alors, ¯ telle que pour toute pour chaque ! > 0, il existe une jauge constante η sur I, P-partition η-fine Π de I, on ait |SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)|2 ≤ !. Démonstration. En vertu du calcul effectué ci-dessus, on a, pour la PA B partition Π = (tj , I j ) 1≤j≤m de I, avec I j = ]aj−1 , aj ], SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π) = m $ f (Γ(tj )) j=1 = m $ j=1 , n $ i=1 (Γ$i (tji ))2 -1/2 − , n $ (Γ$i (tj ))2 i=1 -1/2 (aj − aj−1 ) f (Γ(tj ))[h(tj1 , . . . , tjn ) − h(tj , . . . , tj )](aj − aj−1 ), tji avec ∈ ]aj−1 , aj [, 1 ≤ j ≤ m, 1 ≤ i ≤ n, si l’on définit l’application h de [a, b] × . . . × [a, b] dans R par h(t1 , . . . , tn ) = , n $ i=1 (Γ$i (ti ))2 -1/2 . Puisque Γ est de classe C 1 sur [a, b], h est uniformément continue sur [a, b] × . . . × [a, b]. Par conséquent, si M > 0 désigne un majorant de |f (x)|2 sur C et si ! > 0 est donné, il existe une constante η > 0 telle que pour tout (t1 , . . . , tn ) ∈ [a, b]×. . .×[a, b] et tout (t$1 , . . . , t$n ) ∈ [a, b]×. . .×[a, b] vérifiant l’inégalité |(t1 , . . . , tn ) − (t$1 , . . . , t$n )|∞ ≤ η, on ait |h(t1 , . . . , tn ) − h(t$1 , . . . , t$n )| ≤ !/M (b − a). Si l’on prend cet η comme jauge constante sur [a, b] et si Π est une P-partition η-fine de I, on aura tji ∈ ]aj−1 , aj [ ⊂ [tj − η, tj + η], 1 ≤ i ≤ n, 1 ≤ j ≤ m, 573 15.1. INTÉGRALE SUR UNE COURBE donc, |(tj1 , . . ., tjn ) − (tj , . . . , tj )|∞ ≤ η, et dès lors |SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)|2 ≤ m $ j=1 M (!/M (b − a))(aj − aj−1 ) = !, et la démonstration est complète. L’équivalence annoncée résulte aisément de cette Proposition. Proposition. Dans les conditions de la Proposition qui précède, les intégrales J J f dL(Γ) et (f ◦ Γ)|Γ$ |2 I¯ C existent simultanément et sont égales. Démonstration. Nous démontrerons le résultat dans un sens, l’autre cas étant strictement analogue. Supposons donc f L-intégrable sur C (de représentation paramétrique Γ) et montrons que (f ◦ Γ)|Γ$ |2 est P-intégrable H ¯ ¯ sur I et a pour intégrale sur I la quantité C f dL(Γ). Si ! > 0 est donné, on peut trouver une jauge δ1 sur I¯ telle que, pour toute P-partition δ1 -fine Π de I, on ait # # J # # #SL (Γ, f, Π) − f dL(Γ)## ≤ !/2, # C 2 Si maintenant η est la constante associée par la Proposition précédente à !/2, si δ est la jauge sur I¯ définie par δ(t) = min(δ1 (t), η), et si Π est une P-partition δ-fine de I, on aura alors # # J # # #S(I, (f ◦ Γ)|Γ$ |2 , Π) − f dL(Γ)## # C # # 2 ≤ |S(I, (f ◦ Γ)|Γ$ |2 , Π) − SL (Γ, f, Π)|2 + ##SL (Γ, f, Π) − ≤ !/2 + !/2 = !. J C # # f dL(Γ)## 2 574 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE Corollaire. Si Γ est de classe C 1 sur [a, b], alors la longueur de l’arc de courbe simple C de représentation paramétrique Γ est donnée par J L(CΓ ) = dL(Γ) = J b a C $ |Γ |2 = J b a , n $ (Γ$i )2 i=1 -1/2 . Soit maintenant Γ̃ : [c, d] → Rn une représentation paramétrique de classe C 1 équivalente à Γ, c’est-à-dire telle que Γ = Γ̃ ◦ h pour un difféomorphisme h : [a, b] → [c, d]. Alors, on a J L(CΓ ) = b a |Γ$ |2 = J b a |(Γ̃$ ◦ h)h$ |2 = J b a |Γ̃$ ◦ h|2 |h$ |. Comme h est bijective sur [a, b], elle y est monotone et h$ y a un signe constant. Par le théorème de changement de variable dans une intégrale simple, on obtient alors L(CΓ ) = sign h$ J b a |Γ̃ ◦ h|2 h$ = sign h$ J h(b) h(a) |Γ̃$ |2 = J d c |Γ̃$ |2 = L(CΓ̃ ), puisque, si h$ ≥ 0 (resp. ≤ 0) sur [a, b], h est croissante (resp. décroissante) et h(a) = c, h(b) = d (resp. h(a) = d, h(b) = c). Donc, la longueur de l’arc de courbe simple ne dépend pas de la représentation paramétrique à l’intérieur de la classe définie par la relation d’équivalence ci-dessus. Considérons par exemple la représentation paramétrique usuelle du cercle C(r) de centre 0 et de rayon r > 0, à savoir Γr : [0, 2π] → R2 , t 2→ (r cos t, r sin t). On trouve la formule familière L(CΓr )) = J 2π (r 2 sin2 t + r 2 cos2 t)1/2 dt = 0 J 2π r dt = 2πr. 0 Dans le cas particulier d’un arc de courbe simple dont la trace dans R2 est le graphe F = {(x, f (x)) : x ∈ [a, b]} d’une fonction f de R dans R de classe C 1 sur [a, b], on a évidemment la représentation paramétrique de classe C 1 correspondante et, puisque Φ : [a, b] → R2 , x 2→ (x, f (x)), Φ$ (x) = (1, f $ (x)), x ∈ [a, b], on obtient immédiatement la formule L(FΦ ) = J a b [1 + (f $ )2 ]1/2. 575 15.2. INTÉGRALE SUR UNE SURFACE 15.2 Intégrale sur une surface Soit S une partie non vide de R3 qui est l’image d’une application Σ : K = [a1 , b1] × [a2 , b2] ⊂ R2 → R3 continue sur K et injective sur int K. En géométrie différentielle, S est appelé le support ou la trace d’un arc ou d’un élément de surface simple, et Σ s’appelle une représentation paramétrique de S. Un exemple extrêmement simple est celui du parallélogramme [c, d, e] construit sur les points non colinéaires c, d, e (dans l’ordre) de R3 , [c, d, e] = {c + u1 (d − c) + u2 (e − c) : (u1 , u2 ) = u ∈ K = [0, 1] × [0, 1]}, et muni de sa représentation paramétrique canonique Π : K → R3 , u 2→ c + u1 (d − c) + u2 (e − c). En accord avec la géométrie élémentaire, il est naturel d’appeler aire de [c, d, e] (pour la représentation paramétrique Π) le nombre positif A([c, d, e]) = |(d − c) ∧ (e − c)|2 = |N ([c, d, e])|2, où N ([c, d, e]) = (d − c) ∧ (e − c) désigne le produit vectoriel de d − c par e − c, c’est-à-dire l’élément de R3 (normal à P ) défini par (d − c) ∧ (e − c) = ((d2 − c2 )(e3 − c3 ) − (e2 − c2 )(d3 − c3 ), (d3 − c3 )(e1 − c1 ) − (e3 − c3 )(d1 − c1 ), (d1 − c1 )(e2 − c2 ) − (e1 − c1 )(d2 − c2 )) = & det & d2 − c2 d3 − c3 e2 − c2 e3 − c3 det & ' , det & d3 − c3 d1 − c1 e3 − c3 e1 − c1 d1 − c1 d2 − c2 e1 − c1 e2 − c2 '' ' , . Pour donner un sens à la notion d’aire de S (pour la représentation paramétrique Σ), il est naturel de considérer une partition {I 1 , . . . , I m} de I = ]a1 , b1 ]× ]a2 , b2 ] en semi-pavés I j = ]aj1 , bj1 ]× ]aj2 , bj2 ], 1 ≤ j ≤ m, et de considérer les “valeurs approchées” de l’aire données par les “sommes de Riemann” m $ j=1 A([cj , dj , ej ]) = m $ j=1 |(dj − cj ) ∧ (ej − cj )|2 = m $ j=1 |N ([cj , dj , ej ])|2 (15.3) 576 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE où cj = Σ(aj1 , aj2 ), dj = Σ(bj1 , aj2 ), ej = Σ(aj1 , bj2 ), où l’on a assimilé l’élément de surface correspondant à la restriction de Σ à I j au parallélogramme [cj , dj , ej ] et où l’on a sommé les aires correspondantes. On est alors amené à dire que le réel positif A est l’aire de S (pour la représentation paramétrique Σ) si les expressions (15.3) deviennent arbitrairement proches de A en prenant des partitions de I suffisamment fines. Plus généralement, et pour pouvoir donner un sens par exemple à la notion de masse d’une plaque dont on connaı̂t la densité superficielle, on est conduit, si f est une fonction de R3 dans Rp définie sur l’élément de surface S de représentation paramétrique Σ, à considérer des “sommes de Riemann” du type SA (Σ, f, Π) = = m $ m $ f (Σ(uj ))A([cj , dj , ej ]) j=1 f (Σ(uj ))|N ([cj , dj , ej ])|2 , (15.4) j=1 A relatives à la P-partition Π = (uj , I j ) Σ(aj1 , aj2 ), dj Σ(bj1, aj2 ), ej posé c = = ainsi à la définition suivante. j B 1≤j≤m de I, où, = Σ(aj1 , bj2 ), 1 ≤ de nouveau, on a j ≤ m. On arrive Définition. On dit que f est A-intégrable sur l’élément de surface S de représentation paramétrique Σ s’il existe J ∈ Rp tel que pour tout ! > 0, il existe une jauge δ sur I¯ telle que, pour toute P-partition δ-fine Π = A j j B (u , I ) 1≤j≤m de I, on ait |SA (Σ, f, Π) − J|2 ≤ !. On montre comme précédemment, qu’il existe au plus un tel J, on l’appelle l’intégrale de f sur l’élément de surface simple S de représentation paramétrique Σ, et on le note J S f A(dΣ)) ou J S f dA(Σ) ou J SΣ f dA ou J SΣ f |dN |2, H pour rappeler son mode de construction. En particulier, si S dA(Σ) existe, on l’appelle l’aire de l’élément de surface S de représentation paramétrique Σ et on la note A(SΣ ). On peut de nouveau, à partir de cette définition, construire une théorie de l’intégrale sur un élément de surface analogue à celle développée pour 577 15.2. INTÉGRALE SUR UNE SURFACE l’intégrale sur un pavé fermé. Comme dans le cas de l’intégrale sur un arc de courbe, nous nous contenterons ici de montrer qu’en se limitant aux fonctions bornées et aux éléments de surface de classe C 1 , l’intégrale que nous venons d’introduire se ramène à l’intégrale ordinaire sur I¯ = K d’une expression faisant intervenir la fonction, la représentation paramétrique et ses dérivées partielles. On pourra donc appliquer à cette dernière intégrale tous les résultats précédemment obtenus. Pour motiver la forme de cette ¯ on obtient, expression, notons que, si Σ possède des dérivées partielles sur I, en utilisant le théorème de Lagrange, A([cj , dj , ej ]) = #8 9 # j,1 j j j j,2 j j j j,3 j j j # D1 Σ1 (u1 , a2 )(b1 − a1 ), D1Σ2 (u1 , a2 )(b1 − a1 ), D1Σ3 (u1 , a2 )(b1 − a1 ) ∧ 8 9# # j j j j,2 j j j j,3 j j D2 Σ1 (aj1 , uj,1 2 )(b2 − a2 ), D2 Σ2 (a1 , u2 )(b2 − a2 ), D2 Σ3 (a1 , u2 )(b2 − a2 ) # # & j # D1 Σ2 (uj,2 # 1 , a2) = #det # D2 Σ2 (aj1 , uj,2 2 ) det det & & j D1 Σ3 (uj,3 1 , a2 ) D2 Σ3 (aj1 , uj,3 2 ) ' j j,1 j D1 Σ3 (uj,3 1 , a2 ) D1 Σ1 (u1 , a2 ) j j,3 j D2 Σ3 (a1 , u2 ) D2 Σ1 (a1 , uj,1 2 ) j j,2 j D1 Σ1 (uj,1 1 , a2 ) D1 Σ2 (u1 , a2 ) j j,2 D2 Σ1 (aj1 , uj,1 2 ) D2 Σ2 (a1 , u2 ) ' 2 , , '# # # # µ(I j ), # 2 où les uj,k appartiennent à ]ajl , bjl [ , (1 ≤ j ≤ m, 1 ≤ k ≤ 3, 1 ≤ l ≤ 2). l Si, dans cette expression, on remplace les arguments des Dl Σk par uj (1 ≤ j ≤ m, 1 ≤ k ≤ 3, 1 ≤ l ≤ 2), on trouve, au lieu de A([cj , dj , ej ]), l’expression |D1 Σ(uj ) ∧ D2 Σ(uj )|2 µ(Ij ) = |(JΣ2 ,Σ3 (uj ), JΣ3 ,Σ1 (uj ), JΣ1 ,Σ2 (uj ))|2 µ(Ij ), où JΣi ,Σj désigne comme d’habitude le jacobien de l’application u 2→ (Σi(u), Σj (u)), 1 ≤ i, j ≤ 3. On notera que la direction de l’élément NΣ (u) défini par NΣ (u) = D1 Σ(u) ∧ D2 Σ(u) 578 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE est orthogonale à celle des éléments D1 Σ(u) et D2 Σ(u) parallèles au plan tangent à la surface S en Σ(u), et est donc normale à S en Σ(u). Les sommes de Riemann après ce remplacement deviennent les expressions m $ f (Σ(uj ))|NΣ (uj )|2 µ(I j ), (15.5) j=1 c’est-à-dire les sommes de Riemann usuelles pour l’intégration sur I¯ de la fonction (f ◦ Σ)|NΣ |2 . Le problème consiste de nouveau à voir sous quelles conditions on peut remplacer, sans changer les conclusions, les sommes de Riemann SA (Σ, f, Π) par les sommes de Riemann usuelles S(I, (f ◦ Σ)|NΣ |2 , Π). Dans cette direction, on a le résultat suivant, qui se démontre d’une manière strictement analogue au résultat correspondant pour l’intégration sur un arc de courbe, et dont les détails de la démonstration seront laissés au lecteur. Proposition. Si f est bornée sur S et si Σ est de classe C 1 sur K, alors J f dA(Σ) S et J K (f ◦ Σ)|NΣ |2 = J K (f ◦ Σ)[JΣ2 2 ,Σ3 + JΣ2 3 ,Σ1 + JΣ2 1 ,Σ2 ]1/2 existent simultanément et sont égales. Corollaire. Si Σ est de classe C 1 sur K, alors l’aire de l’élément de surface simple S de représentation paramétrique Σ est donnée par A(SΣ ) = J K |NΣ |2 = J K [JΣ2 2 ,Σ3 + JΣ2 3 ,Σ1 + JΣ2 1 ,Σ2 ]1/2. En utilisant le théorème de changement de variables dans une intégrale multiple, on peut montrer, comme dans le cas d’un arc de courbe, que l’aire d’un élément de surface simple ne dépend pas de la représentation paramétrique à l’intérieur de la classe d’équivalence des représentations paramétriques au sens de la géométrie différentielle. Si nous considérons, à titre d’exemple, la représentation paramétrique usuelle de la sphère S(r) de centre 0 et de rayon r > 0, c’est-à-dire l’application Σr : [0, π] × [0, 2π] → R3 , 15.3. CIRCULATION D’UN CHAMP VECTORIEL 579 (u1 , u2 ) 2→ (r sin u1 cos u2 , r sin u1 sin u2 , r cos u1 ), nous obtenons aisément, en utilisant le théorème de Fubini, le résultat familier J 2π J π A(SΣr ) = (r 4 sin4 u1 cos2 u2 + r 4 sin4 u1 sin2 u2 0 0 +r sin2 u1 cos2 u2 )1/2 du1 du2 4 = r2 J 2π 0 J 0 π sin u1 du1 du2 = 2r 2 J 2π 0 du2 = 4πr 2 . Dans le cas particulier d’un élément de surface simple dont la trace dans R3 est le graphe F = {(x1 , x2, f (x1 , x2 )) : (x1 , x2 ) ∈ K} d’une fonction f de R2 dans R de classe C 1 sur le pavé fermé K, on considère la représentation paramétrique naturellement associée Σ : K → R3 , (x1 , x2 ) 2→ (x1 , x2 , f (x1 , x2 )). Comme JΣ2 ,Σ3 = −D1 f, JΣ3 ,Σ1 = −D2 f, JΣ1 ,Σ2 = 1, on trouve immédiatement la formule importante A(F ) = 15.3 J K [1 + (D1 f )2 + (D2 f )2 ]1/2. Circulation d’un champ vectoriel Si n ≥ 2 est un entier, convenons d’appeler champ vectoriel dans Rn toute fonction de Rn dans Rn , et rappelons la notation (x|y) du produit scalaire %n n i=1 xi yi des éléments x et y de R . Si [c, d] est le segment de droite joignant c ∈ Rn et d ∈ Rn introduit précédemment, et si f est un champ vectoriel constant sur [c, d], dont nous désignerons également par f la valeur constante, différentes questions de physique conduisent à considérer l’expression (f |d − c) = (f |T ([c, d])) = n $ i=1 fi (di − ci ). Ainsi, lorsque n = 3 et que f représente une force constante, (f |d − c) fournit le travail de cette force le long du segment orienté [c, d]. L’extension nécessaire de ces notions au cas où f n’est plus nécessairement constant et où [c, d] est remplacé par un arc de courbe simple C de représentation 580 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE paramétrique Γ : [a, b] ⊂ R → Rn conduit à la considération de “sommes de Riemann” du type SC (Γ, f, Π) = = m $ m $ j=1 (f (Γ(tj ))|Γ(aj ) − Γ(aj−1 )) (f (Γ(tj ))|T ([Γ(aj−1 ), Γ(aj )])), j=1 A B si Π = 1≤j≤m est une P-partition de I =]a, b]. De telles sommes apparaissent lorsqu’on remplace la restriction de Γ à [aj−1 , aj ] par le segment de droite [Γ(aj−1 ), Γ(aj )] et que l’on suppose que, sur ce segment, le champ vectoriel garde la valeur constante f (Γ(tj )). On est ainsi conduit à la définition suivante. (tj , ]aj−1 , aj ]) Définition. On dit que J ∈ R est la circulation du champ vectoriel f le long de l’arc de courbe C de représentation paramétrique Γ si pour chaque ! > 0 il existe une jauge δ sur I¯ telle que pour toute P-partition δ-fine Π de I, on a |SC (Γ, f, Π) − J| ≤ !. On montre comme d’habitude l’unicité d’un tel J, ce qui justifie la terminologie, et on le désigne par J C (f |T (dΓ)) ou J (f |dT (Γ)) ou C J CΓ (f |dT ) pour rappeler son mode de construction. Comme pour les autres extensions de l’intégrale introduites précédemment, on peut déduire de cette définition un certain nombre de propriétés. Nous nous contenterons de montrer que si f est borné sur C et si Γ est de classe C 1 , la circulation de f le long de Γ se ramène à l’intégrale usuelle sur [a, b] d’une fonction de R dans R construite à partir de f, Γ et Γ$ . Pour déterminer heuristiquement la forme de cette fonction, il suffit encore, lorsque Γ est dérivable, d’appliquer le théorème de Lagrange aux composantes Γi dans l’expression de la somme de Riemann. On trouve ainsi SC (Γ, f, Π) = = , n m $ $ j=1 , n m $ $ j=1 i=1 i=1 8 fi (Γ(t )) Γi (a ) − Γi (a j fi (Γ(t j ))Γ$i (tji )(aj j j−1 j−1 −a - ) , ) 9 581 15.3. CIRCULATION D’UN CHAMP VECTORIEL pour des tji ∈]aj−1 , aj [, 1 ≤ i ≤ n, 1 ≤ j ≤ m. Si, dans la dernière expression, j on remplace les ti par tj , 1 ≤ i ≤ n, 1 ≤ j ≤ m, on obtient , n m $ $ j=1 m $ = j=1 fi (Γ(t j ))Γ$i (tj )(aj i=1 j−1 −a ) - (f (Γ(tj ))|Γ$ (tj ))(aj − aj−1 ) = S(I, (f ◦ Γ|Γ$ ), Π), c’est-à-dire la somme de Riemann usuelle pour la fonction (f ◦ Γ|Γ$ ) et la Ppartition Π de I = ]a, b]. D’une manière strictement analogue à celle utilisée dans le cas de l’intégration sur un arc de courbe, on peut démontrer la condition suffisante suivante pour que SC (Γ, f, Π) et S(I, (f ◦ Γ|Γ$ ), Π) fournissent la même intégrale. Proposition. Si f est bornée sur C et si Γ est de classe C 1 sur [a, b], alors J C et J a b $ (f |dT (Φ)) (f ◦ Γ|Γ ) = J n b$ a i=1 existent simultanément et sont égales. (fi ◦ Γ)Γ$i Si Γ̃ : [c, d] → Rn est une représentation paramétrique de C équivalente à Γ, c’est-à-dire si Γ = Γ̃ ◦ h pour un certain difféomorphisme h : [a, b] → [c, d], le théorème du changement de variable dans une intégrale entraı̂ne que J C (f |dT (Γ)) = =± J c J d b a $ (f ◦ Γ|Γ ) = (f ◦ Γ̃|Γ̃$ ) = ± J a J C b (f ◦ Γ̃ ◦ h|Γ̃$ ◦ h)h$ (f |dT (Γ̃)), avec le signe + ou le signe − selon que h est croissante ou décroissante. Donc, dans la classe des représentations paramétriques considérées, seul le signe de H C (f |dT (Φ)) dépend du choix de la représentation. On dit en géométrie différentielle que Γ et Γ̃, liés par la relation ci-dessus, correspondent à une même orientation de C si h$ est positive sur [a, b] et correspondent à des orientations opposées si h$ est négative sur [a, b]. Dans le cas du segment de droite, on vérifie aisément que les orientations différentes correspondent aux deux sens de parcours possibles sur le segment. 582 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE Si nous supposons maintenant que Γ, bijective et de classe C 1 , est en outre telle que, pour tout t ∈ [a, b], on ait |Γ$ (t)|2 /= 0, nous pouvons définir la tangente unitaire à C dans la représentation paramétrique Γ par τΓ = Γ$ ◦ Γ−1 , |Γ$ ◦ Γ−1 |2 ce qui implique immédiatement que Γ$ = (τΓ ◦ Γ)|Γ$ |2 . Dès lors, par les propriétés de l’intégrale sur un arc de courbe, on obtient J C = J a b (f |dT (Γ)) = J b a (f ◦ Γ|Γ$ ) (f ◦ Γ|τΓ ◦ Γ)|Γ$ |2 = J C (f |τΓ )dL(Γ), ce qui montre que, dans ces conditions, la circulation de f le long de l’arc de courbe C de représentation paramétrique Γ est égale à l’intégrale sur C de la fonction (f |τΓ ). 15.4 Flux d’un champ vectoriel Soit maintenant S un élément de surface dans R3 de représentation paramétrique Σ et soit f un champ vectoriel dans R3 . Si [c, d, e] représente de nouveau le parallélogramme construit sur les points c, d, e de R3 avec sa représentation paramétrique canonique, et si f est un champ vectoriel constant sur [c, d, e], différentes questions de mécanique ou de physique conduisent à considérer l’expression (f |(d − c) ∧ (e − c)) = (f |N ([c, d, e])), qui représente le flux de f à travers l’élément de surface [c, d, e] dans le sens de la normale N ([c, d, e]). La terminologie provient de l’hydrodynamique lorsque f représente le champ des vitesses d’un fluide en mouvement. Pour étendre cette notion au cas où f n’est plus nécessairement constant et où S est un élément de surface de représentation paramétrique Σ, on est conduit à des “sommes de Riemann” du type SF (Σ, f, Π) = m $ j=1 (f (Σ(uj ))|N ([cj , dj , ej ])) 583 15.4. FLUX D’UN CHAMP VECTORIEL = m 8 $ 9 f (Σ(uj ))|(Σ(dj ) − Σ(cj )) ∧ (Σ(ej ) − Σ(cj )) , j=1 où les notations sont celles utilisées pour les intégrales de surface. De telles sommes correspondent à l’approximation qui consiste à remplacer la restriction de Σ à I j par le parallélogramme [cj , dj , ej ] et de supposer que le champ f y a la valeur constante f (Σ(uj )). On est ainsi conduit à la définition suivante. Définition. On dit que J ∈ R est le flux du champ vectoriel f : S → R3 à travers l’élément de surface S de représentation paramétrique Σ si pour chaque ! > 0, il existe une jauge δ sur I¯ telle que, pour toute P-partition δ-fine Π de I, on a |SF (Σ, f, Π) − J|2 ≤ !. On montre comme d’habitude qu’il existe au plus un tel J et on le note J S (f |N (dΣ)) ou J S (f |dN (Σ)) ou J SΣ (f |dN ), pour rappeler son mode de construction. De nouveau, plutôt que de reconstruire une théorie de l’intégration basée sur la définition ci-dessus, nous nous contenterons de montrer que, sous certaines hypothèses supplémentaires relatives à f et Σ, cette intégrale se ¯ Pour motiver la forme de cette ramène à une intégrale habituelle sur I. intégrale, il suffit encore de supposer Σ dérivable et d’appliquer le théorème de Lagrange à chaque composante Σi . On obtient ainsi m $ SF (Σ, f, Π) = , f1 (Σ(u )) det j=1 j +f2 (Σ(u )) det j + f3 (Σ(u )) det j & & & j j,3 j D1 Σ2 (uj,2 1 , a2 ) D1 Σ3 (u1 , a2 ) j j,3 D2 Σ2 (aj1 , uj,2 2 ) D2 Σ3 (a1 , u2 ) j j,1 j D1 Σ3 (uj,3 1 , a2 ) D1 Σ1 (u1 , a2 ) j j,1 D2 Σ3 (aj1 , uj,3 2 ) D2 Σ1 (a1 , u2 ) j,1 j j,2 j D1 Σ1 (u1 , a2 ) D1 Σ2 (u1 , a2 ) j j,1 j j,2 D2 Σ1 (a1 , u2 ) D2 Σ2 (a1 , u2 ) '- ' ' µ(I j ), où les uj,k appartiennent à ]ajl , bjl [, (1 ≤ j ≤ m; 1 ≤ k ≤ 3; 1 ≤ l ≤ 2). l Si, dans cette expression, on remplace les arguments des Dl Σk par uj , on obtient la somme de Riemann usuelle m $ j=1 [f1 (Σ(uj ))JΣ2 ,Σ3 (uj ) + f2 (Σ(uj ))JΣ3 ,Σ1 (uj ) 584 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE +f3 (Σ(uj ))JΣ1 ,Σ2 (uj )]µ(I j ) = S(I, (f ◦ Σ|NΣ ), Π), où l’application “normale” NΣ a été introduite précédemment. D’une manière similaire à celle utilisée dans l’intégration sur un arc de surface, on démontre la condition suffisante suivante pour que les sommes de Riemann SF (Σ, f, Π) et S(I, (f ◦ Σ|NΣ ), Π) conduisent à la même intégrale. ¯ Proposition. Si fH est bornée sur S et si Σ est de classe C 1 sur K = I, alors les intégrales S (f |dN (Σ)) et J K (f ◦ Σ|NΣ ) = J K [(f1 ◦ Σ)JΣ2 ,Σ3 + (f2 ◦ Σ)JΣ3 ,Σ1 + (f3 ◦ Σ)JΣ1 ,Σ2 ] existent simultanément et sont égales. En utilisant encore le théorème de changement de variables dans une intégrale on peut encore montrer, comme dans le cas de la circulation, que si Σ̃ est une représentation paramétrique de S régulièrement C 1 -équivalente à Σ, c’est-à-dire si Σ = Σ̃ ◦ h pour un difféomorphisme h de K sur K̃, on trouve que J J S (f |dN (Σ̃)) = sign Jh S (f |dN (Σ)). Dans le langage de la géométrie différentielle, on voit donc que les intégrales sont donc égales ou opposées selon que les représentations ont même orientation ou des orientations opposées. Si l’on suppose maintenant que Σ est injective sur K et que |NΣ (u)|2 /= 0 pour tout u ∈ K, on peut définir l’application normale unitaire à S dans la représentation Σ par NΣ ◦ Σ−1 νΣ = , |NΣ ◦ Σ−1 |2 ce qui entraı̂ne NΣ = (νΣ ◦ Σ)|NΣ |2 , et, dès lors, = J K J S (f |dN (Σ)) = J K (f ◦ Σ|NΣ ) (f ◦ Σ|νΣ ◦ Σ)|NΣ |2 = J S (f |νΣ )dA(Σ). Donc, dans les conditions mentionnées ci-dessus, le flux du champ vectoriel f à travers l’élément de surface S de représentation paramétrique Σ est égal à l’intégrale sur S de la fonction (f |νΣ ). 15.4. FLUX D’UN CHAMP VECTORIEL 585 En conclusion, les intégrales de circulation et de flux conduisent à des intégrales ordinaires d’expressions du type (f1 ◦ Γ)Γ$1 + . . . + (fn ◦ Γ)Γ$n , sur un intervalle fermé de R, et du type (f1 ◦ Σ)JΣ2 ,Σ3 + (f2 ◦ Σ)JΣ3 ,Σ1 + (f3 ◦ Σ)JΣ1 ,Σ2 sur un pavé fermé de R2 . D’autre part, le théorème du changement de variables dans les intégrales a conduit à la considération d’intégrales du type (f ◦ Ψ)JΨ où Ψ applique Rn en lui-même. Si l’on remarque que, dans la première expression, on a évidemment Γ$i = JΓi , (1 ≤ i ≤ n), on voit que toutes ces expressions possèdent une structure semblable et sont des cas particuliers d’expressions de la forme n $ i1 =1 ... n $ ik =1 (fi1 ,...,ik ◦ Φ)JΦi1 ,...,ik , où k est un entier compris entre 1 et n, les fi1 ,...,ik sont des fonctions de Rn dans R, Φ : K ⊂ Rk → Rn est une application de classe C 1 sur le pavé fermé K et JΦi1 ,...,ik : K → R, u 2→ det[(Φi1 , . . . , Φik )$u ] est le jacobien de l’application (Φi1 , . . . , Φik ) de K dans Rk . Le premier exemple correspond à k = 1 et n quelconque, le deuxième à k = 2 et n = 3 et le troisième à k = n. Des expressions du type général se présentent lorsqu’on cherche à étendre les notions des deux dernières sections du cas particulier des courbes et des surfaces dans R2 ou R3 au cas général des “variétés de dimension k dans Rn ”. Elles possèdent par ailleurs des propriétés algébriques et différentielles remarquables qui unifient les opérateurs différentiels de l’analyse vectorielle et fournissent le langage naturel pour la généralisation aux intégrales multiples du théorème fondamental du calcul différentiel et intégral. Cette généralisation s’appelle le théorème de Stokes-Cartan et fournit en outre un traitement unifié et rigoureux des résultats d’analyse vectorielle, rencontrés en physique et en mécanique, sur la réduction d’intégrales de volume à des intégrales de surface, et d’intégrales de surface à des intégrales curvilignes. C’est à ces questions et à des applications à l’analyse complexe que nous consacrerons les sections et le chapitre suivants. Sans perte de généralité, on pourra toujours supposer, en faisant si nécessaire une reparamétrisation, que K est le produit cartésien d’intervalles unitaires [0, 1]. Pour des raisons de simplicité, on se limitera au cas où les fonctions fi1 ,...,ik sont au moins continues sur K, ce qui suffit pour bon nombre d’applications. Enfin, l’élément 586 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE primordial dans une théorie analytique étant la représentation paramétrique plutôt que l’être géométrique, on abandonnera les hypothèses d’injectivité faites sur Φ. 15.5 Algèbre des formes extérieures Soient n ≥ 1 et k ≥ 1 des entiers. Définition. Si J = (j1 , j2 , . . . , jk ) est un k-uple d’entiers (1 ≤ ji ≤ n), la k-forme (extérieure ou alternée ou antisymétrique) élémentaire pJ sur Rn est l’application de Rn × . . . × Rn = Rnk dans R définie par # # h1 # j1 # h2 # j1 pJ (h1 , h2 , . . ., hk ) = ## . # .. # k # hj 1 h1j2 h2j2 .. . hkj2 . . . h1jk . . . h2jk .. .. . . . . . hkjk # # (h1 )J # # # (h2 )J # = det .. # # . # # (hk )J , où, si hi = (hi1 , hi2 , . . . , hin ), on pose (hi )J = (hij1 , hij2 , . . ., hijk ). Si k = 1, les 1-formes élémentaires pj sont simplement les applications projection sur la j e composante pj : Rn → R, h 2→ hj (1 ≤ j ≤ n). Si n = 4 et k = 2, les 2-formes élémentaires sur R4 sont les applications pi,j de R4 × R4 dans R définies par p1,1 (h1 , h2 ) = h11 h21 − h21 h11 , p1,2 (h1 , h2 ) = h11 h22 − h21 h12 , p1,3 (h1 , h2 ) = h11 h23 − h21 h13 , p1,4 (h1 , h2 ) = h11 h24 − h21 h14 , p2,1 (h1 , h2 ) = h12 h21 − h11 h22 , p2,2 (h1 , h2 ) = h12 h22 − h22 h12 , p2,3 (h1 , h2 ) = h12 h23 − h22 h13 , p2,4 (h1 , h2 ) = h12 h24 − h22 h14 , et ainsi de suite pour p3,1 , p3,2 , p3,3, p3,4 , p4,1, p4,2, p4,3 et p4,4 . Par les propriétés des déterminants, on a pj1 ,...,ji ,...,jl ,...,jk = −pj1 ,...,jl ,...,ji ,...,jk , et dès lors, pj1 ,...,ji ,...,jl ,...,jk = 0 s’il existe i = / l tel que ji = jl . En particulier, si k > n, un tel couple existe toujours et donc pJ = 0 quel que soit J. 15.5. ALGÈBRE DES FORMES EXTÉRIEURES 587 Posons B(n, k) = {J = (j1 , . . . , jk ) : 1 ≤ j1 ≤ n, . . . , 1 ≤ jk ≤ n}, A(n, k) = {J = (j1 , . . . , jk ) ∈ B(n, k) : jr /= js si r /= s, 1 ≤ r, s ≤ k}, C(n, k) = {J = (j1 , . . . , jk ) ∈ B(n, k) : j1 < j2 < . . . < jk }, de telle sorte que B(n, k) ⊃ A(n, k) ⊃ C(n, k), et que B(n, k), A(n, k) et n! n! C(n, k) contiennent respectivement nk , (n−k)! et k!(n−k)! éléments. Il résulte de la discussion précédente que pJ /= 0 si et seulement si J ∈ A(n, k) et que si J ∈ A(n, k), il existe un élément unique I ∈ C(n, k) et une permutation π(I) de I telle que J = π(I), et donc, en vertu des propriétés des déterminants, telle que pJ = pπ(I) = (sign π(I))pI, où sign π(I) = 1 si π(I) s’obtient par un nombre pair de permutations de deux éléments seulement et sign π(I) = −1 si π(I) s’obtient par un nombre impair de telles opérations. Dès lors, toutes les k-formes élémentaires non nulles pJ s’expriment en fonction des k-formes pI , I ∈ C(n, k), qui sont appelées les k-formes (extérieures, alternées ou antisymétriques) fondamentales et sont en nombre n! k!(n−k)! . Ainsi, pour k = 1, les n 1-formes élémentaires pi (1 ≤ i ≤ n) sont fondamentales, pour k = n−1, il y a également n (n-1)-formes fondamentales p2,3,...,n , p1,3,...,n , . . . , p1,2,...,n−1 , et pour k = n, il y a une seule n-forme fondamentale p1,2,...,n . Les 2-formes fondamentales dans R3 sont p1,2 , p1,3, p2,3 , et les 2-formes fondamentales dans R4 sont p1,2 , p1,3, p1,4, p2,3 , p2,4, p3,4 . Définition. Une k-forme extérieure (ou alternée ou antisymétrique) réelle (resp. complexe) sur Rn est une application u de Rn × . . . × Rn = Rnk dans R (resp. C) de la forme $ u= uJ pJ , J∈B(n,k) où les uJ ∈ R (resp. C). Les 1-formes extérieures réelles (resp. complexes) sont donc les formes linéaires réelles (resp. complexes) sur Rn , c’est-à-dire les éléments de L(Rn , R) (resp. L(Rn , C)). 588 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE L’application 5p1,2 + 12 p2,1 + 8p4,3 est une 2-forme extérieure réelle sur Rn . [ Si K = R ou C, l’ensemble k (Rn , K) des k-formes extérieures à valeurs dans K est donc l’espace vectoriel sur K engendré par les k-formes élémentaires pI. C’est évidemment un sous-espace vectoriel de l’ensemble Lk (Rn , K) des applications k-linéaires de Rn dans K. Il est utile également de donner un sens à la notion de 0-forme extérieure. Toute application u : {0} → K est caractérisée par son unique valeur u = u(0), et l’on peut ainsi associer une 0-forme à chaque élément de K. % [ Si u = J∈B(n,k) uJ pJ ∈ k (Rn , K), alors, on a $ u= uJ pJ = J∈A(n,k) = $ I∈C(n,k) si l’on pose $ I∈C(n,k) $ permutations ũI = π(I) $ permutations de I $ permutations π(I) de I de I uπ(I) pπ(I) uπ(I) sign π(I) pI = π(I) $ ũI pI, I∈C(n,k) uπ(I) sign π(I). [k On voit donc que tout u ∈ (Rn , K) peut s’exprimer comme combinaison linéaire à coefficients dans K des k-formes fondamentales. Que cette expression soit unique résulte du lemme suivant. Lemme. % I∈C(n,k) uI pI = 0 si et seulement si uI = 0, (I ∈ C(n, k)). Démonstration. La condition suffisante est évidente. Pour la condition nécessaire, si I = (i1 , . . . , ik ) ∈ C(n, k), de telle sorte que 1 ≤ i1 < i2 < . . . < ik ≤ n, alors, en prenant h = (h1 , . . . , hk ) ∈ Rnk défini par hm il = δl,m (symbole de Kronecker) , 1 ≤ m ≤ k, 1 ≤ l ≤ k, hm i = 0, i ∈ {1, 2, . . ., n} \ {i1 , . . ., ik }, on trouve 0= $ uJ pJ (h1 , . . . , hk ) = uI , J∈C(n,k) et la démonstration est complète. 15.5. ALGÈBRE DES FORMES EXTÉRIEURES Dès lors, si u ∈ [k (Rn , K) et si u= $ uIpI = $ (uI − u$I)pI = 0, I∈C(n,k) on en déduit 589 I∈C(n,k) $ u$I pI , I∈C(n,k) et donc, par le Lemme, uI = u$I , (I ∈ C(n, k)). En résumé, toute k-forme extérieure u sur Rn s’exprime d’une manière unique comme combinaison linéaire des k-formes fondamentales pI u= $ uI pI, I∈C(n,k) et cette expression s’appelle l’écriture canonique de u. Il en résulte que n! (Rn , K) est un espace vectoriel sur K de dimension k!(n−k)! , et que si % % u = I∈C(n,k) uI pI , v = I∈C(n,k) vI pI sont deux k-formes extérieures en % % écriture canonique, et si c ∈ K, alors I∈C(n,k) (uI +vI )pI et I∈C(n,k) cuIpI sont les écritures canoniques de u + v et de cu respectivement. Soient n ≥ 1, k ≥ 1 et l ≥ 1 des entiers. Nous allons d’abord définir le produit extérieur d’une k-forme fondamentale pI et d’une l-forme fondamentale pJ . [k Définition. Le produit extérieur pI ∧ pJ de pI = pi1 ,...,ik par pJ = pj1 ,...,jl est la (k+l)-forme élémentaire dans Rn pI ∧ pJ = p(I,J), où (I, J) désigne le (k+l)-uple (i1 , . . . , ik , j1 , . . . , jl ). Si α, β ∈ {−1, 1}, on définit (αpI ) ∧ (βpJ ) par (αpI ) ∧ (βpJ ) = (αβ)p(I,J). En d’autres termes, pi1 ,...,ik ∧pj1 ,...,jl = pi1 ,...,ik ,j1 ,...,jl . Si (I, J) /∈ A(n, k + l) (c’est-à-dire si I et J ont un élément en commun), alors, par ce qui précède, pI ∧ pJ = 0. Si (I, J) ∈ A(n, k + l), désignons par [I, J] ∈ C(n, k + l) le (k+l)uple obtenu en réordonnant les éléments de I∪J dans l’ordre croissant: p[I,J] est donc une (k+l)-forme fondamentale. 590 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE Proposition. Si I ∈ C(n, k), J ∈ C(n, l) et (I, J) ∈ A(n, k + l), on a pI ∧ pJ = (−1)α(I,J)p[I,J], où α(I, J) désigne le nombre de différences jr − is strictement négatives (1 ≤ r ≤ l, 1 ≤ s ≤ k). Démonstration. Partant de (I, J) = (i1 , . . ., ik , j1, . . . , jl ), on arrivera pas à pas à [I, J] en permutant successivement ik avec tous les jr tels que jr < ik , puis en permutant successivement ik−1 avec tous les jr tels que jr < ik−1 , et ainsi de suite jusqu’à i1 . Comme, à chaque opération pI ∧ pJ est multiplié par (−1), la formule est prouvée. Proposition. Si I ∈ C(n, k), J ∈ C(n, l) et K ∈ C(n, m), on a (pI ∧ pJ ) ∧ pK = pI ∧ (pJ ∧ pK ), dont on désigne la valeur commune par pI ∧ pJ ∧ pK . Démonstration. Si (I, J, K) /∈ A(n, k + l + m), les deux membres de l’égalité à prouver sont nuls et donc égaux. On peut donc supposer que (I, J, K) ∈ A(n, k + l + m). Par la définition et la proposition précédentes, on a (pI ∧ pJ ) ∧ pK = p(I,J) ∧ pK = (−1)α(I,J)p[I,J] ∧ pK = (−1)α(I,J)p([I,J],K) = (−1)α(I,J)(−1)α([I,J],K)p[I,J,K] = (−1)α(I,J)+α(I,K)+α(J,K)p[I,J,K]. On montre de la même manière que pI ∧ (pJ ∧ pK ) est égal à cette dernière expression. Passons maintenant à la définition du produit extérieur de deux formes quelconques. Définition. Si u= % I∈C(n,k) uI pI ∈ [k (Rn , K), v = % J∈C(n,l) vJ pJ ∈ [l (Rn , K), sont respectivement une k-forme extérieure et une l-forme extérieure sur Rn , [ le produit extérieur u ∧ v de u par v est l’élément de k+l (Rn , K) défini par u∧v = $ $ uI vJ p(I,J). I∈C(n,k) J∈C(n,l) Le produit extérieur possède les propriétés suivantes. 591 15.5. ALGÈBRE DES FORMES EXTÉRIEURES Proposition. 1. Si u ∈ 2. Si u ∈ [k (Rn , K), v ∈ [k (Rn , K), v ∈ [l [k (Rn , K) et w ∈ (Rn , K) et k + l > n, alors u ∧ v = 0. [l (Rn , K), c ∈ K, alors (u + v) ∧ w = (u ∧ w) + (v ∧ w), w ∧ (u + v) = (w ∧ u) + (w ∧ v), (cu) ∧ w = u ∧ (cw) = c(u ∧ w). 3. Si u ∈ [k (Rn , K), v ∈ [l (Rn , K) et w ∈ [m (Rn , K), alors (u ∧ v) ∧ w = u ∧ (v ∧ w), et la valeur commune s’écrit u ∧ v ∧ w. [ [ 4. Si u ∈ k (Rn , K) et v ∈ l (Rn , K), alors u ∧ v = (−1)kl (v ∧ u). 5. Si I = (i1 , . . . , ik ) ∈ B(n, k), alors pi1 ∧ pi2 ∧ . . . ∧ pik = pi1 ,...,ik = pI . Démonstration. Les propriétés 1, 2 et 5 sont des conséquences immédiates de la définition. Par la propriété 2, il suffit de démontrer la propriété 3 pour des formes fondamentales, ce qui a été fait plus haut. Quant à la propriété 4, elle découle de la propriété 2 et du fait que, si I = (i1 , . . . , ik ) ∈ C(n, k) et J = (j1 , . . . , jl ) ∈ C(n, l), alors les deux membres sont nuls si (I, J) /∈ A(n, k + l) tandis que, dans le cas contraire, on a p(I,J) = pi1 ,...,ik ,j1 ,...,jl = (−1)kl pj1 ,...,jl ,i1 ,...,ik = (−1)kl p(J,I). Exemple. Si u = %3 i=1 ui pi et v = %3 j=1 %3 k=1 vj,k pj,k , on a u ∧ v = u1 v2,3 p1,2,3 + u1 v3,2 p1,3,2 + u2 v1,3 p2,1,3 +u2 v3,1 p2,3,1 + u3 v1,2 p3,1,2 + u3 v2,1 p3,2,1 = [u1 (v2,3 − v3,2 ) + u2 (v3,1 − v1,3 ) + u3 (v1,2 − v2,1 )]p1,2,3. Soient n ≥ 1 et k ≥ 0 des entiers. 592 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE % % Définition. Si u = I∈C(n,k) uIpI et v = I∈C(n,k) vI pI sont deux élé[ ments de k (Rn , K), le produit scalaire (u|v) de u par v est l’élément de K défini par $ (u|v) = uI vI , I∈C(n,k) où vI est le conjugué de vI . % En particulier, si u = ni=1 ui pi est une 1-forme, on peut lui associer % biunivoquement l’élément u = (u1 , . . . , un) de Kn . Si alors v = ni=1 vi pi est aussi une 1-forme, on voit que le produit scalaire (u|v) n’est rien d’autre que le produit scalaire usuel (u|v) des éléments de Kn qui leur sont respectivement associés. On vérifie sans peine les propriétés suivantes du produit scalaire. [ Proposition. Si u, v, w ∈ k (Rn , K), on a 1. (u|v) = (v|u) 2. (u + v|w) = (u|w) + (v|w) 3. Si c ∈ K, (cu|v) = c(u|v). Soient n ≥ 1 et 0 ≤ k ≤ n des entiers. % [ Définition. Si u = I∈C(n,k) uI pI ∈ k (Rn , K), l’adjointe (de Hodge) 7u [ de u est l’élément de n−k (Rn , K) défini par 7u = $ !(I)uI pI∗ , I∈C(n,k) où, pour chaque I = (i1 , . . . , ik ) ∈ C(n, k), on pose I∗ = (i∗1 , . . . , i∗n−k ), où les 1 ≤ i∗1 < i∗2 < . . . < i∗n−k ≤ n sont tels que {i∗1 , . . . , i∗n−k } = {1, 2, . . ., n} \ {i1 , . . . , ik }, tandis que !(I) est la signature de la permutation (i1 , . . . , ik , i∗1 , . . . , i∗n−k ) 2→ (1, 2, . . ., n). Bien entendu, si u est une 0-forme de valeur constante u ∈ K cette définition signifie que 7u = ūp1,...,n , et si u = u1,...,n p1,...,n est une n-forme, cette définition signifie que 7u est la 0-forme associée à l’élément u1,...,n de K. On notera que (I∗ )∗ = I et que !(I∗ ) = (−1)k(n−k) !(I). % Exemple. Si u = 3i=1 ui pi , alors 7u = u1 p2,3 − u2 p1,3 + u3 p1,2 . L’adjointe de Hodge est caractérisée par la propriété importante suivante, qui relie les produits extérieur et scalaire. 593 15.5. ALGÈBRE DES FORMES EXTÉRIEURES Proposition. Soient n ≥ 1 et 0 ≤ k ≤ n des entiers et soit u ∈ [ Alors 7u est l’unique élément de n−k (Rn, K) tel que l’on ait [k (Rn , K). v ∧ 7u = (v|u)p1,...,n (= 7(v|u) = 7(u|v)), pour tout v ∈ [k (Rn , K), Démonstration. En vertu des propriétés des produits extérieur et scalaire, il suffit de démontrer le résultat pour des k-formes fondamentales u = pI , I = (i1 , . . . , ik ) ∈ C(n, k) (u = 1 si k = 0) et v = pL , L = (l1 , . . ., lk ) ∈ C(n, k) (v = 1 si k = 0). Alors, laissant les cas particuliers k = 0 et k = n au lecteur, on a 7u = !(I)pI∗ , et dès lors v ∧ 7u = !(I)p(L,I∗) et le second membre est égal à !(I)p(I,I∗) = p1,...,n si L = I, et est égal à zéro si L /= I. D’autre part, (pI |pL ) est égal à zéro si L /= I, et à un si L = I, et la formule s’en déduit aussitôt.Pour montrer l’unicité de l’élément vérifiant la propriété de la proposition, on remarque que si w et z sont des éléments [ de n−k (Rn , K) tels que l’on ait v ∧ w = v ∧ z = (v|u)p1,...,n , pour tout v ∈ [k (Rn , K), alors, pour ces v, on aura v ∧ (w − z) = 0. En posant w−z= $ cIpI , I∈C(n,n−k) et en prenant v = 7(w − z), on trouve alors 0 = 7(w − z) ∧ (w − z) = (−1)k(n−k) (w − z) ∧ [7(w − z)] = (−1)k(n−k) (w − z|w − z)p1,...,n = (−1)k(n−k) $ I∈C(n,k) et donc w − z = 0. L’adjointe d’une forme a les propriétés suivantes. |cI|2 p1,...,n , 594 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE [k Proposition. Si u, v ∈ 1. 7(cu) = c̄(7u) 2. 7(u + v) = 7u + 7v 3. 77u = (−1)k(n−k) u. (Rn , K) et si c ∈ K, on a Démonstration. Les propriétés 1 et 2 sont évidentes. Pour la propriété % % 3, si u = I∈C(n,k) uI pI, alors 7u = I∈C(n,k) !(I)uIpI∗ et 7(7u) = $ I∈C(n,k) uI pI = (−1)k(n−k) u. I∈C(n,k) Exemples. 1. Si u = [1 3 (R , R), alors et $ !(I∗ )!(I)uIpI∗∗ = (−1)k(n−k) %3 i=1 ui pi et v = %3 i=1 vi pi sont des éléments de u ∧ v = (u1 v2 − u2 v1 )p1,2 + (u1 v3 − u3 v1 )p1,3 + (u2 v3 − u3 v2 )p2,3 , 7(u ∧ v) = (u1 v2 − u2 v1 )p3 − (u1 v3 − u3 v1 )p2 + (u2 v3 − u3 v2 )p1 = (u2 v3 − u3 v2 )p1 + (u3 v1 − u1 v3 )p2 + (u1 v2 − u2 v1 )p3 , qui est la 1-forme dans R3 associée au produit vectoriel u ∧ v des éléments u et v de R3 naturellement associés à u et v. 2. Avec les mêmes notations que dans l’exemple 1, on a aussi ou encore (7u) ∧ v = (u|v)p1,2,3 = u ∧ (7v) 7[(7u) ∧ v] = 7[u ∧ (7v)] = (u|v). 15.6 Formes différentielles Soit E ⊂ Rn un ouvert et f ∈ C 1 (E, K). En chaque point x ∈ E, la dérivée totale fx$ de f est l’application linéaire de Rn dans K telle que fx$ (h) = n $ i=1 Di f (x) hi = n $ i=1 Di f (x) pi(h). % En d’autres termes, pour chaque x ∈ E, fx$ = ni=1 Dif (x) pi ∈ L(Rn , K) [ = 1 (Rn , K). En conséquence, l’application x 2→ fx$ peut être considérée [ comme une application de E dans 1 (Rn , K). Il est utile de considérer, plus [ généralement, des applications de E dans k (Rn , K). Soit E ⊂ Rn non vide et k ≥ 1 un entier. 595 15.6. FORMES DIFFÉRENTIELLES Définition. On appelle k-forme différentielle (extérieure) sur E toute ap[ plication ω de E dans k (Rn , K) de la forme ω : x 2→ $ wI pI, I∈B(n,k) où, pour chaque I ∈ B(n, k), wI est une application de E dans K. D’une manière équivalente, une k-forme différentielle sur E peut être considérée comme une application de E × Rn × . . . × Rn = E × Rnk dans K de la forme ω(x; h1 , . . . , hk ) = $ wI(x)pI(h1 , . . . , hk ). I∈B(n,k) Ainsi, l’application ω définie par ω(x1 , x2 , x3 ; h1 , h2 )) = x2 p1,2 (h1 , h2 ) + sin(x1 x2 x3 )p3,2 (h1 , h2 ) est une 2-forme dans R3 . % Si ω = I∈B(n,k) wI pI est une k-forme différentielle sur E, alors, pour % chaque x ∈ E, la k-forme extérieure ω(x) = I∈B(n,k) wI (x)pI possède % une écriture canonique unique I∈C(n,k) w̃I (x)pI. La k-forme différentielle % I∈C(n,k) w̃I pI est appelée l’écriture canonique de ω. Notons en particulier qu’une 0-forme différentielle sur E sera identifiée à une application de E dans K. % La k-forme différentielle ω = I∈C(n,k) wI pI sera dite réelle (resp. complexe) si K = R (resp. C). Elle sera dite de classe C l (l ≥ 0, entier) si, pour chaque I ∈ C(n, k), wI est de classe C l sur E. On désignera par [ C l (E, k (Rn , K)) l’ensemble des k-formes différentielles (réelles pour K = R, complexes pour K = C) de classe C l sur E. On définit de façon naturelle les opérations d’addition, de multiplication extérieure, de produit scalaire et d’adjointe de la manière suivante : (ω + λ)(x) = ω(x) + λ(x), (gω)(x) = g(x)ω(x), (ω ∧ µ)(x) = ω(x) ∧ µ(x), (ω|λ)(x) = (ω(x)|λ(x)), (7ω)(x) = 7(ω(x)), pour tout x ∈ E, où ω et λ sont des k-formes différentielles sur E, µ une l-forme différentielle sur E et g est une application de E dans K. Exemples. 1. Une 1-forme différentielle réelle dans E ⊂ Rn s’écrit d’une manière unique ω= n $ i=1 wipi , 596 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE où les wi : E ⊂ Rn → R. Sa donnée correspond donc à celle d’un champ w sur E, c’est-à-dire d’une application w : E ⊂ Rn → Rn . Réciproquement, à un champ w sur E, on peut associer la 1-forme différentielle 1 ωw = n $ wi pi . i=1 Mais on peut également lui associer la (n-1)-forme différentielle n−1 ωw = n $ i=1 wip1,...,Ii,...,n , où (1, . . . , Ii, . . . , n) = (1, . . . , i − 1, i + 1, . . ., n), puisque chaque élément I ∈ C(n, n − 1) peut-être caractérisé par l’élément i de {1, 2, . . ., n} qu’il ne contient pas. % 2. La 1-forme différentielle ni=1 Dif pi introduite au début de ce para1 1 graphe est la 1-forme ωgrad ou ω∇f associée au champ gradient de f défini f par grad f = ∇f = (D1 f, . . . , Dn f ). 3. A une application f : E → K on peut non seulement associer la 0-forme différentielle correspondante, mais aussi la n-forme différentielle ωfn = f p1,...,n . Supposons maintenant que E ⊂ Rn soit un ouvert et que f ∈ C 1 (E, K). On a vu que la notion de dérivée totale permet d’associer à f (ou à la 0-forme différentielle correspondante) la 1-forme différentielle n $ Dif pi i=1 que nous noterons df et appellerons la différentielle extérieure de f . Nous étendrons comme suit cette notion aux k-formes différentielles de classe C 1 sur E. % Définition. Soit E ⊂ Rn un ouvert et ω = I∈C(n,k) wIpI une k-forme différentielle de classe C 1 sur E. On appelle différentielle extérieure dω de ω la (k+1)-forme différentielle de classe C 0 sur E définie par dω = $ I∈C(n,k) dwI ∧ pI , 597 15.6. FORMES DIFFÉRENTIELLES où les dwI sont donnés, conformément à ce qui précède, par dwI = n $ Di wIpi . i=1 Explicitement, on a donc, dω = $ n $ Di wIp(i,I). I∈C(n,k) i=1 En particulier, les dérivées partielles d’une fonction constante étant nulles, on a dpI = 0, pour tout I ∈ C(n, k). D’autre part, en appliquant la définition de différentielle extérieure à la projection sur la j e composante pj : Rn → R, considérée ici comme une 0-forme dans Rn (ce que l’on traduit par l’emploi d’un symbole en caractère non gras), on voit que dpj = pj , (1 ≤ j ≤ n), et, comme il est d’usage de commettre l’abus d’écriture qui consiste à remplacer pj par sa valeur xj en x, on écrit traditionnellement dxj au lieu de dpj . Comme, par ailleurs, on sait que pI = pi1 ,...,ik = pi1 ∧ . . . ∧ pik , on écrira, pour suivre la tradition, pI = dxi1 ∧ . . . ∧ dxik = dxI , ce qui fournit, pour la k-forme différentielle ω = tions usuelles $ wI dxI, ou % I∈B(n,k) wI pI , les nota- I∈B(n,k) n $ n $ ... dwI = n $ i1 =1 i2 =1 n $ ik =1 En particulier, on écrira i=1 wi1,i2 ,...,ik dxi1 ∧ dxi2 ∧ . . . ∧ dxik . Di wI dxi , dω = $ I∈C(n,k) dwI ∧ dxI. La différentielle extérieure d’une forme possède les propriétés suivantes. 598 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE [ Proposition. Soit E ⊂ Rn un ouvert, k ≥ 0, l ≥ 0, ω ∈ C 1 (E, k (Rn , K)), [ [ [ λ ∈ C 1 (E, k (Rn , K)), µ ∈ C 1 (E, l (Rn , K)), ν ∈ C 2 (E, k (Rn , K)), c ∈ K et f ∈ C 1 (E, K). Alors, on a [ [ 1. ω + λ ∈ C 1 (E, k (Rn , K)), cω ∈ C 1 (E, k (Rn , K)) et d(ω + λ) = dω + dλ, d(cω) = cdω. 2. f ω ∈ C 1 (E, [k 3. ω ∧ µ ∈ C 1 (E, (Rn , K)) et d(f ω) = df ∧ ω + f dω. [k+l (Rn , K)) et d(ω ∧ µ) = dω ∧ µ + (−1)k (ω ∧ dµ). 4. d2 ν = d(dν) = 0 (Théorème de Poincaré). Démonstration. La propriété 1 est immédiate et il suffit dès lors de démontrer la propriété 2 dans le cas où ω = wI dxI. Alors, f ω = f wI dxI ∈ [ C 1 (E, k (Rn , K)) et d(f wIdxI) = d(f wI) ∧ dxI = = n $ i=1 = n $ i=1 n $ i=1 Di (f wI)dxi ∧ dxI [(Dif )wI + f DiwI ]dxi ∧ dxI [Dif dxi ∧ wIdxI] + f n $ i=1 Di wI dxi ∧ dxI = df ∧ ω + f dω. Il suffit également de démontrer la propriété 3 lorsque ω = wI dxI et µ = mJ dxJ. On a, par la propriété 2, d(ω ∧ µ) = d(wImJ dx(I,J)) = d(wImJ ) ∧ dx(I,J) + wI mJd(dx(I,J)) = n $ i=1 + n $ i=1 Di (wImJ)dxi ∧ dx(I,J) = I J wI (DimJ )dxi ∧ dx ∧ dx = n $ i=1 & (Di wI)mJ dxi ∧ dxI ∧ dxJ n $ i=1 (DiwI)dxi ∧ dx I ' ∧ mJ dxJ 599 15.6. FORMES DIFFÉRENTIELLES I +(−1) wIdx ∧ k & n $ i=1 Di mJ dxi ∧ dx J ' = dω ∧ µ + (−1)k ω ∧ dµ. Enfin, il suffit de prouver la propriété 4 lorsque ν = wI dxI avec wI ∈ C 2 (E, K). On a, en utilisant les propriétés 1 et 3, d ν = d(dwI 2 = n $ i=1 = $ 1≤i<j≤n ∧ dxI) = d(dwI ) ∧ dxI − dw I d(Di wI) ∧ dxi ∧ dx = n $ i=1 ∧ d(dxI) I n $ j=1 2 Dij wI dxj ∧ dxi ∧ dxI + $ 1≤i<j≤n =d & n $ i=1 Di wI dxi ∧ dxI 2 Dij wI dxj ∧ dxi $ 1≤j<i≤n ' ∧ dxI 2 Dij wI dxj ∧ dxi ∧ dxI = 2 2 (Dij wI − Dji wI )dxj ∧ dxi ∧ dxI = 0, 2 w = D 2 w . Dans l’avant-dernière ligne du calcul, on a remplacé puisque Dij I ji I i par j et j par i dans la deuxième somme et utilisé le fait que dxi ∧ dxj = −dxj ∧ dxi. Exemples. 1. Soit E ⊂ Rn un ouvert et f ∈ C 2 (E, R). On a vu plus haut que 1 df = ωgrad f = n $ Di f dxi . i=1 Dès lors, 7df = n $ !(i) Dif dxi∗ = i=1 n $ i=1 Z ∧ . . . ∧ dx , (−1)i−1 Dif dx1 ∧ . . . ∧ dx i n Zi indique que le terme correspondant est absent. Par conséquent, où dx d 7 df = n $ i=1 = n $ i=1 Z ∧ . . . ∧ dx (−1)i−1d(Dif ) ∧ dx1 ∧ . . . ∧ dx i n (−1)i−1 n $ j=1 2 Zi ∧ . . . ∧ dxn Dij f dxj ∧ dx1 ∧ . . . ∧ dx 600 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE = n $ i=1 = & %n où ?f = i=1 n $ n $ i=1 + 2 Dii f i=1 ' dx1 ∧ . . . ∧ dxn = ?f dx1 ∧ . . . ∧ dxn , 2 f s’appelle le laplacien de f . On a donc aussi Dii 1 2. Soit ωw = Alors, 1 dωw = 2 Z ∧ . . . ∧ dx (−1)i−1 Dii f dxi ∧ dx1 ∧ . . . ∧ dx i n 7d 7 df = ?f. %n i=1 wi dwi ∧ dxi = $ 1≤j<i≤n dxi ∈ C 1 (E, n $ n $ i=1 j=1 (Rn , R)), où E ⊂ Rn est ouvert. Dj wi dxj ∧ dxi = Dj wi dxj ∧ dxi = En particulier, si n = 2, [1 $ 1≤i<j≤n $ 1≤i<j≤n Dj wi dxj ∧ dxi (Diwj − Dj wi)dxi ∧ dxj . 1 1 dωw = (D1 w2 − D2 w1 )dx1 ∧ dx2 , 7dωw = D1 w2 − D2 w1 . Si n = 3, 1 7dωw = (D1 w2 − D2 w1 )dx3 − (D1 w3 − D3 w1 )dx2 + (D2 w3 − D3 w2 )dx1 1 = (D2 w3 − D3 w2 )dx1 + (D3 w1 − D1 w3 )dx2 + (D1 w2 − D2 w1 )dx3 = ωrot w, où l’opérateur différentiel rotationnel est défini par rot w = (D2 w3 − D3 w2 , D3 w1 − D1 w3 , D1w2 − D2 w1 ), et parfois noté symboliquement ∇ ∧ w. D’autre part, 1 7ωw = n $ i=1 et 1 d 7 ωw = n $ i=1 = n $ i=1 (−1)i−1 Z ∧ . . . ∧ dx , wi(−1)i−1 dx1 ∧ . . . ∧ dx i n Z ∧ . . . ∧ dx (−1)i−1 dwi ∧ dx1 ∧ . . . ∧ dx i n n $ j=1 Zi ∧ . . . ∧ dxn Dj wi dxj ∧ dx1 ∧ . . . ∧ dx 601 15.6. FORMES DIFFÉRENTIELLES = n $ i=1 Z ∧ . . . ∧ dx (−1)i−1 Di wi dxi ∧ dx1 ∧ . . . ∧ dx i n = & n $ i=1 ' n Di wi dx1 ∧ . . . ∧ dxn = ωdiv w, où l’opérateur différentiel divergence est défini par div w = n $ Di wi , i=1 et parfois noté symboliquement (∇|w). La formule peut encore s’écrire 1 7d 7 ωw = div w. L’opérateur 7d7 est appelé l’opérateur de codifférentiation extérieure et est noté δ. 3. Si f ∈ C 2 (E, R) et w ∈ C 2 (E, R3), avec E ⊂ R3 ouvert, on aura, par ce qui précède, 1 1 0 = 7d2 f = 7dωgrad f = ωrot grad f , et donc rot grad f = 0, tandis que 1 1 1 3 0 = d2 ωw = d(7 7 dωw ) = d(7ωrot w ) = ωdiv rot w , et donc div rot w = 0. L’étude des propriétés des opérateurs différentiels gradient, divergence, rotationnel et de leurs dérivés s’appelle l’analyse vectorielle. La théorie des formes différentielles lui fournit un cadre général et systématique. Si F ⊂ Rm et E ⊂ Rn sont des ouverts, si f ∈ C 1 (E, K) et g ∈ C 1 (F, E), on sait, par le théorème de dérivation des fonctions composées, que f ◦ g ∈ C 1 (F, K) et que $ d(f ◦ g)(y, h) = (f ◦ g)$y (h) = (fg(y) ◦ gy$ )(h) $ $ = fg(y) (gy$ (h)) = fg(y) m $ j=1 hj Dj g(y) = n $ i=1 m $ Di f (g(y)) Dj gi (y)hj j=1 602 CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE = n $ Di f (g(y))dgi(y, h), i=1 m pour tout y ∈ F et tout h ∈ R . On a donc d(f ◦ g) = n $ i=1 [(Dif ) ◦ g]dgi, (15.6) et l’on voit qu’en définissant le changement de variables x = g(y) dans la 1-forme différentielle df par le membre de droite de (15.6), cette opération commutera avec l’opération de différentiation extérieure. On est ainsi conduit à la définition suivante, dans le cas général. [ Définition. Soient E ⊂ Rn , ω ∈ C 0 (E, k (Rn , K)), où n, k ≥ 1 sont des entiers, F ⊂ Rm et g ∈ C 1 (F, E). La transformée par g de ω= $ wIdxI I∈C(n,k) est l’élément g ∗ ω de C 0 (F, [k (Rm, K)) défini par $ g ∗ω = (wI ◦ g)dgI, I∈C(n,k) où, si dxI = dxi1 ∧ . . . ∧ dxik , on a posé dgI = dgi1 ∧ . . . ∧ dgik = m $ j1 =1 Dj1 gi1 dyj1 ∧ . . . ∧ m $ jk =1 Djk gik dyjk , les dyj désignant les 1-formes fondamentales dans Rm . Si f ∈ C 0 (E, K), la transformée par g de f (considérée comme 0-forme) est définie par g ∗ f = f ◦ g, c’est-à-dire par le composé de f avec g. La transformée possède les propriétés suivantes. [ Proposition. Soient E ⊂ Rn , F ⊂ Rm des ouverts, ω ∈ C 0 (E, k (Rn , K)), [ [ λ ∈ C 0 (E, k (Rn, K)), µ ∈ C 0 (E, l (Rn , K)), f ∈ C 0 (E, K) et g ∈ C 1 (F, E). Alors, on a 1. g ∗ (ω + λ) = g ∗ ω + g ∗ λ 2. g ∗ (f ω) = (f ◦ g)g ∗ω 15.6. FORMES DIFFÉRENTIELLES 603 3. g ∗ (ω ∧ µ) = g ∗ ω ∧ g ∗ µ 4. Si f ∈ C 1 (E, K), d(g ∗f ) = g ∗ (df ) [ 5. Si ω ∈ C 1 (E, k (Rn , K)), k ≥ 1 et g ∈ C 2 (F, E), d(g ∗ω) = g ∗ dω. 6. Si G ⊂ Rl est un ouvert et h ∈ C 1 (G, F ), (g ◦ h)∗ ω = h∗ (g ∗ω). Démonstration. Les propriétés 1 à 3 sont des conséquences immédiates de la définition et la propriété 4 est une écriture différente de (15.6). Elles impliquent qu’il suffit de démontrer les propriétés 5 et 6 pour ω = wIdxI où I ∈ C(n, k). Pour la propriété 5, on a d(g ∗ (wIdxI )) = d[(wI ◦ g)dgi1 ∧ . . . ∧ dgik ] = d(wI ◦ g) ∧ dgi1 ∧ . . . ∧ dgik + (wI ◦ g)d2 gi1 ∧ dgi2 ∧ . . . ∧ dgik −(wI ◦ g)dgi1 ∧ d2 gi2 ∧ . . .∧ dgik + . . .+ (−1)k−1(wI ◦ g)dgi1 ∧ dgi