Telechargé par trgjk yfojn

Mawhin Analyse Complet

publicité
See discussions, stats, and author profiles for this publication at: http://www.researchgate.net/publication/266367922
Analyse. Fondements, techniques, évolution.
(Analysis. Foundations, techniques,
evolution).2ème éd. 2ème éd
ARTICLE
READS
13
1 AUTHOR:
Jean Mawhin
Université catholique de Louvain
447 PUBLICATIONS 5,177 CITATIONS
SEE PROFILE
Available from: Jean Mawhin
Retrieved on: 02 November 2015
ANALYSE
Fondements, techniques, évolution
Jean Mawhin
Université Catholique de Louvain
Préface de la deuxième édition
Ce Cours d’analyse constitue la partie théorique du cours de calcul différentiel
et intégral dispensé aux étudiants de candidatures en sciences mathématiques et
physiques à l’Université Catholique de Louvain. En le publiant, nous ne faisons
que suivre une tradition illustrée à l’U.C.L. par Ph. Gilbert et Ch.J. de la Vallée
Poussin et, dans les autres universités belges, par A. Timmermans, A. Meyer, M.
Schaar, E. Catalan, P. Mansion, J. Neuberg, L. Godeaux et H.G. Garnir.
Le but de cet ouvrage est d’introduire les concepts et les résultats fondamentaux
du calcul différentiel et intégral, de développer les techniques correspondantes utiles
à tant de disciplines scientifiques, et d’ouvrir à quelques domaines importants de
l’analyse qui seront développés dans d’autres cours.
La notion de limite est le seul concept vraiment nouveau que l’analyse introduit.
Face à une opération impossible pour les opérations habituelles de l’arithmétique
ou de l’algèbre, mais pour lesquelles un procédé de résolution “approchée” existe,
on cherche à montrer que l’erreur commise peut être rendue arbitrairement petite
pour un choix approprié, et suffisamment vaste, de solutions approchées. C’est une
méthodologie proche de celle de l’expérimentateur ou du technicien, à cela près
qu’il n’y a pas de limitation a priori dans la précision.
Depuis la publication par L’Hospital, il y a exactement trois cents ans, du premier d’entre eux, la production de livres de calcul différentiel et intégral a été très
abondante. Chaque auteur doit donc se justifier en dégageant l’originalité de son
produit. Après un premier chapitre rappelant le minimum indispensable sur le langage des ensembles, les nombres et l’espace vectoriel à n dimensions, les suivants
abordent successivement les notions de limite, continuité etdérivabilité en un point
pour les fonctions d’une ou de plusieurs variables réelles, en se limitant rigoureusement aux propriétés locales. Le débutant peut ainsi se concentrer sur la définition
de limite et sur les techniques régissant son utilisation. L’ouvrage insiste plus que
d’autres sur la notion de fonction localement bornée en un point: le produit d’une
fonction ayant une limite nulle par une fonction localement bornée a une limite nulle,
et l’utilisation systématique de ce résultat simplifie la démonstration de nombreuses
propriétés. C’est en particulier le cas pour l’étude du délicat concept de dérivée
totale d’une fonction de plusieurs variables. Le passage des propriétés locales aux
propriétés globales fait appel à une variante de la compacité classique, le lemme de
Cousin, qui sera indispensable pour définir, plus loin, la notion d’intégrale. Les propriétés globales des fonctions continues sont systématiquement démontrés à partir
de cette technique, qui privilégie la notion de partition ou découpage, plus concrète
peut-être que celle de recouvrement. Le théorèmes et inégalités de la moyenne pour
les fonctions dérivables sont d’autres résultats globaux importants dont découlent
de nouvelles techniques de calcul des limites. Le lemme de Cousin fournit aussi une
démonstration naturelle de l’indispensable critère de Cauchy permettant de prouver l’existence d’une limite sans en connaı̂tre a priori la valeur, une caractéristique
précieuse en théorie de l’itération et dans ses applications aux fonctions implicites.
ii
Afin de minimiser, chez les débutants, les confusions trop fréquentes entre les
notions liées à l’ordre et celles liées à la distance, un chapitre regroupe les résultats
dépendant de la structure d’ordre de la droite réelle. C’est là qu’apparaissent les
fonctions monotones, les fonctions convexes et les premières fonctions transcendantes élémentaires: l’exponentielle et le logarithme. La notion de dérivée d’ordre
supérieur et le développement de Taylor conduisent à l’étude des séries, permettant l’introduction analytique des fonctions trigonométriques et des exponentielles
complexes. On dispose ainsi du matériel nécessaire pour aborder les équations
différentielles linéaires à coefficients constants. L’approche proposée ne fait appel
qu’à des techniques simples d’algèbre linéaire sur des espaces convenables d’exponentielles-polynômes. Le problème de Cauchy pour un système différentiel est
introduit, et l’unicité de sa solution prouvée par des considérations élémentaires.
La résolution de l’équation différentielle linéaire non homogène la plus simple
n’est rien d’autre que le problème de la primitivation d’une fonction, qu’on résoud
explicitement pour certaines classes de fonctions élémentaires, avant de se tourner,
dans le cas général, vers le concept de résolution approchée infiniment précise mentionné plus haut. Son interprétation géométrique conduit très naturellement à une
approche nouvelle de l’intégrale, due à Kurzweil et Henstock, que nous enseignons
depuis une vingtaine d’années. Formellement très proche de celle de Riemann,
dont elle conserve le support intuitif et la simplicité technique, cette définition
fournit une intégrale plus puissante que celle de Lebesgue capable, en particulier,
d’intégrer toutes les dérivées. Cette approche autorise une progression naturelle,
sans modification de définition, depuis le calcul intégral élémentaire jusqu’aux aspects avancés de l’intégrale de Lebesgue. Elle rend également inutile le concept
d’intégrale généralisée ou impropre: ce qui servait de définition à cette notion n’est
plus, ici, qu’un procédé de calcul d’une véritable intégrale. On lui rattache naturellement la convergence simple ou absolue des séries, ce qui permet un traitement unifié des critères correspondants. On dispose alors des outils nécessaires pour
étudier la continuité, la dérivabilité et l’intégrabilité de limites de suites de fonctions, les ensembles et les fonctions mesurables et les représentations intégrales des
fonctions. A cette occasion sont introduites non seulement des fonctions spéciales
classiques comme les fonctions de Bessel, les fonctions beta et gamma d’Euler, les
polynômes d’Hermite, la fonction hypergéométrique et la fonction zeta, mais aussi
des fonctions continues non dérivables, ces monstres mathématiques récemment
transformés en paradigmes scientifiques par la théorie des fractales. C’est aussi le
moment de faire les premiers pas en analyse harmonique en introduisant les séries
et intégrales de Fourier et le produit de convolution.
Après avoir défini les intégrales sur une courbe et sur une surface, les extensions
du théorème fondamental du calcul différentiel et intégral aux fonctions de plusieurs
variables (formules de Green-Riemann, Stokes-Ampère, Gauss-Ostrogradsky) sont
présentées d’une manière générale et unifiée à partir du concept de forme différentielle, indispensable aujourd’hui aux mathématiciens et aux physiciens. Cette
élégante et féconde théorie trouve des applications directes en analyse vectorielle,
et dans l’étude globale des fonctions C-dérivables d’une variable complexe. Les
concepts fondamentaux de la théorie des fonctions holomorphes sont ainsi dégagés,
iii
pour aboutir à cette puissante technique de calcul que constitue le théorème des
résidus.
La notion d’espace métrique avec, comme cas particulier, les plus importants
espaces de Banach, est alors introduite. Elle unifie de nombreux types de passage à
la limite définis précédemment et fournit des théorèmes d’existence au problème de
Cauchy pour les systèmes différentiels. Elle mène au calcul des variations, illustration exemplaire de cette analyse fonctionnelle qui étudie les fonctions définies sur
des espaces de fonctions, et outil fondamental dans la formulation et l’étude des
lois de la mécanique et de la physique.
L’ouvrage se termine par un index historique, qui, en plus de son rôle pratique
usuel, montre que la mathématique est une oeuvre humaine en constante évolution,
esquisse quelques développements récents et formule plusieurs problèmes ouverts.
Des exemples variés illustrent les définitions, et des contre-exemples montrent la
nécessité des hypothèses de nombreux théorèmes. Ils serviront de modèles au lecteur
pour en construire lui-même de nombreux autres. A la fin de chaque chapitre sont
rassemblés des exercices, qui proposent une approche plus personnelle à quelques
compléments théoriques. Une petite anthologie rejoint les préoccupations de l’index
historique en montrant, par des citations appropriées de mathématiciens célèbres,
l’évolution de l’énoncé des grands concepts et des grands résultats du chapitre. Le
lecteur pourra juger par lui-même si, comme on peut l’espérer, cette évolution s’est
faite dans le sens d’une plus grande clarté et d’une plus grande précision.
Il reste à parler des figures, totalement absentes de cet ouvrage. Si elles ont cessé
d’être indispensables à la présentation rigoureuse de l’analyse, elles demeurent un
précieux outil de compréhension et de découverte. Absentes du support écrit, où ne
pourrait subsister que le résidu figé du processus dynamique de leur construction,
les figures sont omniprésentes dans l’exposé oral, avec la dimension temporelle, si
importante, de leur tracé. Le lecteur devra donc illustrer, par ses propres figures,
les notions et les théorèmes introduits.
Chacun sait qu’il est difficile d’apprendre une matière délicate en consultant un
seul ouvrage. Tout enseignant qui publie un livre espère susciter la lecture d’autres
traités. En se limitant à un choix restreint, mais issu d’horizons divers, on peut
citer, parmi de nombreux livres de niveau et d’esprit assez proches de celui-ci, les
références suivantes:
T. Apostol, Mathematical Analysis, Addison-Wesley, Reading, 1974,
G. Chilov, Analyse mathématique, 3 vol., Mir, Moscou, 1973,
H.G. Garnir, Fonctions de variables réelles, 2 vol., Vander, Leuven, 1970,
R. Remmert, Theory of Complex Functions, Springer, New York, 1991,
W. Rudin, Principles of Mathematical Analysis, Mc Graw-Hill, New York, 1975,
W. Walter, Analysis I und II, Springer, Berlin, 1990.
Le lecteur qui reste sur sa faim poursuivra son effort avec beaucoup de profit
en lisant l’incomparable livre
iv
L. Schwartz, Analyse, 4 vol., Hermann, Paris, 1991-1993.
Par ailleurs, les ouvrages suivants fournissent des développements, aussi différents que remarquables, de l’analyse harmonique,
T.W. Körner, Fourier Analysis, Cambridge University Press, Cambridge, 1988,
M. Willem, Analyse harmonique réelle, Hermann, Paris, 1995,
tandis que la monographie
H. Brézis, Analyse fonctionnelle. Théorie et applications, Masson, Paris, 1983
est sans rivale pour approfondir l’analyse fonctionnelle et ses applications actuelles.
Enfin, le lecteur curieux d’histoire pourra compléter ses connaissances en consultant
E. Hairer, G. Wanner, Analysis by its History, Springer, New York, 1996.
Cette deuxième édition conserve strictement la structure et le volume de la
première, qui était une version profondément transformée de l’Introduction à l’analyse publiée pour la première fois en 1979. Elle en diffère par de nombreuses
corrections de détail, des améliorations typographiques et surtout par des modifications de présentation portant principalement sur la dérivée totale, le passage
du local au global, les formes différentielles et les chaı̂nes, les ensembles compacts.
Les gains d’espace qui en résultent ont permis d’enrichir cette nouvelle édition de
notions importantes comme celles de système dynamique discret, de produit de convolution, de fonction à variation bornée, de forme symplectique, et de résultats
utiles dans la théorie des équations différentielles comme le lemme de Gronwall,
l’équation fonctionnelle de Cauchy et le théorème de Peano.
Ce texte a bénéficié, aux différents stages de son élaboration, des critiques,
remarques et corrections de nombreux collègues, en particulier de M. Anciaux, M.
Brémond, C. Debiève, C. de Coster, Th. De Pauw, E. Giusti, P. Habets,
M. Henrard, H. Kalf, J.R. Roisin, J.P. Tignol, G. Vandenbossche (†) et
M. Willem, mais aussi, et surtout, des améliorations suggérées ou provoquées
par les étudiants de candidatures en sciences mathématiques et physiques. Les
générations futures de lecteurs et lectrices auront tout le loisir de s’illustrer à leur
tour sur la présente édition, et ils en sont remerciés d’avance.
Verviers et Louvain-la-Neuve, août 1996
Chapitre 1
Ensembles, graphes,
fonctions
1.1
Logique et ensembles : terminologie et notations
La mathématique actuelle est fondée sur la théorie des ensembles, et utilise le
langage de la logique formelle. Il n’entre pas dans notre propos de développer
ici la logique formelle et la théorie des ensembles : le point de vue naı̈f nous
suffira et nous le supposerons connu du lecteur. Rappelons simplement que,
P , Q . . . étant des propositions ou énoncés ou formules, la négation de P se
note ¬P ou non P, la disjonction de P et Q se note P ∨ Q ou P ou Q, la
conjonction de P et Q se note P ∧ Q ou P et Q, l’implication matérielle, qui
est l’abréviation de (¬P ) ∨ Q, se note P ⇒ Q et l’équivalence matérielle, qui
est l’abréviation de (P ⇒ Q) ∧ (Q ⇒ P ), se note P ⇔ Q. On a en particulier
l’équivalence suivante
(P ⇒ Q) ⇔ (¬Q ⇒ ¬P ),
qui permet parfois de simplifier la démonstration d’un théorème. La deuxième proposition dans cette équivalence s’appelle la contraposée de la première.
Signalons également que, pour éviter des paradoxes très vite apparus dès
l’introduction, par Georg Cantor, de la notion d’ensemble à la fin du XIXe
siècle, la théorie des ensembles a dû se construire comme théorie formelle
partant des notions primitives d’ensemble et d’appartenance, représentée par
le prédicat binaire ∈ (qui se lit appartient à ou élément de) et d’une liste
1
2
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
d’axiomes que nous n’énoncerons pas formellement et que l’on peut d’ailleurs
présenter sous plusieurs formes.
Dans l’axiomatique de Zermelo-Fraenkel, le premier axiome affirme l’existence d’un ensemble sans élément : c’est l’ensemble vide, noté ∅.
Le deuxième axiome affirme que deux ensembles sont égaux dès qu’ils
ont les mêmes éléments. Dans l’approche naı̈ve des ensembles, un ensemble
est défini en extension lorsqu’on donne la liste de ses éléments.
Le troisième axiome affirme l’existence d’un ensemble z = {x, y} dont
les éléments sont deux ensembles quelconques donnés x et y. Cet ensemble
s’appelle la paire d’éléments x et y et, si x = y, la paire {x, x} est notée plus
simplement {x} et s’appelle le singleton de x. La paire {x, {x, y}} est notée
(x, y) et s’appelle le couple (x, y).
Le quatrième axiome affirme l’existence de l’union des éléments t d’un
ensemble d’ensembles x constituée des éléments z qui appartiennent à l’un
!
des t de x; cet ensemble est noté t∈x t. Si x et y sont des ensembles, la
réunion x ∪ y des ensembles x et y est la réunion des éléments de la paire
{x, y}. De manière plus naı̈ve, on peut écrire
x ∪ y = {u : u ∈ x ou u ∈ y}.
Le cinquième axiome affirme l’existence de l’ensemble des parties de tout
ensemble x (y est une partie de x si tout élément de y est élément de x); cet
ensemble se note P(x) ou 2x et si z ∈ P(x), on écrit aussi y ⊂ x (ou parfois
y ⊆ x). Lorsque y est une partie de x différente de x, on dit que y est une
partie propre de x et l’on écrit alors y ! x (ou y ⊂ x dans le second choix de
notation). Nous adopterons la première notation dans cet ouvrage. Si a est
un ensemble non vide, on appelle intersection des éléments de a, l’ensemble,
noté ∩x∈ax ou ∩{x : x ∈ a}, formé par les éléments qui appartiennent à tous
les ensembles qui appartiennent à a. Etant donnés deux ensembles x et y,
on appelle intersection des ensembles x et y l’intersection des éléments de la
paire {x, y}; elle est notée x ∩ y. De manière plus naı̈ve, on peut écrire
x ∩ y = {u : u ∈ x et u ∈ y}.
Le sixième axiome affirme l’existence d’un ensemble x contenant ∅ et tel
que, s’il contient y il contient son “successeur” y ∪ {y}; cet axiome garantit
l’existence d’ensembles infinis .
Le septième axiome (qui est en fait une liste sans fin de formules construites sur le même schéma) entraı̂ne en particulier que, pour tout ensemble
u et pour toute propriété “raisonnable” P (x) dépendant des éléments x de
1.1. LOGIQUE ET ENSEMBLES : TERMINOLOGIE ET NOTATIONS3
v et qui peut être exprimée dans le langage formel de la théorie, il existera
un sous-ensemble v formé des éléments x satisfaisant à P ; cet ensemble est
noté {x ∈ u : P (x)}. Dans l’approche naı̈ve des ensembles, on dit qu’un tel
ensemble est défini en compréhension.
Le huitième axiome, dit axiome du choix ou axiome de Zermelo, affirme
qu’il est possible de former un ensemble en choissant un élément dans chaque
ensemble d’un ensemble d’ensembles. Le neuvième axiome exclut des formules comme x ∈ x.
On peut construire, à partir de ces axiomes, l’ensemble
N = {0, 1, 2, . . .}
des entiers naturels et démontrer l’important principe d’induction affirmant
que si une partie A de N contient 0 et est telle que, chaque fois que n ∈ A,
on a n + 1 ∈ A, alors A = N. On désignera également par N∗ l’ensemble
N \ {0} l’ensemble des entiers naturels strictement positifs. On rappellera
que, si x et y sont des ensembles, x \ y désigne l’ensemble des éléments de x
qui n’appartiennent pas à y. On démontre également que N est un ensemble
ordonné et que toute partie de N possède un plus petit élément.
Si une propriété P (x) (dépendant des éléments x d’un ensemble y) est
satisfaite par tous les éléments de y, on écrira
(∀x ∈ y) : P (x),
(1.1)
ce qui se lit “pour tout élément x de y, la propriété P (x) est vraie” ou “quel
que soit l’élément x de y, la propriété P (x) est vraie”. Le symbole ∀ est
appelé le quantificateur universel .
Si un élément x (au moins) de y vérifie la propriété P (x), on écrira
(∃x ∈ y) : P (x),
(1.2)
ce qui se lit “il existe (au moins) un élément x de y tel que la propriété P (x)
soit vraie”. Le symbole ∃ est le quantificateur existentiel .
La négation logique de la formule (1.1), ¬[(∀x ∈ y) : P (x)] est equivalente
à la formule
(∃x ∈ y) : ¬P (x),
et la négation logique de la formule (1.2), ¬[(∃x ∈ y) : P (x)] est équivalente
à la formule
(∀x ∈ y) : ¬P (x).
4
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
On voit que, pour nier (1.1) (resp. (1.2)), on a remplacé le quantificateur universel, (resp. existentiel), par le quantificateur existentiel (resp. universel),
et remplacé P (x) par sa négation ¬P (x). La proposition suivante montre
que cette règle s’étend aux formules contenant un nombre fini d’expressions
de type (∀x ∈ y), (∃u ∈ v) suivi de l’énoncé d’une propriété P dépendant
des éléments des ensembles correspondants.
Proposition. La négation d’une proposition du type
(∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 )(∀xm ∈ ym ) :
(1.3)
P (x1 , x2 , x3 , . . . , xm−1 , xm ),
contenant un nombre fini d’expressions du type (∀x ∈ y) ou (∃x ∈ y) suivi de
l’énoncé d’une propriété P s’obtient en remplaçant chaque ∀ par ∃, chaque
∃ par ∀ et P par ¬P .
Démonstration. Elle se fait par récurrence sur le nombre d’expressions
du type (∀x ∈ y) ou (∃x ∈ y) qui précèdent P . Nous avons admis le résultat
pour une formule contenant une seule de ces expressions. Supposons donc la
proposition vraie pour une formule de type (1.3) contenant m−1 expressions
du type (∀x ∈ y) ou (∃x ∈ y) et montrons qu’elle est vraie pour une formule
en contenant m, par exemple, pour fixer les idées, la formule (1.3). Si nous
posons
Q(x1 , . . . , xm−1 ) = (∀xm ∈ ym ) : P (x1 , . . . , xm−1 , xm ),
la formule (1.3) peut s’écrire
(∀x1 ∈ y1 )(∃x2 ∈ y2 )(∃x3 ∈ y3 ) . . . (∃xm−1 ∈ ym−1 ) : Q(x1 , . . . , xm−1 ),
et, par l’hypothèse de récurrence, sa négation est équivalente à
(∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 ) : ¬Q(x1 , . . . , xm−1 ),
et donc, en vertu de la définition de Q et de ce qui précède, à
(∃x1 ∈ y1 )(∀x2 ∈ y2 )(∀x3 ∈ y3 ) . . . (∀xm−1 ∈ ym−1 )(∃xm ∈ ym ) :
¬P (x1 , . . . , xm ).
1.2. GRAPHES, FONCTIONS, APPLICATIONS
5
Remarque. On a évidemment les équivalences
(∀x ∈ y)(∀u ∈ v) ⇔ (∀u ∈ v)(∀x ∈ y),
et
(∃x ∈ y)(∃u ∈ v) ⇔ (∃u ∈ v)(∃x ∈ y),
mais une permutation de quantificateurs consécutifs d’espèces différentes
modifie le sens de la formule.
1.2
Graphes, fonctions, applications
A partir d’ici nous utiliserons la convention usuelle consistant à désigner les
ensembles par des capitales et leurs éléments par des minuscules. Soient E et
F deux ensembles non vides. Rappelons que le produit cartésien ou produit
ensembliste de E par F , noté E × F , est l’ensemble des couples (a, b) tels
que a ∈ E et b ∈ F ; formellement,
E × F = {(a, b) : a ∈ E et b ∈ F }.
Définition. Un graphe ou relation de E vers F est une partie de E × F .
Si G ⊂ E × F est un graphe de E vers F , le domaine de G est l’ensemble
dom G défini par
dom G = {a ∈ E : (∃b ∈ F ) : (a, b) ∈ G},
et l’image de G est l’ensemble im G défini par
im G = {b ∈ F : (∃a ∈ E) : (a, b) ∈ G}.
Le graphe réciproque G−1 de G est le graphe de F dans E défini par
G−1 = {(b, a) ∈ F × E : (a, b) ∈ G}.
Exemples. Si b ∈ F , E × {b} est un graphe de E dans F appelé graphe
constant de E dans F , et si a ∈ E, alors {a} × F est un graphe de E dans
F que l’on peut appeler graphe vertical de E dans F . Le graphe réciproque
d’un graphe constant est un graphe vertical, et le graphe réciproque d’un
graphe vertical est un graphe constant.
On vérifie sans peine que
dom G−1 = im G, im G−1 = dom G.
6
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Si a ∈ dom G, on dit encore que G est défini en a, et si b ∈ im G, on dit que
b est une valeur prise par G. En particulier, on dira que le graphe G de E
dans F est partout défini si dom G = E. Donc G−1 est partout défini si et
seulement si dom G−1 = F , c’est-à-dire si et seulement si im G = F . On est
ainsi conduit à la définition suivante.
Définition. On dit que le graphe G de E dans F est surjectif si im G = F .
Ainsi donc, G (resp. G−1 ) est partout défini si et seulement si G−1 (resp.
G) est surjectif.
Si A ⊂ E, l’ensemble G|A défini par
G|A = G ∩ (A × F ),
est évidemment encore un graphe de E dans F qui s’appelle la restriction de
G à A. Son image im G|A s’appelle l’image (directe) de A par G et se note
G(A). Si B ⊂ F , on appelle image réciproque de B par G l’image G−1 (B)
de B par le graphe réciproque G−1 . Par conséquent,
G(A) = {b ∈ F : (∃a ∈ A) : (a, b) ∈ G},
G−1 (B) = {a ∈ E : (∃b ∈ B) : (b, a) ∈ G−1 }
= {a ∈ E : (∃b ∈ B) : (a, b) ∈ G}.
En particulier, si A = {a} où a ∈ E, G({a}) est appelée l’image de a par G.
On notera que G({a}) /= ∅ si et seulement si a ∈ dom G.
Si G et H sont deux graphes de E dans F tels que G ⊂ H, on dit que
H est un prolongement de G ou encore que G est une restriction de H.
Définissons aussi l’importante notion de composé de deux graphes.
Définition. Soient D, E, F des ensembles, G un graphe de D dans E et H
un graphe de E dans F . Le composé H ◦ G de H et G est le graphe de D
dans F défini par
H ◦ G = {(a, c) ∈ D × F : (∃b ∈ E) : (a, b) ∈ G et (b, c) ∈ H}.
Le lecteur vérifiera aisément les égalités suivantes :
dom (H ◦ G) = {a ∈ dom G : G({a}) ∩ dom H /= ∅},
im (H ◦ G) = H(im G).
Il vérifiera aussi sans peine que le composé de deux graphes partout définis
est partout défini et que le composé de deux graphes surjectifs est surjectif.
Introduisons maintenant un type particulier de graphe qui joue un rôle
essentiel en analyse mathématique.
1.2. GRAPHES, FONCTIONS, APPLICATIONS
7
Définition. Un graphe G de E dans F est dit fonctionnel ou est appelé une
fonction de E dans F si, pour chaque a ∈ E, il existe au plus un b ∈ F tel
que (a, b) ∈ G, c’est-à-dire si les relations (a, b) ∈ G et (a, b$) ∈ G entraı̂nent
que b = b$ .
En d’autres termes, G est une fonction de E dans F si et seulement si,
pour chaque a ∈ E, G({a}) est soit vide, soit un singleton, ou encore si et
seulement si, pour chaque a ∈ dom G, G({a}) est un singleton. Dans ce cas,
G({a}) est donc de la forme {b} pour un certain élément b de F que l’on
notera G(a) et qu’on appellera l’image de a par G ou encore la valeur de la
fonction G en a.
Exemples. Un graphe constant de E dans F est toujours une fonction de
E dans F ; un graphe vertical de E dans F est une fonction de E dans F si
et seulement si F est un singleton.
Pour désigner une fonction G de E dans F , on utilise souvent la notation
G : dom G ⊂ E → F, a 2→ G(a),
qui met en évidence la valeur G(a) de G en a ∈ dom G.
Le caractère fonctionnel d’un graphe se conserve par composition.
Proposition. Si G est une fonction de D dans E et H une fonction de E
dans F , alors H ◦ G est une fonction de D dans F .
Démonstration. Soit a ∈ dom (H ◦ G) et soient c ∈ F et c$ ∈ F tels
que (a, c) ∈ H ◦ G et (a, c$) ∈ H ◦ G. Par définition du composé, il existe
b ∈ E tel que (a, b) ∈ G et (b, c) ∈ H et il existe b$ ∈ E tel que (a, b$ ) ∈ G et
(b$ , c$) ∈ H. Comme G est une fonction, on a nécessairement b = b$ et dès
lors, comme H est une fonction, on a nécessairement c = c$ .
On pourra donc parler de la fonction composée de deux fonctions, et la
démonstration ci-dessus montre que, si a ∈ dom (H ◦ G), alors (H ◦ G)(a) =
H(G(a)).
Même si G est une fonction de E dans F , l’exemple du graphe constant
avec E différent d’un singleton montre que le graphe réciproque G−1 (qui
est un graphe vertical) n’est pas nécessairement une fonction. Si G est un
graphe de E dans F , G−1 sera une fonction si et seulement si
(b, a) ∈ G−1 et (b, a$ ) ∈ G−1 ⇒ a = a$ ,
c’est-à-dire si et seulement si
(a, b) ∈ G et (a$ , b) ∈ G ⇒ a = a$ .
On est ainsi conduit à la définition suivante.
(1.4)
8
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Définition. Soit G un graphe de E dans F . On dit que G est injectif si la
condition (1.4) est satisfaite.
Ainsi donc, G−1 est un graphe fonctionnel si et seulement si G est un
graphe injectif.
On a la caractérisation suivante des graphes injectifs.
Proposition. Le graphe G de E dans F est injectif si et seulement si, pour
chaque a ∈ E et chaque a$ ∈ E tel que a$ =
/ a, on a G({a}) ∩ G({a$ }) = ∅.
Démonstration. La condition nécessaire et suffisante d’injectivité que
nous voulons démontrer est équivalente, par contraposition, à la condition
(∀a ∈ E)(∀a$ ∈ E) : G({a}) ∩ G({a$ }) /= ∅ ⇒ a = a$ ,
et donc à la condition
(∀a ∈ E)(∀a$ ∈ E) : (a, b) ∈ G et (a$ , b) ∈ G ⇒ a = a$ ,
c’est-à-dire à la définition d’injectivité.
On en déduit facilement que la composition de graphes préserve l’injectivité.
Proposition. Si G est un graphe injectif de D dans E et H un graphe
injectif de E dans F , alors H ◦ G est un graphe injectif de D dans F .
Un graphe fonctionnel injectif est appelé une fonction injective ou une
injection. G est donc une injection si et seulement si
a ∈ dom G, a$ ∈ dom G et G(a) = G(a$ ) ⇒ a = a$ ,
ou encore, si et seulement si
(∀a ∈ dom G)(∀a$ ∈ dom G : a /= a$ ) : G(a) /= G(a$ ).
Les propositions qui précèdent montrent que G est une injection de E dans
F si et seulement si G−1 est une injection de F dans E et que le composé
de deux injections est une injection. Lorsque G est une injection de E dans
F , G−1 est appelée la fonction réciproque de G.
Un graphe fonctionnel G de E dans F partout défini est appelé une
application de E dans F , et noté
G : E → F, a 2→ G(a).
1.2. GRAPHES, FONCTIONS, APPLICATIONS
9
Bien entendu, si G est une fonction de E dans F , alors G|dom G est une
application de dom G dans F : toute fonction restreinte à son domaine devient une application. D’autre part, si G est une application injective de E
dans F , on sait que G−1 est une fonction de F dans E et des exemples simples montrent que G−1 n’est pas nécessairement une application de F dans
E. Ainsi, si E = {a1 , a2, a3 }, F = {a1 , a2 , a3 , a4 } et si G est l’application
injective de E dans F définie par
G : E → F, ai 2→ ai (i = 1, 2, 3)
alors la fonction inverse G−1 n’est pas définie en a4 et n’est donc pas une
application de F dans E. Si G est une application injective de E dans F ,
G−1 sera une application de F dans E si et seulement im G = F , c’est-à-dire
si et seulement si G est surjectif. Un graphe fonctionnel surjectif G de E
dans F est appelé une fonction surjective ou une surjection de E sur F . En
combinant les propriétés des graphes déjà obtenues, on voit facilement que
G est une application injective et surjective de E sur F si et seulement si
G−1 est une application surjective de F sur E.
Une application injective et surjective G de E dans F est appelée une
application bijective ou bijection de E sur F . En combinant les propriétés
de conservation du caractère fonctionnel, du caractère partout défini, de
l’injectivité et de la surjectivité par passage au composé, on obtient immédiatement le résultat suivant.
Proposition. Si G est une bijection de D sur E et H une bijection de E
sur F , alors H ◦ G est une bijection de D sur F .
Il existe, pour les applications, une variante terminologique souvent utilisée en mathématiques. Si I est un ensemble, que l’on appellera ensemble des
indices, et E un ensemble, une application G de I dans E est parfois appelée
famille d’éléments de E indicée par I et, au lieu de la notation canonique
G : I → E, i 2→ G(i),
on utilise la notation
G : I → E, i 2→ Gi ,
ou encore la notation compacte (Gi)i∈I . En particulier, une famille d’éléments de E indicée par N ou N∗ est appelée une suite dans E ou encore une
suite d’éléments de E, et notée en abrégé (Gk )k∈N ou (Gk )k∈N∗ selon le cas.
10
1.3
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Ensembles finis, infinis, dénombrables
La notion de bijection permet de “comparer” les ensembles. Soient E et F
des ensembles.
Définition. On dit que E est équipotent à F s’il existe une bijection B de
E sur F .
Il en résulte aussitôt que E est équipotent à E (prendre B définie par
B(a) = a pour chaque a ∈ E), que E est équipotent à F si et seulement si F
est équipotent à E (puisque B est une bijection de E sur F si et seulement
si B −1 est une bijection de F sur E) et que si E est équipotent à F et F
équipotent à l’ensemble G, alors E est équipotent à G (puisque le composé
de deux bijections est une bijection). La relation “est équipotent à” est donc
une relation d’équivalence.
Pour chaque n ∈ N∗ , posons Jn = {1, 2, . . . , n}, et, pour unifier les
notations dans ce qui suit, posons J0 = ∅. On vérifiera facilement que Jn est
équipotent à Jm si et seulement si m = n.
Définition. On dit que l’ensemble E est fini s’il existe n ∈ N tel que E soit
équipotent à Jn . Dans le cas contraire, E est dit infini.
Les éléments d’un ensemble fini non vide pourront donc être ”numérotés”
par les entiers 1, 2, . . ., n pour un certain entier n. La remarque précédant la
définition montre que l’entier n ainsi associé à un ensemble fini E est unique;
on l’appelle le nombre d’éléments ou le cardinal de E et on le note # E.
Proposition. Si E est fini et s’il existe une bijection C de E sur l’ensemble
F , alors F est fini et # E = # F .
Démonstration. Si # E = n, il existe une bijection B de E sur Jn , et
donc B ◦ C −1 est une bijection de F sur Jn .
Corollaire. Si E est infini et s’il existe une bijection B de E sur F , alors
F est infini.
Démonstration. Si F est fini, E l’est aussi par la proposition précédente,
ce qui contredit l’hypothèse.
La définition d’ensemble fini entraı̂ne qu’un ensemble fini ne peut être
équipotent à aucune de ses parties propres (cette propriété peut d’ailleurs
être prise comme définition d’un ensemble fini). L’existence de la bijection
B : N → 2N, n 2→ 2n,
11
1.3. ENSEMBLES FINIS, INFINIS, DÉNOMBRABLES
de l’ensemble des entiers naturels sur l’ensemble 2N des entiers naturels pairs,
partie propre de N, montre que N est infini.
Introduisons maintenant une importante classe d’ensembles infinis. Intuitivement, ce sont les ensembles infinis dont les éléments peuvent être
“numérotés” par tous les entiers naturels.
Définition. On dit que l’ensemble E est dénombrable s’il est équipotent à
N.
Comme N est infini, un ensemble dénombrable est évidemment infini. Si
B : N → E est la bijection donc l’existence est assurée par la définition, on
aura donc E = {B(n) : n ∈ N} = {B(0), B(1), . . .}.
Ainsi, les ensembles 2N et N∗ sont dénombrables (prendre respectivement
les applications B définies sur N par B(n) = 2n et B(n) = n + 1 pour chaque
n ∈ N). De même, l’ensemble N × N est dénombrable, puisque l’application
B : N × N → N, (m, n) 2→
(m + n)(m + n + 1)
+n
2
est bijective. Elle correspond en effet au schéma de numérotation suivant
0
1
2
...
(0, 0) (1, 0) (0, 1) . . .
l(l+1)
2
+1
(l, 0)
l(l+1)
2
+2 ...
(l − 1, 1) . . .
l(l+1)
2
+l ...
(0, l)
...
qui consiste, sur le tableau suivant suivant “représentant” N × N,
(0, 0)
(1, 0)
(2, 0)
(3, 0)
(4, 0)
..
.
(0, 1)
(1, 1)
(2, 1)
(3, 1)
(4, 1)
..
.
(0, 2)
(1, 2)
(2, 2)
(3, 2)
(4, 2)
..
.
(0, 3)
(1, 3)
(2, 3)
(3, 3)
(4, 3)
..
.
(0, 4)
(1, 4)
(2, 4)
(3, 4)
(4, 4)
..
.
...
...
...
...
...
..
.
à associer un élément de type (l, 0) à l’entier constitué du nombre d’éléments
du tableau situés au dessus de la diagonale passant par (l, 0) (c’est-à-dire
1 + 2 + . . . + l = l(l + 1)/2), à numéroter successivement les éléments de
cette diagonale en ajoutant 1 au numéro de l’élément qui précède jusqu’à ce
qu’on arrive à l’élément de la première ligne, à revenir à l’élément (l + 1, 0)
et répéter le même processus.
Remarquons qu’un raisonnement strictement analogue permet de montrer que le produit cartésien de deux ensembles dénombrables est dénombrable.
12
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Le résultat suivant permet de construire de nombreux ensembles dénombrables et montre qu’intuitivement, les ensembles dénombrables sont les
“plus petits” ensembles infinis que l’on puisse considérer.
Proposition. Toute partie infinie d’un ensemble dénombrable est dénombrable.
Démonstration. Soit E un ensemble dénombrable et A une partie infinie
de E. Il existe donc une bijection B : E → N. Comme A est infini, l’ensemble
B(A) est une partie infinie de N. Soit n0 le plus petit élément de B(A), n1 le
plus petit élément de B(A) \ {n0 }, et, de proche en proche, nk le plus petit
élément de B(A)\{n0 , n1 , . . . , nk−1 }. Comme B(A) est infini, on définit ainsi
une bijection C : N → B(A), k 2→ nk , qui fournit la bijection C ◦ B de A sur
N et montre que A est dénombrable.
Corollaire. Tout ensemble contenant une partie infinie non dénombrable
est infini non dénombrable.
Définition. On dira qu’un ensemble E est au plus dénombrable s’il est fini
ou dénombrable.
On vérifie aisément que E est au plus dénombrable s’il existe une surjection de N sur E.
Il est évident que toute partie d’un ensemble au plus dénombrable est
au plus dénombrable. Le résultat suivant montre qu’une union dénombrable
d’ensembles au plus dénombrables est encore au plus dénombrable.
Proposition. Soit (En )n∈N une suite d’ensembles En telle que chaque En
!
soit au plus dénombrable. Alors l’ensemble E = n∈N En est au plus
dénombrable.
Démonstration. Par hypothèse, pour chaque n ∈ N, il existe une surjection Bn : N → En . Il en résulte que l’application
B : N × N → E, (n, m) 2→ Bn (m)
est également surjective. Comme on a vu plus haut qu’il existe une bijection
C : N → N × N, on obtient une surjection B ◦ C de N sur E.
1.4
Nombres réels
Nous ne reviendrons pas ici sur les extensions de la notion de nombre obtenues à partir de N et supposerons connus l’ensemble Z des entiers relatifs, l’ensemble Q des nombres rationnels et leurs propriétés. On sait que N ! Z ! Q
1.4. NOMBRES RÉELS
13
et que l’on peut construire un ensemble R, l’ensemble des nombres réels, ou,
brièvement, des réels, qui contient strictement Q et possède les propriétés
suivantes. Nous n’aborderons pas ici le problème de la construction de R.
L’ensemble des réels ou corps des réels ou champ des réels est un ensemble, noté R, pour lequel sont définies :
1) deux applications A et M de R × R dans R, respectivement appelées
l’addition et la multiplication sur R et pour lesquelles on peut utiliser respectivement les notations A(x, y) = x + y et M (x, y) = x.y ou M (x, y) = xy ou
M (x, y) = x × y, qui se lisent respectivement x plus y et x fois y;
2) une relation G dite relation d’ordre de R dans R notée x ≤ y (ou
y ≥ x) si et seulement si (x, y) ∈ G, qui se lit x inférieur à y (ou y supérieur
à x);
qui vérifient les quatre groupes de propriétés suivantes.
(I) R est un corps commutatif ou champ.
En d’autres termes :
(i) pour tout x ∈ R, y ∈ R et z ∈ R, on a
x + y = y + x, x + (y + z) = (x + y) + z,
xy = yx, x(yz) = (xy)z, x(y + z) = xy + xz;
(ii) il existe un élément 0 ∈ R tel que, pour tout x ∈ R, on ait 0 + x = x;
(iii) pour chaque x ∈ R il existe un unique réel, noté −x tel que x+(−x) = 0;
(iv) il existe un élément 1 /= 0 dans R tel que, pour tout x ∈ R, on ait
1.x = x :
(v) pour chaque x /= 0 dans R, il existe un unique réel noté x−1 ou x1 tel que
x.x−1 = 1.
(II) R est un corps ordonné.
En d’autres termes :
(i) pour tout x ∈ R, y ∈ R et z ∈ R, les relations x ≤ y et y ≤ z impliquent
la relation x ≤ z;
(ii) pour tout x ∈ R et y ∈ R, ”x ≤ y et y ≤ x” équivaut à x = y;
(iii) pour chaque x ∈ R et chaque y ∈ R, on a x ≤ y ou y ≤ x;
(iv) pour tout x ∈ R, y ∈ R et z ∈ R, la relation x ≤ y implique la relation
x + z ≤ y + z;
(v) pour tout x ∈ R tel que x ≥ 0 et tout y ∈ R tel que y ≥ 0, on a xy ≥ 0.
La relation x ≤ y et x /= y s’écrira x < y ou y > x et se lira x strictement
inférieur à y ou y strictement supérieur à x. Si a < b sont deux réels,
l’ensemble
{x ∈ R : a < x < b}
14
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
sera appelé intervalle ouvert d’origine a et d’extrémité b et sera désigné par
]a, b[; l’ensemble
{x ∈ R : a ≤ x ≤ b}
sera appelé intervalle fermé d’origine a et d’extrémité b et sera désigné par
[a, b]; l’ensemble
{x ∈ R : a < x ≤ b} (resp.{x ∈ R : a ≤ x < b})
sera appelé un intervalle semi-ouvert ou semi-fermé et désigné par ]a, b]
(resp. [a, b[).
(III) R est un corps ordonné archimédien,
c’est-à-dire qu’il satisfait au théorème d’Archimède: pour tout réel x > 0
et tout réel y ≥ 0, il existe un entier m tel que mx ≥ y.
(IV) R est un corps complet,
c’est-à-dire qu’il vérifie le théorème des intervalles fermés emboı̂tés:
si ([ak , bk ])k∈N est une suite d’intervalles fermés tels que, pour tout k ∈ N,
on ait [ak+1 , bk+1 ] ⊂ [ak , bk ], alors
"
k∈N
[ak , bk ] /= ∅.
En d’autres termes, si les suites dans R (ak )k∈N et (bk )k∈N sont telles
que, pour chaque k ∈ N, on ait ak ≤ ak+1 < bk+1 ≤ bk , alors il existe au
moins un réel c tel que, pour chaque k ∈ N, on ait c ∈ [ak , bk ].
Rappelons que Q est formé du sous-ensemble des éléments de R qui
∗
peuvent s’écrire sous la forme ± m
n où m ∈ N et n ∈ N .
Proposition. L’ensemble Q des rationnels est dénombrable.
Démonstration. Comme Q ⊃ N, Q est infini et il suffit de montrer
qu’il est au plus dénombrable, ce qui sera le cas si l’on montre que Q+ =
{x ∈ Q : x ≥ 0} est au plus dénombrable, puisque Q = Q+ ∪ Q− avec
Q− = {x ∈ Q : x ≤ 0} et Q− est évidemment équipotent à Q+ . L’application
B : N × N∗ → Q+ est une surjection, et, comme N × N∗ est dénombrable, Q
est au plus dénombrable.
Donnons maintenant quelques conséquences importantes des propriétés
des réels. La première résulte des propriétés de l’ordre.
Proposition. Si b > c sont deux réels, il existe un réel ! > 0 tel que b > c+!.
Démonstration. Par hypothèse, b − c > 0 et dès lors b − c >
suffit donc de prendre ! = b−c
2 .
b−c
2
> 0; il
15
1.4. NOMBRES RÉELS
Corollaire. Soient b et c des réels. Alors b ≤ c si et seulement si, pour tout
! > 0, on a b ≤ c + !.
Démonstration. Condition nécessaire. Si b ≤ c et ! > 0 est donné, on a
évidemment b ≤ c + !.
Condition suffisante. Elle est équivalente à sa contraposée, qui n’est rien
d’autre que la proposition précédente.
Démontrons maintenant une conséquence du théorème d’Archimède exprimant la propriété de densité des rationnels dans les réels.
Proposition. Tout invervalle ouvert de R contient un ensemble infini de
rationnels.
Démonstration. Montrons d’abord qu’il suffit de démontrer que tout
intervalle ouvert de R contient au moins un rationnel. En effet, s’il en est
ainsi et si c1 ∈ ]a, b[ est rationnel, alors ]a, c1[ contiendra un rationnel c2
et, en continuant de la sorte, on obtient un ensemble infini {ci : i ∈ N} de
rationnels contenus dans ]a, b[. Pour démontrer maintenant que ]a, b[ contient
au moins un rationnel, on peut supposer sans perte de généralité que b > 0,
car, dans le cas contraire, il suffit de considérer l’intervalle ] − b, −a[ dont
l’extrémité −a est strictement positive et de noter que si c ∈ ] − b, −a[, alors
−c ∈ ]a, b[. La démonstration consiste maintenant à déterminer un n ∈ N∗
et un m ∈ N tels que a < m
n < b. Comme b − a > 0, le théorème d’Archimède
implique l’existence d’un entier n ≥ 1 tel que n(b − a) ≥ 2 et donc tel que
n(b − a) > 1, ou encore
b−a>
1
.
n
(1.5)
Comme b > 0, le même théorème d’Archimède entraı̂ne l’existence d’un
entier naturel k ≥ 1 tel que nk ≥ b. Désignons par h le plus petit entier
naturel ayant cette propriété. On a donc
h−1
h
< b,
≥ b.
n
n
(1.6)
En utilisant (1.5) et la deuxième inégalité de (1.6), on obtient
h
1
−a > ,
n
n
c’est-à-dire a < h−1
n . En vertu de la première inégalité de (1.6), il suffit donc
de prendre m = h − 1.
16
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Donnons maintenant une conséquence importante du théorème des intervalles fermés emboı̂tés : l’existence d’ensembles infinis non dénombrables.
Proposition. Si a < b sont des réels, l’intervalle fermé [a, b] n’est pas
dénombrable.
Démonstration. Supposons que [a, b] soit dénombrable et soit B : N →
[a, b] une bijection fournie par la définition. Pour simplifier les notations,
nous poserons, pour chaque n ∈ N, xn = B(n). Notons que si c ∈ [a, b]
et que l’on divise [a, b] en trois intervalles fermés de même longueur, l’un
d’entre eux au moins ne contiendra pas c.
Cela étant, divisons [a, b] en trois intervalles fermés de même longueur et
soit [a0 , b0] l’un d’eux tel que x0 /∈ [a0 , b0]. Si x1 /∈ [a0 , b0], prenons [a1 , b1] =
[a0 , b0 ], tandis que si x1 ∈ [a0 , b0], divisons [a0 , b0 ] en trois intervalles fermés
de même longueur et prenons pour [a1 , b1] l’un deux tel que x1 /∈ [a1 , b1 ].
Ayant ainsi construit
[ak−1 , bk−1] ⊂ [ak−2 , bk−2 ] ⊂ . . . ⊂ [a1 , b1] ⊂ [a0 , b0] ⊂ [a, b],
tels que,
xj /∈ [aj , bj ], (1 ≤ j ≤ k − 1),
prenons [ak , bk ] = [ak−1 , bk−1 ] si xk /∈ [ak−1 , bk−1] tandis que, si xk ∈
[ak−1 , bk−1], divisons [ak−1 , bk−1] en trois intervalles fermés de même longueur et prenons pour [ak , bk ] l’un d’entre eux qui ne contient pas xk . En
continuant de la sorte, on obtient une suite ([ak , bk ])k∈N d’intervalles fermés
emboı̂tés contenus dans [a, b] et tels que, pour chaque k ∈ N, xk /∈ [ak , bk ].
Le théorème des intervalles emboı̂tés implique l’existence d’un réel c appartenant à chaque intervalle [ak , bk ], (k ∈ N). Dès lors, cet élément c de [a, b]
est différent de xk pour chaque k ∈ N, ce qui contredit la définition de B.
Corollaire. Tout intervalle de R et R lui-même sont des ensembles non
dénombrables.
Démonstration. Ces ensembles contiennent en effet un intervalle fermé.
Corollaire. Tout intervalle de R contient un nombre rationnel et un nombre
irrationnel.
Démonstration. Tout intervalle I de R contient un intervalle ouvert qui
contient lui-même un rationnel. Si I ne contient pas d’irrationnel, alors
I ⊂ Q est au plus dénombrable, ce qui contredit le Corollaire précédent.
1.4. NOMBRES RÉELS
17
Nous avons donc démontré l’existence, à côté des ensembles infinis dénombrables, d’ensembles infinis non dénombrables équipotents à R. On dit
qu’ils ont la puissance du continu. Le créateur de la théorie des ensembles, Georg Cantor, et ses successeurs ont cherché sans succès à montrer
l’existence de parties infinies de R non dénombrables et non équipotentes à R
et ont été amenés à formuler la célèbre hypothèse du continu : tout ensemble
infini non dénombrable possède une partie équipotente à R. Paul Cohen
a démontré en 1962 que l’hypothèse du continu était indécidable (c’est-àdire ni vraie ni fausse) dans le cadre de la théorie des ensembles : on peut
ajouter indifféremment aux axiomes de la théorie des ensembles l’hypothèse
du continu ou sa négation et obtenir des théories ayant la même cohérence.
Définissons maintenant l’importante notion de valeur absolue d’un réel.
Définition. La valeur absolue du réel x, notée |x|, est le réel positif défini
par |x| = x si x ≥ 0 et |x| = −x si x < 0.
Il résulte aussitôt de cette définition que, pour tout x ∈ R, on a |x| = |−x|
et que |x| = 0 si et seulement si x = 0. En outre, il est très facile de montrer
que, a > 0 et x ∈ R étant donnés, on a les équivalences
|x| ≤ a ⇔ −a ≤ x ≤ a ⇔ x ∈ [−a, a],
|x| < a ⇔ −a < x < a ⇔ x ∈ ] − a, a[.
Dans la représentation géométrique de R, qui consiste à associer à chaque
réel x le point d’abscisse x sur une droite orientée munie d’une origine, |x|
représente la longueur du segment de droite joignant 0 à x. Dès lors, si x ∈ R
et y ∈ R, |x − y| représente la distance entre les points correspondants à x
et à y sur la droite.
Les inégalités suivantes, qui expriment les relations entre l’addition, la
soustraction et la valeur absolue, sont fondamentales.
Proposition. Pour tout x ∈ R et tout y ∈ R, on a
|x + y| ≤ |x| + |y|, ||x| − |y|| ≤ |x − y|.
Démonstration. Démonstrons tout d’abord la première inégalité. Si x ≥
0 et y ≥ 0, alors, en utilisant les propriétés (II), on a x + y ≥ 0 + y = y ≥ 0,
et dès lors |x + y| = x + y = |x| + |y|. On procède de même si x ≤ 0 et y ≤ 0.
Si x ≤ 0 ≤ y, alors
x + y ≤ 0 + y = y = |y| = |y| + 0 ≤ |y| + |x| = |x| + |y|,
18
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
x + y ≥ x + 0 = x = −(−x) = −|x| = −|x| + 0 ≥ −|x| − |y| = −(|x| + |y|).
Par conséquent, −(|x| + |y|) ≤ x + y ≤ |x| + |y|, c’est-à-dire la thèse. Si
y ≤ 0 ≤ x, il suffit d’intervertir x et y. Pour la seconde inégalité, en utilisant
la première et les égalités
x = (x − y) + y, y = (y − x) + x,
on obtient
|x| ≤ |x − y| + |y|, |y| ≤ |y − x| + |x| = |x − y| + |x|,
et dès lors
|x| − |y| ≤ |x − y|, |x| − |y| ≥ −|x − y|,
ce qui équivaut à la seconde inégalité.
Remarque. On déduit aussitôt, de proche en proche, de la Proposition
précédente, que si x1 , x2 , . . ., xn sont des réels, alors
#
#
n
n
#$
# $
#
#
xi # ≤
|xi|.
#
#
#
i=1
i=1
La propriété suivante exprime les relations entre valeur absolue et multiplication.
Proposition. Pour tout x ∈ R et tout y ∈ R, on a
|xy| = |x||y|.
Démonstration. Si x ≥ 0 et y ≥ 0, alors xy ≥ 0 et
|xy| = xy = |x||y|.
Si x ≤ 0 ≤ y, alors, en utilisant le premier cas,
|xy| = | − (xy)| = |(−x)y| = |(−x)||y| = |x||y|.
Le cas où y ≤ 0 ≤ x s’en déduit en intervertissant x et y. Enfin, si x ≤ 0 et
y ≤ 0, on a
|xy| = |(−x)(−y)| = |(−x)||(−y)| = |x||y|.
1.5. L’ESPACE VECTORIEL NORMÉ RN
19
Si nous posons R+ = {x ∈ R : x ≥ 0}, la notion de valeur absolue d’un
réel permet de définir comme suit sur R l’application valeur absolue
| · | : R → R+ , x 2→ |x|,
vérifiant les propriétés suivantes :
1) pour chaque réel x, |x| = 0 ⇔ x = 0;
2) pour chaque c ∈ R et chaque x ∈ R, on a |cx| = |c||x|;
3) pour chaque x ∈ R et chaque y ∈ R, on a |x + y| ≤ |x| + |y|.
Enfin, la condition d’annulation suivante est souvent utile.
Proposition. Soit a un réel. Alors a = 0 si et seulement si, pour tout ! > 0,
on a |a| ≤ !.
Démonstration. La condition nécessaire est évidente. La condition suffisante résulte d’une condition nécessaire et suffisante pour que b ≤ c vue
plus haut; il suffit de prendre c = 0 et b = |a|.
1.5
L’espace vectoriel normé Rn
L’étude des fonctions de plusieurs variables et des fonctions à valeurs vectorielles gagne en clarté et en concision par l’emploi du langage géométrique
lié à l’espace vectoriel Rn .
Si n ≥ 1 est un entier, nous désignerons par Rn le produit cartésien
R × R × . . . R de n copies de R. Rn est donc l’ensemble des n-uples ordonnés
(x1 , x2 , . . . , xn ) de nombres réels. Un élément x = (x1 , x2 , . . ., xn ) de Rn est
souvent appelé un point de Rn et, pour chaque 1 ≤ i ≤ n, xi s’appelle la ie
composante de x. En définissant les applications
Rn × Rn → Rn , (x, y) 2→ x + y = (x1 + y1 , . . . , xn + yn ),
R × Rn → Rn , (c, x) 2→ cx = (cx1 , . . . , cxn),
respectivement appelées somme de deux éléments de Rn et multiplication
d’un élément de Rn par un réel, on vérifie aisément qu’on munit Rn d’une
structure d’espace vectoriel sur le corps R. Lorsque n = 1, ces applications se réduisent respectivement à l’addition et à la multiplication usuelles.
L’élément (0, . . ., 0) de Rn sera noté 0. L’espace vectoriel Rn est de dimension n et les points
e1 = (1, 0, . . ., 0), e2 = (0, 1, 0, . . ., 0), . . ., en = (0, . . ., 0, 1)
20
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
de Rn forment une base algébrique de cet espace vectoriel qui est appelée
base canonique. Tout élément x de Rn peut en effet s’écrire
x = x1 e1 + . . . + xn en =
n
$
xi ei .
i=1
Pour chaque 1 ≤ i ≤ n, on appellera projection sur la ie composante
l’application
pi : Rn → R, x 2→ xi .
Comme, pour chaque x ∈ Rn , y ∈ Rn et c ∈ R, on a
pi (x + y) = (x + y)i = xi + yi = pi (x) + pi (y),
pi (cx) = (cx)i = cxi ,
on voit que pi est une application linéaire de Rn dans R. Nous n’insisterons
pas davantage ici sur la structure algébrique de Rn ni sur son interprétation
géométrique lorsque n = 1, 2 ou 3.
La définition suivante s’inspire des propriétés de l’application valeur absolue sur R.
Définition. Si E est un espace vectoriel sur R, on appelle norme sur E
toute application
6 · 6 : E → R+ , x →
2 6x6,
vérifiant les conditions suivantes :
1) pour chaque x ∈ E, on a 6x6 = 0 ⇔ x = 0;
2) pour chaque c ∈ R et chaque x ∈ E, on a 6cx6 = |c|6x6;
3) pour chaque x ∈ E et chaque y ∈ E, on a 6x + y6 ≤ 6x6 + 6y6.
Un espace vectoriel E muni d’une telle norme est dit un espace vectoriel
normé . Il est clair que R muni de l’application valeur absolue est un espace
vectoriel normé. Nous allons voir que l’on peut, et de différentes manières,
définir, quel que soit n ∈ N∗ , une norme sur Rn qui se réduira à la valeur
absolue lorsque n = 1.
Définissons l’application | · |1 de Rn dans R+ par
| · |1 : Rn → R+ , x = (x1 , . . . , xn ) 2→ |x1 | + . . . + |xn | =
Proposition. | · |1 est une norme sur Rn .
%
n
$
i=1
|xi |.
Démonstration. On a |0|1 = 0 et si |x|1 = 0, alors ni=1 |xi| = 0, et comme
chaque terme |xi| est positif, il faut nécessairement que |xi| = 0, (1 ≤ i ≤ n),
21
1.5. L’ESPACE VECTORIEL NORMÉ RN
et donc que xi = 0, (1 ≤ i ≤ n), c’est-à-dire que x = 0. Si c ∈ R et x ∈ Rn ,
on a
& n
'
n
n
|cx|1 =
$
|cxi | =
i=1
$
i=1
$
|c||xi| = |c|
i=1
Enfin, si x ∈ Rn et y ∈ Rn , on a
|x + y|1 =
n
$
i=1
|xi + yi | ≤
n
$
i=1
|xi | = |c||x|1.
(|xi| + |yi |) = |x|1 + |y|1 .
Définissons l’application | · |2 de Rn dans R+ par
| · |2 : R → R+ , x 2→
n
(x21
+
. . . + x2n )1/2
=
&
n
$
x2i
i=1
'1/2
=
& n
$
i=1
|xi |
2
'1/2
.
Pour vérifier que | · |2 est une norme sur Rn , nous aurons besoin des
deux résultats importants suivants. Le premier porte le nom d’identité de
Lagrange.
Proposition. Pour tout x ∈ Rn et tout y ∈ Rn , on a
&
n
$
i=1
 ,
' n
-2
n
n $
n
$
$
1$
2 
2
xi
yj −
(xiyi ) =
(xi yj − xj yi )2 .
j=1
2
i=1
i=1 j=1
Démonstration. On a
n $
n
1$
(xiyj − xj yi )2 =
2 i=1 j=1
n $
n $
n $
n
n
n
$
1$
1$
x2i yj2 −
xi yj xj yi +
x2j yi2 =
2 i=1 j=1
2
i=1 j=1
i=1 j=1
&
n
$
i=1
 ,

' n
- n
n
$
$
$
x2 
y2 −
(xi yi )  (xj yj ) ,
i
j
j=1
i=1
j=1
et l’identité de Lagrange s’en déduit aussitôt.
L’identité de Lagrange a pour conséquence immédiate l’inégalité de Cauchy.
22
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Corollaire. Pour tout x ∈ Rn et tout y ∈ Rn , on a
, n
$
(xi yi )
i=1
-2
≤
&
n
$
i=1

' n
$
x2 
y2  .
i
j
j=1
Nous pouvons maintenant démontrer que | · |2 est une norme sur Rn .
Proposition. | · |2 est une norme sur Rn .
Démonstration. La vérification facile des propriétés 1 et 2 de la norme
est laissée au lecteur. La propriété 3 s’écrit explicitement
, n
$
(xi + yi )
i=1
2
-1/2
≤
&
n
$
i=1
x2i
'1/2
+
&
n
$
yi2
i=1
'1/2
,
et les deux membres étant positifs, cette inégalité équivaut à l’inégalité
n
$
i=1
&
(xi + yi )2 ≤ 
n
$
x2i
i=1
'1/2
+
&
n
$
i=1
'1/2 2
 ,
y2
i
c’est-à-dire, en effectuant les calculs et en simplifiant les termes communs
aux deux membres, à l’inégalité
n
$
i=1
xi yi ≤
&
n
$
i=1
x2i
'1/2 &
Cette inégalité est évidemment satisfaite si
%
l’inégalité de Cauchy si ni=1 xi yi ≥ 0.
n
$
yi2
i=1
%n
i=1
'1/2
.
xi yi < 0 et elle résulte de
Remarque. La norme | · |2 est souvent appelée la norme euclidienne de Rn
parce que, si n = 2 ou 3 et si x ∈ Rn et y ∈ Rn , l’expression |x − y|2 n’est
rien d’autre que la distance euclidienne entre les points x et y.
Définissons l’application | · |∞ de Rn dans R+ par
| · |∞ : Rn → R+ , x = (x1 , . . ., xn ) 2→ max{|xi| : 1 ≤ i ≤ n},
où max{|xi | : 1 ≤ i ≤ n} désigne le plus grand élément de l’ensemble {|xi| :
1 ≤ i ≤ n}.
23
1.5. L’ESPACE VECTORIEL NORMÉ RN
Proposition. | · |∞ est une norme sur Rn .
Démonstration. La vérification des conditions 1 et 2 est laissée au lecteur.
Pour la propriété 3, soit x ∈ Rn , y ∈ Rn et k un indice tel que
|x + y|∞ = max{|xi + yi | : 1 ≤ i ≤ n} = |xk + yk |.
On a évidemment
|xk + yk | ≤ |xk | + |yk | ≤ max{|xi| : 1 ≤ i ≤ n} + max{|yi | : 1 ≤ i ≤ n}
= |x|∞ + |y|∞ .
On a les inégalités suivantes entre les trois normes que nous venons de
définir sur Rn .
Proposition. Pour tout x ∈ Rn et tout 1 ≤ i ≤ n, on a
|xi| ≤ |x|∞ ≤ |x|2 ≤ |x|1 ≤ n|x|∞ .
Démonstration. Soit x ∈ Rn et k un indice tel |x|∞ = |xk |. On a
évidemment, pour chaque 1 ≤ i ≤ n,
|xi| ≤ |xk | ≤
En outre, on a
|x|1 =
Enfin, on a trivialement,
|x|22 =
n
$
i=1
n
$
i=1
&
n
$
i=1
|xi |
2
'1/2
= |x|2 .
|xi | ≤ n|xk | = n|x|∞ .
|xi ||xi| ≤
n $
n
$
i=1 j=1
|xi ||xj | = |x|21 ,
ce qui entraı̂ne |x|2 ≤ |x|1 , puisque ces nombres sont positifs.
Définition. Si E est un espace vectoriel, les deux normes 6 · 61 et 6 · 62 sur
E seront dites équivalentes s’il existe deux constantes a > 0 et b > 0 telles
que, pour tout x ∈ E, on ait
a6x61 ≤ 6x62 ≤ b6x61 .
24
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
On vérifie sans peine qu’il s’agit bien d’une relation d’équivalence sur
les normes de E. La Proposition que nous venons de démontrer montre
que les trois normes | · |i , (i = 1, 2, ∞) que nous venons de définir sur Rn
sont équivalentes. On montrera plus loin que toutes les normes sur Rn sont
équivalentes.
La notion de norme permet de définir la notion de boule dans Rn .
Définition. Soit a ∈ Rn , r > 0 et i = 1, 2 ou ∞. La boule de centre a et
de rayon r pour la norme | · |i est la partie Bi [a; r] de Rn définie par
Bi [a; r] = {x ∈ Rn : |x − a|i ≤ r}.
Lorsque a = 0, on écrira en général Bi [r] au lieu de Bi [a; r]. La terminologie provient évidemment de ce que, pour n = 3 et pour la norme euclidienne,
l’ensemble B2 [a; r] correspond à la boule usuelle de centre a et de rayon r.
Pour n = 2 et la norme euclidienne, B2 [a; r] correspond au disque de centre
a et de rayon r. Enfin, pour n = 1, les trois normes se réduisent à la valeur
absolue et
Bi [a; r] = [a − r, a + r], (i = 1, 2, ∞),
et les boules sont donc des intervalles fermés. Réciproquement, tout interb−a
valle fermé [a, b] de R corrrespond à la boule Bi [ a+b
2 ; 2 ].
Proposition. Pour tout a ∈ Rn et tout r > 0, on a
2
B∞ a;
3
r
⊂ B1 [a; r] ⊂ B2 [a; r] ⊂ B∞ [a; r].
n
Démonstration. C’est une conséquence facile des inégalités entre normes
qui entraı̂nent, pour tout x ∈ Rn , que
|x − a|∞ ≤ |x − a|2 ≤ |x − a|1 ≤ n|x − a|∞ .
La norme | · |2 sur Rn est associée à la notion de produit scalaire de deux
éléments de Rn .
Définition. L’application (·|·) de Rn × Rn dans R définie par
(x|y) =
n
$
i=1
xi yi
1.6. NOMBRES COMPLEXES
25
s’appelle le produit scalaire sur Rn .
On vérifie facilement les propriétés suivantes du produit scalaire. Si
x ∈ Rn , y ∈ Rn , z ∈ Rn et c ∈ R, alors
1) (x|y) = (y|x) et (x|x) = |x|22 ;
2) (x + y|z) = (x|z) + (y|z);
3) (cx|y) = c(x|y).
On en déduit aussitôt que
(x|y + z) = (x|y) + (x|z), (x|cy) = c(x|y).
D’autre part, l’inégalité de Cauchy s’écrit, en termes de produit scalaire et
de norme | · |2
|(x|y)| ≤ |x|2 |y|2.
On notera que, si n = 1, le produit scalaire se ramène à la multiplication
ordinaire sur R mais que, pour n ≥ 2, il constitue une application bilinéaire
de Rn × Rn dans R et non pas l’éventuelle application de Rn × Rn dans Rn
qui étendrait à Rn la notion de multiplication définie sur R. Nous allons voir
qu’une telle extension est possible pour n = 2.
1.6
Nombres complexes
Introduisons dans R2 une multiplication à partir de l’application R2 × R2
dans R2
(x, y) 2→ xy = (x1 y1 − x2 y2 , x1 y2 + x2 y1 ).
On vérifie sans peine par des calculs très simples que l’addition usuelle dans
R2 et cette multiplication satisfont à tous les axiomes (I) vérifiés par les
nombres réels si l’on prend 0 = (0, 0) comme élément neutre pour l’addition,
e1 = (1, 0) comme élément neutre pour la multiplication, −x = (−x1 , −y1 )
et, pour x /= 0,
4
5
x1
−x2
x−1 =
,
.
x21 + x22 x21 + x22
Muni de cette addition et de cette multiplication, R2 possède donc la structure de champ, est appelé le corps ou le champ des nombres complexes, est
noté C et ses éléments sont appelés des nombres complexes.
L’application j de R dans C définie par x 2→ (x, 0) est une bijection de
R sur R × {0} et est telle que, pour tout x ∈ R et tout y ∈ R, on a
j(x) + j(y) = (x, 0) + (y, 0) = (x + y, 0) = j(x + y),
26
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
j(x).j(y) = (xy, 0) = j(xy).
On peut donc identifier R au sous-corps R × {0} de C; par suite de cette
identification, l’élément e1 = (1, 0) de C sera encore simplement noté 1 et les
éléments de R×{0} notés indifféremment (x1 , 0) ou x1 . L’élément e2 = (0, 1)
de C sera noté i et la loi de multiplication et l’identification que nous venons
de faire entraı̂nent
i2 = i.i = (0, 1).(0, 1) = (−1, 0) = −1.
On retrouve ainsi l’origine historique des nombres complexes comme extension des nombres réels permettant de donner un sens à la racine carrée
d’un nombre négatif, problème qui s’était présenté dès le XVIe siècle dans
la résolution des équations algébriques. On a aussi, pour tout c ∈ R et tout
x ∈ C,
(c, 0).x = (c, 0).(x1, x2 ) = (cx1 , cx2 ) = c(x1 , x2 ) = cx,
ce qui montre la compatibilité, via l’identification faite plus haut, entre le
produit par un réel d’un élément de C et la multiplication de cet élément par
l’élément de C identifié à ce réel. On pourra donc écrire, pour tout x ∈ C,
x1 e1 = x1 .1 = x1 , x2 e2 = (x2 , 0).(0, 1) = (0, x2 ) = x2 (0, 1) = x2 i = ix2 ,
et dès lors
x = x1 e1 + x2 e2 = x1 + ix2 ,
qui est l’écriture complexe de x ∈ C. x1 est alors appelé la partie réelle de x
et noté aussi 8x et x2 est appelé la partie imaginaire de x et noté aussi 9x.
L’avantage de la notation complexe est que les opérations d’additions et de
multiplication peuvent se faire avec les règles habituelles de l’algèbre sur R,
à condition de remplacer i2 par −1.
Pour éviter l’emploi d’indices, on utilise souvent, pour un nombre complexe, la notation z = (x, y) = x + iy. Le nombre complexe x − iy = (x, −y)
est appelé le conjugué du nombre complexe z = x + iy = (x, y) et est noté
z̄. On vérifie sans peine que, pour tout z ∈ C et tout v ∈ C, on a
¯
z̄ = z, z + v = z̄ + v̄, zv = z̄v̄,
et
z z̄ = x2 + y 2 = |z|22 .
1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE
27
Dans C, la norme |z|2 de z, qui est donc égale à (z z̄)1/2, se note simplement
|z| et est souvent appelée (comme dans R), la valeur absolue de z ou le
module de z. On a, pour tout z ∈ C et tout v ∈ C,
|zv|2 = zvzv = zvz̄v̄ = z z̄vv̄ = |z|2 |v|2 ,
et dès lors |zv| = |z||v|, comme pour la multiplication et la valeur absolue
dans R. Cette dernière relation n’est pas vraie pour les deux autres normes
sur R2 , comme on le vérifie aisément. On utilisera uniquement la norme | · |2
dans C.
Tant que la notion de multiplication de deux éléments n’est pas utilisée
dans C, ce dernier ensemble ne diffère donc de R2 muni de la norme | · |2 que
par les notations et la terminologie. D’autre part, de la même manière que
R est un espace vectoriel sur R, on peut considérer C non seulement comme
un espace vectoriel sur R (lorsqu’on l’identifie à R2 ), mais aussi comme un
espace vectoriel sur C, le produit par un scalaire (c’est-à-dire un élément de
C) étant défini à partir de la multiplication dans C.
On notera enfin qu’il n’a pas été question de relation d’ordre dans C. On
démontre en algèbre qu’il est impossible de munir C d’une relation d’ordre
vérifiant tous les axiomes II de la section sur les réels. En outre, Georg
Frobenius a démontré qu’il était impossible, pour n ≥ 3, de munir Rn
d’une multiplication (c’est-à-dire d’une application bilinéaire de Rn × Rn
dans Rn telle que tous les axiomes I de la section sur les réels soient vérifiés).
1.7
Intérieur, adhérence, frontière
La notion de norme dans Rn permet de renforcer et d’affaiblir la notion
d’appartenance à une partie de Rn . Soit a ∈ Rn et E une partie de Rn .
Définition. On dit que a est intérieur à E (ou que E est un voisinage de
a) s’il existe r > 0 tel que B2 [a; r] ⊂ E.
L’intérieur int E de E est l’ensemble
int E = {a ∈ Rn : a est intérieur à E} = {a ∈ Rn : E est voisinage de a}.
Le résultat suivant est une conséquence immédiate de la définition.
Proposition. Si a est intérieur à E, alors a ∈ E. En d’autres termes,
int E ⊂ E.
La réciproque de cette proposition est fausse : un point peut appartenir
à un ensemble sans être intérieur à cet ensemble. Par exemple, si a < b sont
28
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
des réels, a ∈ [a, b] mais a n’est pas intérieur à [a, b]. En effet, pour chaque
r > 0, B2 [a; r] /⊂ [a, b] puisque B2 [a; r] = [a − r, a + r] et a − r /∈ [a, b].
Définition. On dit que a est adhérent à E si, pour tout r > 0, on a
B2 [a; r] ∩ E /= ∅.
L’adhérence adh E de E est l’ensemble
adh E = {a ∈ Rn : a est adhérent à E}.
On le note aussi E.
Le résultat suivant est une conséquence immédiate de la définition.
Proposition. Si a ∈ E, alors a est adhérent à E.
La réciproque de cette proposition est fausse : un point peut être adhérent à un ensemble sans lui appartenir. Par exemple, si a < b sont des réels,
a /∈ ]a, b[ mais a est adhérent à ]a, b[. En effet, pour chaque r > 0, on a
B2 [a; r]∩ ]a, b[ = [a − r, a + r]∩ ]a, b[ /= ∅,
puisque a + r $ ∈ [a − r, a + r]∩ ]a, b[ si r $ = min{r, b−a
2 }.
Il résulte immédiatement des définitions que
int ∅ = adh ∅ = ∅,
et que
int Rn = adh Rn = Rn .
En outre, puisque tout intervalle de R contient à la fois un rationnel et un
irrationnel, on a nécessairement
int Q = int (R \ Q) = ∅,
et
adh Q = adh (R \ Q) = R.
La proposition suivante montre que le rôle privilégié joué par la norme
| · |2 dans la définition de point intérieur et de point adhérent à un ensemble
n’est qu’apparent.
1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE
29
Proposition. Si i = 1, 2 ou ∞, alors a est intérieur à E si et seulement s’il
existe r > 0 tel que Bi [a; r] ⊂ E. a est adhérent à E si et seulement si, pour
tout r > 0, on a Bi [a; r] ∩ E /= ∅.
Démonstration. Condition nécessaire. Si a est intérieur à E, il existe
r2 > 0 tel que B2 [a; r2] ⊂ E. Comme
B∞
2
3
r2
a;
⊂ B1 [a; r2] ⊂ B2 [a; r2],
n
il existe r1 = r2 tel que B1 [a; r1] ⊂ E et r∞ = rn2 tel que B∞ [a; r∞] ⊂ E. On
procède de même dans le cas de l’adhérence.
Condition suffisante. Soit a ∈ Rn tel que, pour i = 1 ou ∞, il existe
ri > 0 tel que Bi [a; ri] ⊂ E. Comme
2
B2 [a; r∞] ⊂ B∞ [a; r∞] et B2 a;
3
r1
⊂ B1 [a; r1],
n
on obtient, en prenant r = r∞ ou r = rn1 selon le cas considéré l’existence
d’un r > 0 tel que B2 [a; r] ⊂ E. On procède de même dans le cas de
l’adhérence.
Les notions de point intérieur et de point adhérent s’échangent par double
passage au complémentaire. On posera !E = Rn \ E.
Proposition. a est adhérent à E si et seulement si a n’est pas intérieur à
!E. a est intérieur à E si et seulement si a n’est pas adhérent à !E. En
d’autres termes, on a adh E = !int !E, int E = !adh !E, ou encore
Rn = E ∪ !E = int E ∪ adh !E = adh E ∪ int !E.
Démonstration. En utilisant les définitions et les règles de négation d’une
proposition contenant des quantificateurs, on a
a n’est pas intérieur à !E ⇔ (∀r > 0) : B2 [a; r] /⊂ !E
⇔ (∀r > 0) : B2 [a; r] ∩ !!E /= ∅ ⇔ (∀r > 0) : B2 [a; r] ∩ E /= ∅
⇔ a est adhérent à E.
L’autre proposition s’obtient en appliquant la première à !E.
Etudions maintenant les relations entre les notions d’intérieur et d’adhérence et les relations et opérations usuelles entre ensembles. Soit F une
partie de Rn .
Le premier résultat est une conséquence immédiate des définitions.
30
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Proposition. Si E ⊂ F , alors int E ⊂ int F et adh E ⊂ adh F .
Proposition. On a
int (E ∪ F ) ⊃ int E ∪ int F, int (E ∩ F ) = int E ∩ int F,
adh (E ∪ F ) = adh E ∪ adh F, adh (E ∩ F ) ⊂ adh E ∩ adh F.
Démonstration. Comme E∪F ⊃ E et E∪F ⊃ F , on a, par la proposition
précédente,
int (E ∪ F ) ⊃ int E et int (E ∪ F ) ⊃ int F,
et donc int (E ∪ F ) ⊃ int E ∪ int F. Comme E ⊃ E ∩ F et F ⊃ E ∩ F , on
a, par la proposition précédente,
int E ⊃ int (E ∩ F ), int F ⊃ int (E ∩ F ),
et dès lors int E ∩ int F ⊃ int (E ∩ F ). Par ailleurs, si a ∈ int E, il existe
r1 > 0 tel que B2 [a; r1] ⊂ E et si a ∈ int F , il existe r2 > 0 tel que
B2 [a; r2] ⊂ F. Dès lors, r = min{r1 , r2} est tel que B2 [a; r] ⊂ E ∩ F, ce
qui montre que int E ∩ int F ⊂ int (E ∩ F ). Comme l’inclusion contraire
a été démontrée plus haut, on a bien l’égalité souhaitée. Pour obtenir les
propriétés de l’adhérence, on utilise les propriétés de l’intérieur, les lois de
De Morgan
!(A ∪ B) = !A ∩ !B, !(A ∩ B) = !A ∪ !B,
et les relations entre intérieur et adhérence. Cela donne
adh (E ∪ F ) = !int !(E ∪ F ) = !int (!E ∩ !F )
= ![(int !E) ∩ (int !F )] = !(int !E) ∪ !(int !F )
= adh E ∪ adh F,
et
adh (E ∩ F ) = !int !(E ∩ F ) = !int (!E ∪ !F )
⊂ ![(int !E) ∪ (int !F )] = (!int !E) ∩ (!int !F )
= adh E ∩ adh F.
1.7. INTÉRIEUR, ADHÉRENCE, FRONTIÈRE
31
Remarque. Traduits en termes de voisinages, les résultats ci-dessus expriment que toute partie de Rn contenant un voisinage de a est un voisinage
de a et que l’intersection de deux voisinages de a est encore voisinage de a.
A titre d’exemple, déterminons l’intérieur et l’adhérence des différents
types d’intervalle de R muni de la norme valeur absolue.
Proposition. Si a < b sont deux réels, alors
]a, b[= int ]a, b[ = int [a, b[ = int ]a, b] = int [a, b],
[a, b] = adh ]a, b[ = adh [a, b[ = adh ]a, b] = adh [a, b].
Démonstration. Démontrons d’abord la première série d’égalités. Puisque
]a, b[ ⊂ [a, b[ ⊂ [a, b] et ]a, b[ ⊂ ]a, b] ⊂ [a, b],
et que ces inclusions se conservent par passage à l’intérieur, il suffit de
démontrer que
]a, b[ = int ]a, b[ = int [a, b].
La première égalité sera démontrée si l’on prouve que ]a, b[ ⊂ int ]a, b[. Soit
x ∈]a, b[, c’est-à-dire tel que a < x < b. Par une propriété des réels démontrée
plus haut, il existe donc r1 > 0 tel que a + r1 < x et r2 > 0 tel que x + r2 < b
et, en prenant r = min{r1 , r2 }, on voit que a < x − r < x + r < b ou encore
que B2 [x; r] = [x − r, x + r] ⊂ ]a, b[. Pour démontrer que ]a, b[ = int [a, b], on
sait déjà, puisque ]a, b[ ⊂ [a, b], que ]a, b[ = int ]a, b[ ⊂ int [a, b] et il suffit
donc de prouver que int [a, b] ⊂ ]a, b[. Si x ∈ int [a, b], il existe r > 0 tel que
B2 [x; r] = [x − r, x + r] ⊂ [a, b]. Par conséquent, on a
a < a + r ≤ x ≤ b − r < b,
et x ∈ ]a, b[.
Pour calculer les adhérences, il suffit, comme dans le cas des intérieurs,
de prouver que
[a, b] = adh [a, b] = adh ]a, b[.
Pour la première égalité, il suffit de nouveau de prouver que adh [a, b] ⊂ [a, b].
Si x ∈ adh [a, b], alors, pour chaque r > 0, on a
B2 [x; r] ∩ [a, b] = [x − r, x + r] ∩ [a, b] /= ∅.
En d’autres termes,
(∀r > 0)(∃y ∈ R) : x − r ≤ y ≤ b et a ≤ y ≤ x + r,
32
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
ce qui entraı̂ne que
(∀r > 0) : a ≤ x + r et x ≤ b + r.
On a vu plus haut que cette propriété équivaut à a ≤ x ≤ b, et donc
x ∈ [a, b]. Pour démontrer que adh [a, b] = adh ]a, b[, on déduit tout d’abord
de l’inclusion ]a, b[ ⊂ [a, b] que
adh ]a, b[ ⊂ adh [a, b] = [a, b],
et il suffit de prouver que [a, b] ⊂ adh ]a, b[, ce qui se ramène à {a, b} ⊂
adh ]a, b[ et a été démontré plus haut.
Remarque. Les exemples suivants montrent qu’on ne peut pas améliorer
les conclusions de la proposition sur l’intérieur d’une union et l’adhérence
d’une intersection. Si a < b < c sont des réels, E = [a, b[ et F = [b, c[, alors
E ∪ F = [a, c[ et
int (E ∪ F ) = ]a, c[ /= ]a, b[ ∪ ]b, c[ = int E ∪ int F.
Si a < b < c < d sont des réels, et si E = [b, c[, F =]a, b] ∪ ]c, d[, alors
E ∩ F = {b} = {b} /= {b} ∪ {c} = [b, c] ∩ ([a, b] ∪ [c, d]) = E ∩ F .
Introduisons enfin la notion de frontière d’une partie de Rn .
Définition. Si E ⊂ Rn , la frontière fr E ou Ė ou ∂E est l’ensemble
fr E = adh E ∩ adh !E.
Il résulte aussitôt de cette définition que fr E = fr !E, et le lien entre
intérieur et adhérence entraı̂ne aussi la relation
fr E = adh E \ int E,
puisque
adh E \ int E = adh E ∩ !int E = adh E ∩ adh !E.
Il résulte de la définition et de résultats démontrés pour l’intérieur et
l’adhérence que l’on a
fr Q = R, fr Rn = ∅, fr ∅ = ∅,
et, si a < b sont des réels,
fr [a, b] = fr [a, b[ = fr ]a, b] = fr ]a, b[ = {a, b}.
33
1.8. EXERCICES
1.8
Exercices
1. Soient a1 , a2 , . . . , an et b1 , b2, . . . , bn des nombres réels. Vérifier l’identité


n
$
j=1
&
aj 
n
$
bk
k=1
'
−n
&
n
$
k=1
ak bk
'
$
=
1≤j<k≤n
(aj − ak )(bk − bj ) =
n $
n
1$
(aj − ak )(bk − bj ).
2 j=1 k=1
En déduire que si aj ≤ ak et bj ≥ bk pour tout 1 ≤ j < k ≤ n, on a l’inégalité
de Tchebycheff

&
n
1$

aj 
n j=1
n
1$
bk
n k=1
'
≥
n
1$
ak bk .
n k=1
2. Soient a1 , a2 , . . . an des nombres réels tels que aj ∈ ] − 1, 0] (1 ≤ j ≤ n)
ou aj ≥ 0, (1 ≤ j ≤ n). Démontrer, par récurrence, l’inégalité
n
6
j=1
(1 + aj ) ≥ 1 +
n
$
aj ,
j=1
l’inégalité étant stricte dès que n ≥ 2. En déduire l’inégalité de Bernoulli :
si a > −1 et si n ≥ 1 est un entier, alors (1 + a)n ≥ 1 + na.
3. On dit qu’un nombre réel x est algébrique s’il est solution d’une équation
%
algébrique à coefficients aj entiers nj=0 aj xj = 0. On dit qu’un nombre réel
est transcendant s’il n’est pas algébrique. Démontrer que tout rationnel est
algébrique, que l’ensemble des nombres algébriques est dénombrable et que
l’ensemble des nombres transcendants est non-dénombrable.
1.9
Petite anthologie
Ensembles
Par ensemble, nous devons entendre toute collection M considérée comme un tout d’objets définis et séparés de notre intuition et de notre pensée.
Ces objets sont appelés les “éléments” de M.
Georg Cantor, 1895
34
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Si, d’autre part, la totalité des éléments d’une multiplicité peut être considérée sans contradiction “comme un tout”, alors ils peuvent être rassemblés
en “une seule chose”. Je l’appelle une multiplicité consistante ou un ensemble.
Georg Cantor, 1899
Jusqu’à présent, personne n’a réussi à définir correctement la notion
d’ensemble. Il ne faut probablement pas espérer une définition, mais plutôt
un système d’axiomes. Les définitions usuelles d’ensemble ne permettent
aucune conclusion utile, et en outre elles tolèrent des ensembles paradoxaux.... Mais, comme il semble exister des ensembles infinis consistants,
une définition convenable ou un système d’axiomes correct devraient exclure
les êtres paradoxaux.
Gerhard Hessenberg, 1906
Fonctions, applications
On appelle ici fonction d’une grandeur variable, une quantité composée
de quelque manière que ce soit de cette grandeur variable et de constantes.
Jean Bernoulli, 1718
Une fonction d’une quantité variable est une expression analytique composée de quelque manière que ce soit de cette quantité variable et de nombres
ou quantités constantes.
Leonhard Euler, 1748
On appelle fonction d’une ou de plusieurs quantités toute expression de
calcul dans laquelle ces quantités entrent d’une manière quelconque, mêlées
ou non avec d’autres quantités qu’on regarde comme ayant des valeurs données et invariables, tandis que les quantités de la fonction peuvent recevoir
toutes les valeurs possibles. Ainsi, dans les fonctions, on ne considère que
les quantités qu’on suppose variables, sans aucun égard aux constantes qui
peuvent y être mêlées. Nous désignerons en général par la caractéristique f
ou F , placée devant une variable, toute fonction de cette variable, c’est-àdire toute quantité dépendante de cette variable et qui varie avec elle suivant
une loi donnée.
Joseph-Louis Lagrange, 1797
1.9. PETITE ANTHOLOGIE
35
Enfin de nouvelles idées, amenées par le progrès de l’analyse, ont donné
lieu à la définition suivante des fonctions : toute quantité dont la valeur
dépend d’une ou plusieurs autres quantités, est dite fonction de ces dernières,
soit qu’on sache ou qu’on ignore par quelles opérations il faut passer pour
remonter de celles-ci à la première.
Sylvestre François Lacroix, 1797
En général, la fonction f (x) représente une suite de valeurs, ou ordonnées, dont chacune est arbitraire. L’abscisse x pouvant recevoir une
infinité de valeurs, il y a un pareil nombre d’ordonnées f (x). Toutes ont des
valeurs numériques actuelles, ou positives, ou négatives, ou nulles. On ne
suppose point que ces ordonnées soient assujetties à une loi commune; elles
se succèdent d’une manière quelconque, et chacune d’elles est donnée comme
le serait une seule quantité.
Jean-Baptiste Joseph Fourier, 1822
Lorsque des quantités variables sont tellement liées entre elles que, la
valeur de l’une d’elles étant donnée, on puisse en conclure les valeurs de
toutes les autres, on conçoit d’ordinaire ces diverses quantités exprimées au
moyen de l’une d’entre elles, qui prend alors le nom de variable indépendante; et les autres quantités, exprimées au moyen de la variable indépendante,
sont ce qu’on appelle des fonctions de cette variable.
Augustin Cauchy, 1823
D’une manière générale, on doit appeler fonction de x un nombre qui est
donné pour chaque x et qui change progressivement avec x. La valeur de la
fonction pourrait être donnée ou bien par une expression analytique, ou par
une condition qui offre un moyen de tester tous les nombres et de sélectionner
l’un deux, ou, finalement, la dépendance peut exister mais rester inconnue.
Nicolas Lobatchevsky, 1834
Il n’est pas, en outre, du tout nécessaire que y dépende de x dans tout
l’intervalle suivant la même loi; en fait, il n’est pas nécessaire de penser
seulement à des relations qui puissent être exprimées par des opérations
mathématiques.
Gustave Lejeune Dirichlet, 1837
36
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Par le terme fonction, je considère une quantité dont les valeurs dépendent d’une manière quelconque de la valeur de la variable, ou des valeurs de
plusieurs variables dont elle est composée. Ainsi, les fonctions considérées
n’ont pas besoin pour être admises d’être exprimées par une combinaison de
symboles algébriques, même entre des limites des variables arbitrairement
proches.
Georges Stokes, 1848
Une fonction de x est appelée f (x) si à chaque valeur de x à l’intérieur
d’un intervalle est associée une valeur univoquement déterminée de f (x). En
outre, la manière dont f (x) est déterminée n’a aucune importance, que ce
soit par une opération analytique sur les quantités ou une autre manière. La
valeur de f (x) doit seulement être déterminée univoquement partout.
Hermann Hankel, 1870
Quand deux multiplicités bien ordonnées M et N se laissent mettre en
correspondance, élément par élément, de façon univoque et complète (chose
qui, si elle est possible de quelque manière, peut toujours se faire de beaucoup d’autres manières), nous nous autoriserons désormais à dire que ces
multiplicités one même puissance, ou encore qu’elles sont équivalentes. ...
La série des nombres entiers positifs offre, comme on peut le montrer facilement, la plus petite de toutes les puissances qui se trouvent dans les multiplicités infinies. Néanmoins la classe des multiplicités qui ont cette plus
petite puissance est une classe extraordinairement riche et étendue.
Georg Cantor, 1878
Par une application d’une système S, on entend une loi par laquelle
à chaque élément déterminé s de S est associé un objet déterminé, qui est
appelé l’image de s et noté φ(s); on dit, aussi, que φ(s) correspond à l’élément
s, que φ(s) est déterminé ou engendré par l’application φ à partir de s, que
s est transformé par l’application φ en φ(s).
Richard Dedekind, 1887
Considérons un ensemble (X) de nombres distincts, et regardons ces
nombres comme des valeurs qui puissent être attribuées à une lettre x, laquelle sera désignée comme étant une variable. Supposons qu’à chaque valeur
de x, c’est-à-dire à chaque élément de l’ensemble (X) corresponde un nombre que l’on regardera comme une valeur attribuée à une lettre y; on dira
37
1.9. PETITE ANTHOLOGIE
que y est une fonction de x déterminée dans cet ensemble (X): la fonction
sera définie dans cet ensemble si la correspondance est définie. L’ensemble
(Y ) des valeurs distinctes que prend y est déterminé par la correspondance
même : dire que b est un élément de (Y ) c’est dire qu’il y a un élément a
de (X) auquel correspond le nombre b. A chaque élément de (X) correspond un élément de (Y ) et un seul; mais rien n’empêche, dans la définition
précédente, qu’à plusieurs éléments différents de (X) corresponde un même
élément de (Y ).
Jules Tannery, 1904
Une fonction est une relation u telle que, si deux paires y; x et z; x ayant
le même second élément, satisfont à la relation u, il en résulte nécessairement
que y = x quelles que soient les valeurs de x, y, z.
Giuseppe Peano, 1911
Soient E et F deux ensembles, distincts ou non. Une relation entre une
variable x de E et une variable y de F est dite relation fonctionnelle en y,
ou relation fonctionnelle de E vers F , si, quel que soit x ∈ E, il existe un
élément y de F , et un seul, qui soit dans la relation considérée avec x.
Nicolas Bourbaki, 1939
Nombres réels
On doit se rappeler cependant que les quantités infiniment petites, même
comprises dans le sens populaire, ne sont en aucun cas constantes et déterminées. Car si un opposant dénie l’exactitude de nos théorèmes, nos calculs
montrent que l’erreur est plus petite que toute quantité donnée, puisqu’il
est en notre pouvoir de diminuer l’incomparablement petit, que l’on peut
toujours supposer aussi petit que l’on veut. Nul doute que là se trouve la
démonstration rigoureuse de notre calcul infinitésimal.
Gottfried W. Leibniz, 1702
Les nombres irrationnels se trouvent en une quantité sans comparaison
plus grande que les nombres rationnels.
Bernard le Bovier de Fontenelle, 1727
38
CHAPITRE 1. ENSEMBLES, GRAPHES, FONCTIONS
Il n’y a pas de doute que toute quantité peut être diminuée de telle
manière qu’elle s’annule complètement et disparaisse. Mais une quantité
infiniment petite n’est rien d’autre qu’une quantité qui s’annule et dès lors
la chose elle-même est égale à zéro. C’est en harmonie aussi avec cette
définition des choses infiniment petites, par laquelle les choses sont dites
inférieures à toute quantité assignable; elles devraient certainement n’être
rien, car à moins qu’elle ne soit égale à zéro, une quantité égale peut lui être
assignée, ce qui est contraire à l’hypothèse.
Léonard Euler, 1755
Nombres complexes
Après les irrationnels sont nées les quantités impossibles ou imaginaires
dont la nature est très étrange mais dont l’utilité est indéniable.
Gottfried W. Leibniz
De la même manière qu’on peut imaginer le domaine entier des quantités
réelles comme étant représentées par une ligne droite infinie, le domaine
complet de toutes les grandeurs, nombres réels aussi bien qu’imaginaires,
peut être visualisé comme un plan infini, dans lequel le point défini par
l’abscisse a et l’ordonnée b représente la quantité a + bi.
Carl-Friedrich Gauss, 1811
On
√ appelle expression imaginaire toute expression symbolique de la forme
a + b −1, a, b désignant deux quantités réelles.
Augustin Cauchy, 1821
Chapitre 2
Limites et continuité
2.1
Fonctions de plusieurs variables réelles
Soient n ≥ 1 et p ≥ 1 des entiers et soit f une fonction de Rn dans Rp. Pour
chaque x ∈ dom f, on a
f (x) = (p1 (f (x)), . . ., pp(f (x))) = ((p1 ◦ f ))(x), . . . , (pp ◦ f )(x))
où, pour chaque 1 ≤ j ≤ p, pj : Rp → R, y 2→ yj est l’application projection
sur la j e composante. On pose, pour chaque 1 ≤ j ≤ p, fj = pj ◦ f , ce qui
définit une fonction de Rn dans R, de domaine dom fj = dom f , appelée
fonction j e composante de f . Réciproquement, si l’on se donne p fonctions
f1 , . . . , fp de Rn dans R, de domaines respectifs dom f1 , . . . , dom fp , on peut
7p
leur associer la fonction f de Rn dans Rp , de domaine dom f = j=1 dom fj ,
définie, pour chaque x ∈ dom f , par f (x) = (f1 (x), . . . , fp(x)). La fonction
j e composante de f est alors la restriction de fj à dom f .
Lorsque n > 1 et p = 1, on dit que f est une fonction réelle de plusieurs
(ici n) variables réelles; si n > 1 et p > 1, on dit que f est une fonction
vectorielle de plusieurs variables réelles; si n = 1 et p > 1, on dit que f est
une fonction vectorielle d’une variable réelle et si n = p = 1, on dit que f
est une fonction réelle d’une variable réelle.
Exemples. 1. La fonction qui associe à chaque réel x son carré x2 est une
fonction réelle d’une variable réelle de domaine égal à R puisque l’opération
“élévation au carré” est définie pour chaque réel.
x
2. La fonction qui associe à chaque réel x différent de zéro le réel |x|
est une
∗
fonction réelle de variable réelle de domaine égal à R = R \ {0}, puisque la
division n’est définie que pour des diviseurs non nuls.
39
40
CHAPITRE 2. LIMITES ET CONTINUITÉ
3. La fonction qui associe à chaque réel positif x sa racine carrée arithmétique
x1/2 est une fonction réelle d’une variable réelle de domaine égal à R+ = {x ∈
R : x ≥ 0}, puisque l’opération “racine carrée arithmétique” n’est définie que
pour les réels positifs.
4. La fonction de R2 dans R2 définie par
f (x1 , x2 ) =
4
x1 + x 2
x 1 x2
,
x1 − x2 (x1 − 1)1/2
5
a pour domaine
dom f = {(x1 , x2 ) ∈ R2 : x1 /= x2 et x1 > 1}
x1 x2
2
puisque l’expression xx11 +x
−x2 est définie lorsque x1 /= x2 et l’expression (x1 −1)1/2
est définie lorsque x1 > 1.
Une fonction f de Rn dans R2 peut évidemment être considérée comme
une fonction f de Rn dans C et s’appelle alors une fonction complexe de
plusieurs variables réelles si n > 1 et d’une variable réelle si n = 1. Ses
composantes au sens défini plus haut s’appellent alors respectivement la
fonction partie réelle et la fonction partie imaginaire de f . Une fonction
de R2 dans Rp peut également être considérée comme fonction de C dans
Rp et s’appelle alors une fonction vectorielle d’une variable complexe. En
particulier, une fonction de R2 dans R2 peut être considérée comme une
fonction de C dans C; on l’appelle alors une fonction complexe d’une variable
complexe. Tant que la structure de corps qui distingue C de R2 n’est pas
utilisée, il n’y a évidemment aucune nécessité de distinguer R2 de C comme
espace de départ ou d’arrivée d’une fonction. Il en sera ainsi pour les notions
de limite et de continuité. Par contre, la notion de dérivabilité sera différente
selon que l’on considère C ou R2 .
Rappelons enfin que, conformément aux notions générales introduites
sur les graphes, si f est une fonction de Rn dans Rp et E une partie de
Rn , la restriction f |E de f à E sera la fonction de Rn dans Rp de domaine
dom f |E = dom f ∩ E telle que, pour chaque x ∈ dom f |E , on a f |E (x) =
f (x).
2.2
Limite des valeurs d’une fonction
Introduisons maintenant le concept fondamental de limite, en un point de
Rn , des valeurs d’une fonction de Rn dans Rp . Si f est une fonction de Rn
dans Rp , l’opération “calculer f (a) en a ∈ Rn ” est possible si et seulement
2.2. LIMITE DES VALEURS D’UNE FONCTION
41
si a ∈ dom f . Si nous considérons à titre d’exemple la fonction f de R dans
R définie par
1
1
f (x) = −
,
x x + x2
nous voyons immédiatement que son domaine est égal à R \ {−1, 0}. Si
nous calculons numériquement des valeurs de f (x) pour des x différents
de −1 mais proches de −1, nous constatons que f (x) prend des valeurs
positives et des valeurs négatives dont la valeur absolue peut devenir très
grande. Si nous calculons numériquement f (x) pour des valeurs différentes
de 0 mais proches de 0, nous constatons que les valeurs obtenues pour f (x)
diffèrent peu de 1. La fonction f présente donc un comportement différent
au voisinage des points −1 et 0 du complémentaire de son domaine. Dans le
cas de 0, l’opération impossible “calculer f (0)” semble réalisable “de manière
approchée” dans le sens suivant : f (x) diffère d’aussi peu que l’on veut de
1 si on la calcule aux points de dom f \ {0} suffisamment proches de 0.
D’une manière plus précise, montrons que chaque fois qu’on se donne un
réel ! > 0, on pourra trouver un réel δ > 0 tel que |f (x) − 1| ≤ ! pour tous
les x ∈ dom f vérifiant l’inégalité |x| ≤ δ. Pour ce faire, notons tout d’abord
que, pour chaque x ∈ dom f, on a
#
#1
|f (x) − 1| = ##
x
−
#
#
#
# # −x #
1
# = |x| .
− 1## = ##
2
x+x
1 + x # |1 + x|
|x|
! > 0 étant donné, nous devons donc trouver un δ > 0 tel que |1+x|
≤ !
lorsque x /∈ {−1, 0} et |x| ≤ δ. Rappelons qu’on majore une fraction en
majorant son numérateur et en minorant son dénominateur. Pour minorer
|1 + x|, notons que si |x| ≤ 12 , c’est-à-dire si − 12 ≤ x ≤ 12 , on a 12 ≤ 1 + x ≤ 32 ,
et dès lors
1
|1 + x| = 1 + x ≥ .
2
En conséquence, on a
|x|
≤ 2|x|
|1 + x|
dès que |x| ≤ 12 , ce qui entraı̂ne que
|f (x) − 1| =
|x|
≤ 2|x| ≤ !,
|1 + x|
si, outre les conditions x /∈ {−1, 0} et |x| ≤ 12 déjà imposées, on ajoute
|x| ≤ 2! . Nous avons donc montré que le réel strictement positif δ = min{ 12 , 2! }
42
CHAPITRE 2. LIMITES ET CONTINUITÉ
est tel que |f (x) − 1| ≤ ! pour tous les x ∈ dom f vérifiant l’inégalité
|x| ≤ δ. Dans ce sens précis, on peut dire que l’opération impossible “faire
prendre à f en 0 la valeur 1” est réalisée de manière approchée, et avec une
approximation aussi bonne que l’on veut. Dans ce processus, ! > 0 mesure
l’erreur maximale tolérée dans la réalisation de l’opération approchée et le
réel strictement positif δ qu’on lui associe délimite les valeurs de la variable x
pour lesquelles l’opération approchée est réalisée dans les limites de l’erreur
maximale tolérée. On voit tout de suite que si un δ1 > 0 convient, dans
ce qui précède, pour un !1 > 0 donné, il conviendra a fortiori pour chaque
! > !1 puisque |f (x) − 1| ≤ !1 entraı̂ne |f (x) − 1| ≤ !. Par contre, si ! < !1 ,
on constate facilement que le δ1 associé à !1 ne conviendra pas en général
pour !; il faudra prendre un δ < δ1 et être assuré de trouver des éléments x
dans dom f tels que |x| ≤ δ. Comme δ peut être arbitrairement petit, il est
important que dom f ∩ {x : |x| ≤ δ} /= ∅ pour tout δ > 0, c’est-à-dire que
0 ∈ adh dom f.
Nous pouvons maintenant formaliser ce qui précède et obtenir la définition suivante.
Définition. Soit f une fonction de Rn dans Rp, a ∈ Rn et b ∈ Rp . On dit
que f (x) tend vers b lorsque x tend vers a, ou encore que b est limite de f (x)
lorsque x tend vers a, et l’on écrit
f (x) → b si x → a,
si les deux conditions suivantes sont satisfaites :
1) a ∈ adh dom f ;
2) (∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !.
Rappelons que la condition 2 se lit comme suit : pour tout ! > 0, il
existe un δ > 0 tel que pour tout x ∈ dom f vérifiant l’inégalité |x − a|2 ≤ δ,
on a l’inégalité |f (x) − b|2 ≤ !. Pour chaque ! > 0 donné, on devra donc
trouver un δ > 0 (pouvant dépendre d’!) tel que |f (x) − b|2 ≤ ! pour tous les
x ∈ dom f tels que |x − a|2 ≤ δ. Dans l’exemple considéré plus haut, toutes
les conditions de la définition sont satisfaites avec a = 0 et b = 1, et l’on
peut donc écrire
1
1
→ 1 si x → 0.
−
x x + x2
Donnons maintenant un exemple de vérification de la définition pour une
fonction de plusieurs variables.
Exemple. Soit f la fonction de R2 dans R définie par
x 1 x2
x 1 x2
f (x1 , x2 ) =
= 2
.
|x|2
(x1 + x22 )1/2
2.2. LIMITE DES VALEURS D’UNE FONCTION
43
Comme |x|2 = 0 si et seulement si x = 0, on voit que dom f = R2 \ {0}. On
a 0 ∈ adh dom f puisque adh dom f = R2 . Montrons que
f (x) → 0 si x → 0.
Soit ! > 0; il faut donc trouver un δ > 0 tel que, pour tout x = (x1 , x2 ) /=
(0, 0) vérifiant l’inégalité |x|2 ≤ δ, on ait
#
#
# x1 x2 #
#
#
# |x| # ≤ !,
2
c’est-à-dire
|x1 ||x2|
≤ !.
|x|2
L’étude de cette inégalité est simplifiée si l’on rappelle que, pour tout x =
(x1 , x2 ) ∈ R2 , on a
|xi | ≤ |x|2 , (i = 1, 2),
et dès lors, pour tout x ∈ R2 \ {0}, on a
|x1 ||x2|
|x|22
≤
= |x|2 .
|x|2
|x|2
Il suffit donc de prendre δ = ! pour que les conditions x ∈ dom f et |x|2 ≤ δ
entraı̂nent |x|2 ≤ ! et dès lors |f (x)| ≤ |x|2 ≤ !.
Dans les applications pratiques de la notion de limite, il est souvent
nécessaire de restreindre les valeurs de la variable x à une certaine partie
de Rn fixée d’avance et constituant un ensemble de contraintes. Par exemple, dans le cas d’une fonction réelle d’une variable réelle, on peut n’être
intéressé que par les valeurs strictement positives de la variable. Il est donc
nécessaire, pour couvrir toutes les situations rencontrées dans les applications, d’étendre la définition de limite au cas où la variable x est astreinte
à rester dans un ensemble de contraintes E, c’est-à-dire de demander à la
définition précédente de s’appliquer seulement à la restriction f |E de f à E.
Définition. Soit f une fonction de Rn dans Rp , a ∈ Rn , b ∈ Rp et E ⊂ Rn
tel que dom f ∩ E /= ∅. On dit que f (x) tend vers b lorsque x tend vers a
dans E, ou encore que b est limite de f (x) lorsque x tend vers a dans E, et
l’on écrit
f (x) → b si x → a dans E,
(2.1)
44
CHAPITRE 2. LIMITES ET CONTINUITÉ
si b est limite de f |E (x) pour x tendant vers a, c’est-à-dire si les deux conditions suivantes sont satisfaites :
1) a ∈ adh (dom f ∩ E);
2) (∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ E : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !.
x
Exemple. Soit f la fonction de R dans R définie par f (x) = |x|
. On a
évidemment dom f = R \ {0}. Prenons E = R+ = {x ∈ R : x ≥ 0}, ce
qui entraı̂ne dom f ∩ E = R∗+ = {x ∈ R : x > 0}, et 0 ∈ adh R∗+ = R+ .
Montrons que
f (x) → 1 si x → 0 dans E.
On a, pour tout x > 0, f (x) = xx = 1 et donc |f (x) − 1| = 0. Si ! > 0 est
donné, on aura donc |f (x) − 1| = 0 ≤ ! quel que soit x > 0 et l’on peut donc
choisir n’importe quel δ > 0 dans la définition.
Il est évident que, pour chaque E ⊂ Rn tel que a ∈ adh (dom f ∩ E), on
a l’implication
f (x) → b si x → a ⇒ f (x) → b si x → a dans E.
Nous donnerons plus loin un exemple montrant que l’implication contraire
est fausse.
Donnons maintenant quelques remarques simples mais importantes sur
la structure et l’utilisation de la définition de limite.
Remarques. 1. La condition 2 est évidemment équivalente à la condition
(∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : f (x) ∈ B2 [b; !],
elle-même équivalente à la condition
(∀! > 0)(∃δ > 0) : f (B2 [a; δ]) ⊂ B2 [b; !].
2. Si r > 0 est donné, la condition 2 de la définition est équivalente à la
condition
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ r!,
puisque l’application ! 2→ r! est une bijection de R∗+ = {x ∈ R : x > 0} sur
lui-même.
3. La condition 2 est équivalente à la condition
(∀! > 0)(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 < δ $ ) : |f (x) − b|2 < !,
(2.2)
45
2.2. LIMITE DES VALEURS D’UNE FONCTION
où les signes ≤ sont remplacés par < (le changement de δ en δ $ n’a évidemment aucune signification profonde et ne sert que pour clarifier la démonstration). Montrons tout d’abord que la condition 2 de la définition implique
(2.2) : si ! > 0 est donné, il faut donc trouver un δ $ > 0 tel que (2.2) soit
satisfaite. Par la condition 2 de la définition et la remarque 2, il existe un
δ $$ > 0 tel que
(∀x ∈ dom f ∩ E : |x − a|2 ≤ δ $$ ) : |f (x) − b|2 ≤
!
,
2
ce qui entraı̂ne évidemment que
(∀x ∈ dom f ∩ E : |x − a|2 < δ $$ ) : |f (x) − b|2 < !.
On peut donc prendre δ $ = δ $$ . Montrons maintenant que la condition (2.2)
implique la condition 2 de la définition. Si ! > 0 est donné, nous devons
trouver un δ > 0 tel que la condition 2 soit satisfaite. Par (2.2), il existe un
δ $ > 0 tel que
!
(∀x ∈ dom f ∩ E : |x − a|2 < δ $ ) : |f (x) − b|2 < ,
2
ce qui entraı̂ne aussitôt que
(∀x ∈ dom f ∩ E : |x − a|2 ≤
"
δ$
) : |f (x) − b|2 ≤ !,
2
et montre que δ = δ2 convient.
4. La deuxième partie de la démonstration de la Remarque 3 a fait usage
du fait suivant, qui est aussi simple qu’utile : si, étant donné un ! > 0
on a trouvé un δ > 0 qui convient pour cet ! dans la condition 2 de la
définition, alors tout δ $ ∈ ]0, δ] conviendra a fortiori, puisqu’alors |x − a|2 ≤ δ
si |x − a|2 ≤ δ $ . En particulier, on peut toujours décider d’avance de se
restreindre à déterminer des δ inférieurs à un nombre strictement positif
donné.
5. Si, dans la condition 2 de la définition, on a trouvé un δ > 0 qui convient
pour un ! > 0 donné, ce δ conviendra également pour tous les !$ ≥ !. Il suffit
donc que la condition 2 puisse être vérifiée pour chaque ! strictement positif
inférieur à un !∗ fixé d’avance. L’exigence “pour chaque ! > 0” signifie donc
fondamentalement “pour chaque ! > 0 arbitrairement petit”.
6. Les exemples que nous avons déjà traités montrent l’intérêt qu’il y a,
pour vérifier les conditions de la définition de limite, à majorer l’expression
|f (x) − b|2 par une expression plus simple à estimer. On utilise pour ce faire
46
CHAPITRE 2. LIMITES ET CONTINUITÉ
un stock d’inégalités qui se constitue petit à petit par la pratique. Le choix
de l’inégalité est un art plus qu’une science puisqu’il faut veiller à ce qu’elle
simplifie suffisamment l’expression à majorer sans altérer la nature de cette
expression au point de rendre l’inégalité impossible.
Montrons maintenant qu’il ne peut pas exister plus d’un b vérifiant les
conditions de la définition de la limite.
Proposition. Etant donnés f et a, il existe au plus un b ∈ Rp vérifiant les
conditions de la définition de la limite des valeurs de f (x) lorsque x tend
vers a.
Démonstration. Supposons que b ∈ Rp et b$ ∈ Rp vérifient les conditions
de la définition de limite. Rappelons que
b = b$ ⇔ (∀! > 0) : |b − b$ |2 ≤ !,
et que, pour tout x ∈ dom f , on a évidemment
|b − b$ |2 = |b − f (x) + f (x) − b$ |2 ≤ |b − f (x)|2 + |f (x) − b$ |2 .
Soit ! > 0. Par hypothèse
(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤
et
!
,
2
!
.
2
Dès lors, si l’on pose δ $$ = min{δ, δ $} et que l’on choisit x ∈ dom f tel que
|x − a|2 ≤ δ $$ (ce qui est toujours possible par la condition 1 de la définition),
on aura
!
!
|b − b$ |2 ≤ + = !.
2 2
(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $ ) : |f (x) − b$ |2 ≤
Ce résultat d’unicité entraı̂ne qu’on pourra appeler b la limite de f (x)
lorsque x tend vers a. On écrira alors
b = lim f (x).
x→a
En appliquant ce résultat à f |E , on obtient évidemment l’existence d’au plus
un b vérifiant les conditions de la définition de la limite des valeurs de f (x)
lorsque x tend vers a dans E. On l’appellera la limite de f (x) lorsque x tend
vers a dans E et l’on écrira
b=
lim
x→a, x∈E
f (x).
2.3. CONDITIONS NÉCESSAIRES D’EXISTENCE DE LA LIMITE
2.3
47
Conditions nécessaires d’existence de la limite
La définition que nous avons donnée permet, étant donnés f, a et b, de
vérifier si b = limx→a f (x). Il est évidemment fastidieux de l’utiliser pour
montrer que f n’a pas de limite lorsque x tend vers a, puisqu’il faut alors
vérifier qu’elle n’est satisfaite pour aucun b ∈ Rp . Nous allons donner dans
cette section des conditions nécessaires d’existence d’une limite qui ne font
pas intervenir la valeur b de la limite. Par contraposition, ces conditions
nécessaires donneront alors des conditions de non-existence de la limite plus
facilement utilisables.
La première condition porte le nom de condition de Cauchy.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ Rn . Si limx→a f (x)
existe alors la condition suivante est satisfaite:
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)(∀x$ ∈ dom f : |x$ − a|2 ≤ δ) :
|f (x) − f (x$ )|2 ≤ !.
(2.3)
Démonstration. Posons b = limx→a f (x) et notons tout d’abord que,
pour tout x ∈ dom f et tout x$ ∈ dom f , on a
|f (x) − f (x$ )|2 = |f (x) − b + b − f (x$ )|2 ≤ |f (x) − b|2 + |f (x$ ) − b|2 .
Si ! > 0 est donné, il existe δ > 0 tel que
(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤
!
,
2
et dès lors, en utilisant l’inégalité ci-dessus,
(∀x ∈ dom f : |x − a|2 ≤ δ)(∀x$ ∈ dom f : |x$ − a|2 ≤ δ) :
|f (x) − f (x$ )|2 ≤ |f (x) − b|2 + |f (x$ ) − b|2 ≤
!
!
+ = !.
2 2
Par contraposition, nous obtenons immédiatement le
48
CHAPITRE 2. LIMITES ET CONTINUITÉ
Corollaire. Soit f une fonction de Rn dans Rp et a ∈ Rn tels que a ∈
adh dom f. Si la condition de Cauchy (2.3) n’est pas satisfaite, c’est-à-dire
si sa négation
(∃! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ)(∃x$ ∈ dom f : |x$ − a|2 ≤ δ) :
|f (x) − f (x$ )|2 > !,
(2.4)
est vérifiée, alors la limite de f (x) pour x tendant vers a n’existe pas.
On notera que, dans la condition (2.4), il suffit de trouver un ! > 0 tel
que (2.4) soit satisfaite pour tout δ ∈ ]0, δ ∗ [ pour un δ ∗ fixé a priori, puisque,
si x et x$ conviennent dans (2.4) pour un δ > 0, ils conviennent pour tous les
δ supérieurs. On obtient évidemment une condition nécessaire de Cauchy
pour la limite de f (x) lorsque x tend vers a dans E en appliquant le résultat
précédent à f |E .
Exemples. 1. Nous avons vu précédemment que
lim
x→0, x>0
Montrons que
lim
x→0
x
= 1.
|x|
x
|x|
n’existe pas, ce qui justifiera le fait mentionné plus haut que, lorsque E ∩
dom f ! dom f , l’existence de la limite de f (x) lorsque x tend vers a dans
E n’entraı̂ne pas nécessairement celle de la limite de f (x) lorsque x tend
vers a . Pour vérifier (2.4), il faut donc trouver des réels x et des réels
x$ arbitrairement proches de 0 tels que |f (x) − f (x$ )| reste supérieur à un
x
nombre positif fixe. Comme f (x) = −x
= −1 si x < 0 et f (x) = xx = 1 si
x > 0, on voit que, pour tout x > 0 et tout x$ < 0, on aura
|f (x) − f (x$ )| = |1 − (−1)| = 2,
et la condition (2.4) est vérifiée pour ! = 1 en prenant, pour chaque δ > 0,
x = δ et x$ = −δ.
2. Si f est la fonction de R dans R définie par f (x) = 0 si x /= 0 et f (0) = 1,
alors limx→0 f (x) n’existe pas. En effet, pour chaque δ > 0 fixé, en prenant
x = δ et x$ = 0 (qui sont bien tels que |x| ≤ δ et |x$ | ≤ δ), on trouve
|f (x) − f (x$ )| = |0 − 1| = 1, et la condition (2.4) est vérifiée avec ! = 12 .
2.3. CONDITIONS NÉCESSAIRES D’EXISTENCE DE LA LIMITE
49
Ce dernier exemple nous conduit à une remarque terminologique importante. Certains auteurs définissent le concept de limite
f (x) → b si x → a
par les conditions
1’) a ∈ adh (dom f \ {a})
et
2’) (∀! > 0)(∃δ > 0)(∀x ∈ dom f \ {a} : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !,
et ils écrivent dans ce cas b = limx→a f (x). Cette définition, dans les notations que nous avons adoptées ici, n’est pas équivalente à notre définition
de b = limx→a f (x), mais au choix de E = dom f \ {a} dans la définition
générale, c’est-à-dire à b = limx→a, x(=a f (x). Pour éviter des contradictions
apparentes dans l’énoncé de certains résultats dans différentes ouvrages d’analyse, il convient donc d’être attentif à la définition de limite choisie par
l’auteur.
Une autre condition nécessaire d’existence de la limite est fondée sur
l’utile notion de fonction localement bornée.
Définition. Soit f une fonction de Rn dans Rp et a ∈ Rn . On dit que f est
localement bornée en a si la condition suivante est vérifiée :
(∃r > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 ≤ r.
(2.5)
En d’autres termes, f est localement bornée en a s’il existe une boule
B2 [a; δ] dans Rn centrée en a et une boule B2 [r] dans Rp centrée en 0 telles
que f ([B2 [a; δ]) ⊂ B2 [r].
x
Ainsi, la fonction réelle d’une variable réelle f définie par f (x) = |x|
, qui,
en vertu de l’exemple 1 ci-dessus, n’a
pas
de
limite
pour
x
tendant
vers
0,
# #
#x#
∗
est localement bornée en 0. En effet, # |x|
≤
1
pour
tout
x
∈
R
.
De
même,
la
#
x
fonction réelle d’une variable réelle f définie par f (x) = |x|
+x est localement
bornée en 0 puisque, pour tout x ∈ [−1, 1] \ {0}, on a |f (x)| ≤ 2.
L’existence d’une limite en un point entraı̂ne que la condition de borne
locale est satisfaite en ce point. C’est une conséquence de la Proposition
suivante, montrant que le caractère localement borné de f en a est une
condition nécessaire pour que f vérifie la condition de Cauchy en a.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ Rn . Si f vérifie la
condition de Cauchy (2.3), alors f est localement bornée en a.
Démonstration. En prenant ! = 1 dans la condition (2.3), on voit qu’il
existe δ > 0 tel que, pour tout x ∈ dom f tel que |x − a|2 ≤ δ, et pour
50
CHAPITRE 2. LIMITES ET CONTINUITÉ
tout x$ ∈ dom f tel que |x$ − a|2 ≤ δ, on a |f (x) − f (x$ )|2 ≤ 1. Dès lors, si
l’on fixe un x$ ∈ dom f ∩ B2 [a; δ], on trouve, pour tout x ∈ dom f tel que
|x − a|2 ≤ δ,
|f (x)|2 = |f (x) − f (x$ ) + f (x$ )|2 ≤ |f (x) − f (x$ )|2 + |f (x$ )|2 ≤ 1 + |f (x$ )|2 ,
ce qui montre que la condition (2.5) est vérifiée pour ce δ et r = 1 + |f (x$)|2 .
La contraposée de cette proposition et le Corollaire précédent fournissent
immédiatement une condition suffisante de non-existence de la limite.
Corollaire. Soit f une fonction de Rn dans Rp et a ∈ Rn tels que a ∈
adh dom f. Si f n’est pas localement bornée en a (c’est-à-dire si la condition
suivante est vérifiée
(∀r > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 > r),
alors la limite de f (x) pour x tendant vers a n’existe pas.
En appliquant les résultats précédents à f |E , on voit qu’une condition
nécessaire pour que f vérifie la condition de Cauchy lorsque x tend vers a
dans E est que f |E soit localement bornée en a.
1
Exemple. Utilisons ce corollaire pour montrer que la limite de x1 − x+x
2
lorsque x tend vers −1 n’existe pas. C’est la première fonction introduite
pour motiver l’introduction de la notion de limite, mais considérée cette
fois au deuxième point −1 du complémentaire de son domaine. Pour tout
x ∈ dom f , on a
#
#
# x + x2 − x #
1
#
#
|f (x)| = #
.
#=
# x(x + x2 ) #
|1 + x|
1
Dès lors, si r > 0 et δ > 0 sont donnés et si l’on prend x = −1+min{δ, 2r
}, on
1
1
voit que x−(−1) = x+1 = min{δ, 2r } > 0, donc |x+1| = x+1 = min{δ, 2r
},
1
ce qui entraı̂ne aussitôt que |x + 1| ≤ δ et |f (x)| = |1+x| ≥ 2r > r.
2.4
Règles de calcul des limites
Le recours systématique à la définition pour vérifier l’existence d’une limite
est long et fastidieux. Il est donc important de voir comment la notion
de limite se comporte vis-à-vis des opérations algébriques et ensemblistes
que l’on peut effectuer sur des fonctions, afin de déduire automatiquement
l’existence et la valeur de la limite de fonctions compliquées lorsqu’on connaı̂t
51
2.4. RÈGLES DE CALCUL DES LIMITES
celle de fonctions plus simples qui les composent. C’est l’objet des règles de
calcul des limites. La première exprime essentiellement que la limite d’une
somme est égale à la somme des limites. Rappelons que si f et g sont deux
fonctions de Rn dans Rp , la somme f + g de f et g est la fonction de Rn
dans Rp de domaine dom (f + g) = dom f ∩ dom g telle que, pour tout
x ∈ dom (f + g), on a (f + g)(x) = f (x) + g(x).
Proposition. Soient f et g deux fonctions de Rn dans Rp , a ∈ Rn , b ∈ Rp
et c ∈ Rp tels que a ∈ adh (dom f ∩ dom g). Si
lim f (x) = b et lim g(x) = c,
x→a
x→a
alors
lim (f + g)(x) = b + c.
x→a
Démonstration. Notons tout d’abord que, pour tout x ∈ dom (f + g),
on a
|(f + g)(x) − (b + c)|2 = |f (x) − b + g(x) − c|2 ≤ |f (x) − b|2 + |g(x) − c|2 .
Si ! > 0 est donné, alors, par hypothèse,
(∃δ $ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $ ) : |f (x) − b|2 ≤
!
,
2
!
.
2
Dès lors, si l’on pose δ = min{δ $ , δ $$ }, on aura, pour tout x ∈ dom f ∩dom g :
|x − a|2 ≤ δ,
!
!
|(f + g)(x) − (b + c)|2 ≤ + = !.
2 2
(∃δ $$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$ ) : |g(x) − c|2 ≤
Un raisonnement semblable, dont les détails sont laissés au lecteur, démontre le résultat suivant.
Proposition. Si f et g sont des fonctions de Rn dans Rp localement bornées
en a ∈ Rn , alors f + g est localement bornée en a.
Le deuxième résultat affirme essentiellement que la limite d’un produit
de deux fonctions est égale au produit des limites. Encore faut-il que ce
produit soit bien défini, ce qui impose des restrictions aux espaces d’arrivée.
Rappelons que si f est une fonction de Rn dans Rp (resp. C) et g une
fonction de Rn dans R (resp. C), le produit gf de g par f est la fonction de
52
CHAPITRE 2. LIMITES ET CONTINUITÉ
Rn dans Rp (resp. C) de domaine dom gf = dom f ∩ dom g telle que, pour
chaque x ∈ dom gf , on a (gf )(x) = g(x).f (x), g(x).f (x) désignant selon
le cas le produit de f (x) ∈ Rp par le réel g(x) ou le produit des nombres
complexes g(x) et f (x).
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), a ∈ Rn , b ∈ Rp (resp. C) et c ∈ R (resp. C) tels
que a ∈ adh (dom f ∩ dom g). Si
lim f (x) = b et lim g(x) = c,
x→a
x→a
alors
lim (gf )(x) = cb.
x→a
Démonstration. Notons tout d’abord que, pour tout x ∈ dom f ∩ dom g,
on a
|(gf )(x) − cb|2 = |g(x)f (x) − g(x)b + g(x)b − cb|2
≤ |g(x)||f (x) − b|2 + |b|2|g(x) − c|.
D’autre part, l’existence de la limite de g lorsque x tend vers a entraı̂ne que
g est localement bornée en a, c’est-à-dire l’existence de r > 0 et δ $ > 0 tels
que
(∀x ∈ dom g : |x − a|2 ≤ δ $ ) : |g(x)| ≤ r.
Si ! > 0 est donné, alors, par hypothèse,
(∃δ $$ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $$ ) : |f (x) − b|2 ≤
(∃δ $$$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$$) : |g(x) − c| ≤
!
,
2r
!
.
2(1 + |b|2 )
Si l’on pose δ = min{δ $ , δ $$ , δ $$$}, on voit, en rassemblant les résultats ci-dessus
que, pour chaque x ∈ dom f ∩ dom g tel que |x − a|2 ≤ δ), on a
|(gf )(x) − cb|2 ≤ r.
!
!
+ |b|2.
≤ !.
2r
2(1 + |b|2)
Un raisonnement semblable, dont les détails sont laissés au lecteur, démontre le résultat suivant
53
2.4. RÈGLES DE CALCUL DES LIMITES
Proposition. Si g est une fonction de Rn dans R (resp. C) localement
bornée en a et f une fonction de Rn dans Rp (resp. C) localement bornée
en a, alors gf est localement bornée en a.
On peut obtenir une variante utile des deux propositions précédentes
dans laquelle l’hypothèse sur l’une des deux fonctions est renforcée et celle
sur l’autre affaiblie. Essentiellement, le résultat affirme que la limite du
produit d’une fonction ayant une limite nulle par une fonction localement
bornée est égale à zéro.
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C) et a ∈ adh (dom f ∩ dom g). Si limx→a f (x) = 0 et
si g est localement bornée en a, alors
lim (gf )(x) = 0.
x→a
Démonstration. Par hypothèse, il existe r > 0 et δ $ > 0 tels que, pour
tout x ∈ dom g tel que |x − a|2 ≤ δ $ , on a
Si ! > 0 est donné, alors
|g(x)| ≤ r.
!
(∃δ $$ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ $$ ) : |f (x)|2 ≤ .
r
Dès lors, en posant δ = min{δ $ , δ $$} et en rassemblant les résultats qui
précèdent, on aura
!
(∀x ∈ dom f ∩ dom g : |x − a|2 ≤ δ) : |(gf )(x)|2 = |g(x)||f (x)|2 ≤ r. = !.
r
On a évidemment un résultat semblable, avec la même démonstration, si
f est localement bornée en a et limx→a g(x) = 0.
Le résultat suivant affirme que la limite d’un quotient de deux fonctions est égale au quotient des limites lorsque la limite du dénominateur est
différente de zéro. Rappelons que si f est une fonction de Rn dans Rp (resp.
C) et g une fonction de Rn dans R (resp. C), le quotient fg de f par g est la
fonction de Rn dans Rp (resp. C) de domaine dom
f
g
= {x ∈ dom f ∩dom g :
(x)
(x)
g(x) /= 0} telle que, pour chaque x ∈ dom
on a ( fg )(x) = fg(x)
, où fg(x)
1
désigne selon le cas le produit de f (x) ∈ R par le réel g(x)
ou le produit
1
des nombres complexes f (x) et g(x) . Bien entendu, si 1 désigne l’application
f
g,
p
constante de R dans R partout égale à 1, on a
f
g
= 1g .f.
54
CHAPITRE 2. LIMITES ET CONTINUITÉ
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), a ∈ Rn , b ∈ Rp (resp. C) et c ∈ R (resp. C) tels
que a ∈ adh (dom f ∩ dom g). Si
lim f (x) = b et lim g(x) = c,
x→a
avec c /= 0, alors
x→a
f
b
(x) = .
x→a g
c
lim
Démonstration. En vertu de l’égalité fg = 1g .f. et du résultat sur le
produit des limites, il suffit de démontrer que, avec les hypothèses faites sur
g, on a
1
1
lim (x) = .
x→a g
c
Notons que dom 1g = {x ∈ dom g : g(x) /= 0}, et montrons tout d’abord que
a ∈ adh dom 1g . En prenant ! = |c|/2, l’hypothèse et une inégalité classique
entraı̂nent l’existence d’un δ $ > 0 tel que, pour tout x ∈ dom g vérifiant
|x − a|2 ≤ δ $ , on ait
||g(x)| − |c|| ≤ |g(x) − c| ≤
|c|
,
2
et dès lors, pour les mêmes valeurs de x,
|g(x)| ≥
|c|
.
2
En conséquence, dom 1g ⊃ dom g ∩ B2 [a; δ $], ce qui entraı̂ne aussitôt que
dom 1g ∩ B2 [a; r] /= ∅ pour tout r > 0. Pour tout x ∈ dom 1g , on a
#
# #
#
#1
# #
#
# (x) − 1 # = # 1 − 1 # = |c − g(x)| .
#g
c # # g(x) c #
|c||g(x)|
Soit maintenant ! > 0; par hypothèse,
(∃δ $$ > 0)(∀x ∈ dom g : |x − a|2 ≤ δ $$ ) : |g(x) − c| ≤
!|c|2
.
2
Dès lors, en posant δ = min{δ $ , δ $$ }, on aura, en rassemblant les résultats
qui précèdent, pour chaque x ∈ dom 1g tel que |x − a|2 ≤ δ,
#
#
2
#1
#
# (x) − 1 # ≤ !|c| . 1 . 2 = !.
#g
#
c
2 |c| |c|
2.4. RÈGLES DE CALCUL DES LIMITES
55
Remarque. Le lecteur trouvera facilement des exemples montrant qu’on ne
peut tirer aucune conclusion générale sur la valeur de la limite d’un quotient
lorsque le dénominateur a une limite nulle. Nous analyserons plus tard
quelques situations particulières.
En appliquant les résultats qui précèdent à f |E et g|E , on obtient immédiatement les règles de calcul pour la limite lorsque x tend vers a dans E des
sommes, produits et quotients de fonctions.
Le résultat qui suit donne des conditions sous lesquelles la limite du
composé de deux fonctions existe.
Proposition. Soit f une fonction de Rn dans Rp, g une fonction de Rp dans
Rq , a ∈ Rn , b ∈ Rp et c ∈ Rq tels que a ∈ adh dom (g ◦ f ) et b ∈ adh dom g.
Si
lim f (x) = b et lim g(y) = c,
x→a
y→b
alors
lim (g ◦ f )(x) = c.
x→a
Démonstration. Soit ! > 0; par hypothèse,
(∃η > 0)(∀y ∈ dom g : |y − b|2 ≤ η) : |g(y) − c|2 ≤ !,
et, pour cet η > 0,
(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ η.
Dès lors, pour tout x ∈ dom (g◦f ) tel que |x−a|2 ≤ δ, on aura f (x) ∈ dom g
et |f (x) − b|2 ≤ η, et dès lors
|(g ◦ f )(x) − c|2 = |g(f (x)) − c|2 ≤ !.
Remarques. 1. En appliquant le résultat précédent à f |E , on obtient un
théorème sur la limite, lorsque x tend vers a dans E, du composé g ◦ f .
2. On peut démontrer que la proposition cesse d’être vraie si l’on remplace
l’hypothèse
lim g(y) = c
y→b
par
lim
y→b, y(=b
g(y) = c.
56
CHAPITRE 2. LIMITES ET CONTINUITÉ
Dans ce dernier cas, la limite de g ◦ f lorsque x tend vers a peut cesser
d’exister, être égale à g(b) ou être égale à c.
Donnons quelques conséquences du théorème sur la limite des fonctions
composées. Pour i = 1, 2 ou ∞, désignons par |f |i la fonction de Rn dans
Rp de domaine égal à dom f définie pour chaque x ∈ dom f par |f |i(x) =
|f (x)|i.
Corollaire. Soit f une fonction de Rn dans Rp, a ∈ Rn et b ∈ Rp tels que
limx→a f (x) = b. Alors, pour i = 1, 2 ou ∞, on a
lim |f |i(x) = |b|i.
x→a
Démonstration. Soit i = 1, 2 ou ∞; si g désigne l’application de Rp dans
R définie par g(y) = |y|i, on a évidemment |f |i = g ◦f et dom g ◦f = dom f .
D’ailleurs, pour chaque y ∈ Rp et chaque z ∈ Rp , on a la relation
||y|i − |z|i| ≤ |y − z|i ,
qui se démontre exactement comme l’inégalité correspondante pour la valeur
absolue et entraı̂ne aussitôt que, pour chaque z ∈ Rp , on a
lim g(y) = g(z).
y→z
La thèse résulte alors du théorème sur la limite d’une fonction composée.
La réciproque de ce résultat est fausse : limx→a |f |i(x) peut exister sans
x
que limx→a f (x) n’existe (penser à f (x) = |x|
avec a = 0). Toutefois, la
réciproque est vraie dans le cas d’une limite nulle.
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp tels que,
pour i = 1, 2 ou ∞, on ait
lim |f |i(x) = 0.
x→a
Alors, limx→a f (x) = 0.
Démonstration. C’est une conséquence immédiate de la définition et du
fait que, pour chaque x ∈ dom f , on a
||f |i(x)| = |f (x)|i ≤ n|f (x)|2 .
57
2.4. RÈGLES DE CALCUL DES LIMITES
Une autre conséquence montre l’équivalence entre l’existence de la limite
des valeurs d’une fonction et de la limite des valeurs de chaque composante
de la fonction.
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp . Alors,
limx→a f (x) = b si et seulement si, pour chaque 1 ≤ j ≤ p, on a
lim fj (x) = bj .
x→a
Démonstration. Pour chaque 1 ≤ j ≤ p, on a fj = pj ◦ f si pj désigne
l’application projection sur la j e composante de Rp dans R; en particulier,
dom fj = dom f.
Condition nécessaire. Pour chaque y ∈ Rp et chaque z ∈ Rp , on a
|pj (y) − pj (z)| = |yj − zj | ≤ |y − z|2 ,
on en déduit immédiatement que, pour chaque z ∈ Rp , on a limy→z pj (y) =
pj (z), et le résultat découle du théorème sur la limite d’une fonction composée.
Condition suffisante. Soit ! et 1 ≤ j ≤ p; par hypothèse
(∃δj > 0)(∀x ∈ dom fj : |x − a|2 ≤ δj ) : |fj (x) − bj | ≤
!
p1/2
.
Dès lors, si l’on pose δ = min{δ1 , . . . , δp}, on voit que, pour chaque x ∈
dom f tel que |x − a|2 ≤ δ, on a

|f (x) − b|2 = 
p
$
j=1
1/2
|fj (x) − bj |2 

≤
p
$
!2
j=1
p
1/2

= !.
Ce résultat montre que l’étude de la limite des valeurs d’une fonction
de Rn dans Rp peut se ramener à l’étude de la limite des valeurs des p
fonctions composantes, qui sont chacune à valeurs réelles. Par contre, l’étude
de la limite des valeurs d’une fonction de Rn dans Rp ne peut pas se faire
“composante par composante” dans l’espace de départ Rn de la fonction, ainsi
que le montre l’exemple suivant.
x2
Exemple. La fonction f de R2 dans R définie par f (x1 , x2 ) = xx21+x
2 a pour
1
2
domaine R2 \ {0}. Si x1 = 0, alors, pour tout x2 /= 0, on a f (0, x2 ) = 0 et
dès lors
lim f (0, x2 ) = 0.
x2 →0
58
CHAPITRE 2. LIMITES ET CONTINUITÉ
x2
Si x1 /= 0 est fixé, la fonction réelle d’une variable réelle f (x1 , ·) : x2 2→ xx21+x
2
1
2
est définie pour chaque x2 ∈ R, et il est facile de montrer, en utilisant par
exemple le théorème sur la limite d’un quotient de fonctions, que, pour
chaque x1 /= 0 fixé,
lim f (x1 , x2 ) = 0.
x2 →0
Ces résultats entraı̂nent aussitôt que
lim
2
lim f (x1 , x2 ) = 0.
2
lim f (x1 , x2 ) = 0.
x1 →0 x2 →0
3
Comme f est symétrique par rapport à x1 et x2 , on a évidemment aussi
lim
x2 →0 x1 →0
3
Il ne faut pourtant pas en déduire que limx→0 f (x1 , x2 ) = 0, car cette limite
n’existe pas ! En effet, pour chaque point de la forme (x1 , x1 ) avec x1 /=
x2
0, on a f (x1 , x1 ) = 2x12 = 12 et l’on en déduit aussitôt que, pour chaque
1
δ
δ
δ > 0, si l’on choisit x = (δ, 0) et x$ = ( 21/2
, 21/2
), on a |x|2 = |x$ |2 = δ et
|f (x) − f (x$ )| = 12 , ce qui montre que la négation de la condition nécessaire
de Cauchy est satisfaite avec ! = 14 .
Montrons enfin que la limite respecte les inégalités non strictes entre
fonctions à valeurs réelles.
Proposition. Soient f et g des fonctions de Rn dans R, a ∈ Rn , b ∈ R et
c ∈ R. Si,
lim
f (x) = b et
lim
g(x) = c,
x→a, x∈dom g
x→a, x∈dom f
et si, pour tout x ∈ dom f ∩ dom g, on a f (x) ≤ g(x), alors b ≤ c.
Démonstration. On sait qu’il est équivalent de démontrer que, pour
chaque ! > 0, on a b ≤ c + !. Soit donc ! > 0; par hypothèse,
!
!
(∃δ $ > 0)(∀x ∈ dom f ∩ dom g : |x − a|2 ≤ δ $ ) : − ≤ f (x) − b ≤ ,
2
2
et
!
!
(∃δ $$ > 0)(∀x ∈ dom g ∩ dom f : |x − a|2 ≤ δ $$ ) : − ≤ g(x) − c ≤ .
2
2
Dès lors, si δ = min{δ $ , δ $$ } et si x ∈ dom f ∩ dom g est tel que |x − a|2 ≤ δ,
on aura
!
!
!
!
b ≤ f (x) + ≤ g(x) + ≤ c + + = c + !.
2
2
2 2
2.5. FORMULATIONS ÉQUIVALENTES ET CARACTÈRE LOCAL 59
L’exemple de la fonction réelle d’une variable réelle f définie par f (x) =
qui est strictement positive sur son domaine R \ {0} et a pour limite 0
lorsque x tend vers zéro montre qu’une inégalité stricte n’est pas nécessairement conservée à la limite; seule l’inégalité non stricte correspondante est
satisfaite, en vertu de la proposition que nous venons de démontrer.
En considérant f |E et g|E , on voit immédiatement que tous ces résultats
restent valables pour les limites lorsque x tend vers a dans E.
x2
|x|
2.5
Formulations équivalentes et caractère local
On va montrer que la notion de limite des valeurs de f lorsque x tend vers
a peut s’exprimer en termes de voisinages.
Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp.
Proposition. limx→a f (x) = b si et seulement si
1) a ∈ adh dom f ;
2’) (∀V : V est voisinage de b)(∃U : U est voisinage de a) : f (U ) ⊂ V.
Démonstration. Condition nécessaire. Il faut montrer que la condition 2
de la définition de limite entraı̂ne la condition 2’. Soit V un voisinage de b;
il existe donc ! > 0 tel que B2 [b; !] ⊂ V. Pour cet ! > 0, la condition 2 dans
la définition de la limite entraı̂ne l’existence d’un δ > 0 tel que, pour tout
x ∈ dom f ∩ B2 [a; δ], on ait f (x) ∈ B2 [b; !]. En d’autres termes, le voisinage
U = B2 [a; δ] est tel que f (U ) ⊂ B2 [b; !] ⊂ V.
Condition suffisante. Il faut montrer que si 2’ est satisfaite, il en est de
même de la condition 2 de la définition de la limite. Soit donc ! > 0; comme
V = B2 [b; !] est un voisinage de b, il existera par (2’) un voisinage U de a
tel que
f (U ) ⊂ V = B2 [b; !],
c’est-à-dire tel que, pour tout x ∈ dom f ∩ U , on ait |f (x) − b|2 ≤ !. D’autre
part, U étant un voisinage de a, il existe un δ > 0 tel que B2 [a; δ] ⊂ U, et on
aura donc aussi |f (x) − b|2 ≤ ! pour tout x ∈ dom f tel que |x − a|2 ≤ δ.
Rappelons que n’importe quelle boule Bi [a; r] est voisinage de a ∈ Rn ,
n’importe quelle boule Bi [b; r] est voisinage de b ∈ Rp (i = 1, 2, ∞) et que
tout voisinage d’un point contient une boule en chacune des normes centrée
en ce point. Une conséquence de ce fait et de la proposition précédente
est évidemment que, dans la condition 2 de définition de la limite, on peut
remplacer |x − a|2 par |x − a|i et |f (x) − b|2 par |f (x) − b|j pour n’importe
quel choix de i, j = 1, 2 ou ∞.
60
CHAPITRE 2. LIMITES ET CONTINUITÉ
Comme la notion de voisinage est liée à celle de point intérieur et que
cette notion peut s’exprimer en fonction de la notion de point adhérent, on
peut s’attendre à ce qu’il existe une formulation de la notion de limite en
termes de points adhérents. C’est bien le cas et l’on a la caractérisation
suivante, que nous n’utiliserons pas dans la suite et dont nous laissons la
démonstration au lecteur, en lui suggérant de démontrer la condition suffisante par contraposition.
Proposition. limx→a f (x) = b si et seulement si
1) a ∈ adh dom f ;
2”) (∀A ⊂ Rn : a ∈ adh (dom f ∩ A)) : b ∈ adh f (A).
On obtient évidemment des caractérisations analogues pour la limite de
f (x) lorsque x tend vers a dans E en appliquant les résultats précédents à
f |E .
Etudions maintenant l’influence du choix de l’ensemble de contraintes E
sur l’existence de la limite. Soit f une fonction de Rn dans Rp, a ∈ Rn ,
b ∈ Rp et E ⊂ Rn .
Le premier résultat montre que l’existence de la limite se maintient si l’on
diminue E en respectant évidemment la première condition de la définition.
Proposition. Si F ⊂ E et si a ∈ adh (dom f ∩ F ) et limx→a, x∈E f (x) = b,
alors, limx→a, x∈F f (x) = b.
Démonstration. C’est une conséquence immédiate de la définition.
Un exemple antérieur a montré qu’on pouvait par contre perdre l’existence de la limite en agrandissant l’ensemble des contraintes E. On a toutefois
l’importante propriété suivante, qui montre le caractère local de la notion de
limite, en ce sens que l’existence et la valeur de la limite ne dépendent que
des valeurs de la fonction dans un voisinage arbitrairement petit du point
considéré.
Proposition. Soit W un voisinage de a. Alors
lim
x→a, x∈E
f (x) = b ⇔
lim
x→a, x∈E∩W
f (x) = b.
Démonstration. Condition nécessaire. Puisque E ∩ W ⊂ E, il suffit, pour pouvoir appliquer la proposition précédente, de montrer que a ∈
adh (dom f ∩ E ∩ W ). Pour ce faire, soit r > 0; puisque W et B2 [a; r] sont
voisinages de a, il en est de même de W ∩ B2 [a; r], et il existe donc r $ ∈ ]0, r]
tel que B2 [a; r $] ⊂ W ∩ B2 [a; r]; d’autre part, puisque a ∈ adh (dom f ∩ E),
on a dom f ∩ E ∩ B2 [a; r $] /= ∅ et dès lors dom f ∩ E ∩ W ∩ B2 [a; r] /= ∅.
2.5. FORMULATIONS ÉQUIVALENTES ET CARACTÈRE LOCAL 61
Condition suffisante. Bien entendu, l’hypothèse a ∈ adh (dom f ∩ E ∩ W )
entraı̂ne a ∈ adh (dom f ∩ E). Il suffit donc maintenant de démontrer la
condition 2’ de la caractérisation de la limite par les voisinages. Soit V
un voisinage de b; par hypothèse, il existe un voisinage U $ de a tel que
f (U $ ∩ E ∩ W ) ⊂ V et, comme U $ ∩ W est un voisinage de a, il existe donc
un voisinage U = U $ ∩ W de a tel que f (U ∩ E) ⊂ V .
Pour une fonction f d’une variable réelle, les choix particuliers suivants
pour E donnent lieu à une terminologie et à des notations particulières. Si
f est une fonction de R dans Rp , a ∈ R et si E = {x ∈ R : x < a}, alors,
lorsque b = limx→a, x∈E f (x), on dira que b est la limite à gauche de f (x)
lorsque x tend vers a, et l’on écrira
b=
lim
x→a, x<a
f (x) ou b = lim f (x).
x→a−
D’une manière similaire, si E = {x ∈ R : x > a}, et b = limx→a, x∈E f (x), on
dira que b est la limite à droite de f (x) lorsque x tend vers a, et l’on écrira
b=
lim
x→a, x>a
f (x) ou b = lim f (x).
x→a+
La propriété d’existence de la limite lorsqu’on diminue l’ensemble des
contraintes entraı̂ne aussitôt la proposition suivante.
Proposition. Soit f une fonction de R dans Rp et a ∈ R. Si
a ∈ adh (dom f ∩ {x ∈ R : x < a}) ∩ adh (dom f ∩ {x ∈ R : x > a}),
et si limx→a, x(=a f (x) = b, alors
lim f (x) = lim f (x) = b.
x→a−
x→a+
La réciproque est vraie dans le sens suivant.
Proposition. Soit f une fonction de R dans Rp et a ∈ R. Si
lim f (x) = lim f (x) = b,
x→a−
x→a+
alors limx→a, x(=a f (x) = b.
Démonstration. Comme, par hypothèse, on a
a ∈ adh (dom f ∩ {x ∈ R : x < a}) ∩ adh (dom f ∩ {x ∈ R : x > a}),
62
CHAPITRE 2. LIMITES ET CONTINUITÉ
on a évidemment que a ∈ adh [dom f ∩ (R \ {a})]. Soit ! > 0; par hypothèse,
(∃δ $ > 0)(∀x ∈ dom f : a − δ $ ≤ x < a) : |f (x) − b|2 ≤ !,
et
(∃δ $$ > 0)(∀x ∈ dom f : a < x ≤ a + δ $$ ) : |f (x) − b|2 ≤ !.
Dès lors, si δ = min{δ $ , δ $$}, et si x ∈ dom f \ {a} est tel que |x − a| ≤ δ, on
aura |f (x) − b|2 ≤ !.
2.6
Limites à l’infini et convergence des suites
Introduisons d’abord la notion de partie bornée de Rn .
Définition. On dit qu’une partie A de Rn est bornée s’il existe un r > 0
tel que A ⊂ B2 [r].
On montre sans peine que A est bornée si et seulement s’il existe un
r > 0 tel que A ⊂ Bi [r] pour i = 1, 2 ou ∞. L’ensemble vide est borné et
toute boule est bornée. En outre, il est évident que si A est bornée et si
B ⊂ A, alors B est bornée. La définition entraı̂ne aussi que A ⊂ Rn est non
bornée si et seulement si, pour tout r > 0, on a A /⊂ B2 [r], ou encore si et
seulement si,
(∀r > 0)(∃x ∈ A) : |x|2 > r.
En particulier, le théorème d’Archimède entraı̂ne que N∗ est non borné
puisque, si r > 0 est donné, il existe un m ∈ N∗ tel que m = m.1 ≥ r + 1, et
dès lors ce m /∈ B[r] = [−r, r]. D’autre part, si A est non borné et B ⊃ A,
B est non borné (par contraposition du résultat ci-dessus), et l’on en déduit
que Rn est une partie non bornée de Rn et que R, Q, Z et N sont des parties
non bornées de R.
L’exemple de la fonction f de Rn dans R définie par f (x) = |x|1 2 pour
chaque x /= 0 montre que la propriété “prendre la valeur zéro” est vérifiée
“approximativement” au sens donné dans l’introduction de la notion de limite non pas pour des valeurs suffisamment proches d’un point a de Rn mais
pour les points de Rn de norme suffisamment grande. En effet, si ! > 0 est
donné, on aura |f (x)| = |x|1 2 ≤ ! dès que |x|2 ≥ 1! . On est ainsi conduit à la
définition suivante de limite à l’infini pour une fonction.
Définition. Soit f une fonction de Rn dans Rp et b ∈ Rp. On dit que f (x)
tend vers b lorsque x tend vers l’infini, et l’on écrit
f (x) → b si x → ∞,
2.6. LIMITES À L’INFINI ET CONVERGENCE DES SUITES
63
si les conditions suivantes sont satisfaites :
1) dom f est non borné;
2) (∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !.
Comme dans le cas classique, on démontre qu’il existe au plus un b
vérifiant cette définition (on écrit alors
b = lim f (x))
x→∞
et que la condition de Cauchy
(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ)
(∀x$ ∈ dom f : |x$ |2 ≥ ρ) : |f (x) − f (x$ )|2 ≤ !,
est une condition nécessaire d’existence de la limite de f pour x tendant vers
l’infini. Une condition nécessaire pour la condition de Cauchy soit vérifiée,
et qui se démontre comme dans le cas classique, est que f soit bornée à
l’infini au sens de la définition suivante.
Définition. Soit f une fonction de Rn dans Rp . On dit que f est bornée à
l’infini si dom f est non borné et si la condition suivante est vérifiée:
(∃r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x)|2 ≤ r.
Enfin, les règles de calcul des limites s’étendent aussi, avec des démonstrations analogues, à la limite à l’infini.
Si E est une partie de Rn , alors, en appliquant la définition ci-dessus
à f |E , on obtient immédiatement la notion de limite des valeurs de f (x)
lorsque x tend vers l’infini dans E.
Définition. Soit f une fonction de Rn dans Rp , b ∈ Rp et E ⊂ Rn . On dit
que f (x) tend vers b lorsque x tend vers l’infini dans E, et l’on écrit
f (x) → b si x → ∞ dans E,
si les conditions suivantes sont satisfaites :
1) dom f ∩ E est non borné;
2) (∀! > 0)(∃ρ > 0)(∀x ∈ dom f ∩ E : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !.
Lorsque f est une fonction d’une variable réelle, des choix particuliers
de E bénéficient d’une terminologie et de notations spéciales. Ainsi, lorsque
E = R+ (resp. E = R− ) et que
lim
x→∞, x∈R+
f (x) = b, (resp.
lim
x→∞, x∈R−
f (x) = b),
64
CHAPITRE 2. LIMITES ET CONTINUITÉ
on dit que f (x) tend vers b lorsque x tend vers plus l’infini (resp. moins
l’infini), et l’on écrit
lim f (x) = b, (resp.
x→+∞
lim f (x) = b).
x→−∞
Ces notions correspondent donc respectivement aux conditions
(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : x ≥ ρ) : |f (x) − b|2 ≤ !,
et
(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : x ≤ −ρ) : |f (x) − b|2 ≤ !.
x
Exemple. Soit f l’application de R dans R définie par f (x) = 1+|x|
. Si
x
1
! > 0 est donné, alors, pour x ≥ 0, |f (x) − 1| = | 1+x − 1| = 1+x ≤ ! dès que
x ≥ 1! − 1. On voit donc que limx→+∞ f (x) = 1. On montre de même que
limx→−∞ f (x) = −1. D’autre part, pour chaque ρ > 0, on a
#
#
# ρ
−ρ ##
2ρ
#
|f (ρ) − f (−ρ)| = #
=
−
>1
#
1+ρ 1+ρ
1+ρ
si ρ > 1. On en déduit aisément que la condition nécessaire de Cauchy
d’existence de limx→∞ f (x) n’est pas satisfaite et que cette dernière limite
n’existe pas.
Les notions que nous venons de développer s’appliquent évidemment dans
le cas particulier d’une suite (ak )k∈N dans Rp , c’est-à-dire d’une application
de N (ou de N∗ ) dans Rp. Si b ∈ Rp alors b = limk→∞ ak si et seulement si
(∀! > 0)(∃ρ > 0)(∀k ∈ N : k ≥ ρ) : |ak − b|2 ≤ !.
Etant donné que, pour chaque ρ > 0, le théorème d’Archimède affirme
l’existence d’un entier naturel m ≥ ρ, il est clair que la condition précédente
est équivalente à la condition
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |ak − b|2 ≤ !,
plus couramment utilisée pour caractériser la limite d’une suite. On vérifie
immédiatement à partir de cette définition que, si q ∈ N est fixé, alors
lim ak = b ⇔ lim aq+k = b,
k→∞
k→∞
ce qui traduit simplement le fait qu’on peut ignorer les q premiers termes
d’une suite sans modifier l’existence et la valeur de sa limite. Lorsque la
2.6. LIMITES À L’INFINI ET CONVERGENCE DES SUITES
65
limite de (ak )k∈N existe, on dit aussi que la suite (ak )k∈N converge ou est
une suite convergente; sinon on dit qu’elle diverge ou est une suite divergente.
Les points ak de Rp sont souvent appelés les termes de la suite.
Exemple. La suite ( k1 )k∈N∗ converge vers zéro et la suite ((−1)k )k∈N diverge.
On le vérifiera comme exercice.
La condition nécessaire de Cauchy peut s’écrire, dans le cas d’une suite
(ak )k∈N dans Rp sous la forme équivalence
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |ak − aq |2 ≤ !.
Les règles de calcul des limites s’appliquent évidemment au cas particulier
des suites.
On peut caractériser la notion de point adhérent à une partie de Rn en
termes de la notion de convergence d’une suite.
Proposition. Soit a ∈ Rn et E une partie de Rn . Alors a est adhérent à E
si et seulement s’il existe une suite (xk )k∈N dans E qui converge vers a.
Démonstration. Condition nécessaire. Soit a adhérent à E; alors, pour
1
chaque k ∈ N, on a E ∩ B2 [a; k+1
] /= ∅; on d’autres termes, pour chaque
1
k ∈ N, il existe un xk ∈ E ∩ B2 [a; k+1
], c’est-à-dire un xk ∈ E tel que
1
|xk − a|2 ≤ k+1 . Cette dernière condition entraı̂ne aussitôt que la suite
(xk )k∈N converge vers a.
Condition suffisante. Soit (xk )k∈N une suite dans E qui converge vers a. En
conséquence, si r > 0 est donné,
(∃m ∈ N)(∀k ∈ N : k ≥ m) : |xk − a|2 ≤ r,
et dès lors, xm ∈ E ∩ B2 [a; r]. Donc a ∈ adh E.
On peut également caractériser en termes de suite la notion de limite en
un point des valeurs d’une fonction.
Proposition. Soit f une fonction de Rn dans Rp , a ∈ Rn et b ∈ Rp . Alors,
limx→a f (x) = b si et seulement si les deux conditions suivantes sont satisfaites :
1) a ∈ adh dom f ;
2) toute suite (xk )k∈N dans dom f qui converge vers a, a pour image une
suite (f (xk ))k∈N qui converge vers b.
Démonstration. Condition nécessaire. Soit (xk )k∈N une suite dans
dom f qui converge vers a. Si l’on désigne par h : N → Rn , k 2→ xk ,
l’application correspondante, on voit que, pour chaque k ∈ N, f (xk ) =
66
CHAPITRE 2. LIMITES ET CONTINUITÉ
(f ◦ h)(k), dom (f ◦ h) = N, et il suffit d’appliquer le théorème de la limite
d’une fonction composée.
Condition suffisante. On démontre le contraposé. Si b n’est pas limite de
f (x) lorsque x tend vers a, alors
(∃! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 > !.
1
En choisissant successivement δ = k+1
pour chaque k ∈ N, on trouve ainsi
1
un xk ∈ dom f tel que |xk − a|2 ≤ k+1 et |f (xk ) − b|2 > !. En conséquence,
la suite (xk )k∈N ainsi obtenue est une suite dans dom f qui converge vers a
et est telle que f (xk )k∈N ne converge pas vers b.
La forme contraposée de cette caractérisation de la limite des valeurs
d’une fonction est souvent utile pour montrer que la limite n’est pas égale
à b : il suffira de trouver une suite (xk )k∈N dans dom f qui converge vers
a et soit telle que la suite f (xk )k∈N ne converge pas vers b. On en déduit
également un moyen utile pour prouver la non-existence de la limite : il
suffira de trouver une suite (xk )k∈N dans dom f qui converge vers a et soit
telle que la suite f (xk )k∈N converge vers b$ et une suite (x$k )k∈N dans dom f
qui converge vers a et soit telle que la suite f (x$k )k∈N converge vers b$$ /= b$ .
En appliquant le résultat précédent à f |E , on obtient une caractérisation
en termes de suites de la limite de f (x) lorsque x tend vers a dans E.
2.7
Limites infinies
Soit f une fonction de Rn dans R et a ∈ adh dom f. Nous allons analyser
la situation dans laquelle la limite de f (x) lorsque x tend vers a n’existe
pas parce que |f (x)|2 prend des valeurs arbitrairement grandes lorsque x est
suffisamment proche de a. Par abus de langage, on parle alors d’existence
d’une limite infinie pour f .
Définition. Soit f une fonction de Rn dans Rp et a ∈ Rn . On dit que f (x)
tend vers l’infini lorsque x tend vers a, et l’on écrit
lim f (x) = ∞,
x→a
si les conditions suivantes sont réalisées.
1. a ∈ adh dom f.
2. (∀r > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) : |f (x)|2 ≥ r.
Par exemple, la fonction f : x 2→ |x|−1
2 est telle que limx→0 f (x) = ∞,
puisque, si r > 0 est donné, on a |x|−1
≥
r dès que 0 < |x|2 ≤ r −1 .
2
On a une notion semblable lorsque x tend vers l’infini.
67
2.7. LIMITES INFINIES
Définition. Soit f une fonction de Rn dans Rp . On dit que f (x) tend vers
l’infini lorsque x tend vers l’infini, et l’on écrit
lim f (x) = ∞,
x→∞
si les conditions suivantes sont réalisées.
1. dom f est non borné.
2. (∀r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x)|2 ≥ r.
Par exemple, la fonction identité sur Rn tend vers l’infini lorsque x tend
vers l’infini.
On montre facilement que les définitions ci-dessus ne dépendent pas du
choix de la norme |·|2 et qu’on peut utiliser n’importe quelle autre norme. Si
E est une partie de Rn , on obtient évidemment les situations correspondantes
lorsque x tend vers a dans E ou lorsque x tend vers l’infini dans E en
appliquant les définitions ci-dessus à la restriction f |E de f à E. Cela revient,
dans les définitions ci-dessus, à remplacer partout dom f par dom f ∩ E.
Dans le cas particulier où p = 1, on utilise la structure d’ordre sur R pour
introduire les situations suivantes.
Définition. Soit f une fonction de Rn dans R et a ∈ Rn . On dit que f (x)
tend vers +∞ (resp. −∞) lorsque x tend vers a, et l’on écrit
lim f (x) = +∞ (resp. lim f (x) = −∞),
x→a
x→a
si les conditions suivantes sont vérifiées.
1. a ∈ adh dom f.
2. (∀r > 0)(∃δ > 0)(∀x ∈ dom f : |x−a|2 ≤ δ) : f (x) ≥ r (resp. f (x) ≤ −r).
Définition. Soit f une fonction de Rn dans R. On dit que f (x) tend vers
+∞ (resp. −∞) lorsque x tend vers l’infini, et l’on écrit
lim f (x) = +∞ (resp. lim f (x) = −∞),
x→∞
x→∞
si les conditions suivantes sont vérifiées.
1. dom f est non borné.
2. (∀r > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : f (x) ≥ r (resp. f (x) ≤ −r).
On a bien entendu des définitions analogues pour x tendant vers a ou
vers l’infini dans E ⊂ Rn en appliquant ces définitions à f |E .
Insistons sur le fait que ces définitions couvrent des situations où la limite
n’existe pas. Les conditions nécessaires d’existence de la limite et les règles
68
CHAPITRE 2. LIMITES ET CONTINUITÉ
de calcul des limites n’ont donc aucune raison de s’appliquer, et il est facile
de le montrer par des exemples. D’ailleurs les énoncés correspondants n’ont
eux-mêmes souvent aucun sens. Il convient donc de traiter ces notions avec
prudence en retournant aux définitions.
La notion de limite infinie fournit toutefois des compléments d’information sur les limites de quotients de fonctions dans des situations où les règles
de calcul classiques ne s’appliquent pas. Nous les formulons dans le cas où
x tend vers a. On a des résultats entièrement analogues lorsque x tend vers
l’infini, dont les énoncés et les démonstrations sont laissés au lecteur.
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C) et a ∈ adh (dom f ∩ dom 1/g). Si
lim g(x) = 0
x→a
et s’il existe δ1 > 0 et η1 > 0 tels que |f (x)|2 ≥ η1 pour tout x ∈ dom f ∩
B2 [a; δ1 ], (ce qui est le cas si limx→a f (x) = b /= 0), alors
lim
x→a
f
(x) = ∞.
g
Démonstration. Soit r > 0; et soient δ1 et η1 donnés par les hypothèses.
Puisque g(x) tend vers 0 lorsque x tend vers a, il existera δ2 > 0 tel que,
pour tout x ∈ dom g ∩ B2 [a; δ2 ], on a |g(x)| ≤ ηr1 . Dès lors, si δ = min{δ1 , δ2 }
et si x ∈ dom f ∩ dom 1/g ∩ B2 [a; δ], on aura
#
#
#f
#
# (x)# = |f (x)|2 ≥ η1 r = r.
#g
#
|g(x)|
η1
2
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C) et a ∈ adh dom f ∩ dom g. Si
lim g(x) = ∞
x→a
et si f est localement bornée en a, (ce qui est le cas si limx→a f (x) existe),
alors
f
lim (x) = 0.
x→a g
Démonstration. Notons tout d’abord qu’on montre facilement, comme
dans le cas classique de la limite d’un quotient, que a ∈ adh dom fg , en
2.8. CONTINUITÉ D’UNE FONCTION EN UN POINT
69
montrant que g ne s’annule pas suffisamment près de a. Par l’hypothèse sur
f , il existe δ1 > 0 et r1 > 0 tels que, pour tout x ∈ dom f ∩ B2 [a; δ1 ], on a
|f (x)|2 ≤ r1 . Soit ! > 0; l’hypothèse sur g entraı̂ne l’existence d’un δ2 > 0
tel que, pour tout x ∈ dom g ∩ B2 [a; δ2 ], on a |g(x)| ≥ r!1 . En conséquence,
si δ = min{δ1 , δ2 }, on aura, pour tout x ∈ dom fg tel que |x − a|2 ≤ δ, :
#
#
#f
#
# (x)# = |f (x)|2 ≤ r1 ! = !.
#g
#
|g(x)|
r1
2
La notion de limite infinie fournit également, par une démonstration
entièrement analogue à celle du cas classique, une caractérisation en termes
de suites de l’existence de la limite limite de f (x) lorsque x tend vers l’infini.
Proposition. Soit f une fonction de Rn dans Rp telle que dom f soit non
borné et soit b ∈ Rp . Alors, limx→∞ f (x) = b si et seulement si, pour toute
suite (xk )k∈N dans dom f telle que xk → ∞ si k → ∞, la suite (f (xk ))k∈N
converge vers b.
2.8
Continuité d’une fonction en un point
Soit f une fonction de Rn dans Rp; nous allons maintenant étudier le problème de la limite de ses valeurs en un point a appartenant au domaine de
f . Dans ce cas, l’existence de la limite lorsque x tend vers a se ramène à
la vérification de la deuxième condition. Si cette deuxième condition est
vérifiée, on dira que f est continue en a; si elle ne l’est pas, on dira que f
est discontinue en a. En d’autres termes, on a la définition suivante.
Définition. Soit f une fonction de Rn dans Rp et a ∈ dom f . On dit que
f est continue au point a si limx→a f (x) existe et que f est discontinue au
point a si limx→a f (x) n’existe pas.
Bien entendu, dans l’expression d’existence de la limite, on pourra utiliser
n’importe laquelle des formulations équivalentes.
On a l’utile propriété suivante.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Alors f est
continue en a si et seulement si limx→a f (x) = f (a).
Démonstration. Condition nécessaire. Soit b = limx→a f (x). Par la caractérisation de la limite en termes de suites, si on prend la suite constante
70
CHAPITRE 2. LIMITES ET CONTINUITÉ
(xk )k∈N définie par xk = a pour chaque k ∈ N, on obtient une suite dans
dom f convergeant vers a et dès lors la suite (constante) (f (xk ))k∈N égale
pour tout k ∈ N à f (a) convergera vers b; mais sa limite est évidemment
f (a), ce qui entraı̂ne que f (a) = b.
Condition suffisante. Elle est évidente.
Cette proposition montre qu’en un point de continuité d’une fonction, il
suffit simplement, pour obtenir la limite, de calculer la valeur de la fonction
en ce point. On pourra donc gagner beaucoup de temps, dans le calcul des
limites, en identifiant rapidement les points de continuité d’une fonction.
Il existe une condition sur a et dom f qui assure toujours la continuité
de f en a.
Définition. Si E ⊂ Rn et si a ∈ E, on dit que a est un point isolé de E s’il
existe r > 0 tel que B2 [a; r] ∩ E = {a}.
En d’autres termes, a est isolé dans E si et seulement s’il existe un r > 0
tel que B2 [a; r] ∩ (E \ {a}) = ∅ c’est-à-dire si et seulement si a n’est pas
adhérent à E \ {a}.
Proposition. Si f est une fonction de Rn dans Rp et si a est isolé dans
dom f , alors f est continue en a.
Démonstration. Soit r > 0 tel que B2 [a; r] ∩ dom f = {a}. Si ! > 0 est
donné, alors,
{x ∈ dom f : x ∈ B2 [a; r]} = {a},
et évidemment, |f (a) − f (a)|2 = 0 ≤ !.
Considérons maintenant le cas d’un point non isolé du domaine.
Proposition. Soit f une fonction de Rn dans Rp et a un point non isolé de
dom f . Alors
lim f (x) = f (a) ⇔
x→a
lim
x→a, x(=a
f (x) = f (a).
Démonstration. Condition nécessaire. Elle est évidente puisque, par
hypothèse, a ∈ adh (dom f \ {a}).
Condition suffisante. Soit ! > 0; par hypothèse,
(∃δ > 0)(∀x ∈ dom f \ {a} : |x − a|2 ≤ δ) : |f (x) − f (a)|2 ≤ !.
Comme on a évidemment |f (a)−f (a)|2 = 0 ≤ !, la thèse s’en déduit aussitôt.
2.8. CONTINUITÉ D’UNE FONCTION EN UN POINT
71
Exemples. 1. Toute fonction constante de Rn dans Rp est continue en
chaque point de son domaine et l’application identité I de Rn dans Rn est
continue en chaque point de Rn (vérification immédiate).
2. Si i = 1, 2 ou ∞, l’application | · |i de Rn dans R est continue en chaque
point de Rn ; on effet, si a ∈ Rn on a, pour chaque x ∈ Rn ,
||x|i − |a|i| ≤ |x − a|i ,
et le résultat s’en déduit aussitôt en prenant δ = ! dans la définition.
3. La fonction de Dirichlet est l’application de R dans R définie par d(x) = 1
si x est rationnel et d(x) = 0 si x est irrationnel. Cette fonction n’est continue
en aucun point de R. On le montre en utilisant la condition de non existence
de la limite déduite de la condition nécessaire de Cauchy. Si a ∈ R et si δ > 0
est donné, on a vu que l’intervalle [a−δ, a+δ] contient au moins un rationnel
x et un irrationnel x$ ; on a donc |d(x) − d(x$ )| = 1 et il suffit de prendre
! = 12 dans la négation de la condition de Cauchy.
4. L’application f de R dans R définie par f (x) = x si x est rationnel
et f (x) = −x si x est irrationnel est continue en 0 (le vérifier) mais n’est
continue en aucun autre point de R. En effet, si, pour fixer les idées, a > 0,
alors, pour chaque δ > 0, l’intervalle [a, a + δ] contient un rationnel x et un
irrationnel x$ ; ils sont tels que
|f (x) − f (x$ )| = |x + x$ | = x + x$ ≥ 2a > a,
et la négation de la condition de Cauchy est vérifiée avec ! = a. Le cas où
a < 0 se traite de même et est laissé au lecteur.
5. La fonction racine carrée arithmétique qui à chaque réel positif associe sa
racine carrée arithmétique est continue en chaque point de R+ . En effet, si
√
! > 0 est donné, on a, en a = 0, x ≤ ! pour tout 0 ≤ x ≤ !2 , et, en a > 0,
on a, pour tout x ≥ 0,
#
#
# x−a #
√
√
|x − a|
√ ## ≤ √ ,
| x − a| = ## √
x+ a
a
√
et la dernière expression sera inférieure à ! si |x − a| ≤ a!.
On peut maintenant utiliser les règles de calcul sur les limites pour en
déduire immédiatement des résultats de continuité.
Proposition. 1. Si f et g sont des fonctions de Rn dans Rp continues en
a, alors f + g est continue en a.
2. Si f est une fonction de Rn dans Rp (resp. C) continue en a et g une
72
CHAPITRE 2. LIMITES ET CONTINUITÉ
fonction de Rn dans R (resp. C) continue en a, alors gf est continue en a et
si, en outre, g(a) /= 0, fg est continue en a.
3. Si f est une fonction de Rn dans Rp continue en a et g une fonction de
Rp dans Rq continue en f (a), alors g ◦ f est continue en a.
Démonstration. Les propriétés 1 et 2 sont des conséquences immédiates
des définitions et des propriétés des limites. Pour la propriété 3, il suffit,
pour appliquer le théorème sur les limites, de noter que a ∈ dom (g ◦ f ).
En combinant cette proposition avec les exemples simples d’applications
continues déjà donnés, on voit que les applications polynômiales (et en particulier linéaires) de Rn dans Rp sont continues en chaque point de Rn et
que les fonctions rationnelles de Rn dans Rp (c’est-à-dire les fonctions qui
peuvent s’écrire comme quotient d’un polynôme de Rn dans Rp (resp. C)
par un polynôme de Rn dans R (resp. C)) sont continues en chaque point
de Rn où leur dénominateur est différent de zéro.
2.9
Applications linéaires
Approfondissons les propriétés de continuité des applications linéaires. Rappelons qu’une application linéaire de Rn dans Rp est une application L de
Rn dans Rp telle que :
1. (∀x ∈ Rn )(∀y ∈ Rn ) : L(x + y) = L(x) + L(y).
2. (∀c ∈ R)(∀x ∈ Rn ) : L(cx) = cL(x).
On en déduit aussitôt que, pour tout x ∈ Rn , on a
L(x) = L(
n
$
xj ej ) =
j=1
n
$
L(xj ej ) =
j=1
n
$
xj L(ej ).
(2.6)
j=1
Réciproquement, si c1 , . . . , cn sont des éléments donnés de Rp , l’application
L de Rn dans Rp définie pour chaque x ∈ Rn par
L(x) =
n
$
(2.7)
xj c j ,
j=1
sera telle que, pour tout x ∈ Rn , tout y ∈ Rn et tout c ∈ R, on ait
L(x + y) =
n
$
j=1
(x + y)j cj =
n
$
j=1
(xj + yj )cj =
n
$
j=1
xj c j +
n
$
j=1
yj cj = L(x) + L(y),
73
2.9. APPLICATIONS LINÉAIRES
L(cx) =
n
$
(cx)j cj =
j=1
n
$
n
$
cxj cj = c
j=1
xj cj = cL(x),
j=1
et sera donc linéaire. En conséquence, toute application linéaire de Rn dans
Rp est de la forme (2.7) avec cj = L(ej ), (1 ≤ j ≤ n). Les éléments cj = L(ej )
s’appellent les coefficients de L dans la base canonique. Leurs composantes
Lk (ej ) = pk (L(ej )), (1 ≤ j ≤ n, 1 ≤ k ≤ p) définissent une matrice qui
représente l’application linéaire dans la base canonique. Ainsi, la donnée
d’une application linéaire de Rn dans Rp revient à la donnnée de n éléments
de Rp, c’est-à-dire de np réels. En particulier, la donnée d’une application
linéaire de Rn dans R revient à la donnée de n réels ou encore d’un élément de
Rn et celle d’une application linéaire de R dans Rp revient à la donnée d’un
élément de Rp . On notera aussi que L est l’application nulle si et seulement
si tous les cj sont nuls.
Exemple. Pour chaque 1 ≤ k ≤ n, l’application pk : x 2→ xk (projection sur
la ke composante) est une application linéaire de Rn dans R.
Le résultat suivant est la clef de l’étude des propriétés de continuité d’une
application linéaire.
Proposition. Soit k = 1, 2 ou ∞ et L une application linéaire de Rn dans
Rp . Pour tout x ∈ Rn et (i, j) = (1, ∞), (2, 2) ou (∞, 1), on a
où |L|k,i
|L(x)|k ≤ |L|k,i|x|j ,
#
#
= #(|L(e1 )|k , . . . , |L(en)|k )#i .
Démonstration. On a, pour chaque x ∈ Rn , en utilisant (2.6),
|L(x)|k ≤
et dès lors,

|L(x)|k ≤ 
n
$
j=1
n
$
j=1
|xj L(ej )|k =
n
$
j=1

|L(e )|k  max{|x1 |, . . . , |xn|} = |L|k,1 |x|∞ ,
j
|L(x)|k ≤ max{|L(e1 )|k , . . . , |L(en)|k }
et, en utilisant l’inégalité de Cauchy,

|L(x)|k ≤ 
|xj ||L(ej )|k
n
$
j=1
1/2 
|L(ej )|2k 

n
$
j=1
n
$
j=1
|xj | = |L|k,∞ |x|1 ,
1/2
x2j 
= |L|k,2 |x|2 .
74
CHAPITRE 2. LIMITES ET CONTINUITÉ
Corollaire. Si L est une application linéaire de Rn dans Rp, alors, pour
chaque i = 1, 2 ou ∞ et pour tout x ∈ Rn et tout y ∈ Rn , on a
(2.8)
|L(x) − L(y)|i ≤ |L|i,j |x − y|i ,
et en particulier L est continue en chaque point de Rn et les fonctions x 2→
L(x)
|x|i sont localement bornées en 0.
Démonstration. Le cas de l’application nulle est évident. Sinon, soit
i = 1, 2 ou ∞, x ∈ Rn et y ∈ Rn ; par la proposition précédente et la
linéarité de L, on a
|L(x) − L(y)|i = |L(x − y)|i ≤ |L|i,j |x − y|i ,
et la continuité en y s’en déduit aussitôt en prenant,
#
# dans la définition, si
# L(x) #
!
! > 0 est donné, δ = |L|i,i . Enfin, si x /= 0, on a # |x|i # ≤ |L|i,i, ce qui montre
i
que la fonction x 2→ L(x)
|x|i est localement bornée en 0 (elle l’est évidemment
aux autres points puisqu’elle y est continue).
Terminons par quelques remarques sur les applications linéaires de C
dans C. Rappelons que C peut être considéré comme un espace vectoriel sur
R (c’est alors essentiellement R2 ) et comme un espace vectoriel sur C. Dès
lors, nous dirons qu’une application L de C dans C est R-linéaire (resp. Clinéaire) si elle est linéaire comme application de C dans C où C est considéré
comme espace vectoriel sur R (resp. C.) Ainsi donc, L sera R-linéaire si et
seulement si, pour tout x ∈ C, tout y ∈ C et tout c ∈ R, on a
L(x + y) = L(x) + L(y), L(cx) = cL(x),
et L sera C-linéaire si et seulement si, pour tout x ∈ C, tout y ∈ C et tout
c ∈ C, on a
L(x + y) = L(x) + L(y), L(cx) = cL(x).
Comme R est canoniquement injecté dans C, on en déduit aussitôt que
toute application C-linéaire de C dans C est R-linéaire. La réciproque n’est
pas vraie. En effet, l’application de conjugaison C : C → C, z 2→ z̄ est
évidemment R-linéaire puisque, pour chaque z ∈ C et chaque v ∈ C, on a
C(z + v) = z + v = z̄ + v̄ = C(z) + C(v),
et, pour chaque c ∈ R et chaque z ∈ C, on a
C(cz) = cz = cz̄ = cC(z).
75
2.10. EXERCICES
Mais elle n’est pas C-linéaire puisque
C(i.1) = C(i) = ī = −i /= i.1.
En fait, si L est C-linéaire, alors, pour tout z = x1 + ix2 ∈ C, on a
L(z) = L(z.1) = z.L(1) = x1 L(1) + x2 (iL(1)) = x1 L(e1 ) + x2 L(e2 ),
ce qui montre que les coefficients L(ej ) de L vérifient la relation
L(e2 ) = iL(e1 ),
ou encore, en posant L(ej ) = L1 (ej ) + iL2 (ej ), si et seulement si les coefficients Lk (ej ) vérifient les relations
L2 (e2 ) = L1 (e1 ), L1 (e2 ) = −L2 (e1 ).
En d’autres termes, la matrice représentant L dans la base canonique doit
avoir ses éléments diagonaux égaux et ses éléments hors diagonale opposés.
On montre facilement que si une application R-linéaire de C dans C vérifie
ces conditions, elle est également C-linéaire.
2.10
Exercices
1. Pour chaque nombre rationnel x, il existe un et un seul couple d’entiers
(m, n) tels que n > 0, m et n soient premiers entre eux et x = m
n (représentation irréductible de x). Si l’on définit l’application f de R dans R par
f (x) = n si x est rationnel de représentation irréductible m
n , et f (x) = 0 si
x est irrationnel, montrer que f n’est localement bornée en aucun point de
R. (Raisonner par l’absurde).
2. On définit la suite de Fibonacci (uk )k∈N par u0 = u1 = 1 et
uk+2 = uk+1 + uk ,
pour k ≥ 0. Ainsi, u2 = 2, u3 = 3, u4 = 5, u5 = 8, . . . . On définit la suite
u
(vk )k∈N par vk = uk+1
. Montrer que, pour tout k ≥ 1, on a vk > 1 et que,
k
pour tout k ≥ 0, on a
1
vk+1 = 1 + .
vk
En déduire que, si la suite (vk )k∈N converge vers v ∗ , alors v ∗ est la racine
positive de l’équation algébrique
v 2 − v − 1 = 0,
76
CHAPITRE 2. LIMITES ET CONTINUITÉ
c’est-à-dire
√
1+ 5
v =
= 1, 618 . . ..
2
Cette quantité est appelée le nombre d’or. Montrer que, pour tout k ≥ 1,
on a
|vk − v ∗ |
|vk+1 − v ∗ | ≤
,
v∗
et dès lors
|v1 − v ∗ |
|vk+1 − v ∗ | ≤
.
(v ∗ )k
∗
En déduire que (vk )k∈N converge vers v ∗ .
3. Si p ≥ 1 est un réel et si x ∈ Rn , on définit |x|p par

|x|p = 
p
$
j=1
Montrer que
1/p
|xj |p
.
|x|∞ = lim |x|p,
p→∞
ce qui “justifie” la notation utilisée pour la norme |x|∞ . Pour ce faire, on
utilisera les inégalités suivantes, qui sont faciles à démontrer
|x|p ≤ n1/p |x|∞, |x|∞ ≤ |x|p.
4. Si d est la fonction de Dirichlet, montrer que, pour chaque a ∈ R, on a
lim
x→a; x∈Q
d(x) = 1,
lim
x→a; x∈R\Q
d(x) = 0.
En déduire que d n’est pas continue en a.
5. Soit f l’application de R dans R définie par f (x) = x si x est rationnel
et f (x) = −x si x est irrationnel. Montrer que f est continue en a si et
seulement si a = 0. La fonction f n’est donc continue qu’à l’origine. Par
contre, on a, pour tout x ∈ R, (f ◦ f )(x) = x, qui est continue en chaque
point de R.
6. Si l’on définit l’application g de R dans R par g(x) = n1 si x est rationnel de
représentation irréductible m
n , et g(x) = 0 si x est irrationnel, montrer que
g est continue en chaque point irrationnel et discontinue en chaque point
rationnel. En utilisant le théorème de Baire démontré au chapitre 17, on
peut prouver qu’il n’existe pas de fonction de R dans R qui est discontinue
en chaque point irrationnel et continue en chaque point rationnel.
77
2.11. PETITE ANTHOLOGIE
7. Soit f l’application de R2 dans R définie par f (0, 0) = 0 et
f (x, y) =
x2
xy
si (x, y) /= (0, 0).
+ y2
Montrer que cette fonction n’est pas continue en (0, 0) mais que les fonctions
x 2→ f (x, 0) et y 2→ f (0, y) sont continues en 0.
8. Soit (ak )k∈N∗ une suite dans Rp. Montrer que si limk→∞ ak = a, alors
lim
n→∞
%n
k=1
ak
n
= a.
Suggestion. Soit ! > 0; il existe m$ ∈ N∗ tel que, pour tout k ≥ m$ , on a
|ak − a|2 ≤ 2! . Si n ≥ m$ , alors
#
#
%m" −1
%n
# %n
#
n
#$
# k=1 ak
#
ak − a ##
" |ak − a|2
#
k=1 |ak − a|2
#
#
− a# = #
+ k=m
# ≤
#
#
#
n
n
n
n
2
k=1
≤
%m" −1
k=1
2
|ak − a|2 n − m$ + 1 !
+
≤
n
n
2
%m" −1
%m" −1
k=1
|ak − a|2
!
+ .
n
2
|ak −a|2
Prendre alors m ≥ m tel que k=1 n
≤ 2! lorsque n ≥ m. La réciproque est fausse, comme le montre l’exemple de ak = (−1)k .
$
2.11
Petite anthologie
Limites
On dit qu’une grandeur est la limite d’une autre grandeur, quand la seconde peut approcher de la première plus près que d’une grandeur donnée,
si petite qu’on la puisse supposer, sans pourtant que la grandeur, qui approche, puisse jamais surpasser la grandeur dont elle approche; en sorte que
la différence d’une pareille quantité à sa limite est absolument inassignable.
Jean le Rond d’Alembert, 1752
Si une quantité variable susceptible de limite, jouit d’une certaine propriété, sa limite jouit de la même propriété.
Simon Lhuilier, 1786
78
CHAPITRE 2. LIMITES ET CONTINUITÉ
Quand les valeurs successivement attribuées à une variable s’approchent
indéfiniment d’une valeur fixée, de manière à finir par en différer aussi peu
que l’on voudra, cette dernière est appelée la limite de toutes les autres.
Lorsque les valeurs numériques successives d’une même variable décroissent
indéfiniment, de manière à s’abaisser au-dessous de tout nombre donné, cette
variable devient ce qu’on nomme un infiniment petit ou une quantité infiniment petite.
Augustin Cauchy, 1821
Limites infinies
Lorsque les valeurs numériques successives d’une même variable croissent
de plus en plus, de manière à s’élever au-dessus de tout nombre donné, on
dit que cette variable a pour limite l’infini positif, indiqué par le signe ∞, s’il
s’agit d’une variable positive, et l’infini négatif, indiqué par la notation −∞,
s’il s’agit d’une variable négative. Les infinis positif et négatif sont désignés
conjointement sous le nom de quantités infinies.
Augustin Cauchy, 1821
Je proteste contre l’usage de la grandeur infinie comme quelque chose
d’achevé, ce qui n’est jamais admissible en mathématiques. L’infini est purement une manière de parler; son vrai sens est une limite de laquelle certains
rapports s’approchent indéfiniment, tandis que d’autres peuvent croı̂tre sans
restriction.
Carl-Friedrichs Gauss, 1831
Continuité
Les fonctions continues sont celles dont la nature est définie par une
relation précise entre les coordonnées exprimée par une équation; en sorte
que tous ses points soient déterminés par une même équation, comme par
une loi.
Leonhard Euler, 1767
La loi de continuité consiste en ce qu’une quantité ne peut pas passer
d’un état à un autre sans passer par tous les états intermédiaires qui sont
sujets à la même loi. Les fonctions algébriques sont considérées comme
continues parce que les différentes valeurs de ces fonctions dépendent de
2.11. PETITE ANTHOLOGIE
79
la même manière de celles de la variable; et supposant que la variable croı̂t
continûment, la fonction recevra des variations correspondantes; mais elle ne
passera pas d’une valeur à une autre sans passer aussi par toutes les valeurs
intermédiaires. La continuité peut être détruite de deux manières : (1) La
fonction peut changer de forme, c’est-à-dire la loi par laquelle la fonction
dépend de la variable peut changer tout d’un coup. (2) La loi de continuité
est aussi brisée quand les différentes parties d’une courbe ne tiennent pas les
unes aux autres.
Louis François Arbogast, 1791
En considérant la courbe dont i serait l’abscisse et l’une de ces fonctions l’ordonnée, cette courbe coupera l’axe à l’origine des abscisses et ...
le cours de la courbe sera nécessairement continu depuis ce point; donc
elle s’approchera peu à peu de l’axe avant de le couper et s’en approchera,
par conséquent, d’une quantité moindre qu’aucune quantité donnée, de sorte
qu’on pourra toujours trouver une abscisse i correspondant à une ordonnée
moindre qu’une quantité donnée, et alors toute valeur plus petite de i répondra aussi à des ordonnées moindres que la quantité donnée.
Joseph-Louis Lagrange, 1797
Une fonction f (x) qui varie selon la loi de continuité pour toutes les
valeurs de x situées à l’intérieur ou à l’extérieur de certaines limites n’est
rien d’autre que ce qui suit : si x est l’une quelconque de ces valeurs, la
différence f (x + w) − f (x) peut être rendue plus petite que n’importe quelle
quantité donnée si on fait w aussi petit qu’on le désire.
Bernard Bolzano, 1817
La fonction f (x) sera, entre les deux limites assignées à la variable x,
fonction continue de cette variable, si, pour chaque valeur de x intermédiaire
entre ces limites, la valeur numérique de la différence f (x + α) − f (x) décroı̂t
indéfiniment avec celle de α. En d’autres termes, la fonction f(x) restera continue par rapport à x entre les limites données, si, entre ces limites, un accroissement infiniment petit de la variable produit toujours un accroissement
infiniment petit de la fonction elle-même.
Augustin Cauchy, 1821
S’il est possible de déterminer une borne δ telle que pour toute valeur de
h, plus petite en valeur absolue que δ, f (x + h) − f (x) soit plus petite qu’une
80
CHAPITRE 2. LIMITES ET CONTINUITÉ
quantité ! aussi petite que l’on veut, alors on dira qu’on a fait correspondre à
une variation infiniment petite de la variable une variation infiniment petite
de la fonction.
Karl Weierstrass, 1861
Chapitre 3
Dérivabilité
3.1
Fonctions d’une variable réelle
Soit f une fonction de R dans Rp et a ∈ dom f . Des questions de géométrie
et de mécanique (vitesse moyenne) suggèrent l’introduction de la fonction
suivante.
Définition. Le taux de variation de f en a ou l’accroissement relatif de f
en a ou le quotient différentiel de f en a est la fonction de R dans Rp de
domaine dom f \ {a} définie par
∆af (x) =
f (x) − f (a)
.
x−a
On remarquera que cette fonction ∆a f ne peut pas être définie pour une
fonction f de Rn dans Rp lorsque n > 1, puisqu’il n’existe pas de division
d’un élément de Rp par un élément de Rn .
La notion géométrique de tangente à une courbe et la notion mécanique
de vitesse instantanée conduisent alors à la notion suivante.
Définition. On dit que la fonction f de R dans Rp est dérivable au point
a ∈ dom f si la limite
lim ∆a f (x) ≡ lim
x→a
x→a
f (x) − f (a)
x−a
(3.1)
df
existe. Dans ce cas, cette limite est notée f $ (a), Df (a) ou dx
(a) et appelée le
vecteur dérivé de f en a (nombre dérivé si p = 1), ou encore, plus simplement,
la dérivée de f en a.
81
82
CHAPITRE 3. DÉRIVABILITÉ
Rappelons que l’existence de (3.1) impose que a ∈ adh (dom f \ {a}),
c’est-à-dire que a ne soit pas un point isolé de dom f.
Remarques. 1. Si nous posons
dom f − a = {h ∈ R : a + h ∈ dom f },
alors, en posant x = a + h dans la définition de (3.1) exprimée en termes d’!
et δ
#
#
# f (x) − f (a)
#
$
#
(∀! > 0)(∃δ > 0)(∀x ∈ dom f \{a} : |x−a| ≤ δ) : #
− f (a)## ≤ !,
x−a
2
nous voyons immédiatement que la dérivabilité de f en a équivaut à la condition
(∀! > 0)(∃δ > 0)(∀h ∈ (dom f − a) \ {0} : |h| ≤ δ) :
#
#
# f (a + h) − f (a)
#
$
#
# ≤ !.
(a)
−
f
#
#
h
2
2. En ajoutant dans (3.1) la contrainte “x < a” (resp. “x > a”), on définit
le concept de dérivabilité à gauche (resp. à droite) de f au point a, et les
propriétés de la limite impliquent aussitôt que si f est dérivable à gauche et
à droite en a et que ses dérivées à gauche et à droite sont égales, alors f est
dérivable en a.
Exemples. 1. Toute application constante de R dans Rp est dérivable en
chaque point de R et sa dérivée y est nulle.
2. Toute application linéaire f : R → Rp , x 2→ xc, où c ∈ Rp , est dérivable
en chaque point a ∈ R, et f $ (a) = c.
3. Pour chaque n ≥ 2, l’application de R dans R définie par f (x) = xn est
telle que, pour chaque a ∈ R, on a
xn − an
= lim (xn−1 + xn−2 a + . . . + xan−2 + an−1 ) = nan−1 ,
x→a x − a
x→a, x(=a
lim
ce qui montre que f est dérivable en a et f $ (a) = nan−1 .
4. Considérons maintenant l’application valeur absolue de R dans R. Si
a > 0, alors, pour tout x appartenant au voisinage U = [ a2 , 3a
2 ] de a, on a
|x| = x et dès lors, par le caractère local de la limite,
lim
x→a
|x| − |a|
|x| − |a|
x−a
= lim
= lim
= 1,
x→a,
x∈U
x→a,
x∈U
x−a
x−a
x−a
ce qui montre que l’application valeur absolue est dérivable en a > 0 et y
a pour dérivée 1. On montre de même que l’application valeur absolue est
3.1. FONCTIONS D’UNE VARIABLE RÉELLE
83
dérivable en chaque a < 0 et y a pour dérivée −1. Par contre, l’application
valeur absolue n’est pas dérivable en 0, puisque
|x|
−x
= lim
= −1,
x→0− x
x→0− x
lim
et
|x|
x
= lim
= 1.
x→0+ x
x→0+ x
La dérivabilité en un point d’une fonction d’une variable réelle à valeurs
dans Rp se ramène à celle de ses p fonctions composantes.
lim
Proposition. Si f est une fonction de R dans Rp et a ∈ dom f , alors f
est dérivable en a si et seulement si, pour chaque 1 ≤ k ≤ p, les fonctions
composantes fk sont dérivables en a, auquel cas l’on a
f $ (a) = ((f1 )$ (a), . . ., (fp)$ (a)),
c’est-à-dire (f $ (a))k = (fk )$ (a), (1 ≤ k ≤ p).
Démonstration. Comme, pour chaque 1 ≤ k ≤ p, fk = pk ◦ f et que pk
est linéaire, on a, pour tout a ∈ dom f et tout x ∈ dom f \ {a},
(pk ◦ ∆a f )(x) =
(pk ◦ f )(x) − (pk ◦ f )(a)
fk (x) − fk (a)
=
= ∆afk (x).(3.2)
x−a
x−a
Par ailleurs, en vertu des propriétés des limites,
lim ∆a f (x) = b ⇔ lim (pk ◦ ∆af )(x) = bk , (1 ≤ k ≤ p),
x→a
x→a
et la thèse se déduit aussitôt de ce résultat et de (3.2).
Introduisons maintenant une formulation équivalente de la notion de
dérivabilité qui constitue une étape importante vers la généralisation de cette
notion aux fonctions de plusieurs variables.
Proposition. Soit f une fonction de R dans Rp et a ∈ dom f . Alors f est
dérivable en a si et seulement s’il existe b ∈ Rp et une fonction r de R dans
Rp définie au moins sur (dom f − a) \ {0} tels que
lim r(h) = 0,
h→0
et, tels que, pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + hb + |h|r(h).
(3.3)
84
CHAPITRE 3. DÉRIVABILITÉ
S’il en est ainsi, b = f $ (a).
Démonstration. Condition nécessaire. Si f est dérivable en a, alors, en
prenant b = f $ (a), on a
f (a + h) − f (a)
= b,
h→0
h
lim
c’est-à-dire
lim
h→0
f (a + h) − f (a) − hb
= 0.
h
Dès lors si l’on pose
r(h) =
f (a + h) − f (a) − hb
,
|h|
on voit que dom r = (dom f − a) \ {0}, (3.3) est satisfaite, et
lim r(h) = lim
h→0
h→0
2
3
h f (a + h) − f (a) − hb
= 0,
.
|h|
h
puisque la fonction h 2→ h/|h| est localement bornée en 0.
Condition suffisante. Si f vérifie (3.3), alors, pour tout h ∈ (dom f −a)\{0},
on a
f (a + h) − f (a)
|h|
=b+
r(h),
h
h
et dès lors
f (a + h) − f (a)
lim
= b,
h→0
h
ce qui montre que la limite (3.1) existe et est égale à b.
Remarque. La caractérisation que nous venons d’obtenir peut évidemment
s’énoncer sous la forme équivalente de l’existence d’un b ∈ Rp tel que
lim
h→0
ou encore tel que
lim
x→a
f (a + h) − f (a) − hb
= 0,
|h|
f (x) − f (a) − (x − a)b
= 0.
|x − a|
Quant à (3.3), elle peut bien sûr également s’écrire
f (x) = f (a) + (x − a)b + |x − a|r(x − a),
3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES
85
pour tout x ∈ dom f \ {a}.
La condition (3.3) peut être interprétée comme suit : une fonction f est
dérivable en a ∈ dom f si et seulement si f (a + h) peut être approchée pour
|h| suffisamment petit par une fonction affine g : h 2→ f (a) + hb, en ce sens
que l’erreur commise f (a+h)−g(h) est de la forme |h|r(h) avec r(h) tendant
vers 0 si h tend vers 0, c’est-à-dire tend vers zéro plus rapidement que |h|
lorsque |h| → 0.
En résumé, la dérivabilité en un point d’une fonction de R dans Rp peut
se concevoir comme l’existence d’un taux de variation “instantané” de la
fonction en ce point, ou comme la possibilité d’approcher cette fonction,
au voisinage de ce point, par une fonction affine. Géométriquement, parmi
toutes les droites de R × Rp passant par (a, f (a)), le graphe de g constitue la
meilleure approximation de celui de f au voisinage de (a, f (a)). On pourra
visualiser la situation lorsque p = 1 et p = 2.
3.2
Fonctions de plusieurs variables réelles
Si l’on rappelle que toute application linéaire de R dans Rp est de la forme
x 2→ xb pour un certain b ∈ Rp, on voit que la caractérisation de la notion de
dérivabilité en a ∈ dom f d’une fonction f de R dans Rp revient à demander
l’existence d’une application linéaire L de R dans Rp et d’une fonction r de
R dans Rp définie au moins sur (dom f − a) \ {0}, telle que limh→0 r(h) = 0
et telle que, pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + L(h) + |h|r(h).
Les deux membres de cette égalité gardent un sens pour une fonction f
de Rn dans Rp à condition de prendre pour L une application linéaire de Rn
dans Rp , pour r une fonction de Rn dans Rp et de remplacer |h| par |h|2 .
Nous sommes ainsi conduits à la définition suivante.
Définition. Soit f une fonction de Rn dans Rp et a ∈ dom f . On dit que f
est dérivable (ou différentiable) au point a s’il existe une application linéaire
L de Rn dans Rp et une fonction r de Rn dans Rp définie au moins sur
(dom f − a) \ {0}, telles que
lim r(h) = 0
h→0
et telles que, pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + L(h) + |h|2 r(h),
(3.4)
86
CHAPITRE 3. DÉRIVABILITÉ
ou encore, d’une manière équivalente,
f (x) = f (a) + L(x − a) + |x − a|2 r(x − a),
(3.5)
pour tout x ∈ dom f \ {a}.
Dans cette définition, on a posé, par analogie avec le cas n = 1,
dom f − a = {h ∈ Rn : a + h ∈ dom f }.
Remarques. 1. La condition limh→0 r(h) = 0 implique évidemment que 0
ne soit pas isolé dans (dom f − a), c’est-à-dire que a ne soit pas isolé dans
dom f.
2. Si j = 1, 2 ou ∞, les inégalités entre les différentes normes entraı̂nent que
les relations (3.4) et (3.5) sont évidemment équivalentes respectivement à
f (a + h) = f (a) + L(h) + |h|j rj (h),
et
f (x) = f (a) + L(x − a) + |x − a|j rj (x − a),
pour une certaine function rj de Rn dans Rp définie au moins sur (dom f −
a) \ {a} et telle que limh→0 rj (h) = 0. En particulier, la définition ne dépend
pas du choix de la norme | · |2 .
3. La caractérisation de la dérivabilité d’une fonction de R dans Rp donnée
dans la section précédente et la structure générale des applications linéaires
de R dans Rp entraı̂nent évidemment que la définition de dérivabilité que
nous venons de donner dans le cas général d’une fonction de Rn dans Rp est
compatible avec celle donnée pour n = 1.
4. En vertu de la propriété correspondante pour la limite, la dérivabilité de f
en a est une notion locale, c’est-à-dire qu’elle ne dépend que de la restriction
de f à un voisinage arbitraire de a.
Comme pour n = 1, et avec une démonstration semblable, on a la caractérisation suivante de la dérivabilité de f en a.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Alors f
est dérivable en a si et seulement s’il existe une application linéaire L de Rn
dans Rp telle que
f (a + h) − f (a) − L(h)
= 0,
h→0
|h|2
lim
3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES
87
c’est-à-dire telle que
lim
x→a
f (x) − f (a) − L(x − a)
= 0.
|x − a|2
Exemples. 1. Toute application constante de Rn dans Rp est dérivable en
chaque point a ∈ Rn . Il suffit de prendre L = 0 et r = 0 dans la définition.
2. Toute application linéaire f de Rn dans Rp est dérivable en chaque point
a ∈ Rn . Comme, par linéarité, on a, pour tout h ∈ Rn , f (a+h) = f (a)+f (h),
il suffit de prendre L = f et r = 0 dans la définition.
3. Soit f : R2 → R, (x1, x2 ) 2→ x21 + x2 . Si a = (a1 , a2 ) ∈ R2 et h = (h1 , h2 ) ∈
R2 , on a
f (a + h) = (a1 + h1 )2 + (a2 + h2 ) =
a21 + a2 + 2a1 h1 + h2 + h21 = f (a) + L(h) + |h|2 r(h),
si l’on définit l’application linéaire L : R2 → R par L(h) = 2a1 h1 + h2 et
la fonction r de R2 dans R par r(h) =
Comme, pour tout h /= 0, on a
|r(h)| ≤
h21
|h|2 .
On voit que dom r = R2 \ {0}.
h21 + h22
= |h|2 ,
|h|2
on voit que limh→0 r(h) = 0 et f est dérivable en chaque point a ∈ R2 .
Lorsque n ≥ 2, il peut exister plus d’une application linéaire L vérifiant
les conditions de la définition de dérivabilité. Pour le voir, soit f la fonction
de R2 dans R définie par f (x1 , x2 ) = x1 (x21 − |x2 |)1/2. On a
dom f = {(x1 , x2 ) ∈ R2 : |x2 | ≤ x21 }.
Si c ∈ R, si l’on considère l’application linéaire
Lc : R2 → R, (h1 , h2 ) 2→ ch2 ,
et si l’on définit la fonction rc de R2 dans R par
rc (h1 , h2 ) =
91/2
h1 8 2
h2
h1 − |h2 |
−c
,
|h|2
|h|2
on a, pour chaque (h1 , h2 ) ∈ dom f \ {(0, 0)},
f (h1 , h2 ) = f (0, 0) + Lc (h1 , h2 ) + |h|2 rc (h1 , h2 ).
88
CHAPITRE 3. DÉRIVABILITÉ
Comme, pour tout (h1 , h2 ) ∈ dom f, on a
#
# h2
#c
# |h|
#
2
#
# ≤ |c| |h1| ≤ |c||h|2,
#
|h|2
2
on voit que limh→0 rc (h) = 0 et donc que, pour chaque c ∈ R, l’application
linéaire Lc vérifie la définition de la dérivabilité de f en 0.
Un dessin convaincra aisément le lecteur de la forme particulière du domaine de f dans l’exemple ci-dessus. On retrouve l’unicité en faisant des
hypothèses plus fortes sur les relations entre a et dom f .
Proposition. Soit f une fonction de Rn dans Rp . Si a ∈ int dom f, il existe
au plus une application linéaire L vérifiant les conditions de la définition de
dérivabilité de f en a.
Démonstration. Supposons qu’il existe deux applications linéaires L et
M de Rn dans Rp vérifiant les conditions de la définition de dérivabilité de
f en a. Alors, il existera deux fonctions r et s de Rn dans Rp définies au
moins sur (dom f − a) \ {0} et telles que, pour chaque h ∈ (dom f − a) \ {0},
on ait
f (a) + L(h) + |h|2 r(h) = f (a + h) = f (a) + M (h) + |h|2 s(h).
En conséquence, on a, pour chaque h ∈ (dom f − a) \ {0},
(L − M )(h) = |h|2 [s(h) − r(h)].
Soit ρ > 0 tel que B2 [a; ρ] ⊂ dom f. Comme B2 [ρ] ⊂ dom f − a, on aura,
pour chaque 1 ≤ k ≤ n, et chaque t ∈ ]0, ρ],
t(L − M )(ek ) = (L − M )(tek ) = |t|[s(tek ) − r(tek )] = t[s(tek ) − r(tek )],
et dès lors
(L − M )(ek ) = [s(tek ) − r(tek )].
En faisant tendre t vers 0 dans cette égalité, et en utilisant les propriétés de
r et s et le théorème sur la limite d’une fonction composée, on obtient, pour
chaque 1 ≤ k ≤ n,
(L − M )(ek ) = 0,
et dès lors L = M , puisqu’une application linéaire de Rn dans Rp est nulle
si et seulement si elle s’annulle sur chaque élément de la base canonique de
Rn .
3.2. FONCTIONS DE PLUSIEURS VARIABLES RÉELLES
89
Définition. Si f est une fonction de Rn dans Rp dérivable en a ∈ int dom f
si n ≥ 2 et en a ∈ dom f si n = 1, l’unique application linéaire L de Rn dans
Rp vérifiant les conditions de la définition est appelée la dérivée totale ou la
différentielle de f au point a et notée fa$ ou dfa .
fa$ est donc, dans ce cas, l’unique application linéaire de Rn dans Rp telle
que l’on puisse écrire, pour chaque h ∈ (dom f − a) \ {0},
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),
avec r une fonction de Rn dans Rp définie au moins sur (dom f − a) \ {0}
et telle que limh→0 r(h) = 0, ou encore l’unique application linéaire de Rn
dans Rp telle que l’on ait
f (a + h) − f (a) − fa$ (h)
= 0.
h→0
|h|2
lim
Lorsque n = 1 et que f est dérivable en a au sens de la première section
de de chapitre, il existe un élément unique f $ (a) ∈ Rp tel que, pour chaque
h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + hf $ (a) + |h|r(h).
Dès lors, on a nécessairement, pour chaque h ∈ R,
fa$ (h) = hf $ (a),
et en particulier
f $ (a) = fa$ (1).
La connaissance de la dérivée f $ (a) de f en a entraı̂ne donc, pour n = 1, la
connaissance de sa dérivée totale fa$ , et réciproquement.
Géométriquement, lorsque n ≥ 2 et que f est une fonction de Rn dans
R dérivable en a ∈ int dom f, le graphe de la fonction affine h 2→ f (a) +
fa$ (h) est le plan de Rn × R passant par (a, f (a)) qui fournit la meilleure
approximation du graphe de f au voisinage de (a, f (a)). On l’appelle le plan
tangent au graphe de f en (a, f (a)). On pourra visualiser la situation lorsque
n = 2.
La dérivabilité de f en a entraı̂ne sa continuité en ce point.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ dom f . Si f est
dérivable en a, alors, pour chaque j = 1, 2 ou ∞, la fonction g de Rn dans Rp
90
CHAPITRE 3. DÉRIVABILITÉ
définie par g(h) =
en a.
f (a+h)−f (a)
|h|j
est localement bornée en 0 et f est continue
Démonstration. Soit j = 1, 2 ou ∞. Par hypothèse, il existe une application linéaire L de Rn dans Rp et une fonction r de Rn dans Rp définie au
moins sur (dom f − a) \ {0} telle que limh→0 r(h) = 0 et
f (a + h) = f (a) + L(h) + |h|2 r(h)
pour chaque h ∈ (dom f − a) \ {0}. En conséquence, pour ces mêmes h, on
a
f (a + h) − f (a)
L(h) + |h|2 r(h)
g(h) =
=
=L
|h|j
|h|j
&
h
|h|j
'
+
|h|2
r(h).
|h|j
On sait que le premier terme est une fonction localement bornée en 0 et, en
utilisant les inégalités entre normes, on voit aisément que le deuxième terme
est le produit par r d’une fonction localement bornée en 0; il tend donc vers
0 lorsque h tend vers 0, et est donc également localement borné en 0. Enfin,
pour tout x ∈ dom f \ {a}, on a
f (x) = f (a) + L(x − a) + |x − a|2 r(x − a),
et dès lors
lim
x→a, x(=a
f (x) = f (a),
ce qui équivaut à la continuité de f en a, puisque a est non isolé dans dom f .
Remarque. La réciproque de cette proposition est fausse : une fonction
peut être continue en un point sans y être dérivable. Ainsi, l’application
valeur absolue de R dans R est continue en 0 et n’y est pas dérivable. Comme
on le verra plus loin, il existe même des fonctions de R dans R continues en
chaque point de R qui ne sont dérivables en aucun point de R !
3.3
Dérivées directionnelles et dérivées partielles
La définition de dérivabilité d’une fonction de Rn dans Rp requiert la détermination de l’application linéaire L intervenant dans la définition. Cette
détermination est facilitée par l’introduction des dérivées d’une fonction de
Rn dans Rp dans une direction fixée. On appellera direction dans Rn tout
élément u ∈ Rn tel que |u|2 = 1. Un tel élément fixe en effet la direction de
la droite qui le joint à l’origine.
3.3. DÉRIVÉES DIRECTIONNELLES ET DÉRIVÉES PARTIELLES 91
Définition. Soit f une fonction de Rn dans Rp , a ∈ dom f et u ∈ Rn tel
que |u|2 = 1. On dit que f est dérivable au point a dans la direction u si la
fonction de R dans Rp t 2→ f (a + tu) est dérivable en 0, c’est-à-dire si
lim
t→0
f (a + tu) − f (a)
t
(3.6)
existe. Dans ce cas, cette limite est notée f $ (a; u) ou Du f (a) et appelée la
dérivée de f au point a dans la direction u. Dans le cas particulier où u = ek
pour un certain 1 ≤ k ≤ n, f $ (a; ek ) est appelée la dérivée partielle de f en
a par rapport à la ke -composante (brièvement par rapport à xk ) et notée
∂f
Dk f (a) ou Dxk f (a) ou ∂x
(a) ou ∂k f (a).
k
Notons que l’existence de la limite (3.6) requiert que a soit adhérent à
l’ensemble
{x ∈ dom f \ {a} : x = a + tu, t ∈ R}.
Si a ∈ int dom f, ce sera évidemment le cas, pour n’importe quel u ∈ Rn tel
que |u|2 = 1. Notons aussi que, si l’on introduit l’application affine g : R →
Rn , t 2→ a + tu, la dérivabilité de f en a dans la direction u équivaut à la
dérivabilité en 0 de la fonction de R dans Rp f ◦ g, auquel cas
f $ (a; u) = (f ◦ g)$(0).
D’autre part, lorsque n = 1, on a u = 1 ou u = −1 et l’on voit tout de suite
que l’existence de f $ (a; 1) et f $ (a; −1) équivalent toutes deux à la dérivabilité
(ordinaire) de f en a, avec les relations f $ (a; 1) = −f $ (a; −1) = f $ (a).
Remarquons enfin que, dans le cas de la dérivée partielle par rapport à
xk , on a, explicitement, par (3.6),
f (a1 , . . ., ak−1 , ak + t, ak+1 , . . . , an ) − f (a1 , . . ., an )
,
t→0
t
Dk f (a) = lim
ou encore, d’une manière équivalente,
Dk f (a) = lim
xk →ak
f (a1 , . . . , ak−1, xk , ak+1 , . . . , an ) − f (a1 , . . ., an )
.
xk − ak
L’existence et le calcul de Dk f (a) revient donc à la dérivabilité et au calcul
de la dérivée de la fonction de R dans Rp
xk 2→ f (a1 , . . . , ak−1 , xk , ak+1 , . . ., an ).
Il suffit donc de “geler” à leur valeur aj les composantes xj telles que j /= k
et de considérer la seule dépendance en xk .
92
CHAPITRE 3. DÉRIVABILITÉ
Notons que, contrairement à la notion de dérivabilité introduite dans la
section précédente, la dérivabilité d’une fonction en un point dans toutes
les directions n’entraı̂ne pas la continuité de la fonction en ce point. Par
exemple, si f est la fonction de R2 dans R définie par
f (x) =
x1 x22
si x /= 0
x21 + x42
et f (0) = 0, on voit que, pour chaque u = (u1 , u2 ) tel que |u|2 = 1, on a,
pour chaque réel t /= 0,
f (tu) − f (0)
f (tu)
u1 u22
=
= 2
,
t
t
u1 + t2 u42
et dès lors
f (tu) − f (0)
u2
= 2 si u1 /= 0,
t→0
t
u1
lim
et
f (tu) − f (0)
= 0 si u1 = 0.
t
En conséquence, f $ (0; u) existe pour toute direction u de R2 . D’autre part,
pour tout réel h /= 0, on a
lim
t→0
f (h2 , h) =
h4
1
= ,
h4 + h4
2
ce qui montre que |f (h2 , h) − f (0, 0)| = 12 quel que soit h /= 0 et dès lors f
n’est pas continue en 0 puisque limx→0 f n’est pas égale à f (0).
Nous allons voir maintenant qu’en un point intérieur au domaine d’une
fonction de Rn dans Rp, l’existence de la dérivée totale entraı̂ne celle de
la dérivée dans n’importe quelle direction (et en particulier des n dérivées
partielles) et que la dérivée totale peut s’exprimer en termes des dérivées
directionnelles ou des dérivées partielles.
Proposition. Soit f une fonction de Rn dans Rp, a ∈ int dom f . Si f est
dérivable en a, alors, pour chaque u ∈ Rn tel que |u|2 = 1, f est dérivable
en a dans la direction u et l’on a
f $ (a; u) = fa$ (u).
En particulier, pour chaque 1 ≤ k ≤ n, f possède une dérivée partielle
Dk f (a) en a par rapport à xk et, pour tout h ∈ Rn , on a
fa$ (h) =
n
$
k=1
hk Dk f (a).
(3.7)
3.3. DÉRIVÉES DIRECTIONNELLES ET DÉRIVÉES PARTIELLES 93
Démonstration. Par la définition de la dérivabilité totale de f en a, il
existe une fonction r de Rn dans Rp définie au moins sur (dom f − a) \ {0},
telle que limh→0 r(h) = 0 et telle que, pour tout h ∈ (dom f − a) \ {0}, on
ait
f (a + h) = f (a) + fa$ (h) + |h|2 r(h).
Dès lors, pour tout réel t /= 0 tel que a + tu ∈ dom f , on a
f (a + tu) = f (a) + fa$ (tu) + |tu|2 r(tu) = f (a) + tfa$ (u) + |t|r(tu),
et, en utilisant le théorème sur la limite des fonctions composées et le fait
que la fonction t 2→ |t|
t est localement bornée en 0,
2
3
f (a + tu) − f (a)
|t|
lim
= lim fa$ (u) + r(tu) = fa$ (u).
t→0
t→0
t
t
En particulier, en prenant u = ek , (1 ≤ k ≤ n), on obtient
Dk f (a) = fa$ (ek ), (1 ≤ k ≤ n),
et, pour tout h ∈ Rn , on aura
fa$ (h)
=
fa$
&
n
$
k=1
k
hk e
'
=
n
$
hk fa$ (ek ) =
k=1
n
$
hk Dk f (a).
k=1
L’exemple donné d’une fonction dérivable dans chaque direction sans
être continue, et donc sans être dérivable, montre que la réciproque de cette
proposition est fausse. Nous donnerons plus loin des conditions supplémentaires à imposer à l’existence des dérivées partielles en un point pour en
déduire la dérivabilité en ce point.
La proposition que nous venons de démontrer fournit un procédé systématique pour étudier la dérivabilité d’une fonction f de Rn dans Rp en un
point a ∈ dom f :
1. On étudie l’existence des dérivées partielles de f en a par rapport à xk
(1 ≤ k ≤ n). Si l’une d’entre elles n’existe pas, f ne sera pas dérivable en a.
2. Si toutes les dérivées partielles D1 f (a), . . . , Dnf (a) existent, on définit
l’application linéaire L de Rn dans Rp par la relation
L(h) =
n
$
k=1
hk Dk f (a).
94
CHAPITRE 3. DÉRIVABILITÉ
Si f (a + h) − f (a) − L(h) = |h|2 r(h) avec limh→0 r(h) = 0, ou encore si
lim
h→0
f (a + h) − f (a) − L(h)
= 0,
|h|2
(3.8)
alors f est dérivable en a. Si la limite du premier membre de (3.8) est
différente de zéro ou n’existe pas, alors f n’est pas dérivable en a.
Exemple. Reprenons l’exemple de la fonction f de R2 dans R définie par
f (x) = x21 + x2 . Si a = (a1 , a2 ) ∈ R2 est donné, alors la fonction x1 2→ x21 + a2
est dérivable en a1 et y a pour dérivée 2a1 et la fonction x2 2→ a21 + x2 est
dérivable en a2 et y a pour dérivée 1. En conséquence,
D1 f (a) = 2a1 , D2 f (a) = 1.
Soit L l’application linéaire de R2 dans R définie par
L(h) =
2
$
hk Dk f (a) = 2a1 h1 + h2 .
k=1
On a
f (a + h) − f (a) − L(h) = (a1 + h1 )2 + a2 − a21 − a2 − 2a1 h1 − h2 = h21 ,
et dès lors
f (a + h) − f (a) − L(h)
h2
= lim 1 = 0.
h→0
h→0 |h|2
|h|2
lim
Remarque. Dans le cas particulier d’une fonction f de Rn dans R dérivable
en a ∈ int dom f , chaque dérivée partielle Dk f (a) est un nombre réel et
l’élément (D1 f (a), . . ., Dnf (a)) de Rn est appelé le gradient de f en a et
noté ∇f (a) ou grad f (a). En utilisant le produit scalaire, la relation (3.7)
s’écrit
f $ (a; h) = fa$ (h) = (∇f (a)|h).
En vertu de l’inégalité de Cauchy, on aura alors, pour tout u ∈ Rn , tel que
|u|2 = 1,
fa$ (u) ≤ |fa$ (u)| ≤ |∇f (a)|2 |u|2 = |∇f (a)|2 ,
et si ∇f (a) /= 0, on obtient, en prenant u =
4
f $ a;
∇f (a)
|∇f (a)|2
5
4
= ∇f (a)|
∇f (a)
|∇f (a)|2
5
=
∇f (a)
|∇f (a)|2 ,
(∇f (a)|∇f (a))
= |∇f (a)|2,
|∇f (a)|2
3.4. RÈGLES DE CALCUL DES DÉRIVÉES
ce qui montre que f $ (a; u) prend sa plus grande valeur lorsque u =
Comme
f (a + tu) = f (a) + t(∇f (a)|u) + |t|r(tu),
95
∇f (a)
|∇f (a)|2 .
∇f (a)
avec r(h) → 0 si h → 0, le résultat qui précède montre que u = |∇f
est
(a)|2
la direction suivant laquelle f croı̂t le plus vite à partir de a. L’opposée −u
est la direction de plus grande pente.
3.4
Règles de calcul des dérivées
Pour éviter de devoir retourner systématiquement à la définition pour étudier
la dérivabilité et calculer la dérivée, il est important de savoir comment
la dérivabilité se comporte par rapport aux opérations algébriques et ensemblistes faites sur des fonctions dérivables. On pourra alors obtenir la
dérivabilité et la dérivée de fonctions compliquées lorsqu’on connaı̂t celle de
fonctions plus simples. On se contentera de traiter le cas important de la
dérivabilité en un point intérieur au domaine.
Montrons tout d’abord que la dérivée d’une somme est la somme des
dérivées.
Proposition. Soient f et g deux fonctions de Rn dans Rp et a ∈ int (dom f
∩dom g). Si f et g sont dérivables en a, alors f + g est dérivable en a et l’on
a
(f + g)$a = fa$ + ga$ .
En particulier, pour n = 1,
(f + g)$(a) = f $ (a) + g $ (a).
Démonstration. Par hypothèse, il existe des fonctions r et s de Rn dans
définies au moins sur (dom f −a)\{0} et (dom g−a)\{0} respectivement,
telles que
lim r(h) = 0, lim s(h) = 0,
Rp
h→0
h→0
et
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),
pour tout h ∈ (dom f − a) \ {0} et
g(a + h) = g(a) + ga$ (h) + |h|2 s(h),
96
CHAPITRE 3. DÉRIVABILITÉ
pour tout h ∈ (dom g − a) \ {0}. Dès lors, pour tout h ∈ [(dom f − a) ∩
(dom g − a)] \ {0}, on a
(f + g)(a + h) = f (a + h) + g(a + h)
= f (a) + fa$ (h) + |h|2 r(h) + g(a) + ga$ (h) + |h|2 s(h)
avec
= (f + g)(a) + (fa$ + ga$ )(h) + |h|2 [r(h) + s(h)],
lim [r(h) + s(h)] = 0.
h→0
Le cas n = 1 s’en déduit aussitôt puisque
(f + g)$ (a) = (f + g)$a(1) = fa$ (1) + ga$ (1) = f $ (a) + g $ (a).
Etudions maintenant la dérivabilité d’un produit de fonctions dérivables.
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables
en a, alors gf est dérivable en a et l’on a
(gf )$a = ga$ (·)f (a) + g(a)fa$ .
En particulier, si n = 1, on a aussi
(gf )$ (a) = g $ (a)f (a) + g(a)f $ (a).
Démonstration. Par hypothèse, il existe une fonction r de Rn dans Rp
(resp. C) définie au moins sur (dom f − a) \ {0} et une fonction s de Rn
dans R (resp. C) définie au moins sur (dom g − a) \ {0}, telles que
lim r(h) = 0, lim s(h) = 0,
h→0
h→0
et
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),
pour tout h ∈ (dom f − a) \ {0} et
g(a + h) = g(a) + ga$ (h) + |h|2 s(h),
pour tout h ∈ (dom g − a) \ {0}. Dès lors, pour tout h ∈ [(dom f − a) ∩
(dom g − a)] \ {0}, on a
(gf )(a + h) = g(a + h)f (a + h)
97
3.4. RÈGLES DE CALCUL DES DÉRIVÉES
= [g(a) + ga$ (h) + |h|2 s(h)][f (a) + fa$ (h) + |h|2 r(h)]
2
= (gf )(a) + ga$ (h)f (a) + g(a)fa$ (h) + |h|2 g(a)r(h) +
ga$ (h)fa$ (h)
|h|2
+ ga$ (h)r(h) + s(h)f (a) + s(h)fa$ (h) + |h|2 s(h)r(h)
si l’on pose
= (gf )(a) + ga$ (h)f (a) + g(a)fa$ (h) + |h|2 q(h),
q(h) = g(a)r(h) +
:
ga$ (h)fa$ (h)
|h|2
+ga$ (h)r(h) + s(h)f (a) + s(h)fa$ (h) + |h|2 s(h)r(h).
$
$ h
Comme la fonction h 2→ |h|−1
2 ga (h) = ga ( |h|2 ) est localement bornée en 0, on
voit que chaque terme de q est formé du produit d’une fonction localement
bornée en 0 par une fonction ayant une limite nulle en 0, et donc que
lim q(h) = 0.
h→0
La formule particulière pour n = 1 s’en déduit aisément.
Remarque. On démontre de la même manière le théorème de dérivabilité
du produit scalaire de deux fonctions f et g de Rn dans Rp dérivables en
a ∈ int dom f ∩ int dom g et la formule pour la dérivée
(f |g)$a = (fa$ (·)|g(a)) + (f (a)|ga$ (·)).
Etudions la dérivabilité d’un quotient de fonctions dérivables.
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables
en a et si g(a) /= 0, alors fg est dérivable en a et l’on a
4 5$
f
g
a
=
g(a)fa$ (·) − ga$ (·)f (a)
.
(g(a))2
En particulier, si n = 1, on a aussi
4 5$
f
g
(a) =
g(a)f $(a) − g $ (a)f (a)
.
(g(a))2
Démonstration. Puisque fg = f. 1g , il suffit de montrer que
en a, avec
4 5$
1
1
=−
g$ ,
g a
(g(a))2 a
1
g
est dérivable
98
CHAPITRE 3. DÉRIVABILITÉ
et d’utiliser le résultat précédent sur le produit. Montrons tout d’abord que
a ∈ int dom fg . On a
dom
f
= {x ∈ dom f ∩ dom g : g(x) /= 0}.
g
Puisque g(a) /= 0 et que g, dérivable en a, y est continue, il existera δ > 0
tel que, pour tout x ∈ dom g tel que |x − a|2 ≤ δ, on ait
|g(x) − g(a)| ≤
|g(a)|
,
2
et dès lors
|g(a)|
,
2
ce qui entraı̂ne en particulier que, pour tout x ∈ dom g tel que |x − a|2 ≤ δ,
on aura |g(x)| ≥ |g(a)|
> 0. Donc dom f ∩ dom g ∩ B2 [a; δ] ⊂ dom fg et
2
a ∈ int dom 1g . D’autre part, g étant dérivable en a, il existe une fonction
r de Rn dans R définie au moins sur (dom g − a) \ {0} telle que, pour tout
h ∈ (dom g − a) \ {0}, on ait
||g(x)| − |g(a)|| ≤
g(a + h) = g(a) + ga$ (h) + |h|2 r(h),
et dès lors, pour tout h ∈ [(dom g − a) ∩ B2 [δ]] \ {0}, on aura
2
1
1
1
g $ (h)
−
− −
g(a + h) g(a)
(g(a))2 a
= |h|2
ga$ ( |h|h 2 )ga$ (h) + [ga$ (h) − g(a)]r(h)
(g(a))2g(a + h)
3
= |h|2 s(h),
et l’on vérifie sans peine que s(h) → 0 lorsque h → 0. La formule particulière
pour n = 1 s’en déduit aisément.
Donnons maintenant l’importante règle de dérivation d’une fonction
composée.
Proposition. Soif f une fonction de Rn dans Rp , g une fonction de Rp dans
Rq , a ∈ int dom f tel que f (a) ∈ int dom g. Si f est dérivable en a et si g
est dérivable en f (a), alors a ∈ int dom (g ◦ f ), g ◦ f est dérivable en a et
(g ◦ f )$a = gf$ (a) ◦ fa$ .
3.4. RÈGLES DE CALCUL DES DÉRIVÉES
99
Si n = p = 1, on a aussi la formule particulière
(g ◦ f )$ (a) = g $ (f (a)).f $(a).
Démonstration. Par hypothèse, f , dérivable en a, y est continue. Si r > 0
est tel que B2 [f (a); r] ⊂ int dom g, il existera δ > 0 tel que f (B2 [a; δ]) ⊂
B2 [f (a); r] et donc tel que B2 [a; r] ⊂ dom (g ◦ f ). Donc a ∈ int dom (g ◦ f ).
D’autre part, il existe une fonction r de Rn dans Rp définie au moins sur
(dom f − a) \ {0} telle que, pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = f (a) + fa$ (h) + |h|2 r(h),
et une fonction s de Rp dans Rq définie au moins sur (dom g − f (a)) \ {0}
telle que, pour tout t ∈ (dom g − f (a)) \ {0}, on ait
g[f (a) + t] = g[f (a)] + gf$ (a)(t) + |t|2 s(t).
Dès lors, si h ∈ [(dom f − a) ∩ B2 [δ]] \ {0}, alors f (a + h) − f (a) ∈ (dom g −
f (a)) \ {0}, et
g(f (a + h)) = g[f (a) + f (a + h) − f (a)]
= g[f (a)] + gf$ (a)(f (a + h) − f (a)) + |f (a + h) − f (a)|2s[f (a + h) − f (a)]
= g[f (a)]+gf$ (a)(fa$ (h))+gf$ (a)(|h|2r(h))+|fa$ (h)+|h|2r(h)|2 s[f (a+h)−f (a)]
+|h|2
;
= g[f (a)] + (gf$ (a) ◦ fa$ )(h)
gf$ (a)(r(h)) +
=
<
# 4
#
5
# $
#
h
#f
+ r(h)## s[f (a + h) − f (a)]
# a |h|
2
g[f (a)] + (gf$ (a)
2
◦
fa$ )(h) + |h|2 b(h),
et l’on vérifie sans peine que b(h) → 0 lorsque h → 0. La formule pour n = 1
s’en déduit facilement.
Remarque. En appliquant le théorème précédent aux fonctions composées
pk ◦ f (1 ≤ k ≤ p) lorsque f est une fonction de Rn dans Rp dérivable en
a ∈ int dom f , on trouve immédiatement que chaque composante fk de f
est dérivable en a et que
(fk )$a = (pk )$f (a) ◦ fa$ = pk ◦ fa$ = (fa$ )k ,
ce qui montre que la dérivée totale en a de la ke -composante de f est la
ke -composante de la dérivée totale de f en a. Réciproquement, si chaque
100
CHAPITRE 3. DÉRIVABILITÉ
composante fk de f est dérivable en a ∈ int dom f , il existera des fonctions
rk de Rn dans R définies au moins sur (dom f − a) \ {0} telles que
fk (a + h) = f (a) + (fk )$a(h) + |h|2 rk (h), (1 ≤ k ≤ p),
pour tout h ∈ (dom f − a) \ {0}; dès lors, en définissant l’application linéaire
L de Rn dans Rp par
L(h) = ((f1 )$a(h), . . ., (fp)$a (h)),
et la fonction r de Rn dans Rp par
r(h) = (r1 (h), . . ., rp(h)),
on voit que f est dérivable en a et que fa$ = L.
Cette remarque combinée avec la formule (3.7) reliant la dérivée totale
aux dérivées partielles entraı̂ne aussitôt que, si f est une fonction de Rn
dans Rp dérivable en a ∈ int dom f , on a, pour chaque h ∈ Rn et chaque
1 ≤ j ≤ p,
(fa$ (h))j = (fj )$a(h) =
n
$
hk Dk fj (a),
k=1
et dès lors, si l’on considère h comme un vecteur-colonne dans Rn , l’application linéaire fa$ de Rn dans Rp est représentée par la matrice
(Dk fj (a))(1≤k≤n; 1≤j≤p)
à n colonnes et p lignes formée par les dérivées partielles des composantes
de f . Cette matrice appelée la matrice jacobienne de f en a constitue donc
la représentation de l’application linéaire fa$ dans les bases canoniques de Rn
et Rp .
3.5
Règles de calcul des dérivées partielles
Les règles de calcul des dérivées totales que nous venons d’établir se combinent aux formules liant la dérivée totale aux dérivées directionnelles et aux
dérivées partielles pour fournir immédiatement les règles de calcul de ces
dernières dérivées dans le cas de la somme, du produit et du quotient de
deux fonctions.
3.5. RÈGLES DE CALCUL DES DÉRIVÉES PARTIELLES
101
Proposition. Soient f et g deux fonctions de Rn dans Rp et a ∈ int (dom f
∩dom g). Si f et g sont dérivables en a, alors, pour chaque u ∈ Rn tel que
|u|2 = 1, f + g est dérivable en a dans la direction u et l’on a
(f + g)$ (a; u) = f $ (a; u) + g $ (a; u).
En particulier, pour chaque 1 ≤ k ≤ n, on a
Dk (f + g)(a) = Dk f (a) + Dk g(a).
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables
en a, alors, pour chaque u ∈ Rn tel que |u|2 = 1, gf est dérivable en a dans
la direction u et l’on a
(gf )$(a; u) = g $ (a; u)f (a) + g(a)f $ (a; u).
En particulier, pour chaque 1 ≤ k ≤ n, on a
Dk (gf )(a) = Dk g(a)f (a) + g(a)Dk f (a).
Proposition. Soit f une fonction de Rn dans Rp (resp. C), g une fonction
de Rn dans R (resp. C), et a ∈ int (dom f ∩dom g). Si f et g sont dérivables
en a et si g(a) /= 0, alors, pour chaque u ∈ Rn tel que |u|2 = 1, fg est dérivable
en a dans la direction u et l’on a
4 5$
f
g
(a; u) =
g(a)f $(a; u) − g $ (a; u)f (a)
.
(g(a))2
En particulier, pour chaque 1 ≤ k ≤ n, on a
Dk
4 5
f
g
(a) =
g(a)Dk f (a) − Dk g(a)f (a)
.
(g(a))2
Le cas du composé de deux fonctions est un peu moins direct. On ne
manquera pas de noter le contraste entre la simplicité de la règle de calcul
pour les dérivées totales et le caractère plus compliqué de la règle pour les
dérivées partielles.
Proposition. Soif f une fonction de Rn dans Rp , g une fonction de Rp dans
Rq , a ∈ int dom f tel que f (a) ∈ int dom g. Si f est dérivable en a et si g
est dérivable en f (a), alors, a ∈ int dom (g ◦ f ), et, pour chaque u ∈ Rn tel
que |u|2 = 1, g ◦ f est dérivable en a dans la direction de u, et
(g ◦ f )$ (a; u) = g $ [f (a); f $(a; u)].
102
CHAPITRE 3. DÉRIVABILITÉ
En particulier, pour chaque 1 ≤ k ≤ n, on a
Dk (g ◦ f )(a) =
p
$
Dk fj (a)Dj g(f (a)),
(3.9)
p
$
Dj gl (f (a))Dk fj (a).
(3.10)
j=1
et, pour chaque 1 ≤ l ≤ q, on a
Dk (g ◦ f )l (a) =
j=1
Démonstration. On a, en utilisant le lien entre dérivée totale et dérivée
directionnelle et la règle de la dérivée totale d’une fonction composée,
(g ◦ f )$ (a; u) = (g ◦ f )$a(u) = (gf$ (a) ◦ fa$ )(u)
= gf$ (a)(fa$ (u)) = gf$ (a)[f $ (a; u)] = g $ [f (a); f $(a; u)].
Dès lors, pour chaque 1 ≤ k ≤ n, il vient
Dk (g ◦ f )(a) = (g ◦ f )$ (a; ek ) = g $ [f (a); f $(a; ek )] = g $ [f (a); fa$ (ek )]
=
p
$
j=1
(fa$ (ek ))j Dj g(f (a))
=
p
$
(fj )$a(ek )Dj g(f (a))
j=1
=
p
$
Dk fj (a)Dj g(f (a)).
j=1
La formule (3.10) s’obtient en passant aux composantes dans la formule
(3.9).
Remarque. La formule (3.10) montre que la matrice jacobienne de g ◦ f en
a est égale au produit matriciel de la matrice jacobienne de g en f (a) par la
matrice jacobienne de f en a.
Exemples. 1. Considérons le passage des coordonnées cartésiennes (x1 , x2 )
aux coordonnées polaires (r, θ) dans R2 pour une fonction g de R2 dans R
dérivable en chaque point de R2 \ {0}. Rappelons que ce changement de
variables est donné par l’application f de R+ × R dans R2 définie par
f (r, θ) = (r cos θ, r sin θ),
et que cette fonction f est dérivable en chaque point de R+ × R. En utilisant
la formule (3.10), on voit, que pour chaque (r, θ) ∈ R+ × R, on a
Dr (g ◦ f )(r, θ)
= D1 g(r cos θ, r sin θ)Dr f1 (r, θ) + D2 g(r cos θ, r sin θ)Dr f2 (r, θ)
103
3.6. C-DÉRIVABILITÉ
= D1 g(r cos θ, r sin θ) cos θ + D2 g(r cos θ, r sin θ) sin θ,
Dθ (g ◦ f )(r, θ)
= D1 g(r cos θ, r sin θ)Dθ f1 (r, θ) + D2 g(r cos θ, r sin θ)Dθ f2 (r, θ)
= −D1 g(r cos θ, r sin θ)r sin θ + D2 g(r cos θ, r sin θ)r cos θ.
En notations matricielles, ces relations s’écrivent
&
Dr (g ◦ f )(r, θ)
Dθ (g ◦ f )(r, θ)
'
=
&
cos θ
sin θ
−r sin θ r cos θ
'&
D1 g(r cos θ, r sin θ)
D2 g(r cos θ, r sin θ)
ce qui donne également, si r /= 0, en inversant la matrice,
&
D1 g(r cos θ, r sin θ)
D2 g(r cos θ, r sin θ)
'
=
&
cos θ −r −1 sin θ
sin θ r −1 cos θ
'&
Dr (g ◦ f )(r, θ)
Dθ (g ◦ f )(r, θ)
'
,
'
.
2. Un cas particulier important, pour la mécanique par exemple, est celui
où f est une fonction de R dans Rp+1 de la forme
f (x) = (x, h(x)),
avec h une fonction de R dans Rp dérivable en a ∈ int dom h et g une
fonction de Rp+1 dans R dérivable en f (a) = (a, h(a)) ∈ int dom g. On
numérotera les variables dans Rp+1 par les indices 0, 1, . . ., p. Dans ce cas,
g ◦ f = g(·, h(·)) est une fonction de R dans R dérivable en a et
(g ◦ f )$ (a) = (g ◦ f )$a (1) = [gf$ (a) ◦ fa$ ](1) = gf$ (a)(fa$ (1)) = gf$ (a)(f $ (a))
= D0 g(a, h(a))f0$ (a) +
p
$
Dk g(a, h(a))fk$ (a)
k=1
= D0 g(a, h(a)) +
p
$
Dk g(a, h(a))h$k(a).
k=1
3.6
C-dérivabilité
Soit f une fonction de C dans C et a ∈ dom f . On peut évidemment la considérer simplement comme une fonction de R2 dans R2 (en oubliant la structure supplémentaire de champ de R2 ), et considérer sa dérivabilité en a au
sens de l’existence de la dérivée totale en a. Mais la structure supplémentaire
de C nous permet également de généraliser à une telle fonction la notion de
fonction taux d’accroissement en a (puisqu’on peut diviser un élément de C
par un élément non nul de C) et la notion de dérivée correspondante.
104
CHAPITRE 3. DÉRIVABILITÉ
Définition. Soit f une fonction de C dans C et a ∈ dom f . On dit que f
est C-dérivable en a si
f (z) − f (a)
lim
z→a
z −a
existe. Dans ce cas, cette limite est appelée la C-dérivée de f en a et elle est
df
notée f $ (a) ou dz
(a).
L’existence de la limite implique évidemment que a ne soit pas isolé dans
dom f.
Exemples. 1. Toute application constante de C dans C est évidemment
C-dérivable en chaque point a de C et f $ (a) = 0.
2. Toute application C-linéaire de C dans C est C-dérivable en chaque point
a de C puisqu’alors f est de la forme f (z) = cz pour un certain c ∈ C, et
lim
z→a
cz − ca
c(z − a)
= lim
= c.
z→a z − a
z−a
On a, dans ce cas, f $ (a) = c.
3. L’application f : z 2→ z̄, qui est R-linéaire mais n’est pas C-linéaire, n’est
C-dérivable en aucun point a de C puisque
lim
z→a
z̄ − ā
,
z−a
n’existe pas. En effet, si (hk )k∈N est une suite de nombres réels non nuls
tendant vers zéro, alors, en prenant zk = a + hk , on obtient
lim
k→∞
zk − ā
hk
= 1,
= lim
k→∞
zk − a
hk
et en prenant zk = a + ihk , on obtient
lim
k→∞
zk − ā
−ihk
= −1.
= lim
zk − a k→∞ ihk
En procédant exactement comme dans le cas d’une fonction d’une variable réelle, et en se rappelant la structure des applications C-linéaires de C
dans C, on démontre aisément le résultat suivant.
Proposition. Soit f une fonction de C dans C et a ∈ dom f . Alors f est
C-dérivable en a si et seulement s’il existe b ∈ C et une fonction r de C dans
C définie au moins sur (dom f − a) \ {0} tels que limh→0 r(h) = 0 et
f (a + h) = f (a) + hb + |h|r(h),
105
3.6. C-DÉRIVABILITÉ
pour tout h ∈ (dom f − a) \ {0}, ou encore si et seulement s’il existe une
application C-linéaire L de C dans C et une fonction r de C dans C définie
au moins sur (dom f − a) \ {0} tels que limh→0 r(h) = 0 et
f (a + h) = f (a) + L(h) + |h|r(h),
auquel cas L(1) = f $ (a).
On en déduit aisément une condition nécessaire et suffisante de
C-dérivabilité due à Maurice Fréchet et Grace Young.
Proposition. Soit f une fonction de C dans C et a ∈ int dom f. Alors f
est C-dérivable en a si et seulement si les deux conditions suivantes sont
réalisées
a. f , considérée comme fonction de R2 dans R2 , est dérivable en a;
b. D1 f (a) = 1i D2 f (a),
auquel cas on a f $ (a) = D1 f (a) = 1i D2 f (a).
Démonstration. Par la proposition précédente, on voit que f est Cdérivable en a si et seulement si f , considérée comme fonction de R2 dans
R2 est dérivable en a et sa dérivée totale en a est une application C-linéaire
de C dans C. Il existera donc un b ∈ C tel que l’on ait, pour tout h ∈ C,
fa$ (h) = bh = b(h1 + ih2 ) = bh1 + (ib)h2,
ce qui entraı̂ne aussitôt, puisque
fa$ (h) = h1 D1 f (a) + h2 D2 f (a),
que
1
D1 f (a) = b = D2 f (a),
i
et
f $ (a) = fa$ (1) = D1 f (a).
La condition b du théorème de Fréchet-Young porte le nom de condition
de Cauchy-Riemann. Comme
Dk f (a) = (Dk f1 (a), Dkf2 (a)) (k = 1, 2)
et que le deuxième membre s’écrit encore, en notations complexes,
Dk f (a) = Dk f1 (a) + iDk f2 (a) (k = 1, 2),
106
CHAPITRE 3. DÉRIVABILITÉ
ou
Dk f (a) = Dk 8f (a) + iDk 9f (a), (k = 1, 2),
les conditions de Cauchy-Riemann s’écrivent également, en égalant les parties réelles et imaginaires des deux membres de la condition b,
D1 f1 (a) = D2 f2 (a), D2 f1 (a) = −D1 f2 (a),
ou
D1 8f (a) = D2 9f (a), D2 8f (a) = −D1 9f (a).
La matrice jacobienne en a d’une fonction C-dérivable en a a donc ses termes
diagonaux égaux et ses termes hors-diagonale opposés.
Exemple. L’application f de C dans C définie par f (z) = |z|2 n’est Cdérivable qu’en z = 0. En effet, si z = x + iy, on a
f1 (z) = 8f (z) = x2 + y 2 , f2 (z) = 9f (z) = 0,
et f , considérée comme fonction de R2 dans R2 possède évidemment une
dérivée totale en chaque point a = (a1 , a2 ) = a1 + ia2 . En un tel point, on a
D1 f1 (a) = 2a1 , D2 f1 (a) = 2a2 , D1 f2 (a) = 0, D2 f2 (a) = 0,
et les conditions de Cauchy-Riemann
2a1 = 0, 2a2 = 0,
sont donc satisfaites si et seulement si a = 0.
Enfin, on obtient aisément les règles de calcul suivantes, en utilisant la
définition de la C-dérivabilité en terme de limite du taux d’accroissement
et les propriétés des limites par rapport aux opérations algébriques sur les
fonctions.
Proposition. Soient f et g deux fonctions de C dans C qui sont C-dérivables en a non isolé dans dom f ∩ dom g. Alors :
1. f + g est C-dérivable en a et (f + g)$ (a) = f $ (a) + g $(a).
2. f g est C-dérivable en a et (f g)$ (a) = f $ (a)g(a) + f (a)g $ (a).
3. Si g(a) /= 0, fg est C-dérivable en a et
4 5$
f
g
(a) =
f $ (a)g(a) − f (a)g $ (a)
.
(g(a))2
107
3.7. EXERCICES
Enfin, si f est C-dérivable en a et g est C-dérivable en f (a), alors g ◦ f est
C-dérivable en a et
(g ◦ f )$ (a) = g $ (f (a))f $ (a).
Une conséquence immédiate de cette proposition et des exemples donnés
plus haut est que tout polynôme de C dans C est C-dérivable en chaque
point de C et que toute fonction rationnelle de C dans C est C-dérivable en
chaque point où son dénominateur ne s’annule pas.
3.7
Exercices
1. Soit f une fonction de R dans R∗+ dérivable en a ∈ R. On appelle dérivée
logarithmique de f en a le nombre réel
Dlog f (a) =
f $ (a)
= (log f )$ (a).
f (a)
Montrer que si f et g sont deux fonctions de R dans R∗+ dérivables en a ∈ R,
alors on a
Dlog (f g)(a) = Dlog f (a) + Dlog g(a),
f
Dlog (a) = Dlog f (a) − Dlog g(a).
g
2. Soit E une partie non vide de Rn , a ∈ E et b ∈ Rn tel que |b|2 = 1. On
dit que b est tangent à E en a s’il existe une suite (xk )k∈N dans E \ {a} qui
−a
converge vers a et est telle que la suite ( |xxkk−a|
)k∈N converge vers b. Montrer
2
n
que si a ∈ int E, alors tout b ∈ R tel que |b|2 = 1 est tangent à E en a.
Montrer que si E = {(r, r 2) ∈ R2 : r ∈ R}, alors b est tangent à E en 0 si et
seulement si b = e1 ou b = −e1 .
3. Soit f une fonction de Rn dans Rp dérivable en a ∈ dom f. Montrer qu’il
existe au plus une application linéaire L de Rn dans Rp telle que
f (a + h) = f (a) + L(h) + |h|2 r(h),
avec r définie au moins sur (dom f − a) \ {0} et
lim r(h) = 0,
h→0
si et seulement s’il existe une base {b1 , b2, . . . , bn} formée d’éléments bj tangents à dom f en a.
108
CHAPITRE 3. DÉRIVABILITÉ
4. Si m > 0 est un réel, on dit qu’une application f de Rn dans Rp est
homogène de degré m si, pour tout a ∈ Rn et tout t ∈ R, on a
f (ta) = tm f (a).
En dérivant les deux membres de cette expression par rapport à t en t = 1,
montrer que si f est dérivable en a, on a la formule d’Euler
n
$
aj Dj f (a) = mf (a).
j=1
5. Si f est une application de Rn dans Rn et k ≥ 1 un entier, posons
f k = f ◦ f ◦ . . . ◦ f (k fois). Montrer par récurrence sur k que si f est
dérivable en chaque point a ∈ Rn , alors, pour chaque k ≥ 2, f k est dérivable
en chaque point a ∈ Rn et
(f k )$a = ff$ k−1 (a) ◦ . . . ◦ ff$ (a) ◦ fa$ .
6. Soit v une fonction de R dans Rp dérivable en chaque point de R, aj ∈ R,
bj ∈ R, (1 ≤ j ≤ n). Montrer que la fonction u de Rn dans Rp définie par
u(x) = v
&
n
$
ak xk
k=1
est telle que, pour chaque x ∈ Rn ,
$
bj Dj u(x) =
j=1
n
$
aj bj v
$
j=1
&
'
n
$
k=1
'
ak xk .
7. Soit f une fonction de Rn dans R dérivable en a, g et h des fonctions de
Rn dans Rn définies en a. On appelle dérivée de Lie en a de f par rapport
à g le réel
Lg f (a) = fa$ (g(a)) =
n
$
gj (a)Dj f (a) = (g(a)|∇f (a)),
j=1
et on appelle dérivée de Lie en a de h par rapport à g l’élément de Rn
Lg h(a) = h$a (g(a)) =
n
$
j=1
gj (a)Dj h(a).
109
3.8. PETITE ANTHOLOGIE
Montrer que si ϕ est une fonction de Rn dans R et κ une fonction de Rn
dans Rn dérivables en a et si c ∈ Rn , alors
Lg (f + ϕ)(a) = Lg f (a) + Lg ϕ(a), Lg (h + κ)(a) = Lg h(a) + Lg κ(a),
Lg (cf )(a) = cLg f (a), Lg (ch)(a) = cLg h(a),
Lg (f ϕ)(a) = ϕ(a)Lg f (a) + f (a)Lg ϕ(a).
8. Soit f une fonction de R dans Rp et a non isolé dans dom f. Montrer que
f est dérivable en a si et seulement s’il existe une fonction ϕ de R dans Rp,
continue en a et telle que
f (x) = f (a) + (x − a)ϕ(x),
pour tout x ∈ dom f (caractérisation de Carathéodory). (Suggestion: prendre pour ϕ le prolongement continu en a de ∆a f ). Soit f une fonction de
Rn dans R et a non isolé dans dom f. Montrer que f est dérivable en a si
et seulement s’il existe une fonction ϕ de Rn dans Rn continue en a et telle
que
f (x) = f (a) + (x − a|ϕ(x)),
pour tout x ∈ dom f. (Suggestion: si f (a + h) = f (a) + (∇f (a)|h) + |h|2r(h),
noter que |h|2 r(h) = r(h)
|h|2 (h|h)).
3.8
Petite anthologie
Dérivée
Les rapports ultimes dans lequels les quantités disparaissent ne sont pas
réellement les rapports de quantités ultimes, mais les limites vers lesquelles
les rapports de quantités, décroissant sans limite, s’en approchent toujours;
et vers lesquelles ils peuvent s’en approcher aussi près que toute différence
donnée, mais dont ils ne peuvent jamais les dépasser ou atteindre avant que
les quantités soient diminuées indéfiniment.
Isaac Newton, 1687
Le calcul différentiel en fait consiste seulement en la détermination algébrique de la limite d’un quotient.
Jean Le Rond d’Alembert, 1754
110
CHAPITRE 3. DÉRIVABILITÉ
Si l’on pose alors ∆x = i, les deux termes du rapport aux différences
∆y
f (x + i) − f (x)
=
,
∆x
i
seront des quantités infiniment petites. Mais, tandis que ces deux termes
s’approcheront indéfiniment et simultanément de la limite zéro, le rapport
lui-même pourra converger vers une autre limite, soit positive, soit négative.
Cette limite, lorsqu’elle existe, a une valeur déterminée pour chaque valeur
particulière de x. Pour indiquer cette dépendance, on donne à la nouvelle
fonction le nom de fonction dérivée, et on la désigne, à l’aide d’un accent,
par la notation y $ ou f $ (x).
Augustin Cauchy, 1823
f (x0 + h) = f (x0 ) + c.h + h.h1 (h) où h1 tend vers zéro avec h et c est
une constante : là-dedans se trouve la véritable notion de dérivée.
Karl Weierstrass, 1874
Dérivées partielles et dérivée totale
Juste comme une fonction de y et z ne peut pas être appelée continue en
un point quand elle y est continue comme une fonction de y seulement, z
étant constante, et comme une fonction de z seulement, y étant constant, on
ne peut pas appeler la fonction dérivable simplement parce que les dérivées
partielles existent.
Karl Thomae, 1873
f a une différentielle première en (x, y), donnée par
df (x, y) =
∂f (x, y)
∂f (x, y)
ξ+
η,
∂x
∂y
si, pour tous les points (x + ξ, y + η) proches de (x, y) on peut écrire
f (x + ξ, y + η) = f (x, y) + df (x, y) + ξρ(ξ, η) + ησ(ξ, η),
où ρ(ξ, η) et σ(ξ, η) sont des fonctions de ξ, η qui tendent vers zéro lorsque
ξ et η tendent vers zéro.
Otto Stolz, 1893
111
3.8. PETITE ANTHOLOGIE
Dès que nous quittons le domaine d’une seule variable dans les applications des définitions fondamentales du calcul différentiel, nous sentons
presqu’immédiatement que nous nous trouvons sur un sol moins sûr. Il
ne peut pas, par la nature des choses, exister une théorie applicable aux
fonctions de deux ou plus variables aussi élégante et simple que celle du coefficient différentiel. Une connaissance des coefficients dérivées partielles
dans le cas le plus général n’est en aucune manière équivalent à celui du
seul coefficient différentiel d’une fonction d’une variable. En fait, gardant
à l’esprit l’interprétation géométrique usuelle, et, fixant notre pensée sur le
plan comme image géométrique de la région de variation de deux variables,
nous ne pouvons même pas affirmer qu’une connaissance des coefficients
différentiels dans toutes les directions issues du point constitue l’équivalent
de la connaissance du coefficient différentiel dans le cas d’une seule variable. Pour comprendre et pour caractériser le comportement d’une fonction au voisinage d’un point, nous devons recourir à ce qui a été appelé la
différentielle.
William H. Young, 1909
C-dérivée
Supposons d’ailleurs que Z reste fonction continue de z, du moins pour
des valeurs de z comprises entre certaines limites. Pour de telles valeurs de
z, à des accroissements infiniment petits ∆x, ∆y de x, y correspondront des
accroissements infiniment petits ∆z, ∆Z de z, Z; et la dérivée de la variable
Z considérée comme fonction de z ne sera autre chose que la limite dont
s’approchera indéfiniment le rapport ∆Z
∆z tandis que ∆x, ∆y s’approcheront
indéfiniment de zéro. Cette dérivée sera désignée par la notation Dz Z. Cela
posé, la dérivée de Z, relative à z, se confondra évidemment avec le rapport
différentiel de Z à z, c’est-à-dire avec le rapport dZ
dz . Si, dans cette formule,
on substitue à la différentielle dz, sa valeur dz = dx+idy, et à la différentielle
dZ sa valeur dZ = Dx Z dx + Dy Z dy, on trouvera
Dz Z =
Si, d’ailleurs, on pose
dy
dx
DxZ dx + Dy Z dy
.
dx + idy
= tg-, cette dernière équation donnera
Dz Z =
Dx Z cos - + Dy Z sin .
cos - + i sin -
112
CHAPITRE 3. DÉRIVABILITÉ
... Il suit immédiatement de cette formule que la dérivée de Z, considérée
comme fonction de z, dépend en général, non seulement de la position du
point A de coordonnées rectangulaires x, y sur la ligne qu’il décrit, mais
encore de la direction de cette ligne. Cette dérivée deviendra indépendante
de l’angle - si ...
Dy Z = iDxZ.
Augustin Cauchy, 1853
Lorsqu’une fonction u d’une variable imaginaire z est continue, à un
accroissement infiniment petit de la variable correspond un accroissement
infiniment petit de la fonction, et la limite du rapport de l’accroissement de
la fonction à l’accroissement de la variable est la dérivée de la fonction. On
a donc
du
dX + idY
=
=
dz
dx + idy
ou
du
=
dz
dX
dx
dX
dx dx
+
dX
dy dy
+ ( dX
dx dx +
dx + idy
dX
dY dy
+ i dY
dx + ( dy + i dy ) dx
dy
1 + i dx
dY
dy
dy)i
,
.
En général, la dérivée dépend de la quantité dy
dx , et par conséquent de la direction du déplacement infiniment petit donné au point z. A chaque direction
de déplacement correspond une dérivée particulière, et la fonction a ainsi,
pour une même valeur de z, une infinité de dérivées. Lorsque la valeur de la
dérivée est indépendante de la direction du déplacement, en d’autres termes,
lorsque la fonction admet une dérivée unique en chaque point, M. Cauchy
dit que la fonction est monogène.
Charles Briot et Jean-Claude Bouquet, 1856
Chapitre 4
Fonctions continues ou
dérivables
4.1
Propriétés locales et propriétés globales
Il est important en mathématiques de distinguer les propriétés locales des
propriétés globales et d’étudier leurs relations. Si E est une partie non vide
de Rn , et P est une propriété, on dira que P est localement vérifiée sur E si,
pour chaque a ∈ E, il existe un nombre δ = δ(a) > 0 tel que P soit vérifiée
sur E ∩ B∞ [a; δ(a)]. Bien entendu, une telle définition est indépendante du
choix de la norme dans Rn et nous avons choisi | · |∞ pour des raisons de
commodité qui apparaı̂tront plus tard. Il est clair que si P est vérifiée sur
E, alors P est vérifiée localement sur E, mais la réciproque est fausse.
Ainsi, prenant pour P la propriété “être fini”, on voit que E sera localement fini si, pour chaque a ∈ E, il existe δ = δ(a) > 0 tel que E ∩B∞ [a; δ(a)]
soit fini. Z n’est pas fini mais est localement fini (prendre par exemple
δ(k) = 1/2 pour k ∈ Z), et E = {1/k : k ∈ N∗ }, également infini, est
localement fini (prendre δ(1/k) = 1/2k(k + 1)).
On a dit au Chapitre 2 qu’une fonction f de Rn dans Rp est localement
bornée en a ∈ Rn si la condition
(∃δ > 0)(∃r > 0)(∀x ∈ dom f ∩ B∞ [a; δ]) : |f (x)|2 ≤ r
est satisfaite. Cette propriété suggère la définition suivante. Soit f une
fonction de Rn dans Rp et E une partie de Rn telle que dom f ∩ E /= ∅.
Définition. On dit que f est bornée sur E si la condition
(∃r > 0)(∀x ∈ dom f ∩ E) : |f (x)|2 ≤ r
113
114
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
est satisfaite.
Il est clair que f est localement bornée en a si et seulement s’il existe
δ > 0 tel que f soit bornée sur B∞ [a; δ].
La propriété pour f d’être bornée sur E est évidemment une propriété
globale de E. Elle implique évidemment la propriété locale correspondante.
Définition. On dit que f est localement bornée sur E si
(∀a ∈ E)(∃δ(a) > 0)(∃r(a) > 0)(∀x ∈ dom f ∩ E ∩ B∞ [a; δ(a)]) :
|f (x)|2 ≤ r(a).
Il est clair que si f est bornée sur E, elle est localement bornée sur E, et
que f est localement bornée sur E si et seulement si f est localement bornée
en chaque a ∈ E, au sens de la définition du Chapitre 2. Par exemple, la
fonction f de R dans R définie par f (x) = x1 est localement bornée sur R∗+ .
En effet, étant donné a > 0, si l’on prend# δ(a)
= a/2, on voit que pour
#
#1#
a 3a
1
2 2
x ∈ ] 2 , 2 ], on aura x ∈ [ 3a , a [, et donc # x # < a2 . La valeur r(a) = 2/a
convient donc dans la définition. Par contre, cette fonction n’est pas bornée
1
sur R∗+ puisque, pour chaque r > 0, on aura 1/2r
= 2r > r. Ainsi donc, la
propriété: la fonction f est localement bornée sur l’ensemble E n’implique
pas nécessairement que f soit bornée sur E.
Comme autre exemple, considérons la propriété, pour une fonction f
de Rn dans R, d’être de signe constant sur E ⊂ Rn , c’est-à-dire d’être
strictement positive sur E ou strictement négative sur E. C’est une propriété globale sur E qu’on peut localiser en disant que f est localement de
signe constant sur E si, pour chaque a ∈ E, il existe δ(a) > 0 tel que f soit
de signe constant sur E ∩B∞ [a; δ(a)]. Toute fonction de signe constant sur E
est évidemment localement de signe constant sur E, mais la réciproque est
fausse. Ainsi, l’identité de R dans R n’est pas de signe constant sur R \ {0},
mais elle y est localement de signe constant. En effet, si a > 0, on voit que f
est strictement positive sur [a/2, 2a/2] et si a < 0, f est strictement négative
sur [3a/2, a/2]. On voit donc que δ(a) = |a|/2 convient dans la définition.
Une propriété vérifiée localement sur E introduit donc une application
δ : E → R∗+ , a 2→ δ(a), dont la valeur en a fixe sur le rayon d’une boule
centrée en a telle que la propriété P ait lieu sur E ∩ B∞ [a; δ(a)]. Une telle
application sera appelée une jauge sur E. Nous allons développer une technique permettant de montrer que, pour certaines classes d’ensembles E de
Rn , une propriété localement satisfaite sur E y sera globalement vérifiée.
En utilisant le théorème des intervalles fermés emboı̂tés, nous montrerons
4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN
115
d’abord que c’est le cas pour les intervalles fermés (bornés) de R et les produits cartésiens de tels intervalles dans Rn . C’est le fait qu’une boule en
norme | · |∞ soit un produit d’intervalles fermés bornés qui suggère, par commodité, le choix de cette norme. Nous étendrons ensuite le résultat à une
classe plus vaste de parties de Rn .
4.2
P-partitions d’un pavé et lemme de Cousin
Généralisons à Rn la notion d’intervalle.
Définition. On appelle pavé de Rn toute partie K ⊂ Rn de la forme
K = K1 × K2 × . . . × Kn =
n
6
Ki ,
i=1
où, pour chaque 1 ≤ i ≤ n, Ki = [ai , bi] est un intervalle fermé de R. On
appelle pavé ouvert de Rn toute partie J ⊂ Rn de la forme
J = J1 × J2 × . . . × Jn =
n
6
Ji ,
i=1
où, pour chaque 1 ≤ i ≤ n, Ji = ]ai , bi[ est un intervalle ouvert de R. Enfin,
on appelle semi-pavé de Rn toute partie I ⊂ Rn de la forme
I = I1 × I2 × . . . × In =
n
6
Ii ,
i=1
où, pour chaque 1 ≤ i ≤ n, Ii = ]ai , bi] est un intervalle ouvert à gauche
et fermé à droite. Lorsque b1 − a1 = b2 − a2 = . . . = bn − an , on parlera
respectivement d’un n-cube, d’un n-cube ouvert ou d’un n-semi-cube.
Ainsi donc, avec les notations de la définition,
K = {x ∈ Rn : ai ≤ xi ≤ bi , (1 ≤ i ≤ n)},
J = {x ∈ Rn : ai < xi < bi , (1 ≤ i ≤ n)},
I = {x ∈ Rn : ai < xi ≤ bi , (1 ≤ i ≤ n)}.
Exemple. Pour chaque a ∈ Rn et chaque r > 0, B∞ [a; r] est le n-cube
[a1 − r, a1 + r] × [a2 − r, a2 + r] × . . . × [an − r, an + r].
116
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Définition. On dit que (K (i))i∈N est une suite de pavés emboı̂tés de Rn si
chaque K (i) est un pavé de Rn et si, pour chaque i ∈ N, on a
K (i+1) ⊂ K (i).
Si, pour chaque i ∈ N,
(i)
(i)
K (i) = K1 × K2 × . . . × Kn(i) ,
l’hypothèse que (K (i))i∈N soit une suite de pavés emboı̂tés équivaut évidem(i)
ment à ce que, pour chaque 1 ≤ j ≤ n, la suite (Kj )i∈N soit une suite
d’intervalles fermés emboı̂tés de R.
Le résultat suivant, appelé théorème des pavés emboı̂tés, est une
conséquence facile du théorème des intervalles fermés emboı̂tés.
Proposition. Si (K (i))i∈N est une suite de pavés emboı̂tés de Rn , alors
(i)
/= ∅.
i∈N K
7
Démonstration. Soit (K (i))i∈N une suite de pavés emboı̂tés de Rn . Si,
pour chaque i ∈ N, on écrit
(i)
(i)
K (i) = K1 × K2 × . . . × Kn(i) ,
(i)
alors, pour chaque 1 ≤ j ≤ n, la suite (Kj )i∈N est une suite d’intervalles
fermés emboı̂tés de R, et il existe donc un réel cj tel que, pour chaque i ∈ N,
on ait
(i)
cj ∈ K j .
Dès lors, c = (c1 , c2 , . . . , cn) ∈ Rn est tel que, pour chaque i ∈ N, on a
(i)
c’est-à-dire c ∈
7
(i)
c ∈ K1 × K2 × . . . × Kn(i) = K (i),
i∈N K
(i)
.
Pour étudier les relations entre les pavés, pavés ouverts et semi-pavés, on
a besoin des compléments suivants sur l’intérieur et l’adhérence d’une partie
de Rn .
Proposition. Si m ≥ 1, p ≥ 1 sont des entiers et si A ⊂ Rm et B ⊂ Rp,
alors
int (A × B) = int A × int B,
adh (A × B) = adh A × adh B.
4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN
117
Démonstration. Soit x = (y, z) ∈ int (A × B), avec y ∈ A et z ∈ B. Il
existe donc r > 0 tel que
n
B∞
[x; r] ⊂ A × B,
n [x; r] désigne la boule de centre x et de rayon r dans Rn avec n = m+p.
où B∞
Comme
n
m
p
B∞
[x; r] = B∞
[y; r] × B∞
[z; r],
on aura évidemment
m
p
B∞
[y; r] ⊂ A et B∞
[z; r] ⊂ B,
ce qui montre que y ∈ int A et z ∈ int B, et donc que
x = (y, z) ∈ int A × int B.
Réciproquement, si x = (y, z) ∈ int A × int B, alors y ∈ int A et z ∈ int B,
et il existera r1 > 0 et r2 > 0 tels que
m
p
B∞
[y; r1] ⊂ A et B∞
[z; r2] ⊂ B.
En conséquence, si r = min{r1 , r2 }, on aura
n
m
p
B∞
[x; r] = B∞
[y; r] × B∞
[z; r] ⊂ A × B,
ce qui montre que x ∈ int (A × B). On a donc démontré la première égalité.
Pour la seconde, notons que x = (y, z) ∈ adh (A × B) si et seulement si,
n [x; r] ∩ (A × B) /= ∅, c’est-à-dire si et seulement
pour chaque r > 0, on a B∞
si, pour chaque r > 0, on a
m
p
B∞
[y, r] ∩ A /= ∅ et B∞
[z; r] ∩ B /= ∅,
c’est-à-dire si et seulement si
y ∈ adh A et z ∈ adh B,
ou encore si et seulement si x = (y, z) ∈ adh A × adh B.
En appliquant ce résultat de proche en proche et en le combinant avec
les calculs d’intérieur et d’adhérence des différents types d’intervalles de R,
on obtient aussitôt le corollaire suivant.
118
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Corollaire. Soient ai < bi , (1 ≤ i ≤ n), des réels, et soient
K=
n
6
[ai, bi], J =
i=1
n
6
]ai , bi[, I =
i=1
n
6
]ai , bi].
i=1
Alors,
int K = int J = int I = J,
K = J = I = K.
Rappelons que si E est un ensemble quelconque et (Eα)α∈A une famille
de parties Eα de E, on dit que (Eα)α∈A partitionne E ou est une partition
de E si les deux conditions suivantes sont vérifiées :
1) (∀α ∈ A)(∀β ∈ A : α /= β) : Eα ∩ Eβ = ∅.
!
2) E = α∈A Eα.
En d’autres termes, les Eα doivent être des parties mutuellement disjointes
de E dont l’union redonne E. Comme on travaillera en général avec des partitions en un nombre fini d’ensembles, on utilisera l’abus de notation commode
consistant à désigner, lorsque A = {α1 , . . . , αm }, la famille (Eα)α∈A par
{Eα1 , Eα2 , . . . , Eαm }.
Bien entendu, (E) est une partition de E, que l’on qualifiera de triviale.
On se convaincra aisément que, à l’exception de la partition triviale, il
n’est pas possible de partitionner un pavé en un nombre fini de pavés et
qu’il n’est pas possible de partitionner un pavé ouvert en un nombre fini de
pavés ouverts. Ainsi, {[a, c], [c, b]} avec a < c < b n’est pas une partition
de [a, b] puisque [a, c] ∩ [c, b] = {c}, et {]a, c[, ]c, b[} n’est pas une partition
de ]a, b[ puisque ]a, c[ ∪ ]c, b[ /= [a, b[. Par contre, il est toujours possible
de partitionner un semi-pavé en un nombre fini de semi-pavés, puisque, si
=
a < c < b, {]a, c], ]c, b]} est une partition de ]a, b], et que si I = ni=1 Ii est
un semi-pavé de Rn et si, pour chaque 1 ≤ i ≤ n, les intervalles semi-ouverts
Ii1 , Ii2 , . . . , Iiki partitionnent l’intervalle semi-ouvert Ii , alors la famille finie
{I1j1 × I2j2 × . . . × Injn : 1 ≤ j1 ≤ k1 , 1 ≤ j2 ≤ k2 , . . . , 1 ≤ jn ≤ kn }
est une partition de I en un nombre fini de semi-pavés. Notons aussi que
si (I j )1≤j≤m est une partition du semi-pavé I en semi-pavés, alors, de la
!
j
relation I = m
j=1 I , on déduit aussitôt
I¯ =
m
>
j=1
Ij =
m
>
j=1
Ij.
4.2. P-PARTITIONS D’UN PAVÉ ET LEMME DE COUSIN
119
Dans l’étude du passage d’une propriété locale à une propriété globale,
il est utile de considérer des partitions d’un semi-pavé de Rn en un nombre
fini de semi-pavés à chacun desquels est attaché un point de son adhérence.
Ce concept se formalise comme suit.
Définition. Soit I ⊂ Rn un semi-pavé. Une P-partition de I est une famille
finie
8
9
?
@
Π = (xj , I j )
= (x1 , I 1), (x2, I 2 ), . . ., (xm, I m )
1≤j≤m
telle que :
1) (I j )1≤j≤m = {I 1 , I 2 , . . . , I m} est une partition de I en semi-pavés.
2) xj ∈ I j pour chaque 1 ≤ j ≤ m.
¯ {(c, I)} est une P-partition du semi-pavé I
Ainsi, quel que soit c ∈ I,
n
de R et {(0, ]0, 1]), (2, ]1, 3])} est une P-partition de ]0, 3]. Bien entendu,
si les semi-pavés I 1 , . . . I q partitionnent le semi-pavé I et si, pour chaque
1 ≤ l ≤ q,
8
9
Πl = (xl,jl , I l,jl )
1≤jl ≤ml
est une P-partition de I l , alors
8
Π = (xl,jl , I l,jl )
9
1≤jl ≤ml , 1≤l≤q
sera une P-partition de I que l’on désignera souvent d’une manière impropre
mais commode par la notation {Π1 , Π2 , . . . , Πq }.
On a vu qu’une propriété locale P sur un ensemble E de Rn s’obtient
en associant à chaque point x ∈ Rn un nombre strictement positif (pouvant
dépendre de x) δ(x) tel que P soit satisfaite sur E ∩ B∞ [x; δ(x)], c’est-à-dire
en donnant une jauge δ sur E. La donnée d’une jauge sur l’adhérence I¯ d’un
semi-pavé permet de mesurer la “finesse” d’une P-partition de I.
A
B
Définition. Si I ⊂ Rn est un semi-pavé, Π = (xj , I j ) 1≤j≤m une P¯ on dit que Π est δ-fine si, pour chaque
partition de I et δ une jauge sur I,
1 ≤ j ≤ m, on a
I j ⊂ B∞ [xj ; δ(xj )].
Comme, pour chaque 1 ≤ j ≤ m, on a
adh B∞ [xj ; δ(xj )] = B∞ [xj ; δ(xj )],
(4.1)
120
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
on voit que la condition (4.1) équivaut à ce que, pour chaque 1 ≤ j ≤ m, on
ait
I j ⊂ B∞ [xj ; δ(xj )].
¯ dont la valeur constante est
Lorsque δ est une jauge constante sur I,
également notée δ, il est facile de construire une P-partition δ-fine de I.
Si I = I1 × . . . × In , avec, pour chaque 1 ≤ k ≤ n, Ik = ]ak , bk ], il suffit
en effet de partitionner Ik en q semi-intervalles Ikl = ]clk , cl+1
k ] de longueur
l ≤ δ (1 ≤ l ≤ q − 1), de considérer la partition produit
cl+1
−
c
k
k
(I1l1 × I2l2 × . . . × Inln )(1≤lk ≤q; 1≤k≤n) ,
et d’associer à chacun des semi-pavés I j de cette partition un élément quelconque xj appartenant à son adhérence (1 ≤ j ≤ m). Ici, m = q n . En effet,
=
si I j = nk=1 ]ajk , bjk ], alors on a, par construction, pour chaque 1 ≤ k ≤ n,
bjk − ajk ≤ δ, et dès lors
xjk − δ ≤ bjk − δ ≤ ajk < bjk ≤ ajk + δ ≤ xjk + δ,
ce qui entraı̂ne aussitôt que
I j ⊂ B∞ [xj ; δ] = B∞ [xj ; δ(xj )].
On ne dispose pas d’un tel procédé de construction dans le cas d’une
¯ et l’existence d’une P-partition δ-fine résulte alors
jauge quelconque δ sur I,
de l’important résultat suivant, qu’on appelle le lemme de Cousin.
¯ alors il existe
Théorème. Si I un semi-pavé de Rn et δ une jauge sur I,
une P-partition δ-fine de I.
Démonstration. Supposons le résultat faux et soit δ une jauge sur I¯ telle
=
que I n’admette pas de P-partition δ-fine. Partitionnons I = ni=1 ]ai , bi]
en 2n semi-pavés congruents par bissection des côtés. En d’autres termes,
=
partitionnons I en 2n semi-pavés congruents du type ni=1 ]ci , di] avec
ci = ai , di =
ai + bi
ai + bi
, ou ci =
, di = bi , (1 ≤ i ≤ n).
2
2
L’un de ces semi-pavés au moins, disons I (1), n’admet pas de P-partition
δ-fine car, autrement, la réunion des P-partitions δ-fines de chaque semipavé de la division fournirait une P-partition δ-fine de I, ce qui a été exclu. Partitionnons alors I (1) en 2n semi-pavés congruents par bissection des
côtés, comme on l’a fait pour I. L’un de ces semi-pavés au moins, disons
4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE
121
I (2) n’admettra pas de P-partition δ-fine. En continuant indéfiniment cette
construction, on obtient une suite (I (k))k∈N de semi-pavés, avec I (0) = I,
vérifiant les propriétés suivantes :
(i) chaque I (k) n’admet pas de P-partition δ-fine;
(ii) I (k+1) ⊂ I (k), (k ∈ N);
(iii) si d = max{bi − ai : 1 ≤ i ≤ n} désigne la longueur du plus grand côté
de I, alors, pour tout x ∈ I (k) et tout y ∈ I (k), on a |x − y|∞ ≤ 2dk , (k ∈ N).
Cette dernière propriété résulte du fait que la longueur de chacun des côtés
d’un semi-pavé I (k) est deux fois plus petite que celle du côté correspondant
du semi-pavé qui le précède dans la suite.
En conséquence, la suite (I (k))k∈N constitue une suite de pavés emboı̂tés
7
et, par le théorème des pavés emboı̂tés, il existe c ∈ k∈N I (k) . Choisissons
p ∈ N suffisamment grand pour que 2dp ≤ δ(c). Comme c ∈ I (p), on aura,
pour tout x ∈ I (p),
d
|x − c|∞ ≤ p ≤ δ(c),
2
8
9
c’est-à-dire I (p) ⊂ B∞ [c; δ(c)], et (c, I (p)) sera une P-partition δ-fine de
I (p), ce qui contredit la propriété (i) ci-dessus.
Remarque. La démonstration que nous venons de faire prouve en fait que
¯ il existe une P-partition
pour tout
semi-pavé I de Rn et toute jauge δ sur I,
A j j B
j
δ-fine (x , I ) 1≤j≤m telle que chaque I soit semblable à I, c’est-à-dire telle
que, si I =
=n
i=1 ]ai , bi]
et I j =
=n
j j
i=1 ]ai , bi ],
(1 ≤ j ≤ m), on ait
bj1 − aj1
bj − aj2
bj − ajn
= 2
= ... = n
.
b1 − a1
b2 − a2
bn − an
Une telle P-partition est appelée une P-partition régulière de I.
4.3
Propriété de valeur intermédiaire
Montrons tout d’abord qu’une fonction réelle, non nulle et continue en un
point garde son signe sur un voisinage du point: la propriété ponctuelle
devient une propriété locale.
Lemme. Soit f une fonction de Rn dans R continue en a ∈ dom f . Si
f (a) > 0 (resp. f (a) < 0), il existe δ = δ(a) > 0 tel que, pour tout
x ∈ dom f ∩ B∞ [a; δ(a)], on ait
f (x) > 0 (resp. f (x) < 0).
122
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Démonstration. Faisons-la dans le cas où f (a) > 0, l’autre cas s’y ramenant en remplaçant f par −f. En prenant ! = f (a)
2 dans la définition de
continuité de f en a, on obtient l’existence d’un δ = δ(a) > 0 tel que, pour
tout x ∈ dom f ∩ B∞ [a; δ(a)], on aura
−
et donc f (x) ≥
f (a)
2
f (a)
f (a)
≤ f (x) − f (a) ≤
,
2
2
> 0.
Remarque. La conclusion de la proposition précédente peut encore s’exprimer en disant que, pour tout x ∈ dom f ∩B∞ [a; δ(a)], on aura f (x)f (a) > 0.
Le théorème de Cousin permet, sous certaines conditions, de passer de
ce résultat local à un résultat global. Si f est une fonction de Rn dans Rp
et E ⊂ dom f , on dira que f est continue sur E si f est continue en chaque
point de E. Montrons tout d’abord qu’une fonction réelle d’une variable
réelle continue et non nulle sur un intervalle fermé garde un signe constant
sur cet intervalle.
Proposition. Soit f une fonction de R dans R continue sur l’intervalle
fermé [a, b]. Si, pour chaque x ∈ [a, b], on a f (x) /= 0, alors f (a)f (b) > 0.
Démonstration. Par la proposition précédente appliquée à chaque point
de [a, b], on trouve que
(∀x ∈ [a, b])(∃δ(x) > 0)(∀y ∈ [a, b] ∩ [x − δ(x), x + δ(x)]) : f (y)f (x) > 0.
On obtient ainsi une jauge δ : x 2→ δ(x) sur [a, b], et leAlemme Bde Cousin
garantit alors l’existence d’une P-partition δ-fine Π = (xj , I j ) 1≤j≤m de
I = ]a, b], que l’on peut évidemment toujours numéroter de telle sorte que,
si I j = ]aj−1 , aj ], on ait
a = a0 < a1 < a2 < . . . < am−1 < am = b.
Comme Π est δ-fine, on a, pour chaque 1 ≤ j ≤ m,
[aj−1 , aj ] ⊂ [xj − δ(xj ), xj + δ(xj )],
et dès lors
f (aj−1 )f (xj ) > 0, f (aj )f (xj ) > 0,
ce qui entraı̂ne aussitôt que
f (aj−1 )f (aj ) > 0,
et la thèse s’en déduit.
4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE
123
Remarque. Le résultat est faux si f cesse d’être continue en un point de
[a, b] (considérer par exemple la fonction f définie sur [0, 1] par f (x) = −1
si x ∈ [0, 12 ] et f (x) = 1 si x ∈ ] 12 , 1]) ou si elle est continue sur un ensemble
qui n’est pas un intervalle (considérer par exemple la fonction f définie sur
[0, 1] ∪ [2, 3] par f (x) = −1 si x ∈ [0, 1] et f (x) = 1 si x ∈ [2, 3]).
La forme contraposée de cette proposition fournit, pour une fonction
réelle d’une variable réelle, une utile condition suffisante d’existence d’un
zéro, appellée le théorème de Bolzano. C’est Bernard Bolzano qui le
premier, en 1817, sentit la nécessité de donner une démonstration analytique
de ce résultat, considéré jusqu’alors comme “géométriquement” évident.
Corollaire. Soit f une fonction de R dans R continue sur [a, b]. Si
f (a)f (b) ≤ 0,
alors il existe au moins un c ∈ [a, b] tel que f (c) = 0.
Une conséquence utile du théorème de Bolzano est l’existence d’un zéro
réel pour tout polynôme réel de degré impair.
Corollaire. Tout polynôme à coefficients réels de degré impair possède au
moins un zéro réel.
Démonstration. Soit
p : R → R, x 2→
m
$
aj xj ,
j=0
un polynôme à coefficients réels aj de degré impair m (am /= 0). Sans perte
de généralité, on peut supposer que am > 0, puisque, dans le cas contraire,
il suffit de considérer −p. On sait que p est continue sur R et, pour tout
x /= 0, on a


%m−1
Comme j=0 aj
|x| ≥ ρ, on ait
p(x) = xm am +
xj−m
m−1
$
j=0
aj xj−m  .
→ 0 si x → ∞, il existera ρ > 0 tel que, pour tout
#
#
#m−1
#
#$
#
am
j−m #
#
a
x
j
#
#≤ 2 .
# j=0
#
Cela entraı̂ne en particulier que

p(ρ) = ρm am +
m−1
$
j=0

aj ρj−m  ≥ ρm
am
> 0,
2
124
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
et
p(−ρ) = −ρ

m
am +
m−1
$
j=0
aj (−ρ)

j−m 
≤ −ρm
am
< 0.
2
La thèse résulte alors du théorème de Bolzano.
Il résulte immédiatement de ce résultat que tout nombre réel possède
une racine ne réelle lorsque n est impair. On va l’utiliser pour démontrer
l’existence de la racine ne complexe d’un nombre complexe quelconque pour
tout entier n strictement positif.
Proposition. Pour chaque entier n ≥ 1, et chaque c ∈ C, il existe au moins
un z ∈ C tel que z n = c.
Démonstration. Le résultat est trivial pour n = 1. Si n = 2 et c =
a + ib, z = x + iy, l’équation z 2 = c équivaut au système d’équations
x2 − y 2 = a, 2xy = b.
Comme x2 + y 2 = |z|2 = |c|, on en déduit que
2x2 = |c| + a, 2y 2 = |c| − a,
ce qui fournit les solutions
z=
et
C
1
(|c| + a) + i sign b
2
C
C
1
(|c| − a),
2
C
1
1
z=−
(|c| + a) − i sign b
(|c| − a).
2
2
Supposons maintenant que n > 2 et démontrons le résultat par récurrence
sur n. Si n est pair, disons n = 2m, il existe, par ce qui précède, au moins
un η ∈ C tel que η 2 = c. Comme m < n, l’hypothèse de récurrence entraı̂ne
l’existence d’un z ∈ C tel que z m = η, et dès lors tel que z n = z 2m = η 2 = c.
Si n est impair, alors, puisqu’on sait déjà que tout réel possède une racine
ne réelle, on peut supposer sans perte de généralité que c n’est pas réel et
que |c| = 1. Soit d ∈ C tel que d2 = c, de telle sorte que dd¯ = 1. Définissons
le polynôme p sur R par
p(x) = i[d̄(x + i)n − d(x − i)n].
Son terme de degré n en x, i(d̄ − d)xn , est différent de zéro et, comme
p(x) = p(x) pour tout x ∈ R, p est donc un polynôme réel de degré impair
4.3. PROPRIÉTÉ DE VALEUR INTERMÉDIAIRE
125
n. Par le Corollaire précédent, il existe donc un λ ∈ R tel que p(λ) = 0, ce
qui entraı̂ne
d(λ + i)n = d(λ − i)n ,
et dès lors
4
λ+i
λ−i
5n
=
d
= d2 = c.
d
La propriété suivante a longtemps été confondue avec la propriété de
continuité sur E. Nous verrons qu’elle est seulement une condition nécessaire
de continuité sur E.
Définition. Soit f une fonction de Rn dans R définie sur E ⊂ Rn . On
dit que f possède la propriété de valeur intermédiaire ou la propriété de
Darboux sur E ou encore que f est continue au sens de Darboux sur E si,
pour chaque x ∈ E, chaque y ∈ E et chaque v compris entre f (x) et f (y), il
existe au moins un z ∈ E tel que f (z) = v.
En d’autres termes, une telle fonction prend sur E toutes les valeurs
intermédiaires entre deux quelconques de ses valeurs. Nous allons voir que
cette propriété est satisfaite par une fonction réelle continue sur une partie
“d’un seul tenant” de Rn .
Définition. Soit E ⊂ Rn . On dit que E est connexe par arcs si, pour tout
x ∈ E et tout y ∈ E, il existe une application continue γ : [0, 1] → E telle
que γ(0) = x et γ(1) = y.
Intuitivement, E est connexe par arcs si deux quelconques de ses points
peuvent être joints par un arc de courbe continu entièrement contenu dans
E. Par exemple, tout intervalle I de R est connexe par arcs puisque, si
x < y appartiennent à I, alors [x, y] ⊂ I et l’application continue γ : [0, 1] →
R, t 2→ (1 − t)x + ty, satisfait bien aux conditions de la définition puisque
γ([0, 1]) = [x, y] ⊂ I. Par contre, N, Z et Q ne sont pas connexes par arcs
mais R l’est. De même, toute boule de Rn est connexe par arcs, de même
que toute partie du type {x ∈ Rn : r ≤ |x|j ≤ R}, avec j = 1, 2 ou ∞. Mais
l’union de deux boules disjointes de Rn n’est pas connexe par arcs.
Proposition. Soit f une fonction de Rn dans R continue sur une partie
connexe par arcs E de Rn . Alors f possède sur E la propriété de valeur
intermédiaire.
Démonstration. Soit x ∈ E, y ∈ E et γ : [0, 1] → E une application
continue telle que γ(0) = x, γ(1) = y. Soit v compris entre f (x) et f (y)
126
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
(c’est-à-dire v ∈ [f (x), f (y)] si f (x) < f (y), v ∈ [f (y), f (x)] si f (y) < f (x) et
v = f (x) = f (y) si f (x) = f (y)). Par le théorème de continuité des fonctions
composées, la fonction g = f ◦ γ − v est une fonction de R dans R continue
sur [0, 1], et, par construction, elle est telle que
g(0)g(1) = (f (x) − v)(f (y) − v) ≤ 0.
Le théorème de Bolzano entraı̂ne donc l’existence d’au moins un τ ∈ [0, 1]
tel que g(τ ) = 0, c’est-à-dire de z = γ(τ ) ∈ E tel que f (z) = v.
4.4
Ouverts, fermés et bornés
Introduisons des familles importantes de parties de Rn qui jouent un rôle
important en analyse et qui conduiront à une extension du lemme de Cousin.
Définition. On dit que E ⊂ Rn est une partie ouverte ou un ouvert de Rn
si chaque élément de E est intérieur à E.
En d’autres termes, E est un ouvert s’il est voisinage de chacun de
ses points ou encore si int E ⊃ E, ce qui équivaut à int E = E, puisque
l’inclusion inverse est toujours satisfaite.
Par exemple, ∅ et Rn sont des ouverts de Rn , et ]a, b[ est un ouvert de
R. De même, si a ∈ R et b ∈ R, les ensembles
]a, +∞[ = {x ∈ R : x > a} et ] − ∞, b[ = {x ∈ R : x < b}
sont des ouverts de R (le vérifier). On les appelle respectivement des intervalles ouverts non bornés d’origine a et d’extrémité b.
Définition. On dit que F ⊂ Rn est une partie fermée ou un fermé de Rn si
tout point adhérent à F appartient à F .
En d’autres termes, F est un fermé si adh F ⊂ F , ce qui équivaut à
adh F = F , puisque l’inclusion inverse est toujours satisfaite.
Par exemple, ∅ et Rn sont des fermés de Rn , et [a, b] est un fermé de R.
D’autre part, ]a, b] et [a, b[ ne sont ni ouverts ni fermés dans R.
Les notions d’ouvert et de fermé s’échangent par passage au complémentaire.
Proposition. E ⊂ Rn est ouvert si et seulement si !E est fermé.
Démonstration. On a
!E est fermé ⇔ adh !E = !E ⇔ !int E = !E
127
4.4. OUVERTS, FERMÉS ET BORNÉS
⇔ int E = E ⇔ E est ouvert.
Par conséquent, si a ∈ R et b ∈ R, les ensembles
[a, +∞[ = {x ∈ R : x ≥ a} et ] − ∞, b] = {x ∈ R : x ≤ b}
sont des fermés de R puisqu’ils sont respectivement les complémentaires dans
R des ensembles ouverts ] − ∞, a[ et ]b, +∞[. On les appelle respectivement
des intervalles fermés non bornés d’origine a ou d’extrémité b.
Etudions maintenant comment se comportent les ouverts et les fermés
vis-à-vis des opérations d’union et d’intersection.
Le premier résultat affirme qu’une union quelconque d’ouverts est un
ouvert.
Proposition. Si A est un ensemble non vide quelconque et (Eα)α∈A une
!
famille d’ouverts Eα de Rn , alors α∈A Eα est un ouvert de Rn .
!
Démonstration. Si x ∈ α∈A Eα, il existe α̃ ∈ A tel que x ∈ Eα̃ . Comme
!
Eα̃ est ouvert, il est voisinage de x et il en sera donc de même de α∈A Eα.
Donc ce dernier ensemble, voisinage de chacun de ses points, est ouvert.
Le deuxième résultat affirme qu’une intersection d’un nombre fini d’ouverts est un ouvert.
Proposition. Si (Ej )1≤j≤m est une famille finie d’ouverts Ej de Rn , alors
7m
n
j=1 Ej est un ouvert de R .
Démonstration. Par une propriété de l’intérieur vis-à-vis de l’intersection, on a


int 
m
"
j=1
Ej  =
m
"
j=1
int Ej =
m
"
Ej .
j=1
Remarque. Ce résultat est faux si la famille n’est pas finie. Ainsi, pour
7
chaque k ∈ N∗ , ] − 1k , k1 [ est un ouvert de R, mais {0} = k∈N∗ ] − k1 , 1k [ ne
l’est pas.
En utilisant les lois de De Morgan et les trois propositions, on obtient
aisément les résultats suivants sur le comportement des fermés : une intersection quelconque de fermés est fermée; une union finie de fermés est
fermée.
128
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Proposition. Si A est un ensemble non vide quelconque et (Fα )α∈A une
7
famille de fermés Fα de Rn , alors α∈A Fα est un fermé de Rn .
Proposition. Si (Fj )1≤j≤m est une famille finie de fermés Fj de Rn , alors
n
j=1 Fj est un fermé de R .
!m
Remarque. La dernière proposition ne s’étend pas au cas d’une famille non
k
finie de fermés. Ainsi, pour chaque k ∈ N∗ , [0, k+1
] est un fermé de R, mais
!
k
k∈N∗ [0, k+1 ] = [0, 1[ n’est pas un fermé de R.
Exemples. 1. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, alors Bj [a; r] est un fermé
de Rn . Cela équivaut à montrer que
!Bj [a; r] = {x ∈ Rn : |x − a|j > r}
est ouvert. Soit x ∈ !Bj [a; r]. Alors, |x − a|j > r et il existe donc ! > 0 tel
que |x − a|j > r + !. Si y ∈ Bj [x; !], on a
|y − a|j = |(x − a) − (x − y)|j ≥ |x − a|j − |x − y|j > r + ! − ! = r,
c’est-à-dire Bj [x; !] ⊂ !Bj [a; r]; ce dernier ensemble est donc voisinage de
chacun de ses points.
2. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, posons
Bj (a; r) = {x ∈ Rn : |x − a|j < r}.
Alors Bj (a; r) est un ouvert de Rn . En effet, si x ∈ Bj (a; r), alors |x−a|j < r
et il existera un ! > 0 tel que |x − a|j < r − !. Dès lors, si y ∈ Bj [x; !], on a
|y − a|j = |(y − x) + (x − a)|j ≤ |y − x|j + |x − a|j < ! + r − ! = r,
c’est-à-dire Bj [x; !] ⊂ Bj (a; r). Donc Bj (a; r) est voisinage de chacun de ses
points.
Il est naturel d’appeler Bj (a; r) la boule ouverte de centre a et de rayon
r en norme j dans Rn . Pour n = 1 et j = 1, 2 ou ∞, Bj (a; r) = ]a − r, a + r[.
On a les relations suivantes entre Bj [a; r] et Bj (a; r).
Proposition. Si a ∈ Rn , r > 0 et j = 1, 2 ou ∞, alors
int Bj [a; r] = Bj (a; r), adh Bj (a; r) = Bj [a; r].
Démonstration. Comme Bj (a; r) ⊂ Bj [a; r] et que Bj (a; r) est un ouvert,
on a immédiatement
Bj (a; r) = int Bj (a; r) ⊂ int Bj [a; r],
129
4.4. OUVERTS, FERMÉS ET BORNÉS
et, pour démontrer la première égalité, il suffit de prouver que
int Bj [a; r] ⊂ Bj (a; r).
Si x ∈ int Bj [a; r], il existe ρ > 0 tel que Bj [x; ρ] ⊂ Bj [a; r]. Bien sûr,
x−a
|a − a|j = 0 < r. Si x /= a, x + ρ |x−a|
∈ Bj [a; r], et dès lors
j
#
#
&
'
#
#
x−a
ρ
#
#
− a# = 1 +
|x − a|j ≤ r,
#x + ρ
#
#
|x − a|j
|x − a|j
j
ce qui entraı̂ne
|x − a|j ≤
r
1+
ρ
|x−a|j
< r.
La démonstration de la deuxième égalité est similaire et laissée au lecteur.
On peut caractériser l’intérieur et l’adhérence d’une partie de Rn en
termes d’ouverts et de fermés.
Proposition. Soit G une partie de Rn . Alors int G est le plus grand ouvert
contenu dans G et adh G est le plus petit fermé contenant G.
Démonstration. Il faut démontrer que int G est un ouvert et que tout
ouvert contenu dans G est contenu dans int G, et que adh G est un fermé
contenu dans tout fermé qui contient G. C’est évident si G = ∅. Sinon,
démontrons le résultat sur l’intérieur, l’autre en résultant par les relations
entre intérieur et adhérence, ouvert et fermé et les lois de De Morgan. Soit
H l’union de tous les ouverts de Rn contenus dans G; on a vu que c’était
un ouvert et, par construction, c’est le plus grand ouvert contenu dans G. Il
reste à montrer que H = int G. Comme H ⊂ G, on aura H = int H ⊂ int G
et il reste à montrer que int G ⊂ H. Si x ∈ int G, alors il existe r > 0 tel
que B2 [x; r] ⊂ G et donc tel que B2 (x; r) ⊂ G. Comme B2 (x; r) est ouvert,
on voit que x appartient à un ouvert contenu dans G, et donc x appartient
à H.
Enfin, la caractérisation des points adhérents par les suites fournit une
caractérisation semblable pour les fermés : une partie de Rn est fermée si et
seulement si elle contient les limites de toutes ses suites convergentes.
Proposition. F ⊂ Rn est fermé si et seulement si, pour toute suite (ak )k∈N
dans F qui converge vers a ∈ Rn , on a a ∈ F .
Démonstration. Condition nécessaire. Par hypothèse, F = adh F . Soit
(ak )k∈N une suite dans F qui converge vers a ∈ Rn . Alors, a ∈ adh F = F.
130
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Condition suffisante. Soit a ∈ adh F ; alors il existe une suite (ak )k∈N dans
F qui converge vers a. Mais alors, a ∈ F , et donc adh F ⊂ F et F est fermé.
Rappelons la notion de partie bornée déjà introduite précédemment.
Définition. On dit que B ⊂ Rn est une partie bornée ou un borné de Rn
s’il existe ρ > 0 tel que B ⊂ B2 [ρ].
On peut évidemment remplacer B2 [ρ] par B1 [ρ] ou par B∞ [ρ] dans la
définition. Ainsi, pour a ∈ Rn , r > 0 et j = 1, 2 ou ∞, Bj [a; r] est une partie
bornée de Rn puisque, pour tout x ∈ Bj [a; r], on a
|x|j = |(x − a) + a|j ≤ |x − a|j + |a|j ≤ r + |a|j ,
et donc Bj [a; r] ⊂ Bj [r + |a|j ]. Il est clair aussi que toute partie d’un borné
de Rn est un borné de Rn . En particulier, Bj (a; r) est un borné de Rn .
Les propriétés des bornés par rapport à l’union et l’intersection sont
analogues à celles des fermés. Leur démonstration est très facile et laissée
au lecteur.
Proposition. Si A est un ensemble quelconque non vide et (Bα )α∈A est
7
une famille de bornés Bα de Rn , alors α∈A Bα est un borné de Rn .
Proposition. Si (Bj )1≤j≤m est une famille finie de bornés Bj de Rn , alors
n
j=1 Bj est un borné de R .
!m
Le lemme de Cousin s’étend aux ensembles fermés et bornés.
Théorème. Soit F un fermé borné non
vide de Rn . Alors, pour chaque
A j j B
jauge δ sur F , il existe une famille finie (x , F ) 1≤j≤m telle que
F =
m
>
Fj
j=1
et telle que, pour chaque 1 ≤ j ≤ m, on ait
xj ∈ F j ⊂ B∞ [xj ; δ(xj )].
Démonstration. Puisque F est borné, il existe ρ > 0 tel que F ⊂ B∞ [ρ].
Soit I = ] − ρ, ρ] × . . . × ] − ρ, ρ] le semi-pavé de Rn tel que I¯ = B∞ [ρ].
Définissons comme suit la jauge δ̃ sur Rn . Si x ∈ F, posons δ̃(x) = δ(x). Si
x ∈ !F, il existe, puisque !F est ouvert, un r(x) > 0 tel que B∞ [x; r(x)] ⊂
!F ; posons alors δ̃(x) = r(x). Comme la restriction de δ̃ à I¯ est une jauge
131
4.4. OUVERTS, FERMÉS ET BORNÉS
¯
sur
8 I, le9 lemme de Cousin implique l’existence d’une P-partition δ̃-fine
k
(y , J k )
de I. Si k est tel que y k ∈ !F, on a donc δ̃(y k ) = r(y k ),
1≤k≤q
et
J k ⊂ B∞ [y k ; δ̃(y k )] = B∞ [y k ; r(y k )] ⊂ !F.
Dès lors,
F = F ∩ I¯ = F ∩
=
&
Jk
k=1
>
{1≤k≤q
q
>
'
=
q
>
k=1
(F ∩ J k )
(F ∩ J k ).
: yk ∈F }
Si 1 ≤ k1 < k2 < . . . < km ≤ q sont les valeurs de k telles que y k ∈ F , et si
l’on pose
8
9
8
9
(xj , F j )
= (y kj , F ∩ J kj )
,
1≤j≤m
1≤j≤m
(c’est-à-dire si l’on renumérote les (y k , F ∩ J k ) correspondant aux k tels que
y k ∈ F ), on voit que
m
>
j=1
Fj =
m
>
j=1
(F ∩ J kj ) =
>
{1≤k≤q
(F ∩ J k ) = F,
: yk ∈F }
et, pour chaque 1 ≤ j ≤ m, on a
xj = y kj ∈ F ∩ J kj = F j ⊂ J kj ⊂ B∞ [y kj ; δ̃(y kj )] = B∞ [xj ; δ(xj )].
Remarque. La démonstration du lemme de Cousin fournit en fait des F j
fermés (1 ≤ j ≤ n).
Définition. Soit E une partie de
Rn et δ une jauge sur E. Une division
A j j B
!
j
δ-fine de E est une famille finie (x , E ) 1≤j≤m telle que E = m
j=1 E et
telle que, pour chaque 1 ≤ j ≤ m, on ait
xj ∈ E j ⊂ B∞ [xj ; δ(xj )].
Le lemme de Cousin affirme donc que, si F ⊂ Rn est un fermé borné,
alors, pour toute jauge δ sur F , il existe une division δ-fine de F . Montrons
que cette propriété, parfois appelée propriété de Cousin, caractérise les
fermés bornés.
132
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Proposition. Une partie E de Rn est fermée et bornée si et seulement si,
pour toute jauge δ sur E, il existe une division δ-fine de E.
Démonstration. La condition nécessaire résulte du lemme de Cousin pour
les fermés bornés que nous venons de démontrer. Supposons maintenant que
E ait la propriété de Cousin. Montrons tout d’abord que E est borné. En
prenant
sur E la jauge constante de valeur 1, on obtient une division 1-fine
A j j B
(x , E ) 1≤j≤m . Comme chaque E j , contenu dans le borné B∞ [xj ; 1] est
borné, E, union finie de bornés, est borné. Montrons maintenant que E
est fermé ou, ce qui est équivalent, que !E est ouvert, c’est-à-dire voisinage
de chacun de ses points. Soit a ∈ !E; définissons la jauge δ sur E par
δ(x) = 12 |x − a|∞ pour chaque x ∈ E. Par construction, pour chaque x ∈ E,
a
∈ !B [x; δ(x)]. Par la propriété de Cousin, il existe une division δ-fine
A j j∞B
(x , E ) 1≤j≤m et
E=
m
>
j=1
Ej ⊂
m
>
j=1
B∞ [xj ; δ(xj )] = F.
Par construction, F ⊃ E est fermé et a /∈ F , c’est-à-dire !F ⊂ !E est un
ouvert contenant a.
4.5
Continuité uniforme
Si une fonction est continue en un point a, ses valeurs seront arbitrairement
proches de f (a) si l’on se restreint à des points suffisamment proches de a.
On peut en déduire la propriété locale un peu plus forte suivante.
Lemme. Soit f une fonction de Rn dans Rp continue en a ∈ dom f . Alors,
pour chaque ! > 0, il existe un δ = δ(a; !) > 0 tel que, pour tout x ∈
dom f ∩ B∞ [a; δ] et tout y ∈ dom f tel que |y − x|∞ ≤ δ, on a
|f (x) − f (y)|∞ ≤ !.
Démonstration. Soit ! > 0; puisque f est continue en a, il existe δ̃ =
δ̃(a; !) > 0 tel que, pour tout x ∈ dom f vérifiant |x − a|∞ ≤ δ̃, on ait
!
|f (x) − f (a)|∞ ≤ .
2
Posons δ = 2δ̃ , et soient x ∈ dom f ∩B∞ [a; δ] et y ∈ dom f tel que |y −x|∞ ≤
δ. Alors,
|y − a|∞ = |(y − x) + (x − a)|∞ ≤ |y − x|∞ + |x − a|∞ ≤ δ + δ = δ̃,
133
4.5. CONTINUITÉ UNIFORME
et dès lors,
|f (y) − f (x)|∞ ≤ |f (y) − f (a)|∞ + |f (a) − f (x)|∞ ≤
!
!
+ = !.
2 2
Remarque. La conclusion du lemme n’implique pas que f soit continue
en x ∈ (dom f ∩ B∞ [a; δ]) \ {a} ! En effet, l’ensemble dom f ∩ B∞ [a; δ]
des x autorisés pour que l’inégalité soit satisfaite dépend de δ, et donc d’!.
Rappelons à cet effet l’exemple donné précédemment d’une fonction de R
dans R qui n’est continue qu’en 0.
Lorsque f est continue sur un fermé borné de Rn , on peut utiliser le
lemme de Cousin pour obtenir une version globale du lemme : c’est le
théorème de Heine.
Théorème. Soit f une fonction de Rn dans Rp continue sur le fermé borné
E de Rn . Alors, pour chaque ! > 0, il existe un δE > 0 tel que, pour tout
x ∈ E et tout y ∈ dom f tel que |y − x|∞ ≤ δE , on a |f (y) − f (x)|∞ ≤ !.
Démonstration. Si ! > 0 est fixé, alors, par l’hypothèse de continuité de
f sur E et le lemme ci-dessus, on sait que,
(∀a ∈ E)(∃δ = δ(a) > 0)(∀x ∈ dom f ∩ B∞ [a; δ])(∀y ∈ dom f ∩ B∞ [x; δ]) :
|f (y) − f (x)|∞ ≤ !.
(4.2)
Soit δ : a 2→ δ(a) la jauge
ainsi définie
sur E. Par le lemme de Cousin, il
A
B
existe une division δ-fine (aj , E j ) 1≤j≤m de E. Posons
δE = min{δ(aj ) : 1 ≤ j ≤ m},
et soit x ∈ E et y ∈ dom f tel que |y − x|∞ ≤ δE . Il existe donc un entier
1 ≤ l ≤ m tel que x ∈ E l , et donc tel que |x − al |∞ ≤ δ(al ); comme en outre
|y − x|∞ ≤ δE ≤ δ(al ), (4.2) implique que |f (y) − f (x)|∞ ≤ !.
Rappelons que la continuité de f en chaque point x de E équivaut à la
propriété suivante :
(∀x ∈ E)(∀! > 0)(∃δ > 0)(∀y ∈ dom f : |y − x|∞ ≤ δ) :
|f (y) − f (x)|∞ ≤ !,
(4.3)
134
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
montrant clairement que le δ peut dépendre à la fois d’! et de x. La propriété
que nous venons démontrer dans le théorème de Heine est la suivante :
(∀! > 0)(∃δ > 0)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ) :
(4.4)
|f (y) − f (x)|∞ ≤ !.
Dans (4.4), on a la propriété plus forte que δ ne dépend que d’! et convient
pour chaque x ∈ E. On est ainsi conduit à la définition suivante.
Définition. Soit f une fonction de Rn dans Rp et E ⊂ Rn . On dit que f
est uniformément continue sur E si f est définie sur E et vérifie la propriété
(4.4).
Bien entendu, toute fonction uniformément continue sur un ensemble E
est continue sur E, et le théorème de Heine montre que la réciproque est
vraie lorsque E est fermé et borné. Une fonction continue sur un ensemble
E peut ne pas y être uniformément continue si E n’est pas fermé ou n’est
pas borné. C’est ce que montrent les exemples suivants. On notera que,
dans (4.4), on peut toujours demander que le δ cherché soit inférieur à une
quantité fixe donnée.
Exemples. 1. La fonction f de R dans R définie par f (x) = x1 est continue
sur le borné (non fermé) ]0, 1] mais n’y est pas uniformément continue. En
effet, pour chaque δ ∈ ]0, 1], si l’on prend x = δ et y = 2δ, on a |y − x| = δ,
#
#
#1
1 ##
1
1
1
#
|f (x) − f (y)| = # − # =
≥ > ,
δ
2δ
2δ
2
4
et la négation de (4.4) est satisfaite.
2. La fonction f de R dans R définie par f (x) = x2 est continue sur le fermé
(non borné) [0, +∞[ mais n’y est pas uniformément continue. En effet, pour
chaque δ > 0, si l’on prend x = 1δ et y = 1δ + δ, on a |y − x| = δ,
|f (x) − f (y)| = 2 + δ 2 > 2,
et la négation de (4.4) est satisfaite.
Remarque. Le lecteur se convaincra sans peine de l’équivalence de la condition (4.3) de continuité de f sur E ⊂ dom f avec la propriété :
(∀! > 0)(∃δ, jauge sur E)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ(x)) :
|f (y) − f (x)|∞ ≤ !,
4.6. IMAGES PAR UNE FONCTION CONTINUE
135
et de l’équivalence de la condition (4.4) de continuité uniforme de f sur
E ⊂ dom f avec la propriété :
(∀! > 0)(∃δ, jauge constante sur E)(∀x ∈ E)(∀y ∈ dom f : |y − x|∞ ≤ δ) :
|f (y) − f (x)|∞ ≤ !.
4.6
Images par une fonction continue
Nous allons étudier, dans cette section la préservation des propriétés des
ensembles lorsqu’on prend leur image directe ou réciproque par une fonction
continue. Les propriétés que nous aurons en vue sont celles rencontrées dans
ce chapitre, c’est-à-dire la connexité par arcs, le caractère ouvert, le caractère
fermé et le caractère borné.
Notons tout d’abord que la fonction f identiquement nulle sur l’ensemble
R \ {0} y est évidemment continue et que l’image réciproque f −1 ({0}) de
l’ensemble connexe par arcs {0} est égale à R \ {0} qui n’est pas connexe
par arcs puisque, si x < 0 < y sont deux points de R \ {0}, toute application
continue γ : [0, 1] → R telle que γ(0) = x et γ(1) = y s’annule, par le
théorème de Bolzano, en un τ ∈ [0, 1] au moins, et son image n’appartient
donc pas à R \ {0}. Par contre, les images directes par une fonction continue
d’ensembles connexes par arcs sont connexes par arcs.
Proposition. Soit f une fonction de Rn dans Rp continue sur une partie
connexe par arcs E de Rn . Alors f (E) est connexe par arcs.
Démonstration. Soient u ∈ f (E) et v ∈ f (E). Il existe donc x ∈ E et
y ∈ E tels que u = f (x) et v = f (y). Comme E est connexe par arcs, il
existe une application continue γ : [0, 1] → E telle que γ(0) = x et γ(1) = y.
En conséquence, f ◦ γ est une application continue de [0, 1] dans f (E) telle
que (f ◦ γ)(0) = u et (f ◦ γ)(1) = v.
Si f est une application constante de l’ouvert E de Rn , alors f (E) est
un singleton et n’est donc pas un ouvert. Par contre, les images réciproques
d’ouverts par des fonctions continues sont des ouverts, et cette propriété
caractérise d’ailleurs les fonctions continues.
Proposition. Soit f une fonction de Rn dans Rp et E une partie de dom f .
Alors f est continue sur E si et seulement si, pour tout ouvert B de Rp, il
existe un ouvert A de Rn tel que
f −1 (B) ∩ E = A ∩ E.
136
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Démonstration. Condition nécessaire. Soit B un ouvert de Rp ; si
f −1 (B) ∩ E = ∅,
il suffit de prendre A = ∅. Sinon, soit a ∈ f −1 (B) ∩ E. B est donc un
voisinage de f (a) et, f étant continue en a, il existera un voisinage Ua de
a, que l’on peut toujours prendre ouvert (puisque, par exemple, il contient
toujours une boule ouverte centrée en a) tel que f (Ua ∩ E) ⊂ B, c’est-à-dire
tel que
Ua ∩ E ⊂ f −1 (B) ∩ E.
Si nous posons
A=
>
Ua ,
a∈f −1(B)∩E
alors A est un ouvert de Rn tel que
f −1 (B) ∩ E ⊂ A ∩ E ⊂ f −1 (B) ∩ E.
Condition suffisante. Soit a ∈ E et montrons que f est continue en a. Si V
est un voisinage de f (a), il existe un ouvert B de Rp tel que f (a) ∈ B ⊂ V
(par exemple un boule ouverte centrée en f (a) de rayon suffisamment petit).
Par hypothèse, on peut donc trouver un ouvert A de Rn tel que f −1 (B)∩E =
A ∩ E. Comme a ∈ f −1 (B) ∩ E, a ∈ A et A est un voisinage de a tel que
f (A ∩ E) = f (f −1 (B) ∩ E) ⊂ B ⊂ V.
Donc f est continue en a.
L’image directe d’un fermé E de Rn par une fonction continue sur E
n’est pas nécessairement fermée, ainsi que le montre la fonction f de R dans
x
R définie par f (x) = 1+|x|
, qui est continue sur R et telle que le fermé R a
pour image ] − 1, 1[ qui n’est pas fermé. Comme pour les ouverts, les fermés
de conservent par image réciproque, et cette propriété caractérise également
les fonctions continues.
Proposition. Soit f une fonction de Rn dans Rp et E ⊂ dom f . Alors f
est continue sur E si et seulement si, pour tout fermé B de Rp , il existe un
fermé A de Rn tel que
f −1 (B) ∩ E = A ∩ E.
Démonstration. Elle se fonde sur le résultat correspondant pour les ouverts, le fait que le complémentaire d’un fermé est un ouvert et les propriétés
élémentaires des fonctions et des graphes. Ses détails sont laissés au lecteur.
4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 137
En particulier, on a la propriété suivante de l’ensemble des zéros d’une
fonction continue.
Corollaire. Soit f une fonction de Rn dans Rp continue sur E ⊂ Rn . Il
existe un fermé A de Rn tel que
f −1 ({0}) ∩ E = A ∩ E.
L’image directe d’un borné par une fonction continue n’est pas nécessairement bornée, ainsi que le montre l’exemple de la fonction f de R dans R
définie par f (x) = x1 . Elle est continue sur le borné ]0, 1] et f (]0, 1]) =]0, +∞[
n’est pas borné. L’image réciproque d’un borné par une fonction continue
n’est pas non plus nécessairement bornée comme le montre l’exemple de
l’application nulle sur R : l’image réciproque de tout borné contenant {0}
est R tout entier. Nous avons vu toutefois qu’une fonction f continue en
un point a est localement bornée en ce point, ce qui signifie qu’il existe une
boule B∞ [a; δ] centrée en a et de rayon δ = δ(a) telle que f (B∞ [a; δ]) soit
bornée. La caractérisation des fermés bornés par la propriété de Cousin va
nous permettre de globaliser ce résultat local.
Proposition. Si E ⊂ Rn est fermé et borné et si f est une fonction de Rn
dans Rp continue sur E, alors f (E) est fermé et borné.
Démonstration. On va montrer que f (E) possède la propriété de Cousin.
Soit ! une jauge sur f (E). Comme, pour chaque x ∈ E, f est continue en x,
si l’on prend !(f (x)) dans la définition correspondante, il existera δ(x) > 0
tel que
f (E ∩ B∞ [x; δ(x)]) ⊂ B∞ [f (x); !(f (x))].
On définit ainsi sur E une jauge δA : x 2→ δ(x),
et le lemme de Cousin entraı̂ne
B
l’existence d’une division δ-fine (xj , E j ) 1≤j≤m de E. En conséquence, si,
pour chaque 1 ≤ j ≤ m, on pose y j = f (xj ), on a
f (E j ) ⊂ f (B∞ [xj ; δ(xj )] ∩ E) ⊂ B∞ [y j ; !(y j )],
!
!
m
j
j
y j ∈ f (E j ), et f (E) = f ( m
pour chaque
j=1 E ) =
j=1 f (E ). AEn posant,
B
j
j
1 ≤ j ≤ m, F = f (E ), on obtient une division (y j , F j ) 1≤j≤m !-fine de
f (E).
4.7
Théorème des bornes atteintes et extrémants
La proposition que nous venons de démontrer peut être précisée dans le cas
d’une fonction à valeurs réelles : c’est le théorème des bornes atteintes
138
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
ou théorème de Weierstrass et l’on peut en donner une démonstration
directe indépendante des résultats de la section précédente.
Théorème. Soit E un fermé borné de Rn et f une fonction de Rn dans R
continue sur E. Alors, il existe u ∈ E et v ∈ E tels que, pour tout x ∈ E,
on ait
f (u) ≤ f (x) ≤ f (v).
(4.5)
Démonstration. Notons tout d’abord qu’il suffit de démontrer l’existence
d’un v ∈ E pour lequel l’inégalité de droite dans (4.5) est vérifiée car celle
de u se déduit alors de ce résultat appliqué à −f . Supposons qu’un tel v
n’existe pas; alors,
(∀v ∈ E)(∃xv ∈ E) : f (xv ) > f (v).
Choissons ! = 12 (f (xv ) − f (v)) dans la définition de la continuité de f en v;
on obtient ainsi un δ = δ(v) > 0 tel que
(∀y ∈ dom f ∩ B∞ [v; δ(v)]) : f (y) − f (v) ≤
1
(f (xv ) − f (v)),
2
et dès lors
(∀y ∈ dom f ∩ B∞ [v; δ(v)]) : f (y) ≤
1
(f (xv ) + f (v)) < f (xv ).
2
(4.6)
En appliquant le lemme de Cousin à AE pour Bla jauge δ : v 2→ δ(v) ainsi
obtenue, on obtient une division δ-fine (v j , E j ) 1≤j≤m de E. Soit 1 ≤ l ≤ m
tel que
f (xvl ) = max{f (xvj ) : 1 ≤ j ≤ m}.
Si y ∈ E, il existe un 1 ≤ i ≤ m tel que y ∈ E i ⊂ E ∩ B∞ [v i ; δ(v i)], et donc
tel que
f (y) < f (xvi ) ≤ f (xvl ).
En prenant y = xvl dans cette inégalité, on obtient une contradiction.
Remarque. Le théorème de Weierstrass est faux si E n’est pas fermé ou
n’est pas borné. Ainsi, l’identité sur R est continue sur ]0, 1[ mais il n’existe
ni u ∈ ]0, 1[ ni v ∈ ]0, 1[ tels que, pour tout x ∈ ]0, 1[, on ait u ≤ x ≤ v (le
montrer par l’absurde). De même il n’existe ni u ∈ R ni v ∈ R tels que, pour
tout x ∈ R, on ait u ≤ x ≤ v.
Donnons quelques conséquences utiles du théorème de Weierstrass.
4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 139
Corollaire. Soit E un fermé borné de Rn et f une fonction de Rn dans R
continue sur E et strictement positive en chaque point de E. Alors il existe
r > 0 tel que, pour tout x ∈ E, on a f (x) ≥ r.
Démonstration. Par le théorème de Weierstrass, il existe u ∈ E tel que,
pour tout x ∈ R, on ait
f (x) ≥ f (u) (> 0).
Il suffit donc de prendre r = f (u).
Remarque. Le premier exemple de la remarque précédente montre que le
Corollaire est faux si E n’est pas fermé. D’ailleurs, le Corollaire est faux si E
n’est pas borné car la fonction x 2→ x1 est continue sur [1, +∞[ et il n’existe
pas de r > 0 tel que x1 ≥ r pour tout x ≥ 1 (le vérifier).
Corollaire. Soit f une fonction de R dans R continue et non constante sur
[a, b]. Alors il existe u ∈ [a, b] et v ∈ [a, b] tels que
f ([a, b]) = [f (u), f (v)].
Démonstration. Par le théorème de Weierstrass et le fait que f n’est pas
constante, il existe u ∈ [a, b] et v ∈ [a, b] tels que f (u) < f (v) et
f ([a, b]) ⊂ [f (u), f (v)].
D’autre part, si d ∈ [f (u), f (v)], le théorème des valeurs intermédiaires entraı̂ne l’existence d’un c ∈ [a, b] tel que f (c) = d, et dès lors [f (u), f (v)] ⊂
f ([a, b]).
Remarque. Le Corollaire que nous venons de démontrer montre que l’image
d’un intervalle fermé par une fonction continue non constante est un inter1
valle fermé. L’exemple de la fonction x 2→ 1−x
2 continue sur ] − 1, 1[ montre
que l’image d’un intervalle ouvert n’est pas nécessairement un intervalle ouvert.
Corollaire. Soit E un fermé non borné de Rn et f une fonction de Rn dans
R continue sur E et telle que
f (x) → +∞ si x → ∞.
Alors il existe un y ∈ E tel que, pour tout x ∈ E, on ait
f (y) ≤ f (x).
140
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Démonstration. Soit a ∈ E fixé; par hypothèse, il existe ρ > 0 tel que,
pour tout x ∈ E vérifiant |x|2 > ρ, on a f (x) > f (a). En particulier, |a|2 ≤ ρ.
Comme E ∩ B2 [ρ] est un fermé borné, le théorème de Weierstrass entraı̂ne
l’existence d’un y ∈ E ∩ B2 [ρ] tel que, pour tout x ∈ E ∩ B2 [ρ], on ait
f (y) ≤ f (x).
En particulier, f (y) ≤ f (a), et dès lors, pour tout x ∈ E tel que |x|2 > ρ, on
aura
f (y) ≤ f (a) < f (x).
Ce corollaire fournit une intéressante démonstration du théorème de
d’Alembert ou théorème fondamental de l’algèbre qui généralise le
résultat que nous avons déjà obtenu pour un polynôme de la forme z n − c.
Corollaire. Tout polynôme sur C de degré supérieur ou égal à un possède
au moins un zéro.
%
k
Démonstration. Soit p : C → C, z 2→ m
k=0 ak z un polynôme de degré
m ≥ 1. On a donc, pour chaque 0 ≤ k ≤ m, ak ∈ C et am /= 0. Montrons
d’abord l’existence d’un u ∈ C tel que, pour tout z ∈ C, on a
(4.7)
|p(z)| ≥ |p(u)|.
Pour ce faire, on note que l’application |p| : C 2→ R est continue et que, pour
tout z /= 0, on a
#
&
'#
&
'
m−1
m−1
#
#
$ ak
$ |ak |
#
m
k−m #
m
k−m
|p(z)| = #am z
1+
z
1−
.
|z|
# ≥ |am ||z|
#
#
am
|am |
k=0
k=0
Puisque
m−1
$
k=0
il existera ρ > 0 tel que
|ak | k−m
→ 0 si z → ∞,
|z|
|am |
m−1
$
k=0
|ak | k−m 1
≤
|z|
|am |
2
pour tout z ∈ C tel que |z| ≥ ρ. On a donc, si |z| ≥ ρ,
|p(z)| ≥
|am | m
|z| ,
2
4.7. THÉORÈME DES BORNES ATTEINTES ET EXTRÉMANTS 141
et dès lors
|p(z)| → +∞ si z → ∞,
L’existence d’un u ∈ C vérifiant (4.7) résulte du corollaire précédent.
La deuxième partie de la démonstration consiste à montrer que p(u) = 0.
Si p(u) /= 0, la fonction q définie par q(z) = p(u+z)
p(u) est un polynôme sur C
de degré m tel que q(0) = 1 et |q(z)| ≥ 1 pour tout z ∈ C. En conséquence,
q est de la forme
q(z) = 1 +
m
$
bk z k ,
k=j
avec 1 ≤ j ≤ m, bj /= 0, bm /= 0. Soit r > 0 tel que r j |bj | < 1. Pour
b̄
tout z ∈ C tel que z j = −r j |bjj | , (et l’existence d’un tel z a été démontrée
précédemment), on a
|z| = r, 1 + bj z j = 1 − r j |bj | > 0,
et dès lors
|q(z)| ≤ |1 + bj z j | +
m
$
k=j+1

|bk ||z|k = 1 − r j |bj | +
= 1 − r j |bj | −
m−j
$
k=1
m
$
k=j+1
|bk |r k

|bj+k |r k  .
On en déduit aussitôt que |q(z)| < 1 si l’on diminue éventuellement r > 0
de telle sorte que
m−j
$
k=1
ce qui est contradictoire.
|bj+k |r k < |bj |,
Le résultat du théorème de Weierstrass conduit à la terminologie suivante
pour les fonctions à valeurs réelles.
Définition. Soit f une fonction de Rn dans R et E ⊂ dom f . On dit que
a ∈ E est un maximant (resp. minimant) de f sur E, ou encore que f
possède en a un maximum (resp. minimum) sur E, si, pour tout x ∈ E, on
a
f (x) ≤ f (a) (resp. f (x) ≥ f (a)).
142
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
On écrit dans ce cas
f (a) = max f (resp. f (a) = min f ),
E
E
ou
f (a) = max f (x) (resp. f (a) = min f (x)),
x∈E
x∈E
ou encore
f (a) = max{f (x) : x ∈ E} (resp. f (a) = min{f (x) : x ∈ E}).
On dit également que a ∈ E est un extrémant de f sur E (ou que f possède
un extrémum sur E) si a est un minimant ou est un maximant de f sur E.
Le théorème de Weierstrass montre donc que toute fonction réelle continue sur un fermé borné E possède un maximum et un minimum sur E. Il
ne fournit malheureusement aucune information quant à la localisation du
minimant et du maximant correspondant. De telles informations peuvent
se déduire de conditions nécessaires pour qu’un point de Rn soit extrémant
sur E d’une fonction de Rn dans R. De telles conditions nécessaires peuvent s’obtenir plus généralement dans le cas d’extrémants locaux, ce qui nous
conduit à localiser les notions de maximant et de minimant.
Définition. Soit f une fonction de Rn dans R et E ⊂ dom f . On dit que
a ∈ E est un maximant (resp. minimant) local de f sur E s’il existe un δ > 0
tel que a soit un maximant (resp. minimant) de f sur E ∩ B2 [a; δ]. Cette
propriété s’exprime également en disant que f possède en a un maximum
(resp. minimum) local sur E. On appellera généralement extrémant local
de f sur E un point de E qui est maximant local ou minimant local de f
sur E.
Tout maximant (resp. minimant) de f sur E est évidemment un maximant (resp. minimant) local de f sur E. Par contre, l’application f : x 2→
x3
3 − x de R dans R a un maximant local sur R en −1 et un minimant local
sur R en 1, mais n’a ni maximant ni minimant sur R.
Les extrémants locaux les plus simples à étudier sont ceux qui sont
intérieurs au domaine de la fonction. Ils ont droit à une terminologie propre.
Définition. Soit f une fonction de Rn dans R. On dit que a ∈ Rn est un
maximant (resp. minimant) local libre de f si a ∈ int dom f et si a est un
maximant (resp. minimant) local de f sur Rn . Un extrémant local libre de
f est un point qui est maximant ou minimant local libre de f .
Par exemple, les extrémants locaux de l’application x 2→
plus haut sont libres.
x3
3 −x
considérée
4.8. THÉORÈMES DE FERMAT ET DE ROLLE
143
Les deux notions locales que nous venons d’introduire sont liées par la
Proposition suivante.
Proposition. Soit f une fonction de Rn dans R, E ⊂ dom f et a ∈ E. Si a
est maximant (resp. minimant) local libre de f , alors a est maximant (resp.
minimant) local de f sur E. Si a est maximant (resp. minimant) local de f
sur E et si a ∈ int E, alors a est maximant (resp. minimant) local libre de
f.
Démonstration. La première assertion est immédiate. La seconde résulte
aisément du fait que, puisque E est voisinage de a, E ∩B2 [a; δ] sera voisinage
de a quel que soit δ > 0.
Définition. Soit f une fonction de Rn dans R, E ⊂ dom f et a ∈ E. On
dira que a est maximant (resp. minimant) local lié de f sur E si a n’est
pas intérieur à E et est maximant (resp. minimant) local de f sur E. Un
extrémant local lié de f sur E sera un maximant ou un minimant local lié
de f sur E.
3
Ainsi, pour l’application f : x 2→ x3 − x de R dans R considérée plus
haut, 0 est un extrémant local lié de f sur E = [0, +∞[ et sur E = ] − ∞, 0].
4.8
Théorèmes de Fermat et de Rolle
On peut obtenir d’intéressantes conditions nécessaires d’existence d’un extrémant local libre d’une fonction de Rn dans R lorsque f possède en ce
point une dérivée directionnelle. C’est ce qu’exprime le résultat suivant,
appelé théorème de Fermat pour rappeler une condition similaire trouvée,
dans le cas d’un polynôme réel, par Pierre de Fermat, en 1629, c’est-à-dire
environ cinquante ans avant l’invention du calcul différentiel, et que Johannes
Kepler avait déjà exprimée d’une manière qualitative en 1615, en observant
qu’une fonction réelle varie très peu au voisinage d’un extrémum.
Théorème. Soit f une fonction de Rn dans R et a un extrémant local libre
de f . Si f possède en a une dérivée dans la direction u, alors f $ (a; u) = 0.
Démonstration. Supposons pour fixer les idées que a soit un maximant
local libre de f (sinon, il suffit de considérer −f .) Par hypothèse, on peut
donc trouver r > 0 tel que B2 [a; r] ⊂ dom f et tel que, pour tout x ∈ B2 [a; r],
on ait
f (x) ≤ f (a).
144
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
En particulier, pour tout réel t tel que 0 < |t| ≤ r, on aura a + tu ∈ B2 [a; r],
et dès lors
f (a + tu) − f (a) ≤ 0.
En conséquence, pour 0 < t ≤ r, on aura
f (a + tu) − f (a)
≤ 0,
t
d’où, en faisant tendre t vers 0,
f $ (a; u) =
f (a + tu) − f (a)
≤ 0.
t→0; t>0
t
lim
De même, pour −r ≤ t < 0, on aura
f (a + tu) − f (a)
≥ 0,
t
d’où, en faisant tendre t vers 0,
f $ (a; u) =
f (a + tu) − f (a)
≥ 0.
t→0; t<0
t
lim
Par conséquent, f $ (a; u) = 0.
Remarques. 1. La condition de Fermat n’est nullement suffisante pour que
a soit extrémant local libre de f ; ainsi, pour l’application f de R définie par
f (x) = x3 , on a f $ (0) = 0, et pourtant 0 n’est ni maximant, ni minimant
local libre de f , puisque x3 < 0 si x < 0 et x3 > 0 si x > 0.
2. La condition de Fermat n’est nullement nécessaire si a est un extrémant
local lié de f ; ainsi l’application identité sur R possède en 0 un minimant
local sur E = [0, +∞[ et f $ (0) = 1.
Corollaire. Si f est une fonction de Rn dans R qui possède en a ∈ Rn
un extrémant local libre et des dérivées partielles par rapport à toutes les
variables, alors on a
D1 f (a) = D2 f (a) = . . . = Dn f (a) = 0.
En particulier, si f est dérivable en un extrémant local libre a, on a fa$ = 0.
Démonstration. C’est une conséquence immédiate du théorème de Fermat et du lien entre dérivée totale et dérivées partielles.
Ce corollaire conduit à la définition suivante.
4.8. THÉORÈMES DE FERMAT ET DE ROLLE
145
Définition. Soit f une fonction de Rn dans R et a ∈ dom f tel que, pour
chaque 1 ≤ k ≤ n, Dk f (a) existe. On dit que a est un point critique ou un
point stationnaire de f si, pour chaque 1 ≤ k ≤ n, on a Dk f (a) = 0. f (a)
est alors appelée une valeur critique de f .
Le Corollaire du théorème de Fermat affirme donc que tout extrémant
local libre de f en lequel f possède des dérivées partielles par rapport à chaque
variable est un point critique de f . L’exemple ci-dessus montre qu’un point
critique n’est pas nécessairement extrémant local libre. Lorsque n = 1,
un point critique qui n’est pas extrémant local libre est appelé un point
d’inflexion. Lorsque n ≥ 2, un point critique qui n’est pas extrémant local
libre est appelé un col ou un point de selle. Un exemple est donné par 0 pour
l’application f de R2 dans R définie par f (x1 , x2 ) = x1 x2 . On a en effet
D1 f (0, 0) = 0 = D2 f (0, 0),
ce qui montre que 0 est un point critique de f , mais, pour tout r > 0,
f (r, r) = r 2 > 0 = f (0, 0) > f (r, −r) = −r 2 ,
ce qui montre que 0 ne peut être ni maximant local libre, ni minimant local
libre.
Une conséquence très utile des théorèmes de Weierstrass et de Fermat est
une condition suffisante d’existence d’un point critique, appelé théorème
généralisé de Rolle, en référence à un cas particulier pour des polynômes
réels énoncé en 1691 par Michel Rolle (qui fut pourtant un farouche adversaire du calcul différentiel naissant).
Théorème. Soit f une fonction de Rn dans R et E une partie de Rn vérifiant
les conditions suivantes.
1. E est fermé, borné et d’intérieur non vide.
2. f est continue sur E.
3. Pour chaque 1 ≤ k ≤ n, Dk f (x) existe en chaque x ∈ int E.
4. f est constante sur fr E.
Alors, f possède au moins un point critique c ∈ int E.
Démonstration. Si f est constante sur E, alors pour chaque a ∈ int E,
on a fa$ = 0 et le théorème est démontré. Si f n’est pas constante sur E, le
théorème des bornes atteintes de Weierstrass entraı̂ne l’existence d’un u ∈ E
et d’un v ∈ E tels que, pour tout x ∈ E, on ait f (u) ≤ f (x) ≤ f (v), et,
comme f n’est pas constante sur E, on a nécessairement f (u) < f (v), et
donc u /= v. Comme f est constante sur fr E, u et v ne peuvent tous les
146
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
deux appartenir à fr E = adh E \ int E = E \ int E. L’un d’entre eux au
moins, appelons-le c, appartient à int E et est donc un extrémant local libre
de f . Par le théorème de Fermat, Dk f (c) = 0 pour chaque 1 ≤ k ≤ n et c
est un point critique de f .
Le cas particulier suivant lorsque n = 1 et E = [a, b] est généralement
appelé théorème de Rolle.
Corollaire. Soit f une fonction de R dans R et [a, b] un intervalle fermé
vérifiant les conditions suivantes.
1. f est continue sur [a, b].
2. f est dérivable en chaque point de ]a, b[.
3. f (a) = f (b).
Alors il existe au moins un c ∈ ]a, b[ tel que f $ (c) = 0.
Le graphe de toute fonction vérifiant les conditions du théorème de Rolle
possède donc, en un point au moins, une tangente parallèle au segment
de droite joignant l’origine et l’extrémité du graphe. Chaque hypothèse
est essentielle dans le théorème de Rolle comme le montrent les exemples
suivants sur [−1, 1] pour lesquels la dérivée ne s’annule en aucun point de
] − 1, 1[ : f (x) = x (f (−1) /= f (1)), f (x) = |x| (f n’est pas dérivable en 0)
et f (x) = x si x ∈ [−1, 1[, f (1) = 0 (f n’est pas continue en 1.)
4.9
Théorème de Cauchy et règle de l’Hospital
On peut généraliser le théorème de Rolle à un couple de fonctions réelles
d’une variable réelle. C’est le théorème de la moyenne de Cauchy.
Proposition. Soient f et g deux fonctions de R dans R continues sur [a, b]
et dérivables en chaque point de ]a, b[. Alors il existe au moins un c ∈ ]a, b[
tel que
[f (b) − f (a)]g $(c) = [g(b) − g(a)]f $(c).
Démonstration. Il est clair que la fonction h de R dans R définie par
h(x) = [f (b) − f (a)]g(x) − [g(b) − g(a)]f (x)
est continue sur [a, b], dérivable sur ]a, b[ et, pour tout x ∈ ]a, b[, on a
h$ (x) = [f (b) − f (a)]g $(x) − [g(b) − g(a)]f $(x).
En outre,
h(a) = f (b)g(a) − g(b)f (a) = h(b).
4.9. THÉORÈME DE CAUCHY ET RÈGLE DE L’HOSPITAL
147
Le théorème de Rolle appliqué à h entraı̂ne donc l’existence d’un c ∈ ]a, b[
tel que h$ (c) = 0.
L’interprétation géométrique du théorème de Cauchy est la suivante. Si
l’on considère (f, g) : [a, b] → R2 comme la représentation paramétrique
d’une courbe du plan, le théorème de Cauchy affirme, dans le cas non trivial
où (f (a), g(a)) /= (f (b), g(b)), l’existence d’un point de la courbe, différent
de (f (a), g(a)) et (f (b), g(b)) en lequel la tangente à la courbe est parallèle
au segment de droite joignant (f (a), g(a)) à (f (b), g(b)).
En renforçant les hypothèses, on peut écrire la conclusion du théorème
de Cauchy sous forme d’une égalité entre quotients.
Corollaire. Soient f et g deux fonctions de R dans R continues sur [a, b]
et dérivables en chaque point de ]a, b[. Si l’une des conditions suivantes est
satisfaite :
1. g(a) /= g(b) et |f $ (x)| + |g $ (x)| =
/ 0 pour chaque x ∈ ]a, b[.
2. g $ (x) /= 0 pour tout x ∈ ]a, b[.
Alors g(b) /= g(a) et il existe au moins un c ∈ ]a, b[ tel que g $ (c) /= 0 et
f (b) − f (a)
f $ (c)
= $ .
g(b) − g(a)
g (c)
Démonstration. Le résultat se déduit immédiatement du théorème de
Cauchy si l’on peut montrer que les quantités apparaissant aux dénominateurs sont différentes de zéro. Dans le cas de l’hypothèse 1, si c ∈ ]a, b[ est
tel que
[f (b) − f (a)]g $(c) = [g(b) − g(a)]f $(c),
et si g $ (c) = 0, alors, comme g(b) /= g(a), on a nécessairement f $ (c) = 0,
ce qui est exclus par hypothèse. Dans le cas de l’hypothèse 2, il suffit de
montrer que g(b) /= g(a). Si g(b) = g(a), le théorème de Rolle appliqué
à g entraı̂ne l’existence d’un c$ ∈ ]a, b[ tel que g $ (c$ ) = 0, ce qui contredit
l’hypothèse.
La version “quotient” du théorème de Cauchy conduit à une règle permettant, dans certains cas, de prouver l’existence et de calculer la limite d’un
quotient de deux fonctions réelles d’une variable réelle lorsque la limite du
numérateur et du dénominateur sont toutes deux nulles. C’est une première
forme de la règle de l’Hospital, l’un des plus anciens théorèmes du calcul
différentiel puisque, quoique dû à Jean Bernoulli, il figure dans le premier
traité de calcul différentiel jamais publié, l’Analyse des infiniments petits
pour l’intelligence des lignes courbes du Marquis Guillaume de l’Hospital
(1696).
148
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Proposition. Soit I un intervalle ouvert de R, a son origine ou son extrémité, f et g des fonctions réelles d’une variable réelles dérivables en chaque
point de I. Supposons satisfaites les conditions suivantes.
1. limx→a, x∈I f (x) = 0 = limx→a, x∈I g(x).
2. g $ (x) /= 0 pour chaque x ∈ I.
"
3. limx→a, x∈I fg" (x) = b.
Alors,
f
lim
(x) = b.
x→a, x∈I g
Démonstration. Supposons pour fixer les idées que a soit l’extrémité
de I, l’autre cas se traitant de même. Soient respectivement F et G les
prolongements de f et g à I ∪ {a} définis par F (a) = 0 = G(a). Il résulte de
l’hypothèse 1 que F et G sont continus sur I ∪ {a} et dérivables en chaque
point de I puisqu’ils coı̈cident respectivement avec f et g sur I. Soit ! > 0;
par l’hypothèse 3, il existe δ > 0, que l’on peut toujours choisir suffisamment
petit pour que a − δ ∈ I, tel que
# $
#
# f (y)
#
#
(∀y ∈ I : a − δ ≤ y < a) : # $
− b## =
g (y)
# $
#
# F (y)
#
#
#
# G$ (y) − b# ≤ !.
D’autre part, pour chaque x ∈ [a − δ, a[, la version quotient du théorème
de Cauchy appliqué à F et G sur l’intervalle [x, a] entraı̂ne l’existence d’un
c ∈ ]x, a[ ⊂ ]a − δ, a[ tel que
f (x)
F (a) − F (x)
F $ (c)
f $ (c)
=
= $
= $ ,
g(x)
G(a) − G(x)
G (c)
g (c)
et dès lors tel que
#
#
# f (x)
#
#
#=
−
b
# g(x)
#
ce qui démontre la thèse.
# $
#
# f (c)
#
#
# ≤ !,
−
b
# g $(c)
#
En utilisant l’équivalence entre l’existence de la limite à gauche et de
la limite à droite de a d’une fonction de R dans R avec l’existence de la
limite de cette fonction pour x tendant vers a par valeurs différentes de a,
on obtient aussitôt la version suivante de la règle de l’Hospital.
Corollaire. Soit I un intervalle ouvert de R, a ∈ I, f et g des fonctions
réelles d’une variable réelles dérivables en chaque point de I \{a}. Supposons
satisfaites les conditions suivantes.
1. limx→a, x(=a f (x) = 0 = limx→a, x(=a g(x).
4.9. THÉORÈME DE CAUCHY ET RÈGLE DE L’HOSPITAL
149
2. g $ (x) /= 0 pour chaque x ∈ I \ {a}.
"
3. limx→a, x(=a fg" (x) = b.
Alors,
lim
x→a, x(=a
f
(x) = b.
g
1/3
Exemple. La fonction de R dans R définie par x 2→ (x+1)x −1 est de la
forme fg avec f (x) = (x + 1)1/3 − 1 et g(x) = x. Ces fonctions vérifient les
1
$
conditions du Corollaire ci-dessus avec f $ (x) = 3(x+1)
2/3 et g (x) = 1, et dès
lors
(x + 1)1/3 − 1
1
1
lim
= lim
= .
x→0, x(=0
x→0, x(=0 3(x + 1)2/3
x
3
On a également une version correspondante de la règle de l’Hospital
lorsque x tend vers +∞ ou vers −∞. Sa démonstration, tout à fait semblable
à celle de la Proposition ci-dessus, est laissée comme exercice au lecteur.
Proposition. Soit I = ]a, +∞[ (resp. I = ] − ∞, b[) un intervalle ouvert
non borné de R, f et g des fonctions réelles d’une variable réelles dérivables
en chaque point de I. Supposons satisfaites les conditions suivantes.
1. limx→+∞ f (x) = 0 = limx→+∞ g(x)
(resp. limx→−∞ f (x) = 0 = limx→−∞ g(x)).
2. g $ (x) /= 0 pour chaque x ∈ I.
"
3. limx→+∞ fg" (x) = b
(resp. limx→−∞
Alors,
f"
g " (x)
= b).
lim
x→+∞
f
(x) = b
g
(resp. limx→−∞ fg (x) = b).
On dispose également d’une règle de l’Hospital pour couvrir certaines
situations où g tend vers l’infini et f n’est pas nécessairement localement
bornée. Nous la traitons dans le cas d’une limite lorsque x tend vers a, le
cas où x tend vers +∞ ou −∞ étant laissé au lecteur.
Proposition. Soit I un intervalle ouvert de R, a son origine ou son extrémité, f et g des fonctions de R dans R dérivables en chaque point de I. Supposons satisfaites les conditions suivantes.
1. limx→a, x∈I g(x) = +∞.
2. Pour tout x ∈ I, on a g $(x) /= 0.
150
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
f"
g " (x) = b.
limx→a, x∈I fg (x) =
3. limx→a, x∈I
Alors,
b.
Démonstration. Supposons pour fixer les idées que a soit l’extrémité de
I, l’autre cas étant semblable. Si ! > 0 est donné, alors, par l’hypothèse 3,
il existe δ $ > 0 tel que a − δ $ ∈ I et tel que, pour tout y ∈ [a − δ $ , a[, on a
# $
#
#f
#
# (y) − b# ≤ ! .
# g$
#
2
D’autre part, en vertu de l’hypothèse 1, il existe δ $$ > 0 tel que a − δ $$ ∈ I
et tel que, pour tout y ∈ [a − δ $$ , a[, on a g(y) > 0. Posons δ $$$ = min{δ $ , δ $$}
et soient
a − δ $$$ ≤ y < x < a.
Le théorème de Cauchy sous forme quotient appliqué à l’intervalle [y, x]
entraı̂ne l’existence d’un c ∈ ]y, x[, et donc appartenant à [a − δ $$$ , c[, tel que
f (x) − f (y)
f $ (c)
= $ ,
g(x) − g(y)
g (c)
ce qui donne
#
#
# f (x) − f (y)
#
#
#=
−
b
# g(x) − g(y)
#
Dès lors, pour ces mêmes x,
#
#
# f (x)
#
#
#=
−
b
# g(x)
#
# $
#
# f (c)
#
#
# ≤ !.
−
b
# g $ (c)
#
2
#4
#
54
5
#
f (x) − f (y)
g(y)
f (y) ##
# 1 − g(y)
−
−
b
b
+
#
g(x)
g(x) − g(y)
g(x)
g(x) #
4
|g(y)|
≤ 1+
|g(x)|
=
!
+
2
4
5
!
|g(y)|
|f (y)|
+
|b| +
2 |g(x)|
|g(x)|
5
!
|g(y)| |f (y)|
+ |b|
+
.
2
|g(x)| |g(x)|
Le point y étant maintenant fixé, il résulte de l’hypothèse 1 qu’on peut
trouver un δ ∈ ]0, δ $$$] tel que, si x ∈ [a − δ, a[, on a
|g(x)| ≥
et dès lors
2
!
24
5
3
!
+ |b| |g(y)| + |f (y)| ,
2
#
#
#f
#
# (x) − b# ≤ ! + ! = !.
#g
#
2 2
4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE
151
Remarque. Le lecteur pourra également vérifier que, toutes autres hypothèses étant égales,
lim
x→a
lorsque
f
(x) = +∞ (resp. − ∞)
g
f$
(x) = +∞ (resp. − ∞),
x→a g $
lim
a pouvant lui-même être remplacé par +∞ ou par −∞.
4.10
Théorèmes de Lagrange et de la moyenne
Un cas particulier immédiat mais important du théorème de Cauchy est
le résultat suivant, qui porte le nom de théorème de la moyenne de
Lagrange ou de formule des accroissements finis.
Théorème. Soit f une fonction de R dans R continue sur [a, b] et dérivable
en chaque point de ]a, b[. Alors, il existe c ∈ ]a, b[ tel que
f (b) − f (a) = (b − a)f $ (c).
Démonstration. Il suffit de prendre pour g l’identité dans le théorème de
Cauchy.
Géométriquement, le théorème de Lagrange assure l’existence d’un point
c ∈ ]a, b[ tel que la tangente en (c, f (c)) au graphe de f est parallèle au
segment de droite joignant les points (a, f (a)) et (b, f (b)). Comme tout
c ∈ ]a, b[ est de la forme a + θ(b − a) pour un certain θ ∈ ]0, 1[, le théorème
de Lagrange affirme l’existence d’un θ ∈ ]0, 1[ tel que
f (b) − f (a) = (b − a)f $ (a + θ(b − a)).
On a des théorèmes de Lagrange pour les fonctions de Rn dans
R. Donnons d’abord une version faisant intervenir la dérivée directionnelle.
Théorème. Soit f une fonction de Rn dans R, a ∈ Rn , u ∈ Rn tel que
|u|2 = 1 et T > 0 tels que f soit continue sur S = {a + tu : t ∈ [0, T ]} et
dérivable dans la direction u en chaque point de S0 = {a + tu : t ∈ ]0, T [}.
Alors il existe θ ∈ ]0, 1[ tel que
f (a + T u) − f (a) = T f $ (a + θT u; u).
152
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Démonstration. Par hypothèse, la fonction g : t 2→ f (a + tu) est une
fonction de R dans R qui vérifie les conditions du théorème de Lagrange sur
[0, T ], et, par définition de la dérivée directionnelle, on a g $ (t) = f $ (a + tu; u)
pour chaque t ∈ ]0, T [. En conséquence, il existe θ ∈ ]0, 1[ tel que
f (a + T u) − f (a) = g(T ) − g(0) = T g $ (θT ) = T f $ (a + θT u; u).
Donnons maintenant une version faisant intervenir la dérivée totale.
Théorème. Soit f une fonction de Rn dans R, a ∈ Rn , b ∈ Rn , S =
{a + t(b − a) : t ∈ [0, 1]} et S0 = {a + t(b − a) : t ∈ ]0, 1[} vérifiant les
conditions suivantes.
1. f est continue sur S.
2. Chaque point de S0 est intérieur à dom f .
3. f est dérivable en chaque point de S0 .
Alors il existe θ ∈ ]0, 1[ tel que
$
f (b) − f (a) = fa+θ(b−a)
(b − a),
ou encore il existe c ∈ S0 tel que
f (b) − f (a) = fc$ (b − a).
Démonstration. Soit h l’application affine de R dans Rn définie par
h(t) = a + t(b − a). Elle est dérivable en chaque point de R. Par le théorème
de continuité et de dérivabilité des fonctions composées, la fonction f ◦ h
sera continue sur [0, 1] et dérivable en chaque point de ]0, 1[. En outre, pour
chaque t ∈ ]0, 1[, on a
$
$
$
(f ◦ h)$ (t) = (f ◦ h)$t (1) = (fh(t)
◦ h$t )(1) = fh(t)
(h$ (t)) = fh(t)
(b − a).
Le théorème de Lagrange entraı̂ne donc l’existence d’un θ ∈ ]0, 1[ tel que
f [h(1)] − f [h(0)] = (f ◦ h)$ (θ),
et dès lors tel que
$
f (b) − f (a) = fh(θ)
(b − a),
et il suffit de poser c = h(θ) = a + θ(b − a).
4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE
153
Corollaire. Soit f une fonction de Rn dans R, a ∈ Rn et r > 0 tel que f
soit dérivable en chaque point de B2 (a; r). Alors, pour chaque 1 ≤ k ≤ n et
chaque h ∈ R tel que 0 < |h| < r, il existe θ ∈ ]0, 1[ tel que
f (a + hek ) − f (a) = hDk f (a + θhek ).
Démonstration. Les conditions du théorème de Lagrange sont satisfaites
pour b = a + hek . Dès lors, il existe θ ∈ ]0, 1[ tel que
$
k
$
k
k
f (a + hek ) − f (a) = fa+θhe
k (he ) = hfa+θhek (e ) = hDk f (a + θhe ).
Le théorème de Lagrange est faux pour les fonctions à valeurs dans
Rp lorsque p ≥ 2. Ainsi, la fonction f de R dans R2 définie par f (x) =
(cos x, sin x) est dérivable (et donc continue) en chaque point x de R et
telle que f (2π) − f (0) = 0. D’autre part, pour tout x ∈ R, on a f $ (x) =
(− sin x, cos x), et donc |f $ (x)|2 = 1. Il ne peut donc exister de c ∈ ]0, 2π[ tel
que f (2π) − f (0) = 2πf $ (c).
Toutefois, une version affaiblie, s’exprimant en termes d’inégalité ou
lieu d’égalité, mais tout aussi utile pour les applications, subsiste pour les
fonctions à valeurs vectorielles. Donnons tout d’abord l’inégalité de la
moyenne pour les fonctions de R dans Rp.
Théorème. Soit f une fonction de R dans Rp continue sur [a, b] et dérivable
en chaque point de ]a, b[. Alors il existe c ∈ ]a, b[ tel que
|f (b) − f (a)|2 ≤ (b − a)|f $ (c)|2.
Démonstration. Le théorème est évident si f (b) − f (a) = 0. Si f (b) −
f (a) /= 0, définissons la fonction g de R dans R par
g(x) = (f (b) − f (a)|f (x)) =
n
$
k=1
[fk (b) − fk (a)]fk (x)
pour chaque x ∈ dom f. On montre sans peine qu’elle est continue sur [a, b]
et dérivable en chaque point x ∈ ]a, b[, avec
g $ (x) = (f (b) − f (a)|f $ (x)).
En lui appliquant le théorème de Lagrange, on obtient l’existence d’un c ∈
]a, b[ tel que
g(b) − g(a) = (b − a)g $(c),
154
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
c’est-à-dire tel que
|f (b) − f (a)|22 = (b − a)(f (b) − f (a)|f $ (c)).
La thèse s’en déduit en utilisant l’inégalité de Cauchy
|(f (b) − f (a)|f $ (c))| ≤ |f (b) − f (a)|2 |f $ (c)|2,
et en simplifiant les deux membres de l’inégalité obtenue par |f (b) − f (a)|2.
Remarque. Le théorème précédent peut encore s’exprimer en disant qu’il
existe θ ∈ ]0, 1[ tel que
|f (b) − f (a)|2 ≤ (b − a)|f $ (a + θ(b − a))|2 .
Une conséquence utile de cette inégalité de la moyenne pour les fonctions
vectorielles est une caractérisation des fonctions constantes en termes
de dérivabilité.
Corollaire. Soit I ⊂ R un intervalle borné ou non et f une fonction de R
dans Rp dérivable en chaque point de I. Alors f est constante sur I si et
seulement si, pour chaque x ∈ I, on a f $ (x) = 0.
Démonstration. La condition nécessaire a déjà été obtenue dans le chapitre sur la dérivabilité. Pour la condition suffisante, si a < b sont deux
points de I, alors f est dérivable sur [a, b] et le théorème de la moyenne et
l’hypothèse sur f $ (x) entraı̂nent l’existence d’un c ∈ ]a, b[ (et donc contenu
dans I) tel que
0 ≤ |f (b) − f (a)|2 ≤ (b − a)|f $ (c)|2 = 0,
et dès lors tel que f (b) = f (a). Comme a et b sont arbitraires dans I, f est
constante sur I.
Nous pouvons maintenant énoncer et démontrer des inégalités de la
moyenne pour les fonctions de Rn dans Rp. La première s’exprime en
termes de dérivée directionnelle.
Théorème. Soit f une fonction de Rn dans Rp , a ∈ Rn , u ∈ Rn tel que
|u|2 = 1 et T > 0 tels que f soit continue sur S = {a + tu : t ∈ [0, T ]} et
dérivable dans la direction u en chaque point de S0 = {a + tu : t ∈ ]0, T [}.
Alors il existe θ ∈ ]0, 1[ tel que
|f (a + T u) − f (a)|2 ≤ T |f $ [a + θT u; u]|2 .
4.10. THÉORÈMES DE LAGRANGE ET DE LA MOYENNE
155
Démonstration. Par hypothèse, la fonction g : t 2→ f (a + tu) est une
fonction de R dans Rp qui vérifie les conditions du théorème de la moyenne
sur [0, T ], et, par définition de la dérivée directionnelle, on a g $ (t) = f $ (a +
tu; u) pour chaque t ∈ ]0, T [. En conséquence, il existe θ ∈ ]0, 1[ tel que
|f (a + T u) − f (a)|2 = |g(T ) − g(0)|2 ≤ T |g $ (θT )|2 = T |f $ (a + θT u; u)|2 .
On a aussi la version suivante en termes de dérivée totale.
Théorème. Soit f une fonction de Rn dans Rp , a ∈ Rn , b ∈ Rn , S =
{a + t(b − a) : t ∈ [0, 1]} et S0 = {a + t(b − a) : t ∈ ]0, 1[} vérifiant les
conditions suivantes.
1. f est continue sur S.
2. Chaque point de S0 est intérieur à dom f .
3. f est dérivable en chaque point de S0 .
Alors il existe θ ∈ ]0, 1[ tel que
$
|f (b) − f (a)|2 ≤ |fa+θ(b−a)
(b − a)|2 ,
ou encore il existe c ∈ S0 tel que
|f (b) − f (a)|2 ≤ |fc$ (b − a)|2 .
Démonstration. Soit h l’application affine de R dans Rn définie par
h(t) = a + t(b − a). Elle est dérivable en chaque point de R. Par le théorème
de continuité et de dérivabilité des fonctions composées, la fonction f ◦ h
sera continue sur [0, 1] et dérivable en chaque point de ]0, 1[. En outre, pour
chaque t ∈ ]0, 1[, on a
$
$
$
(f ◦ h)$ (t) = (f ◦ h)$t (1) = (fh(t)
◦ h$t )(1) = fh(t)
(h$ (t)) = fh(t)
(b − a).
Le théorème de la moyenne pour une fonction de R dans Rp entraı̂ne donc
l’existence d’un θ ∈ ]0, 1[ tel que
|f [h(1)] − f [h(0)]|2 ≤ |(f ◦ h)$ (θ)|2 ,
et dès lors tel que
$
|f (b) − f (a)|2 ≤ |fh(θ)
(b − a)|2 ,
et il suffit de poser c = h(θ) = a + θ(b − a).
156
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Corollaire. Soit f une fonction de Rn dans Rp, a ∈ Rn et r > 0 tel que f
soit dérivable en chaque point de B2 (a; r). Alors, pour chaque 1 ≤ k ≤ n et
chaque h ∈ R tel que 0 < |h| < r, il existe θ ∈ ]0, 1[ tel que
|f (a + hek ) − f (a)|2 ≤ |h||Dk f (a + θhek )|2 .
Démonstration. Les conditions du théorème de la moyenne pour une
fonction de Rn dans Rp sont satisfaites pour b = a + hek . Dès lors, il existe
θ ∈ ]0, 1[ tel que
$
k
|f (a + hek ) − f (a)|2 ≤ |fa+θhe
k (he )|2
$
k
k
= |h||fa+θhe
k (e )|2 = |h||Dk f (a + θhe )|2 .
4.11
Condition suffisante de dérivabilité
On a vu que l’existence des dérivées partielles en un point n’entraı̂nait pas
la dérivabilité (totale) en ce point. Les résultats globaux que nous venons
d’obtenir permettent de démontrer une intéressante condition suffisante (locale) de dérivabilité en un point en termes de propriétés des dérivées partielles. Elle repose sur la conséquence suivante du théorème de la moyenne.
Lemme. Soit f une fonction de Rn dans Rp , a ∈ Rn , h ∈ R et 1 ≤ k ≤ n
tels que f soit continue en chaque point de S = {a + thek : t ∈ [0, 1]} et
Dk f (x) existe pour chaque x ∈ S0 = {a + thek : t ∈ ]0, 1[}. Alors il existe
θ ∈ ]0, 1[ tel que
|f (a + hek ) − f (a) − hDk f (a)|2 ≤ |h||Dk f (a + θhek ) − Dk f (a)|2.
Démonstration. Soit g la fonction de R dans Rp définie par g(t) = f (a +
− f (a) − thDk f (a). Par hypothèse g est dérivable en chaque point de
]0, 1[ et
thek )
g(τ ) − g(t)
f (a + τ hek ) − f (a + thek ) − (τ − t)hDk f (a)
= lim
τ →t
τ →t
τ −t
τ −t
g $ (t) = lim
D
E
= h Dk f (a + thek ) − Dk f (a) .
157
4.11. CONDITION SUFFISANTE DE DÉRIVABILITÉ
Le théorème de la moyenne pour une fonction de R dans Rp appliqué à g sur
[0, 1] entraı̂ne l’existence d’un θ ∈ ]0, 1[ tel que
|f (a + hek ) − f (a) − hDk f (a)|2 = |g(1) − g(0)|2 ≤ |g $(θ)|2
= |h||Dk f (a + θhek ) − Dk f (a)|2 .
Proposition. Soit f une fonction de Rn dans Rp, a ∈ dom f. Supposons
qu’il existe un entier 1 ≤ k ≤ n tel que Dk f (a) existe et un r > 0 tel que,
pour chaque entier j /= k compris entre 1 et n, Dj f (x) existe pour chaque
x ∈ B2 [a; r]. Si les fonctions de Rn dans Rp Dj f : x 2→ Dj f (x), (1 ≤ j /=
k ≤ n) sont continues en a, alors f est dérivable en a.
Démonstration. En modifiant éventuellement le nom des variables, on
peut, sans perte de généralité, supposer que k = n. Si h ∈ B2 [r], on a
f (a + h) − f (a) −
,
&
= f (a + h) − f
, &
+ f
a+
 
+ f  a +
 
+ f a +
=
n−1
$
j=1
 
n
$
k
hk e
k=2
n
$
k=j
'
a+
n
$
&
k=n−1
k
hk e
−f a+
+...



hj Dj f (a)
j=1
k=2
hk ek  − f a +
n
$
n
$
+...
n
$
'
− h1 D1 f (a)
k
hk e
k=3
n
$
k=j+1
'
− h2 D2 f (a)

f a +
k=j

hk ek  − hj Dj f (a)

hk ek  − f (a + hn en ) − hn−1 Dn−1 f (a)
+[f (a + hn en ) − f (a) − hn Dn f (a)]
n
$
-


hk ek  − f a +
n
$
k=j+1

hk ek  − hj Dj f (a)
+[f (a + hn e ) − f (a) − hn Dn f (a)].
n

158
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
Dès lors, en appliquant le Lemme aux n − 1 premiers termes de la somme,
on obtient θj ∈ ]0, 1[, (1 ≤ j ≤ n − 1) tels que
# 
#



#
#
n
n
$
$
#
#
k
k
#f a +
#

h
e
−
f
a
+
h
e
−
h
D
f
(a)
k
k
j j
#
#
#
#
k=j
k=j+1
2
#
#


#
#
n
$
#
#
≤ |hj | ##Dj f a + θj hj ej +
hk ek  − Dj f (a)## .
#
#
k=j+1
2
Si maintenant ! > 0 est donné, alors, pour chaque 1 ≤ j ≤ n−1, la continuité
de Dj f en a entraı̂ne l’existence d’un δj ∈ ]0, r] tel que, si |x − a|2 ≤ δj , on a
!
|Dj f (x) − Dj f (a)|2 ≤ ,
n
et l’existence de Dn f (a) entraı̂ne l’existence d’un δn ∈]0, r] tel que, si |t| ≤ δn ,
on a
!
|f (a + ten ) − f (a) − tDn f (a)|2 ≤ |t|.
n
En rassemblant tous ces résultats, on voit que si |h|2 ≤ δ = min{δj : 1 ≤ j ≤
n}, on a
#
#
#
#
#f
#
j=1 #
#
n−1
$
#
#
n
$
#
#
#f (a + h) − f (a) −
hj Dj f (a)## ≤
#
#
#
j=1
2
#




#
n
n
$
$
#
k
k
a +



hk e − f a +
hk e − hj Dj f (a)##
#
k=j
k=j+1
2
!
+|f (a + hn e ) − f (a) − hn Dn f (a)|2 ≤ n |h|∞ ≤ !|h|2 ,
n
ce qui montre que f est dérivable en a.
n
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ dom f. Supposons
qu’il existe un r > 0 tel que, pour chaque entier j compris entre 1 et n,
Dj f (x) existe pour chaque x ∈ B2 [a; r]. Si les fonctions de Rn dans Rp
Dj f : x 2→ Dj f (x), (1 ≤ j ≤ n) sont continues en a, alors f est dérivable en
a.
Remarque. La Proposition que nous venons de démontrer est une condition
suffisante mais nullement nécessaire de dérivabilité. Ainsi, la fonction f de
R2 dans R définie par f (0) = 0 et
f (x) =
|x|22 sin
4
1
|x|22
5
159
4.12. EXERCICES
si x /= 0 est dérivable en 0 avec f0$ = 0 puisque, pour h /= 0, f (h) = |h|2 r(h)
avec
4
5
1
r(h) = |h|2 sin
→0
|h|22
lorsque h → 0 comme produit d’une fonction tendant vers zéro par une
fonction localement bornée en 0. D’autre part, un calcul facile laissé au
lecteur montre que D1 f (0) = D2 f (0) = 0, et que, pour x /= 0,
4
1
D1 f (x) = 2x1 sin
|x|22
D2 f (x) = 2x2 sin
4
1
|x|22
5
5
4
5
4
5
1
2x1
− 2 cos
,
|x|2
|x|22
−
1
2x2
cos
.
|x|22
|x|22
Comme limx→0 Dj f (x) n’existe pas (j = 1, 2) (le vérifier), on voit que les
fonctions Dj f ne sont pas continues en 0.
4.12
Exercices
1. Soit ]a, b] un intervalle semi-ouvert et c ∈ [a,Ab]. Construire
une jauge δ
B
sur [a, b] telle que, pour toute P-partition δ-fine (xj , I j ) 1≤j≤m de ]a, b], on
ait nécessairement xj = c pour l’un des 1 ≤ j ≤ m.
2. Montrer que la fonction f de R dans R définie par
f (0) = 0, f (x) = sin
1
si x /= 0,
x
est continue au sens de Darboux sur [0, 1] mais n’est pas continue sur [0, 1].
3. Soit g : [a, b] → R une application continue telle que g(a) ∈ [a, b] et
g(b) ∈ [a, b]. Montrer que le théorème de Bolzano appliqué à I − g entraı̂ne
l’existence d’au moins un c ∈ [a, b] tel que c = g(c). (Théorème du point fixe
de Rothe en dimension un). Le cas particulier où g([a, b]) ⊂ [a, b] s’appelle
le théorème du point fixe de Brouwer .
4. Soit f une application de R dans R continue sur R et telle que
f (x) → −∞ si x → −∞ et f (x) → +∞ si x → +∞.
Utiliser le théorème des valeurs intermédiaires pour montrer que f est surjective. Il en est évidemment de même si
f (x) → +∞ si x → −∞ et f (x) → −∞ si x → +∞.
160
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
5. Montrer que E ⊂ Rn est un ouvert si et seulement si E est une union de
boules ouvertes.
6. Si E ⊂ R est une union finie d’intervalles fermés mutuellement disjoints, appelons C(E) l’union finie d’intervalles fermés mutuellement disjoints obtenue en retirant de chaque intervalle (disons [a, b]) constituant E
b−a
l’intervalle ouvert “central” ]a + b−a
3 , b − 3 [ de la division de [a, b] en trois
intervalles de longueurs égales. Si E0 = [0, 1], posons
E1 = C(E0 ), E2 = C(E1 ), . . . , Ek = C(Ek−1 ), . . ., .
7
Montrer que l’ensemble C = k∈N Ek est un fermé borné non vide. On
l’appelle l’ensemble de Cantor. Montrer (c’est plus difficile) que C est
d’intérieur vide et n’a aucun point isolé.
7. Montrer que si 6 · 6 : x 2→ 6x6 est une norme sur Rn , il existe des réels
0 < a ≤ b tels que, pour tout x ∈ Rn , on a
a|x|2 ≤ 6x6 ≤ b|x|2 .
En d’autres termes, toutes les normes sont équivalentes sur Rn . (Il suffit de
noter que, pour x /= 0, ces inégalités se réduisent à
F
F x
a≤F
F |x|
2
F
F
F ≤ b,
F
et d’appliquer le théorème de Weierstrass à la fonction x 2→ 6x6 sur le fermé
borné {x ∈ Rn : |x|2 = 1}).
8. Soit f une fonction de Rn dans R et a ∈ dom f. On dit que f est semicontinue inférieurement (resp. semi-continue supérieurement) en a si
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ) :
f (a) − ! ≤ f (x) (resp. f (x) ≤ f (a) + !).
f est évidemment continue en a si elle est semi-continue inférieurement et
supérieurement en a. Montrer que la conclusion
f (y) ≤ f (x) (resp. f (x) ≤ f (z)),
du théorème de Weierstrass subsiste si f est semi-continue inférieurement
(resp. semi-continue supérieurement) sur le fermé borné E ⊂ Rn .
9. Soit f une application de Rn dans R+ dérivable en chaque point de Rn .
Montrer que, pour tout ! > 0, il existe au moins un point c! ∈ Rn tel que
161
4.12. EXERCICES
|∇f (c!)|2 ≤ !. Suggestion : dans le cas non trivial où il existe a ∈ Rn tel que
f (a) > 0, appliquer un Corollaire du théorème de Weierstrass à la fonction
g : x 2→ f (x) + δ2 |x − a|22 , où δ > 0 est à déterminer. Cette fonction atteint
un minimum en un point yδ pour lequel
∇f (yδ ) + δ(yδ − a) = 0.
Dès lors,
δ
f (yδ ) + |yδ − a|22 ≤ f (a),
2
ce qui entraı̂ne
|yδ − a|2 ≤
et dès lors
si l’on prend δ =
4
2f (a)
δ
51/2
,
|∇f (yδ )|2 ≤ (2f (a)δ)1/2 ≤ !,
!2
2f (a) .
Il suffit alors de prendre c! = y
!2
2f (a)
. La fonction
exponentielle fournit un exemple vérifiant ce résultat sans que sa dérivée ne
s’annule jamais.
10. Soit f une fonction de R dans R dérivable en chaque point d’un voisinage
d’un point a ∈ R. Utiliser le théorème de Lagrange pour démontrer que si
limx→a, x(=a f $ (x) = b, alors b = f $ (a).
11. Soit f une fonction de Rn dans Rp et a ∈ adh (dom f \ {a}). On dit
que f est fortement dérivable en a s’il existe une application linéaire L de
Rn dans Rp telle que
f (x) − f (y) − L(x − y)
= 0.
|x − y|2
(x,y)→(a,a)
lim
Montrer que :
a. Si f est fortement dérivable en a, alors f est dérivable en a.
b. Si f est fortement dérivable en a ∈ int dom f, alors nécessairement
L = fa$ .
c. S’il existe r > 0 tel que f soit dérivable en chaque point de B2 (a; r), et si
les fonctions dérivées partielles correspondantes x 2→ Dj f (x), (1 ≤ j ≤ n),
sont continues en a, alors f est fortement dérivable en a. (Utiliser le théorème
de la moyenne).
12. Soient f et g des fonctions de R dans R et a ∈ dom f ∩ dom g tel que
g(a) = 0. On dit que f est dérivable par rapport à g en a si
lim
x→a
f (x) − f (a)
g(x) − g(a)
162
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
df
existe, auquel cas cette limite est notée Dg f (a) ou dg
(a). Utiliser le théorème
de l’Hospital pour montrer que si f et g sont dérivables sur un voisinage de
a et si g $ (a) /= 0, alors
f $ (a)
Dg f (a) = $ .
g (a)
Si h est une fonction de R dans R∗+ et a ∈ dom h, tel que a > 0, on appelle
(en économie mathématique) élasticité de h en a la dérivée en a de ln h par
rapport à ln x, et on la note Eh(a). Montrer que, si h est dérivable en a,
" (a)
alors Eh(a) = ah
h(a) .
4.13
Petite anthologie
Soit, sur le plan Y OX, une aire connexe S limitée par un contour fermé
simple ou complexe; on suppose qu’à chaque point de S ou de son périmètre
correspond un cercle, de rayon non nul, ayant ce point pour centre : il est
alors toujours possible de subdiviser S en régions, en nombre fini et assez
petites pour que chacune d’elles soit complètement intérieure au cercle correspondant à un point convenablement choisi dans S ou sur son périmètre.
Pierre Cousin, 1895
Dans la théorie des équations, il y a deux théorèmes dont on pouvait dire
récemment encore que la démonstration entièrement correcte est inconnue.
L’un est le suivant : il faut qu’il y ait toujours, entre deux valeurs quelconques de la grandeur inconnue qui donnent deux résultats de signes opposés,
au moins une racine réelle de l’équation.
Bernard Bolzano, 1817
On dit qu’une fonction f (x) est continue de x = a jusqu’à x = b quand
elle est continue pour chaque valeur particulière x = X entre x = a et x = b,
les valeurs a et b comprises; on dit qu’elle est uniformément continue de
x = a à x = b quand, pour une grandeur ! donnée aussi petite que l’on veut,
il existe une grandeur positive η0 telle que pour toutes les valeurs positives η
qui sont plus petites que η0 , f (x ± η) − f (x) reste inférieur à !. Quelles que
soient les valeurs qu’on a pu donner à x et seulement telles que x et x ± η
appartiennent au domaine entre a et b, la condition doit être réalisée avec
le même η0 .
Heinrich Heine, 1872
163
4.13. PETITE ANTHOLOGIE
Cette démonstration s’appuie, pour l’essentiel, sur le théorème exposé
fréquemment et démontré dans les cours de Monsieur Weierstrass : “Une
fonction réelle continue ϕ(x), définie dans un intervalle (a . . . b) (les extrémités comprises), atteint le maximum g des valeurs qu’elle peut prendre au
moins pour une valeur x0 de la variable de façon que ϕ(x0 ) = g.”
Georg Cantor, 1870
Soit à chercher le maximum de b2 a − a3 . D’après les règles de la méthode
précitée, on aura de la sorte :
b2 a + b2 e − a3 − e3 − 3a2 e − 3e2 a = b2 a − a3 .
Il est clair que, si l’on supprime les termes semblables, tous ceux qui resteront
seront affectés de l’inconnue e; ceux en a seul se trouvent en effet les mêmes
de part et d’autre. On a ainsi : b2 e = e3 + 3a2 e + 3ae2 , et, en divisant
tous les termes par e, b2 = e2 + 3a2 + 3ae, ce qui donne la constitution des
deux équations corrélatives sous cette forme. Pour trouver le maximum, il
s’agit d’égaler les racines des deux équations, afin de satisfaire aux règles
de la première méthode, dont notre nouveau procédé tire sa raison et sa
façon d’opérer. Ainsi, il faut égaler a à a + e, d’où e = 0. Mais, d’après
la constitution que nous avons trouvée pour les équations corrélatives, b2 =
e2 +3a2 +3ae, nous devons donc supprimer, dans cette égalité, tous les termes
affectés de e, comme se réduisant à zéro; il restera b2 = 3a2 , équation qui
donnera le maximum cherché pour le produit dont il s’agit.
Pierre de Fermat, 1629
Si l’on substitue deux nombres au lieu de l’inconnue, chacun séparément,
et si l’un de ces nombres donne un résultat positif, et l’autre un résultat
négatif, il y a toujours une racine qui surpasse le plus petit des nombres,
et qui est surpassée par le plus grand. Ces deux nombres s’appelleront Hypothèses. Si une égalité a pu être formée comme il a esté dit dans le premier
Article, ses racines sont les hypothèses des racines de la Cascade immédiate.
Cette Cascade se forme en multipliant par la progression 0.1.2. etc.
Michel Rolle, 1691
Depuis l’impression de cet ouvrage, j’ai reconnu qu’à l’aide d’une formule
très simple on pouvait ramener au Calcul différentiel la solution de plusieurs
problèmes que j’avais renvoyés au Calcul intégral. D’après ce qui a été dit
dans la septième Leçon, si l’on désigne par x0 , X deux valeurs de x entre
164
CHAPITRE 4. FONCTIONS CONTINUES OU DÉRIVABLES
lesquelles les fonctions f (x) et f $ (x) restent continues, et par θ un nombre
inférieur à l’unité, on aura
f (X) − f (x0 )
= f $ [x0 + θ(X − x0 )].
X − x0
Or il est aisé de voir que des raisonnements entièrement semblables à ceux
dont nous avons fait usage pour démontrer l’équation précédente suffiront
pour établir la formule
f (X) − f (x0 )
f $ [x0 + θ(X − x0 )]
= $
,
F (X) − F (x0 )
F [x0 + θ(X − x0 )]
θ désignant encore un nombre inférieur à l’unité, et F (x) une fonction nouvelle qui, toujours croissante ou décroissante depuis la limite x = x0 jusqu’à
la limite x = X, reste continue, avec sa dérivée F $ (x), entre ces mêmes
limites.
Augustin Cauchy, 1823
Soit une ligne courbe AM D (AP = x, P M = y, AB = a) telle que la
valeur de l’appliquée y soit exprimée par une fraction, dont le numérateur et
le dénominateur deviennent chacun zéro lorsque x = a, c’est-à-dire lorsque
le point P tombe sur le point donné B. On demande quelle doit être alors
la valeur de l’appliquée BD. ... Et partant que si l’on prend la différence
du numérateur, et qu’on la divise par la différence du dénominateur, après
avoir fait x = a = Ab ou AB, l’on aura la valeur cherchée de l’appliquée bd
ou BD.
Guillaume-François de L’Hospital, 1696
n’a eu aucune signification jusqu’à présent, et nous n’allons pas lui en
donner une.
0
0
Edmund Landau , 1934
Chapitre 5
Fonctions implicites
5.1
Limites infinies et point d’accumulation
Le lemme de Cousin fournit une intéressante caractérisation des limites
infinies. Commençons par une remarque très simple.
Lemme. Soit f une fonction de Rn dans Rp et a ∈ adh dom f. Alors,
limx→a f (x) = ∞ si et seulement si
(∀b ∈ Rp )(∀! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x) − b|∞ > !. (5.1)
Démonstration. La condition suffisante s’obtient immédiatement en prenant b = 0 dans (5.1). Pour démontrer la condition nécessaire, soit b ∈ Rp
et ! > 0. Par hypothèse,
(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x)|∞ > |b|∞ + !,
et dès lors, pour ces mêmes x, on aura
|f (x) − b|∞ ≥ |f (x)|∞ − |b|∞ > !.
Le résultat suivant, plus profond, donne la caractérisation en question.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f. Alors,
limx→a f (x) = ∞ si et seulement si
(∀b ∈ Rp )(∃! > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x) − b|∞ > !. (5.2)
165
166
CHAPITRE 5. FONCTIONS IMPLICITES
Démonstration. Condition nécessaire. Il suffit d’utiliser la condition
nécessaire du lemme et de prendre, par exemple, ! = 1 dans (5.1).
Condition suffisante. Pour chaque b ∈ Rp, choisissons !(b) > 0 et δ(b) > 0
tels que (5.2) soit satisfaite, c’est-à-dire tels que
(∀x ∈ dom f ∩ B2 [a; δ(b)]) : f (x) /∈ B∞ [b, !(b)].
(5.3)
Nous définissons ainsi une jauge ! : b 2→ !(b) sur Rp. Soit r > 0; par le
lemme de Cousin appliqué
au pavé
B∞ [r] et à la jauge ! sur B∞ [r], il existe
A
B
une P-partition !-fine (bj , E j ) 1≤j≤m de (] − r, r])n. Posons δ = min{δ(bj ) :
1 ≤ j ≤ m}. Si x ∈ dom f ∩ B2 [a; δ], alors, pour chaque 1 ≤ j ≤ m, on a
x ∈ dom f ∩ B2 [a; δ(bj )], et dès lors, par (5.3) et la définition de !-finesse,
f (x) /∈ B∞ [bj , !(bj )],
(1 ≤ j ≤ m).
En conséquence, pour ces mêmes x, f (x) /∈ B∞ [r], c’est-à-dire |f (x)|∞ > r.
Donc, limx→a f (x) = ∞.
On démontre exactement de la même manière une caractérisation des
limites infinies lorsque x tend vers l’infini.
Proposition. Soit f une fonction de Rn dans Rp telle que dom f ne soit
pas borné. Alors, limx→∞ f (x) = ∞ si et seulement si
(∀b ∈ Rp )(∃! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|∞ > !.
On obtient les résultats correspondants lorsque x tend vers a ou vers
l’infini dans E ⊂ Rn en appliquant les propositions qui précèdent à f |E .
Le choix des normes est évidemment indifférent dans les caractérisations.
Leur négation conduit aux définitions suivantes.
Définition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f . On dit
que b ∈ Rp est un point d’accumulation ou une valeur d’adhérence de f (x)
lorsque x tend vers a si
(∀! > 0)(∀δ > 0)(∃x ∈ dom f : |x − a|2 ≤ δ) : |f (x) − b|2 ≤ !.
(5.4)
Définition. Soit f une fonction de Rn dans Rp telle que dom f ne soit
pas borné. On dit que b ∈ Rp est un point d’accumulation ou une valeur
d’adhérence de f (x) lorsque x tend vers l’infini si
(∀! > 0)(∀ρ > 0)(∃x ∈ dom f : |x|2 ≥ ρ) : |f (x) − b|2 ≤ !.
(5.5)
5.1. LIMITES INFINIES ET POINT D’ACCUMULATION
167
On obtient évidemment les définitions correspondantes de point d’accumulation de f lorsque x tend vers a ou vers l’infini dans E ⊂ Rn en appliquant les définitions précédentes à f |E .
Enfin, dans le cas d’une suite, la définition obtenue à partir du cas général
est équivalente à la suivante.
Définition. Soit (ak )k∈N une suite dans Rp . b ∈ Rp est un point d’accumulation ou une valeur d’adhérence de (ak )k∈N si
(∀! > 0)(∀m ∈ N)(∃k ≥ m) : |ak − b|2 ≤ !.
Bien entendu, dans ces définitions, le choix des normes est indifférent. Il
est immédiat que si b = limx→a f (x) (resp. b = limx→∞ f (x)), alors b est un
point d’accumulation de f (x) lorsque x tend vers a (resp. tend vers l’infini),
et c’est le seul. Mais f peut avoir des points d’accumulation lorsque x tend
vers a (ou vers l’infini) sans que la limite existe. Par exemple, -1 et 1 sont
x
des points d’accumulation de la fonction f : x 2→ x + |x|
lorsque x tend vers
0 (le vérifier), alors que la limite correspondante n’existe pas.
En s’inspirant du résultat correspondant pour la limite, il est facile
d’obtenir les caractérisations suivantes d’un point d’accumulation en termes
de suites.
Proposition. Soit f une fonction de Rn dans Rp et a ∈ adh dom f (resp.
dom f non borné). Alors b est un point d’accumulation de f lorsque x tend
vers a (resp. x tend vers l’infini) si et seulement s’il existe une suite (xk )k∈N
dans dom f telle que xk → a (resp. xk → ∞) et f (xk ) → b lorsque k → ∞.
b est un point d’accumulation de la suite (ak )k∈N si et seulement s’il existe
une suite (kn )n∈N tendant vers l’infini telle que akn → b si m → ∞.
Par exemple, chaque réel b ∈ [−1, 1] est un point d’accumulation de la
fonction x 2→ sin x1 , puisque, si a ∈ [0, 2π] est tel que sin a = b, alors la suite
1
(xk )k∈N∗ = ( a+2kπ
)k∈N∗ converge vers 0 et est telle que sin x1k = b quel que
∗
soit k ∈ N .
Le contraposé de la caractérisation d’existence d’une limite infinie fournit
évidemment une condition nécessaire et suffisante d’existence d’un
point d’accumulation de f lorsque x tend vers a ou tend vers l’infini.
Proposition. Soit f une fonction de Rn dans Rp , a ∈ adh dom f (resp.
dom f non borné). Alors f possède un point d’accumulation lorsque x tend
vers a (resp. tend vers l’infini) si et seulement si f (x) ne tend pas vers l’infini
lorsque x tend vers a (resp. lorsque x tend vers l’infini).
168
CHAPITRE 5. FONCTIONS IMPLICITES
Corollaire. Soit f une fonction de Rn dans Rp , a ∈ adh dom f (resp.dom f
non borné). Si f est localement bornée lorsque x tend vers a (resp. bornée
à l’infini), alors f possède un point d’accumulation lorsque x tend vers a
(resp. tend vers l’infini).
Démonstration. C’est une conséquence immédiate de la Proposition
précédente et du fait que si f est localement bornée en a (resp. bornée
à l’infini), elle ne tend pas vers l’infini lorsque x tend vers a (resp. tend vers
l’infini). Dans le premier cas par exemple,
(∃r > 0)(∃δ > 0)(∀x ∈ dom f ∩ B2 [a; δ]) : |f (x)|2 ≤ r,
ce qui implique la négation de la condition de limite infinie
(∃r $ > 0)(∀δ $ > 0)(∃x ∈ dom f ∩ B2 [a; δ $]) : |f (x)|2 < r $ ,
si l’on prend par exemple r $ = 2r et, pour chaque δ $ > 0, n’importe quel
x ∈ dom f tel que |x − a|2 ≤ min{δ, δ $ }.
Dans le cas des suites, le Corollaire ci-dessus a une formulation encore
plus simple due au résultat suivant.
Définition. On dit qu’une suite (ak )k∈N dans Rp est bornée si l’ensemble
{ak : k ∈ N} est borné.
Lemme. Soit (ak )k∈N une suite dans Rp. Alors (ak )k∈N est bornée si et
seulement si elle est bornée à l’infini.
Démonstration. La condition nécessaire est suffisante. Pour la condition
suffisante, (ak )k∈N est bornée à l’infini si et seulement s’il existe r > 0 et
m ∈ N tels que, pour tout entier k ≥ m, on a |ak |2 ≤ r, ce qui entraı̂ne
aussitôt que, pour tout k ∈ N, on aura
|ak |2 ≤ max{|a0 |2 , |a1 |2 , . . . , |am−1 |2 , r}.
En combinant ce résultat avec la Proposition précédente appliquée au
cas particulier d’une suite, on obtient le résultat important suivant, appelé
théorème de Bolzano-Weierstrass.
Corollaire. Toute suite bornée dans Rp possède au moins un point d’accumulation.
La notion de point d’accumulation d’une suite peut s’exprimer en termes
de l’important concept de sous-suite.
5.2. CRITÈRE DE CAUCHY
169
Définition. Soit (ak )k∈N une suite dans Rp. On appelle sous-suite de
(ak )k∈N ou suite extraite de (ak )k∈N toute suite de la forme (akn )n∈N où
(kn )n∈N est une suite dans N telle que kn < kn+1 pour tout k ∈ N.
En d’autres termes, une sous-suite de (ak )k∈N est une suite obtenue en
composant (ak )k∈N avec une suite (kn )n∈N vérifiant kn < kn+1 pour chaque
n ∈ N. Par exemple, (2n)n∈N et (2n + 1)n∈N sont des sous-suites de (k)k∈N
(prendre respectivement kn = 2n et kn = 2n + 1). Notons que la condition
kn < kn+1 entraı̂ne évidemment que, pour chaque n ∈ N, kn+1 ≥ kn + 1, et
dès lors, par récurrence, que kn ≥ n.
La proposition suivante est une conséquence facile de la définition de
limite.
Proposition. Toute sous-suite d’une suite convergente converge vers la
même limite.
On a une autre caractérisation d’un point d’accumulation d’une
suite.
Proposition. b ∈ Rp est un point d’accumulation de la suite (ak )k∈N si et
seulement s’il existe une sous-suite (akn )n∈N de (ak )k∈N qui converge vers b.
Démonstration. Condition nécessaire. Soit b un point d’accumulation de
(ak )k∈N . En prenant ! = 1 et m = 1 dans la définition, on obtient un entier
k0 ≥ 1 tel que |ak0 − b|2 ≤ 1. En prenant ! = 12 et m = k0 + 1, on obtient un
entier k1 ≥ k0 + 1 tel que |ak1 − b|2 ≤ 12 . En continuant de la sorte, on trouve
1
pour chaque entier n ≥ 1 un entier kn ≥ kn−1 + 1 tel que |akn − b|2 ≤ n+1
.
En conséquence, (akn )n∈N est une sous-suite de (ak )k∈N qui converge vers b.
Condition suffisante. Soit (akn )n∈N une sous-suite de (ak )k∈N qui converge
vers b, et soient ! > 0 et m ∈ N. Par hypothèse, (∃q ∈ N)(∀j ≥ q) :
|akj − b|2 ≤ !. Dès lors, si n = kmax{m,q}, on a n ≥ km ≥ m et |an − b|2 ≤ !.
5.2
Critère de Cauchy
Nous sommes maintenant en mesure de démontrer que la condition nécessaire
de Cauchy d’existence de la limite est également suffisante. Cela fournira
le critère de Cauchy, dont l’intérêt est d’être une condition nécessaire et
suffisante d’existence de la limite, qui, au contraire de la définition, ne fait
pas intervenir la valeur de la limite.
170
CHAPITRE 5. FONCTIONS IMPLICITES
Soit f une fonction de Rn dans Rp et a ∈ adh dom f . Rappelons tout
d’abord que la condition de Cauchy pour f lorsque x tend vers a est la
suivante :
(∀! > 0)(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)
(∀y ∈ dom f : |y − a|2 ≤ δ) : |f (x) − f (y)|2 ≤ !.
Complétons maintenant la démonstration du critère de Cauchy pour
la limite de f (x) lorsque x tend vers a en montrant que la condition de
Cauchy est une condition suffisante d’existence de la limite.
Théorème. Soit f une fonction de Rn dans Rp et a ∈ adh dom f . Si
f vérifie la condition de Cauchy lorsque x tend vers a, alors limx→a f (x)
existe.
Démonstration. Puisqu’elle vérifie la condition de Cauchy, f est localement bornée en a et dès lors f possède un point d’accumulation b lorsque
x tend vers a. Montrons maintenant que b = limx→a f (x). Soit ! > 0; par
hypothèse,
(∃δ > 0)(∀x ∈ dom f : |x − a|2 ≤ δ)
!
(∀y ∈ dom f : |y − a|2 ≤ δ) : |f (y) − f (x)|2 ≤ ,
2
et, puisque b est un point d’accumulation, pour cet 2! et ce δ > 0, il existe
un z ∈ dom f ∩ B2 [a; δ] tel que
!
|f (z) − b|2 ≤ .
2
En conséquence, pour tout x ∈ dom f tel que |x − a|2 ≤ δ, on a
|f (x) − b|2 ≤ |f (x) − f (z)|2 + |f (z) − b|2 ≤
!
!
+ = !.
2 2
On démontre d’une manière complètement analogue les résultats correspondants lorsque x tend vers l’infini. Rappelons que, dans ce cas, la
condition de Cauchy s’énonce comme suit :
(∀! > 0)(∃ρ > 0)(∀x ∈ dom f : |x|2 ≥ ρ)
(∀y ∈ dom f : |y|2 ≥ ρ) : |f (x) − f (y)|2 ≤ !.
Lemme. Soit f une fonction de Rn dans Rp telle que dom f soit non borné.
Si f vérifie la condition de Cauchy lorsque x tend vers l’infini, alors f est
bornée à l’infini.
5.3. ITÉRÉES D’UNE APPLICATION
171
Théorème. Soit f une fonction de Rn dans Rp telle que dom f soit non
borné. Si f vérifie la condition de Cauchy lorsque x tend vers l’infini, alors
limx→∞ f (x) existe.
En appliquant ces résultats à la restriction f |E de f à E ⊂ Rn , le lecteur
obtiendra aisément les assertions correspondantes pour la limite de f (x)
lorsque x tend vers a ou vers l’infini dans E.
Enfin, le cas particulier d’une suite conduit aux formulations suivantes.
Appelons suite de Cauchy toute suite vérifiant la condition de Cauchy :
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) :
|ak − aq |2 ≤ !.
Lemme. Toute suite de Cauchy dans Rp est bornée.
Théorème. Toute suite de Cauchy dans Rp est convergente.
5.3
Itérées d’une application
Soit h une application de Rp dans Rp dont nous nous proposons de trouver
les zéros, c’est-à-dire les éléments a ∈ Rp tels que h(a) = 0. En d’autres
termes, nous voulons résoudre l’équation en l’inconnue y
h(y) = 0,
(5.6)
ou encore déterminer ses racines. En dehors de cas très particuliers (h
est une application affine, un polynôme de R dans R ou de C dans C
de degré inférieur ou égal à quatre,...), il n’est pas possible en général
de trouver une formule exacte fournissant les zéros de h et l’on est ramené à leur détermination approchée, avec une erreur arbitrairement petite.
Une stratégie possible pour cette détermination approchée consiste à écrire
l’équation (5.6) sous la forme équivalente
y = y + h(y),
c’est-à-dire, en posant g = I + h, sous la forme
y = g(y).
(5.7)
Les zéros a de h correspondent donc aux points fixes de g, c’est-à-dire aux
éléments a ∈ Rp tels que g(a) = a. Pour tenter de déterminer les points fixes
172
CHAPITRE 5. FONCTIONS IMPLICITES
de g, on peut utiliser la méthode des approximations successives qui
consiste à partir d’un élément y0 arbitraire de Rp et de calculer g(y0 ). Si
g(y0 ) = y0 , alors y0 est un point fixe de g (et donc un zéro de h). Sinon, on
pose y1 = g(y0 ) et l’on calcule
g(y1) = g[g(y0)] = (g ◦ g)(y0) = g 2 (y0 ).
Si g(y1 ) = y1 , alors y1 est un point fixe de g; sinon, on pose y2 = g(y1 ) et
l’on calcule g(y2 ) = (g ◦ g ◦ g)(y0) = g 3 (y0 ). En continuant de la sorte, ou
bien l’on trouve un entier positif k et un yk ∈ Rp tel que g(yk ) = yk , ou bien
l’on détermine, de proche en proche, une suite (yk )k∈N par les relations
y0 ∈ Rp , yk = g(yk−1) = (g ◦ g ◦ . . . ◦ g)(y0) = g k (y0 ), (k ∈ N∗ ).
(5.8)
Pour chaque entier k ≥ 1, l’application g k = g ◦ g ◦ . . . ◦ g (k fois) s’appelle
la ke -itérée de g (on pose aussi g 0 = I). Par exemple, si g est l’application
de R dans R définie par g(y) = y 2 , alors g k (y) = y 2k . Supposons maintenant
que la suite (yk )k∈N définie par les relations (5.8) converge vers y ∗ et que
l’application g soit continue. Alors, en faisant tendre k vers l’infini dans
(5.8), on obtient
y ∗ = lim yk = lim g(yk−1 ) = g( lim yk−1 ) = g(y ∗),
k→∞
k→∞
k→∞
et
est un point fixe de g, c’est-à-dire un zéro de h. On dit que ce point
fixe y ∗ est obtenu par la méthode d’approximations successives définie par
(5.8). On voit donc que la convergence de (yk )k∈N et la continuité de g
suffisent pour obtenir un point fixe de g par la méthode des approximations
successives. Bien entendu, la limite y ∗ de la suite (yk )k∈N n’est pas, en
pratique, connue a priori puisque, dans ce cas, le point fixe correspondant
de g serait connu et le problème posé serait résolu. Il est donc important de
pouvoir déterminer la convergence de (yk )k∈N, sans connaı̂tre explicitement
y ∗ , et l’on fera naturellement appel au critère de Cauchy. La suite (yk )k∈N
dépend de g et de y0 , et il en est donc de même de sa convergence. Par
exemple, si g est l’application de R dans R définie par g(y) = y + 1, alors,
pour n’importe quel y0 ∈ R, on aura, pour k ∈ N∗ ,
y∗
yk = g k (y0 ) = y0 + k,
et la suite correspondante (yk )k∈N est divergente. D’autre part, si g est
l’application de R dans R définie par g(y) = y 2 , on a, pour chaque entier
k ≥ 1, g k (y) = y 2k ; dès lors, si l’on prend y0 = 2, la suite correspondante
5.4. THÉORÈME DES APPLICATIONS CONTRACTANTES
173
(yk )k∈N = (22k )k∈N est divergente tandis que si l’on prend y0 = 12 , la suite
correspondante (yk )k∈N = (2−2k )k∈N converge vers 0. Remarquons aussi
que (yk )k∈N convergera vers 1 si et seulement si y0 = 1. Notons enfin que,
étant donnée une application h dont on veut déterminer les zéros, on peut
construire différentes applications g dont les points fixes fournissent les zéros
de h : par exemple, si L est une application linéaire inversible de Rp dans
Rp , on aura évidemment
h(y) = 0 ⇔ y = y + L[h(y)],
et l’on peut donc prendre g = I + L ◦ h. On est donc amené à déterminer
des conditions sur g et sur y0 qui assurent la convergence de la suite des
itérées (g k (y0 ))k∈N. Nous donnerons, au paragraphe suivant, des conditions sur g assurant cette convergence quel que soit le choix de y0 . Lorsque
de telles conditions sur g ne sont pas satisfaites, le comportement de la
suite des itérées (g k (y0 ))k∈N peut être extrêmement varié et extraordinairement compliqué même pour une fonction g de R dans R aussi simple que
g(y) = ay(1 − y). Une telle suite d’itérées d’une application constitue
l’exemple le plus simple d’un système dynamique discret, et (g k (y0 ))k∈N
s’appelle l’orbite issue de y0 . L’ensemble limite ω(y0 ) de cette orbite est
l’ensemble des points d’accumulation de (g k (y0 ))k∈N . L’étude du comportement asymptotique (pour k → ∞) des orbites conduit en particulier à la
théorie du chaos, qui fait actuellement l’objet de nombreuses recherches.
5.4
Théorème des applications contractantes
Le but de cette section est d’énoncer et démontrer un résultat qui, pour
une application g d’une partie E de Rp en elle-même, assure la convergence
de la suite des itérée (g k (y0 ))k∈N quel que soit le choix de y0 ∈ E. Nous
aurons besoin pour ce faire d’un type de continuité introduit par Rudolph
Lipschitz en 1868.
Définition. Soit E ⊂ Rn et f une application de E dans Rp . On dit que f
est lipschitzienne sur E s’il existe un α ≥ 0 tel que, pour tout u ∈ E et tout
v ∈ E, on ait
|f (u) − f (v)|2 ≤ α|u − v|2 .
Rn .
Ainsi, toute application linéaire L de Rn dans Rp est lipschitzienne sur
Si f est une fonction de Rn dans Rp dérivable en chaque point d’une
174
CHAPITRE 5. FONCTIONS IMPLICITES
boule ouverte B2 (a; r) de Rn et s’il existe une constante α telle que, pour
tout x ∈ B2 (a; r), et tout h ∈ Rn , on ait
|fx$ (h)|2 ≤ α|h|2 ,
alors f sera lipschitzienne sur Bj (a; r) puisque, par le théorème de la moyenne, si u ∈ B2 (a; r) et v ∈ B2 (a; r), il existera θ ∈ ]0, 1[ tel que
$
|f (u) − f (v)|2 ≤ |fv+θ(u−v)
(u − v)|2 ≤ α|u − v|2 ,
puisque u + θ(v − u) ∈ B2 (a; r). D’autre part, toute application f de E dans
Rp lipschitzienne sur E est évidemment uniformément continue sur E. En
outre, si f est lipschitzienne sur E, alors pour chaque a ∈ E, l’application
(a)
x 2→ f (x)−f
est localement bornée en a. On peut évidemment, dans la
|x−a|2
définition, remplacer les normes | · |2 par d’autres normes.
Définition. Soit E ⊂ Rp et g une application de E dans Rp . On dit que
g est une application contractante ou une contraction sur E pour la norme
| · |j (j = 1, 2, ∞), s’il existe un α ∈ [0, 1[ tel que, pour tout u ∈ E et tout
v ∈ E, on ait
|g(u) − g(v)|j ≤ α|u − v|j .
α est appelée une constante de contraction de f .
Une application f de E dans Rp contractante sur E est évidemment
lipschitzienne sur E. La propriété suivante est utile.
Lemme. Soit E ⊂ Rp et g une application contractante de E dans E de
constante α pour la norme | · |j . Alors, pour chaque entier k ≥ 1, g k =
g ◦ g ◦ . . . ◦ g est contractante sur E de constante αk pour la norme | · |j .
Démonstration. Elle se fait par récurrence sur k. Le résultat est évident
pour k = 1. Si maintenant k ≥ 2 et g k−1 est contractante sur E de constante
αk−1 , alors, pour tout u ∈ E et tout v ∈ E, on a
#
#
#
#
|g k (u)−g k (v)|j = #g k−1 [g(u)] − g k−1 [g(v)]# ≤ αk−1 |g(u)−g(v)|j ≤ αk |u−v|j .
j
Quoiqu’énoncé et démontré dans Rp par Edouard Goursat en 1903, le
résultat suivant, appelé théorème des applications contractantes, est
aussi connu comme théorème du point fixe de Banach suite à l’extension
à des espaces plus généraux donnée par Stefan Banach en 1922.
5.4. THÉORÈME DES APPLICATIONS CONTRACTANTES
175
Théorème. Soit E un fermé non vide de Rp, j = 1, 2 ou ∞ et g une
application contractante de E dans E pour la norme | · |j , de constante
α ∈ [0, 1[. Alors, g possède dans E un point fixe unique y ∗ . En outre, pour
chaque y0 ∈ E, la suite (yk )k∈N des itérées de y0 définie par
yk = g(yk−1) = g k (y0 ), k ∈ N∗ ,
converge vers y ∗ . Enfin, pour chaque k ∈ N∗ , on a
|yk − y ∗ |j ≤
αk
|g(y0 ) − y0 |j .
1−α
Démonstration. Soit
8 y0 ∈9E. Notons tout d’abord que, puisque g(E) ⊂
E, la suite (yk )k∈N = g k (y0 )
des itérées de y0 est bien définie et est une
k∈N
suite dans E. Montrons que c’est une suite de Cauchy. Pour chaque k ∈ N∗ ,
on a
#
#
#
#
|yk+1 − yk |j = #g k [g(y0)] − g k (y0 )# ≤ αk |g(y0 ) − y0 |j ,
j
et dès lors, si k ∈ N et q ∈ N, on a
|yk − yq |j = |yk − yk+1 + yk+1 − yq+1 + yq+1 − yq |j
≤ |yk − yk+1 |j + |yk+1 − yq+1 |j + |yq+1 − yq |j
≤ αk |g(y0 ) − y0 |j + |g(yk ) − g(yq )|j + αq |g(y0) − y0 |j
ce qui entraı̂ne
≤ (αk + αq )|g(y0) − y0 |j + α|yk − yq |j ,
|yk − yq |j ≤
αk + αq
|g(y0) − y0 |j .
1−α
(5.9)
k
α
Comme α ∈ [0, 1[, la suite ( 1−α
|g(y0 ) − y0 |j )k∈N converge vers zéro et dès
lors, si ! > 0 est donné, il existera m ∈ N tel que, pour tout entier k ≥ m ,
on a
αk
!
|g(y0 ) − y0 |j ≤ ;
1−α
2
cela entraı̂ne que, pour k ≥ m et q ≥ m, on a |yk − yq |j ≤ !, et (yk )k∈N est
une suite de Cauchy dans E. Elle converge donc vers un élément y ∗ ∈ Rp
et, puisque E est fermé, on a y ∗ ∈ E. Montrons que y ∗ est un point fixe de
g; pour tout k ∈ N, on a
0 ≤ |y ∗ − g(y ∗ )|j = |y ∗ − yk+1 + g(yk ) − g(y ∗ )|j ≤ |y ∗ − yk+1 |j + α|yk − y ∗ |j ,
176
CHAPITRE 5. FONCTIONS IMPLICITES
et dès lors, en faisant tendre k vers l’infini, on en déduit que |y ∗ −g(y ∗ )|j = 0.
On peut aussi obtenir le même résultat comme dans la section précédente
en utilisant la continuité de g. D’ailleurs, g possède un seul point fixe dans
E puisque, si y ∗ et y ∗∗ sont des points fixes de g dans E, on a
0 ≤ |y ∗ − y ∗∗ |j = |g(y ∗) − g(y ∗∗)|j ≤ α|y ∗ − y ∗∗ |j ,
et dès lors
0 ≤ (1 − α)|y ∗ − y ∗∗ |j ≤ 0,
ce qui implique y ∗ = y ∗∗ . Enfin, pour chaque k ∈ N∗ , si l’on fait tendre q
vers l’infini dans (5.9), on obtient
|yk − y ∗ |j ≤
αk
|g(y0 ) − y0 |j .
1−α
Par exemple, pour chaque a ∈ ] − 1, 1[ et chaque b ∈ R, l’équation de
Kepler
y = a sin y + b,
possède une solution unique y ∗ = limk→∞ yk où y0 ∈ R est arbitraire et,
pour chaque k ∈ N∗ ,
yk = a sin yk−1 + b,
puisque l’application g de R dans R définie par g(y) = a sin y + b est telle
que, pour tout u ∈ R et tout v ∈ R, il existe, par le théorème de Lagrange,
θ ∈ ]0, 1[ tel que
|g(u) − g(v)| = |a||(sin u − sin v)| = |a|| cos(u + θ(v − u))(u − v)| ≤ |a||u − v|,
et g est donc une contraction sur R de constante |a| ∈ [0, 1[.
Sous les hypothèses du théorème des applications contractantes, le point
fixe unique y ∗ de g est un attracteur global pour le système dynamique défini
par les itérées de g.
5.5
Fonctions implicites : existence
Soit F une fonction de Rn × Rp dans Rq . L’ensemble de ses zéros
F −1 ({0}) = {(x, y) ∈ dom F : F (x, y) = 0}
(5.10)
5.5. FONCTIONS IMPLICITES : EXISTENCE
177
constitue donc un graphe de Rn dans Rp . L’objet de la théorie des fonctions
implicites est de déterminer des conditions sur F sous lesquelles le graphe
F −1 ({0}) est une fonction de Rn dans Rp (problème global) ou sous lesquelles
la restriction de F −1 ({0}) à un voisinage d’un de ses points est une fonction
de Rn dans Rp (problème local). Pour situer la difficulté du problème et
motiver les hypothèses du théorème qui donnera la solution du problème
local (le problème global est beaucoup plus difficile et ne sera pas abordé
ici), considérons tout d’abord le cas où F est une application affine de R × R
dans R. Elle peut donc s’écrire
F (x, y) = ax + by + c,
où a, b et c sont des réels. Pour que le graphe F −1 ({0}) correspondant soit
une fonction de R dans R, il faut qu’à chaque x ∈ R corresponde au plus un
élément y ∈ R tel que
ax + by + c = 0,
c’est-à-dire il faut que l’équation linéaire en y
by = −ax − c
ait au plus une solution; ce sera le cas si et seulement si b /= 0. On notera que
pour chaque x ∈ R et chaque y ∈ R, b = D2 F (x, y) est la dérivée partielle
de F par rapport à y en (x, y).
Considérons maintenant une situation simple où F est non linéaire. Soit
F l’application de R × R dans R définie par F (x, y) = x2 + y 2 − 1. Le graphe
F −1 ({0}) correspondant est la partie de R2 formée des points du cercle de
centre 0 et de rayon 1 et ce n’est pas un graphe fonctionnel, puisque, pour
chaque x ∈]−1, 1[⊂ [−1, 1] = dom F −1 ({0}), il existe deux éléments distincts
(x, (1 − x2 )1/2) et (x, −(1 − x2 )1/2) appartenant à F −1 ({0}). Pour la même
raison, la restriction de F −1 ({0}) à n’importe quel voisinage du point (−1, 0)
et du point (1, 0) de F −1 ({0}) ne sera pas une fonction de R dans R. Ces
points sont les seuls points du graphe de la forme (x, 0). Si (x, y) ∈ F −1 ({0})
avec y > 0 (resp. y < 0), on vérifie sans peine que la restriction de F −1 ({0})
au voisinage {(x, y) ∈ R2 : y ≥ 0} (resp. {(x, y) ∈ R2 : y ≤ 0}) de (x, y)
est une fonction f de R dans R de domaine [−1, 1] donnée explicitement
par f (x) = (1 − x2 )1/2 (resp. f (x) = −(1 − x2 )1/2). Notons que, pour
chaque (x, y) ∈ R × R, D2 F (x, y) = 2y et dès lors que la restriction de
F −1 ({0}) est une fonction sur un voisinage convenable des points (x, y) tels
que D2 F (x, y) /= 0 et n’est une fonction sur aucun voisinage des points (x, y)
tels que D2 F (x, y) = 0. Il ne faudrait toutefois pas en conclure trop vite que
178
CHAPITRE 5. FONCTIONS IMPLICITES
la condition D2 F (x, y) /= 0 est nécessaire et suffisante pour que la restriction
de F −1 ({0}) à un voisinage d’un de ses points (x, y) soit une fonction de R
dans R puisque l’exemple de F (x, y) = y 3 − x, dont le graphe correspondant
F −1 ({0}) = {(x, y) ∈ R × R : y 3 − x = 0}
est celui de l’application f de R dans R définie par f (x) = x1/3, est tel que
D2 F (x, y) = 3y 2 et donc D2 F (0, 0) = 0 au point (0, 0) de F −1 ({0}). La
condition D2 F (x, y) /= 0 n’est donc pas nécessaire. Toutefois, l’important
théorème des fonctions implicites, que nous allons démontrer, montre
que, sous certaines conditions de régularité sur F , la condition D2 F (x, y) /= 0
est suffisante pour que la restriction de F −1 ({0}) à un voisinage suffisamment
petit du point (x, y) de F −1 ({0}) soit une fonction. Nous donnerons d’abord
le théorème dans le cas particulier où p = 1 avant de l’étendre au cas où p
est quelconque.
Théorème. Soit F une fonction de Rn ×R dans R, (x0 , y0 ) ∈ dom F, r0 > 0,
R0 > 0 tels que
B2 (x0 ; r0 )× ]y0 − R0 , y0 + R0 [ ⊂ dom F
et tels que les conditions suivantes soient satisfaites.
1. F (x0 , y0 ) = 0 (c’est-à-dire (x0 , y0 ) ∈ F −1 ({0})).
2. La fonction F (·, y0 ) : x 2→ F (x, y0 ) est continue en x0 .
3. Pour chaque x ∈ B2 (x0 ; r0) et chaque y ∈ ]y0 − R0 , y0 + R0 [, D2 F (x, y)
existe et la fonction correspondante D2 F : (x, y) 2→ D2 F (x, y) de Rn × R
dans R est continue en (x0 , y0 ).
4. D2 F (x0 , y0 ) /= 0.
Alors il existe r ∈ ]0, r0[ et R ∈ ]0, R0[ tels que la restriction f du graphe
F −1 ({0}) à B2 [x0 ; r] × [y0 − R, y0 + R] est une application de B2 [x0 ; r] dans
[y0 − R, y0 + R] continue en x0 .
Démonstration. La première partie de la thèse revient à démontrer l’existence de r ∈]0, r0[ et R ∈]0, R0[ tels que, pour chaque x ∈ B2 [x0 ; r], l’équation
F (x, y) = 0
(5.11)
en l’inconnue y possède dans [y0 − R, y0 + R] une solution unique, que l’on
notera alors f (x). La deuxième partie de la thèse revient à prouver que f
est continue en x0 . Nous allons construire, pour chaque x ∈ B2 (x0 ; r0) une
fonction de R dans R dont les points fixes y correspondent aux solutions
de (5.11) et pour laquelle le théorème des applications contractantes sera
179
5.5. FONCTIONS IMPLICITES : EXISTENCE
applicable. Si nous posons L = D2 F (x0 , y0 ), alors pour chaque (x, y) ∈
B2 (x0 ; r0)× ]y0 − R0 , y0 + R0 [, nous avons
F (x, y) = 0 ⇔ Ly + F (x, y) − Ly = 0 ⇔ y = G(x, y),
si G est la fonction de Rn × R de domaine égal à dom F définie par
G(x, y) = −L−1 [F (x, y) − Ly].
Pour chaque x ∈ B2 (x0 ; r0), si u ∈ ]y0 − R0 , y0 + R0 [ et v ∈ ]y0 − R0 , y0 + R0 [,
le théorème de Lagrange appliqué à la fonction G(x, ·) : y 2→ G(x, y) entraı̂ne
l’existence d’un θ ∈ ]0, 1[ tel que
G(x, u) − G(x, v) = (u − v)D2G(x, v + θ(u − v))
= −(u − v)L−1 [D2 F (x, v + θ(u − v)) − L]
= −(u − v)L−1 [D2 F (x, v + θ(u − v)) − D2 F (x0 , y0 )].
Par l’hypothèse 3, il existe r1 ∈ ]0, r0[ et R ∈ ]0, R0[ tels que, pour tout
(x, y) ∈ B2 [x0 ; r1] × [y0 − R, y0 + R] on a
|D2 F (x, y) − D2 F (x0 , y0 )| ≤
L
,
2
et dès lors, si x ∈ B2 [x0 ; r1], u ∈ [y0 −R, y0 +R], v ∈ [y0 −R, y0 +R], on aura,
pour le θ donné par le théorème de Lagrange, v + θ(u − v) ∈ [y0 − R, y0 + R],
et dès lors,
|G(x, u) − G(x, v)| ≤ |u − v|L−1
L
1
= |u − v|,
2
2
ce qui montre que, pour chaque x ∈ B2 [x0 ; r1], l’application G(x, ·) est lipschitzienne de constante 12 sur [y0 − R, y0 + R]. Pour pouvoir appliquer le
théorème du point fixe de Banach, il faut encore que G(x, ·) soit une application de [y0 − R, y0 + R] dans [y0 − R, y0 + R]. On a, pour tout x ∈ B2 [x0 ; r1]
et tout y ∈ [y0 − R, y0 + R],
|G(x, y) − y0 | ≤ |G(x, y) − G(x, y0 )| + |G(x, y0) − y0 |
= |G(x, y) − G(x, y0)| + |L−1 F (x, y0 )|
≤
1
R
|y − y0 | + |L−1 F (x, y0 )| ≤ + |L−1 F (x, y0 )|.
2
2
180
CHAPITRE 5. FONCTIONS IMPLICITES
Par l’hypothèse 1 et l’hypothèse 2, il existe r ∈ ]0, r1] tel que, pour tout
x ∈ B2 [x0 ; r], on a
|L−1 F (x, y0 )| = |L−1 [F (x, y0 ) − F (x0 , y0 )]| ≤
R
,
2
et dès lors, pour chaque x ∈ B2 [x0 ; r] et chaque y ∈ [y0 − R, y0 + R], on aura
|G(x, y) − y0 | ≤ R,
ce qui montre que G(x, ·) est une application du fermé [y0 − R, y0 + R] en
lui-même. Le théorème de Banach entraı̂ne donc, pour chaque x ∈ B2 [x0 ; r],
l’existence d’un point fixe unique y ∈ [y0 − R, y0 + R] de G(x, ·), c’est-à-dire
l’existence d’un unique y = f (x) ∈ [y0 − R, y0 + R] tel que F [x, f (x)] = 0.
Pour x = x0 , l’unicité entraı̂ne en particulier que f (x0 ) = y0 . Il reste à
montrer que f est continue en x0 . Si x ∈ B2 [x0 ; r], on a
|f (x) − f (x0 )| = |G[x, f (x)] − G[x0 , f (x0 )]|
= |G[x, f (x)] − G[x, f (x0)] + G(x, y0 ) − G(x0 , y0 )|
1
≤ |f (x) − f (x0 )| + |L−1 [F (x, y0 ) − F (x0 , y0 )]|.
2
Dès lors,
|f (x) − f (x0 )| ≤ 2|L−1 [F (x, y0 ) − F (x0 , y0 )]|,
et comme le second membre tend vers 0 lorsque x tend vers x0 en vertu de
l’hypothèse 2, on voit que f est continue en x0 .
Enonçons et démontrons maintenant le théorème dans le cas général.
Pour motiver l’énoncé dans ce cas (la démonstration sera très semblable à
celle du cas particulier précédent), considérons le cas où F est une application
linéaire de Rn × Rp dans Rq . Elle peut donc s’écrire
F (x, y) = Ax + By,
où A est une application linéaire de Rn dans Rq et B une application linéaire
de Rp dans Rq . Pour que le graphe F −1 ({0}) correspondant soit une fonction
de Rn dans Rp , il faut qu’à chaque x ∈ Rn corresponde au plus un élément
y ∈ Rp tel que
Ax + By = 0,
c’est-à-dire il faut que le système linéaire en y
By = −Ax
5.5. FONCTIONS IMPLICITES : EXISTENCE
181
ait au plus une solution. La théorie des équations linéaires nous apprend que
ce sera le cas si et seulement si B est injective. Cela entraı̂ne en particulier
que p ≤ q et nous nous restreindrons au cas le plus simple où q = p. Dans ce
cas, la condition pour que F −1 ({0}) soit une fonction (en fait une application
de Rn dans Rp) est que B soit inversible, ou encore que det B /= 0. On notera
que si, pour chaque x ∈ Rn fixé, F (x, ·) désigne l’application (affine) de Rp
dans Rp définie par F (x, ·) = Ax + B(·), alors, pour chaque y ∈ Rp, B est
la dérivée totale de F (x, ·) en y, c’est-à-dire B = (F (x, ·))$y . On doit donc
s’attendre, dans le cas non linéaire, à trouver une hypothèse d’inversibilité
pour (F (x0 , ·))$y0 .
Théorème. Soit F une fonction de Rn × Rp dans Rp , (x0 , y0 ) ∈ dom F,
r0 > 0, R0 > 0 tels que
B2 (x0 ; r0 ) × B2 (y0 ; R0) ⊂ dom F
et tels que les conditions suivantes soient satisfaites.
1. F (x0 , y0 ) = 0 (c’est-à-dire (x0 , y0 ) ∈ F −1 ({0})).
2. La fonction F (., y0 ) : x 2→ F (x, y0 ) est continue en x0 .
3. Pour chaque x ∈ B2 (x0 ; r0 ) la fonction F (x, ·) : y 2→ F (x, y) de Rp dans
Rp est dérivable en chaque y ∈ B2 (y0 ; R0), et, pour chaque 1 ≤ j ≤ p, la
fonction correspondante Dyj F : (x, y) 2→ Dyj F (x, y) de Rn × Rp dans Rp est
continue en (x0 , y0 ).
4. L’application linéaire (F (x0 , ·))$y0 de Rp dans Rp est inversible (c’est-à-dire
le déterminant de la matrice jacobienne correspondante
(Dyj Fk (x0 , y0 ))(1≤j≤p; 1≤k≤p)
est différent de zéro).
Alors il existe r ∈ ]0, r0[ et R ∈ ]0, R0[ tels que la restriction f du graphe
F −1 ({0}) à B2 [x0 ; r]×B2 [y0 ; R] est une application de B2 [x0 ; r] dans B2 [y0 ; R]
continue en x0 .
Démonstration. La première partie de la thèse revient à démontrer l’existence de r ∈]0, r0[ et R ∈]0, R0[ tels que, pour chaque x ∈ B2 [x0 ; r], l’équation
F (x, y) = 0
(5.12)
en l’inconnue y possède dans B2 [y0 ; R] une solution unique, que l’on notera
alors f (x). La deuxième partie de la thèse revient à prouver que f est
continue en x0 . Nous allons construire, pour chaque x ∈ B2 (x0 , r0) une
fonction de R dans R dont les points fixes y correspondent aux solutions
182
CHAPITRE 5. FONCTIONS IMPLICITES
de (5.12) et pour laquelle le théorème des applications contractantes sera
applicable. Si nous posons L = (F (x0 , ·))$y0 , (L est donc une application
linéaire inversible de Rp dans Rp ), alors pour chaque (x, y) ∈ B2 (x0 ; r0) ×
B2 (y0 ; R0), nous avons
F (x, y) = 0 ⇔ Ly + F (x, y) − Ly = 0 ⇔ y = G(x, y),
si G est la fonction de Rn × Rp de domaine égal à dom F définie par
G(x, y) = −L−1 [F (x, y) − Ly].
Pour chaque x ∈ B2 (x0 ; r0 ), si u ∈ B2 (y0 ; R0) et v ∈ B2 (y0 ; R0 ), l’inégalité de
la moyenne appliqué à la fonction G(x, ·) : y 2→ G(x, y) entraı̂ne l’existence
d’un θ ∈ ]0, 1[ tel que
|G(x, u) − G(x, v)|2 ≤ |(G(x, ·))$v+θ(u−v)(u − v)|2
= |L−1 [(F (x, ·))$v+θ(u−v) − L](u − v)|2
≤ |L−1 |2,2 |[(F (x, ·))$v+θ(u−v) − L](u − v)|2
= |L
−1

|2,2 
≤ |L−1 |2,2 |(F (x, ·))$v+θ(u−v) − L|2,2 |u − v|2
p
$
j=1
|Dyj F (x, v + θ(u − v))
1/2
− Dyj F (x0 , y0 )|22 
|u − v|2 .
Par l’hypothèse 3, il existe r1 ∈ ]0, r0[ et R ∈ ]0, R0[ tels que, pour tout
(x, y) ∈ B2 [x0 ; r1] × B2 [y0 ; R] et chaque 1 ≤ j ≤ p, on a
|Dyj F (x, y) − Dyj F (x0 , y0 )|2 ≤
1
2p1/2|L−1 |
,
2,2
et dès lors, si x ∈ B2 [x0 ; r1], u ∈ B2 [y0 ; R], v ∈ B2 [y0 ; R], on aura, pour le θ
donné par le théorème de la moyenne, v + θ(u − v) ∈ B2 [y0 ; R], et dès lors,
|G(x, u) − G(x, v)|2 ≤
1
|u − v|2 ,
2
ce qui montre que, pour chaque x ∈ B2 [x0 ; r1 ], l’application G(x, ·) est lipschitzienne de constante 12 sur B2 [y0 ; R]. Pour pouvoir appliquer le théorème
du point fixe de Banach, il faut encore que G(x, ·) soit une application de
B2 [y0 ; R] dans B2 [y0 ; R]. On a, pour tout x ∈ B2 [x0 ; r1 ] et tout y ∈ B2 [y0 ; R],
|G(x, y) − y0 |2 ≤ |G(x, y) − G(x, y0 )|2 + |G(x, y0) − y0 |2
183
5.6. FONCTIONS IMPLICITES : RÉGULARITÉ
= |G(x, y) − G(x, y0 )|2 + |L−1 F (x, y0 )|2
1
R
≤ |y − y0 |2 + |L−1 F (x, y0 )|2 ≤ + |L−1 F (x, y0 )|2 .
2
2
Par l’hypothèse 1, l’hypothèse 2 et la continuité des applications linéaires, il
existe r ∈ ]0, r1] tel que, pour tout x ∈ B2 [x0 ; r], on a
|L−1 F (x, y0 )|2 = |L−1 [F (x, y0 ) − F (x0 , y0 )]|2 ≤
R
,
2
et dès lors, pour chaque x ∈ B2 [x0 ; r] et chaque y ∈ B2 [y0 ; R], on aura
|G(x, y) − y0 |2 ≤ R,
ce qui montre que G(x, ·) est une application du fermé B2 [y0 ; R] en ellemême. Le théorème de Banach entraı̂ne donc, pour chaque x ∈ B2 [x0 ; r],
l’existence d’un point fixe unique y ∈ B2 [y0 ; R] de G(x, ·), c’est-à-dire l’existence d’un unique y = f (x) ∈ B2 [y0 ; R] tel que F [x, f (x)] = 0. Pour x = x0 ,
l’unicité entraı̂ne en particulier que f (x0 ) = y0 . Il reste à montrer que f est
continue en x0 . Si x ∈ B2 [x0 ; r], on a
|f (x) − f (x0 )|2 = |G[x, f (x)] − G[x0 , f (x0 )]|2
= |G[x, f (x)] − G[x, f (x0)] + G(x, y0 ) − G(x0 , y0 )|2
≤
1
|f (x) − f (x0 )|2 + |L−1 [F (x, y0 ) − F (x0 , y0 )]|2.
2
Dès lors,
|f (x) − f (x0 )|2 ≤ 2|L−1 [F (x, y0 ) − F (x0 , y0 )]|2 ,
et comme le second membre tend vers 0 lorsque x tend vers x0 en vertu de
l’hypothèse 2, on voit que f est continue en x0 .
5.6
Fonctions implicites : régularité
Si l’on impose à F des conditions de continuité ou de dérivabilité plus fortes,
on obtient des conditions de continuité ou de dérivabilité plus fortes pour f .
184
CHAPITRE 5. FONCTIONS IMPLICITES
Proposition. Dans les conditions du théorème des fonctions implicites, si
l’on suppose en outre que, pour chaque y ∈ B2 (y0 ; R0 ), la fonction F (·, y) :
x 2→ F (x, y) est continue sur B2 (x0 ; r0 ), alors f est continue sur B2 [x0 ; r].
Démonstration. Il suffit d’imiter la fin de la démonstration du théorème
des fonctions implicites. Si a ∈ B2 [x0 ; r] et x ∈ B2 [x0 ; r], on a
|f (x) − f (a)|2 = |G[x, f (x)] − G[a, f (a)]|2
= |G[x, f (x)] − G[x, f (a)] + G(x, f (a)) − G(a, f (a))|2
≤
1
|f (x) − f (a)|2 + |L−1 [F (x, f (a)) − F (a, f (a))]|2.
2
Dès lors,
|f (x) − f (a)|2 ≤ 2|L−1 [F (x, f (a)) − F (a, f (a))]|2,
et comme le second membre tend vers 0 lorsque x tend vers a en vertu de
l’hypothèse de continuité sur F (·, f (a)), on voit que f est continue en a.
Proposition. Dans les conditions du théorème des fonctions implicites, si
l’on suppose en outre que F est dérivable en (x0 , y0 ), alors f sera dérivable
en x0 et
fx$ 0 = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 .
Démonstration. La dérivabilité de F en (x0 , y0 ) entraı̂ne l’existence d’une
fonction α de Rn ×Rp dans Rp de domaine au moins égal à (dom F −(x0 , y0 ))\
{(0, 0)}, tendant vers zéro lorsque son argument tend vers zéro et telle que
$
F (x0 + h, y0 + l) = F (x0 , y0 ) + F(x
(h, l) + |(h, l)|2α(h, l)
0 ,y0 )
= F (x0 , y0 ) + (F (., y0 ))$x0 (h) + (F (x0 , .))$y0 (l) + |(h, l)|2α(h, l),
pour tout (h, l) ∈ (dom F − (x0 , y0 )) \ {(0, 0)}. Dès lors, si h ∈ Rp est tel que
|h|2 ≤ r $ avec r $ ∈ ]0, r] tel que |f (x0 + h) − f (x0 )|2 ≤ R lorsque |h|2 ≤ r $ (un
tel r $ existe toujours puisque f est continue en x0 ), il résulte de la définition
de f et de l’égalité précédente avec l = f (x0 + h) − f (x0 ) que
0 = (F (·, y0))$x0 (h) + (F (x0 , ·))$y0 (f (x0 + h) − f (x0 ))
+|(h, f (x0 + h) − f (x0 ))|2α[h, f (x0 + h) − f (x0 )];
dès lors, puisque (F (x0 , ·))$y0 est inversible,
f (x0 + h) − f (x0 )
185
5.6. FONCTIONS IMPLICITES : RÉGULARITÉ
= −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |(h, f (x0 + h) − f (x0 ))|2 β(h)], (5.13)
où β est définie par
β(h) = −[(F (x0 , ·))$y0 ]−1 α (h, f (x0 + h) − f (x0 )) ,
et tend donc vers 0 lorsque h tend vers zéro. En particulier, on peut trouver
un r $$ ∈ ]0, r $] tel que, pour tout 0 < |h|2 ≤ r $$ , on ait
|β(h)|2 ≤
1
,
2
et dès lors, pour ces mêmes valeurs de h, on déduit de (5.13) que
#
#
#
#
|f (x0 + h) − f (x0 )|2 ≤ #[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h)#
2
1
1
+ |h|2 + |f (x0 + h) − f (x0 )|2 ,
2
2
c’est-à-dire,
|f (x0 + h) − f (x0 )|2 ≤ 2|[(F (x0, ·))$y0 ]−1 [(F (·, y0 ))$x0 (h)|2 + |h|2 .
Il en résulte aussitôt que la fonction h 2→
en 0. Dès lors (5.13) peut s’écrire
f (x0 +h)−f (x0 )
|h|2
est localement bornée
f (x0 + h) − f (x0 )
#4
# h
= −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |h|2 ##
|h|2
,
5#
f (x0 + h) − f (x0 ) ##
# β(h)
|h|2
2
= −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 (h) + |h|2 γ(h),
où la fonction γ définie par
#4
# h
γ(h) = ##
|h|2
,
5#
f (x0 + h) − f (x0 ) ##
# β(h),
|h|2
2
tend vers 0 lorsque h tend vers 0 comme produit d’une fonction localement
bornée en 0 par une fonction tendant vers zéro. Par la caractérisation de la
dérivabilité totale, f est dérivable en x0 et
fx$ 0 = −[(F (x0 , ·))$y0 ]−1 (F (·, y0 ))$x0 .
186
CHAPITRE 5. FONCTIONS IMPLICITES
Remarque. Lorsque n = p = 1, la formule donnant la dérivée d’une fonction implicite peut évidemment s’écrire, en termes de dérivées ordinaires
D1 F (x0 , y0 )
f $ (x0 ) = −
.
D2 F (x0 , y0 )
En faisant des hypothèses de dérivabilité plus fortes sur F , on obtient
des propriétés correspondantes de dérivabilité pour f .
Proposition. Supposons que, outre les conditions du théorème des fonctions implicites, F soit dérivable en chaque point de B2 (0; r0) × B2 (y0 ; R0)
et que les fonctions (x, y) 2→ Dxi F (x, y), (1 ≤ i ≤ n) et (x, y) 2→ Dyj F (x, y),
(1 ≤ j ≤ p) soient continues sur B2 (0; r0)×B2 (y0 ; R0). Alors il existe r̃ ∈]0, r]
tel que f soit dérivable en chaque point x de B2 (0; r̃) et tel que les fonctions
x 2→ Dif (x), (1 ≤ i ≤ n), soient continues sur B2 (0; r̃).
Démonstration. Par hypothèse, la fonction (x, y) 2→ det(F (x, ·))$y est
continue sur B2 (0; r0) × B2 (y0 ; R0 ) et telle que det(F (x0 , ·)$y0 /= 0. Comme,
en outre, f est continue sur B2 (0; r0), la fonction x 2→ det(F (x, ·))$f (x) est
continue sur B2 (0; r0) et telle que
det(F (x0 , ·))$f (x0) = det(F (x0 , ·))$y0 /= 0.
En conséquence, il existe r̃ ∈ ]0, r0] tel que det(F (x, ·))$f (x) /= 0 pour tout x ∈
B2 (x0 ; r̃) et la Proposition précédente est applicable en un tel x, entraı̂nant
la dérivabilité de f en x et la formule
fx$ = −[(F (x, ·))$f (x)]−1 (F (·, f (x)))$x.
Dès lors, en utilisant les formules reliant dérivée totale et dérivées partielles,
la continuité des dérivées partielles de F et les formules donnant l’inverse et
le produit de deux matrices, on en déduit la continuité des dérivées partielles
Di f, (1 ≤ i ≤ n) en chaque point de B2 (x0 ; r̃).
Remarque. Dans le cas où n = p = 1 et où f est dérivable sur un voisinage
de x0 , la formule donnant la dérivée de f en x peut se retrouver à partir de
l’identité
F (x, f (x)) = 0,
en utilisant le théorème de dérivation d’une fonction composée, qui entraı̂ne
ici
d
0=
[F (x, f (x))] = D1 F (x, f (x)) + D2 F (x, f (x))f $(x),
dx
dont on déduit aussitôt
D1 F (x, f (x))
f $ (x) = −
.
D2 F (x, f (x))
5.7. FONCTION RÉCIPROQUE
5.7
187
Fonction réciproque
Le théorème des fonctions implicites permet d’étudier l’existence locale et
la régularité de la fonction réciproque d’une fonction de Rp dans Rp. Soit g
une fonction de Rp dans Rp , y0 ∈ dom g, et posons x0 = g(y0 ). Le graphe
de g est l’ensemble
G = {(y, x) ∈ Rp × Rp : y ∈ dom g et x = g(y)}
et le graphe réciproque G−1 est l’ensemble
G−1 = {(x, y) ∈ Rp × Rp : y ∈ dom g et x = g(y)}.
Le problème de l’existence locale de la fonction réciproque de g consiste à
trouver des conditions sous lesquelles la restriction de G−1 à un voisinage de
(x0 , y0 ) est une fonction, qui sera alors la fonction réciproque g −1 de g au
voisinage du point considéré. Si l’on remarque que
G−1 = {(x, y) ∈ Rp × Rp : y ∈ dom g et g(y) − x = 0},
on voit que l’existence de la fonction réciproque de g au voisinage de (x0 , y0 )
n’est rien d’autre que l’existence locale de la fonction implicite correspondant
à F (x, y) = g(y) − x.
Proposition. Soit g une fonction de Rp dans Rp , y0 ∈ dom g, x0 = g(y0 ).
S’il existe R0 > 0 tel que g soit dérivable en chaque point de B2 (y0 ; R0 ) et
tel que, pour chaque 1 ≤ j ≤ p, la fonction y 2→ Dj g(y) soit continue en
y0 , et si gy$ 0 est inversible (c’est-à-dire si det gy$ 0 /= 0), alors il existe r̃ > 0
et R̃ ∈ ]0, R0[ tels que la restriction du graphe G−1 à B2 (x0 ; r̃) × B2 (y0 ; R̃)
soit une application g −1 de B2 (x0 ; r̃) dans B2 (y0 ; R̃) continue sur B2 (x0 ; r̃),
dérivable en y0 et telle que
(g −1 )$x0 = [gg$ −1(x0 ) ]−1 .
Si, en outre, pour chaque 1 ≤ j ≤ p,la fonction y 2→ Dj g(y) est continue sur
B2 (y0 ; R0), alors g −1 est dérivable en chaque point de B2 (x0 ; r̃), telle que
(g −1 )$x = [gg$ −1(x)]−1 ,
et telle que, pour chaque 1 ≤ j ≤ p, la fonction x 2→ Dj g −1 (x) est continue
en chaque point x ∈ B2 (x0 ; r̃).
Démonstration. Il suffit de vérifier que la fonction F définie par F (x, y)
= g(y) − x sur dom F = Rp × dom g vérifie les conditions de régularité
188
CHAPITRE 5. FONCTIONS IMPLICITES
requises par la version du théorème des fonctions implicites correspondant
aux hypothèses de régularité faites et de noter que
(F (x, ·))$y = gy$ , (F (·, y))$x = −I.
Remarque. Lorsque p = 1, la formule donnant la dérivée de la fonction
réciproque de g peut encore s’écrire
(g −1 )$ (x0 ) =
1
.
g $ [g(x0)]
Par exemple, si g(y) = y 2 , y0 /= 0 et x0 = y02 , on retrouve la formule bien
connue
1
(g −1 )$ (x0 ) = 1/2 .
2x0
5.8
Théorème de l’application intérieure
Une autre application intéressante du théorème des fonctions implicites est
une version non linéaire de la propriété suivante des applications linéaires. Si
L : Rm → Rp est linéaire et surjective, c’est-à-dire si rang L = p, alors, pour
chaque a ∈ Rm , L(a) est évidemment intérieur à L(Rm ) = Rp; si L n’est
pas surjective, c’est-à-dire si rang L < p, L(Rm ) est un sous-espace vectoriel
propre de Rp et, quel que soit a ∈ Rm , L(a) n’est pas intérieur à L(Rm ),
puisque int L(Rm ) est vide. En d’autres termes, la condition nécessaire et
suffisante pour que L(a) soit intérieur à L(Rm ) est que rang L = p. C’est
la partie suffisante de ce résultat que le théorème des fonctions implicites
permet d’étendre, localement, sous le nom de théorème de l’application
intérieure, à certaines fonctions de Rm dans Rp . Ce théorème donne donc
des conditions sur g pour que l’image par g d’un voisinage de a soit un
voisinage de g(a).
Proposition. Soit a ∈ Rm , r0 > 0 et g une fonction de Rm dans Rp
dérivable en chaque point x ∈ B2 (a; r0) et telle que, pour chaque 1 ≤ j ≤ m,
la fonction x 2→ Dj g(x) soit continue en a. Si m ≥ p et rang ga$ = p, alors
g(a) est intérieur à g[B2 (a; r0)].
Démonstration. Il faut donc trouver un r ∈ ]0, r0[ tel que B2 [g(a); r] ⊂
g[B2 (a; r0)], c’est-à-dire trouver un r ∈ ]0, r0[ tel que, pour chaque v ∈
B2 [g(a); r], il existe un u ∈ B2 (a; r0) tel que g(u) = v. Puisque rang ga$ = p,
5.9. EXTRÉMANTS LIÉS
189
on peut trouver dans {D1 g(a), . . ., Dmg(a)} p éléments formant une famille
libre et, en permutant si nécessaire les indices des variables, on peut, sans
perte de généralité, supposer que les p premiers éléments forment une telle
famille, c’est-à-dire supposer que
det col [D1 g(a), . . ., Dpg(a)] /= 0.
En vertu des hypothèses, si l’on pose
y0 = (a1 , . . . , ap), x0 = (g1 (a), . . ., gp(a), ap+1, . . . , am ),
l’application F définie sur B2 (x0 ; r0 ) × B2 (y0 ; 0) par
F (x, y) = g(y1 , . . . , yp , xp+1 , . . . , xm) − (x1 , . . ., xp)
est telle que,
F (x0 , y0 ) = g(a) − g(a) = 0,
det(F (x0 , ·)$y0 = det col[D1 g(a), . . ., Dpg(a)] /= 0.
Le théorème des fonctions implicites implique donc l’existence d’un r ∈]0, r0[,
d’un R ∈ ]0, r0[ et d’une application f : B2 [x0 ; r] → B2 [y0 ; R] continue en x0
et telle que, pour tout x ∈ B2 [x0 ; r], on ait F (x, f (x)) = 0. En particulier, si
v ∈ B2 [g(a); r] ⊂ Rp , alors (v, ap+1 , . . . , am) ∈ B2 [x0 ; r], et on a donc
F [v, ap+1 , . . . , am , v, f (v, ap+1, . . . , am )] = 0,
c’est-à-dire
v − g[f (v, ap+1, . . . , am ), ap+1 , . . ., am ] = 0,
avec [f (v, ap+1, . . . , am), ap+1 , . . . , am] ∈ B2 (a; r0).
Remarque. Par définition du rang, on a rang ga$ ≤ min{m, p} = p. Dès
lors, le théorème de l’application intérieure implique que si g(a) n’est pas
intérieur à g(B2 (a; r0 )), alors rang ga$ < p.
5.9
Extrémants liés
Le théorème de Fermat a fourni une condition nécessaire pour l’existence
d’un extrémant local libre d’une fonction réelle f . Nous allons montrer que le
théorème des fonctions implicites ou ses conséquences permettent de donner
des conditions nécessaires d’existence pour certains extrémants liés , c’est-àdire non intérieurs au domaine de la fonction f . Pour motiver ces conditions,
190
CHAPITRE 5. FONCTIONS IMPLICITES
soient f et g des fonctions de R2 dans R définies sur B2 (a; r0) pour un
certain a ∈ R2 et un certain r0 > 0, et soit E = {(x, y) ∈ R × R : g(x, y) =
0}. On supposera que a ∈ E, c’est-à-dire que g(a) = 0. On veut trouver
une condition nécessaire pour que a soit un extrémant local de f sur E.
Pour fixer les idées, supposons que a soit un maximant local de f sur E,
c’est-à-dire qu’il existe r $ ∈ ]0, r0[ tel que, pour tout (x, y) ∈ B2 (a; r $) ∩ E,
on ait f (x, y) ≤ f (a1 , a2 ). Supposons en outre que f soit dérivable en a,
que g soit dérivable en chaque point x ∈ B2 (a; r0), que D2 g(a1 , a2 ) /= 0 et
que les fonctions (x, y) 2→ D1 g(x, y) et (x, y) 2→ D2 g(x, y) soient continues
en a. Dans ce cas, le théorème des fonctions implicites appliqué à g en a
entraı̂ne l’existence d’un r ∈ ]0, r0[, d’un R ∈ ]0, r0[ et d’une application
e : [a1 − r, a1 + r] → [a2 − R, a2 + R] dérivable en a1 et telle que e soit la
restriction du graphe E sur [a1 − r, a1 + r] × [a2 − R, a2 + R]. En d’autres
termes, si l’on prend r ≤ r $ , on a (x, y) ∈ E ∩ B2 (a; r) si et seulement si
y = e(x) et dès lors
f (x, y) ≤ f (a1 , a2 ), x ∈ E ∩ B2 (a; r),
si et seulement si
f (x, e(x)) ≤ f (a1 , a2 ), x ∈ ]a1 − r, a1 + r[.
Par conséquent, a1 est un maximant local libre de la fonction (de R dans
R) x 2→ f (x, e(x)), qui est dérivable en a1 , et le théorème de Fermat et les
théorèmes de dérivation des fonctions composées et des fonctions implicites
entraı̂nent que
0=
d
[f (a1 , e(a1))] = D1 f (a1 , e(a1 )) + D2 f (a1 , e(a1 ))e$ (a1 )
dx
= D1 f (a1 , a2 ) − D2 f (a1 , a2)
c’est-à-dire
det
&
D1 g(a1 , a2 )
,
D2 g(a1 , a2 )
D1 f (a1 , a2 ) D1 g(a1 , a2 )
D2 f (a1 , a2 ) D2 g(a1 , a2 )
'
= 0.
Par conséquent, la famille {fa$ , ga$ } n’est pas libre et il existe donc (µ0 , µ1 )
/= (0, 0) tel que
µ0 fa$ + µ1 ga$ = 0.
On a nécessairement µ0 /= 0 car, si µ0 = 0, alors µ1 ga$ = 0 et donc, puisque
ga$ /= 0, µ1 = 0 ce qui est contradictoire. En divisant les deux membres par
191
5.9. EXTRÉMANTS LIÉS
µ0 , la relation précédente s’écrit
fa$ + λ1 ga$ = 0.
Si l’on se souvient que la condition a ∈ E équivaut à g(a) = 0, on voit que
si a est un extrémant local de f sur
E = {(x, y) : g(x, y) = 0},
alors il existe λ1 ∈ R tel que
(Lf,g )$a,λ1 = 0,
où Lf,g est la fonction de Lagrange associée à f et g, c’est-à-dire la fonction
de R3 dans R définie par
Lf,g (x, λ) = f (x) + λg(x).
On constate en effet que
D1 Lf,g (x, λ) = D1 f (x) + λD1 g(x),
D2 Lf,g (x, λ) = D2 f (x) + λD2 g(x),
D3 Lf,g (x, λ) = g(x).
Le nombre λ1 est appelé le multiplicateur de Lagrange relatif à l’extrémant
lié a de f . Si, au lieu de supposer que D2 g(a1, a2 ) /= 0, on suppose que
D1 g(a1 , a2 ) /= 0, on arrive au même résultat en intervertissant le rôle de x
et y dans l’application du théorème des fonctions implicites à g. On obtient
donc la conclusion sous la seule hypothèse que rang ga$ = 1.
On peut généraliser ce résultat à une fonction f de Rn dans R et à une
fonction g de Rn dans Rq . Dans ce cas, il est plus simple d’utiliser, au lieu
du théorème des fonctions implicites, le théorème de l’application intérieure.
Le premier résultat s’appelle la règle des multiplicateurs de Carathéodory.
Proposition. Soit f une fonction de Rn dans R, g une fonction de Rn dans
Rq , a ∈ Rn et r > 0 tels que f et g soient définies sur B2 (a; r) et g(a) = 0.
Supposons que f et g soient dérivables en x pour chaque x ∈ B2 (a; r) et
que, pour chaque 1 ≤ j ≤ n, les fonctions x 2→ Dj f (x) et x 2→ Dj g(x) soient
continues en a. Si a est un extrémant local de f sur l’ensemble
E = {x ∈ Rn : g(x) = 0},
192
CHAPITRE 5. FONCTIONS IMPLICITES
alors il existe γ = (γ0 , γ1, . . . , γq ) ∈ Rq+1 \ {0} tel que γ0 ≥ 0 et tel que
γ0 fa$ +
q
$
γj (gj )$a = 0,
j=1
c’est-à-dire tel que (a, γ1, . . . , γq) soit un point critique de la fonction Cf,g
de Rn × Rq définie par
Cf,g (x, γ1, . . . , γq ) = γ0 f (x) +
q
$
γj gj (x).
j=1
Démonstration. Supposons, pour fixer les idées, que a soit un minimant
local de f sur E, et soit r $ ∈ ]0, r[ tel que
f (a) ≤ f (x)
(5.14)
pour tout x ∈ B2 [a; r $] ∩ E. Soit h la fonction de Rn dans Rq+1 définie par
h = (f, g1 , . . . , gq), et soit
W = {(y0 , 0, . . ., 0) ∈ Rq+1 : y0 < f (a)}.
Notons que h(a) = (f (a), 0, . . ., 0). En vertu de (5.14), on a
h(B2 [a; r $ ]) ∩ W = ∅.
(5.15)
h(a) /∈ int h(B2 [a; r $]),
(5.16)
En conséquence,
car, dans le cas contraire, il existerait r0 > 0 tel que
B2 [h(a); r0] ⊂ h(B2 [a; r $])
et l’on aurait donc, pour k ≥ r10 , (f (a) − k1 , 0, . . ., 0) ∈ h(B2 [a; r $]) ∩ W, ce
qui est impossible par (5.15). Il résulte alors de (5.16) et de la remarque qui
suit le théorème de l’application ouverte que rang h$a < q + 1, c’est-à-dire
qu’il existe γ = (γ0 , γ1, . . . , γq ) ∈ Rq+1 \ {0} tel que
γ0 fa$
+
q
$
γj (gj )$a = 0,
j=1
et l’on peut, sans perte de généralité, supposer que γ0 ≥ 0 dans cette égalité
en multipliant, le cas échéant, les deux membres par −1.
193
5.9. EXTRÉMANTS LIÉS
Remarque. Les nombres (γ0, γ1 , . . . , γq) s’appellent les multiplicateurs de
Carathéodory et Cf,g la fonction de Carathéodory associés à f et g.
Un cas particulier important de la proposition précédente porte le nom
de règle des multiplicateurs de Lagrange.
Corollaire. Dans les conditions de la proposition précédente, si l’on suppose en outre que
rang ga$ = q,
il existe λ = (λ1 , . . . , λq ) ∈ Rq tel que
fa$ +
q
$
λj (gj )$a = 0,
j=1
c’est-à-dire un λ tel que (a, λ) soit un point critique de la fonction Lf,g de
Rn × Rq dans R définie par
Lf,g (x, λ) = f (x) +
q
$
λj gj (x) = f (x) + (λ|g(x)).
j=1
Démonstration. Soit γ = (γ0 , γ1 , . . . , γq) ∈ Rq+1 \ {0} donné par la règle
de Caratheodory. Si γ0 = 0, alors (γ1 , . . . , γq) /= 0 et
q
$
γj (gj )$a = 0,
j=1
ce qui contredit l’hypothèse rang ga$ = q. Donc, γ0 /= 0 et la thèse s’en déduit
γ
en posant λj = γj0 , (1 ≤ j ≤ q).
Remarque. Les nombres (λ1 , . . . , λq ) fournis par la proposition précédente
s’appellent les multiplicateurs de Lagrange et Lf,g la fonction de Lagrange
associés à f et g.
Exemple. Cherchons à déterminer les extrémants locaux de la fonction f
de R2 dans R définie par f (x) = |x|2 sur l’ensemble
E = {(x1 , x2 ) ∈ R2 : g(x1, x2 ) = 0},
lorsque, a > 0 et b > 0 étant donnés,
g(x1 , x2) =
4
x1
a
52
+
4
x2
b
52
− 1,
194
CHAPITRE 5. FONCTIONS IMPLICITES
c’est-à-dire les extrémants locaux de la distance entre l’origine et les points
de l’ellipse E. On a
D1 g(x1 , x2 ) = 2
x1
x2
, D2 g(x1 , x2 ) = 2 2 ,
2
a
b
et dès lors rang gx$ = 1 pour tout x ∈ E puisque (0, 0) /∈ E. La fonction de
Lagrange est la fonction L = Lf,g définie par
L(x, λ) = |x|2 + λ
,4
x1
a
52
+
4
x2
b
52
-
−1 ,
et ses points critiques sont les solutions du système d’équations
D1 L(x, λ) =
x1
x1
+ 2λ 2 = 0,
|x|2
a
D2 L(x, λ) =
x2
x2
+ 2λ 2 = 0,
|x|2
b
D3 L(x, λ) =
4
x1
a
52
+
4
x2
b
52
− 1 = 0.
La résolution de ce système fournit les solutions
4
0, b, −
5 4
5 4
5 4
5
b
b
a
a
, 0, −b, −
, a, 0, −
, −a, 0, −
,
2
2
2
2
dont les deux premières composantes correspondent aux sommets de l’ellipse
E.
5.10
Exercices
1. Montrer que la suite (ak )k∈N dans Rp converge vers a si et seulement
toute sous-suite de (ak )k∈N contient une sous-suite convergeant vers a.
2. Montrer que si la suite (ak )k∈N dans Rp converge vers a, alors a est le
seul point d’accumulation de (ak )k∈N .
3. Utiliser le théorème de Bolzano-Weierstrass pour démontrer le théorème
de Cantor : Si (Bk )k∈N est une suite de fermés bornés emboı̂tés (Bk+1 ⊂ Bk
7
pour tout k ∈ N), alors k∈N Bk est un fermé borné non vide.
4. Utiliser le théorème de Bolzano-Weierstrass pour démontrer le théorème
de Heine (suggestion : procéder par l’absurde).
195
5.10. EXERCICES
5. Soit A : Rn → Rn une application linéaire inversible. Montrer que, pour
toute application linéaire B : Rn → Rn telle que
|B|2,2 <
1
,
|A−1 |2,2
l’application linéaire A + B est inversible. Suggestion : il suffit de montrer
que, pour tout x ∈ Rn , l’équation (A+B)y = x possède une solution unique.
Cette équation est équivalente au problème de point fixe
y = −A−1 By + A−1 x ≡ gx(y),
et l’on a, pour tout y ∈ Rn et tout z ∈ Rn ,
|gx (y) − gx(z)|2 ≤ |A−1 |2,2 |B(y − z)|2 ≤ |A−1 |2,2 |B|2,2 |y − z|2 ,
ce qui montre que gx est contractante sur Rn .
6. Soit f une contraction de Rn dans Rp , de constante de contraction α. On
définit g : Rn → R par
g(x) = |x − f (x)|2 .
Montrer que, pour tout x ∈ Rn , on a
g(x) ≥ (1 − α)|x|2 − |f (0)|2.
En conséquence, il existe y ∈ Rn tel que g(y) ≤ g(x) pour tout x ∈ Rn . En
particulier,
g(y) ≤ g(f (y)) = |f (y) − f (f (y))|2 ≤ α|y − f (y)|2 = αg(y),
ce qui entraı̂ne que g(y) = 0 et donc que y est un point fixe de f . Montrer que
cette nouvelle démonstration du théorème du point fixe de Banach fournit
l’existence d’un point fixe unique de f sous les hypothèses plus générales :
a. |x − f (x)|2 → +∞ si x → ∞.
b. |f (x) − f (y)|2 < |x − y|2 pour tout x /= y dans Rn .
7. Soit
F : R × Rn+1 → R, (x, a0, a1 , . . . , an ) 2→
Une racine simple de l’équation (en l’inconnue x)
F (x, a) = 0
n
$
k=0
ak xk .
196
CHAPITRE 5. FONCTIONS IMPLICITES
est un x ∈ R vérifiant cette équation et tel que F1$ (x, a) /= 0. Utiliser le
théorème des fonctions implicites pour montrer que si x∗ est une racine
simple de l’équation
F (x, a∗ ) = 0,
alors il existe r > 0 et R > 0 et une application continue f : [−r, r] ×
B2 [−R, R] unique tels que, pour chaque a ∈ B2 [−R, R], l’équation
F (x, a)
possède dans [−r, r] la solution unique f (a). (Dépendance continue des solutions d’une équation algébrique par rapport aux coefficients au voisinage
d’une racine simple). Généraliser le résultat aux équations complexes en
utilisant la notion de C-dérivabilité.
8. Montrer que l’application
g : R2 → R2 , (y1 , y2 ) 2→ (exp y1 cos y2 , exp y1 sin y2 ),
vérifie en chaque point (y1 , y2 ) ∈ R2 les conditions du théorème de la fonction
réciproque, mais n’est pas une bijection de R2 sur R2 (noter que g(y1 , y2 +
2kπ) = g(y1 , y2 )) (Caractère local du théorème de la fonction réciproque).
9. Soit a : Rn → R l’application définie par
a(x) =
n $
n
$
ajk xj xk ,
j=1 k=1
où les ajk sont des nombres réels tels que
ajk = akj , (1 ≤ j, k ≤ n).
On dit que a est la forme quadratique associée à la matrice symétrique A
d’éléments ajk . En fait, on a, pour tout x ∈ Rn ,
a(x) = (Ax|x).
Comme a est continue sur Rn , elle admet, par le théorème de Weierstrass, un
minimant y et un maximant z sur le fermé borné S = {x ∈ Rn : |x|22 = 1}.
Utiliser la règle des multiplicateurs de Lagrange pour montrer que si l’on
pose
λ1 = a(y), λn = a(z),
alors λ1 et λn sont respectivement la plus petite et la plus grande valeur
propre de A.
197
5.11. PETITE ANTHOLOGIE
5.11
Petite anthologie
Si l’on a à l’intérieur d’une partie bornée du plan une infinité de points
possédant une certaine propriété, alors il existe dans son intérieur ou sur sa
frontière au moins un point tel que dans tout voisinage de ce point il y a une
infinité de points ayant cette propriété.
Karl Weierstrass, 1866
Si dans une suite de grandeurs
F1 (x), F2(x), F3 (x), . . ., Fn (x), . . ., Fn+r (x),
la différence entre son ne terme Fn (x) et tout terme ultérieur Fn+r (x), aussi
éloigné soit-il du ne , reste plus petite que toute grandeur donnée, si l’on a
pris n suffisamment grand, alors il existe toujours une certaine grandeur
constante, et une seule, dont s’approchent toujours davantage les termes
de cette suite et dont ils peuvent s’approcher d’aussi près que l’on voudra,
lorsqu’on prolonge la suite suffisamment loin.
Bernard Bolzano, 1817
Soit un système de n équations entre m + n variables
f1 (x1 , . . . , xm, y1 , . . ., yn ) = 0, . . ., fn (x1 , . . . , xm , y1 , . . . , yn ) = 0,
qui sont satisfaites pour la valeur
a1 , . . ., am , b1, . . . , bn,
des variables; supposons que les fonctions f1 , . . . , fn et leurs dérivées partielles du premier ordre soient continues dans un voisinage du point
(a1 , . . ., am , b1, . . . , bn);
finalement supposons que le déterminant :
#
# ∂f1
# ∂y1
# ∂f2
#
J = ## ∂y1
# ...
# ∂fn
# ∂y
1
∂f1
∂y2
∂f2
∂y2
...
∂fn
∂y2
...
...
...
...
#
#
#
#
#
#
. . . ##
∂fn ##
∂y
∂f1
∂yn
∂f2
∂yn
n
198
CHAPITRE 5. FONCTIONS IMPLICITES
ne soit pas nul en ce point. Alors il existe un et un seul système de fonctions
y des variables x:
y1 = ψ1 (x1 , . . . , xm ), . . ., yn = ψn (x1 , . . . , xn ),
définies sur un voisinage du point a1 , . . . , am et qui vérifient identiquement
les équations f1 = 0, . . ., fn = 0 pour les valeurs correspondantes de la
variable x; y1 , . . . , yn sont des fonctions continues, qui prennent au point
a1 , . . . , am les valeurs b1 , . . . , bn et qui possèdent des dérivées partielles premières.
Giuseppe Peano, 1884
On connaı̂t les beaux résultats obtenus par M. E. Picard dans l’étude des
équations différentielles et des équations aux dérivées partielles, grâce à sa
méthode des approximations successives. Cette méthode s’applique également
avec une grande facilité à la théorie des fonctions implicites. ... Soit f (x, y)
une fonction de deux variables indépendantes réelles x et y, continue dans le
voisinage d’un système de valeurs x0 , y0 , tel que f (x0 , y0 ) = 0. Pour préciser,
nous supposerons que cette fonction est continue dans un domaine D défini
par les inégalités
x0 − a ≤ x ≤ x0 + a, y0 − b ≤ y ≤ y0 + b,
a et b étant deux nombres positifs. Nous admettrons de plus que l’on peut
choisir les nombres a et b assez petits pour que l’on ait
|f (x, y $) − f (x, y $$)| < K|y $ − y $$ |,
x étant une valeur quelconque comprise entre x0 − a et x0 + a, y $ , y $$ étant
de même deux valeurs quelconques de y comprises entre y0 − b et y0 + b, et
K un nombre positif constant plus petit que l’unité. Ces conditions étant
supposées satisfaites, nous allons démontrer que l’équation
y − y0 = f (x, y),
où l’on regarde x comme une variable indépendante et y comme l’inconnue
admet une racine, et une seule, qui tend vers y0 lorsque x tend vers x0 .
Edouard Goursat, 1903
Chapitre 6
Fonctions monotones
6.1
Parties majorées ou minorées
Ce chapitre est consacré à l’étude de propriétés particulières de parties de R
et de fonctions réelles liées à l’existence d’une structure d’ordre sur R.
Définition. Soit E une partie de R et a ∈ R.
On dit que a majore E, ou que a est un majorant de E, ou encore que E est
majoré par a si, pour tout x ∈ E, on a x ≤ a.
On dit que a minore E, ou que a est un minorant de E, ou encore que E est
minoré par a si, pour tout x ∈ E, on a x ≥ a.
Ainsi, n’importe quel réel majore ∅ et n’importe quel réel minore ∅. Il
résulte immédiatement des définitions que si a majore E et si b ≥ a, alors b
majore E et que si a minore E et si b ≤ a, alors b minore E. On désignera par
M (E) l’ensemble des majorants de E et par m(E) l’ensemble des minorants
de E. Chacun de ces ensembles peut être vide : on vérifie aisément que
M ([0, +∞[) = ∅ et m(] − ∞, 0]) = ∅. Lorsque M (E) /= ∅, on dit que E est
majoré, et lorsque m(E) /= ∅, on dit que E est minoré. Ces notions sont
liées à celle d’ensemble borné par le résultat élémentaire suivant.
Proposition. E ⊂ R est borné si et seulement si E est majoré et minoré.
Démonstration. Condition nécessaire. Si r > 0 est tel que E ⊂ B[r] =
[−r, r], alors r majore E et −r minore E.
Condition suffisante. Si a minore E et b majore E, alors, pour tout x ∈ E,
on a |x| ≤ r = max{|a|, |b|}, et E est borné.
Il peut arriver qu’aucun majorant ou aucun minorant d’une partie E de
R n’appartienne à E. C’est le cas par exemple pour E = ]0, 1[. En effet,
199
200
CHAPITRE 6. FONCTIONS MONOTONES
si a ∈ ]0, 1[, c’est-à-dire si 0 < a < 1, alors a ne majore pas ]0, 1[ puisque
a + 1−a
2 > a et appartient à ]0, 1[. On montre de même qu’aucun minorant
de ]0, 1[ n’appartient à ]0, 1[. Il peut aussi arriver qu’un majorant ou un
minorant d’une partie E de R appartienne à E. C’est le cas par exemple
pour E = [0, 1] qui est majoré par 1 et minoré par 0. E ne contiendra pas
d’autre majorant ou d’autre minorant, ainsi que cela résulte de la proposition
suivante.
Proposition. Soit E une partie de R. Il existe au plus un majorant de E
appartenant à E et au plus un minorant de E appartenant à E.
Démonstration. Faisons-la, pour fixer les idées, dans le cas d’un majorant. Si a et b majorent E et appartiennent à E, alors on a b ≤ a et a ≤ b,
et donc a = b.
Cette proposition justifie la définition suivante.
Définition. Soit E une partie de R et a ∈ R. On dit que a est le maximum
ou le plus grand élément de E, et on le note max E, si a ∈ E et a majore
E. On dit que a est le minimum ou le plus petit élément de E, et on le note
min E, si a ∈ E et a minore E.
Notons que, si max E existe, alors, puisque max E ∈ E, on a max E ≤ a
pour tout a ∈ M (E), et max E est donc le plus petit majorant de E. En
d’autres termes,
max E = min M (E).
On montre de même que si min E existe, alors
min E = max m(E).
L’important résultat suivant, qui porte le nom de théorème du supremum montre que si E et M (E) sont non vides, M (E) possède toujours un
minimum. Ainsi, bien qu’une partie non vide et majorée E de R n’ait pas
nécessairement de plus grand élément, l’ensemble de ses majorants possédera
toujours un plus petit élément.
Théorème. Si E est une partie non vide et majorée de R, alors M (E)
possède un minimum.
Démonstration. Soit a ∈ E et b ∈ M (E) tel que b > a. Si M (E) possède
un minimum, ce minimum appartiendra nécessairement à [a, b]. Il faut donc
démontrer que
(∃x ∈ [a, b] ∩ M (E))(∀y ∈ M (E)) : x ≤ y.
201
6.1. PARTIES MAJORÉES OU MINORÉES
Nous procédons par l’absurde et supposons que cette proposition est fausse.
Alors,
(∀x ∈ [a, b] ∩ M (E))(∃yx ∈ M (E)) : x > yx .
(6.1)
Définissons dès lors comme suit une jauge δ sur [a, b]. Si x ∈ [a, b] ∩ M (E),
x
prenons δ(x) = x−y
2 , où yx est donné par (6.1); si x ∈ [a, b] \ M (E), alors
il existera
z ∈ E tel que zx > x et nous prendrons δ(x) = zx2−x . Soit
A j j xB
Π = (x , I ) 1≤j≤m une P-partition δ-fine de ]a, b], numérotée de telle sorte
que si I j = ]aj−1 , aj ], alors
a = a0 < a1 < . . . < am−1 < am = b.
Par le choix de la jauge, si xj /∈ M (E), alors δ(xj ) =
zxj > xj appartenant à E et dès lors
aj ≤ xj + δ(xj ) =
zxj −xj
2
pour un certain
zxj + xj
< zxj ∈ E,
2
ce qui entraı̂ne que [aj−1 , aj ] ∩ M (E) = ∅. D’autre part, si xj ∈ M (E), alors
δ(xj ) =
yxj −xj
2
pour un certain yxj < xj appartenant à M (E) et dès lors
aj−1 ≥ xj − δ(xj ) =
yxj + xj
> yxj ∈ M (E),
2
c’est-à-dire [aj−1 , aj ] ⊂ M (E) \ E. Comme b ∈ [am−1 , am ] ∩ M (E), on a
nécessairement, xm ∈ M (E) et donc [am−1 , am ] ⊂ M (E) \ E. Mais alors
xm−1 ∈ M (E) et le même raisonnement entraı̂ne que [am−2 , am−1 ] ⊂ M (E)\
E. En continuant de proche en proche, on en conclut finalement que [a0 , a1 ] ⊂
M (E) \ E, ce qui est contradictoire, puisque a0 = a ∈ E.
On est ainsi conduit à la définition suivante.
Définition. Soit E une partie non vide de R. Si E est non vide et majorée,
on appelle supremum de E, et l’on note sup E, le minimum de M (E), c’està-dire le plus petit majorant de E. Si E est non vide et non majoré, on
pose, par extension, sup E = +∞. Si E est vide, on pose, par extension,
sup E = −∞.
Le résultat suivant fournit trois caractérisations du supremum.
202
CHAPITRE 6. FONCTIONS MONOTONES
Proposition. Soit E une partie non vide et majorée de R. Les quatre
propriétés suivantes sont équivalentes.
1. x = sup E.
2. (∀y ∈ E) : y ≤ x et (∀! > 0)(∃z ∈ E) : x − ! < z.
3. x ∈ adh E ∩ M (E).
4. x ∈ M (E) et il existe une suite (zk )k∈N dans E qui converge vers x.
Démonstration. a. 1 ⇔ 2. x = sup E équivaut à x ∈ M (E) et x =
min M (E), c’est-à-dire
(∀y ∈ E) : y ≤ x et (∀! > 0) : x − ! /∈ M (E),
ce qui équivaut à
(∀y ∈ E) : y ≤ x et (∀! > 0)(∃z ∈ E) : z > x − !.
2 ⇔ 3. Conséquence immédiate de la définition de l’adhérence.
3 ⇔ 4. Résulte de la caractérisation de l’adhérence par les suites.
Si E et F sont deux parties de R et si c ∈ R, on posera
E + F = {x + y : x ∈ E et y ∈ F },
et
cE = {cx : x ∈ E}.
Lorsque E = {a}, on écrira a + F au lieu de {a} + F et si c = −1, on
écrira −E au lieu de (−1)E. On a évidemment E + F = F + E et l’on se
gardera de confondre E + F avec E ∪ F . Ainsi [0, 1] + [0, 1] = [0, 2] alors que
[0, 1] ∪ [0, 1] = [0, 1].
Les propositions suivantes sont des conséquences faciles des propriétés
élémentaires des inégalités et des définitions.
Proposition. Si E ⊂ R et a ∈ R, alors a majore E si et seulement si −a
minore −E. En d’autres termes, M (E) = −m(−E).
Proposition. Si E ⊂ R possède un maximum (resp. un minimum), alors,
pour tout c ≥ 0, cE possède un maximum (resp. un minimum) et
max(cE) = c max E, (resp. min(cE) = c min E).
Démonstration. c max E (resp. c min E) appartient à cE et majore (resp.
minore) cE.
6.1. PARTIES MAJORÉES OU MINORÉES
203
Proposition. Si E ⊂ R possède un maximum (resp. un minimum), alors
−E possède un minimum (resp. un maximum) et
min(−E) = − max E, (resp. max(−E) = − min E.
Démonstration. − max E (resp. − min E) appartient à −E et minore
(resp. majore) −E.
Ces résultats permettent de déduire aisément du théorème du supremum
le théorème de l’infimum.
Théorème. Si E est une partie non vide et minorée de R, alors m(E)
possède un maximum et max m(E) = − sup(−E).
Démonstration. E étant non vide et minoré, −E est non vide et majoré,
et dès lors min M (−E) existe. Comme M (−E) = −m(E), on en déduit que
m(E) possède un maximum et que
max m(E) = − min[−m(E)] = − min[M (−E)] = − sup(−E).
Ce résultat et l’unicité du maximum conduisent à la définition suivante.
Définition. Soit E une partie non vide de R. Si E est non vide et minorée,
on appelle infimum de E, et l’on note inf E, le maximum de m(E), c’està-dire le plus grand minorant de E. Si E est non vide et non minoré, on
pose, par extension, inf E = −∞. Si E est vide, on pose, par extension,
inf E = +∞.
Le théorème de l’infimum affirme donc que si E est une partie non vide
et minorée de R, alors
inf E = − sup(−E).
On en déduit aussitôt que si E est une partie non vide et majorée de R,
alors
sup E = − inf(−E).
En combinant le théorème de l’infimum avec les caractérisations du supremum, on obtient trois caractérisations de l’infimum.
Proposition. Soit E une partie non vide et minorée de R. Les quatre
propriétés suivantes sont équivalentes.
1. x = inf E.
2. (∀y ∈ E) : y ≥ x et (∀! > 0)(∃z ∈ E) : z < x + !.
204
CHAPITRE 6. FONCTIONS MONOTONES
3. x ∈ adh E ∩ m(E).
4. x ∈ m(E) et il existe une suite (zk )k∈N dans E qui converge vers x.
Une conséquence immédiate mais très utile des définitions de supremum
et d’infimum est la règle de passage au supremum ou à l’infimum
dans une inégalité.
Proposition. Soit E une partie non vide de R et c ∈ R. Si, pour tout
x ∈ E, on a x ≤ c, alors sup E existe et sup E ≤ c. Si, pour tout x ∈ E, on
a x ≥ c, alors inf E existe et inf E ≥ c.
Démonstration. Faisons-la, pour fixer les idées, dans le cas du supremum.
Par hypothèse, c majore E et dès lors sup E existe. Comme il est le plus
petit des majorants de E, on a nécessairement sup E ≤ c.
Etudions maintenant le comportement du supremum et de l’infimum par
rapport aux opérations d’inclusion, d’homothétie et d’addition introduites
sur les ensembles.
Proposition. Soient E et F deux parties non vides et majorées de R et
soit c ≥ 0. On a les propriétés suivantes.
1. Si E ⊂ F , alors sup E ≤ sup F .
2. sup(cE) = c sup E.
3. sup(E + F ) = sup E + sup F.
Démonstration. 1. Si x ∈ E, alors x ∈ F et donc x ≤ sup F ; on déduit
de la proposition précédente que sup E existe et que sup E ≤ sup F.
2. Si c = 0, cE = {0} et le résultat est évident; si c > 0, alors M (cE) =
cM (E) et
sup(cE) = min M (cE) = min[cM (E)] = c min M (E) = c sup E.
3. Soit x ∈ E + F ; alors x = y + z avec y ∈ E et z ∈ F et dès lors
x ≤ sup E + sup F ; en conséquence,
sup(E + F ) ≤ sup E + sup F.
Soient maintenant x ∈ E et y ∈ F ; alors x + y ∈ E + F , et dès lors
y + z ≤ sup(E + F ). En particulier, z étant fixé dans F , on a, pour chaque
y ∈ E, y ≤ sup(E + F ) − z, et dès lors sup E ≤ sup(E + F ) − z. Par
conséquent, pour chaque z ∈ F , on a z ≤ sup(E + F ) − sup E, ce qui
entraı̂ne que sup F ≤ sup(E + F ) − sup E, c’est-à-dire
sup E + sup F ≤ sup(E + F ).
205
6.2. INTERVALLES
Proposition. Soient E et F deux parties non vides et minorées de R et
soit c ≥ 0. On a les propriétés suivantes.
1. Si E ⊂ F , alors inf E ≥ inf F .
2. inf(cE) = c inf E.
3. inf(E + F ) = inf E + inf F.
Démonstration. Elle est analogue à celle de la proposition précédente.
On peut aussi utiliser les relations entre infimum et supremum.
6.2
Intervalles
Les résultats des sections précédentes nous permettent de déterminer la
structure des intervalles de la droite réelle.
Définition. On dit qu’une partie non vide I de R est un intervalle si I n’est
pas un singleton et si
(∀x ∈ I)(∀y ∈ I : y > x)(∀z ∈ R : x ≤ z ≤ y) : z ∈ I.
En d’autres termes, un intervalle est une partie de R différente du vide
et d’un singleton qui, dès qu’elle contient deux réels distincts, contient tous
les réels compris entre ces deux nombres.
Proposition. Si I ⊂ R est un intervalle et est minoré et majoré, alors
] inf I, sup I[ ⊂ I ⊂ [inf I, sup I].
Démonstration. Pour chaque x ∈ I, on a évidemment x ≥ inf I et
x ≤ sup I, et l’inclusion de droite s’en déduit aussitôt. Soit maintenant x ∈
] inf I, sup I[. Comme x > inf I, il existe, par la caractérisation de l’infimum,
y ∈ I tel que inf I < y < x, et, comme x < sup I, il existe, par la caractérisation du supremum, z ∈ I tel que x < z < sup I. Comme I est un
invervalle, on en déduit que x ∈ I.
Corollaire. Si I ⊂ R est un intervalle et est minoré et majoré, alors int I =
] inf I, sup I[ et adh I = [inf I, sup I].
Démonstration. Passer à l’intérieur et à l’adhérence dans les inclusions
précédentes.
Les intervalles minorés et majorés sont donc les intervalles ouverts, semiouverts ou fermés I = ]a, b[, I = ]a, b], I = [a, b[, I = [a, b] de R, et a =
inf I, b = sup I.
206
CHAPITRE 6. FONCTIONS MONOTONES
Proposition. Si I ⊂ R est un intervalle majoré et non minoré, alors
] − ∞, sup I[ ⊂ I ⊂ ] − ∞, sup I].
Démonstration. Pour tout x ∈ I, on a x ≤ sup I, et l’inclusion de droite
s’en déduit. Si x ∈ ] − ∞, sup I[, alors x < sup I et, par la caractérisation
du supremum, il existe z ∈ I tel que x < z < sup I. D’autre part, comme I
n’est pas minoré, x ne minore pas I et il existe donc y ∈ I tel que y < x.
Comme I est un intervalle, x ∈ I et l’inclusion de gauche est démontrée.
Une démonstration tout à fait analogue fournit le résultat suivant.
Proposition. Si I ⊂ R est un intervalle minoré et non majoré, alors
] inf I, +∞[ ⊂ I ⊂ [inf I, +∞[.
On en déduit évidemment l’analogue du Corollaire ci-dessus.
Corollaire. Si I ⊂ R est un intervalle majoré et non minoré, alors
int I = ] − ∞, sup I[, adh I = ] − ∞, sup I].
Si I ⊂ R est un intervalle minoré et non majoré, alors
int I = ] inf I, +∞[, adh I = [inf I, +∞[.
Les intervalles de I minorés et non majorés sont donc les intervalles non
majorés ouverts ou fermés ]a, +∞[, [a, +∞[, avec a = inf I, et les intervalles
de I majorés et non minorés sont donc les intervalles non minorés ouverts
ou fermés ] − ∞, a[, ] − ∞, a] avec a = sup I.
Enfin, il n’existe qu’un intervalle de R non minoré et non majoré.
Proposition. Si I est un intervalle non minoré et non majoré de R, alors
I = R.
Démonstration. Soit x ∈ R; comme I n’est pas minoré, il existe y ∈ I
tel que y < x, et comme I n’est pas majoré, il existe z ∈ I tel que x < z. I
étant un intervalle, on en déduit que x ∈ I.
Cette proposition conduit à la notation alternative ] − ∞, +∞[ pour R.
La définition de majorant d’une partie E de R entraı̂ne immédiatement
que, si E est non vide et majoré, alors M (E) est un intervalle non majoré
de R. Le théorème du supremum précise ce résultat en affirmant que M (E)
est l’intervalle fermé [sup E, +∞[. De même, la définition de minorant d’une
partie E de R entraı̂ne que, si E est non vide et minorée, alors m(E) est un
intervalle non minoré de R. Le théorème de l’infimum précise ce résultat en
affirmant que m(E) est l’intervalle fermé ] − ∞, inf E].
207
6.3. APPLICATIONS RÉELLES
6.3
Applications réelles
Soit A un ensemble quelconque (n’appartenant pas nécessairement à Rn ) et
f une application de A dans R. On dit alors que f est une application réelle.
Rappelons qu’on désigne par f (A) la partie de R définie par
f (A) = {f (x) : x ∈ A}.
L’application à f (A) des notions que nous venons d’introduire pour les parties de R conduit à la terminologie suivante.
Définition. On dit que f est majorée (resp. minorée) sur A si f (A) est majorée (resp. minorée). Si f est majorée (resp. minorée) sur A, le supremum
(resp. l’infimum) de f sur A est le nombre réel noté
sup f ou sup f (x) (resp. inf f ou inf f (x)),
A
A
x∈A
x∈A
et défini par
sup f = sup f (A) = sup{f (x) : x ∈ A}
A
(resp. inf f = inf f (A) = inf{f (x) : x ∈ A}).
A
Si f n’est pas majorée sur A, on écrira supA f = +∞ et si f n’est pas
minorée sur A, on écrire inf A f = −∞.
Lorsque supA f ∈ f (A), c’est-à-dire lorsqu’il existe x ∈ A tel que f (x) =
supA f , ou encore lorsque sup f (A) = max f (A), on dit qu’il est le maximum
de f sur A, et l’on écrit
max f ou max f (x).
A
x∈A
Le point x ∈ A tel que f (x) = maxA f est alors appelé un maximant de f
sur A. De même, lorsque inf A f ∈ f (A), c’est-à-dire lorsqu’il existe x ∈ A
tel que f (x) = inf A f , ou encore lorsque inf f (A) = min f (A), on dit qu’il
est le minimum de f sur A, et l’on écrit
min f ou min f (x).
A
x∈A
Le point x ∈ A tel que f (x) = minA f est alors appelé un minimant de
f sur A. Cette terminologie et ces notations sont compatibles avec celles
introduites précédemment pour une fonction de Rn dans R.
Si f et g sont deux applications de A dans R, si c ∈ R, et si l’on définit
l’application f +g de A dans R par (f +g)(x) = f (x)+g(x) pour chaque x ∈ A
208
CHAPITRE 6. FONCTIONS MONOTONES
et l’application cf de A dans R par (cf )(x) = c[f (x)] pour chaque x ∈ A,
avec la notation −f au lieu de (−1)f lorsque c = −1, on déduit aisément
des définition ci-dessus et des propriétés de l’infimum et du supremum d’une
partie de R les résultats suivants.
Proposition. Soit f une application majorée (resp. minorée) de A dans R.
On a les propriétés suivantes.
1. −f est minorée (resp. majorée) sur A et supA f = − inf A (−f ). (resp.
supA (−f ) = − inf A f ).
2. Si B ⊂ A, alors supB f ≤ supA f (resp. inf B f ≥ inf A f ).
3. Si g est une application de A dans R telle que, pour tout x ∈ A, on a
g(x) ≤ f (x) (resp. g(x) ≥ f (x)), alors g est majorée (resp. minorée) sur A
et
sup g ≤ sup f (resp. inf g ≥ inf f ).
A
A
A
A
4. Si g est une application majorée (resp. minorée) sur A, alors f + g est
majorée (resp. minorée) et
sup(f + g) ≤ sup f + sup g (resp. inf f + inf g ≤ inf (f + g)).
A
A
A
A
Si, en outre, g est minorée (resp. majorée) sur A, alors
sup f + inf f ≤ sup(f + g) (resp. inf (f + g) ≤ inf f + sup g).
A
A
A
A
A
A
Remarque. On notera que les inégalités dans la partie 4 de la proposition
précédente sont les meilleures possibles et qu’on n’a pas en général les égalités
correspondantes (c’est essentiellement dû au fait que
(f + g)(A) = {f (x) + g(x) : x ∈ A}
est en général strictement inclus dans
f (A) + g(A) = {f (x) + g(y) : x ∈ A et y ∈ A}).
Par exemple, si A = [0, 1], f = I, g = −I, alors f + g = 0 et dès lors
inf (f + g) = 0 = sup(f + g),
[0,1]
[0,1]
et
sup f = 1, inf f = 0, inf g = −1, sup g = 0.
[0,1]
[0,1]
[0,1]
[0,1]
On déduit facilement des caractérisations du supremum et de l’infimum
d’une partie de R des caractérisations du supremum et de l’infimum
d’une application réelle.
6.4. FONCTIONS MONOTONES
209
Proposition. Soit A un ensemble non vide et f une application de A dans
R. Alors a = supA f si et seulement si l’une des deux conditions suivantes
est réalisée.
1. (∀x ∈ A : f (x) ≤ a) et (∀! > 0)(∃y ∈ A) : f (y) > a − !.
2. (∀x ∈ A : f (x) ≤ a) et il existe une suite (yk )k∈N dans A telle que
(f (yk ))k∈N converge vers a.
Une suite (yk )k∈N telle que (f (yk ))k∈N converge vers supA f est appelée
une suite maximisante pour f sur A.
Proposition. Soit A un ensemble non vide et f une application de A dans
R. Alors a = inf A f si et seulement si l’une des deux conditions suivantes
est réalisée.
1. (∀x ∈ A : f (x) ≥ a) et (∀! > 0)(∃y ∈ A) : f (y) < a + !.
2. (∀x ∈ A : f (x) ≥ a) et il existe une suite (yk )k∈N dans A telle que
(f (yk ))k∈N converge vers a.
Une suite (yk )k∈N telle que (f (yk ))k∈N converge vers inf A f est appelée
une suite minimisante pour f sur A.
6.4
Fonctions monotones
Nous allons étudier dans cette section les fonctions de R dans R qui préservent (ou qui renversent) l’ordre sur R.
Définition. Soit f une fonction de R dans R et E ⊂ dom f . On dit que f
est croissante sur E si
(∀x ∈ E)(∀y ∈ E) : (x − y)[f (x) − f (y)] ≥ 0.
On dit que f est décroissante sur E si
(∀x ∈ E)(∀y ∈ E) : (x − y)[f (x) − f (y)] ≤ 0.
On dit que f est monotone sur E si f est croissante sur E ou est décroissante
sur E. On dit que f est strictement croissante sur E si
(∀x ∈ E)(∀y ∈ E : y /= x) : (x − y)[f (x) − f (y)] > 0.
On dit que f est strictement décroissante sur E si
(∀x ∈ E)(∀y ∈ E : y /= x) : (x − y)[f (x) − f (y)] < 0.
210
CHAPITRE 6. FONCTIONS MONOTONES
On dit que f est strictement monotone sur E si f est strictement croissante
sur E ou est strictement décroissante sur E.
Remarques. 1. On vérifiera aisément que les définitions ci-dessus sont
équivalentes aux suivantes :
f est croissante (resp. décroissante) sur E si et seulement si
(∀x ∈ E)(∀y ∈ E : y ≥ x) : f (y) ≥ f (x) (resp. f (y) ≤ f (x)).
f est strictement croissante (resp. strictement décroissante) sur E si et
seulement si
(∀x ∈ E)(∀y ∈ E : y > x) : f (y) > f (x) (resp. f (y) < f (x)).
Une fonction croissante (resp. strictement croissante) sur E préserve donc
l’ordre (resp. l’ordre strict) sur E.
2. Il résulte aussitôt des définitions que f est croissante (resp. strictement
croissante) sur E si et seulement si −f est décroissante (resp. strictement
décroissante) sur E. En outre, si f est croissante (resp. décroissante, strictement croissante, strictement décroissante) sur E et si F ⊂ E, alors f est
croissante (resp. décroissante, strictement croissante, strictement décroissante) sur F .
Exemples. 1. Toute application constante de R dans R est à la fois croissante et décroissante sur R.
2. L’identité sur R est strictement croissante sur R.
3. L’application partie entière définie sur R par
E(x) = [x] = le plus grand entier inférieur ou égal à x
est croissante sur R.
Ce dernier exemple, qui est discontinu en chaque entier, montre qu’une
fonction croissante n’est pas nécessairement continue. Toutefois, elle possède
en chaque point une limite à gauche et une limite à droite dans E.
Proposition. Soit E ⊂ R, f une fonction de R dans R telle que E ⊂ dom f ,
a ∈ E ∩ adh Ea− ∩ adh Ea+ , où
Ea− = {x ∈ E : x < a}, Ea+ = {x ∈ E : x > a}.
Si f est croissante sur E, alors
lim
x→a, x∈Ea−
f (x) = sup f ≤ f (a) ≤
Ea−
lim
x→a, x∈Ea+
f (x) = inf f.
Ea+
211
6.4. FONCTIONS MONOTONES
Si f est décroissante sur E, alors
lim
x→a, x∈Ea−
f (x) = inf f ≥ f (a) ≥
Ea−
lim
x→a, x∈Ea+
f (x) = sup f.
Ea+
Démonstration. Il suffit de démontrer le résultat pour une fonction croissante et de l’appliquer à −f si f est décroissante. Nous ne considérerons que
le cas de la limite limx→a, x∈Ea− f (x), l’autre étant similaire. Puisque f est
croissante sur E, on a, pour tout x ∈ Ea− , f (x) ≤ f (a); donc f est majorée
sur Ea− , supEa− f existe et supEa− f ≤ f (a). Posons b = supEa− f et soit ! > 0;
en vertu de la caractérisation du supremum, on a
(∀x ∈ Ea− : f (x) ≤ b) et (∃y ∈ Ea− ) : b − ! < f (y).
En posant δ = a − y > 0 et en utilisant, dans ces inégalités, la croissance de
f , on trouve que
(∀x ∈ Ea− : x ≥ a − δ) : b − ! < f (a − δ) ≤ f (x) ≤ b,
et dès lors
(∀x ∈ Ea− : |x − a| ≤ δ) : |f (x) − b| ≤ !.
On a des résultats analogues si x tend vers le supremum ou l’infimum de
E. Lorsque, le cas échéant, f n’est pas majorée ou n’est pas minorée sur E,
les limites correspondantes sont évidemment des limites infinies.
Proposition. Soit E une partie non vide de R et f une fonction de R dans
R définie sur E.
1. Si E est majoré, a = sup E /∈ E et f croissante sur E, alors
lim
x→a, x∈E
f (x) = sup f.
E
2. Si E est majoré, a = sup E /∈ E et f décroissante sur E, alors
lim
x→a, x∈E
f (x) = inf f.
E
3. Si E est minoré, a = inf E /∈ E et f croissante sur E, alors
lim
x→a, x∈E
f (x) = inf f.
E
212
CHAPITRE 6. FONCTIONS MONOTONES
4. Si E est minoré, a = inf E /∈ E et f est décroissante sur E, alors
lim
x→a, x∈E
f (x) = sup f.
E
Démonstration. Nous la ferons pour le premier cas, le troisième étant
semblable et les deux autres s’en déduisant en appliquant les résultats à
−f. Nous supposerons également que f est majorée sur E, l’autre cas étant
semblable. Notons tout d’abord que a = sup E entraı̂ne que a ∈ adh E.
Comme f est majorée sur E, supE f existe et l’on posera b = supE f . Si
! > 0 est donné, alors la caractérisation du supremum entraı̂ne que
(∀x ∈ E : f (x) ≤ b) et (∃y ∈ E) : b − ! < f (y).
Comme a /∈ E, on a y < a et, en posant δ = a − y > 0, on déduit des
inégalités précédentes et de la croissance de f que
et dès lors
(∀x ∈ E : x ≥ a − δ) : b − ! < f (a − δ) ≤ f (x) ≤ b,
(∀x ∈ E : |x − a| ≤ δ) : |f (x) − b| ≤ !.
On a des résultats analogues pour les limites vers +∞ ou −∞ lorsque
E est non majoré ou non minoré. Les démonstrations sont laissées comme
exercice au lecteur.
Proposition. Soit E une partie non vide de R et f une fonction de R dans
R définie sur E.
1. Si E est non majoré et f croissante sur E, alors
lim
x→+∞, x∈E
f (x) = sup f.
E
2. Si E est non majoré et f décroissante sur E, alors
lim
x→+∞, x∈E
f (x) = inf f.
E
3. Si E est non minoré et f croissante sur E, alors
lim
x→−∞, x∈E
f (x) = inf f.
E
4. Si E est non minoré et f est décroissante sur E, alors
lim
x→−∞, x∈E
f (x) = sup f.
E
On peut évidemment considérer le cas particulier où f est une suite
réelle (ak )k∈N. Notons tout d’abord la caractérisation simple suivante des
suites croissantes ou décroissantes.
213
6.4. FONCTIONS MONOTONES
Proposition. Soit (ak )k∈N une suite réelle. Alors (ak )k∈N est croissante
(resp. décroissante) si et seulement si, pour tout k ∈ N, on a
ak+1 ≥ ak (resp. ak+1 ≤ ak ).
En outre, (ak )k∈N est strictement croissante (resp. strictement décroissante)
si et seulement si, pour tout k ∈ N, on a
ak+1 > ak (resp. ak+1 < ak ).
Démonstration. Nous la ferons dans le cas où (ak )k∈N est croissante,
l’autre s’y ramenant par changement de signe.
Condition nécessaire. Soit k ∈ N; en prenant x = k + 1 et y = k dans la
définition, on trouve ak+1 − ak ≥ 0 dans le cas croissant et ak+1 − ak > 0
dans le cas strictement croissant.
Condition suffisante. Soient r ≥ q des entiers naturels; alors
ar − aq = ar − ar−1 + ar−1 − ar−2 + . . . + aq+1 − aq ≥ 0,
l’inégalité étant stricte si ak+1 > ak pour chaque k ∈ N. Donc (ak )k∈N est
croissante ou strictement croissante selon le cas.
1
Exemples. 1. La suite ( k+1
)k∈N est strictement décroissante.
k
2. Si a > 0, la suite (a )k∈N est strictement croissante si a > 1, strictement
décroissante si a ∈ ]0, 1[ et à la fois croissante et décroissante si a = 0 et
a = 1.
L’application des propositions précédentes au cas d’une suite fournit le
résultat suivant, où les limites peuvent être des limites infinies.
Corollaire. Soit (ak )k∈N une suite réelle. Si (ak )k∈N est croissante, alors
lim ak = sup ak .
k→∞
k∈N
Si (ak )k∈N est décroissante, alors
lim ak = inf ak .
k→∞
k∈N
On en déduit une caractérisation de la convergence des suites
monotones.
214
CHAPITRE 6. FONCTIONS MONOTONES
Corollaire. Une suite réelle croissante converge si et seulement si elle est
majorée, auquel cas
lim ak = sup ak .
k→∞
k∈N
Une suite réelle décroissante converge si et seulement si elle est minorée,
auquel cas
lim ak = inf ak .
k→∞
k∈N
Démonstration. La condition suffisante résulte du Corollaire précédent.
Pour la condition nécessaire, en considérant le cas d’une suite croissante
convergente et en appelant a sa limite, on a, en prenant par exemple ! = 1
dans la définition de convergence :
(∃m ∈ N)(∀k ≥ m) : ak ≤ a + 1.
Dès lors, pour tout k ∈ N, on aura
ak ≤ max{a1 , a2 , . . . , am−1 , a + 1},
et (ak )k∈N est majorée.
6.5
Fonction exponentielle
Nous allons introduire dans cette section l’une des plus importantes des
fonctions élémentaires, la fonction exponentielle. Nous aurons besoin plusieurs fois des inégalités élémentaires suivantes.
Lemme. Si α ≥ β ≥ 0, on a, pour tout entier k ≥ 1,
(α − β)(k + 1)β k ≤ αk+1 − β k+1 ≤ (α − β)(k + 1)αk ,
avec des inégalités strictes si α > β > 0.
Démonstration. En effet, on a l’identité
αk+1 − β k+1 = (α − β)
k
$
αk−j β j ,
j=0
et les inégalités s’en déduisent aussitôt puisque, pour chaque 0 ≤ j ≤ k, on
a
β k ≤ αk−j β j ≤ αk ,
avec des inégalités strictes si α > 0, β > 0 et j > 0.
215
6.5. FONCTION EXPONENTIELLE
Pour chaque x ∈ R et chaque k ∈ N∗ , posons
4
fk (x) = 1 +
x
k
5k
.
En particulier, fk (0) = 1 pour tout k ∈ N∗ et dès lors
lim fk (0) = 1.
k→∞
Proposition. Pour chaque x > 0 fixé, la suite réelle (fk (x))k∈N∗ est strictement croissante et majorée.
Démonstration. En appliquant l’inégalité de droite du lemme à α = 1+ xk
x
et β = 1 + k+1
, on trouve
4
fk+1 (x) = 1 +
4
x
k
5k+1
− (k + 1)
−(k + 1) 1 +
5k 4
1+
x
k+1
5k+1
4
> 1+
x
k
5k+1
5
= 1+
5k
= 1+
x
x
−1−
k
k+1
4
x
k
5k
4
x
mk
= fk (x),
et (fk (x))k∈N∗ est strictement croissante. D’autre part, en appliquant la
x
même inégalité à α = 1 + mk
, β = 1, où m ≥ 1 est un entier, on obtient
4
1> 1+
x
mk
4
x
x
1+
mk
mk
5k 4
1−
5
x
.
m
Dès lors, si m ≥ 2x, est fixé, (par exemple m = [2x] + 1, avec [2x] la partie
entière de 2x), on trouve
1>
c’est-à-dire
4
1
x
1+
2
mk
4
5k
< 2.
x
mk
5mk
x
1+
mk
Par conséquent, pour tout k ∈ N∗ , on a
4
fmk (x) = 1 +
5k
,
< 2m .
Pour chaque j ∈ N∗ , il existe k ∈ N∗ tel que
(k − 1)m ≤ j ≤ km,
216
CHAPITRE 6. FONCTIONS MONOTONES
et, en utilisant la croissance de (fk (x))k∈N∗ , on en déduit que, pour tout
j ∈ N∗ , on a
fj (x) ≤ fkm (x) < 2m .
Donc (fk (x))k∈N∗ est majorée et, en particulier, pour tout k ≥ 1 et tout
x > 0, on a fk (x) ≤ 2[2x]+1 .
Le critère de convergence d’une suite monotone donné dans la section
précédente entraı̂ne que, pour chaque x > 0, la suite (fk (x))k∈N∗ converge
et l’on posera (lire exponentielle de x)
exp x = lim fk (x) = lim
k→∞
k→∞
4
1+
x
k
5k
.
On a évidemment exp x > 1 pour tout x > 0. On posera e = exp 1.
Proposition. Si x < 0, alors (fk (x))k∈N∗ converge vers
1
exp(−x) .
Démonstration. Si x < 0, alors x = −|x| et, pour tout k ∈ N∗ , on a
4
x
1+
k
5k
En prenant α = 1, β = 1 −
k + 1 ≥ |x|, on obtient
1>
&
|x|2
1−
(k + 1)2
4
|x|
= 1−
k
|x|2
(k+1)2 ,
'k+1
5k
8
1−
= 8
1+
9
|x|2 k
k2
9 .
|x| k
k
dans l’inégalité de droite du lemme et
> 1 − (k + 1)
|x|2
|x|2
=1−
,
2
(k + 1)
k+1
ce qui entraı̂ne aussitôt que
lim
k→∞
&
|x|2
1− 2
k
'k
= 1,
et dès lors, par l’égalité ci-dessus et la proposition précédente, que
lim
k→∞
4
x
1+
k
5k
=
1
1
=
.
exp |x|
exp(−x)
217
6.5. FONCTION EXPONENTIELLE
Cette proposition nous conduit à poser, pour chaque x < 0,
exp x =
1
.
exp(−x)
Définition. La fonction exponentielle est l’application de R dans R définie
par
4
5
x k
exp : R → R, x 2→ lim 1 +
.
k→∞
k
Corollaire. Pour tout x > 0 et tout k ∈ N∗ , on a
4
exp x ≥ 1 +
x
k
5k
x
k
5−k
pour tout x < 0 et tout k ∈ N∗ , on a
4
exp x ≤ 1 −
,
et, pour tout x ∈ R, on a
(exp x).[exp(−x)] = exp 0 = 1.
Démonstration. La première partie est une conséquence immédiate de la
définition. Si x < 0, la proposition précédente montre que
(exp x).[exp(−x)] =
1
.[exp(−x)] = 1 = exp 0.
exp(−x)
Si x > 0, alors
(exp x).[exp(−x)] = [exp(−x)].[exp[−(−x)]] = exp 0,
et le cas de x = 0 est trivial.
Remarque. Le Corollaire montre en particulier que e = exp 1 > 2. Cette
quantité joue un rôle fondamental en mathématiques. Une approximation
numérique est donnée par
e = 2, 71828182845904523536028747135266249775724709366995 . . ..
En 1737, Leonard Euler a donné les grandes lignes de la démonstration de
l’irrationnalité de e et e2 , un résultat précisé et généralisé à ec pour tout rationnel positif c par Johann Lambert en 1761. Charles Hermite a montré
218
CHAPITRE 6. FONCTIONS MONOTONES
en 1873 que e est transcendant et ce résultat a conduit Ferdinand Lindemann à prouver en 1882 que π est également transcendant. Aujourd’hui
encore, on ignore si e + π et e.π sont ou non transcendants.
Enonçons et démontrons maintenant la propriété essentielle de la fonction
exponentielle, à savoir qu’elle fournit un homomorphisme du groupe additif
(R, +) sur le groupe multiplicatif (]0, +∞[, ·).
Proposition. Pour tout x ∈ R et tout y ∈ R, on a
exp(x + y) = (exp x).(exp y).
Démonstration. Si x = 0 ou y = 0, le résultat est évident. Considérons
tout d’abord le cas où x + y > 0 et xy > 0. En prenant
α = 1+
4
54
1+
1+
y
k+1
x+y
xy
x
= 1+
+
2
k + 1 (k + 1)
k+1
5
y
x+y
, β =1+
,
k+1
k+1
dans le lemme ci-dessus, on trouve
4
xy
x+y
1+
k+1
k+1
5k
≤
4
≤ 1+
x
k+1
4
5k+1 4
xy
x
1+
k+1
k+1
5k 4
1+
5k+1
y
k+1
5k
4
− 1+
x+y
k+1
5k+1
.
On en déduit aussitôt, en faisant tendre k vers l’infini, que
0 = [exp x].[exp y] − exp(x + y).
Si x + y > 0 et xy < 0, on posera
β =1+
4
x+y
x
xy
= 1+
+
2
k + 1 (k + 1)
k+1
54
1+
5
y
x+y
, α=1+
,
k+1
k+1
et l’on raisonnera
#
# comme dans le cas précédent avec k suffisamment grand
# xy #
pour que # (k+1)2 # ≤ 1 + x+y
k+1 . Enfin, si x + y < 0, alors, par la Proposition
précédente et la première partie de la démonstration, on a
exp(x + y) =
1
1
=
= [exp x].[exp y].
exp(−x − y)
[exp(−x)].[exp(−y)]
219
6.5. FONCTION EXPONENTIELLE
Corollaire. La fonction exponentielle est strictement croissante sur R. En
outre, on a
lim exp x = 0, lim exp x = +∞.
x→−∞
x→+∞
Démonstration. Si y > x ≥ 0, on a y − x > 0, donc exp(y − x) > 1 et
dès lors,
exp y = exp[x + (y − x)] = [exp x].[exp(y − x)] > exp x.
Si y > 0 > x, alors, par ce qui précède,
exp y > exp 0 = 1,
et
exp x =
1
< 1 < exp y.
exp(−x)
Si x < y ≤ 0, on a 0 ≤ −y < −x et dès lors
exp x =
1
1
<
= exp y.
exp(−x)
exp(−y)
D’autre part, exp n’est pas majorée sur R puisque, pour tout k ∈ N∗ , on a
exp k = exp(k.1) = (exp 1)k = ek > 2k .
Comme exp est croissante, on en déduit que exp x → +∞ si x → +∞ et que
1
dès lors exp x = exp(−x)
→ 0 si x → −∞.
Etudions maintenant les propriétés de dérivabilité de la fonction exponentielle.
Proposition. La fonction exponentielle est dérivable en 0 et (exp)$ (0) = 1.
Démonstration. Soit h > 0; en utilisant le lemme avec α = 1 +
β = 1, on trouve
4
h
h
k ≤ 1+
k+1
k+1
et dès lors
5k+1
4
4
h
−1 ≤ h 1+
k+1
5k
5
4
h
≤ h 1+
k+1
k+1
h
− 1 ≤ h exp h.
k+1
En faisant tendre k vers l’infini, on en déduit aussitôt que
h≤ 1+
h ≤ exp h − 1 ≤ h exp h.
h
k+1
5k+1
,
et
220
CHAPITRE 6. FONCTIONS MONOTONES
En particulier, si 0 < h ≤ 1, on a
h ≤ exp h − 1 ≤ eh,
ce qui entraı̂ne que exp h → 1 si h → 0 par valeurs positives, et dès lors
lim
h→0, h>0
exp h − 1
= 1.
h
Si h < 0, on a
2
3
exp h − 1
1 − exp(−h)
exp h[1 − exp(−h)]
1
,
=
=
h
h
exp(−h)
−h
et dès lors
exp h − 1
= 1.
h→0, h<0
h
lim
Comme les limites du quotient différentiel pour h tendant vers zéro par
valeurs positives et par valeurs négatives existent et sont égales à un, la
fonction exponentielle est dérivable en 0 et sa dérivée y vaut un.
Corollaire. La fonction exponentielle est dérivable (et donc continue) en
chaque point x de R et
(exp)$ (x) = exp x.
Démonstration. Si x ∈ R et h /= 0, on a
exp(x + h) − exp x
exp h − 1
= exp x
,
h
h
et dès lors
2
3
exp(x + h) − exp x
exp h − 1
lim
= exp x.
= lim exp x
h→0
h→0
h
h
6.6
Fonctions monotones continues
On a une caractérisation des fonctions continues strictement monotones sur un intervalle.
221
6.6. FONCTIONS MONOTONES CONTINUES
Proposition. Soit I ⊂ R un intervalle et f une fonction de R dans R
continue sur I. Alors f est strictement monotone sur I si et seulement si f
est injective sur I.
Démonstration. Condition nécessaire. Elle résulte immédiatement du
fait que toute fonction (continue ou non) strictement monotone sur I est
injective sur I.
Condition suffisante. Si f , continue et injective sur I, n’est pas strictement
monotone sur I, il existera x < y < z dans I tels que f (x) < f (y) et
f (y) > f (z) ou f (x) > f (y) et f (y) < f (z). Considérons, pour fixer les idées,
le premier cas, l’autre se traitant de même. Si d ∈ ] max{f (x), f (z)}, f (y)[,
alors, par le théorème des valeurs intermédiaires, il existera u ∈ ]x, y[ et
v ∈ ]y, z[ tels que f (u) = d = f (v), ce qui contredit l’injectivité.
Le résultat suivant montre qu’une fonction strictement croissante sur un
intervalle a pour image un intervalle de même nature.
Proposition. Soit I = ]a, b[ (resp. ]a, b], [a, b[, [a, b]), avec éventuellement
a = −∞ (resp. b = +∞) si I est ouvert à gauche (resp. à droite). Si f est
strictement croissante sur I, et si l’on pose
f (a+) =
lim
x→a, x∈I
f (x), f (b−) =
lim
x→b, x∈I
f (x),
on a
f (I) = ]f (a+), f (b−)[ (resp. ]f (a+), f (b)], [f (a), f (b−)[, [f (a), f (b)]).
Si f est strictement décroissante sur I, on a
f (I) = ]f (b−), f (a+)[ (resp. [f (b), f (a+)[, ]f (b−), f (a)], [f (b), f (a)]).
Démonstration. Considérons, pour fixer les idées, le cas de I = ]a, b],
et f strictement croissante, les autres se traitant de même. Puisque f est
continue sur I, il résulte du théorème des valeurs intermédiaires que f (I) est
un intervalle. D’ailleurs, pour tout x ∈ ]a, b], on a f (x) ≤ f (b) et f (b) est le
maximum de f (I). D’autre part, on a vu que
f (a+) =
lim
x→a, x∈I
f (x) = inf f = inf f (I).
I
S’il existe u ∈ ]a, b] tel que f (u) = inf f (I), alors, pour tout v ∈ ]a, u[, on
aura f (v) < f (u) = inf f (I), ce qui est contradictoire. Donc f (u) > inf f (I)
pour tout u ∈ I, et f (I) = ]f (a+), f (b)].
222
CHAPITRE 6. FONCTIONS MONOTONES
La fonction réciproque d’une fonction continue et strictement monotone
sur un intervalle est continue et strictement monotone.
Proposition. Soit I ⊂ R un intervalle et f une fonction continue et strictement monotone sur I. Alors f −1 est strictement monotone et continue sur
f (I).
Démonstration. f , strictement monotone et continue sur I, est injective
sur I et dès lors sa fonction réciproque f −1 est bien définie sur f (I). Supposons, pour fixer les idées, que f soit strictement croissante sur I = ]a, b[,
les autres cas se traitant de même. La relation
(x − y)[f (x) − f (y)] > 0 si x /= y dans I,
entraı̂ne, en posant u = f (x), v = f (y),
(u − v)[f −1 (u) − f −1 (v)] > 0 si u /= v dans f (I),
et f −1 est strictement croissante sur f (I). Soit d ∈ f (I) et c ∈ I l’unique
élément tel que f (c) = d. Soit ! > 0 tel que [c − !, c + !] ⊂ ]a, b[. De la
relation
c − ! < c < c + !,
on tire
f (c − !) < d < f (c + !),
et il existe dès lors δ > 0 tel que
f (c − !) < f (c) − δ < d < f (c) + δ < f (c + !).
Comme f −1 est strictement croissante, on en déduit aussitôt que
f −1 (d) − ! = c − ! < f −1 (d − δ) < f −1 (d) < f −1 (d + δ) < c + ! = f −1 (d) + !.
En conséquence, pour tout x ∈ [d − δ, d + δ] ∩ I, on aura
f −1 (d) − ! < f −1 (d − δ) ≤ f −1 (x) ≤ f −1 (d + δ) < f −1 (d) + !.
6.7. FONCTIONS MONOTONES DÉRIVABLES
6.7
223
Fonctions monotones dérivables
Le théorème de Lagrange fournit une caractérisation des fonctions monotones et dérivables sur un intervalle.
Proposition. Soit I ⊂ R un intervalle ouvert et f une fonction de R dans
R dérivable sur I. Alors f est croissante (resp. décroissante) sur I si et
seulement si, pour tout x ∈ I, on a f $ (x) ≥ 0 (resp. f $ (x) ≤ 0).
Démonstration. Il suffit de considérer le cas de f croissante, l’autre s’en
déduisant par application à −f.
Condition nécessaire. Si f est croissante et dérivable sur I, on a, pour chaque
x ∈ I et chaque y /= x dans I,
(y − x)[f (y) − f (x)] ≥ 0,
et dès lors
f $ (x) =
lim
y→x, y∈I
f (y) − f (x)
≥ 0.
y−x
Condition suffisante. Si x ∈ I, y ∈ I et y > x, alors, par le théorème de
Lagrange, il existe z ∈ ]x, y[ tel que
f (y) − f (x) = (y − x)f $ (z),
et dès lors
(y − x)[f (y) − f (x)] = (y − x)2 f $ (z) ≥ 0.
On a également une caractérisation des fonctions dérivables et
strictement monotones sur un intervalle.
Proposition. Soit I un intervalle ouvert de R et f une fonction de R dans
R dérivable sur I. Alors f est strictement croissante (resp. strictement
décroissante) sur I si et seulement si f $ (x) ≥ 0 (resp. f $ (x) ≤ 0) pour tout
x ∈ I et f $ ne s’annule sur aucun intervalle J ⊂ I.
Démonstration. Il suffit de nouveau de considérer le cas où f est strictement croissante.
Condition nécessaire. Si f est strictement croissante et dérivable sur I, alors,
par la proposition précédente, f $ (x) ≥ 0 pour tout x ∈ I, et s’il existe un
intervalle J ⊂ I tel que f $ (x) = 0 pour tout x ∈ J, f sera constante sur J,
ce qui contredit son caractère strictement croissant.
Condition suffisante. Soient x < y dans I; par le théorème de Lagrange,
224
CHAPITRE 6. FONCTIONS MONOTONES
il existe z ∈ ]x, y[ tel que f (y) − f (x) = (y − x)f $ (z). Si f $ (z) = 0, alors,
f (y) = f (x) et puisque f est croissante sur I, on aura, pour tout u ∈ [x, y],
f (u) = f (x) = f (y), et dès lors f $ (u) = 0, ce qui contredit l’hypothèse sur
les zéros de f $ . Donc, f $ (z) > 0 et f (y) > f (x).
Le résultat suivant donne des conditions pour que la fonction réciproque
d’une fonction dérivable et injective soit dérivable.
Proposition. Soit I un intervalle de R et f une fonction de R dans R
dérivable et injective sur I. Pour tout a ∈ I tel que f $ (a) /= 0, f −1 est
dérivable en f (a) et
1
(f −1 )$ (f (a)) = $ .
f (a)
Démonstration. Par hypothèse f est continue et injective sur I, et donc
strictement monotone. Il existe donc certainement des a ∈ I tels que f $ (a) /=
0. Soit a l’un d’entre eux. Notons que f (x) /= f (a) si x /= a et f −1 (y) /=
f −1 (f (a)) si y /= f (a). Comme
f (x) − f (a)
= f $ (a) /= 0,
x→a, x∈I\{a}
x−a
lim
On aura
x−a
=
lim
x→a, x∈I\{a} f (x) − f (a)
x→a, x∈I\{a}
lim
1
f (x)−f (a)
x−a
=
1
f $ (a)
.
Dès lors, si ! > 0 est donné,
#
#
(∃η > 0)(∀x ∈ I : 0 < |x − a| ≤ η) : ##
#
x−a
1 #
− $ ## ≤ !.
f (x) − f (a) f (a)
Par un résultat ci-dessus, f −1 est continue en f (a) et dès lors
(∃δ > 0)(∀y ∈ f (I) : |y − f (a)| ≤ δ) : |f −1 (y) − f −1 (f (a)| = |f −1 (y) − a| ≤ η.
En conséquence,
#
#
# f −1 (y) − f −1 (f (a))
1 ##
#
(∃δ > 0)(∀y ∈ f (I) : 0 < |y − f (a)| ≤ δ) : #
− $ # ≤ !.
#
y − f (a)
f (a) #
225
6.8. FONCTIONS CONVEXES OU CONCAVES
On a vu que la fonction exponentielle était une application strictement
croissante de R dans R, ayant une limite nulle lorsque x tend vers −∞ et
tendant vers +∞ lorsque x tend vers +∞. Elle est en outre dérivable en
chaque point x de R, sa dérivée étant égale à elle-même. En conséquence,
les résultats de cette section et de la précédente entraı̂nent que exp est une
bijection de R sur ]0, +∞[ et possède donc une fonction réciproque, définie
sur ]0, +∞[, strictement croissante et continue sur cet intervalle, et dérivable
en chaque point de cet intervalle. Cette fonction est appelée la fonction
logarithme et notée ln ou log. En vertu du théorème que nous venons de
démontrer, on aura, pour tout x ∈ ]0, +∞[,
(ln)$ (x) = (ln)$ [exp(ln x)] =
1
exp$ (ln x)
=
1
1
= .
exp(ln x)
x
D’autre part, pour tout x ∈ ]0, +∞[ et tout y ∈ ]0, +∞[, on a
exp(ln x + ln y) = [exp(ln x)].[exp(ln y)] = xy,
et dès lors
ln(xy) = ln x + ln y.
Donc la fonction logarithme fournit un homomorphisme du groupe multiplicatif (]0, +∞[, ·) sur le groupe additif (R, +) et cette propriété remarquable
de la fonction logarithme est à la base de son utilisation comme outil de
calcul numérique. Si a > 0, on définit la fonction exponentielle de base a
x 2→ ax sur R par ax = exp(x ln a). On voit facilement que cette fonction est
positive et dérivable en chaque point x de R et que
(ax )$ = ax ln a.
En particulier, cette fonction sera strictement décroissante sur R si a ∈ ]0, 1[,
constante si a = 1 et strictement croissante si a > 1. On a évidemment
ex = exp x pour tout x ∈ R. Lorsque a > 0 est différent de un, la fonction
réciproque de l’exponentielle de base a est définie sur ]0, +∞[, appelée la
fonction logarithme de base a et notée loga . On vérifie aisément que, pour
tout x ∈ ]0, +∞[, on a
ln x
loga x =
.
ln a
6.8
Fonctions convexes ou concaves
Soit f une fonction de R dans R définie sur un intervalle I ⊂ R. Il est
intéressant d’étudier les fonctions telles que, pour chaque a ∈ I, le taux de
226
CHAPITRE 6. FONCTIONS MONOTONES
variation
f (x) − f (a)
x−a
de f en a est une fonction croissante sur I \ {a} ou une fonction décroissante
sur I \ {a}.
La caractérisation suivante est bien utile.
∆af : x 2→
Proposition. Soit f une fonction de R dans R définie sur un intervalle
I ⊂ R. Alors la fonction ∆a f est, pour chaque a ∈ I, une fonction croissante
sur I \ {a} si et seulement si, pour chaque x ∈ I, chaque y ∈ I et chaque
λ ∈ [0, 1], on a
f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).
Démonstration. Condition nécessaire. Il suffit évidemment de démontrer
le résultat lorsque x /= y et λ ∈ ]0, 1[, les autres cas étant triviaux. Si x < y
et λ ∈ ]0, 1[, on a x + λ(y − x) < y, et dès lors, par hypothèse,
∆x f (x + λ(y − x)) ≤ ∆x f (y)
pour tout y ∈ I tel que y > x, c’est-à-dire
f [(1 − λ)x + λy] − f (x)
f (y) − f (x)
≤
,
λ(y − x)
y−x
ce qui entraı̂ne facilement que
f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).
Si x > y et λ ∈ ]0, 1[, alors, en posant µ = 1 − λ, on a aussi µ ∈ ]0, 1[, et, par
la première partie de la démonstration,
f [(1−λ)x+λy] = f [(1−µ)y+µx] ≤ (1−µ)f (y)+µf (x) = (1−λ)f (x)+λf (y).
Condition suffisante. Si x < y < a appartiennent à I, alors
λ=
et
a−y
y−x
∈ ]0, 1[, 1 − λ =
,
a−x
a−x
f (y) = f (a+y −a) = f [a+λ(x−a)] = f [(1−λ)a+λx] ≤ (1−λ)f (a)+λf (x);
dès lors
f (y) − f (a) ≤ λ[f (x) − f (a)],
6.8. FONCTIONS CONVEXES OU CONCAVES
c’est-à-dire
227
f (y) − f (a)
f (x) − f (a)
≥
.
y−a
x−a
Le cas où a < x < y se traite d’une manière semblable. Si x < a < y
appartiennent à I, alors, par la première partie de la démonstration de la
condition suffisante, on a
f (a) − f (x)
f (y) − f (x)
≤
,
a−x
y−x
et dès lors
(y − x)[f (a) − f (x)] ≤ (a − x)[f (y) − f (x)]
= (a − x)[f (y) − f (a)] + (a − x)[f (a) − f (x)].
On en déduit aussitôt que
(y − a)[f (a) − f (x)] ≤ (a − x)[f (y) − f (a)],
et donc que
f (x) − f (a)
f (y) − f (a)
≤
.
x−a
y−a
Remarque. L’examen de la démonstration de la proposition précédente
montre que, pour chaque a ∈ I, ∆a f est strictement croissante sur I \ {a}
si et seulement si, pour tout x /= y dans I et pour tout λ ∈ ]0, 1[, on a
f [(1 − λ)x + λy] < (1 − λ)f (x) + λf (y).
On est ainsi conduit à la définition suivante.
Définition. Soit f une fonction de R dans R définie sur un intervalle I de
R. On dit que f est convexe sur I si, pour tout x ∈ I, tout y ∈ I et tout
λ ∈ [0, 1], on a
f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).
Elle sera dite strictement convexe sur I si, pour tout x /= y dans I et tout
λ ∈ ]0, 1[, on a
f [(1 − λ)x + λy] < (1 − λ)f (x) + λf (y).
228
CHAPITRE 6. FONCTIONS MONOTONES
Géométriquement, cette définition exprime que, pout tout x ∈ I et pour
tout y ∈ I, le graphe de f situé entre (x, f (x)) et (y, f (y) est située “endessous” du segment de droite joignant ces deux points. Par la proposition
qui précède, f est convexe (resp. strictement convexe) sur I si et seulement
si, pour chaque a ∈ I, la fonction ∆af est croissante (resp. strictement
croissante) sur I \ {a}.
On a évidemment la situation correspondant au cas où ∆a f est décroissante.
Définition. Soit f une fonction de R dans R définie sur un intervalle I de
R. On dit que f est concave sur I si, pour tout x ∈ I, tout y ∈ I et tout
λ ∈ [0, 1], on a
f [(1 − λ)x + λy] ≥ (1 − λ)f (x) + λf (y).
Elle sera dite strictement concave sur I si, pour tout x /= y dans I et tout
λ ∈ ]0, 1[, on a
f [(1 − λ)x + λy] > (1 − λ)f (x) + λf (y).
Il est clair que f est concave (resp. strictement concave) sur I si et
seulement si −f est convexe (resp. strictement convexe) sur I, et dès lors si
et seulement si, pour chaque a ∈ I, ∆af est décroissante sur I \ {a}. Il suffit
donc d’étudier les fonctions convexes ou strictement convexes.
Exemples. 1. Toute fonction constante sur I est concave et convexe sur I.
2. Toute fonction affine sur R est concave et convexe sur R.
3. Pour tout entier n ≥ 2, la fonction x 2→ xn est strictement convexe sur
%
k n−1−k
R; en effet, pour chaque a ∈ R, ∆a f (x) = n−1
est strictement
k=0 a x
croissante sur R.
Une fonction convexe sur I est continue en tout point intérieur à I.
Proposition. Si f est une fonction de R dans R convexe sur l’intervalle I,
alors, f est continue en tout point a ∈ int I et les limites
fg$ (a) =
lim
x→a, x<a
∆af (x) et fd$ (a) =
lim
x→a, x>a
∆af (x)
existent et vérifient l’inégalité fg$ (a) ≤ fd$ (a).
Démonstration. Soit a ∈ int I. L’existence des limites en question et
l’inégalité fg$ (a) ≤ fd$ (a) sont une conséquence de la croissance de ∆a f et
des propriétés des fonctions croissantes. D’autre part,
lim
x→a, x<a
[f (x) − f (a)] =
lim
x→a, x<a
(x − a)
f (x) − f (a)
= 0.fg$ (a) = 0,
x−a
6.8. FONCTIONS CONVEXES OU CONCAVES
229
et de même
lim
x→a, x>a
[f (x) − f (a)] = 0.
On en déduit aussitôt la continuité de f en a.
Remarque. Le résultat ci-dessus n’est pas vrai en une extrémité de I comme
le montre l’exemple de la fonction f égale à 1 en 0 et à 0 ailleurs qui est
convexe sur [0, 1] et n’est pas continue en 0.
Les fonctions convexes vérifient une inégalité de la moyenne en termes
des dérivées à gauche fg$ et à droite fd$ .
Proposition. Soit f une fonction de R dans R convexe sur un intervalle I.
Si a < b sont des points de I tels que fd$ (a) et fg$ (b) existent (en particulier
s’ils sont intérieurs à I), alors
fd$ (a) ≤
f (b) − f (a)
≤ fg$ (b).
b−a
Démonstration. Si a < x < b sont intérieurs à I, on a
f (a) − f (x)
f (b) − f (x)
≤
,
a−x
b−x
et dès lors, en faisant tendre x respectivement vers a et vers b, on obtient
fd$ (a) ≤
f (b) − f (a)
≤ fg$ (b).
b−a
On a une caractérisation intéressante des fonctions convexes dérivables.
Proposition. Soit f une fonction de R dans R dérivable en chaque point
d’un intervalle I. Les énoncés suivants sont équivalents.
1. f est convexe sur I.
2. Pour tout x ∈ I et tout y ∈ I, on a
f (y) ≥ f (x) + f $ (x)(y − x).
3. f $ est croissante sur I.
Démonstration. Notons tout d’abord que, f étant dérivable en chaque
point de I, on a fg$ (x) = fd$ (x) = f $ (x) pour chaque x ∈ I. Dès lors, la
proposition précédente entraı̂ne que 1 ⇒ 2 et la caractérisation de la convexité en termes de ∆a f et de la croissance d’une fonction dérivable entraı̂ne
230
CHAPITRE 6. FONCTIONS MONOTONES
que 3 ⇒ 1. Il reste à montrer que 2 ⇒ 3. L’hypothèse 2 entraı̂ne que, pour
tout x ∈ I et tout y ∈ I, on a
f (y) ≥ f (x) + f $ (x)(y − x) et f (x) ≥ f (y) + f $ (y)(x − y),
c’est-à-dire
f $ (x)(y − x) ≤ f (y) − f (x) ≤ f $ (y)(y − x),
et donc (y − x)[f $ (y) − f $ (x)] ≥ 0.
Remarques. 1. On démontre d’une manière analogue l’équivalence, pour
une fonction dérivable sur I, entre les énoncés
1. f est strictement convexe sur I.
2. Pour chaque x /= y dans I, on a
f (y) > f (x) + f $ (x)(y − x).
3. f $ est strictement croissante sur I.
On déduit aisément de cette remarque que la fonction exponentielle est une
fonction strictement convexe sur R et la fonction logarithme une fonction
strictement concave sur ]0, +∞[.
2. La propriété 2 de la Proposition précédente montre que, si f est
convexe sur I, tout point critique de f sur I est un minimant de f sur I.
3. La définition de fonction convexe peut s’étendre aux fonctions de Rn
dans R. Si E ⊂ Rn , on dira que E est convexe s’il contient le segment
de droite joignant deux quelconques de ses points, c’est-à-dire si, pour tout
x ∈ E, tout y ∈ E et tout λ ∈ [0, 1], on a (1 − λ)x + λy ∈ E. Les parties
convexes de R sont les intervalles. Une fonction f de Rn dans R sera dite
convexe sur E si elle est définie sur E et si, pour tout x ∈ E, tout y ∈ E et
tout λ ∈ [0, 1], on a f [(1 − λ)x + λy] ≤ (1 − λ)f (x) + λf (y).
6.9
Exercices
1. Si f est une fonction de Rn dans R et si a ∈ dom f, on appelle oscillation
de f en a la quantité
o(f, a) = lim
r→0+
&
sup f − inf f
B2 [a;r]
B2[a;r]
'
.
Montrer que o(f, a) existe au sens large et que f est continue en a si et
seulement si o(f, a) = 0.
231
6.9. EXERCICES
2. Utiliser le lemme de Cousin pour démontrer directement que si f est une
fonction de R dans R dérivable en chaque point d’un intervalle I et telle que
f $ (x) > 0 pour tout x ∈ I, alors f est strictement croissante sur I.
3. Soit a > 0 et (uk )k∈N la suite réelle définie par u0 > 0 arbitraire et
uk+1 =
4
1
a
uk +
2
uk
5
, (k ∈ N).
Montrer que cette suite est positive, décroissante et donc convergente. Mon√
trer que sa limite est égale à a. (Algorithme de Héron pour l’extraction
d’une racine carrée).
4. Soit (ak )k∈N une suite réelle. Pour chaque k ∈ N, posons (au sens large)
ak = inf{aj : j ≥ k}, ak = sup{aj : j ≥ k}.
a. Montrer que (ak )k∈N est une suite croissante dans R si et seulement si
(ak )k∈N est minorée. Si (ak )k∈N n’est pas minorée, on pose
lim inf ak = −∞.
k→∞
Si (ak )k∈N est minorée, on pose (au sens large)
lim inf ak = lim ak = lim inf aj .
k→∞
k→∞
k→∞ j≥k
b. Montrer que (ak )k∈N est une suite décroissante dans R si et seulement si
(ak )k∈N est majorée. Si (ak )k∈N n’est pas majorée, on pose
lim sup ak = +∞.
k→∞
Si (ak )k∈N est majorée, on pose (au sens large)
lim sup ak = lim ak = lim sup aj .
k→∞
k→∞
k→∞ j≥k
c. On a ainsi attaché à toute suite réelle deux éléments lim inf k→∞ ak
et lim supk→∞ ak de R ∪ {−∞} ∪ {+∞} respectivement appelés la limite
inférieure et la limite supérieure de la suite (ak )k∈N . Montrer (avec la convention −∞ < a < +∞ pour tout a ∈ R) que l’on a toujours
lim inf ak ≤ lim sup ak ,
k→∞
k→∞
232
CHAPITRE 6. FONCTIONS MONOTONES
et que l’égalité a lieu si et seulement si la suite (ak )k∈N est convergente (au
sens large), auquel cas sa limite (au sens large) est égale à la valeur commune
de sa limite inférieure et de sa limite supérieure.
5. Soit f une fonction de Rn dans R semi-continue inférieurement en chaque
point du fermé E ⊂ Rn . Montrer que f possède un minimum sur E si et
seulement si f possède une suite minimisante convergente.
6. Soient A et B deux ensembles non vides et
f : A × B → R, (x, y) 2→ f (x, y)
une application réelle majorée et minorée. Montrer que
sup inf f (x, y) ≤ inf sup f (x, y).
x∈A y∈B
6.10
y∈B x∈A
Petite anthologie
Si la propriété M n’appartient pas à toutes les valeurs d’une grandeur x,
mais appartient à toutes celles qui sont plus petites qu’un certain u, alors il
existe toujours une grandeur U qui est la plus grande de celles dont on peut
affirmer que toutes les valeurs inférieures x possèdent la propriété M.
Bernard Bolzano, 1817
Il ne faut pas trop s’étonner que la distinction entre minimum et borne
inférieure, ou maximum et borne supérieure, ait été faite si tardivement.
C’est qu’elle n’a aucune signification concrète. Qui oserait décider s’il existe
une charge maxima que peut supporter un pont, plutôt qu’une charge minima
qui le fasse s’écrouler ?
Henri Lebesgue
Il me semble que la notion de fonction convexe est à peu près aussi fondamentale que celles-ci : fonction positive, fonction croissante. Si je ne
me trompe pas en ceci, la notion devra trouver sa place dans les expositions
élémentaires de la théorie des fonctions réelles.
Johann L.W.V. Jensen, 1906
Chapitre 7
Développement de Taylor et
séries
7.1
Dérivées d’ordre supérieur
Soit f une fonction de R dans Rp dérivable en au moins un point de R. A
chaque point x ∈ R tel que f soit dérivable en x, nous pouvons associer
l’élément f $ (x) de Rp et définir ainsi une nouvelle fonction f $ de R dans Rp
de domaine
dom f $ = {x ∈ R : f est dérivable en x}.
Cette fonction s’appelle la fonction dérivée première de f ou, brièvement, la
dérivée première de f ou la dérivée de f . On la désigne également par Df
df
ou par dx
.
Définition. Soit f une fonction de R dans Rp et a ∈ dom f $ . On dit que
f est deux fois dérivable en a si f $ est dérivable en a, auquel cas (f $ )$ (a) est
2
noté f $$ (a), D 2 f (a) ou ddxf2 (a) et appelé le vecteur dérivé deuxième de f en
a ou, plus simplement la dérivée deuxième de f en a.
On rappellera que l’existence de f $$ (a) requiert que a soit non isolé dans
dom f $ et que
f $ (x) − f $ (a)
lim
x→a
x−a
existe. On sait que, n ≥ 1 étant un entier, l’application f : x 2→ xn est
dérivable en chaque x ∈ R et f $ (x) = nxn−1 . En conséquence la dérivée
deuxième f $$ (x) existe en chaque x ∈ R et est égale à zéro si n = 1 et à
n(n − 1)xn−2 si n ≥ 2.
233
234
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
On peut alors procéder comme avec f $ et définir la fonction dérivée
deuxième de f ou, plus brièvement, la dérivée deuxième de f , notée f $$ ou
2
D2 f ou ddxf2 , comme la fonction de R dans Rp de domaine
dom f $$ = {x ∈ R : f $ est dérivable en x},
qui, à chaque x ∈ dom f $$ associe f $$ (x). On dira alors que f est trois fois
dérivable en a si f $$ est dérivable en a, auquel cas (f $$ )$ (a) est noté f $$$ (a),
3
f (3)(a), D3 f (a) ou ddxf3 (a) et appelé le vecteur dérivée troisième de f en a ou,
plus simplement la dérivée troisième de f en a. En continuant de la sorte,
si k ≥ 2 est un entier et si f k−1 désigne la fonction dérivée (k − 1)e de f ,
on dira que f est k fois dérivable en a si la fonction f (k−1) est dérivable en
a, auquel cas (f (k−1) )$ (a) est appelé le vecteur dérivée ke de f en a ou plus
k
simplement la dérivée ke de f en a, et noté f (k) (a) ou D k f (a) ou ddxfk (a). La
fonction dérivée ke de f est alors la fonction de R dans Rp de domaine
dom f (k) = {x ∈ R : f est k-fois dérivable en x}
qui, à chaque x ∈ dom f (k) associe f (k) (x). Ainsi, dans l’exemple ci-dessus
où f (x) = xn , un raisonnement par récurrence aisé montre que, pour chaque
x ∈ R,
f (k) (x) = n(n − 1) . . . (n − k + 1)xn−k si k ≤ n,
et
f (k) (x) = 0 si k > n.
On a bien entendu en général les inclusions
dom f (k) ⊂ dom f (k−1) ⊂ dom f,
et ces inclusions peuvent être strictes. Ainsi, pour la fonction f de Dirichlet
qui associe 1 à chaque x rationnel et 0 à chaque x irrationnel, on a dom f $ = ∅
(et dès lors dom f (k) = ∅ pour tout k ≥ 2), puisque f n’est continue en aucun
point de R et donc dérivable en aucun point de R. Karl Weierstrass a
donné en 1872 un exemple plus surprenant de fonction continue sur R qui
n’est dérivable en aucun point de R. Nous y reviendrons plus loin.
On déduit aisément des règles de calcul des dérivées (premières) certaines
règles de calcul pour les dérivées d’ordre supérieur. Par exemple, si f et g
sont des fonctions de R dans Rp k-fois dérivables en a ∈ R, et si c ∈ R, alors
f + g et cf sont k-fois dérivables en a et
(f + g)(k)(a) = f (k) (a) + g (k)(a), (cf )(k)(a) = cf (k) (a).
Le cas du produit (et dès lors du quotient) de deux fonctions est plus compliqué et porte le nom de formule de Leibniz.
235
7.1. DÉRIVÉES D’ORDRE SUPÉRIEUR
Proposition. Soit k ≥ 1 un entier, f une fonction de R dans R (resp. C)
et g une fonction de R dans Rp (resp. C) k-fois dérivables en a. Alors, f g
est k-fois dérivable en a et
(f g)(k)(a) =
k
$
Ckj f (j) (a)g (k−j)(a),
j=0
j
où Ck =
k!
j!(k−j)! .
Démonstration. Elle se fait par récurrence sur k. Le résultat a déjà été
démontré pour k = 1. S’il est vrai jusqu’à l’ordre k − 1, alors
(f g)(k−1)(a) =
k−1
$
j
Ck−1
f (j) (a)g (k−1−j)(a),
j=0
et (f g)(k−1) est dérivable en a puisqu’il en est ainsi de chacune des fonctions
f (j) g (k−1−j) (0 ≤ j ≤ k − 1) en vertu de l’hypothèse de récurrence. En outre,
par les règles de calcul d’une dérivée première, on a
(f g)(k)(a) = [(f g)(k−1)]$ (a) =
k−1
$
j
Ck−1
[f (j)g (k−1−j) ]$ (a)
j=0
=
k−1
$
j
Ck−1
[f (j+1)(a)g (k−1−j)(a) + f (j) (a)g (k−j)(a)]
j=0
=
k
$
j−1 (j)
Ck−1
f (a)g (k−j)(a) +
j=1
= f (k) (a)g(a) +
k−1
$
j
Ck−1
f (j) (a)g (k−j)(a)
j=0
k−1
$
j−1
j
(Ck−1
+ Ck−1
)f (j) (a)g (k−j)(a) + f (a)g (k)(a)
j=1
=
k
$
j=0
j−1
j
puisque Ckj = Ck−1
+ Ck−1
.
Ckj f (k) (a)g (k−j)(a),
236
7.2
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Développement de Taylor
Soit f une fonction de R dans Rp et a ∈ dom f . Si f est dérivable en a,
alors, pour tout h ∈ (dom f − a) \ {0}, on a
f (a + h) = f (a) + hf $ (a) + |h|r(h),
où r est une fonction de R dans Rp de domaine au moins égal à (dom f −
a) \ {0} telle que r(h) → 0 si h → 0. En d’autres termes, on peut écrire,
pour tout h ∈ (dom f − a) \ {0},
f (a + h) = P 1 (h) + |h|r(h),
où P 1 (h) est un polynôme de degré un en h dont les coefficients s’expriment
en fonction de f (a) et f $ (a) et où r(h) → 0 si h → 0.
Lorsque f est une fonction de R dans Rp m-fois dérivable en a, (m ≥ 2),
il est naturel de se demander s’il existe un polynôme P m de degré m, dont
les coefficients s’expriment en fonction de f (a), f $ (a), . . ., f (m)(a) tel que,
pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = P m (h) + |h|m r(h)
(7.1)
où r est une fonction de R dans Rp de domaine au moins égal à (dom f −a)\
{0} telle que r(h) → 0 si h → 0. Avant de donner des conditions suffisantes
pour l’existence d’un tel polynôme, montrons qu’il en existe au plus un.
Proposition. Soit f une fonction de R dans Rp et a non isolé dans dom f .
Il existe au plus un polynôme P m de degré m vérifiant (7.1).
%
k
Démonstration. Supposons que P m (h) = m
k=0 ck h vérifie (7.1) et que
%m
m
k
Q (h) = k=0 dk h soit tel que, pour tout h ∈ (dom f − a) \ {0}, on ait
f (a + h) = Qm (h) + |h|m s(h),
où s est une fonction de R dans Rp de domaine au moins égal à (dom f −
a) \ {0} telle que s(h) → 0 si h → 0. On en déduit aussitôt, par soustraction,
que, pour tout h ∈ (dom f − a) \ {0}, on a
Qm (h) − P m (h) = |h|m[r(h) − s(h)] = |h|m q(h),
avec q(h) → 0 si h → 0. On déduit aussitôt de (7.2) que
d0 − c0 = lim [Qm (h) − P m (h)] = lim |h|mq(h) = 0,
h→0
h→0
(7.2)
237
7.2. DÉVELOPPEMENT DE TAYLOR
et, pour prouver par récurrence que P m = Qm , il suffit de montrer que si
cj = dj pour 0 ≤ j ≤ k − 1 ≤ m − 1, alors ck = dk . Si cj = dj pour
0 ≤ j ≤ k − 1 ≤ m − 1, la condition (7.2) entraı̂ne
m
$
j=k
et dès lors
m
$
j=k
(dj − cj )hj = |h|m q(h),
(dj − cj )hj−k =
|h|m
q(h),
hk
pour tout h ∈ (dom f − a) \ {0}. En conséquence,
dk − ck = lim
h→0
puisque la fonction h 2→
k ≤ m.
m
$
j=k
|h|m
hk
|h|m
q(h) = 0,
h→0 hk
(dj − cj )hj−k = lim
est localement bornée en 0 pour chaque 1 ≤
Cherchons maintenant à déterminer la forme de cet unique polynôme
de degré m qui vérifie éventuellement la condition (7.1). Pour ce faire,
%
k
considérons le cas particulier trivial où f (x) = m
k=0 bk x est elle-même
un polynôme de degré m. Dans ce cas, si a ∈ R est donné, la fonction
%
k
h 2→ f (a + h) = m
k=0 bk (a + h) est aussi un polynôme de degré m, comme
le montre le développement de chaque monôme (a + h)k par la formule
du binôme de Newton. Donc f (a + h) est dans ce cas l’unique polynôme
%
k
P m (h) = m
k=0 ck h de degré m vérifiant la condition (7.1). De l’identité
f (a + h) =
m
$
ck hk ,
k=0
on déduit aussitôt, par dérivations des deux membres, que, pour chaque
1 ≤ j ≤ m, on a
[f (a + ·)](j)(h) = f (j) (a + h) =
m
$
k=j
ck k(k − 1) . . .(k − j + 1)hk−j ,
et dès lors, en prenant h = 0, on trouve
f (a) = c0 ,
f (j) (a) = j!cj , (1 ≤ j ≤ m).
238
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Le polynôme de degré m vérifiant les conditions voulues est donc de la forme
m
$
hj
j=0
j!
f (j) (a),
(avec les conventions habituelles 0! = 1 et f (0) = f ) et s’exprime bien en
fonction de f (a), f $ (a), . . ., f (m)(a). Ce résultat suggère l’introduction de la
définition suivante.
Définition. Soit m ≥ 1 un entier et f une fonction de R dans Rp m fois
dérivable en a ∈ R. Le développement de Taylor d’ordre m de f en a est le
m
polynôme Tf,a
de degré m défini par
m
Tf,a
(h) =
m
$
j=0
hj
f (j) (a)
.
j!
Le reste du développement de Taylor d’ordre m de f en a est la fonction
p
Rm
f,a de R dans R de domaine dom f − a définie par
m
Rm
f,a (h) = f (a + h) − Tf,a (h).
m est aussi appelé le développement de Maclaurin d’ordre
Lorsque a = 0, Tf,0
m de f .
Un lemme sera utile pour donner des conditions suffisantes pour que le
développement de Taylor d’ordre m de f vérifie la relation (7.1).
Lemme. Soit m ≥ 1 un entier et g une fonction de R dans Rp (m − 1)-fois
dérivable en chaque point d’un voisinage V de 0 et m fois dérivable en 0
(cette hypothèse se réduisant à la dérivabilité de g en 0 si m = 1). Si
g(0) = g $ (0) = . . . = g (m)(0) = 0,
alors
lim
h→0
g(h)
= 0.
|h|m
Démonstration. Elle se fait par récurrence sur m. Le résultat est évidemment vrai pour m = 1 puisque, si g(0) = g $ (0) = 0, alors,
g(h)
g(h) − g(0) − hg $ (0)
= lim
= 0,
h→0 |h|
h→0
|h|
lim
7.2. DÉVELOPPEMENT DE TAYLOR
239
puisque g est dérivable en 0. Supposons donc le résultat vrai pour k − 1,
où 2 ≤ k ≤ m est un entier, et montrons qu’il est vrai pour k. On a, par
hypothèse
g(0) = g $ (0) = . . . = g (k)(0) = 0,
et la fonction g $ est donc telle que
g $ (0) = (g $)$ (0) = . . . = (g $)(k−1) (0) = 0.
En conséquence, l’hypothèse de récurrence entraı̂ne que
g $ (h)
= 0.
h→0 |h|k−1
lim
(7.3)
Si r > 0 est suffisamment petit pour que le voisinage V de 0 contienne
B2 [0; r], alors, pour chaque h ∈ [−r, r], le théorème de la moyenne entraı̂ne
l’existence d’un θ ∈ ]0, 1[ tel que
|g(h)|2 = |g(h) − g(0)|2 ≤ |h||g $(θh)|2 .
(7.4)
Soit ! > 0; la condition (7.3) entraı̂ne l’existence d’un δ ∈ ]0, r] tel que, pour
tout h$ ∈ [−δ, δ], on ait
|g $(h$ )|2 ≤ !|h$ |k−1 .
Dès lors, pour tout h ∈ [−δ, δ], on aura |θh| ≤ δ, et, par (7.4),
|g(h)|2 ≤ |h|!|θh|k−1 ≤ !|h|k .
Le résultat suivant, dû à William H. Young, montre qu’il suffit d’ajouter
la dérivabilité jusqu’à l’ordre m − 1 sur un voisinage du point a à l’existence
de la dérivée me en ce point pour que le développement de Taylor d’ordre
m de f en a vérifie la condition (7.1).
Proposition. Soit m ≥ 1 un entier, f une fonction de R dans Rp (m − 1)fois dérivable en chaque point d’un voisinage V de a et m-fois dérivable en
a (si m = 1 cette hypothèse se réduit à la dérivabilité de f en a). Si Rm
f,a est
le reste du développement de Taylor d’ordre m de f en a, alors
Rm
f,a (h)
= 0.
h→0 |h|m
lim
240
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Démonstration. Pour tout h ∈ dom f − a, on a, par définition,
m
Rm
f,a (h) = f (a + h) − Tf,a (h) = f (a + h) −
m
$
j=0
hj
f (j) (a)
,
j!
et dès lors, pour chaque 1 ≤ k ≤ m,
(k)
(k)
(Rm
(a + h) −
f,a ) (h) = f
m
$
j=k
j(j − 1) . . . (j − k + 1)hj−k
f (j) (a)
,
j!
ce qui entraı̂ne immédiatement que
m (k)
(k)
Rm
(a)−f (k) (a) = 0, (1 ≤ k ≤ m).
f,a (0) = f (a)−f (a) = 0, (Rf,a) (0) = f
Il suffit donc d’appliquer le lemme à Rm
f,a .
Exemples. 1. On a vu que, pour tout x ∈ R, (exp)$ (x) = exp x. En
conséquence, pour tout x ∈ R et tout k ∈ N∗ , on a (exp)(k)(x) = exp x. En
particulier, (exp)(k) (0) = exp 0 = 1 pour tout k ≥ 1 et dès lors, pour chaque
entier m ≥ 1 et chaque x ∈ R, on a
exp x =
m
$
xj
j=0
Rm
j!
+ Rm
exp,0 (x),
(x)
avec limx→0 exp,0
= 0.
xm
2. On a vu que, pour tout x ∈ ]0, +∞[, (ln)$ (x) = x1 . Dès lors, pour chaque
k ≥ 2, on a (ln)(k)(x) = (−1)k−1 (k−1)!
(le montrer par récurrence). En
xk
conséquence, pour chaque h ∈ ] − 1, +∞[, et chaque m ≥ 1, on aura (puisque
ln 1 = 0),
m
$
(−1)j−1
ln(1 + h) =
hj
+ Rm
ln,1 (h),
j
j=1
avec limh→0
7.3
Rm
(h)
ln,1
hm
= 0.
Calcul de limites et de dérivées
Le théorème de Young fournit un résultat pour le calcul de la limite du
quotient de deux fonctions d’une variable dans certains cas où la règle de
calcul de la limite d’un quotient et la règle de l’Hospital ne s’appliquent pas.
7.3. CALCUL DE LIMITES ET DE DÉRIVÉES
241
Proposition. Soit m ≥ 2 un entier, f une fonction de Rn dans Rp (resp. C)
et g une fonction de Rn dans R (resp. C) (m − 1)-fois dérivables en chaque
point d’un voisinage V de a ∈ R et m-fois dérivables en a. Si
f (a) = f $ (a) = . . . = f (m−1) (a) = 0,
g(a) = g $ (a) = . . . = g (m−1)(a) = 0,
et si
g (m)(a) /= 0,
alors
f
f (m) (a)
(x) = (m) .
x→a, x(=a g
g (a)
lim
Démonstration. Par le théorème de Young, on a, pour tout h ∈ (dom f ∩
dom g) − a,
f (m) (a)
f (a + h) = hm
+ Rm
f,a(h),
m!
g(a + h) = hm
g (m)(a)
+ Rm
g,a (h),
m!
et
Rm
Rm
f,a (h)
g,a (h)
=
0,
lim
= 0.
m
h→0
h→0
h
hm
Dès lors, pour tout h ∈ [(dom f ∩ dom g) − a] \ {0}, il vient
lim
f
(a + h) =
g
=
hm f (m) (a)
m!
hm g (m) (a)
m!
f (m) (a)
m!
g (m) (a)
m!
+
+
+ Rm
f,a (h)
+ Rm
g,a (h)
Rm
f,a (h)
hm
Rm
g,a (h)
hm
.
Par conséquent, la règle usuelle de passage à la limite dans un quotient
appliquée au second membre entraı̂ne que
f
f (a + h)
(x) = lim
x→a, x(=a g
h→0, h(=0 g(a + h)
lim
=
f (m) (a)
m!
lim
h→0, h(=0 g (m) (a)
m!
+
+
Rm
f,a (h)
hm
Rm
g,a (h)
hm
=
f (m)(a)
.
g (m)(a)
242
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Exemple. On a
(exp x − 1)3
= 1,
x→0
x3
lim
puisque, si f (x) = (exp x − 1)3 et g(x) = x3 , alors,
f $ (x) = 3(exp x − 1)2 , f $$ (x) = 6(exp x − 1), f $$$ (x) = 6 exp x,
g $ (x) = 3x2 , g $$ (x) = 6x, g $$$(x) = 6,
et dès lors
f (0) = f $ (0) = f $$ (0) = g(0) = g $ (0) = g $$(0) = 0,
f $$$ (0) = 6, g $$$(0) = 6.
Le théorème de Young fournit aussi un moyen rapide de calculer les
dérivées d’ordre supérieur de certaines fonctions. Pour chaque entier q ≥ 1
et chaque h /= 1, on a l’identité algébrique
q
$
1
hq+1
1 − hq+1
hq+1
hk +
=
+
=
.
1−h
1−h
1 − h k=0
1−h
Comme
hq+1
h
= lim
= 0,
q
h→0 (1 − h)h
h→0 1 − h
lim
%
on voit que qk=0 hk est le développement de Taylor d’ordre q de la fonction
1
f : x 2→ 1−x
en 0, et dès lors, puisque q est arbitraire, on a, pour chaque
entier j ∈ N∗ ,
f (j) (0) = j!.
D’ailleurs, l’identité ci-dessus entraı̂ne que, pour tout entier p ≥ 2 et tout
h /= 1, on a
q
$
1
hp(q+1)
kp
=
h
+
,
1 − hp
1 − hp
k=0
et
Comme
q
$
1
(−1)q+1 hp(q+1)
k kp
=
(−1)
h
+
.
1 + hp
1 + hp
k=0
hp(q+1)
= 0,
h→0 (1 ± hp )hqp
lim
243
7.4. RESTE DE TAYLOR DE FONCTIONS RÉELLES
%
q
1
1
kp
on voit que, si f (x) = 1−x
est le développement
p et g(x) = 1+xp ,
k=0 h
%q
k kp
de Taylor d’ordre qp de f en 0 et k=0 (−1) h est le développement de
Taylor d’ordre qp de g en 0. On en déduit aussitôt que
f (j) (0) = 0 si j n’est pas un multiple de p,
f (kp)(0) = (kp)!,
et
g (j)(0) = 0 si j n’est pas un multiple de p,
g (kp)(0) = (−1)k (kp)!.
7.4
Reste de Taylor de fonctions réelles
Le théorème de Cauchy permet de préciser l’expression du reste du développement de Taylor d’ordre m en a d’une fonction de R dans R m + 1-fois
dérivable sur un voisinage de a.
Le résultat le plus général dans cette direction est l’expression de
Schlömilch du reste du développement de Taylor.
Proposition. Soit m ≥ 1 un entier et f une fonction de R dans R (m + 1)fois dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= 0
tel que a + h ∈ I et g une fonction de R dans R continue sur I, dérivable
en chaque point intérieur à I et telle que g $ ne s’annule pas sur l’intervalle
ouvert joignant a et a + h. Alors il existe θ ∈ ]0, 1[ tel que
Rm
f,a (h)
2
g(a + h) − g(a)
=
g $ (a + θh)
3,
-
[(1 − θ)h]m f (m+1) (a + θh)
.
m!
Démonstration. Définissons la fonction F de R dans R par
m
F (y) = f (a + h) − Tf,y
(a + h − y).
F est définie sur I et, par construction,
m
F (a + h) = f (a + h) − Tf,a+h
(0) = f (a + h) − f (a + h) = 0,
m
F (a) = f (a + h) − Tf,a
(h) = Rm
f,a(h).
En outre, pour chaque y ∈ I, on a

m
$
$
f (j) (y) 
F $ (y) = −  (a + h − y)j
j!
j=0
244
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
=
m
$
j=1
=
(a + h − y)j−1
m−1
$
j=0
(a + h − y)j
m
$
f (j) (y)
f (j+1) (y)
−
(a + h − y)j
(j − 1)! j=0
j!
m
f (j+1)(y) $
f (j+1) (y)
−
(a + h − y)j
j!
j!
j=0
f (m+1) (y)
.
m!
Si nous appliquons le théorème de la moyenne Cauchy à F et g sur l’intervalle
d’extrémités a et a + h, nous obtenons un θ ∈ ]0, 1[ tel que
= −(a + h − y)m
[F (a + h) − F (a)]g $ (a + θh) = [g(a + h) − g(a)]F $(a + θh),
et dès lors tel que
Rm
f,a (h)
2
g(a + h) − g(a)
=
g $ (a + θh)
3,
-
[(1 − θ)h]m f (m+1) (a + θh)
.
m!
En choisissant convenablement la fonction g dans l’expression de Schlömilch, on obtient des expressions intéressantes du reste. La première, appelée expression de Lagrange du reste du développement de Taylor,
constitue une généralisation du théorème de Lagrange.
Corollaire. Soit m ≥ 1 un entier et f une fonction de R dans R (m+1)-fois
dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= a tel que
a + h ∈ I. Alors il existe un θ ∈ ]0, 1[ tel que
m+1
Rm
f,a (h) = h
f (m+1) (a + θh)
.
(m + 1)!
Démonstration. Il suffit de prendre g définie par g(y) = (a + h − y)m+1
dans l’expression de Schlömilch, ce qui donne
g(a + h) − g(a) = −hm+1 , g $ (a + θh) = −(m + 1)[(1 − θ)h)]m .
Le deuxième cas particulier s’appelle l’expression de Cauchy du reste
du développement de Taylor.
245
7.5. EXTRÉMANTS LOCAUX LIBRES
Corollaire. Soit m ≥ 1 un entier et f une fonction de R dans R (m+1)-fois
dérivable en chaque point d’un intervalle I de R. Soient a ∈ I, h /= a tel que
a + h ∈ I. Alors il existe un θ ∈ ]0, 1[ tel que
Rm
f,a (h) =
(1 − θ)m hm+1 f (m+1) (a + θh)
.
m!
Démonstration. Il suffit de prendre g définie par g(y) = a + h − y dans
l’expression de Schlömilch.
7.5
Extrémants locaux libres
L’expression de Lagrange du reste du développement de Taylor permet de
donner des conditions nécessaires et des conditions suffisantes pour qu’un
point soit maximant local libre ou minimant local libre d’une fonction de R
dans R.
Proposition. Soit m ≥ 2 un entier, f une fonction de R dans R m-fois
dérivable en chaque point d’un voisinage V d’un point a ∈ R, telle que f (m)
soit continue et différente de zéro en a et que
f $ (a) = f $$ (a) = . . . = f (m−1) (a) = 0.
Si m est impair, a n’est pas un extrémant local libre de f . Si m est pair et
si f (m)(a) > 0, alors a est un minimant local libre de f et si m est pair et
f (m) (a) < 0, alors a est un maximant local libre de f .
Démonstration. Soit r > 0 tel que [a − r, a + r] ⊂ V et tel que, pour tout
x ∈ [a−r, a+r], f (m) (x)f (m)(a) > 0 (c’est possible puisque f (m) est continue
en a et f (m) (a) /= 0). Soit h ∈ R tel que |h| ≤ r. En vertu des hypothèses
et de l’expression de Lagrange du reste du développement de Taylor d’ordre
m − 1 en a, il existe θ ∈ ]0, 1[ tel que
f (a + h) − f (a) = hm
f (m) (a + θh)
.
m!
Dès lors, si m est impair, f (a + h) − f (a) a un signe différent pour h < 0
et h > 0 et a n’est pas un extrémant local libre de f . Si m est pair, alors
pour tout h ∈ [−r, r], f (a + h) − f (a) a le signe de f (m) (a) et le résultat s’en
déduit aussitôt.
246
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Considérons maintenant le cas d’une fonction f de R dans R qui est mfois dérivable sur un voisinage V d’un point a quel que soit l’entier m ≥ 1.
Une telle fonction est appelée indéfiniment dérivable ou de classe C ∞ sur
V . Si a est un point critique de f et si toutes ses dérivées en a ne sont pas
nulles, la proposition précédente montre que l’examen de la première dérivée
non nulle en a permet de discuter complètement la nature du point critique.
Il n’en est pas de même si toutes les dérivées sont nulles en a. C’est ce que
montre l’étude de la fonction de Cauchy définie par
4
c(x) = exp −
1
x
5
si x > 0, c(x) = 0 si x ≤ 0.
Les propriétés de cette fonction résultent des lemmes suivants.
Lemme. Pour tout entier m ≥ 0, on a
4
5
= 0.
4
5
=0
1
1
exp −
x→0+ xm
x
lim
Démonstration. On a
1
1
exp −
x→0+ xm
x
lim
#
4
5#
# 1
1 #
⇔ (∀! > 0)(∃δ > 0)(∀x ∈ ]0, δ]) : ## m exp − ## ≤ !
x
x
#
#
# ym #
ym
# ≤ ! ⇔ lim
⇔ (∀! > 0)(∃ρ > 0)(∀y ≥ ρ) : ##
= 0.
y→+∞ exp(y)
exp(y) #
En appliquant m fois de suite la règle de L’Hospital, on trouve
lim
y→+∞
ym
my m−1
m!
= lim
= . . . = lim
= 0.
y→+∞ exp y
exp y y→+∞ exp y
Lemme. Pour chaque x > 0 et chaque entier m ≥ 1, c est m-fois dérivable
en x et
4 5
4
5
1
1
(m)
c (x) = P
exp −
,
x
x
où P est un polynôme tel que P (0) = 0.
Démonstration. Le résultat est vrai pour m = 1 puisque
c$ (x) =
4
5
1
1
exp −
.
2
x
x
247
7.5. EXTRÉMANTS LOCAUX LIBRES
Si, pour un entier 2 ≤ k ≤ m, on a
c
(k−1)
(x) = P
4 5
4
5
1
1
exp −
,
x
x
avec P un polynôme tel que P (0) = 0, alors
2
c(k) (x) = −
1 $
P
x2
4 5
1
1
+ 2P
x
x
4 53
1
x
4
exp −
1
x
5
=Q
4 5
4
5
1
1
exp −
,
x
x
avec Q(y) = y 2 [P (y) − P $ (y)] un polynôme tel que Q(0) = 0.
Lemme. Pour chaque m ∈ N∗ , c est m-fois dérivable en 0 et c(m)(0) = 0.
Démonstration. Procédons par récurrence sur m. On a évidemment
lim
x→0−
c(x) − c(0)
= 0,
x
et, par le premier lemme,
4
c(x) − c(0)
1
1
= lim exp −
x→0+
x→0+
x
x
x
lim
5
= 0,
ce qui montre que c$ (0) = 0. Supposons que, pour un entier k ≥ 2, on
ait c(k−1) (0) = 0. Comme c est identiquement nulle sur ] − ∞, 0], on aura
c(k−1) (x) = 0 pour tout x < 0, et dès lors
c(k−1)(x) − c(k−1) (0)
= 0.
x→0−
x
lim
D’ailleurs, par le lemme ci-dessus, on a, pour x > 0,
c
(k−1)
(x) = P
4 5
4
1
1
exp −
x
x
5
pour un certain polynôme P tel que P (0) = 0, et dès lors,
c(k−1) (x) − c(k−1)(0)
1
lim
= lim P
x→0+
x→0+ x
x
4 5
4
1
1
exp −
x
x
5
= 0,
en vertu du premier lemme. Donc c(k)(0) = 0, et le résultat s’en déduit.
248
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
En rassemblant les résultats des lemmes que nous venons de démontrer,
on voit que la fonction de Cauchy c est une fonction indéfiniment dérivable
sur R (ce qui entraı̂ne que chacune de ses dérivées est continue sur R) telle
que, pour tout entier k ≥ 0, on a c(k)(0) = 0. Comme par ailleurs c(x) ≥ 0
pour tout x ∈ R, 0 est un minimant de cette fonction. Par ailleurs, 0 est
un maximant pour la fonction −c, qui a aussi toutes ses dérivées nulles à
l’origine. Enfin, il est facile de vérifier que la fonction d définie par d(x) =
c(x) si x > 0, d(0) = 0 et d(x) = −c(x) si x < 0 a aussi toutes ses dérivées
nulles en 0 mais 0 n’est pas un extrémant local libre de d.
7.6
Séries
Soit f une fonction de R dans Rp et a ∈ dom f tel que f (k) (a) existe pour
chaque entier k ≥ 1. Pour chaque h ∈ R fixé et chaque entier q ≥ 0, on peut
q
considérer la valeur en h Tf,a
(h) du développement de Taylor d’ordre q de f
8
q
en a. On obtient ainsi une suite Tf,a
(h)
9
q∈N
dans Rp et, a priori, les cinq
possibilités
8
9suivantes peuvent se présenter :
q
1. Tf,a(h)
est divergente et a + h /∈ dom f − {a}.
2.
3.
9q∈N
q
Tf,a(h)
8
9q∈N
q
Tf,a
(h)
q∈N
8
est divergente et a + h ∈ dom f − {a}.
est convergente, a + h ∈ dom f − {a} et
q
lim Tf,a
(h) = f (a + h).
q→∞
8
q
4. Tf,a
(h)
9
q∈N
est convergente, a + h ∈ dom f − {a} et
q
lim Tf,a
(h) /= f (a + h).
q→∞
8
q
5. Tf,a
(h)
9
q∈N
est convergente et a + h /∈ dom f − {a}.
La situation 1 se présente pour la fonction f de R dans R définie par f (x) =
q
1
1−x pour laquelle on a vu plus haut que, pour chaque q ∈ N, Tf,0 (h) =
%
q
q
k
k=0 h . Dans ce cas, 1 /∈ dom f et Tf,0 (1) = q + 1. La situation 2 se
présente pour la même fonction f au point −1 ∈ dom f puisque, pour chaque
%
q
q ∈ N, on a Tf,0
(−1) = qk=0 (−1)k = 1 si q est pair et 0 si q est impair,
8
q
ce qui entraı̂ne la divergence de la suite Tf,0
(−1)
9
q∈N
. La situation 3 se
249
7.6. SÉRIES
présente pour la même fonction f en chaque h ∈ ] − 1, 1[, puisque, en un tel
point, on a, pour chaque q ∈ N,
q
f (h) =
$
1
hq+1
hk +
=
1 − h k=0
1−h
q
= Tf,0(h) +
ainsi qu’on l’a vu plus haut, et dès lors
hq+1
,
1−h
hq+1
= 0.
q→0 1 − h
q
lim [f (h) − Tf,0
(h)] = lim
q→∞
La situation 4 se présente pour la fonction de Cauchy c en a = 0 et h > 0.
q
En effet, on a vu que Tc,0
(h) = 0 pour tout h ∈ R, alors que c(h) /= 0 pour
tout h > 0. La situation 5 se présente pour la fonction f de R dans R définie
q
x−1
par f (x) = |x−1|
pour laquelle Tf,0 (h) = −1 pour tout q ∈ N et dès lors
8
q
Tf,0
(1)
9
q∈N
converge alors que 1 /∈ dom f.
Pour trouver des conditions sur f sous lesquelles la situation83 se présente,
9
q
il convient donc au prélable d’étudier la convergence de la suite Tf,a
(h)
.
q∈N
On voit que chaque élément de cette suite s’obtient à partir du précédent
en ajoutant un terme : il s’agit donc d’une suite de sommes dont le nombre
de terme augmente indéfiniment. De telles suites se sont présentées très tôt
dans l’histoire des mathématiques en tant que détermination de la “somme
d’une infinité de nombres réels”. Il s’agit là d’une opération impossible pour
l’arithmétique ou l’algèbre, mais on peut, conformément à la philosophie de
l’analyse, chercher à la réaliser de manière approchée avec une erreur aussi
petite que l’on veut.
Définition. Soit (ak )k∈N une suite dans Rp. Pour chaque q ∈ N, définissons
%
la q e somme partielle de (ak )k∈N par Aq = qk=0 ak . On appelle série de
termes ak la suite (Aq )q∈N des sommes partielles de (ak )k∈N; on la note
%
k∈N ak pour rappeler son mode de construction en fonctions des données
ak .
%
Exemples. 1. k∈N 1 est la suite (q + 1)q∈N, puisque, pour chaque q ∈ N,
k=0 1 = q + 1.
8
9
%
(−1)q +1
k
2.
(−1)
est
la
suite
, puisque, pour chaque q ∈ N,
k∈N
2
%q
%q
k=0 (−1)
q∈N
k
= 1 si q est pair et 0 si q est impair.
250
3.
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
%
k∈N k est la suite
q(q+1)
2 .
8
9
q(q+1)
2
q∈N
%
4. Pour chaque a ∈ C \ {1},
k∈N
%q
puisque, pour chaque q ∈ N,
ak est la suite
q+1
8
9
1−aq+1
,
1−a
q∈N
%q
k=0
k =
puisque, pour
chaque q ∈ N, k=0 ak = 1−a
1−a . On l’appelle la série géométrique de raison
a.
8
9
%
1
5. k∈N (k+1)(k+2)
est la suite q+1
puisque, pour chaque q ∈ N,
q+2
q∈N
q
$
q
4
$
1
1
1
=
−
(k
+
1)(k
+
2)
k
+
1
k
+
2
k=0
k=0
=1−
5
=
q
$
q+1
$ 1
1
−
k + 1 k=1 k + 1
k=0
1
q+1
=
.
q+2
q+2
Définition. Si la suite (Aq )q∈N converge vers A ∈ Rp , dit que la série
ou est convergente et a pour somme A. Dans ce cas, on
k∈N ak converge
%∞
%
pose A = k=0 ak . Si la suite (Aq )q∈N diverge, on dit que la série k∈N ak
diverge ou est divergente.
%
Le mot “somme” n’a évidemment plus ici l’acception courante; c’est tout
simplement, si elle existe, la limite des sommes partielles Aq lorsque q tend
vers l’infini.
%
%
%
Exemples. Les séries k∈N 1, k∈N (−1)k et k∈N k des exemples 1 à 3 sont
%
divergentes. La série géométrique k∈N ak de l’exemple 4 converge et a pour
1
somme 1−a
lorsque |a| < 1, puisque, dans ce cas, aq → 0 lorsque q → ∞.
%
1
Nous verrons plus loin qu’elle diverge si |a| ≥ 1. La série k∈N (k+1)(k+2)
de
l’exemple 5 converge et a pour somme 1.
Les remarques suivantes sont des conséquences immédiates de la définition.
%
Remarques. 1. Soit k∈N ak une série dans Rp et, pour m ≥ 1 entier fixé,
%
soit k∈N am+k la série obtenue à partir de la précédente en laissant tomber
ses m premiers termes a0 , a1 , . . . , am−1 . Comme les sommes partielles de
même indice de ces deux séries diffèrent toutes de la quantité constante
%
Am−1 = m−1
deux séries convergent ou divergent
k=0 ak , il est clair que les
%
%
simultanément. Pour m = 1, la série k∈N a1+k est souvent notée k∈N∗ ak .
%
%
1
1
Ainsi, la série k∈N (k+1)(k+2)
s’écrit également k∈N∗ k(k+1)
.
%
2. Par définition, la série k∈N ak est la suite (Aq )q∈N. Réciproquement, à
%
toute suite (bk )k∈N dans Rp on peut associer la série télescopique k∈N (bk −
251
7.6. SÉRIES
bk−1 ) (avec la convention b−1 = 0) dont les sommes partielles
q
$
k=0
(bk − bk−1 ) =
q
$
k=0
bk −
q−1
$
bk = bq
k=0
redonnent les termes de la suite de départ.
Les règles de calcul des limites et les règles de l’algèbre élémentaire fournissent immédiatement les règles de calcul suivantes des séries dans Rp .
%
%
Proposition. Soient k∈N ak et k∈N bk des séries dans Rp et soit c ∈ R.
%
%
1. Si k∈N ak converge et a pour somme A et k∈N bk converge et a pour
%
somme B, alors k∈N (ak + bk ) converge et a pour somme A + B.
%
%
2. Si k∈N ak converge et a pour somme A, alors k∈N cak converge et a
pour somme cA.
%
3.
a converge et a pour somme A si et seulement si les p séries réelles
% k∈N k
(a
et ont pour sommes respectives Aj (1 ≤ j ≤ p).
k∈N k )j convergent%
%
4. Si les séries réelles k∈N ak et k∈N bk convergent respectivement vers A
et B et sont telles que, pour chaque k ∈ N, on a ak ≤ bk , alors A ≤ B.
Ces règles de calcul généralisent aux séries des règles de calcul élémentaires pour les sommes finies. Certaines règles de calcul des sommes finies,
comme l’associativité ou la commutativité, ne s’étendent pas aux séries.
%
Ainsi, la série k∈N (−1)k est divergente (on l’a vu plus haut), alors que la
série qui s’en déduit en groupant deux à deux les termes consécutifs est la
série de termes nuls, qui est évidemment convergente. Nous donnerons plus
loin une classe de séries que l’on peut faire converger vers n’importe quel
réel en permutant les termes.
On dispose d’une condition nécessaire de convergence d’une série
facile à vérifier.
Proposition. Si la série
(ak )k∈N a pour limite zéro.
%
k∈N
ak converge, alors la suite de ses termes
Démonstration. Soit A la somme de la série
q ∈ N∗ , on a
aq =
q
$
k=0
et dès lors
ak −
q−1
$
k=0
%
k∈N ak .
ak = Aq − Aq−1 ,
lim aq = lim Aq − lim Aq−1 = A − A = 0.
q→∞
q→∞
q→∞
Pour chaque
252
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Cette condition n’est pas suffisante pour la convergence d’une série. Ainsi, la suite des termes de la série
$
k∈N
1
1
(k + 1) 2
tend vers zéro mais, pour chaque q ∈ N, on a
q
$
k=0
1
(k + 1)
≥
1
2
q
$
k=0
1
1
(q + 1)
1
2
= (q + 1) 2 ,
et la suite des sommes partielles diverge. La forme contraposée de cette
condition nécessaire fournit un moyen aisé de vérification de la divergence
de certaines séries. Ainsi, lorsque |a| ≥ 1, la série géométrique de raison a
diverge puisque la suite de ses termes (ak )k∈N ne converge pas vers zéro en
vertu du fait que (|ak |)k∈N = (|a|k )k∈N ne converge pas vers zéro.
Le critère de Cauchy de convergence d’une suite fournit immédiatement
le critère de Cauchy de convergence d’une série.
Proposition. La série dans Rp
%
k∈N ak
converge si et seulement si
#
#
# $
#
# r
#
(∀! > 0)(∃m ∈ N)(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : ##
ak ## ≤ !.
#k=q+1 #
2
%
Démonstration. La convergence de la série k∈N ak équivaut, par définition, à la convergence de la suite (Aq )k∈N de ses sommes partielles. En
appliquant le critère de Cauchy à cette suite et en notant qu’on peut toujours,
sans perte de généralité, y supposer que r > q, on trouve que (Aq )k∈N
converge si et seulement si
(∀! > 0)(∃m ∈ N)(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : |Ar − Aq |2 ≤ !,
ce qui fournit la thèse puisque
Ar − Aq =
r
$
k=0
ak −
q
$
k=0
%
ak =
r
$
ak .
k=q+1
%
1
Exemples. 1. La série harmonique k∈N k+1
= k∈N∗
En effet, par le critère de Cauchy, il suffit de montrer que
1
k
(∃! > 0)(∀m ∈ N)(∃q ∈ N : q ≥ m)(∃r ∈ N : r > q ≥ m) :
est divergente.
r
$
1
k=q+1
k
> !.
253
7.7. SÉRIES ABSOLUMENT CONVERGENTES
En prenant, pour chaque m ∈ N∗ , q = m et r = 2m, on a
2m
$
k=m+1
2m
$
1
1
m
1
1
≥
=
= > ,
k k=m+1 2m
2m
2
4
et la négation du critère de Cauchy est satisfaite pour ! = 14 .
%
k
2. La série harmonique alternée k∈N (−1)
k+1 =
gente. En effet, pour tout entier q > r, on a
#
#
# $
#
# r (−1)k #
#
#
#
#
#k=q+1 k + 1 #
%
k∈N∗
(−1)k−1
k
est conver-
#
#
#r−q−1
r−q−1
j ##
$
# $
(−1)
(−1)j
#=
= ##
.
#
q+1+j
# j=0 q + 1 + j #
j=0
Dès lors, si r − q est impair, on a
#
#
# r
#
5
(r−q−1)/2 4
$
# $ (−1)k #
1
1
1
#
#= 1 −
≤
−
,
#
#
q+1
q
+
2l
q
+
2l
+
1
q
+
1
#k=q+1 k + 1 #
l=0
et, si r − q est pair, on a
#
#
# r
#
5
(r−q−2)/2 4
$
# $ (−1)k #
1
1
1
1
#
#= 1 −
− ≤
−
.
#
#
k
+
1
q
+
1
q
+
2l
q
+
2l
+
1
r
q
+
1
#k=q+1
#
l=0
Dès lors, si ! > 0 est donné, il suffit de prendre m ≥
condition de Cauchy soit satisfaite.
7.7
1
!
− 1 pour que la
Séries absolument convergentes
Le critère de Cauchy fournit une importante condition suffisante de convergence d’une série dans Rp .
%
Proposition. Soit k∈N ak une série dans Rp . Si, pour j = 1, 2 ou ∞, la
%
%
série à termes positifs k∈N |ak |j converge, alors k∈N ak converge et
#∞
#
∞
#$ #
$
#
#
ak # ≤
|ak |j .
#
#
#
k=0
j
k=0
254
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
%
Démonstration. Il suffit de vérifier que k∈N ak vérifie le critère de
Cauchy. Pour tout r > q dans N, on a, si j = 1, 2 ou ∞, en vertu de
l’inégalité triangulaire,
#
#
# r
#
r
$
# $
#
#
ak ## ≤
|aj |j .
#
#k=q+1 #
k=q+1
j
D’autre part, en vertu du critère de Cauchy de convergence de
si ! > 0 est donné, il existe m ∈ N tel que
(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) :
r
$
k=q+1
%
k∈N
|ak |j ,
|ak |j ≤ !,
ce qui entraı̂ne aussitôt, par l’inégalité précédente, que
#
#
# r
#
# $
#
#
(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) : #
ak ## ≤ !.
#k=q+1 #
j
%
Donc k∈N ak converge et, en faisant tendre r vers l’infini dans l’inégalité
ci-dessus, on trouve facilement
#∞
#
∞
#$ #
$
#
#
ak # ≤
|ak |j .
#
#
#
k=0
j
k=0
%
Remarque. Nous montrerons plus loin que la série k∈N ak peut converger
%
sans que k∈N |ak |j converge. La condition ci-dessus n’est donc pas une
condition nécessaire de convergence. On est ainsi conduit à séparer les séries
%
convergentes en deux classes, selon que k∈N |ak |j converge ou diverge.
%
%
Définition. Soit k∈N ak une série dans Rp. On dit que k∈N ak con%
verge absolument ou est absolument convergente si k∈N |ak |2 converge. Si
%
%
%
k∈N ak converge et que
k∈N |ak |2 diverge, on dit que
k∈N ak converge
non absolument ou converge simplement.
Remarque. En utilisant les inégalités entre normes et le critère de Cauchy,
on vérifie sans peine que la définition de convergence absolue est indépendante du choix particulier de la norme | · |2 .
Exemples. 1. Toute série convergente à termes positifs est évidemment
absolument convergente.
255
7.7. SÉRIES ABSOLUMENT CONVERGENTES
%
k
2. La série harmonique alternée k∈N (−1)
k+1 est convergente mais la série de
%
1
ses valeurs absolues k∈N k+1
est la série harmonique qui est divergente. La
série harmonique alternée converge donc non absolument.
La convergence d’une série absolument convergente et la valeur de sa
somme ne dépendent pas de l’ordre dans lequel on prend les termes.
%
Proposition. Soit k∈N ak une série dans Rp absolument convergente et
%
soit b : N → N une bijection. Alors la série k∈N ab(k) converge vers la même
somme.
%
Démonstration. Soit ! > 0; par le critère de Cauchy appliqué à la série
k∈N |ak |2 , il existe m ∈ N tel que
(∀q ∈ N : q ≥ m)(∀r ∈ N : r > q ≥ m) :
r
$
k=q+1
|ak |2 ≤
!
.
2
Choissons M ∈ N tel que
{0, 1, . . ., m} ⊂ {b(0), b(1), . . ., b(M )}
(par exemple M = max{b−1 (j) : 1 ≤ j ≤ m}). Pour tout entier q ≥ M,
l’expression
q
$
k=0
ak −
q
$
ab(k)
k=0
ne contiendra pas les termes a0 , a1 , . . . , am (puisqu’ils sont communs aux
deux sommes), et dès lors, si q ≥ M ,
# q
#
q
#$
#
$
#
#
ak −
ab(k) # ≤
#
#
#
k=0
k=0
2
q
$
k=m+1
On en déduit que
lim
q→∞
et donc que
%
k∈N ab(k)
|ak |2 +
&
Aq −
$
{1≤k≤q : b(k)>m}
q
$
ab(k)
k=0
converge vers
%∞
k=0
'
|ab(k) |2 ≤
!
!
+ = !.
2 2
= 0,
ak .
La convergence absolue d’une série dans Rp revient à l’étude de la convergence d’une série à termes positifs. On possède une intéressante condition
nécessaire et suffisante de convergence d’une série à termes positifs.
256
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
%
%
Proposition. Soit k∈N ak une série à termes positifs. Alors k∈N ak converge si et seulement si la suite (Aq )q∈N de ses sommes partielles est majorée,
auquel cas
∞
$
ak = sup Aq .
q∈N
k=0
Démonstration. Pour chaque q ∈ N, on a
Aq+1 = Aq + aq+1 ≥ Aq ,
ce qui montre que (Aq )q∈N est croissante. La thèse résulte alors de la condition nécessaire et suffisante de convergence d’une suite croissante vue au
chapitre précédent.
Remarque. La Proposition précédente montre que si l’on regroupe d’une
façon arbitraire les termes d’une série absolument convergente, on obtient
encore une série absolument convergente.
%
%
1
1
Exemple. La série k∈N (k+1)
2 =
k∈N∗ k2 est convergente. En effet, pour
chaque q ∈ N, on a
q
$
q
q
4
$
$ 1
1
1
1
≤
1
+
=
1
+
−
2
(k
+
1)
k(k
+
1)
k
k
+
1
k=0
k=1
k=1
5
= 1+1−
1
≤2
q +1
et la suite des sommes partielles est majorée par 2.
La condition précédente fournit une utile condition suffisante de convergence absolue.
%
Proposition. Soit k∈N ak une série dans Rp . S’il existe un entier m ≥ 0
tel que, pour tout k ≥ m, on ait
1
|ak+1 |2 ≤ |ak |2 ,
2
%
alors k∈N ak converge absolument.
Démonstration. Si k ≥ 0, on a
1
|am+k |2 ≤ |am+k−1 |2 ≤ . . . ≤
2
et dès lors, pour tout q ∈ N, on a
q
$
k=0
|am+k |2 ≤ |am |2
q 4 5k
$
1
k=0
2
= |am |2
4 5k
1
2
1−
|am |2 ,
8 9q+1
1
2
1−
1
2
≤ 2|am |2 ,
%
ce qui montre que la suite des sommes partielles de la série k∈N |am+k |2
%
est majorée. Donc k∈N am+k converge absolument et il en est de même de
%
k∈N ak .
257
7.8. SÉRIES NON ABSOLUMENT CONVERGENTES
%
k
Exemple. Pour chaque z ∈ C, la série exponentielle de z k∈N zk! (ainsi
appelée parce que, pour z réel, ses sommes partielles sont les valeurs en z
des développements de Taylor en 0 d’ordres successifs de la fonction exponentielle) converge absolument. En effet, pour tout k ∈ N, on a
#
#
# z k+1 #
|z|k+1
|z| |z|k
1
#
#
=
≤
#
#=
# (k + 1)! #
(k + 1)!
k + 1 k!
2
dès que k ≥ 2|z| − 1.
7.8
Soit
# #
# zk #
# #
# #
# k! #
Séries non absolument convergentes
%
k∈N
ak une série réelle. Pour chaque k ∈ N, posons
a+
k = max{ak , 0} =
|ak | + ak
,
2
a−
k = max{−ak , 0} = − min{ak , 0} =
|ak | − ak
.
2
−
Il en résulte aussitôt que, pour chaque k ∈ N, on a ak = a+
k − ak et |ak | =
−
+
a+
k + ak . La suite (ak )k∈N constitue donc la suite des termes positifs de
(ak )k∈N et la suite formée des a−
k non nuls constitue la suite des opposés des
termes strictement négatifs de (ak )k∈N . On a une intéressante condition
nécessaire de convergence non absolue d’une série réelle.
Proposition. Si la série réelle
%
+
−
k∈N ak et
k∈N ak divergent.
%
%
k∈N ak
converge non absolument, alors
%
Démonstration. Si, par exemple, k∈N a+
(l’autre cas se traik converge
%
−
+
tant de même), alors, comme ak = ak − ak , la série k∈N a−
k converge et,
%
−
puisque |ak | = a+
+
a
,
il
en
sera
de
même
de
|a
|,
en
contradiction
k
k∈N
k
k
avec l’hypothèse.
La propriété précédente permet de montrer qu’on peut faire diverger une
série réelle non absolument convergente en permutant l’ordre de ses termes.
%
Proposition. Si la série réelle k∈N ak converge non absolument, alors il
%
existe une permutation b : N → N telle que k∈N ab(k) diverge.
Démonstration. Par la Proposition précédente, les séries à termes posi%
%
−
tifs k∈N a+
lors, par la caractérisation donnée
k∈N ak divergent et dès
k et
%
%q
−
avant, les suites de sommes partielles ( qk=0 a+
k )q∈N et ( k=0 ak )q∈N ne sont
258
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
pas majorées. Effectuons la permutation suivante des termes ak de la série;
retenons d’abord, dans l’ordre des indices, les termes positifs jusqu’à ce que
leur somme soit supérieure ou égale à 1; prenons alors le premier terme
strictement négatif; retenons alors, toujours dans l’ordre des indices, suffisamment de termes positifs non encore utilisés pour que leur somme soit
supérieure ou égale à 2; prenons alors le deuxième termes strictement négatif,
et continuons de la sorte. On obtient ainsi une permutation b : N → N telle
%
que la suite des sommes partielles ( qk=0 ab(k) )q∈N contient une sous-suite
dont le ke terme est supérieur à k, ce qui entraı̂ne sa divergence.
Remarques. 1. Un raffinement du raisonnement précédent a été utilisé
dans un travail de Bernhard Riemann publié en 1868 pour montrer que, si
%
alors, pour chaque
k∈N ak est une suite réelle qui converge non absolument,
%
A ∈ R, il existe une permutation b : N → N telle que k∈N ab(k) converge
vers A. Il suffit de remplacer, dans la démonstration précédente, 1, 2, . . . par
A et de tenir compte du fait que la suite des ak converge vers zéro.
2. En rapprochant le résultat précédent de la propriété de conservation de
convergence d’une série absolument convergente après permutation de ses
termes, on voit qu’une série réelle est absolument convergente si et seulement
si toute série obtenue en permutant ses termes est convergente.
7.9
Série de Taylor
Soit f une fonction de R dans Rp et a ∈ dom f tel que f (k) (a) existe pour
chaque k ∈ N, et soit h ∈ R.
Définition. On appelle valeur en h de la série de Taylor de f en a, la série
dans Rp
$
f (k) (a)
hk
,
k!
k∈N
c’est-à-dire la série dont les sommes partielles sont les valeurs en h des
q
développements de Taylor Tf,a
.
On a vu précédemment que cette série pouvait être convergente ou divergente, et, dans le cas de la convergence, sa somme pouvait être égale
à f (a + h) ou différente de f (a + h). La formule du reste de Lagrange va
nous permettre de donner une condition suffisante de convergence de
la série de Taylor d’une fonction réelle vers cette fonction.
Proposition. Soit f une fonction de R dans R, a ∈ dom f et r > 0, C ≥
0, M ≥ 0 tels que f (k) (x) existe pour chaque k ∈ N et chaque x ∈ ]a − r, a + r[
259
7.9. SÉRIE DE TAYLOR
et y vérifie l’inégalité
|f (k) (x)| ≤ CM k .
Alors, pour chaque h ∈ ] − r, r[, la valeur en h de la série de Taylor de f en a
$
hk
k∈N
converge vers f (a + h). En outre,
%
f (k) (a)
k!
k∈N
hk f
(k) (a)
k!
converge absolument.
Démonstration. Par la formule de Lagrange du reste du développement
de Taylor de f en a, on a, pour chaque q ∈ N et chaque h ∈ ] − r, r[,
f (a + h) −
q
$
hk
k=0
f (k) (a)
hq+1 f (q+1) (a + θq h)
=
,
k!
(q + 1)!
pour un certain θq ∈ ]0, 1[. En conséquence, on a
#
#
q
#
(k)
$
(a) ##
(M |h|)q+1
(M r)q+1
#
kf
h
≤C
,
#f (a + h) −
#≤C
#
k! #
(q + 1)!
(q + 1)!
k=0
et, puisque la série exponentielle
tend vers zéro et
%
k∈N
hk f
(k) (a)
k!
r > q, on a
%
kf
k∈N h
(k) (a)
k!
%
k∈N
(M r)k
k!
converge, la suite de ses termes
converge vers f (a + h). Pour montrer que
converge absolument, il suffit de noter que, pour tout entier
r
$
k=q+1
|h|k
r
$
|f (k) (a)|
(M r)k
≤C
,
k!
k!
k=q+1
et que, si ! > 0 est donné, la convergence absolue de la série exponentielle entraı̂ne l’existence d’un entier positif m tel que le second membre soit inférieur
à ! si r > q ≥ m.
Exemple. Puisque, r > 0 étant donné, on a, pour tout x ∈ ] − r, r[ et tout
entier k ≥ 0,
(exp)(k) (x) = exp x ≤ exp r,
on peut prendre C = exp r et M = 0 dans la Proposition précédente et en
conclure que, pour tout h ∈ ] − r, r[,
exp h =
∞
$
hk
k=0
k!
.
Comme r est arbitraire, cette égalité entre la valeur en h de la fonction
exponentielle et la somme de la série exponentielle de h est valable pour
tout h ∈ R.
260
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Définition. Soit f une fonction de R dans R, a ∈ int dom f , tels que, pour
chaque k ∈ N, f (k) (a) existe. On dit que f est analytique en a s’il existe
r > 0 tel que ]a − r, a + r[ ⊂ dom f et tel que, pour tout h ∈ ] − r, r[, on ait
f (a + h) =
∞
$
hk
k=0
f (k) (a)
.
k!
Ainsi, la fonction exponentielle est analytique en chaque point de R, mais
la fonction de Cauchy n’est pas analytique en 0.
7.10
Fonctions trigonométriques
Pour chaque x ∈ R, considérons les séries
$ (−1)k x2k+1
k∈N
et
(2k + 1)!
$ (−1)k x2k
k∈N
(2k)!
.
Puisque, pour tout k ∈ N, on a
et
#
#
#
#
# (−1)k+1 x2(k+1)+1 #
# (−1)k x2k+1 #
|x|2
#
#
#
#
#
#=
#
#,
# (2(k + 1) + 1)! #
#
(2k + 2)(2k + 3) (2k + 1)! #
#
#
#
#
# (−1)k+1 x2(k+1) #
# (−1)k x2k #
|x|2
#
#
#
#
#
#=
#
#,
# (2(k + 1)! #
(2k + 1)(2k + 2) # (2k)! #
et qu’il existe un entier positif m tel que
|x|2
|x|2
1
≤
≤
(2k + 2)(2k + 3)
(2k + 1)(2k + 2)
2
pour tout entier k ≥ m, on peut appliquer une condition suffisante donnée
plus haut pour conclure à la convergence absolue de ses deux séries. On pose
alors
∞
$
(−1)k x2k+1
sin x =
,
(2k + 1)!
k=0
261
7.10. FONCTIONS TRIGONOMÉTRIQUES
et
cos x =
∞
$
(−1)k x2k
k=0
(2k)!
,
ce qui définit respectivement sur R l’application sinus et l’application cosinus, qui sont les fonctions trigonométriques fondamentales. En particulier,
on a sin 0 = 0 et cos 0 = 1, et, pour chaque x ∈ R,
sin(−x) = − sin x, cos(−x) = cos x.
Proposition. Pour chaque x ∈ R, sin et cos sont dérivables en x et
(sin)$ (x) = cos x, (cos)$ (x) = − sin x.
Démonstration. Soit x ∈ R et q ∈ N; considérons, pour fixer les idées,
le cas de sin, l’autre se traitant de manière similaire. Posons, pour chaque
x ∈ R et chaque q ∈ N∗ ,
Sq (x) =
q
$
(−1)k x2k+1
k=0
et
Cq (x) =
q
$
(−1)k x2k
k=0
Un calcul simple montre que
(2k + 1)!
(2k)!
,
.
Sq$ (x) = Cq (x), Sq$$(x) = −Sq−1 (x).
Par la formule de Lagrange du reste du développement de Taylor, il existe,
pour chaque h ∈ R, et chaque q ∈ N∗ , un θq ∈ ]0, 1[ tel que
Sq (x + h) − Sq (x) = hSq$ (x) +
h2 $$
S (x + θq h),
2! q
et dès lors tel que, si h /= 0,
Sq (x + h) − Sq (x)
h
= Cq (x) − Sq−1 (x + θq h).
h
2
On a
lim
q→∞
Sq (x + h) − Sq (x)
sin(x + h) − sin x
=
,
h
h
262
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
et
lim Cq (x) = cos x,
q→∞
ce qui entraı̂ne que, pour chaque h /= 0,
L(x, h) = lim
q→∞
4
5
1
sin(x + h) − sin x cos x
− Sq−1 (x + θq h) =
−
.
2
h2
h
D’autre part, pour chaque q ∈ N∗ et chaque h tel que |h| ≤ 1, on a
|Sq−1 (x + θq h)| ≤
q−1
$
2q−1
$ (|x| + 1)j
(|x| + |h|)|2k+1
≤
≤ exp(|x| + 1),
(2k + 1)!
j!
j=0
k=0
et dès lors, pour ces mêmes valeurs de h, on a
|L(x, h)| ≤ exp(|x| + 1).
En conséquence, pour tout 0 < |h| ≤ 1, on a
#
#
# sin(x + h) − sin x
#
#
# = |hL(x, h)| ≤ |h| exp(|x| + 1),
−
cos
x
#
#
h
ce qui montre que
sin(x + h) − sin x
= cos x.
h→0
h
lim
Les résultats suivants sont des conséquences de la proposition précédente.
Les deux premiers sont immédiats.
Corollaire. sin et cos sont continues en chaque x ∈ R.
Corollaire. Pour chaque x ∈ R et chaque entier k ≥ 1, sin(k) (x) et cos(k) (x)
existent et, si l ∈ N∗ ,
(sin)(2l)(x) = (−1)l sin x, (sin)(2l−1)(x) = (−1)l−1 cos x,
(cos)(2l)(x) = (−1)l cos x, (cos)(2l−1)(x) = (−1)l sin x,
et les fonctions sin et cos sont analytiques en chaque point de R.
7.10. FONCTIONS TRIGONOMÉTRIQUES
263
Corollaire. Pour tout x ∈ R, on a
sin2 x + cos2 x = 1.
Démonstration. Définissons l’application f de R dans R par f (x) =
sin x + cos2 x (avec sin2 x = (sin x)2 , cos2 x = (cos x)2 ). f est évidemment
dérivable en chaque point x ∈ R et
2
f $ (x) = 2 sin x cos x − 2 cos x sin x = 0.
En conséquence, f est constante sur R et, en particulier, pour tout x ∈ R,
on a
f (x) = f (0) = 1.
Ce Corollaire entraı̂ne en particulier que, pour tout x ∈ R, on a
| sin x| ≤ 1, | cos x| ≤ 1.
Corollaire. Pour tout x ∈ R et tout y ∈ R, on a
sin(x + y) = sin x cos y + cos x sin y,
cos(x + y) = cos x cos y − sin x sin y.
Démonstration. y ∈ R étant fixé, définissons l’application f de R dans
R par
f (x)
= [sin(x+y)−sin x cos y −cos x sin y]2 +[cos(x+y)−cos x cos y +sin x sin y]2 .
Cette fonction est évidemment dérivable en tout x ∈ R, et l’on a
f $ (x)
= 2[sin(x + y) − sin x cos y − cos x sin y][cos(x + y) − cos x cos y + sin x sin y]
+2[cos(x + y) − cos x cos y + sin x sin y][− sin(x + y) + sin x cos y + cos x sin y]
= 0.
Donc f est constante sur R, et en particulier, pour tout x ∈ R, on a
f (x) = f (−y) = (0 + sin y cos y − cos y sin y)2 + (1 − cos2 y − sin2 y) = 0,
ce qui entraı̂ne aussitôt la thèse.
264
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Ce dernier résultat est appelé la formule d’addition pour les fonctions trigonométriques.
Etudions maintenant les zéros des fonctions trigonométriques.
Proposition. Il existe un réel π > 0 tel que
cos x = 0 ⇔ x =
π
+ kπ, (k ∈ Z),
2
sin x = 0 ⇔ x = kπ, (k ∈ Z),
sin(x + π) = − sin x, cos(x + π) = − cos x, (x ∈ R).
Démonstration. On sait que cos 0 = 1 > 0. D’autre part, en utilisant
la formule du reste de Lagrange du développement de Taylor, pour chaque
x ∈ R, il existe θ ∈ ]0, 1[ tel que
cos x = 1 −
x 2 x4
+
cos θx,
2!
4!
et dès lors
2
1
cos 2θ ≤ − < 0.
3
3
Le théorème de Bolzano entraı̂ne alors l’existence d’au moins un zéro dans
]0, 2[. L’ensemble Z de ces zéros est fermé, car si (ak )k∈N est une suite dans
Z convergeant vers a∗ ∈ R, alors a∗ ∈ [0, 2], et les relations
cos 2 = 1 − 2 +
cos ak = 0, (k ∈ N),
et la continuité de cos entraı̂nent que cos a∗ = 0, et donc a∗ ∈ Z. Par
ailleurs, si a ∈ [0, 2] est un zéro de cos, alors (cos)$ (a) = − sin a = ±1,
et, par continuité, il existe δ(a) > 0 tel que (cos)$ (x) /= 0 pour tout x ∈
[a − δ(a), a + δ(a)]. En conséquence, cos est injective sur [a − δ(a), a + δ(a)]
et a est donc le seul zéro de cos dans [a − δ(a), a + δ(a)]. Le lemme de
Cousin
appliqué à Z et à la jauge δ entraı̂ne l’existence d’une famille finie
A j j B
(a , Z ) 1≤j≤m telle que
Z=
m
>
j=1
Z j , aj ∈ Z j ⊂ [aj − δ(aj ), aj + δ(aj )], (1 ≤ j ≤ m).
Il en résulte que cos possède m zéros sur [0, 2]. Désignons par π2 le plus
petit zéro de cos appartenant à ]0, 2[. Comme cos 0 = 1 > 0, on a, par
le théorème de Bolzano, cos x > 0 pour tout x ∈ [0, π2 [, et donc pour tout
265
7.10. FONCTIONS TRIGONOMÉTRIQUES
x ∈ ] − π2 , π2 [ puisque cos(−x) = cos x. Il en résulte que la fonction sin est
strictement croissante sur ] − π2 , π2 [, et donc strictement négative sur ] − π2 , 0[
et strictement positive sur ]0, π2 [, puisque sin 0 = 0. En conséquence, comme
sin2 π2 = 1, on doit avoir
4
− sin −
π
2
5
= sin
π
= 1.
2
La formule d’addition entraı̂ne alors que, pour tout x ∈ R, on a
4
cos x +
π
2
5
= − sin x,
4
sin x +
π
2
5
= cos x, (x ∈ R)
3π
ce qui montre que cos x < 0 pour tout x ∈ ] π2 , 3π
2 [, cos 2 = 0, sin x > 0 pour
π
tout x ∈ ] 2 , π[ et que sin π = 0. On déduit alors de la formule ci-dessus que,
pour tout x ∈ R, on a
4
π π
sin(x + π) = sin x + +
2
2
4
cos(x + π) = cos x +
π π
+
2
2
5
5
4
π
= cos x +
2
4
= − sin x +
5
π
2
= − sin x,
5
= − cos x,
ce qui, combiné avec les propriétés de sin sur [−π, π] et de cos sur [− π2 , π2 ],
achève la démonstration.
Remarques. 1. Le résultat précédent entraı̂ne évidemment que, pour tout
x ∈ R, on a
sin(x + 2π) = sin x, cos(x + 2π) = cos x,
c’est-à-dire que les fonctions trigonométriques sont périodiques de période
2π.
2. Le réel π ainsi introduit se rencontre dans de très nombreuses questions de
mathématique. Johann Lambert a montré en 1767 que π était irrationnel,
Adrien-Marie Legendre a montré en 1794 que π 2 l’était aussi. Il a fallu attendre 1882 pour que Ferdinand Lindemann prouve que π était un nombre
transcendant, c’est-à-dire qu’il n’était pas racine d’une équation algébrique à
coefficients entiers, prouvant ainsi l’impossibilité de la quadrature du cercle.
3. Le calcul des décimales de π peut servir de mesure du progrès des
mathématiques et de la science du calcul. Le Livre des Rois de l’Ancien
Testament fournit π = 3, Archimède, au 3e siècle avant J.C. fournit 3
décimales exactes
π = 3, 141 . . ..
266
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
En 1593, le record était détenu par un professeur de l’Université de Louvain,
Adriaen van Roomen ou Romain, avec 15 décimales exactes. En 1873-74,
William Shanks calcula 707 décimales de π et il fallut attendre 1945 pour
que D.F. Ferguson montre que le calcul de Shanks était faux à partir de
la 528e décimale. On entre alors dans l’ère du calcul des décimales de π à
l’aide des ordinateurs. On en connaı̂t actuellement plus d’un milliard (la
milliardième décimale de π est un 9). Nous nous contenterons ici de donner
l’approximation plus modeste
π = 3, 14159265358979323846264338327950288419716939937510 . . ..
Comme sin est strictement croissante sur l’intervalle ] − π2 , π2 [, avec pour
limites respectives −1 et 1 lorsque x tend vers − π2 et vers π2 , elle possède une
fonction réciproque, appelée l’arc sinus, notée arcsin et définie sur ] − 1, 1[.
Par les résultats sur les fonctions monotones, arc sin sera dérivable en chaque
point x ∈ ] − 1, 1[, et
1
(arcsin)$ (x) =
=
(sin)$ (arcsin
x)
1
cos(arcsin x)
=
1
1
=
.
1/2
(1 − sin (arcsin x))
(1 − x2 )1/2
2
De même, cos étant strictement décroissante sur l’intervalle ]0, π[, avec pour
limites respectives 1 et −1 lorsque x tend vers 0 et vers π, elle possède une
fonction réciproque, appelée l’arc cosinus, notée arcos et définie sur ] − 1, 1[.
Elle est dérivable en chaque x ∈ ] − 1, 1[, et
(arcos)$ (x) =
=−
1
1
=−
(cos)$ (arcos x)
sin(arcos x)
1
(1 −
cos2 (arcos
x))1/2
=−
Comme, pour tout x ∈ ] − 1, 1[, on a
1
.
(1 − x2 )1/2
(arcsin)$ (x) + (arcos)$ (x) = 0,
et que
arcsin 0 + arcos 0 =
on aura, pour tout x ∈ ] − 1, 1[,
arcsin x + arcos x =
π
,
2
π
.
2
267
7.11. EXPONENTIELLES IMAGINAIRES ET COMPLEXES
A partir des fonctions sinus et cosinus, on définit la fonction tangente par
tg x =
sin x
.
cos x
En conséquence,
dom tg = {x ∈ R : x /=
π
+ kπ, (k ∈ Z)},
2
et, pour chaque x ∈ dom tg, on a
1
,
cos2 x
Il en résulte en particulier que tg est strictement croissante sur ] − π2 , π2 [,
avec comme limites respectives −∞ et +∞ lorsque x tend vers − π2 et vers π2 .
On peut donc définir sa fonction réciproque, appelée l’arc tangente et notée
arctg, sur R, et l’on aura
tg (x + π) = tg x, (tg)$ (x) =
(arctg)$ (x) =
1
= cos2 (arctg x)
(tg)$ (arctg x)
1
,
1 + x2
puisque, pour tout x ∈ dom tg, on a
=
cos2 x =
7.11
cos2 x
1
=
.
2
2
1 + tg 2 x
sin x + cos x
Exponentielles imaginaires et complexes
Il existe une relation remarquable entre les fonctions trigonométriques et la
série exponentielle.
Proposition. Pour tout x ∈ R, on a
∞
$
(ix)k
k=0
k!
= cos x + i sin x.
Démonstration. On a, en effet, pour tout x ∈ R, puisque i2k = (−1)k
et que l’on peut permuter l’ordre des termes dans les séries absolument
convergentes,
cos x + i sin x =
∞
$
(ix)2j
j=0
(2j)!
+
∞
$
(ix)2j+1
j=0
(2j + 1)!
=
∞
$
(ix)k
k=0
k!
.
268
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
On est ainsi conduit à définir l’application exponentielle imaginaire de R
dans C par
∞
$
(ix)k
exp ix =
.
k!
k=0
Elle vérifie donc la relation
exp ix = cos x + i sin x,
pour tout x ∈ R. En particulier, on a, pour tout x ∈ R,
| exp ix| = (cos2 x + sin2 x)1/2 = 1.
La fonction exponentielle imaginaire vérifie une formule d’addition semblable à celle de l’exponentielle réelle.
Proposition. Pour tout x ∈ R et tout y ∈ R, on a
exp i(x + y) = (exp ix).(exp iy).
Démonstration. On a, en utilisant la relation précédente et la formule
d’addition des fonctions trigonométriques,
(exp ix).(exp iy) = (cos x + i sin x)(cos y + i sin y)
= cos x cos y − sin x sin y + i(sin x cos y + cos x sin y)
= cos(x + y) + i sin(x + y) = exp i(x + y).
En particulier, on a, pour tout entier n ≥ 1 et tout x ∈ R,
exp(inx) = (exp ix)n ,
c’est-à-dire
cos nx + i sin nx = (cos x + i sin x)n ,
C’est la formule de Moivre qui permet, en calculant le second membre
par la formule du binôme de Newton et en égalant les parties réelles et
imaginaires des deux membres, d’exprimer cos nx et sin nx en termes des
puissances de sin x et cos x de degré inférieur ou égal à n.
L’exponentielle imaginaire possède des propriétés de dérivation intéressantes.
7.11. EXPONENTIELLES IMAGINAIRES ET COMPLEXES
269
Proposition. exp(i·) est dérivable en chaque x ∈ R et
D(exp ix) = i exp ix.
Démonstration. On a
D(exp ix) = D(cos x+i sin x) = − sin x+i cos x = i(cos x+i sin x) = i exp ix.
On peut unifier la théorie des fonctions exponentielles et trigonométriques en introduisant de nouvelles fonctions élémentaires de R dans C, les
exponentielles complexes.
Définition. Soit a = b + ic ∈ C. L’exponentielle complexe exp(a·) est la
fonction de R dans C définie, pour chaque x ∈ R par la formule
exp ax = (exp bx).(exp icx) = (exp bx).(cos cx + i sin cx).
Si a = b est réel, on retrouve l’exponentielle réelle exp(b·) et si a = ic
est imaginaire pur, on retrouve le composé de la fonction réelle x 2→ cx avec
la fonction exponentielle imaginaire. Nous allons voir que l’exponentielle
complexe conserve les propriétés essentielles de l’exponentielle réelle.
Proposition. Pour chaque x ∈ R et chaque entier k ≥ 1, exp(a·) est k-fois
dérivable en x et l’on a
D k [exp(ax)] = ak exp ax.
En outre, pour tout x ∈ R, on a
| exp ax| = exp bx,
et en particulier exp ax /= 0 quel que soit x ∈ R. De plus, pour chaque x ∈ R
et chaque y ∈ R, on a
exp a(x + y) = (exp ax).(exp ay),
ce qui entraı̂ne en particulier que, pour chaque x ∈ R, on a
exp(−ax) = (exp ax)−1 .
Enfin, pour chaque x ∈ R, on a
exp ax = exp āx.
270
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Démonstration. Le fait que exp(a·) soit k fois dérivable en chaque x ∈
R résulte de ce que les fonctions élémentaires réelles exp, cos et sin sont
indéfiniment dérivables et des règles de dérivabilité de la somme, du produit
et du composé de deux fonctions. D’ailleurs, on a, pour chaque x ∈ R,
D[exp(ax)] =
(b exp bx). exp icx + (exp bx).(ic) exp icx =
(b + ic)(exp bx)(exp icx) = a exp ax,
et la formule pour les dérivées d’ordre supérieur s’en déduit aussitôt de
proche en proche. En outre, on a
| exp ax| = | exp bx|| exp icx| = exp bx,
exp a(x + y) = [exp b(x + y)].[exp ic(x + y)] =
(exp bx).(exp by).[(exp(icx)).(exp(icy))]
= (exp bx).(exp(icx))(exp by).(exp(icy)) = (exp ax).(exp ay),
Enfin,
(exp ax).[exp(−ax)] = exp a(x − x) = exp 0 = 1.
exp ax = (exp bx).(cos cx + i sin cx) = (exp bx).(cos cx − i sin cx) = exp āx.
7.12
Dérivées partielles d’ordre supérieur
Soit f une fonction de Rn dans Rp dérivable en au moins un point intérieur
à dom f. On peut alors lui associer la fonction df de Rn dans l’ensemble
L(Rn , Rp) des applications linéaires de Rn dans Rp de domaine
dom df = {x ∈ int dom f : f est dérivable en x},
définie par df (x) = fx$ . Cette fonction s’appelle la fonction différentielle ou la
fonction dérivée totale de f et l’on voit que ce n’est plus une fonction de Rn
dans Rp mais bien une fonction de Rn dans L(Rn , Rp). Nous ne considérerons
pas ici le problème de la continuité et de la dérivabilité d’une telle fonction.
Par contre, si j est un entier compris entre 1 et n et si la fonction f de
Rn dans Rp est telle que la dérivée partielle Dj f (x) existe en au moins un
7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR
271
point x ∈ Rn , on peut lui associer, comme nous l’avons déjà fait à plusieurs
reprises, la fonction
Dj f : Rn → Rp, x 2→ Dj f (x),
de domaine
dom Dj f = {x ∈ dom f : Dj f (x) existe}.
∂f
On la note également fj$ ou ∂x
ou ∂j f. Si k est un entier compris entre 1
j
et n et si la fonction Dj f possède elle-même en x ∈ dom Dj f une dérivée
partielle Dk (Dj f )(x) par rapport à la ke variable, on peut définir la fonction
dérivée partielle seconde de f par rapport à la j e et puis la ke variable par
2
2
Djk
f : x 2→ Djk
f (x) = Dk (Dj f )(x).
Son domaine est donc l’ensemble des points du domaine de Dj f en lesquels
cette fonction possède une dérivée partielle par rapport à la ke variable.
2 f , que l’on note aussi f $$ ou ∂ 2 f
2
Comme Djk
jk
∂xk ∂xj ou ∂jk f est elle-même une
fonction de Rn dans Rp , on peut évidemment continuer le processus et con3 f de f par rapsidérer, lorsqu’elle existe, la fonction dérivée troisième Dlkj
e
e
e
port à la j , puis la k , et puis la l variable, et ainsi de suite, et arriver ainsi,
si m est un entier strictement positif et si j1 , j2 , . . ., jm sont des entiers compris entre 1 et n à la fonction dérivée me de f par rapport successivement
e
aux j1e , j2e , . . . , jm
variables.
Exemples. 1. Soit f l’application de R2 dans R définie par
f (x) = f (x1 , x2 ) = x21 x2 .
On a évidemment, pour chaque x = (x1 , x2 ) ∈ R2 ,
D1 f (x) = 2x1 x2 , D2 f (x) = x21 ,
et dès lors
2
2
2
2
D11
f (x) = 2x2 , D12
f (x) = 2x1 , D21
f (x) = 2x1 , D22
f (x) = 0,
3
3
3
3
D111
f (x) = 0, D112
f (x) = 2, D121
f (x) = 2, D122
f (x) = 0,
3
3
3
3
D211
f (x) = 2, D212
f (x) = 0, D221
f (x) = 0, D222
f (x) = 0,
et dès lors toutes les fonctions dérivées partielles d’ordre supérieur ou égal à
quatre seront nulles. On constate sur cet exemple que
2
2
3
3
3
D12
f = D21
f, D112
f = D121
f = D211
f,
272
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
3
3
3
D122
f = D212
f = D221
f.
2. Soit f l’application de R2 dans R définie par f (0, 0) = 0 et
f (x1 , x2 ) = x1 x2
x21 − x22
si (x1 , x2 ) /= (0, 0).
x21 + x22
On calcule aisément que
D1 f (0, x2 ) = −x2 si x2 /= 0, D1 f (0, 0) = 0,
D2 f (x1 , 0) = x1 si x1 /= 0, D2 f (0, 0) = 0,
et dès lors
D1 f (0, h) − D1 f (0, 0)
−h
= lim
= −1,
h→0
h→0 h
h
2
D12
f (0, 0) = lim
2
D21
f (0, 0) = lim
h→0
D2 f (h, 0) − D2 f (0, 0)
h
= lim = 1.
h→0 h
h
2 f (0, 0) /= D 2 f (0, 0).
On constate dans ce cas que D12
21
2
2
Ce dernier exemple montre que l’existence de D12
f (a) et D21
f (a) n’entraı̂ne pas leur égalité. Notons que
D1 f (a1 , a2 + h2 ) − D1 f (a1 , a2 )
h2 →0
h2
2
D12
f (a) = lim
1
= lim
h2 →0 h2
2
lim
h1 →0
f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 )
h1
3
f (a1 + h1 , a2 ) − f (a1 , a2 )
=
h1 →0
h1
− lim
2
f (a1 + h1 , a2 + h2 ) − f (a1 , a2 + h2 ) − f (a1 + h1 , a2 ) + f (a1 , a2 )
lim lim
h2 →0 h1 →0
h1 h2
et que, de même,
lim
h1 →0
2
2
D21
f (a) =
f (a1 + h1 , a2 + h2 ) − f (a1 + h1 , a2 ) − f (a1 , a2 + h2 ) + f (a1 , a2 )
h2 →0
h1 h2
lim
3
3
L’égalité des deux expressions revient donc à la possibilité de permuter
l’ordre des limites d’une même fonction de deux variables, et cette permutation n’est assurée que si certaines conditions supplémentaires sont remplies.
Un premier résultat dans cette direction est le théorème de Schwarz.
7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR
273
Théorème. Soit f une fonction de Rn dans Rp , 1 ≤ i /= j ≤ n des entiers,
2 f et D 2 f
et V un voisinage de a ∈ Rn tels que les fonctions Di f, Dj f, Dij
ji
2
2
soient définies sur V . Si Dij f et Dji f sont continues en a, alors
2
2
Dij
f (a) = Dji
f (a).
Démonstration. En passant si nécessaire aux composantes de f, il suffit
de démontrer le résultat lorsque p = 1. La thèse revient à démontrer que,
pour tout ! > 0, on a
2
2
|Dij
f (a) − Dji
f (a)| ≤ !.
Soit donc ! > 0; par hypothèse, il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel
que, pour tout h ∈ R2 vérifiant |h|2 ≤ δ, on ait
!
!
2
2
2
2
|Dij
f (a + h) − Dij
f (a)| ≤ , |Dji
f (a + h) − Dji
f (a)| ≤ .
2
2
Si h = hi ei + hj ej ∈ B2 [δ], avec h1 /= 0 et h2 /= 0, on a, en appliquant deux
fois le théorème de Lagrange,
f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a)
= [f (a + hi ei + hj ej ) − f (a + hi ei )] − [f (a + hj ej ) − f (a)]
= hi Di [f (a + θi hi ei + hj ej ) − f (a + θi hi ei )]
= hi [Di f (a + θi hi ei + hj ej ) − Dif (a + θi hi ei )]
2
= hi hj Dij
f (a + θi hi ei + θj hj ej ),
pour un certain θi ∈ ]0, 1[ et un certain θj ∈ ]0, 1[. De même, en groupant les
termes différemment,
f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a)
= [f (a + hi ei + hj ej ) − f (a + hj ej )] − [f (a + hi ei ) − f (a)]
= hj Dj [f (a + hi ei + θj$ hj ej ) − f (a + θj$ hj ej )]
= hj [Dj f (a + hi ei + θj$ hj ej ) − Dj f (a + θj$ hj ej )]
2
= hj hi Dji
f (a + θi$ hi ei + θj$ hj ej ),
pour un certain θi$ ∈ ]0, 1[ et un certain θj$ ∈ ]0, 1[. Dès lors,
2
Dij
f (a + θi hi ei + θj hj ej )
274
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
=
f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a)
hi hj
2
= Dji
f (a + θi$ hi ei + θj$ hj ej ),
avec
θi hi ei + θj hj ej ∈ B2 [δ], θi$ hi ei + θj$ hj ej ∈ B2 [δ].
En conséquence, on a
2
2
|Dij
f (a) − Dji
f (a)|
2
2
= |Dij
f (a) − Dij
f (a + θi hi ei + θj hj ej )
2
2
+Dji
f (a + θi$ hi ei + θj$ hj ej ) − Dji
f (a)|
2
2
≤ |Dij
f (a) − Dij
f (a + θi hi ei + θj hj ej )|
2
2
+|Dji
f (a + θi$ hi ei + θj$ hj ej ) − Dji
f (a)|
≤
!
!
+ = !.
2 2
2
2
Une autre condition suffisante pour que Dij
f (a) = Dji
f (a) est donnée
par le théorème de Young.
Théorème. Soit f une fonction de Rn dans Rp , 1 ≤ i /= j ≤ n des entiers
et V un voisinage de a ∈ Rn tels que les fonctions Di f et Dj f soient définies
sur V et (totalement) dérivables en a. Alors
2
2
Dij
f (a) = Dji
f (a).
Démonstration. Comme dans la démonstration du théorème de Schwarz,
on introduit la fonction F de R2 dans Rp par
F (hi , hj ) = f (a + hi ei + hj ej ) − f (a + hi ei ) − f (a + hj ej ) + f (a).
L’idée consiste ici à montrer que
2
Dij
f (a) = lim
h→0
F (h, h)
2
= Dji
f (a).
h2
Soit ! > 0; par hypothèse, il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel que
2
2
|Dif (a + hi ei + hj ej ) − Di f (a) − hi Dii
f (a) − hj Dij
f (a)|2
275
7.12. DÉRIVÉES PARTIELLES D’ORDRE SUPÉRIEUR
!
≤ |(hi , hj )|2 ,
2
2
2
|Dj f (a + hi ei + hj ej ) − Dj f (a) − hi Dji
f (a) − hj Djj
f (a)|2
!
≤ |(hi , hj )|2 ,
2
lorsque |(hi, hj )|2 ≤ δ. Si nous définissons la fonction G de R dans Rp par
2
G(u) = f (a + uei + hj ej ) − f (a + uej ) − uhj Dij
f (a),
nous pouvons lui appliquer l’inégalité de la moyenne entre 0 et h1 , qui fournit
l’existence d’un θi ∈ ]0, 1[ tel que
|G(hi) − G(0)|2 ≤ |hi ||G$ (θi hi )|2 ,
c’est-à-dire, en explicitant et en utilisant la première inégalité ci-dessus,
2
|F (hi , hj ) − hi hj Dij
f (a)|2
2
≤ |hi ||Dif (a + θi hi ei + hj ej ) − Di f (a + θi hi ei ) − hj Dij
f (a)|2
2
2
≤ |hi ||Dif (a + θi hi + hj ej ) − Di f (a) − θi hi Dii
f (a) − hj Dij
f (a)|2
2
+|hi ||Dif (a + θi hi ei ) − Di f (a) − θi hi Dii
f (a)|2
!
!
≤ |hi ||(θihi , hj )|2 + |hi ||(θi hi , 0)|2
2
2
≤ !|(hi , hj )|22 .
De même, en définissant la fonction H de R dans Rp par
2
H(v) = f (a + hi ei + vej ) − f (a + vej ) − hi vDji
f (a),
en lui appliquant l’inégalité de la moyenne entre 0 et hj , en explicitant et en
utilisant la deuxième inégalité ci-dessus, on obtient
2
|F (hi , hj ) − hj hi Dji
f (a)|2 ≤ !|(hi , hj )|22 ,
lorsque |(hi , hj )|2 ≤ δ. Dès lors, si h ∈ R est tel que 0 < |h| ≤
0 < |(h, h)|2 ≤ δ, et dès lors
c’est-à-dire
#
#
# F (h, h)
#
2
#
# ≤ !,
−
D
f
(a)
ij
# h2
#
2
#
#
# F (h, h)
#
2
#
− Dji
f (a)## ≤ !,
# h2
2
F (h, h)
2
= Dji
f (a).
h→0
h2
2
Dij
f (a) = lim
δ
,
21/2
on aura
276
Rp .
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Introduisons maintenant une classe importante de fonctions de Rn dans
Définition. Soit f une fonction de Rn dans Rp , E un ouvert non vide de
Rn et k ≥ 1 un entier. On dira que f est de classe C k sur E, et l’on écrira
f ∈ C k (E; Rp), si f est continue sur E et si toutes les fonctions dérivées
partielles de f jusqu’à l’ordre k
Di1 f, Di21 i2 f, . . . , Dik1i2 ...ik f, (1 ≤ i1 , . . . , ik ≤ n)
sont définies et continues sur E.
On notera que si f ∈ C k (E; Rp), alors, pour chaque 1 ≤ j ≤ k, on a
évidemment f ∈ C j (E; Rp); en outre, par la condition suffisante de dérivabilité en termes de la continuité des dérivées partielles, la fonction f et toutes
les dérivées partielles de f jusqu’à l’ordre k − 1 seront dérivables en chaque
point de E; enfin, pour chaque 1 ≤ j ≤ k, chaque dérivée partielle d’ordre j
de f sera de classe C k−j sur E.
On étend comme suit cette notion au cas où E n’est pas nécessairement
ouvert.
Définition. Soit f une fonction de Rn dans Rp, E une partie non vide de
Rn et k ≥ 1 un entier. On dira que f est de classe C k sur E, et l’on écrira
f ∈ C k (E; Rp), s’il existe un ouvert Ẽ ⊃ E et une fonction f˜ ∈ C k (Ẽ; Rp)
telle que f˜|E = f.
Lorsque f ∈ C k (E; Rp) pour tout entier k ≥ 1, on dit que f est indéfiniment continûment dérivable sur E, et l’on écrit f ∈ C ∞ (E; Rp). Par extension, si f est continue sur E, on dira qu’elle est de classe C 0 sur E, on écrira
f ∈ C 0 (E; Rp), et on posera Dj0 f (a) = f (a).
Le théorème de Schwarz ou le théorème de Young entraı̂nent, pour une
fonction de classe C k (k ≥ 2), l’important théorème d’interversion des
dérivées partielles.
Théorème. Soit k ≥ 2 un entier et f une fonction de Rn dans Rp de classe
C k sur un voisinage ouvert V de a ∈ Rn . Alors, pour tout 1 ≤ i1 , i2 , . . . , ik ≤
n et tout entier 1 ≤ j ≤ k − 1, on a
Dik1 i2 ...ij ij+1 ...ik f (a) = Dik1 i2 ...ij+1 ij ...ik f (a).
Démonstration. Elle se fait par récurrence sur l’ordre de dérivation. Le
résultat est vrai pour k = 2 en vertu du théorème de Schwarz (ou de Young).
Supposons maintenant le résultat vrai pour les fonctions de classe l − 1 sur
7.13. DÉVELOPPEMENT DE TAYLOR
277
V , avec 3 ≤ l ≤ k − 1, et montrons qu’il est vrai pour celles de classe l sur
V . On a, si 1 ≤ j ≤ l − 2,
Dil1 ...ij ij+1 ...il f (a) = Dil (Dil−1
f )(a)
1 ...ij ij+1 ...il−1
= Dil (Dil−1
f )(a)
1 ...ij+1 ij ...il−1
= Dil1 ...ij+1 ij ...il f (a),
et, si j = l − 1,
Dil1 ...il−1 il f (a) = Di2l−1 il (Dil−2
f )(a)
1 ...il−2
= Di2l il−1 (Dil−2
f )(a) = Dil1...il−2 il il−1 f (a).
1 ...il−2
En vertu de ce résultat, si k ≥ 1 est un entier, f est une fonction de
classe C k sur l’ouvert E ⊂ Rn , a ∈ E, et si α = (α1 , α2 , . . . , αn ) ∈ Nn est tel
que
|α|1 = α1 + α2 + . . . + αn ≤ k,
on posera, sans ambiguı̈té,
Dα f (a) = ∂ αf (a) = D1α1 D2α2 . . . Dnαn f (a).
Cette notation exprime que l’on dérive f α1 fois par rapport à x1 , α2 fois
par rapport à x2 , . . . αn fois par rapport à xn .
7.13
Développement de Taylor
On peut étendre la notion de développement de Taylor aux fonctions de Rn
dans Rp . En passant si nécessaire aux composantes de la fonction, on peut
toujours, sans perte de généralité, supposer que p = 1, ce que nous ferons.
Nous aurons besoin de la conséquence élémentaire suivante du théorème
de dérivation des fonctions composées.
Lemme. Soit r > 0, a ∈ Rn et ϕ une fonction de Rn dans R dérivable en
chaque point de B2 (a; r). Si, pour chaque h ∈ Rn tel que 0 < |h|2 < r, on
définit l’application g par g : R → Rn , t 2→ a + th, alors ϕ ◦ g est dérivable
en chaque t ∈ [0, 1], et
(ϕ ◦ g)$ (t) =
n
$
j=1
hj (Dj ϕ ◦ g)(t).
278
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Démonstration. Par le théorème de dérivation des fonctions composées
et le lien entre dérivées partielles et dérivée totale ϕ ◦ g est dérivable en
t ∈ [0, 1], et
(ϕ ◦ g)$ (t) = (ϕ ◦ g)$t(1) = [ϕ$g(t) ◦ gt$ ](1)
= ϕg(t)(g $ (t)) = ϕg(t)(h) =
n
$
j=1
hj (Dj ϕ ◦ g)(t).
Nous pouvons maintenant énoncer et démontrer le théorème du développement de Taylor d’ordre m pour une fonction de classe C m .
Théorème. Soit m ≥ 1 un entier et f une fonction de Rn dans R de classe
C m+1 sur un voisinage ouvert V de a ∈ Rn et soit h ∈ Rn tel que, pour tout
t ∈ [0, 1], a + th ∈ V. Alors il existe θ ∈ ]0, 1[ tel que
f (a + h) = f (a) +
n
$
hj1 Dj1 f (a) +
j1 =1
n
+...+
1
2
n
n
$
1 $ $
...
hj1 hj2 . . . hjm Djm1 j2 ...jm f (a)
m! j =1 j =1
j =1
1
+
n $
n
1 $
hj hj D 2 f (a)
2! j =1 j =1 1 2 j1 j2
n
$
1
(m + 1)! j
n
$
1 =1 j2 =1
m
2
...
n
$
hj1 hj2 . . . hjm+1 Djm+1
f (a + θh).
1 j2 ...jm+1
jm+1 =1
Démonstration. Si l’on définit l’application g de R dans Rn par g(t) =
a + th, alors f (a + th) = (f ◦ g)(t) est dérivable en chaque point de [0, 1], et,
par le lemme,
(f ◦ g)$ (t) =
n
$
hj1 (Dj1 f ◦ g)(t).
n
$
hj1 (Dj1 f ◦ g)$(t)
j1 =1
Comme les fonctions Dj1 f sont dérivables en chaque point de V , on peut
aussi leur appliquer le lemme, et dès lors (f ◦ g)$ est dérivable en chaque
point de [0, 1], et
(f ◦ g)$$(t) =
=
n
$
j1 =1
hj1
n
$
j2 =1
j1 =1
hj2 (Dj21 j2 f ◦ g)(t) =
n $
n
$
j1 =1 j2 =1
hj1 hj2 (Dj21 j2 f ◦ g)(t).
279
7.13. DÉVELOPPEMENT DE TAYLOR
En continuant de la sorte, on trouve que, pour chaque 1 ≤ k ≤ m + 1, f ◦ g
est k-fois dérivable sur [0, 1] et
(f ◦ g)(k)(t) =
=
n $
n
$
...
j1 =1 j2 =1
n $
n
$
n
$
...
j1 =1 j2 =1
n
$
jk =1
hj1 hj2 . . . hjk (Djk1 j2 ...jk f ◦ g)(t)
hj1 hj2 . . . hjk Djk1 j2 ...jk f (a + th).
jk =1
En conséquence, on peut appliquer à f ◦ g la formule de Lagrange du reste
du développement de Taylor d’ordre m d’une fonction d’une variable, ce qui
donne
f (a + h) = (f ◦ g)(1)
= (f ◦ g)(0) +
m
$
1
k=1
m!
(f ◦ g)k (0) +
1
(f ◦ g)(m+1)(θ),
(m + 1)!
pour un certain θ ∈ ]0, 1[, et le résultat se déduit du calcul des (f ◦ g)(k)(t).
Ce résultat conduit naturellement à la définition suivante.
Définition. Soit f une fonction de Rn dans R , a ∈ int dom f et m ≥ 1 un
entier tel que toutes les dérivées partielles de f jusqu’à l’ordre m existent
en a. On appelle développement de Taylor d’ordre m de f au point a le
m défini par
polynôme de degré m Tf,a
m
Tf,a
(h) = f (a) +
n
$
hj1 Dj1 f (a) +
j1 =1
n
+...+
1
2
n
n
$
1 $ $
...
hj1 hj2 . . . hjm Djm1 j2 ...jm f (a)
m! j =1 j =1
j =1
1
La fonction
n $
n
1 $
hj hj D 2 f (a)
2! j =1 j =1 1 2 j1 j2
m
2

n
n
$
1 $

= f (a) +
...
hj1 . . . hjk Djk1 ...jk f (a) .
k!
j =1
j =1
k=1
Rm
f,a
m
$

1
k
n
de R dans R définie par
m
Rm
f,a (h) = f (a + h) − Tf,a (h),
s’appelle le reste du développement de Taylor d’ordre m de f en a et elle a
pour domaine dom f − a.
280
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
7.14
Conditions d’existence d’extrémants
Le développement de Taylor d’une fonction de plusieurs variables permet de
donner d’intéressantes conditions nécessaires ou suffisantes d’existence d’un
extrémant local libre pour une fonction de classe C 2 au moins au voisinage
de l’extrémant.
Soit f une fonction de Rn dans R de classe C 2 sur un voisinage ouvert
V d’un point a ∈ Rn . Par le théorème de développement de Taylor de f en
a, si h ∈ Rn est tel que a + th ∈ V pour tout t ∈ [0, 1], il existera θ ∈ ]0, 1[
tel que
f (a + h) = f (a) +
n
$
hj Dj f (a) +
j=1
= f (a) +
n
$
n $
n
1$
2
hj hk Djk
f (a + θh)
2 j=1 k=1
hj Dj f (a) + g(a + θh; h),
j=1
si nous définissons, sur V × Rn , la fonction g par
g(x; h) =
n $
n
1$
2
hj hk Djk
f (x).
2 j=1 k=1
On l’appelle la forme hessienne de f en x; la matrice correspondante
8
2
Djk
f (x)
9
1≤j,k≤n
est appelée la matrice hessienne de f en x. On voit que, pour x ∈ V fixé,
g(x; ·) est une forme quadratique. Rappelons qu’une telle forme g(x; ·) est
dite définie positive (resp. définie négative) si, pour tout h /= 0, on a
g(x; h) > 0 (resp. g(x; h) < 0),
et qu’elle est dite semi-définie positive (resp. semi-définie négative) si, pour
tout h ∈ Rn , on a
g(x; h) ≥ 0 (resp. g(x; h) ≤ 0).
Enfin, g(x; ·) est dite indéfinie si elle n’est pas semi-définie. Notons que g
est définie négative (resp. semi-définie négative) si et seulement si −g est
définie positive (resp. semi-définie positive.) L’algèbre fournit des conditions
nécessaires et suffisantes pour qu’une forme quadratique soit de l’un des types
que nous venons de définir. Nous aurons besoin de la conséquence suivante
du théorème des bornes atteintes de Weierstrass.
281
7.14. CONDITIONS D’EXISTENCE D’EXTRÉMANTS
Lemme. Si g(x; ·) définie ci-dessus est définie positive, alors il existe γ > 0
tel que, pour tout h ∈ Rn tel que |h|2 = 1, on ait
g(x; h) ≥ γ.
Démonstration. On vérifie sans peine que l’ensemble E = {h ∈ Rn :
|h|2 = 1} est un fermé borné de Rn et que l’application h → g(x; h) est
continue sur Rn . Le théorème de Weierstrass entraı̂ne l’existence d’un point
y ∈ E tel que, pour tout h ∈ E, on ait
g(x; h) ≥ g(x; y).
Comme y /= 0, on a g(x; y) > 0 et il suffit de poser γ = g(x; y).
Donnons maintenant une condition nécessaire pour que a soit un extrémant local libre de f .
Proposition. Si a est un minimant local libre de f , alors g(a; ·) est semidéfinie positive.
Démonstration. Par hypothèse, il existe r > 0 tel que B2 [a; r] ⊂ V et tel
que, pour tout x ∈ B2 [a; r], on ait
f (x) ≥ f (a).
En outre, par le théorème de Fermat, on aura
Dj f (a) = 0, (1 ≤ j ≤ n).
Dès lors, si h ∈ Rn est tel que |h|2 = r, ces relations et le théorème du
développement de Taylor entraı̂nent que, pour chaque entier k ≥ 1, il existera
θk ∈ ]0, 1[ tel que
4
f (a) ≤ f a +
h
k
5
4
= f (a) + g a +
θk h h
;
k k
c’est-à-dire tel que
0≤
4
5
n $
n
1 $
θk h
2
D
f
a
+
hi hj .
2k2 i=1 j=1 ij
k
On a donc, pour chaque entier k ≥ 1,
n
0≤
n
4
5
1 $$ 2
θk h
Dij f a +
hi hj ,
2 i=1 j=1
k
5
282
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
#
#
#
#
et, comme 0 ≤ # θkkh # ≤ kr , on voit que
les fonctions
2f
Dij
2
8
9
θk h
k k∈N∗
converge vers zéro. Comme
sont continues en a, on en déduit que
n
0≤
n
1 $$
2
hi hj Dij
f (a) = g(a; h).
2 i=1 j=1
Si maintenant h /= 0 est quelconque dans Rn , alors h$ =
|h$ |2 = r, et dès lors
r2
0 ≤ g(a; h$) =
g(a; h),
|h|22
rh
|h|2
est tel que
ce qui entraı̂ne aussitôt que g(a; h) ≥ 0, et achève la démonstration, puisque
le résultat est trivial pour h = 0.
Proposition. Si a est un maximant local libre de f , alors g(a; ·) est semidéfinie négative.
Démonstration. Il suffit d’appliquer le résultat précédent à −f .
Ces résultats fournissent immédiatement une condition suffisante pour
que le point critique a soit un col.
Proposition. Si a est un point critique de f tel que g(a; ·) soit indéfinie,
alors a est un col de f .
Donnons maintenant des conditions suffisantes d’existence d’un extrémant local libre de f .
Proposition. Si a est un point critique de f tel que g(a; ·) soit définie
positive, alors a est un minimant local libre de f .
Démonstration. Soit γ > 0 donné par le Lemme ci-dessus. Puisque f est
de classe C 2 sur V , il existe δ > 0 tel que B2 [a; δ] ⊂ V et tel que, pour tout
h ∈ B2 [δ], on a
n $
n
$
j=1 k=1
2
2
|Djk
f (a + h) − Djk
f (a)| ≤ γ.
Si h ∈ B2 [δ] \ {0}, le théorème de Taylor entraı̂ne l’existence d’un θ ∈ ]0, 1[
tel que
4
f (a + h) − f (a) = g(a + θh; h) = |h|22 g a;
h
|h|2
5
+ [g(a + θh; h) − g(a; h)].
283
7.15. EXERCICES
En conséquence,
f (a + h) − f (a) ≥ γ|h|22 − |g(a + θh; h) − g(a; h)|
≥ γ|h|22 −
n $
n
1$
2
2
|hj ||hk ||Djk
f (a + θh) − Djk
f (a)|
2 j=1 k=1
1
γ
≥ γ|h|22 − |h|2∞ γ ≥ |h|22 > 0.
2
2
Proposition. Si a est un point critique de f tel que g(a; ·) soit définie
négative, alors a est un maximant local libre de f .
Démonstration. Il suffit d’appliquer le résultat précédent à −f.
7.15
Exercices
1. Soit f une fonction de R dans R deux fois dérivable sur un intervalle I
de R. Montrer que f est convexe sur I si et seulement si, pour tout x ∈ I,
on a f $$ (x) ≥ 0.
2. Soit f une fonction de Rn dans R dont les dérivées partielles du premier
et du second ordre existent et sont continues en a, et soient α, β et γ des
fonctions de Rn dans Rn dérivables en a. Montrer que les dérivées de Lie
vérifient les propriétés suivantes :
Lβ (Lαf )(a) − Lα (Lβ f )(a) = Lδ f (a),
L[[α,β],γ]f (a) = Lγ L[α,β]f (a) − L[α,β]Lγ f (a).
où δ = [α, β] est le crochet de Poisson de α et β défini par
[α, β] =
n
$
j=1
(βj Dj α − αj Dj β),
En déduire l’identité de Jacobi
?
@
L[[α,β],γ] + L[[β,γ],α] + L[[γ,α],β] f (a) = 0.
3. Considérons l’équation des ondes
2
2
Dtt
u(t, x) − c2 Dxx
u(t, x) = 0,
284
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
où c est un nombre réel différent de zéro. Montrer que, si f : R → R et
g : R → R sont deux fonctions deux fois dérivables sur R, alors la fonction u
de R2 dans R définie par
u(t, x) = f (x − ct) + g(x + ct)
est solution de l’équation des ondes.
4. Si n ≥ 2 est un entier et u est une application de Rn dans R deux
fois dérivable en chaque point de Rn , on définit le laplacien ∆u de u par la
relation
n
∆u(x) =
$
2
Djj
u(x).
j=1
Montrer que si u(x) = v(|x|2) (fonction radiale), où v est une application de
]0, +∞[ dans R deux fois dérivable en chaque point de ]0, +∞[, alors, pour
tout x ∈ Rn \ {0}, on a
∆[v(|x|2)] = v $$(|x|2 ) +
Comme, pour tout r > 0, on a
v $$ (r) +
n−1 $
v (|x|2 ).
|x|2
n−1 $
v (r) = 0 ⇔ r n−1 v $$ (r) + (n − 1)r n−2 v $ (r) = 0
r
⇔ [r n−1 v $ (r)]$ = 0 ⇔ v $ (r) = Ar 1−n ,
où A est une constante réelle arbitraire, en déduire que u(x) = v(|x|2 ) est
une solution radiale sur Rn \ {0} de l’équation de Laplace
∆u(x) = 0,
si et seulement si
et
u(x) = A log |x|2 + B si n = 2,
u(x) = A|x|2−n
+ B si n ≥ 3,
2
où B est une constante réelle arbitraire.
%
5. Soit k∈N ck hk une série, où ck ∈ Rp et h ∈ R, et f une fonction de R
%
dans Rp définie sur ]a − r, a + r[. On dit que k∈N ck hk est un développement
asymptotique de f au voisinage de a si, pour chaque entier q ∈ N, on a
%q
f (a + h) −
lim
h→0
|h|q
k
k=0 ck h
= 0.
285
7.16. PETITE ANTHOLOGIE
Montrer que si f est une fonction de classe C ∞ sur ]a − r, a + r[, alors la série
(k)
%
de Taylor de f en a k∈N hk f k!(a) est un développement asymptotique de
f au voisinage de a.
7.16
Petite anthologie
Si, pour des accroissements tendant vers zéro, les fluxions qui leur sont proportionnelles sont écrites, les quantités v, v $, v $$ , . . . étant maintenant toutes
prises égales à v, alors lorsque z, variant uniformément, devient z + v, la
v2
variable x deviendra x + ẋ 1.vż + ẍ 1.2.
ż2 + etc.
Brook Taylor, 1715
Ce qu’on appelle la somme d’une suite, c’est la limite de la somme de
ses différents termes, c’est-à-dire une quantité dont on approche aussi près
qu’on veut, en prenant toujours dans la suite un nombre de termes de plus
en plus grand. Nous croyons devoir faire cette remarque en passant, pour
fixer l’idée nette du mot somme d’une suite.
Jean Le Rond d’Alembert, 1789
Mais, pour notre objet, il importe moins de connaı̂tre les restes exacts de
la série développée jusqu’à un terme quelconque que d’avoir des limites de
ces restes pour pouvoir apprécier l’erreur qu’on peut commettre en ne tenant
compte que de quelques-uns des premiers termes.
Joseph-Louis Lagrange, 1808
On appelle série une suite indéfinie de quantités u0 , u1 , u2 , u3 , etc. . . .
qui dérivent les uns des autres suivant une loi déterminée. Ces quantités
elles-mêmes sont les différents termes de la série que l’on considère. Soit
sn = u0 + u1 + u2 + . . . + un−1
la somme des n premiers termes, n désignant un nombre entier quelconque.
Si, pour des valeurs de n toujours croissantes, la somme sn s’approche
indéfiniment d’une certaine limite s, la série sera dite convergente, et la
limite en question s’appellera la somme de la série. Au contraire, si, tandis
que n croı̂t indéfiniment, la somme sn ne s’approche d’aucune limite fixe, la
série sera dite divergente, et n’aura plus de somme.
Augustin Cauchy, 1821
286
CHAPITRE 7. DÉVELOPPEMENT DE TAYLOR ET SÉRIES
Nous sommes donc conduits à envisager une relation d’une nature nouvelle qui peut exister entre une fonction de x et de µ que nous appellerons
ϕ(x, µ) et une série divergente ordonnée suivant les puissances de µ
f0 + µf1 + µ2 f2 + . . . + µp fp + . . . ,
où les coefficients f0 , f1 , . . . peuvent être des fonctions de x seulement indépendantes de µ, ou bien dépendre à la fois de x et de µ. Posons
ϕp = f0 + µf1 + µ2 f2 + . . . + µp fp .
Si l’on a
lim
ϕ − ϕp
= 0 pour µ = 0,
µp
je dirai que la série ci-dessus représente asymptotiquement la fonction ϕ. . . .
Il est clair que, si µ est très petit, la différence ϕ − ϕp sera ausi très petite et,
bien que la série ci-dessus soit divergente, la somme de ses p + 1 premiers
termes représente très approximativement la fonction ϕ.
Henri Poincaré, 1893
Pour rien au monde je ne consacrerai de longues heures à établir que
∂ 2u
= ∂y∂x
et autres belles et grandes choses de même genre.
∂ 2u
∂x∂y
Charles Hermite, 1884
Chapitre 8
Equations différentielles
linéaires
8.1
Opérateurs différentiels linéaires
Dans un bouillon de culture en quantité suffisante, la vitesse de reproduction
des bactéries est proportionnelle à leur nombre. Si r désigne le coefficient
de proportionnalité et que l’on interpole la fonction décrivant le nombre de
bactéries en fonction du temps par une fonction n dérivable de R dans R+ ,
la loi de reproduction se traduit par l’équation
n$ (t) = rn(t),
où n(t) désigne le nombre de bactéries à l’instant t.
La hauteur h(t) à l’instant t d’un point matériel de masse m en chute
libre et soumis à une résistance de frottement proportionnelle à sa vitesse
vérifie, en vertu de la loi fondamentale de la mécanique, l’équation
mh$$ (t) + rh$ (t) = −mg,
où g désigne l’accélération de la pesanteur et r le coefficient de la force de
frottement.
Dans un circuit électrique oscillant de résistance R, de capacité C et
d’inductance L, l’intensité I(t) à l’instant t du courant électrique vérifie
l’équation
LI $$ (t) + RI $ (t) + (1/C)I(t) = 0.
Ces différents problèmes conduisent donc à la question suivante. Si l’on
se donne un entier n ≥ 1, des éléments aj , (0 ≤ j ≤ n) de K tels que an /= 0,
287
288
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
avec K = R ou C, et une fonction f de R dans K, il s’agit de déterminer les
applications y dans K n fois dérivables sur R telles que, pour tout x ∈ R, on
ait
n
$
aj y (j)(x) = f (x).
j=0
(on utilise la convention y (0) = y). Une telle équation dont l’inconnue est
une application y de R dans K est appelée une équation différentielle linéaire
d’ordre n à coefficients constants dans K et toute fonction y vérifiant l’équation sur R une solution sur R de l’équation. Lorsque les coefficients aj sont
réels, une solution réelle de l’équation sera une solution y à valeurs dans R.
Lorsque f = 0 l’équation différentielle correspondante
n
$
aj y (j)(x) = 0.
(8.1)
j=0
est appelée une équation différentielle linéaire homogène d’ordre n à coefficients constants. Sinon, elle est dite non homogène. Nous commencerons
par l’étude de l’équation homogène. Montrons d’abord que toute solution
éventuelle de l’équation (8.1) est indéfiniment dérivable sur R.
Proposition. Toute solution de l’équation (8.1) est indéfiniment dérivable
sur R.
Démonstration. On va le démontrer par récurrence sur l’ordre de dérivabilité. Soit y une solution de (8.1); on a donc
y (n) = −a−1
n
n−1
$
aj y (j) ,
(8.2)
j=0
ce qui montre que y (n) est égale à une fonction dérivable sur R, c’est-à-dire
que y est n + 1 fois dérivable sur R. Si l’on suppose maintenant y n + k fois
dérivable sur R et que l’on égale les dérivées ke des deux membres de (8.2),
on obtient
y (n+k) = −a−1
n
n−1
$
aj y (j+k) ,
(8.3)
j=0
et, en raisonnant sur (8.3) comme on l’a fait sur (8.2), on déduit que y (n+k)
est dérivable sur R, donc que y est n + k + 1 fois dérivable sur R. En
conséquence, y possède des dérivées de tous les ordres en chaque point de R
et la démonstration est complète.
289
8.1. OPÉRATEURS DIFFÉRENTIELS LINÉAIRES
Nous allons montrer que la résolution de l’équation (8.1) se ramène à
un problème essentiellement algébrique par l’introduction des opérateurs
différentiels à coefficients constants. Désignons par C ∞ = C ∞ (R, K) l’ensemble des fonctions à valeurs dans K indéfiniment dérivables sur R. C’est
évidemment un espace vectoriel sur K. Pour chaque y ∈ C ∞ , la fonction dérivée y $ appartient aussi à C ∞ et nous pouvons donc introduire
l’application D : C ∞ → C ∞ , y 2→ y $ . Les propriétés de la dérivée entraı̂nent
que, si y et z appartiennent à C ∞ et si c ∈ K, alors on a
D(y + z) = (y + z)$ = y $ + z $ = Dy + Dz, D(cy) = (cy)$ = cy $ = c(Dy),
ce qui montre que D est une application linéaire de C ∞ dans C ∞ , c’est-à-dire
un endomorphisme de C ∞ . On peut dès lors définir de proche en proche,
pour tout entier m ≥ 1, l’endomorphisme Dm de C ∞ par D 0 = I (identité
sur C ∞ ) et
D m y = D[D m−1 y]
pour tout y ∈ C ∞ , c’est-à-dire D composé m fois avec lui-même, et l’on a
évidemment
D m y = y (m).
Si L est le polynôme à coefficients dans K défini par
L(z) =
n
$
aj z j ,
j=0
où chaque aj ∈ K et an /= 0, nous pouvons lui associer l’endomorphisme
L(D) de C ∞ défini par
L(D)y =
n
$
j=0
aj D j y =
n
$
aj y (j),
j=0
pour tout y ∈
Un tel L(D) est appelé un opérateur différentiel linéaire
d’ordre n à coefficients dans K. On voit que la résolution de l’équation
différentielle homogène (8.1) revient à la détermination du noyau de l’endomorphisme L(D) de C ∞ . Cette détermination repose sur l’étude des propriétés algébriques de L(D).
%
j
Si M (D) = m
j=0 bj D est un autre opérateur différentiel linéaire à coefficients dans K, la somme L(D) + M (D) de L(D) et M (D) sera l’endomorphisme défini, pour tout y ∈ C ∞ , par
C∞.
[L(D) + M (D)]y = L(D)y + M (D)y =
n
$
j=0
aj D j y +
m
$
j=0
bj D j y,
290
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
tandis que le produit cL(D) de L(D) par c ∈ K sera l’endomorphisme de C ∞
défini, pour tout y ∈ C ∞ par

j

(aj + bj )D j y, [cL(D)]y =
n
$
[cL(D)]y = c[L(D)y] = c 
n
$
j=0
On constate aussitôt que
[L(D) + M (D)]y =
p
$
aj D y  .
j=0
(caj )D j y,
(8.4)
j=0
avec p = max(n, m) et aj = 0 pour j > n, bj = 0 pour j > m, c’est-à-dire
que
L(D) + M (D) = (L + M )(D), cL(D) = (cL)(D).
(8.5)
Le composé de M (D) et L(D) est l’endomorphisme de C ∞ défini, pour tout
élément y ∈ C ∞ par
[M (D) ◦ L(D)]y = M (D)[L(D)y] =
=
n $
m
$
bk aj D k+j y =
k=0 j=0
n+m
$
l=0
&


m
$
k=0
m
$
j=0
'
bk D k 

n
$
j=0

aj D j y 
bl−j aj  D l y.
On le notera simplement M (D)L(D) et l’on voit immédiatement que
M (D) ◦ L(D) = (M L)(D),
(8.6)
où M L désigne le produit usuel du polynôme L par le polynôme M . Par
exemple, si L(D) = D − r1 I et M (D) = D − r2 I avec r1 , r2 ∈ C, on a, pour
tout y ∈ C ∞ ,
M (D)L(D)y = (D − r2 I)(Dy − r1 y) = D 2 y − r1 Dy − r2 Dy + r1 r2 y
8
9
= D 2 − (r1 + r2 )D + r1 r2 I y.
Les relations (8.5) et (8.6) montrent que la somme et le produit de deux
opérateurs différentiels à coefficients dans K, ainsi que le produit d’un tel
opérateur par un élément de K sont encore des opérateurs différentiels linéaires à coefficients dans K, ce qui permet de définir, de proche en proche, la
8.1. OPÉRATEURS DIFFÉRENTIELS LINÉAIRES
291
somme et le produit d’un nombre quelconque de tels opérateurs. En outre,
les relations (8.5) et (8.6) et les propriétés des polynômes montrent que
L(D) + M (D) = M (D) + L(D), M (D)L(D) = L(D)M (D),
si l’on définit l’égalité L(D) = M (D) entre deux opérateurs différentiels
linéaires à coefficients dans K par la relation
L(D)y = M (D)y
pour tout y ∈ C ∞ , c’est-à-dire
[L(D)y](x) = [M (D)y](x),
pour tout y ∈ C ∞ et tout x ∈ R. Cette égalité équivaut à l’identité, au sens
algébrique, des polynômes L et M , ainsi que cela résulte de la proposition
suivante.
Proposition. Si 0 désigne l’endomorphisme nul dans C ∞ , alors
L(D) = 0
si et seulement si le polynôme L(z) =
n).
%n
j=0
aj z j est tel que aj = 0, (0 ≤ j ≤
Démonstration. La condition suffisante est évidente. Pour démontrer la
condition nécessaire, notons que si L(D)y = 0 pour tout y ∈ C ∞ , alors, en
prenant y = 1, on trouve a0 = 0. Raisonnant par récurrence et supposant
que a0 = a1 = . . . = ak−1 = 0, on trouve, en prenant y(x) = xk , k!ak = 0, et
la démonstration est complète.
Tous ces résultats montrent que l’ensemble des opérateurs différentiels
à coefficients dans K est isomorphe à l’ensemble des polynômes sur K. En
particulier à toute identité L = M entre deux polynômes algébriques L
et M correspond l’égalité L(D) = M (D) pour les opérateurs différentiels
à coefficients constants correspondants. En guise d’application, rappelons
que le théorème fondamental de l’algèbre appliqué au polynôme L(z) nous
apprend que si r1 , r2, . . . , rq désignent les zéros complexes distincts de L et
m1 , m2, . . . , mq leurs multiplicités respectives, de telle sorte que 1 ≤ q ≤ n
et m1 + . . . + mq = n, on a l’identité
L(z) = an (z − r1 )m1 (z − r2 )m2 . . . (z − rq )mq ,
292
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
l’ordre des facteurs étant évidemment indifférent dans le second membre.
Cela entraı̂ne aussitôt, pour les opérateurs différentiels correspondants, l’égalité
L(D) = an (D − r1 I)m1 (D − r2 I)m2 . . . (D − rq I)mq ,
l’ordre des facteurs étant de nouveau indifférent dans le second membre, et
(D − rI)m désignant le composé des m opérateurs (D − rI) . . .(D − rI).
8.2
Equation homogène complexe
Nous allons déterminer la structure de l’ensemble des solutions de l’équation
différentielle linéaire homogène à coefficients constants dans K
an y (n) + an−1 y (n−1) + . . . + a1 y $ + a0 y = 0,
(8.7)
où n ∈ N∗ , aj ∈ K, (0 ≤ j ≤ n), an /= 0. Si L(D) est l’opérateur différentiel
à coefficients constants correspondant défini par
L(D) =
n
$
aj D j ,
j=0
le problème revient donc à déterminer la structure du noyau ker L(D) de
l’endomorphisme L(D) de C ∞ .
Définition. On appelle polynôme caractéristique de l’équation différentielle
(8.7) le polynôme L sur C défini par
L(z) =
n
$
aj z j ,
j=0
qui s’obtient à partir de (8.7) en remplaçant y (j) par z j . Les zéros distincts r1 , r2 , . . . , rq du polynôme caractéristique P (z) sont appelés les racines
caractéristiques de l’équation différentielle (8.7) et nous désignerons par
m1 , . . ., mq leurs multiplicités respectives.
La discussion de la section 1 montre que l’opérateur différentiel L(D)
peut s’écrire
L(D) = an (D − r1 I)m1 (D − r2 I)m2 . . . (D − rq I)mq ,
l’ordre des facteurs du second membre étant indifférent. Il est évident que
tout élément du noyau de (D − rj I)mj appartiendra au noyau de L(D). On
8.2. EQUATION HOMOGÈNE COMPLEXE
293
est donc amené à étudier d’abord la structure du noyau de (D − rI)m,
où r ∈ K et m ≥ 1 est un entier.
La détermination du noyau de D −rI équivaut à la résolution de l’équation différentielle élémentaire
y $ (x) = ry(x).
(8.8)
Si nous définissons la nouvelle fonction inconnue z par
y(x) = z(x) exp rx,
c’est-à-dire
z(x) = y(x) exp(−rx),
nous voyons que y est solution de l’équation différentielle (8.8) si et seulement
si
z $ (x) exp rx = 0,
c’est-à-dire, puisque exp rx /= 0 pour tout x ∈ R, si et seulement si
z $ (x) = 0.
Les solutions de cette équation sont les fonctions constantes z(x) = c, x ∈ R.
Par conséquent, les solutions de (8.8) sont les fonctions
y(x) = c exp rx
où c ∈ K est arbitraire.
Supposons maintenant que m soit un entier positif quelconque et considérons d’abord le cas particulier où r = 0.
Lemme. y ∈ C ∞ appartient à ker Dm si et seulement si
y(x) = P (x), x ∈ R,
où P est un polynôme arbitraire sur K de degré inférieur ou égal à m − 1.
Démonstration. On vérifie immédiatement que tout polynôme sur K de
degré inférieur ou égal à m−1 appartient au noyau de Dm . Réciproquement,
si y est réel et Dm y = 0, alors, le reste de Lagrange du développement de
Taylor d’ordre m − 1 de y autour de 0 est identiquement nul et l’on a donc
y(x) =
m−1
$
k=0
D k y(0) k
x ,
k!
ce qui montre que y est un polynôme sur K de degré inférieur ou égal à
m − 1. Le cas de y complexe s’en déduit en passant aux composantes.
294
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
Le résultat suivant permet de ramener la recherche de la structure du
noyau de (D − rI)m à celle du noyau de Dm .
Lemme. Si r ∈ C et m ∈ N∗ alors, pour toute fonction g à valeurs dans K
m-fois dérivable sur R, on a
(D − rI)m g(x) = (exp rx). Dm [g(x) exp(−rx)],
(8.9)
c’est-à-dire
[exp(−rx)].(D − rI)mg(x) = D m [g(x) exp(−rx)].
Démonstration. Notons que la fonction g. exp(−r.) est m fois dérivable
sur R puisqu’il en est ainsi de g et de exp(−r.). La formule à démontrer est
vraie pour m = 1 puisque
(exp rx).D[g(x). exp(−rx)] = Dg(x) − rg(x) = (D − rI)g(x).
Montrons par récurrence que si elle est vraie jusqu’à l’ordre k − 1 ≤ m − 1,
elle est vraie à l’ordre k. En fait, on a
(D − rI)k g(x) = (D − rI)[(D − rI)k−1 g(x)]
= (D − rI){(exp rx).Dk−1 [g(x). exp(−rx)]}
= (exp rx).D{[exp(−rx)].(exp rx).Dk−1 [g(x). exp(−rx)]}
= (exp rx).Dk [g(x). exp(−rx)].
Proposition. Si r ∈ C et m ∈ N∗ , alors y : R → C appartient au noyau de
(D − rI)m si et seulement si y est de la forme
y(x) = P (x) exp rx,
où P est un polynôme arbitraire sur C de degré inférieur ou égal à m − 1.
Démonstration. Comme exp(−rx) /= 0 et exp rx /= 0 quel que soit x ∈ R,
la formule (8.9) et le lemme qui précède entraı̂nent que
y ∈ ker(D − rI)m ⇔ (exp rx).Dm[y(x) exp(−rx)] = 0
⇔ D m [y(x) exp(−rx)] = 0
⇔ y(x) exp(−rx) = P (x) ⇔ y(x) = P (x) exp rx,
où P est un polynôme sur C de degré inférieur ou égal à m − 1.
8.2. EQUATION HOMOGÈNE COMPLEXE
295
Remarque. Lorsque r ∈ R, le raisonnement du lemme précédent montre
que les éléments de ker(D − rI)m à valeurs réelles s’obtiennent en prenant
pour P les polynômes sur R de degré inférieur ou égal à m − 1. Lorsque r
est complexe non réel, disons r = b + ic avec c /= 0, alors P (x) exp rx est réel
si et seulement si
P (x) exp rx = P (x) exp r̄x,
c’est-à-dire si et seulement si
[P (x) − P (x)] cos cx = −i[P (x) + P (x)] sin cx,
ou encore
[9P (x)] cos cx = [8P (x)] sin cx,
pour tout x ∈ R, ce qui n’est possible que si P = 0. Ainsi donc, pour r
non réel, les éléments du noyau de (D − rI)m sont nécessairement à valeurs
complexes non réelles.
Pour chaque q ∈ N et chaque s ∈ C, désignons par E q,s l’ensemble
E q,s = {y : R → C : y(x) = P (x) exp sx et P est un
polynôme sur C de degré inférieur ou égal à q}.
Des fonctions de ce type s’appellent des exponentielles-polynômes et comme
la bijection
B : P 2→ P (·) exp(s·)
définit un isomorphisme entre E q,s et l’espace vectoriel sur C des polynômes
sur C de degré inférieur ou égal à q, qui est de dimension q + 1, on voit
que E q,s est un espace vectoriel sur C de dimension q + 1 contenu dans C ∞ .
L’étude du comportement de l’opérateur linéaire D − rI sur E q,s va nous
fournir la structure des éléments de ker L(D). Comme, pour tout polynôme
P de degré inférieur ou égal à q, tout r ∈ C et tout s ∈ C, on a
(D − rI)[P (x) exp sx] = [P $ (x) + (s − r)P (x)] exp sx,
on voit que D − rI est un endomorphisme de E q,s. On a un résultat plus
précis si r /= s.
Lemme. Si r /= s sont des nombres complexes, alors, pour chaque q ∈ N,
D − rI est un automorphisme de E q,s .
Démonstration. Puisque E q,s est de dimension finie, il suffit de vérifier
que D − rI est injectif, c’est-à-dire que ker(D − rI) ∩ E q,s = {0}. Si
(D − rI)[P (x) exp sx] = 0,
296
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
%
pour tout x ∈ R, où P (x) = qk=0 ck xk , alors, en vertu de la formule (8.9),
on a
0 = (exp rx).D[P (x) exp(s − r)x],
ou encore
P $ (x) + (s − r)P (x) = 0,
c’est-à-dire
(s − r)cq xq +
q−1
$
k=0
[(s − r)ck + (k + 1)ck+1 ]xk = 0,
quel que soit x ∈ R. Le polynôme du premier membre doit donc avoir ses
coefficients nuls, c’est-à-dire
cq = 0, ck = −
k+1
ck+1 , (0 ≤ k ≤ q − 1),
s−r
ce qui entraı̂ne, de proche en proche ck = 0, (0 ≤ k ≤ q) et achève la
démonstration.
Nous pouvons maintenant énoncer et démontrer le théorème de structure de l’ensemble des solutions complexes d’une équation différentielle linéaire homogène à coefficients dans K.
Théorème. Si r1 , . . . , rq désignent les racines distinctes de l’équation caractéristique
L(z) ≡
n
$
aj z j = 0
j=0
et m1 , . . . , mq leurs multiplicités respectives, alors y est solution de l’équation
différentielle
n
$
j=0
aj y (j) ≡ L(D)y = 0
si et seulement si
y(x) =
q
$
j=1
Pj (x) exp rj x, x ∈ R,
(8.10)
où Pj est un polynôme arbitraire de degré inférieur ou égal à mj − 1 à
coefficients dans C (1 ≤ j ≤ q).
Démonstration. La Proposition ci-dessus entraı̂ne que le résultat est
vrai si q = 1. Pour démontrer le résultat par récurrence, supposons le
297
8.2. EQUATION HOMOGÈNE COMPLEXE
vrai pour k − 1 racines caractéristiques distinctes et montrons qu’il est vrai
pour k racines caractéristiques distinctes. On a, en vertu de l’hypothèse de
récurrence,
k
6
j=1

k−1
6
(D − rj I)mj y = 0 ⇔ 
j=1
⇔ (D − rk I)mk y(x) =

(D − rj I)mj  (D − rk I)mk y = 0
k−1
$
j=1
Qj (x) exp rj x, x ∈ R,
(8.11)
où Qj est un polynôme sur C de degré inférieur ou égal à mj − 1, (1 ≤ j ≤
k − 1). Le dernier Lemme montre que (D − rk I)mk est un automorphisme
de E mj −1,rj pour chaque 1 ≤ j ≤ k − 1, et il existe donc pour chaque
1 ≤ j ≤ k − 1, un polynôme Pj sur C de degré inférieur ou égal à mj − 1 tel
que
Qj (x) exp rj x = (D − rk I)mk [Pj (x) exp rj x].
Dès lors, par la formule (8.11) et la linéarité de l’opérateur (D − rk I)mk , on
a


(D − rk I)mk y(x) −
k−1
$
j=1
Pj (x) exp rj x = 0,
ce qui équivaut, par la Proposition ci-dessus, à
y(x) −
k−1
$
Pj (x) exp rj x = Pk (x) exp rk x,
j=1
où Pk est un polynôme sur C de degré inférieur ou égal à mk − 1. Le résultat
est donc vrai pour un nombre quelconque q de racines distinctes du polynôme
caractéristique.
Remarque. Si nous explicitons les polynômes Pj dans (8.10) en écrivant
Pj (x) =
mj −1
$
pjk xk ,
k=0
nous voyons que la forme générale des solutions complexes de l’équation
différentielle (8.7) est donnée par
y(x) =
q m$
j −1
$
j=1 k=0
pjk xk exp rj x, x ∈ R,
298
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
%
et elle contient les n = qj=1 mj constantes complexes arbitraires pjk . Cette
formule exprime aussi que la famille de fonctions
F = {x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1, 1 ≤ j ≤ q}
constitue une famille génératrice du sous-espace vectoriel ker L(D) ⊂ C ∞
des solutions de l’équation différentielle (8.7).
Le lemme qui suit permet de montrer que cette famille est libre et constitue donc une base de ker L(D).
Lemme. Si p1 , . . ., pl sont des entiers naturels et r1 , . . . , rl des nombres
complexes tels que ri /= rj pour 1 ≤ i /= j ≤ l, alors
(E p1,r1 + . . . + E pl−1,rl−1 ) ∩ E pl,rl = {0}.
Démonstration. Si
y ∈ (E p1,r1 + . . . + E pl−1 ,rl−1 ) ∩ E pl,rl ,
alors, pour chaque x ∈ R, on a
y(x) =
l−1
$
P j (x) exp rj x = P l (x) exp rl x,
j=1
où chaque polynôme P j est de degré inférieur ou égal à pj (1 ≤ j ≤ l). Dès
lors, par le lemme de structure du noyau de (D − rI)p+1 , on a
0=
l−1
6
k=1

(D − rk I)pk +1 
=
l−1
$
j=1

P j (x) exp rj x =
l−1
6
k=1
(D − rk I)pk +1 [P l (x) exp rl x].
pk +1
Comme l−1
est un automorphisme de E pl,rl , on en déduit
k=1 (D − rk I)
que P l exp(rl ·) = 0 et donc que y = 0.
Ce lemme et le théorème de structure montrent que ker L(D) est la
somme directe des sous-espaces vectoriels de dimension mj E mj −1,rj , (1 ≤
j ≤ q). Donc ker L(D) est de dimension n et comme la famille de fonctions
{x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1} constitue une base de E mj −1,rj , (1 ≤
j ≤ q), la famille F ci-dessus constituera une base de ker L(D). On a donc
prouvé le résultat suivant.
299
8.3. EQUATIONS NON HOMOGÈNES
Corollaire. L’ensemble des solutions complexes de l’équation différentielle
(8.7) est le sous-espace vectoriel de C ∞ de dimension n engendré par la
famille de fonctions
F = {x 2→ xk exp rj x : 0 ≤ k ≤ mj − 1, 1 ≤ j ≤ q},
où les rj sont les racines caractéristiques et mj leurs multiplicités.
Exemple. Considérons l’équation différentielle linéaire homogène du second
ordre
a2 y $$ (x) + a1 y $ (x) + a0 y(x) = 0,
(8.12)
où les aj ∈ C, (0 ≤ j ≤ 2). L’équation caractéristique correspondante est
a2 z 2 + a1 z + a0 = 0.
Dès lors, si a21 − 4a2 a0 /= 0, les racines caractéristiques
r1 =
−a1 −
G
a21 − 4a2 a0
2a2
, r2 =
−a1 +
G
a21 − 4a2 a0
2a2
,
sont simples (m1 = m2 = 1), et les solutions de (8.12) sont donc les fonctions
de la forme
y(x) = c1 exp r1 x + c2 exp r2 x,
où c1 et c2 sont des nombres complexes arbitraires.
Si a21 − 4a2 a0 = 0, l’équation caractéristique possède la racine double
r1 = −
a1
2a2
(m1 = 2) et les solutions de (8.12) sont les fonctions de la forme
y(x) = (c1 + c2 x) exp r1 x,
où c1 et c2 sont des nombres complexes arbitraires.
8.3
Equations non homogènes
Si les aj ∈ K, (0 ≤ j ≤ n) avec an /= 0 et si f est une application de R dans
K, considérons maintenant l’équation différentielle non homogène
L(D)y ≡
n
$
j=0
aj y (j)(x) = f (x).
(8.13)
300
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
L’équation (8.7)
L(D)y ≡
n
$
aj y (j) (x) = 0
j=0
est appelée l’équation homogène associée à (8.13).
Le résultat suivant montre que la détermination de toutes les solutions de
(8.13) revient à celle de toutes les solutions de l’équation homogène associée
et d’une solution de l’équation (8.13).
Proposition. Soit v une solution de l’équation (8.13). Alors toute solution
y de l’équation (8.13) est de la forme y = u+v où u est solution de l’équation
homogène associée à (8.13).
Démonstration. Soient v et y deux solutions de (8.13); on a donc
n
$
aj v (j)(x) = f (x),
j=0
n
$
aj y (j)(x) = f (x),
j=0
pour tout x ∈ R, et dès lors, par soustraction membre à membre,
n
$
j=0
aj (y − v)(j)(x) = 0,
pour tout x ∈ R, ce qui montre que y − v est une solution u de l’équation
homogène associée.
Il résulte de cette proposition que la détermination de la forme générale
de la solution de l’équation (8.13) revient à la détermination de la forme
générale de l’équation homogène associée à (8.13), problème résolu au paragraphe précédent, et à celle d’une solution particulière de l’équation (8.13).
Le raisonnement fait dans le cas homogène pour démontrer la régularité
des solutions s’étend immédiatement au cas non homogène. Les détails sont
laissés au lecteur.
Proposition. Si la fonction f est indéfiniment dérivable sur R, alors toute
solution de l’équation (8.13) est indéfiniment dérivable sur R.
Enfin, l’obtention d’une solution de (8.13) est souvent facilitée par le
résultat suivant.
Proposition. Si les applications fj de R dans K sont telles que f =
et si yj est solution de l’équation différentielle
L(D)(y) = fj ,
%s
j=1 fj ,
301
8.3. EQUATIONS NON HOMOGÈNES
(1 ≤ j ≤ s), alors y =
%s
j=1 yj
est solution de (8.13).
Démonstration. On a, par linéarité de l’opérateur L(D),


s
s
s
$
$
$
L(D)y = L(D) 
yj  =
L(D)yj =
fj = f.
j=1
j=1
j=1
La recherche d’une solution particulière de (8.13) lorsque f est donné est
un problème difficile sur lequel nous reviendrons par la suite. Nous allons le
résoudre dans cette section dans le cas particulier où f est une exponentiellepolynôme, c’est-à-dire lorsque
f (x) = Qp(x) exp(rx),
où Qp est un polynôme à coefficients dans C de degré inférieur ou égal à p et
r ∈ C. Nous aurons besoin pour ce faire de quelques résultats préliminaires
de nature algébrique.
Soit s ∈ C, q ∈ N, m ∈ N et soit E m,q,s ⊂ E m+q,s l’ensemble défini par
E m,q,s = {y : R → C : y(x) = xm P (x) exp sx où P est un polynôme
sur C de degré inférieur ou égal à q}.
On vérifie sans peine que E m,q,s est un espace vectoriel sur C de dimension
q + 1 et que E 0,q,s = E q,s .
Lemme. Pour chaque m ≥ 1, D − sI est un isomorphisme de E m,q,s sur
E m−1,q,s.
Démonstration. Comme dim E m,q,s = dim E m−1,q,s, il suffit de démontrer que D − sI applique E m,q,s dans E m−1,q,s et est injectif. Si y(x) =
xm P (x) exp sx, avec P un polynôme sur C de degré inférieur ou égal à q,
alors, par la formule (8.9), on a
(D − sI)[xmP (x) exp sx] = (exp sx)D[xm P (x)]
= (exp sx)[mxm−1 P (x) + xm P $ (x)],
ce qui entraı̂ne que (D − sI)y ∈ E m−1,q,s et, si (D − sI)y = 0, que
xm P (x) = c, x ∈ R,
où c est une constante complexe; en faisant x = 0, on trouve c = 0 et donc
y = 0.
302
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
On en déduit aussitôt le résultat suivant.
Corollaire. Pour chaque m ≥ 1, (D − sI)m est un isomorphisme de E m,q,s
sur E q,s.
Considérons maintenant l’équation différentielle
L(D)y(x) = Qp (x) exp rx,
(8.14)
où r ∈ C et Qp est un polynôme à coefficients dans C de degré p. Convenons
aussi de dire que r ∈ C est racine caractéristique de multiplicité zéro de
l’équation algébrique L(z) = 0 si r n’est pas racine de cette équation.
Théorème. L’équation différentielle non homogène (8.14) possède toujours
une solution particulière de la forme
y(x) = xm Rp (x) exp rx,
où m est la multiplicité de r comme racine de l’équation caractéristique
L(z) = 0 de l’équation homogène associée à (8.13) et Rp (x) est un certain polynôme complexe de degré inférieur ou égal à p dont les coefficients
dépendent linéairement de ceux de Qp.
Démonstration. L’équation (8.14) peut évidemment s’écrire sous la forme
équivalente
q
6
j=1
(D − rj I)mj y(x) = a−1
n Qp (x) exp rx,
où les rj sont les racines caractéristiques, de multiplicités respectives mj , de
l’équation homogène associée (1 ≤ j ≤ q). Supposons tout d’abord que r ne
soit pas racine de l’équation caractéristique L(z) = 0. Alors, on a vu plus
=
haut que l’opérateur qj=1 (D − rj I)mj est un automorphisme de E p,r et il
existera donc un unique élément Rp (·) exp(r·) ∈ E p,r tel que
q
6
j=1
(D − rj I)mj [Rp(x) exp rx] = a−1
n Qp (x) exp rx.
En conséquence, y = Rp (·) exp(r·) est une solution de (1.14) et l’on déterminera les coefficients de Rp par la méthode des coefficients indéterminés en
insérant cette solution dans l’équation (8.14), en identifiant les coefficients
de même puissance des polynômes après simplification des deux membres
par exp(r.), et en résolvant le système linéaire en les coefficients de Rp ainsi
obtenu.
303
8.3. EQUATIONS NON HOMOGÈNES
Si r est racine de l’équation caractéristique L(z) = 0, on peut toujours
renuméroter les racines caractéristiques pour que r = rq . L’équation (8.14)
peut s’écrire
q−1
6
j=1
(D − rj I)mj (D − rq I)mq y(x) = a−1
n Qp (x) exp rx.
Comme (D − rq I)mq est un isomorphisme de E mq ,p,rq sur E p,rq et
rj I)mj un automorphisme de E p,rq ,
q−1
6
j=1
=q−1
j=1 (D −
(D − rj I)mj (D − rq I)mq
sera un isomorphisme de E mq ,p,rq sur E p,rq et il existera un élément unique
(·)mq Rp (·) exp(rq ·) ∈ E mq ,p,rq tel que
q−1
6
j=1
(D − rj I)mj (D − rq I)mq [xmq Rp (x) exp(rq x)] = a−1
n Qp (x) exp rq x.
Donc, y(x) = xmq Rp(x) exp(rq x) est une solution particulière de (8.14) et
l’on pourra également déterminer les coefficients de Rp par la méthode des
coefficients indéterminés.
Exemple. Considérons l’équation différentielle non homogène du second
ordre
a2 y $$ (x) + a1 y $ (x) + a0 y(x) = (b0 + b1 x) exp rx,
où les aj , bk et r sont des nombres complexes. Utilisons les notations introduites dans l’étude du cas homogène. Si r /∈ {r1 , r2 }, nous savons qu’il
existera une solution de la forme
y(x) = (c0 + c1 x) exp rx.
Introduisons cette expression dans l’équation différentielle, nous trouvons,
après simplification des deux membres par exp rx,
(2a2 r + a1 )c1 + (a2 r 2 + a1 r + a0 )c0 + (a2 r 2 + a1 r + a0 )c1 x = b0 + b1 x,
et dès lors, puisque a2 r 2 + a1 r + a0 = L(r) /= 0,
c1 =
b1
b0 L(r) − b1 L$ (r)
.
, c0 =
L(r)
[L(r)]2
304
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
Si r = r1 /= r2 , alors r est racine de L(z) = 0 de multiplicité un et nous
savons qu’il existera une solution de la forme
y(x) = x(c0 + c1 x) exp rx.
Introduisant cette expression dans l’équation différentielle, nous obtenons,
après simplification, et en notant que L(r) = 0,
2a2 c1 + (a1 + r1 )c0 + 2L$ (r)c1 x = b0 + b1 x,
et dès lors, r étant racine simple, on a L$ (r) /= 0 et
c1 =
b1
b0 L$ (r) − a2 b1
, c0 =
.
$
2L (r)
[L$ (r)]2
Il reste à discuter le cas où r = r1 = r2 est racine double de l’équation
caractéristique. Nous savons alors qu’il existera une solution de la forme
y(x) = x2 (c0 + c1 x) exp rx.
Procédant encore de même et tenant compte du fait que L(r) = L$ (r) = 0,
car r est racine double de L(z) = 0, on trouve
2a2 c0 + 6a2 c1 x = b0 + b1 x,
et dès lors
c0 =
8.4
1
b1
, c1 =
.
2a2
6a2
Solutions réelles
Considérons tout d’abord le cas de l’équation linéaire homogène (8.7) et
supposons les aj réels (0 ≤ j ≤ n). C’est évidemment un cas particulier de
celui traité et les solutions complexes de (8.7) sont données par les fonctions
complexes y définies par
y(x) =
q
$
Pj (x) exp rj x,
j=1
où les rj sont les racines caractéristiques de (8.7) et les Pj des polynômes
arbitraires à coefficients complexes de degré inférieur ou égal à mj − 1, mj
étant la multiplicité de rj . On sait que le caractère réel des aj n’implique
305
8.4. SOLUTIONS RÉELLES
pas le caractère réel des racines caractéristiques rj et l’on a vu que si rj est
non réelle, il ne suffit donc pas de choisir tous les Pj réels pour obtenir une
solution réelle de (8.7).
Si r est une racine non réelle de l’équation caractéristique L(z) = 0, alors,
en prenant le conjugué des deux membres de cette équation, on voit que le
conjugué r̄ de r est également racine de l’équation caractéristique L(z) = 0,
avec la même multiplicité que r. En conséquence, les racines distinctes de
l’équation caractéristique pourront toujours être numérotées comme suit
r1 , r2 , . . . , rp, s1 , s2 , . . ., st , s1 , s2 , . . . , st,
avec les multiplicités respectives
m1 , m2 , . . ., mp, n1 , n2 , . . ., nt , n1 , n2 , . . . , nt,
où les rj , (1 ≤ j ≤ p) sont des nombres réels, sk , (1 ≤ k ≤ t) sont des nombres
complexes non réels et où les entiers 0 ≤ p ≤ q, 0 ≤ t = (q − p)/2, mj (1 ≤
j ≤ p) et nk (1 ≤ k ≤ t) sont tels que
m1 + . . . + mp + 2(n1 + . . . + nt ) = n.
Si nous posons sk = bk + ick , alors sk = bk − ick , (1 ≤ k ≤ t). La solution
générale complexe de (8.7) peut donc s’écrire
y(x) =
p
$
j=1
Pj (x) exp rj x +
t
$
Qk (x) exp sk x +
k=1
t
$
Rk (x) exp sk x,
k=1
où les Pj , Qk , Rk sont des polynômes sur C de degrés inférieurs ou égaux à
mj − 1, nk − 1 et nk − 1 respectivement. Dès lors,
y(x) =
p
$
Pj (x) exp rj x
j=1
+
t
$
k=1
{[Qk (x) + Rk (x)] cos ck x + i[Qk (x) − Rk (x)] sin ck x} exp bk x.
Cette solution sera réelle si nous choisissons les polynômes Pj , Qk + Rk et
i(Qk − Rk ) réels, c’est-à-dire tels que
Pj = Pj , (1 ≤ j ≤ p), Qk + Rk = Qk + Rk ,
i(Qk − Rk ) = i(Qk − Rk ), (1 ≤ k ≤ t),
306
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
ce qui équivaut à prendre Pj réel (1 ≤ j ≤ p) et Qk et Rk complexes
conjugués (1 ≤ k ≤ t). Réciproquement, si la solution y est réelle, alors on a
y(x) = y(x) pour tout x ∈ R, et dès lors, en utilisant son expression donnée
ci-dessus, et le fait que exp ax = exp āx, on obtient
p
$
j=1
[Pj (x) − Pj (x)] exp rj x +
+
t
$
k=1
Puisque la famille
t
$
k=1
[Qk (x) − Rk (x)] exp sk x
[Rk (x) − Qk (x)] exp sk x = 0, x ∈ R.
F = {x 2→ xl exp rj x : 0 ≤ l ≤ mj − 1, 1 ≤ j ≤ p;
x 2→ xl exp sk x : 0 ≤ l ≤ nk − 1, 1 ≤ k ≤ t;
x 2→ xl exp sk x : 0 ≤ l ≤ nk − 1, 1 ≤ k ≤ t},
est libre, on déduit aussitôt de l’identité précédente que, pour toute solution
réelle y de (8.7), on a
Pj = Pj , (1 ≤ j ≤ p), Qk = Rk , (1 ≤ k ≤ t),
qui est par conséquent une condition nécessaire et suffisante pour que y soit
réelle. Si cette condition est vérifiée, alors on a
y(x) =
p
$
Pj (x) exp rj x + 28[
j=1
t
$
Qk (x) exp sk x],
k=1
où les Pj sont des polynômes réels arbitraires de degré inférieur ou égal à
mj − 1 (1 ≤ j ≤ p) et les Qk sont des polynômes complexes arbitraires de
degré inférieur ou égal à nk − 1 (1 ≤ k ≤ t). Les Qk peuvent donc toujours
s’écrire sous la forme
Qk (x) = (1/2)[Bk (x) − iCk (x)]
où les Bk et Ck sont des polynômes réels arbitraires de degré inférieur ou
égal à nk − 1 (1 ≤ k ≤ t), ce qui donne finalement la formule générale
y(x) =
p
$
j=1
Pj (x) exp rj x +
t
$
[Bk (x) cos ck x + Ck (x) sin ck x] exp bk x,
k=1
et achève la démonstration du résultat suivant.
307
8.4. SOLUTIONS RÉELLES
Proposition. Si tous les coefficients aj sont réels dans l’équation (8.7), alors
y est une solution réelle de (8.7) si et seulement si elle est de la forme
y(x) =
p
$
Pj (x) exp rj x +
j=1
t
$
[Bk (x) cos ck x + Ck (x) sin ck x] exp bk x,
k=1
où les rj sont les racines réelles, de multiplicités respectives mj , de l’équation caractéristique (1 ≤ j ≤ p), bk et ck sont respectivement les parties
réelles et imaginaires des racines non réelles, de multiplicités respectives nk ,
de l’équation caractéristique (1 ≤ k ≤ t) et où les Pj , Bk et Ck sont des
polynômes arbitraires à coefficients réels de degrés respectivement inférieurs
ou égaux à mj − 1, nk − 1 et nk − 1, (1 ≤ j ≤ p, 1 ≤ k ≤ t).
Remarque. On vérifie sans peine que si y est solution d’une équation
différentielle linéaire homogène à coefficients réels, alors ȳ l’est aussi. Dès
lors, puisque l’ensemble des solutions complexes de (8.7) est un espace vectoriel sur C et que
8y = (1/2)(y + ȳ), 9y = (1/2i)(y − ȳ),
on voit que 8y et 9y seront aussi solutions de (8.9) et seront des solutions
réelles. Cette remarque peut faciliter la détermination des solutions réelles
d’une équation différentielle homogène à coefficients réels.
Exemple. Revenons à l’équation différentielle linéaire homogène du second
ordre (8.12)
a2 y $$ (x) + a1 y $ (x) + a0 y(x) = 0,
mais supposons maintenant que les coefficients aj (0 ≤ j ≤ 2) sont réels.
L’équation caractéristique correspondante est
a2 z 2 + a1 z + a0 = 0.
Dès lors, si a21 − 4a2 a0 > 0, les racines caractéristiques
r1 =
−a1 −
G
a21 − 4a2 a0
2a2
, r2 =
−a1 +
G
a21 − 4a2 a0
2a2
,
sont toutes deux réelles et simples (m1 = m2 = 1), et les solutions réelles de
(8.12) sont donc les fonctions de la forme
y(x) = c1 exp r1 x + c2 exp r2 x,
308
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
où c1 et c2 sont des nombres réels arbitraires. Si a21 − 4a2 a0 < 0, les racines
caractéristiques
r1 =
G
−a1 − i 4a2 a0 − a21
2a2
, r2 =
G
−a1 + i 4a2 a0 − a21
2a2
= r1 ,
sont complexes conjuguées non réelles et simples (m1 = m2 = 1), et en
posant r1 = b − ic, r2 = b + ic, les solutions réelles de (8.12) sont les fonctions
de la forme
y(x) = [c1 cos cx + c2 sin cx] exp bx,
où c1 et c2 sont des nombres réels arbitraires. Si a21 − 4a2 a0 = 0, l’équation
caractéristique possède la racine réelle double
r1 = −
a1
2a2
(m1 = 2) et les solutions réelles de (8.12) sont les fonctions de la forme
y(x) = (c1 + c2 x) exp r1 x,
où c1 et c2 sont des nombres réels arbitraires.
Passons maintenant au cas d’une équation différentielle linéaire non homogène
L(D)y ≡
n
$
aj y (j) (x) = f (x),
j=0
dont nous supposons les coefficients aj réels. Si y est solution de cette
équation, alors, en conjugant les deux membres, on trouve
L(D)ȳ = f¯,
ce qui entraı̂ne aussitôt, par combinaison linéaire de ces deux équations, que
L(D)(8y) = 8f, L(D)(9y) = 9f.
En d’autres termes, si y est solution de l’équation différentielle non homogène
L(D)y = f et si les coefficients de L(D) sont réels, alors 8y et 9y seront
respectivement des solutions réelles des équations non homogènes réelles
L(D)y = 8f, L(D)y = 9f.
En conséquence, si une équation différentielle non homogène
L(D)y = g
309
8.4. SOLUTIONS RÉELLES
dont les coefficients et le second membre sont réels, est telle que g puisse
s’écrire g = 8f ou g = 9f pour une certaine exponentielle-polynôme complexe f , et si l’on a déterminé une solution v de l’équation L(D)y = f , alors
8v ou 9v sera une solution de L(D)y = g. Cette remarque peut faciliter
l’obtention d’une solution particulière réelle lorsque g est le produit d’un
polynôme par une fonction trigonométrique.
Exemple. Considérons par exemple l’équation différentielle
y $$ (x) + γy(x) = cos ωx,
où γ est un réel et ω > 0. Comme cos ωx = 8 exp iωx, une solution particulière réelle de cette équation s’obtiendra en prenant la partie réelle d’une
solution particulière complexe de l’équation
y $$ (x) + γy(x) = exp iωx.
Les racines caractéristiques de l’équation caractéristique de l’équation homogène associée sont données par
√
r1 = − −γ = −r2
si γ < 0, par
r1 = r2 = 0
si γ = 0 et par
√
r1 = −i γ = −r2
si γ > 0. La méthode des exponentielles-polynômes développée dans la
section précédente fournit donc la solution particulière complexe suivante :
y(x) =
si γ /= ω 2 et
1
exp iωx
γ − ω2
x
exp iωx
2iω
si γ = ω 2 , ce qui donne, en prenant la partie réelle, les solutions particulières
réelles de l’équation de départ
y(x) =
y(x) =
si γ /= ω 2 et
1
cos ωx,
γ − ω2
y(x) =
x
sin ωx
2ω
310
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
si γ = ω 2 . Ce dernier cas illustre le phénomène bien connu de résonance en
mécanique et en physique : lorsque γ = ω 2 , la fréquence ω de l’excitation
√
extérieure cos ωx est égale à la fréquence propre γ de l’oscillateur régi par
l’équation différentielle homogène associée
y $$ + γy = 0,
et, puisque la solution réelle générale est donnée par
y(x) = c1 cos ωx + c2 sin ωx +
x
sin ωx,
2ω
la présence du facteur x montre que l’amplitude des oscillations augmentera
indéfiniment lorsque x tend vers +∞.
8.5
Problème de Cauchy
Soit maintenant A une application linéaire de Kn dans Kn , f une application
continue de R dans Kn .
Définition. On appelle système différentiel linéaire sous forme normale
toute équation différentielle de la forme
z $ (x) = Az(x) + f (x), x ∈ R.
(8.15)
dont l’inconnue est une fonction z de R dans Kn . Une solution sur R de (8.15)
est une application z de R dans Kn dérivable sur R et vérifiant l’équation en
chaque x ∈ R.
Si
n
$
aj y (j)(x) = h(x)
(8.16)
j=0
est une équation différentielle linéaire d’ordre n à coefficients dans K, on peut
la ramener à un système différentiel linéaire sous forme normale en posant
y(x) = z1 (x), y $ (x) = z2 (x), y $$ (x) = z3 (x), . . . , y (n−1) (x) = zn (x),
ce qui entraı̂ne les relations
$
z1$ = z2 , z2$ = z3 , . . . , zn−1
= zn ,
311
8.5. PROBLÈME DE CAUCHY
et, en utilisant l’équation, la relation
n−1
$
aj zj+1 (x) + an zn$ (x) = h(x).
j=0
Dès lors, si y est solution de (8.16), la fonction z(x) = (z1 (x), . . ., zn (x))
vérifie le système différentiel (8.15) avec

et
Az = z2 , z3 , . . . , zn, −
4
f (x) = 0, . . . , 0,
n
$
aj−1
j=1
an

zj 
5
h(x)
.
an
Réciproquement, on vérifie sans peine que si z est solution de (8.15) pour
l’application A et l’application f ci-dessus, sa première composante z1 sera
solution de (8.16).
Définition. Etant donné le système (8.15), x0 ∈ R et z0 ∈ Kn , on appelle
problème de Cauchy de condition initiale z0 en x0 la recherche d’une solution
z sur R de (8.15) telle que
z(x0 ) = z0 .
Dans le cas de l’équation différentielle linéaire à coefficients constants
d’ordre n (8.13), le problème de Cauchy revient, comme on le vérifie immédiatement, à rechercher une solution de l’équation telle que
y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1 ,
où les yj , (0 ≤ j ≤ n − 1) sont donnés dans K.
Montrons que le problème de Cauchy a au plus une solution.
Proposition. Pour chaque x0 ∈ R et chaque z0 ∈ Kn , il existe au plus une
solution du problème de Cauchy pour l’équation (8.15).
Démonstration. En passant aux parties réelles et imaginaires des composantes de z, le cas où K = C se ramène au cas où K = R avec n remplacé
par 2n. Il suffit donc de considérer le cas où K = R. Si z et w sont solutions
du problème de Cauchy pour (8.15) de condition initiale z0 en x0 , alors, par
soustraction, la fonction u = z − w sera solution du problème de Cauchy
u$ (x) = Au(x), (x ∈ R), u(x0 ) = 0.
312
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
Dès lors, par les propriétés élémentaires de la dérivée , on aura
(|u(x)|22)$ = 2(u(x)|u$(x)) = 2(Au(x)|u(x)), x ∈ R.
L’inégalité de Cauchy et les propriétés des applications linéaires entraı̂nent
que
|(Au(x)|u(x))| ≤ |Au(x)|2|u(x)|2 ≤ K|u(x)|22, x ∈ R,
pour une certaine constante positive K, et dès lors, en posant v(x) =
|u(x)|22, x ∈ R, on aura
−2Kv(x) ≤ v $ (x) ≤ 2Kv(x), x ∈ R.
L’inégalité de droite entraı̂ne
v $ (x) exp(−2Kx) − 2Kv(x) exp(−2Kx) ≤ 0,
c’est-à-dire
[v(x) exp(−2Kx)]$ ≤ 0.
En conséquence, v(·) exp(−2K·) est décroissante et, par construction, positive. Comme elle s’annule en x = x0 , elle doit être nulle pour tout x ≥ x0 et
dès lors v(x) et u(x) sont nuls pour x ≥ x0 . De même, l’inégalité de gauche
entraı̂ne
v $ (x) exp(2Kx) + 2Kv(x) exp(2Kx) ≥ 0,
c’est-à-dire
[v(x) exp(2Kx)]$ ≥ 0.
En conséquence, v(·) exp(2K·) est croissante et, par construction, positive.
Comme elle s’annule en x = x0 , elle doit être nulle pour tout x ≤ x0 et dès
lors v(x) et u(x) sont nuls pour x ≤ x0 . Donc z(x) = w(x) pour tout x ∈ R
et la démonstration est complète.
Corollaire. Si h est une application continue de R dans K, a ∈ R et yj ∈
K, (0 ≤ j ≤ n − 1), le problème de Cauchy
n
$
j=0
aj y (j) (x) = h(x), x ∈ R,
y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1
possède au plus une solution sur R.
En combinant ce corollaire avec les théorèmes d’existence obtenus plus
haut, on obtient le théorème d’existence et d’unicité suivant.
8.5. PROBLÈME DE CAUCHY
313
Corollaire. Si h est une combinaison linéaire d’exponentielles-polynômes
de R dans K, x0 ∈ R et yj ∈ K, (0 ≤ j ≤ n − 1), le problème de Cauchy
n
$
j=0
aj y (j) (x) = h(x), x ∈ R,
y(x0 ) = y0 , y $ (x0 ) = y1 , . . . , y (n−1)(x0 ) = yn−1
possède une solution unique sur R.
Remarque. Si I est un intervalle de R, x0 ∈ I, y0 ∈ Rn et f une application
continue de I × Rn dans Rn , le problème de Cauchy (local) de condition
initiale y0 en x0 pour le système différentiel sous forme normale
y $ (x) = f (x, y(x)),
est la détermination d’un sous-intervalle J ⊂ I contenant x0 et d’une solution
y du système différentiel définie sur J et telle que
y(x0 ) = y0 .
Dans le cas d’une équation différentielle du second ordre décrivant le mouvement d’un point matériel,
u$$ (x) = g(x, u(x), u$(x)),
et qui peut évidemment s’écrire sous la forme normale équivalente
y1$ (x) = y2 (x), y2$ (x) = g(x, y1(x), y2 (x)),
en posant y1 = u, y2 = u$ , la donnée des conditions de Cauchy revient à la
donnée de la position et de la vitesse à l’instant initial. Le raisonnement fait
plus haut dans le cas d’un système linéaire à coefficients constants montre
que le problème de Cauchy
y $ (x) = f (x, y(x)), y(x0 ) = y0 ,
possède au plus une solution sur tout sous-intervalle J de I contenant x0
lorsque f vérifie sur chaque ensemble du type I × B, où B est un borné de
Rn , la condition de Lipschitz
|f (x, y) − f (x, z)|2 ≤ LB |y − z|2 ,
où LB ≥ 0 est une constante ne dépendant que de B. Le théorème de
la moyenne montre que cette condition de Lipschitz sera satisfaite lorsque
f possède sur I × Rn des dérivées partielles par rapport aux yj qui sont
bornées sur les ensembles I × B. Les méthodes du Chapitre 18 permettront
de démontrer l’existence de cette solution.
314
8.6
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
Exercices
1. Montrer que si l’on introduit les fonctions sinus hyperbolique sinh et
cosinus hyperbolique cosh par
sinh x =
exp x − exp(−x)
exp x + exp(−x)
, cosh x =
,
2
2
alors, si a > 0, les solutions réelles de l’équation différentielle
y (4)(x) − a4 y(x) = 0,
(qui intervient en théorie de l’élasticité) sont données par
y(x) = A sin ax + B cos ax + C sinh ax + D cosh ax,
où A, B, C, D sont des nombres réels arbitraires.
2. Montrer que, si a ∈ R et T > 0, l’équation différentielle
y $$ (x) + ay(x) = 0
possède une solution non nulle vérifiant les conditions aux limites de Dirichlet
y(0) = y(T ) = 0,
si et seulement si
aT 2 = k2 π 2 , (k ∈ N∗ ),
et qu’elle possède une solution non nulle vérifiant les conditions aux limites
de Neumann
y $ (0) = y $ (T ) = 0,
si et seulement si
aT 2 = k2 π 2 , (k ∈ N).
3. Montrer que si a ∈ R et T > 0, l’équation différentielle
y $$ (x) + ay(x) = 0
possède une solution non nulle telle que y(x) = y(x + T ) pour tout x ∈ R
(solution T-périodique) si et seulement si
aT 2 = 4k2 π 2 , (k ∈ N).
315
8.6. EXERCICES
4. On appelle équation différentielle d’Euler toute équation différentielle de
la forme
an xn y (n) (x) + an−1 xn−1 y (n−1) (x) + . . . + a1 xy $ (x) + a0 y(x) = 0,
où n ≥ 1 est un entier et aj ∈ C, (0 ≤ j ≤ n). Une solution sur ]0, +∞[ de
l’équation d’Euler est une fonction y n-fois dérivable sur ]0, +∞[ vérifiant
cette équation sur cet intervalle. Montrer que le changement de variable
défini par
t = log x (et donc x = exp t)
transforme l’équation d’Euler en une équation différentielle linéaire homogène d’ordre n à coefficients constants pour la nouvelle fonction inconnue z
définie par z(t) = y(exp t).
5. Utiliser les résultats de l’exercice précédent pour montrer que, si n ≥ 2
est un nombre réel, les solutions sur ]0, +∞[ de l’équation différentielle
y $$ (x) +
n−1 $
y (x) = 0,
x
sont données par
y(x) = A +
B
xn−2
si n > 2,
et
y(x) = A + B log x si n = 2.
6. On dit que l’équation différentielle linéaire à coefficients constants dans
C
n
$
aj y (j) (x) = 0
j=0
est stable si toutes ses solutions sont bornées sur [0, +∞[. Montrer que
l’équation différentielle est stable si et seulement si les deux conditions suivantes sont remplies :
a) toutes les racines caractéristiques de l’équation ont une partie réelle
négative;
b) les racines caractéristiques purement imaginaires sont simples.
On dit que l’équation différentielle ci-dessus est asymptotiquement stable
si toutes ses solutions tendent vers zéro lorsque x tend vers +∞. Montrer
que l’équation différentielle est asymptotiquement stable si et seulement si
toutes ses racines caractéristiques ont une partie réelle strictement négative.
316
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
7. On considère l’équation de la chaleur
2
Dtu(t, s) − Dss
u(t, s) = 0,
dont les solutions sont des fonction u de R2 dans R de classe C 2 sur R2 .
Cette équation décrit la propagation de la chaleur dans un fil. Déterminer
les solutions de l’équation de la chaleur qui sont de la forme u(t, s) = y(at +
s), avec a un réel non nul et y une fonction de classe C 2 sur R (ondes
progressives). (La fonction y est solution de l’équation différentielle linéaire
à coefficients constants −y $$ (x) + ay $ (x) = 0, ce qui donne
u(t, s) = A + B exp(a2 t + as)).
8. On considère l’équation des télégraphistes
2
2
Dtt
u(t, s) − Dss
u(t, s) + cDtu(t, s) = 0,
(c > 0), dont les solutions sont des fonction u de R2 dans R de classe C 2 sur
R2 . Cette équation décrit la propagation des ondes électromagnétiques dans
un fil conducteur. Déterminer les solutions de l’équation des télégraphistes
qui sont de la forme u(t, s) = y(at + s), avec a un réel non nul et y une
fonction de classe C 2 sur R (ondes progressives). (La fonction y est solution
de l’équation différentielle linéaire à coefficients constants (a2 − 1)y $$ (x) +
cay $ (x) = 0, ce qui donne u(t, s) = A si a = ±1 et
4
u(t, s) = A + B exp −
si a /= ±1).
9. On considère l’équation différentielle
ca
(at + s)
2
a −1
5
mh$$ (x) + rh$ (x) = −mg,
introduite au premier paragraphe, où m > 0, r > 0 et g > 0. Déterminer les
solutions et montrer que, pour toute solution h de cette équation, on a
lim h$ (x) = −
x→+∞
mg
.
r
(Vitesse limite de chute en présence d’un frottement sous l’action de la pesanteur).
10. On considère l’équation différentielle
y $$ (x) + by $ (x) + ay(x) = A sin ωx,
317
8.7. PETITE ANTHOLOGIE
où a > 0, b > 0, ω > 0 et A ∈ R. Déterminer les solutions réelles de cette
équation et montrer que si θ est déterminé par la relation
tg θ =
bω
,
a − ω2
et si y est une solution quelconque de l’équation différentielle, alors
2
3
A
lim y(x) −
sin(ωx − θ) = 0.
2
2
x→∞
[(a − ω ) + ω 2 b2 ]1/2
On dit que les solutions de cette équation s’approchent du régime stationnaire donné par ys (x) = [(a−ω2 )2A+ω2 b2 ]1/2 sin(ωx − θ).
11. Montrer que, si ω et Ω sont des nombres réels, les systèmes d’équations
différentielles réelles
u$$ (x) + ωv $ (x) = 0,
v $$(x) − ωu$ (x) = 0,
et
u$$ (x) + 2ωv $ (x) + Ω2 u(x) = 0,
v $$ (x) − 2ωu$ (x) + Ω2 v(x) = 0,
peuvent se résoudre par la méthode introduite dans ce chapitre.
Suggestion. En posant y = u + iv, les ramener respectivement aux équations
différentielles linéaires complexes
y $$ (x) − iωy $ (x) = 0,
y $$ (x) − 2iωy $ (x) + Ω2 y(x) = 0.
Discuter la nature géométrique de la solution dans le plan complexe. Ces
systèmes interviennent dans différents problèmes de mécanique et de physique mathématique (pendule de Foucault, précession de Larmor).
8.7
Petite anthologie
Monsieur Euler est même parvenu à . . . résoudre l’équation générale
a
dn y
dn−1 y
+
b
+ . . . + X = 0.
dxn
dxn−1
Il se sert à cet effet de la substitution adroite de la quantité exponentielle
Acf x (où c est la quantité dont le logarithme est égal à 1), et de ses différentielles successives, au lieu de y, dy, ddy, etc.; cette substitution transforme
318
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
l’équation proposée en une autre, qui devient une simple équation finie, telle
que
(1 + bf + af 2 ) = 0, lorsque n = 2, ou
(1 + cf + bf 2 + af 3 ) = 0, si n = 3, etc.
Ayant donc trouvé les différentes valeurs de f suivant le degré de l’équation,
et mettant ces différentes valeurs au lieu de f, dans Acf x , on aura autant de
valeurs de y, puisque y = Acf x ; et ces différentes valeurs jointes ensemble
donneront l’intégrale complète de l’équation proposée. Il y a, à la vérité,
ici quelques cas qui pourroient embarrasser, savoir quand quelques-unes des
valeurs de f sont, ou égales, ou imaginaires; mais Euler résout ces difficultés.
Euler avoit d’abord été arrêté par la limitation que X fut égal à zéro; mais
dans la suite, il surmonta cette difficulté; en perfectionnant sa méthode, il
montra comment on pouvoit résoudre complètement l’équation ci-dessus, X
étant une fonction quelconque de x; mais la méthode est trop compliquée,
quoique sûre et complète, pour en pouvoir donner ici même une esquisse.
Jean-Etienne de Montucla, 1802
L’oscillateur harmonique que nous allons étudier possède des équivalents
très proches dans beaucoup de domaines; bien que partant de l’exemple mécanique d’un poids au bout d’un ressort, ou de petites oscillations d’un pendule, ou encore d’autres appareils mécaniques, nous ne faisons en réalité
qu’étudier une certaine équation différentielle. Cette équation apparaı̂t très
souvent en physique comme dans d’autres sciences, et de fait, elle est sousjacente à tant de phénomènes que cela vaut bien la peine de l’étudier. Parmi
ces phénomènes, il y a les oscillations d’une masse accrochée à un ressort;
les oscillations des charges allant et venant dans un circuit électrique; les
vibrations d’un diapason créant des ondes sonores, les vibrations analogues
des électrons dans un atome engendrant des ondes lumineuses; les équations
de fonctionnement d’un servo-mécanisme comme un thermostat régulant la
température; des interactions compliquées au sein de réactions chimiques;
la croissance d’une population de bactéries en interaction avec l’apport de
nourriture et les poisons produits par ces bactéries; des renards mangeant des
lapins mangeant de l’herbe, etc. Tous ces phénomènes suivent des équations
qui sont très semblables les unes aux autres. Ces équations sont appelées
équations différentielles linéaires à coefficients constants.
Richard P. Feynman, 1963
8.7. PETITE ANTHOLOGIE
319
Les équations linéaires [à coefficients constants] constituent pratiquement
l’unique importante classe d’équations différentielles dont la théorie est relativement complète. Cette théorie qui en fait est une branche de l’algèbre
linéaire permet de résoudre totalement les équations linéaires autonomes.
La théorie des équations linéaires est par ailleurs utile comme première approximation dans la résolution de problèmes non linéaires. Elle permet entre
autres d’étudier la stabilité de l’équilibre dans les cas génériques.
Vladimir I. Arnold, 1974
Une intelligence qui, pour un instant donné, connaı̂trait toutes les forces
dont la nature est animée et la situation respective des êtres qui la composent,
si d’ailleurs elle était assez vaste pour soumettre ces données à l’Analyse,
embrasserait dans la même formule les mouvements des plus grands corps
de l’univers et ceux du plus léger atome; rien ne serait incertain pour elle,
et l’avenir, comme le passé, serait présent à ses yeux.
Simon de Laplace, 1795
Dans mes leçons données à l’Ecole Polytechnique, comme dans la plupart des Ouvrages ou Mémoires que j’ai publié sur le Calcul intégral, j’ai
cru devoir renverser cet ordre et placer en premier lieu la recherche, non pas
des intégrales générales, mais des intégrales particulières; en sorte que la
détermination des constantes ou des fonctions arbitraires ne fut plus séparée
de la recherche des intégrales. ... Les constantes arbitraires, que doivent
renfermer les intégrales générales d’un système d’équations différentielles du
premier ordre, se trouvent remplacées par des valeurs particulières des inconnues, correspondant à une valeur particulière de la variable indépendante, et
par conséquent le problème de l’intégration se trouve réduit à un problème
complètement déterminé.
Augustin Cauchy, 1842
Une cause très petite, qui nous échappe, détermine un effet considérable
que nous ne pouvons pas ne pas voir, et alors nous disons que cet effet est
dû au hasard. Si nous connaissions exactement les lois de la nature et la
situation de l’univers à l’instant initial, nous pourrions prédire exactement
la situation de ce même univers à un instant ultérieur. Mais, lors même
que les lois naturelles n’auraient plus de secret pour nous, nous ne pourrons
connaı̂tre la situation initiale qu’approximativement. Si cela nous permet
de prévoir la situation ultérieure avec la même approximation, c’est tout ce
320
CHAPITRE 8. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
qu’il nous faut, nous disons que le phénomène a été prévu, qu’il est régi par
des lois; mais il n’en est pas toujours ainsi, il peut arriver que de petites
différences dans les conditions initiales en engendrent de très grandes dans
les phénomènes finaux; une petite erreur sur les premières produirait une
erreur énorme sur les derniers. La prédiction devient impossible et nous
avons le phénomène fortuit.
Henri Poincaré, 1907
Le problème de Cauchy apparaı̂t en mécanique : le mouvement d’un
système mécanique doit être calculé à partir des lois du mouvement, qui forment un système différentiel, et des positions et vitesses initiales, qui sont
les données définissant une solution particulière de ce système. Le problème
de Cauchy pour les systèmes différentiels ordinaires a été, bien entendu, le
plus important problème mathématique tant que l’artillerie a régi le monde,
tant que la mécanique céleste a été la théorie scientifique principale et triomphante.
Jean Leray, 1963
Chapitre 9
Fonctions primitivables
9.1
Fonctions primitivables et primitives
Le chapitre précédent a montré comment déterminer les solutions d’équations différentielles linéaires de la forme
L(D)y(x) ≡
n
$
aj y j (x) = f (x),
j=0
lorsque les aj sont des nombres complexes et f une exponentielle-polynôme.
Le problème de la détermination des solutions de telles équations pour des
classes plus générales de seconds membres f est un problème difficile (et
parfois impossible), même dans le cas le plus simple où l’équation se réduit
à
y $ (x) = f (x),
c’est-à-dire lorsqu’il s’agit de déterminer les fonctions qui sont les dérivées
d’une fonction donnée (problème inverse de la dérivation).
Soit I un intervalle et f une fonction de R dans Rp définie sur I.
Définition. On dit que f est primitivable sur I s’il existe une fonction F
de R dans Rp dérivable sur I et telle que
F $ (x) = f (x)
pour chaque x ∈ I. Une telle fonction s’appelle une primitive de f sur I.
Pour rappeler la contribution fondamentale d’Isaac Newton à l’élaboration et à l’étude de cette notion, on désignera par N (I, Rp) l’ensemble des
321
322
CHAPITRE 9. FONCTIONS PRIMITIVABLES
fonctions f de R dans Rp qui sont primitivables sur I. Comme la fonction
nulle sur I admet toute fonction constante sur I comme primitive sur I, on
voit que N (I, Rp) n’est pas vide. On voit aussi que, si la primitive de f sur
I existe, elle n’est pas nécessairement unique. En traduisant, en termes de
primitives, le fait qu’une fonction a une dérivée nulle sur un intervalle si et
seulement si elle y est constante, on obtient le résultat suivant.
Proposition. Soit f une fonction de R dans Rp primitivable sur l’intervalle
I. Si F est une primitive de f sur I, alors la fonction G de R dans Rp est
une primitive de f sur I si et seulement si la fonction F − G est constante
sur I.
Démonstration. La condition suffisante est facile puisque, pour tout x ∈
I, on a, si F − G est constante sur I,
G$ (x) = F $ (x) + (G − F )$ (x) = F $ (x) = f (x).
En ce qui concerne la condition nécessaire, on a, par hypothèse, pour tout
x ∈ I,
(F − G)$ (x) = F $ (x) − G$ (x) = f (x) − f (x) = 0,
et dès lors F − G est constante sur I.
Corollaire. Soit f une fonction de R dans Rp primitivable sur l’intervalle
I. Pour chaque a ∈ I et chaque c ∈ Rp il existe une primitive unique F de
f telle que
F (a) = c.
Démonstration. Si G est une primitive de f sur I vérifiant la même
condition, alors, par la proposition précédente, F − G est constante sur I
et, par hypothèse, F (a) − G(a) = 0. Donc F = G sur I et l’unicité est
démontrée.
En particulier, l’unique
primitive F de f sur I telle que F (a) = 0 sera
H
désignée par Fa ou a· f . Les primitives de f sur I seront donc toutes de la
forme Fa + c où c ∈ Rp est arbitraire et, si G est une primitive quelconque
de f sur I, on a évidemment Fa = G − G(a).
La proposition ci-dessus nous conduit à introduire sur l’ensemble des
fonctions de R dans Rp définies sur l’intervalle I la relation = définie comme
suit.
9.1. FONCTIONS PRIMITIVABLES ET PRIMITIVES
323
Définition. Si g et h sont deux fonctions de R dans Rp définies sur l’intervalle I, on écrira
g=h
si g − h est constante sur I.
On vérifie sans peine que = est une relation d’équivalence sur l’ensemble
des fonctions de R dans Rp définies sur I. Si fI et gI sont deux classes
d’équivalence pour = contenant respectivement les fonctions f et g, on
pourra définir la somme fI+ gI par la classe d’équivalence contenant f + g (on
voit sans peine que cette définition ne dépend pas du choix des représentants
f et g), et l’on définira, pour c ∈ R, cfI comme étant la classe d’équivalence
de cf .
La proposition ci-dessus exprime donc qu’à toute fonction f primitivable
sur I correspond une et une seule classe d’équivalence pour = de l’ensemble
des fonctions de RHdans Rp définies sur I. On désigne en général cette classe
d’équivalence par f ou D −1 f et il faut signaler l’abus de notation, consacré
par l’usage, consistant parfois à désigner par le même symbole un élément
choisi dans cette classe d’équivalence, c’est-à-dire une primitive de f sur I.
De nombreuses fonctions élémentaires sont désignées en pratique par
leur valeur en un point x de leur domaine de définition (ainsi l’on parle de
la fonction x2 pour la fonction qui à x associe x2 ) et la notation ci-dessus
est mal adaptée pour de telles fonctions; on utilise alors la notation
J
f (x) dx ou
J
f (t) dt ou
J
f (u) du.
Avec l’abus de notation signalé plus haut, chacune de ces expressions désigne
aussi une primitive de f sur I et non sa valeur en un point x (ou t ou u) !
C’est le rôle du symbole dx ou dt ou du d’annuler l’apparente dépendance
des expressions ci-dessus par rapport à x, t ou u. Les symboles x, t ou u
jouent dans ces formules un rôle “muet” analogue à celui de l’indice dans
une formule sommatoire. Par exemple, on vérifie sans peine que la fonction
H
x 2→ x3 /3 est une primitive sur R de la fonction x 2→ x2 . Dès lors, x2 dx
représente la classe d’équivalence des fonctions f + c où f (x) = x3 /3 et c est
une constante réelle.
Signalons également que deux primitives d’une fonctions donnée sur un
intervalle donné, qui diffèrent entre elles par une constante additive, peuvent
avoir des expressions qui dissimulent sournoisement cette relation simple.
x−c
Ainsi, pour chaque c ∈ R, les fonctions x 2→ sin x et x 2→ 2 sin x+c
2 cos 2
sont deux primitives sur R de la fonction x 2→ cos x, puisque la seconde
324
CHAPITRE 9. FONCTIONS PRIMITIVABLES
fonction n’est rien d’autre que la fonction x 2→ sin x + sin c et celle-ci diffère
de la fonction x 2→ sin x par la constante sin c.
Les fonctions primitivables et leurs primitives possèdent les propriétés
élémentaires suivantes.
Proposition. Si f ∈ N (I, Rp) et g ∈ N (I, Rp), on a les propriétés suivantes.
1. f ∈ N (J, Rp) pour tout intervalle J ⊂ I et la restriction à J de toute
primitive sur I de f est une primitive sur J de f .
2. f + g ∈ N (I, Rp) et
J
(f + g) =
J
f+
H
J
g.
H
3. cf ∈ N (I, Rp) pour tout c ∈ R et cf = c f.
H
4. Chaque composante fj de f appartient à N (I, R), 1 ≤ j ≤ p et fj est la
classe d’équivalence de la jème composante d’une primitive quelconque de f
sur I.
5. Si f ∈ N (I, C), c’est-à-dire si f ∈ N (I, R2) avec R2 muni de la structure
de corps, alors, cf ∈ N (I, C) pour tout c ∈ C et
J
cf = c
J
f.
Démonstration. Les propriétés 1 à 5 sont des conséquences immédiates
des définitions et des propriétés élémentaires des dérivées.
Cette proposition montre que N (I, Rp) (resp. N (I, C)) est un espace
vectoriel sur R (resp. C). Elle nous permet de trouver des classes de fonctions primitivables sur I par combinaison linéaire de fonctions élémentaires
primitivables sur I. De telles fonctions s’obtiennent facilement en lisant “de
droite à gauche” un tableau donnant les dérivées de fonctions élémentaires.
On obtient ainsi le tableau suivant de fonctions appartenant à N (R, R).
Fonctions
x 2→ xm , m ∈ N
x 2→ exp x
x 2→ sin x
x 2→ cos x
1
x 2→ 1+x
2
1
x 2→ √1+x
2
x 2→ sinh x
x 2→ cosh x
Primitives
m+1
x 2→ xm+1 + c
x 2→ exp x + c
x 2→ − cos x + c
x 2→ sin x + c
x 2→ arctg x + c
x 2→ arcsinh x + c
x 2→ cosh x + c
x 2→ sinh x + c
9.1. FONCTIONS PRIMITIVABLES ET PRIMITIVES
325
On déduit aussitôt de ce tableau et de la proposition précédente que si
K désigne R ou C, les fonctions polynômiales de R dans K appartiennent à
N (R, K).
Les fonctions élémentaires suivantes appartiennent à N (R∗+ , R) et à
N (R∗− , R) :
Fonctions
Primitives
−m+1
−m
x 2→ x , m /= 1 x 2→ x−m+1 + c
x 2→ x−1
x 2→ ln |x| + c
Enfin, les fonctions x 2→ xa , a /∈ Z sont dans N (R∗+ , R) et ont pour primitives
a+1
les fonctions x 2→ xa+1 + c, (c ∈ R), les fonctions x 2→ exp ax, où a ∈ K, sont
dans N (R, K) et ont pour primitives les fonctions x 2→ a−1 exp ax+c, (c ∈ K)
1
et la fonction x 2→ √1−x
2 appartient à N (] − 1, 1[, R) et a pour primitives les
fonctions x 2→ arcsin x + c(c ∈ R).
On trouvera de nombreux autres exemples dans les tables de primitives, également appelées, pour des raisons que nous verrons plus loin, tables
d’intégrales.
Nous reviendrons plus tard sur l’obtention de classes de fonctions appartenant à N (I, Rp) pour un certain intervalle I. En particulier, nous
montrerons que toute fonction de R dans Rp continue sur I appartient à
N (I, Rp). Par ailleurs, N (I, Rp) contient des fonctions non continues sur I.
Ainsi, la fonction F de R dans R définie par
F (x) = x2 sin
1
si x /= 0, F (0) = 0,
x2
possède en chaque point x /= 0 la dérivée
F $ (x) = 2x sin
1
2
1
− cos 2
x2 x
x
et en 0 la dérivée F $ (0) = 0, ainsi qu’on le vérifie aisément. Mais la fonction
f = F $ , primitivable sur R, n’est pas continue en 0 puisque limx→0 f (x)
n’existe pas. On notera en outre que la fonction f n’est bornée sur aucun
intervalle contenant l’origine. Donc N (I, Rp) contient des fonctions non
bornées.
On peut se demander s’il existe des fonctions réelles définies sur R et qui
n’appartiennent pas à N (R, R). La réponse affirmative résultera aisément
de la propriété de valeur intermédiaire ou propriété de continuité
de Darboux qui est une condition nécessaire pour qu’une fonction soit
primitivable sur un intervalle.
326
CHAPITRE 9. FONCTIONS PRIMITIVABLES
Proposition. Soit I ⊂ R un intervalle et f ∈ N (I, R). Alors f vérifie la
propriété de valeur intermédiaire sur I. En d’autres termes, pour chaque
x ∈ I, chaque y ∈ I tel que x < y et chaque v compris entre f (x) et f (y), il
existe un z ∈ [x, y] tel que f (z) = v.
Démonstration. Comme dans la démonstration du théorème de Bolzano,
on peut, sans perte de généralité, supposer que f (x) < v < f (y). Soit F une
primitive de f sur I et soit G la fonction de R dans R définie par
G(t) = F (t) − vt.
G est évidemment dérivable sur I et
G$ (t) = f (t) − v,
pour chaque t ∈ I, ce qui entraı̂ne en particulier que
G$ (x) < 0 < G$ (y).
"
En prenant ! = − G 2(x) dans la définition de la dérivée de G en x, on trouve
un δ ∈ ]0, y − x] tel que, pour tout t ∈ ]x, x + δ], on a
et dès lors
G$ (x)
G(t) − G(x)
G$ (x)
≤
− G$ (x) ≤ −
,
2
t−x
2
G(t) − G(x)
G$ (x)
≤
< 0,
t−x
2
ce qui implique, pour chaque t ∈ ]x, x + δ], l’inégalité
G(t) < G(x).
En procédant d’une manière similaire en y, on trouve un δ $ ∈ ]0, y − x] tel
que
G(t) < G(y)
pour tout t ∈ [y − δ $ , y[. Comme G, dérivable sur [x, y], y est continue,
le théorème des bornes atteintes de Weierstrass entraı̂ne l’existence d’un
minimant z de G sur [x, y] et les deux inégalités que nous venons d’obtenir
montrent que, nécessairement, z ∈ ]x, y[, et est donc intérieur au domaine
de G. Le théorème de Fermat entraı̂ne alors que G$ (z) = 0, c’est-à-dire que
f (z) = v.
327
9.2. RÈGLES DE PRIMITIVATION
Remarque. Le résultat que nous venons de démontrer montre que la propriété de valeur intermédiaire, vérifiée par les fonctions réelles continues sur
un intervalle, peut également l’être par des fonctions non continues sur cet
intervalle, et ne peut donc être prise, ainsi qu’on l’a fait parfois dans le
passé, comme définition de fonction continue sur un intervalle. En fait, on
sait maintenant qu’une fonction ayant la propriété de valeur intermédiaire
sur R peut être discontinue en chaque point de R !
Il résulte de la proposition précédente que toute fonction qui, sur un
intervalle I de R, prend un nombre fini strictement supérieur à un de valeurs
réelles ne peut appartenir à N (I, R) puisqu’elle ne peut vérifier la propriété
de valeur intermédiaire. Ainsi, la fonction sgn x (signe de x) définie par
sgn x = −1 pour x < 0, sgn 0 = 0 et sgn x = +1 pour x > 0 n’est primitivable sur aucun intervalle contenant l’origine.
9.2
Règles de primitivation
Les règles de dérivation des fonctions composées et du produit de deux fonctions se traduisent, dans le langage des primitives, en conditions suffisantes
de primitivabilité et en règles de calcul des primitives. Le premier résultat
s’appelle la règle de primitivation par substitution.
Proposition. Soit g une fonction réelle dérivable sur l’intervalle I ⊂ R et f
une fonction de R dans Rp primitivable sur g(I). Alors (f ◦ g)g $ ∈ N (I, Rp)
et
J
J
(f ◦ g)g $ = (
f ) ◦ g.
Démonstration. Si F désigne une primitive de f sur g(I), le théorème
de dérivation des fonctions composées entraı̂ne la dérivabilité sur I de la
fonction F ◦ g et la relation
(F ◦ g)$ = (F $ ◦ g)g $ = (f ◦ g)g $,
ce qui montre que (f ◦ g)g $ ∈ N (I, Rp) et que la formule de l’énoncé est
satisfaite.
Exemple. Si f ∈ N ([−1, 1], Rp), alors les fonctions x 2→ f (sin x) cos x et
x 2→ f (cos x) sin x appartiennent à N (R, Rp) et leurs primitives sont données
respectivement par F ◦ sin +c et F ◦ cos +c où F est une primitive de f sur
[−1, 1].
328
CHAPITRE 9. FONCTIONS PRIMITIVABLES
Corollaire. Si f ∈ N (I, Rp), alors pour tout réel a /= 0, la fonction f (a·) :
x 2→ f (ax) est primitivable sur a−1 I et l’on a
J
f (a·) = a−1
4J
5
f (a·).
Démonstration. Il suffit d’appliquer la proposition précédente avec g
définie par g(x) = ax et le fait que N (a−1 I, Rp) est un espace vectoriel.
Une autre conséquence du théorème de dérivation des fonctions composées est la règle de primitivation par changement de variable.
Proposition. Soient I et J deux intervalles de R et h une bijection de J
sur I telle que h et h−1 soient dérivables sur J et I respectivement. Si f est
une fonction de R dans Rp définie sur I et si (f ◦ h)h$ est primitivable sur
J, alors f est primitivable sur I et
J
f=
4J
5
(f ◦ h)h$ ◦ h−1 .
Démonstration. Par hypothèse, si G désigne une primitive de (f ◦ h)h$
sur J, le théorème de dérivation des fonctions composées appliqué à G ◦ h−1
entraı̂ne sa dérivabilité sur I et la formule
[G ◦ h−1 ]$ = (G$ ◦ h−1 )(h−1 )$ = f.(h$ ◦ h−1 ).(h−1 )$ = f,
puisque, de l’identité h ◦ h−1 = I sur I, on déduit, par le théorème de
dérivation des fonctions composées,
1 = (h ◦ h−1 )$ = (h$ ◦ h−1 )(h−1 )$ .
Donc f est primitivable sur I et la formule de l’énoncé est satisfaite.
Remarque. Avec les notations de la Proposition ci-dessus, on vérifie aisément que la formule
J
f=
4J
5
(f ◦ h)h$ ◦ h−1
reste valable si h−1 n’est plus supposé dérivable sur I à condition de supposer
que f est primitivable sur I.
Exemple. Si P est un polynôme de R dans C et si f est définie par f (x) =
√
P ( x), alors f ∈ N (R∗+ ) et
J
√
f = Q( ·),
329
9.2. RÈGLES DE PRIMITIVATION
pour toute primitive Q du polynôme P̃ : y 2→ 2yP (y). En effet, l’application
h : R∗+ → R∗+ , y 2→ y 2 est une bijection dérivable ainsi que sa réciproque, et
h$ (y) = 2y. Dès lors,
f (h(y))h$ (y) = 2yf (y 2 ) = 2yP (y) = P̃ (y)
pour tout y strictement positif, ce qui entraı̂ne que (f ◦h)h$ , égal sur R∗+ à un
polynôme de R dans C, y est primitivable. Par la proposition ci-dessus, f est
primitivable sur R∗+ et ses primitives sont données par la formule annoncée.
Le résultat suivant, qui s’appelle la règle de primitivation par parties, découle du théorème de dérivation d’un produit de fonctions.
Proposition. Soient f et g deux fonctions à valeurs dans K dérivables sur
un intervalle I ⊂ R. Alors f $ g ∈ N (I, K) si et seulement si f g $ ∈ N (I, K),
auquel cas l’on a
J
J
f $g = f g −
f g $.
Démonstration. Le théorème de dérivation d’un produit de fonctions
entraı̂ne la dérivabilité de f g sur I et la formule
(f g)$ = f $ g + f g $ .
Comme (f g)$ est évidemment primitivable sur I, avec f g comme primitive,
il suffit d’utiliser le caractère d’espace vectoriel de N (I, K) pour achever la
démonstration.
Exemples. 1. La fonction ln est primitivable sur tout intervalle I ⊂ R∗+ et
ses primitives sont données par les fonctions x 2→ x ln x − x + c. En effet,
en prenant f (x) = x, g(x) = ln x, on voit que, pour tout x ∈ R∗+ , on a
ln x = f $ (x)g(x), f (x)g(x) = x ln x et f (x)g $ (x) = 1; donc f g $ est primitivable sur I et ses primitives sont données par la formule ci-dessus.
2. Si P est un polynôme de R dans K et a ∈ K \ {0}, toute exponentiellepolynôme f : x 2→ P (x). exp ax est primitivable sur R. Pour le montrer, on
procède par récurrence sur le degré du polynôme P . C’est évidemment vrai,
par les résultats qui précèdent, si P est un polynôme de degré zéro. Supposons le résultat vrai pour un polynôme de degré n−1 et soit P un polynôme
de degré n. Alors P $ est un polynôme de degré n−1 et P $ (·). exp(a·) est primitivable sur R par l’hypothèse de récurrence. Il en sera de même, par la règle
de primitivation par parties, pour la fonction P (·).(exp(a·))$ = aP (·). exp(a·)
et dès lors pour P (·). exp(a·). En outre, on a
J
P (·). exp(a·) = a−1 P (·). exp(a·) − a−1
J
P $ (·). exp(a·),
330
CHAPITRE 9. FONCTIONS PRIMITIVABLES
et en appliquant cette formule successivement à P $ (·). exp(a·), P $$(·). exp(a·),
. . . et en recombinant les résultats, on obtient la formule
J
P (·). exp(a·) =
[a−1 P (·)−a−2 P $ (·)+. . .+(−1)n−1 a−n P (n−1) (·)+(−1)na−n−1 P (n) (·)] exp(a·).
Montrons enfin que la théorie des primitives fournit une expression du
reste du développement de Taylor d’une fonction réelle d’une variable.
Proposition. Si m ≥ 0 est un entier et si f est une fonction réelle (m + 1)fois dérivable sur un intervalle I, alors, pour chaque a ∈ I, et chaque h ∈ I −a
différent de 0, l’application
φh : I → R, y 2→
f (m+1) (y)
(a + h − y)m
m!
est primitivable sur I et sa primitive Φh,a qui s’annule en a est égale à la
m
valeur Rm
f,a (h) en h du reste du développement de Taylor Tf,a d’ordre m de
f autour de a.
Démonstration. Définissons l’application g de I dans R par
g(y) =
m
$
f (j) (y)
j=0
j!
(a + h − y)j .
m
Par hypothèse, g est dérivable sur I, g(a) = Tf,a
(h), g(a + h) = f (a + h) et,
pour chaque y ∈ I, on a
g $ (y) =
m
$
f (j+1)(y)
j=0
j!
(a + h − y)j −
m
$
f (j) (y)
(j − 1)!
j=1
(a + h − y)j−1
f (m+1) (y)
(a + h − y)m = φh (y).
m!
Donc φh est primitivable et la valeur en a + h de sa primitive s’annulant en
a est donnée par
=
m
g(a + h) − g(a) = f (a + h) − Tf,a
(h) = Rm
f,a(h).
9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES
9.3
331
Primitivation des fonctions rationnelles
Soit f une fonction rationnelle de R dans K, où K = R ou C, c’est-àdire une fonction de la forme f = PQ où P et Q sont des polynômes d’une
variable réelle à coefficients dans K. Si le degré de P est supérieur ou égal
au degré de Q, on peut toujours écrire, en utilisant l’algorithme de division
des polynômes,
P
R
=S+
Q
Q
où S et R sont des polynômes d’une variable réelle à valeurs dans K tels
que le degré de R est strictement inférieur à celui de Q. Comme S est
P
primitivable et que l’on possède une formule pour calculer sa primitive, Q
sera primitivable si et seulement s’il en est de même de R
Q ; il suffit donc
d’étudier la primitivabilité de f sous l’hypothèse que le degré de P est
P
strictement inférieur à celui de Q. Rappelons aussi que Q
est définie sur
P
le complémentaire dom Q dans R de l’ensemble des zéros réels de Q et qu’il
faut donc entendre par primitivabilité de PQ sa primitivabilité sur chacun des
intervalles ouverts qui forment dom PQ . Enfin, si m désigne le degré de Q,
c’est-à-dire si l’on peut écrire
Q(x) =
m
$
aj xj
j=0
avec am /= 0, alors, comme on l’a déjà signalé, le théorème fondamental de
l’algèbre affirme l’existence de q ≤ m nombres complexes distincts s1 , . . ., sq
les racines de l’équation Q(x) = 0, et de q entiers m1 , . . . , mq supérieurs ou
égaux à un, leurs multiplicités, tels que, pour tout x ∈ R, on a
Q(x) = am (x − s1 )m1 (x − s2 )m2 . . . (x − sq )mq .
Enfin, rappelons que l’ensemble des polynômes de R dans K de degré inférieur ou égal à m, muni des lois habituelles d’addition des polynômes et de
multiplication d’un polynôme par un élément de K, forme un espace vectoriel
sur K de dimension m+1 dont une base évidente est donnée par les monômes
1, x, . . ., xm. Une autre base très utile est donnée par le résultat d’algèbre
suivant, qui se démontre par récurrence.
Lemme. Si Q est le polynôme de R dans C de degré effectif m donné par
Q(x) = am (x − s1 )m1 (x − s2 )m2 . . . (x − sq )mq ,
332
CHAPITRE 9. FONCTIONS PRIMITIVABLES
alors les polynômes Qj,k de R dans C donnés par
Qj,k (x) = am (x − s1 )m1 . . . (x − sj )mj −k . . . (x − sq )mq ,
(1 ≤ k ≤ mj , 1 ≤ j ≤ m),
et obtenus en divisant Q respectivement par (x − sj )k , 1 ≤ k ≤ mj , 1 ≤
j ≤ m, forment une base de l’espace vectoriel des polynômes de R dans C
de degré inférieur ou égal à m − 1.
Une conséquence facile de ce lemme est le résultat suivant.
Corollaire. Si Q est donné par le lemme précédent et si P est un polynôme
de R dans C de degré inférieur ou égal à m − 1, il existe une famille unique
de nombres complexes cj,k , (1 ≤ k ≤ mj , 1 ≤ j ≤ m) telle que, pour tout
x ∈ dom PQ , on a
,
-
mj
q
P (x) $ $
cj,k (x − sj )−k .
=
Q(x) j=1 k=1
Ce corollaire entraı̂ne que la primitivabilité de PQ , et le calcul de ses
primitives, revient à celle des fonctions rationnelles particulières du type
g(x) = (x − s)−k
où s ∈ C et k ∈ N∗ . On vérifie sans peine que, pour k ≥ 2, on a, sur chaque
intervalle de R \ {s}, g(x) = G$ (x) pour
G(x) = c + (1 − k)−1 (x − s)−k+1 ,
c étant un nombre complexe arbitraire. Par conséquent, une telle fonction
rationnelle f est primitivable sur chaque intervalle en question et ses primitives sont données par la formule ci-dessus. Si nous posons s = u + iv avec
u la partie réelle de s et v la partie imaginaire de s, les primitives G de g
peuvent encore s’écrire, avec s̄ = u − iv,
F (x) = c + (1 − k)−1
(x − s̄)k−1
.
[(x − u)2 + v 2 ]k−1
Si k = 1 et s = 0, g est primitivable sur R∗− et sur R∗+ et ses primitives G y
sont données par la formule
G(x) = c + ln |x|,
333
9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES
où c est une constante complexe arbitraire. Si k = 1 et s = u est réel, g
est primitivable sur R∗− et sur R∗+ et ses primitives G y sont données par la
formule
G(x) = c + ln |x − u|.
Enfin, si k = 1 et v /= 0, alors, pour tout x ∈ R, on a
x−u
iv
g(x) =
+
2
2
(x − u) + v
(x − u)2 + v 2
2
3
@
d ?
d
x−u
(1/2) ln[(x − u)2 + v 2 ] + i
arctg
dx
dx
v
en utilisant les règles de dérivation des fonctions élémentaires et le théorème
de dérivation des fonctions composées. En conséquence, les primitives G de
g sont données par la formule
x−u
G(x) = c + (1/2) ln[(x − u)2 + v 2 ] + i arctan
.
v
En conclusion, quels que soient s ∈ C et k ∈ N∗ , la fonction g est primitivable sur chaque intervalle contenu dans son domaine et les formules
ci-dessus fournissent les primitives dans les différents cas. Ces résultats,
joints au corollaire ci-dessus et au caractère d’espace vectoriel de N (I, K),
impliquent la primitivabilité de PQ sur tout intervalle I contenu dans son
domaine et fournissent explicitement ses primitives.
La méthode que nous venons de développer s’applique bien entendu au
cas particulier des fonctions rationnelles de R dans R mais l’on sait que les
zéros sj d’un polynôme Q réel peuvent être complexes non réels ainsi que
les coefficients cj,k donnés par le corollaire ci-dessus. Si PQ est une fonction
rationnelle de R dans R, il est intéressant d’exprimer ses primitives en termes
purement réels. Pour ce faire, rappelons que si Q est réel et si sj est un zéro
non réel de Q de multiplicité mj , alors sj sera également un zéro de Q de
même multiplicité mj . En conséquence, les zéros de Q pourront être rangés
comme suit
r1 , . . . , rl , t1 , . . . , tn , t1 , . . . , tn ,
=
avec les multiplicités respectives
m1 , . . . , ml , m$1 , . . . , m$n, m$1 , . . . , m$n ,
où les rj sont réels, les tj sont complexes non réels, l + 2n = q et
%
2 nj=1 m$j = m. On a donc, par le corollaire ci-dessus
l
mj
n
m"j
%l
j=1
mj +
$$
P (x) $ $
cj,k (x − rj )−k +
[c$j,k (x − tj )−k + c$$j,k (x − tj )−k ],
=
Q(x) j=1 k=1
j=1 k=1
334
CHAPITRE 9. FONCTIONS PRIMITIVABLES
les constantes complexes cj,k , c$j,k et c$$j,k étant univoquement déterminées.
En égalant le complexe conjugué des deux membres de cette égalité et en
utilisant le caractère réel de x, P (x), Q(x) et rj , on obtient
m"j
mj
l $
n $D
E
$
P (x) $
=
cj,k (x − rj )−k +
c$j,k (x − tj )−k + c$$j,k (x − tj )−k ,
Q(x) j=1 k=1
j=1 k=1
et dès lors l’unicité des constantes cj,k , c$j,k et c$$j,k entraı̂ne que
cj,k = cj,k , (1 ≤ k ≤ mj ; 1 ≤ j ≤ l),
c$j,k = c$$j,k , (1 ≤ k ≤ m$j ; 1 ≤ j ≤ l).
Les fonctions cj,k (x − rj )−k sont réelles et primitivables sur ] − ∞, rj [ et
]rj , +∞[, et y ont comme primitives les fonctions
x 2→ c + cj,k (1 − k)−1 (x − rj )−k+1 ,
si k /= 1, et
x 2→ c + cj,k ln |x − rj |,
si k = 1, où c est une constante réelle arbitraire. Par ailleurs, les fonctions
x 2→ c$j,k (x − tj )−k + c$$j,k (x − tj )−k = c$j,k (x − tj )−k + c$j,k (x − tj )−k
=
c$j,k (x − tj )k + c$j,k (x − tj )k
[(x − uj
)2
+ vj2 ]k
=
Pk (x)
,
[(x − uj )2 + vj2 ]k
où l’on a posé tj = uj + ivj et où Pk désigne un polynôme réel de degré
inférieur ou égal à k, se ramènent, après division du polynôme Pk par le
polynôme [(x − uj )2 + vj2 ]p où p est le plus grand entier tel que 2p ≤ k, à des
fonctions hr du type
hr (x) =
a + bx
,
[(x − uj )2 + vj2 ]r
où r est un entier compris entre 1 et k, vj /= 0 et a, b ∈ R. Si b = 0, la
primitivation de hr se ramène, par changement de variable y = x − uj , à
1
la primitivation de fonctions du type gr (y) = (y2 +v
2 )r . Pour r = 1, g1 est
primitivable sur R et ses primitives sont les fonctions G1 données par
G1 (y) =
1
y
arctg .
v
v
335
9.3. PRIMITIVATION DES FONCTIONS RATIONNELLES
Pour r > 1, comme
v 2 gr (y) =
on aura
J
(y 2 + v 2 ) − y 2
y2
= gr−1 (y) − 2
,
2
2
r
(y + v )
(y + v 2 )r
gr = v −2
J
gr−1 − v −2
J
Mais,
(y 2
y2
dy.
+ v 2 )r
2
3
y2
1
1
d
=−
,
y
2
(y + v 2 )r
2r − 2 dy (y 2 + v 2 )r−1
et la formule de primitivation par parties entraı̂ne la relation
J
y2
1
dy = −H +
2
2
r
(y + v )
2r − 2
= −H +
où H est définie par
H(y) =
Dès lors,
J
gr = v
1
2r − 2
J
J
(y 2
1
dy
+ v 2 )r−1
gr−1 ,
1
y
.
2
2r − 2 (y + v 2 )r−1
−2
2
2r − 3
2r − 2
J
3
gr−1 + H ,
H
ce qui permet,
de proche en proche, de ramener le calcul de gr à celui,
H
connu, de g1 . Lorsque b /= 0, la primitivation de la fonction hr se ramène
à la primitivation d’une fonction de type précédent et d’une fonction fr de
la forme
x
fr (x) =
.
[(x − uj )2 + vj2 ]r
Le changement de variable y = (x − uj )2 + vj2 ramène le calcul de cette
primitive à celui de la fonction y 2→ y −r , considéré plus haut.
En rassemblant ces résultats, on obtient une primitive réelle de PQ sur
tout intervalle contenu dans le domaine de la fonction.
336
9.4
CHAPITRE 9. FONCTIONS PRIMITIVABLES
Fonctions irrationnelles, transcendantes
Nous allons indiquer dans ce paragraphe quelques types de fonctions irrationnelles ou transcendantes élémentaires dont la primitivation se ramène,
par un changement de variable adéquat à celle de fonctions rationnelles. La
liste donnée est loin d’être exhaustive et l’on pourra consulter à ce sujet les
tables de primitives.
Soit P un polynôme irréductible de R2 dans R et C la courbe algébrique
d’équation
P (x, y) = 0.
On appelle intégrale abélienne attachée à la courbe C (on devrait plutôt
dire primitive abélienne mais l’usage a consacré la terminologie précédente)
toute primitive d’une fonction (de x) du type R(x, y) où R est une fonction
rationnelle de R2 dans R et où y est remplacé par une des racines y(x) de
l’équation ci-dessus. Si l’on peut trouver deux fonctions rationnelles M et
N et un intervalle I tels que cette équation soit satisfaite si et seulement si
x = M (t), y = N (t), (t ∈ I),
on dit que la courbe C est unicursale et l’intégrale abélienne attachée à C
se ramène à la primitive de la fonction rationnelle t 2→ R[M (t), N (t)]M $(t).
L’obtention des fonctions M et N (c’est-à-dire l’uniformisation de C par des
fonctions rationnelles) est un problème difficile. Nous nous contenterons de
donner quelques exemples simples.
8
G
9
2
a. f (x) = R x, m ax+b
cx+d où R est une fonction rationnelle de R dans
K, m ∈ N∗ , a, b, c, , d ∈ R.
Si m est pair, on doit bien entendu se limiter aux valeurs de x pour
lesquelles ax+b
cx+d ≥ 0. Il s’agit d’une intégrale abélienne avec
P (x, y) ≡ (cx + b)y m − (ax + b).
Introduisons le changement de variable x = h(t) défini par la relation
−1
t=h
(x) =
K
m
ax + b
,
cx + d
ce qui donne
x = h(t) = −
b − dtm $
mtm−1 (ad − bc)
,
h
(t)
=
,
a − ctm
(ctm − a)2
9.4. FONCTIONS IRRATIONNELLES, TRANSCENDANTES
y=
K
m
337
ah(t) + b
= t.
ch(t) + d
En conséquence, (f ◦ h)h$ est une fonction rationnelle de R dans K, donc
primitivable; dès lors, par le théorème de changement de variable, f sera
primitivable sur tout intervalle I = h(J) tel que h soit injective sur J et l’on
pourra calculer les primitives par les méthodes de la section précédente.
8 √
9
b. f (x) = R x, ax2 + bx + c où R est une fonction rationnelle de
R2 dans K, a, b, c ∈ R, a /= 0.
Il s’agit d’une intégrale abélienne avec
P (x, y) ≡ y 2 − ax2 − bx − c.
On se limitera aux valeurs de x pour lesquelles ax2 + bx + c ≥ 0 et l’on peut
exclure le cas où la fonction x 2→ ax2 + bx + c a un zéro double puisqu’alors
f est une fonction rationnelle.
1. Si a > 0 et b2 − 4ac /= 0, on introduit le changement de variable x = h(t)
par la relation
L
√
t = h−1 (x) = ax + ax2 + bx + c,
ce qui donne
√
√
t2 − c
2( at2 + bt + ac)
$
√
x = h(t) = √
,
, h (t) =
2 at + b
(2 at + b)2
y=
G
√
√
a[h(t)]2 + bh(t) + c = t − (2 at + b)−1 a(t2 − c).
En conséquence, (f ◦ h)h$ est une application rationnelle de R dans K et elle
est donc primitivable sur R. Par le théorème de changement de variable,
f sera primitivable sur tout intervalle I = h(J) tel que h soit injective sur
J, et les primitives F de f seront obtenues
en composant les primitives de
√
√
(f ◦ h)h$ avec la fonction x 2→ ax + ax2 + bx + c.
2. Si a < 0, il faut que b2 − 4ac > 0 et que x ∈ ]p, q[ où p < q sont les zéros
distincts du polynôme ax2 + bx + c. On a, pour tout x ∈ ]p, q[,
L
ax2 + bx + c =
G
a(x − p)(x − q) = (x − p)
K
a(x − q)
.
x−p
Le changement de variables x = h(t) défini par la relation
t = h−1 (x) =
K
a(x − q)
,
x−p
338
CHAPITRE 9. FONCTIONS PRIMITIVABLES
et qui donne
x = h(t) =
G
pt2 − aq $
2at(q − p)
,
, h (t) = 2
2
t −a
(t − a)2
a(p − q)t
,
t2 − a
est tel que (f ◦h)h$ est une fonction rationnelle de R dans K. Par le théorème
du changement de variable, f sera primitivable sur tout intervalle I = h(J)
tel que h soit injective sur J et les primitives F de f seront
G obtenues en
$
composant les primitives de (f ◦ h)h avec la fonction x 2→ a(x−q)
x−p .
y=
a[h(t)]2 + bh(t) + c =
8
L
9
Remarque. Les primitives des fonctions de type f (x) = R x, P (x)
lorsque P est un polynôme de degré p ≥ 3 et R une fonction rationnelle
ne peuvent pas en général s’exprimer au moyen des fonctions élémentaires
et conduisent à des fonctions transcendantes nouvelles appelées intégrales
elliptiques si p = 3, 4 et intégrales hyperelliptiques lorsque p ≥ 5. L’étude
de ces intégrales et des fonctions réciproques correspondantes (en particulier
des fonctions elliptiques) doit se faire dans le cadre de la théorie des fonctions
complexes d’une variable complexe.
c. f (x) = R(cos x, sin x, cos 2x, sin 2x, . . ., cos mx, sin mx), m ∈ N∗ , où R
est une fonction rationnelle de R2m dans K.
En utilisant les formules trigonométriques classiques exprimant cos kx et
sin kx comme polynôme en cos x et sin x, on peut exprimer f sous la forme
f (x) = S(cos x, sin x),
où S est une fonction rationnelle de R2 dans K. En utilisant les relations
trigonométriques connues
cos x =
1 − tg 2 (x/2)
2tg (x/2)
, sin x =
,
1 + tg 2 (x/2)
1 + tg 2 (x/2)
on obtient
S(cos x, sin x) = T [tg (x/2)],
où T est une fonction rationnelle de R dans K. Le changement de variable
x = h(t) défini par la relation
t = h−1 (x) = tg (x/2),
et donc tel que
x = h(t) = 2arctg t, h$ (t) =
2
,
1 + t2
9.5. CALCUL APPROCHÉ DES PRIMITIVES
339
montre que (f ◦ h)h$ = T h$ est une fonction rationnelle de R dans K. Le
théorème de changement de variable assure donc la primitivabilité de f sur
tout intervalle I = h(J) tel que h est injective sur J et les primitives de
(t)
f s’obtiennent en composant les primitives de la fonction t 2→ 2T
avec la
1+t2
fonction t = tg (x/2).
Les quelques exemples que nous venons de donner montrent que, pour
une fonction primitivable sur un intervalle I, le calcul effectif peut être
extrêmement compliqué et aucune méthode générale n’existe. Il faudrait
d’ailleurs d’abord s’entendre sur ce que l’on appelle “calcul effectif”. Au
XIXe siècle, Joseph Liouville donna à cette question la forme classique
suivante : étant donné un ensemble de fonctions réelles d’une variable réelle
appelées fonctions élémentaires, et formé des fonctions qui peuvent s’écrire
en itérant, à partir de la variable x et de constantes, les quatre opérations
d’addition, soustraction, multiplication, division ainsi que la prise de logarithmes, d’exponentielles ou l’extraction de racines de polynômes, calculer
sa primitive ou démontrer qu’elle n’est pas une fonction élémentaire. Liouville donna, entre 1833 et 1841, plusieurs contributions fondamentales à ce
problème qui est encore ouvert. Il a fallu attendre les travaux de Maxwell
Rosenlicht en 1968 pour obtenir une formulation algébrique précise du
problème et des généralisations des résultats de Liouville. Robert Risch en
1969 a prouvé l’existence d’un algorithme répondant à la question ci-dessus
pour le sous-ensemble des fonctions élémentaires dites “purement transcendantes” et J.H. Davenport en 1979 a fait de même pour la sous-classe des
fonctions élémentaires algébriques. En outre, pour des sous-ensembles importants de fonctions, ces algorithmes ont été respectivement programmés
dans le cadre des méthodes de calcul symbolique sur ordinateur MACSYMA
et REDUCE, mais le problème général correspondant reste ouvert.
9.5
Calcul approché des primitives
L’impossibilité de la détermination explicite des primitives d’une fonction
primitivable nous suggère de retourner à l’idée fondamentale de “résolution
approchée indéfiniment précise d’un problème dont la solution exacte est
impossible” qui sous-tend de nombreux concepts fondamentaux de l’analyse
mathématique. Nous allons démontrer qu’étant donné une fonction f primitivable sur un intervalle I, un point a de I, un point x > a de I et un
nombre ! > 0, il est possible d’obtenir (au moins théoriquement) une valeur
approchée de Fa (x) avec une erreur inférieure ou égale à !. C’est l’importante
340
CHAPITRE 9. FONCTIONS PRIMITIVABLES
propriété d’approximation des primitives.
Proposition. Soit f une fonction de R dans Rp primitivable sur l’intervalle
I, a ∈ I et Fa la primitive de f qui s’annule en a. Pour chaque x ∈ I tel que
x > a et chaque ! > 0, il
existe une jauge
δ sur [a, x] telle que, pour toute
A
B
P-partition δ-fine Π = (xj , ]aj−1 , aj ]) 1≤j≤m avec a = a0 < a1 < . . . <
am−1 < am = x, on a
#
#
#
#
m
$
#
#
j
j
j−1 #
#Fa (x) −
f (x )(a − a )# ≤ !.
#
#
#
j=1
2
Démonstration. Soit ! > 0; pour chaque y ∈ I, Fa$ (y) = f (y) et il existe
donc un δ(y) > 0 tel que, pour chaque u ∈ I ∩ [y − δ(y), y + δ(y)], on a
|Fa (u) − Fa (y) − f (y)(u − y)|2 ≤
!
|u − y|;
x−a
dès lors, si u et v appartiennent à I et sont tels que
y − δ(y) ≤ u ≤ y ≤ v ≤ y + δ(y),
on aura
|Fa (v) − Fa (u) − f (y)(v − u)|2
= |Fa (v) − Fa (y) − f (y)(v − y) − [Fa (u) − Fa (y) − f (y)(u − y)]|2
≤ |Fa (v) − Fa (y) − f (y)(v − y)|2 + |Fa (u) − Fa (y) − f (y)(u − y)|2
!
!
!
≤
(|v − y| + |u − y|) =
(v − y + y − u) =
(v − u).
x−a
x−a
x−a
Soit δ : y 2→ δ(y)
la jauge ainsi définie sur I, et donc sur [a, x]. Si Π =
A j
B
(x , ]aj−1 , aj ]) 1≤j≤m avec a = a0 < a1 < . . . < am−1 < am = x, est une
P-partition δ-fine de ]a, x], alors on a
xj − δ(xj ) ≤ aj−1 ≤ xj ≤ aj ≤ xj + δ(xj ), (1 ≤ j ≤ m),
et dès lors, en utilisant l’inégalité ci-dessus,
#
#
#
#
#Fa (aj ) − F (aj−1 ) − f (xj )(aj − aj−1 )# ≤
2
Comme on a évidemment
Fa (x) =
m D
$
j=1
!
(aj − aj−1 ), (1 ≤ j ≤ m).
x−a
E
F (aj ) − F (aj−1 ) ,
341
9.5. CALCUL APPROCHÉ DES PRIMITIVES
on en déduit
#
#
#
#
m
$
#
#
j
j
j−1 #
#Fa (x) −
f (x )(a − a )#
#
#
#
j=1
2
#
#
#m D
E##
#$
j
j−1
j
j
j−1
= ##
Fa (a ) − Fa (a ) − f (x )(a − a ) ##
#
#j=1
2
≤
m #
$
j=1
m
#
$
#
#
#Fa (aj ) − Fa (aj−1 ) − f (xj )(aj − aj−1 )# ≤
2
!
(aj − aj−1 ) = !.
x
−
a
j=1
Lorsque f est à valeurs positives sur [a, x], les expressions
m
$
j=1
f (xj )(aj − aj−1 )
associées à la P-partition Π par le résultat précédent représentent la somme
des aires de rectangles de base [aj−1 , aj ] et de hauteur f (xj ) et peuvent donc
être considérées comme une approximation de l’aire de la figure plane E(f )
définie par
E(f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [a, x]},
c’est-à-dire du polygone curviligne délimité par l’intervalle [a, x] de l’axe des
x1 , par les parallèles à l’axe des x2 menées par les points (a, 0) et (x, 0) et par
le graphe de f . Cette approximation consiste à remplacer l’aire de chaque
figure curviligne constituante
Ej (f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [aj−1 , aj ]}
(1 ≤ j ≤ m) par celle du rectangle de même base et de hauteur f (xj ). Par
conséquent, la quantité Fa (x) approchée indéfiniment par ces expressions
sera un candidat naturel pour la valeur de l’aire de la figure curviligne E(f ).
On obtient ainsi un lien étonnant entre le concept de primitive, directement
issu du concept de dérivée, c’est-à-dire, géométriquement, et la notion de
tangente au graphe de f , de celui d’aire de la figure plane curviligne E(f )
associée à f . C’est la découverte de ce lien par Isaac Newton et par Gottfried Leibniz, il y a plus de trois cents ans, qui a donné naissance au calcul
différentiel et intégral.
342
CHAPITRE 9. FONCTIONS PRIMITIVABLES
9.6
Exercices
1. Montrer que si f et g sont deux fonctions réelles primitivables sur
l’intervalle I et telles que, pour tout x ∈ I, on Hait f (x)H ≤ g(x), alors, pour
tout a ∈ I et tout x ≥ a appartenant à I, on a ax f ≤ ax g.
2. Soient I ⊂ R un intervalle, a ∈ I, f une fonction réelle d’une variable
réelle, g une fonction positive d’une variable réelle et C ≥ 0. Si f g et g sont
primitivables sur I et si, pour tout x ≥ a appartenant à I, on a
J
f (x) ≤ C +
x
f g,
a
alors, pour les mêmes valeurs de x, on a
f (x) ≤ C exp
4J
x
5
g .
a
(Lemme de Gronwall). Ce lemme, qui transforme une inéquation sur f
en une inégalité sur f, joue un rôle important dans l’étude des équations
différentielles.
Suggestion. Utiliser l’hypothèse pour montrer que
2
4
J
D exp −
x
g
a
5J
x
a
3
4
f g ≤ Cg(x) exp −
J
x
5
g .
a
En déduire par l’exercice 1 que
4
exp −
J
x
g
a
5J
x
a
fg ≤ C
J
4
x
a
g exp −
J
553
2
·
a
5
g .
Noter que
J
x
a
4
g exp −
En déduire
J
a
·
5
g =
J
x
a
J
x
a
2
4
4
J
f g ≤ C exp
4J
−D exp −
2
·
g
a
x
a
5
4
= C 1 − exp −
3
J
a
x
g
53
.
g −1 ,
et introduire cette dernière inégalité dans l’hypothèse.
3. Montrer que si a ∈ R∗ , alors, sur tout intervalle de R ne contenant pas
±a, on a
#
#
J
#x − a#
dx
1
#
#
=
log
#x + a# .
x2 − a2
2a
343
9.7. PETITE ANTHOLOGIE
4. Utiliser la formule de primitivation par parties pour montrer que, si n ≥ 2
est un entier, alors
J
sinn x dx = −
J
sin x cosn−1 x n − 1
cos x dx =
+
n
n
cos x sinn−1 x n − 1
−
n
n
n
J
J
sinn−2 x dx,
cosn−2 x dx.
5. Utiliser les identités trigonométriques (qui se déduisent facilement de la
formule de Moivre)
cos mx cos nx =
1
[cos(m + n)x + cos(m − n)x],
2
1
[cos(m − n)x − cos(m + n)x],
2
1
sin mx cos nx = [sin(m + n)x + sin(m − n)x],
2
où m et n sont des entiers positifs, pour calculer les primitives des premiers
membres.
sin mx sin nx =
9.7
Petite anthologie
Dans des lettres échangées il y a une dizaine d’années avec le très habile
géomètre G.W. Leibniz, je lui ai fait savoir que j’étais en possession d’une
méthode pour déterminer les maxima et les minima, mener les tangentes et
traiter les autres questions semblables, méthode qui servait aussi bien dans
le cas des racines que dans celui des expressions rationnelles; je lui cachais
cette méthode dans la phrase suivante écrite en lettres transposées : Etant
donnée une équation contenant un nombre quelconque de quantités variables
ou fluentes, trouver leurs fluxions et inversement. Cet homme illustre me
répondit qu’il était aussi tombé sur une méthode analogue et il me communiqua cette méthode qui s’écarte à peine de la mienne, sauf dans les termes
et les notations.
Isaac Newton, 1687
Considérant que les grandeurs qui croissent dans des temps égaux sont
plus grandes ou moindres suivant qu’elles croissent avec une vitesse plus
grande ou plus petite, je cherchai une méthode pour déterminer les grandeurs
344
CHAPITRE 9. FONCTIONS PRIMITIVABLES
d’après les vitesses des mouvements ou accroissements qui les engendrent; en
nommant fluxions les vitesses de ces mouvements ou accroissement, tandis
que les grandeurs engendrées prendraient le nom de fluentes, je suis tombé,
vers les années 1665 et 1666, sur la méthode des fluxions, dont je ferai
usage dans la quadrature des courbes. Les fluxions sont, d’aussi près que
possible, proportionnelles aux accroissements des fluentes, engendrés dans
des intervalles de temps égaux et aussi petits que possible; elles sont dans
la raison première des accroissements naissants et peuvent être représentées
par des lignes qui leur soient proportionnelles.
Isaac Newton, 1704
Mais d’après ce que j’ai montré dans ma méthode
des tangentes, on voit
H
que d( 12 xx) = x dx, et donc inversement 12 xx = x dx (car à l’exemple des
puissances et des racines dans
le calcul ordinaire, dans mon calcul, sommes
H
et différences, c’est-à-dire et d, sont réciproques).
Gottfried W. Leibniz, 1686
Les intégrales des différentielles sont ces quantités dont ces différentielles
proviennent par différentiation.
Jean Bernoulli, 1691
Le calcul intégral est la méthode par laquelle, à partir d’une relation entre
les différentielles, on retrouve la relation entre les quantités elles-mêmes.
Leonard Euler, 1768
Chapitre 10
Fonctions intégrables
10.1
Intégrabilité sur un pavé
On a vu au chapitre précédent que si f est une fonction de R dans Rp
primitivable sur un intervalle I et si a < b appartiennent à I, les expressions
m
$
j=1
f (xj )(aj − aj−1 )
A
B
associées à la P-partition Π = (xj , ]aj−1 , aj ]) 1≤j≤m de ]a, b] deviennent
arbitrairement proche d’un élément de Rp (à savoir F (b)−F (a) où F désigne
une primitive de f sur I), lorsque Π est “suffisamment fine”. Nous avons
également vu l’interprétation de ce résultat en termes d’aire de la figure
plane E(f ) définie par
E(f ) = {(x1 , x2 ) ∈ R2 : 0 ≤ x2 ≤ f (x1 ), x1 ∈ [a, b]},
lorsque f est une fonction positive. Par ailleurs, cette propriété de “convergence” des expressions
m
$
j=1
f (xj )(aj − aj−1 )
est également vérifiée pour des fonctions qui ne sont pas primitivables sur I.
Ainsi, on sait que la fonction f définie sur R par
f (x) = 1 si x < 0, f (x) = 2 si x ≥ 0,
n’est primitivable sur aucun
intervalle Bcontenant l’origine. Pourtant, si ! > 0
A
est donné et si Π = (xj , ]aj−1 , aj ]) 1≤j≤m est une P-partition δ-fine de
345
346
CHAPITRE 10. FONCTIONS INTÉGRABLES
] − 1, 1] pour la jauge constante δ, on aura, si k est le plus grand entier entre
1 et m tel que ak < 0,
m
$
j=1
=
k
$
j=1
f (xj )(aj − aj−1 )
(aj − aj−1 ) + f (xk+1 )(ak+1 − ak ) + 2
m
$
j=k+2
(aj − aj−1 )
= ak + 1 + f (xk+1 )(ak+1 − ak ) + 2(1 − ak+1 ).
Dès lors,
3 − ak+1 = ak + 1 + (ak+1 − ak ) ≤
m
$
j=1
f (xj )(aj − aj−1 )
≤ ak + 1 + 2(ak+1 − ak ) = 3 − ak ,
ce qui entraı̂ne aussitôt que
#
#
#m
#
#$
#
j
j
j−1
#
# ≤ max{−ak , ak+1 } ≤ 2δ ≤ !,
f
(x
)(a
−
a
)
−
3
#
#
#j=1
#
si l’on choisit δ = !/2. On notera que 3 mesure l’aire de la figure plane
(formée de deux rectangles) comprise entre le graphe de f , l’axe des x et les
parallèles à l’axe des y menées par les points (−1, 0) et (1, 0).
Dans le cas d’une fonction de R2 dans R positive sur l’adhérence I¯ d’un
semi-pavé de R2 (pour laquelle aucune notion de primitive n’a été définie !),
on peut encore considérer le problème de la définition et de la détermination
du volume du solide correspondant
¯
G(f ) = {(x1 , x2 , x3 ) ∈ R3 : 0 ≤ x3 ≤ f (x1 , x2 ), (x1 , x2 ) ∈ I}.
Le volume sera cette fois approché par des sommes de volumes de parallélépipèdes rectangles de base I j et de hauteur f (xj ), où {I 1 , . . . , I m}
est une partition de I en semi-pavés I j = ]aj1 , bj1]× ]aj2 , bj2] et où xj ∈ I¯j ,
(1 ≤ j ≤ m), c’est-à-dire par des expressions du type
m
$
j=1
f (xj )(bj1 − aj1 )(bj2 − aj2 ).
347
10.1. INTÉGRABILITÉ SUR UN PAVÉ
Plus généralement encore, on pourra chercher à définir et à déterminer
l’hypervolume d’un ensemble de Rn+1 du type
¯
H(f ) = {x ∈ Rn+1 : 0 ≤ xn+1 ≤ f (x1 , . . . , xn ), (x1 , . . . , xn ) ∈ I},
¯
lorsque I est un semi-pavé de Rn et f une fonction définie et positive sur I.
Les expressions approchées seront de la forme
m
$
j=1
f (xj )
n
6
i=1
(bji − aji ),
où {I 1 , . . . , I m} est une partition de I en semi-pavés
I j = ]aj1 , bj1] × . . . × ]ajn , bjn],
et xj = (xj1 , . . . , xjn ) ∈ I¯j , (1 ≤ j ≤ m).
Ces exemples suggèrent qu’il peut être intéressant d’étudier en toute
généralité la classe des fonctions de Rn dans Rp pour lesquelles les sommes
%m
j
j
j =n
n
j=1 f (x ) i=1 (bi − ai ) associées aux P-partitions d’un semi-pavé I ⊂ R
convergent, au sens de la propriété d’approximation des primitives, vers un
élément de Rp.
Soit I = I1 × . . . × In , avec Ik = ]ak , bk ], (1 ≤ k ≤ n) un semi-pavé et
I = I1 × . . . × In le pavé correspondant.
Définition. On appelle mesure de I (longueur si n = 1, aire si n = 2,
volume si n = 3), et l’on note µ(I), le réel strictement positif défini par
µ(I) = (b1 − a1 )(b2 − a2 ) . . . (bn − an ) =
n
6
i=1
(bi − ai ).
Une conséquence immédiate de cette définition est que, si K et I sont
des semi-pavés de Rn tels que K ⊂ I, alors
µ(K) ≤ µ(I),
l’égalité ayant lieu si et seulement si K = I.
On vérifie sans peine que si I et K sont deux semi-pavés de Rn , alors
I ∩ K est vide ou est un semi-pavé. Dans ce dernier cas, on pourra donc
parler de la mesure µ(I ∩ K) du semi-pavé I ∩ K. On notera que, par contre,
I ∪ K n’est pas en général un semi-pavé. Toutefois, si I 1 , . . . , I l sont des
348
CHAPITRE 10. FONCTIONS INTÉGRABLES
semi-pavés mutuellement disjoints de Rn , on pourra définir, conformément
!
à l’idée intuitive de mesure, la mesure de lj=1 I j par

µ
l
>
j=1
Soit enfin
I0

I j =
l
$
µ(I j ).
j=1
! I deux semi-pavés. Si
I 0 = I10 × . . . In0 , I = I1 × . . . × In ,
avec
Ii0 = ]ci , di], Ii = ]ai, bi], ai ≤ ci ≤ di ≤ bi , (1 ≤ i ≤ n),
l’une des inégalités entre ai et ci ou di et bi au moins étant stricte, et si l’on
pose, pour chaque 1 ≤ i ≤ n,
Ii1 = ]ai, ci] ou ∅ selon que ai < ci ou ai = ci ,
Ii2 = ]di , ci] ou ∅ selon que di < bi ou di = bi,
alors on a
Ii = Ii0 ∪ Ii1 ∪ Ii2 , (1 ≤ i ≤ n).
En conséquence, la famille finie
{I i1 ,i2 ,...,in = I1i1 × I2i2 × . . . × Inin : I i1 ,i2 ,...,in /= ∅, 0 ≤ i1 ≤ 2, . . . , 0 ≤ in ≤ 2},
constitue une partition de I en semi-pavés et I 0 = I 0,0,...,0. Il en résulte que
I \ I0 =
et l’on posera
µ(I \ I 0 ) =
>
I i1 ,...,in ,
{0≤i1 ,...,in ≤2 : i1 +...+in >0}
$
µ(I i1 ,...,in )
{0≤i1 ,...,in ≤2 : i1 +...+in >0, I i1 ,...,in (=∅}
= µ(I) − µ(I 0 ).
On montre de même que si I 1 , . . . , I l sont des semi-pavés disjoints contenus
dans I, alors I \ (I 1 ∪ . . . ∪ I l ) est une union de semi-pavés mutuellement
disjoints et l’on posera
µ[I \ (I 1 ∪ . . . ∪ I l )] = µ(I) −
l
$
µ(I j ).
j=1
Etendons maintenant aux fonctions de
dans Rp les expressions qui
interviennent à la fois dans l’approximation de la valeur d’une primitive et
l’approximation de l’aire d’une figure plane ou du volume d’un solide.
Rn
10.1. INTÉGRABILITÉ SUR UN PAVÉ
349
Définition. Soit
I un semi-pavé de Rn , f une fonction de Rn dans Rp définie
A j j B
sur I¯ et Π = (x , I ) 1≤j≤m une P-partition de I. On appelle somme de
Riemann associée à I, f et Π l’élément S(I, f, Π) de Rp défini par
S(I, f, Π) =
m
$
µ(I j )f (xj ).
j=1
On vérifiera sans peine que si f et g sont deux fonctions de Rn dans Rp
¯ si c ∈ R et si Π est une P-partition de I, alors on a
définies sur I,
S(I, f + g, Π) = S(I, f, Π) + S(I, g, Π), S(I, cf, Π) = cS(I, f, Π),
(S(I, f, Π))k = S(I, fk , Π), (1 ≤ k ≤ p),
|S(I, f, Π)|j ≤ S(I, |f |j , Π), (j = 1, 2, ∞),
¯ on a
tandis que si p = 1 et f (x) ≥ g(x) pour tout x ∈ I,
S(I, f, Π) ≥ S(I, g, Π).
Nous pouvons maintenant introduire l’importante classe de fonctions qui
vérifient la propriété introduite au début de la section.
Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ On dit que f est intégrable au sens de Denjoy-Perron sur
définie sur I.
¯ ou DP-intégrable sur I¯ ou plus simplement intégrable sur I¯ s’il existe un
I,
J ∈ Rp ayant la propriété suivante: pour chaque ! > 0, il existe une jauge δ
sur I¯ telle que, pour toute P-partition δ-fine Π de I, on ait
|S(I, f, Π) − J|2 ≤ !.
Cette définition a un sens puisque, par le théorème de Cousin, l’existence
¯ On notera aussi
d’une P-partition δ-fine est garantie pour toute jauge δ sur I.
que sa structure est semblable à celle de la définition de limite des valeurs
d’une fonction, et que la définition ne dépend pas du choix de la norme
| · |2 pour l’estimation de S(I, f, Π) − J. Enfin la terminologie “intégrable au
sens de Denjoy-Perron” vient de ce que, pour n = 1, cette classe de fonctions
fut introduite pour la première fois indépendamment par Arnaud Denjoy
en 1912 et par Oskar Perron en 1914. Leurs définitions sont différentes
et distinctes de celle donnée ici, découverte indépendamment, en 1957 par
Jaroslav Kurzweil et en 1960 par Ralph Henstock.
¯ Rp) l’ensemble des fonctions de Rn dans Rp intéOn désignera par P (I,
¯
grables sur l’adhérence I d’un semi-pavé I de Rn .
Montrons qu’il ne peut exister plus d’un J vérifiant les conditions de la
définition.
350
CHAPITRE 10. FONCTIONS INTÉGRABLES
Proposition. Il existe au plus un J ∈ Rp vérifiant les conditions de la
¯
définition d’intégrabilité sur I.
Démonstration. Soit J donné par la définition et soit J $ ∈ Rp tel que,
pour chaque ! > 0, il existe une jauge δ $ sur I¯ telle que, pour chaque Ppartition δ $ -fine Π$ de I, on ait
|S(I, f, Π$) − J $ |2 ≤ !.
On va prouver que J = J $ en montrant que |J − J $ |2 ≤ ! pour chaque ! > 0.
Soient en effet δ et δ $ les jauges associées à !/2 par les définitions de J et J $ ;
alors l’application δ $$ définie sur I¯ par
δ $$ (x) = min[δ(x), δ $(x)]
est une jauge sur I¯ et si Π$$ est une P-partition δ $$ -fine de I, elle sera à la
fois δ-fine et δ $ -fine. En conséquence, on aura
|J − J $ |2 ≤ |J − S(I, f, Π$$)|2 + |S(I, f, Π$$) − J $ |2 ≤ !,
et la démonstration est complète.
La définition suivante est donc justifiée.
¯ l’unique
Définition. Si f est une fonction de Rn dans Rp intégrable sur I,
élément J vérifiant la définition ci-dessus est appelé l’intégrale de f sur I¯ et
noté
J
J
J
J
f,
f (x) µ(dx),
f (x) dx ou
f dµ,
I¯
I¯
I¯
I¯
pour rappeler son mode de construction par les sommes de Riemann.
Une telle intégrale est dite simple si n = 1 et multiple si n ≥ 2 (double
pour n = 2 et triple pour n = 3). Dans le cas de l’intégrale simple de f sur
[a, b], on utilise aussi les notations
J
b
f ou
a
J
b
f (x) dx.
a
Enfin, il est commode de poser également
J
b
a
f =−
J
a
b
f et
J
a
f = 0.
a
La propriété d’approximation de la primitive s’annulant en un point
d’une fonction primitivable fournit directement une classe importante de
fonctions intégrables sur un intervalle fermé et borné de R.
10.1. INTÉGRABILITÉ SUR UN PAVÉ
351
Théorème. Si f est une fonction de R dans Rp primitivable sur un intervalle
fermé et borné [a, b], alors f est intégrable sur [a, x] pour chaque a < x ≤ b
et, F désignant une primitive quelconque de f sur [a, b], on a, pour chaque
x ∈ ]a, b],
J
x
a
et en particulier
J
b
a
f = F (x) − F (a),
f = F (b) − F (a).
Démonstration. Il suffit de noter que si f est primitivable sur [a, b], elle
l’est aussi sur [a, x] quel que soit a < x < b et la propriété d’approximation
de la primitive Fa de f s’annulant en a équivaut à l’intégrabilité de f sur
[a, x]. On sait enfin que si F est une primitive quelconque de f sur [a, b], on
a Fa = F (·) − F (a).
Le théorème que nous venons de démontrer s’appelle le théorème fondamental du calcul différentiel et intégral. Il fournit un moyen étonnamment simple pour calculer l’intégrale sur intervalle fermé [a, b] (donc en
particulier de l’aire de E(f )) de toute fonction f dont une primitive est
connue: il suffit de faire la différence entre la valeur d’une primitive entre
l’extrémité et l’origine de l’intervalle considéré. Le théorème fondamental
du calcul différentiel et intégral montre que
N ([a, b], Rp) ⊂ P ([a, b], Rp).
On peut encore l’énoncer sous la forme équivalente suivante, qui fait intervenir f $ et f au lieu de f et F .
Corollaire. Si f est une fonction de R dans Rp dérivable sur [a, b], alors f $
est intégrable sur [a, b] et
J
b
a
f $ = f (b) − f (a).
¯
Il existe une condition nécessaire de Cauchy d’intégrabilité sur I.
Proposition. Si f est une fonction de Rn dans Rp intégrable sur l’adhérence I¯ d’un semi-pavé I de Rn , alors, pour chaque ! > 0, il existe une jauge δ
sur I¯ telle que, pour chaque P-partition δ-fine Π et chaque P-partition δ-fine
Π̃ de I, on a
|S(I, f, Π) − S(I, f, Π̃)|2 ≤ !.
352
CHAPITRE 10. FONCTIONS INTÉGRABLES
Démonstration. Soit ! > 0 et δ une jauge sur I¯ associée par la définition
d’intégrabilité
à !/2. Alors, si Π et Π̃ sont des P-partitions δ-fines, on a,
H
avec J = I¯ f,
|S(I, f, Π) − S(I, f, Π̃)|2 ≤ |S(I, f, Π) − J|2 + |J − S(I, f, Π̃)|2 ≤ !.
Le cas particulier consistant à imposer pour chaque ! > 0, dans la
définition d’intégrabilité, l’existence d’une jauge constante est historiquement et numériquement important, même si son rôle dans l’analyse moderne
s’est singulièrement réduit.
Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ On dit que f est intégrable au sens de Riemann sur I,
¯ ou
définie sur I.
¯
R-intégrable sur I ou plus explicitement uniformément intégrable sur I¯ s’il
existe un J ∈ Rp ayant la propriété suivante: pour chaque ! > 0, on peut
trouver une jauge constante δ sur I¯ telle que, pour toute P-partition δ-fine
Π de I, on ait
|S(I, f, Π) − J|2 ≤ !.
La caractérisation suivante des fonctions R-intégrables, dont on établira
sans peine l’équivalence avec la définition donnée ici, est souvent prise comme
définition des fonctions R-intégrables dans la littérature mathématique.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Alors f est R-intégrable sur I¯ si et seulement s’il existe un
définie sur I.
p
J ∈ R ayant la propriété suivante: pour chaque ! > 0, il existe une constante
η > 0 telle que, pour chaque partition {I 1 , . . . , I m} de I en semi-pavés tels
que
max
(bji − aji ) ≤ η,
1≤j≤m; 1≤i≤n
et toute famille {x , . . . , xm} de points tels que xj ∈ I¯j , (1 ≤ j ≤ m), on a
1
|S(I, f, Π) − J|2 ≤ !.
Le résultat suivant est une conséquence facile de la définition et de
l’unicité de l’intégrale.
Proposition. Toute fonction f R-intégrable sur I¯ est intégrable
sur I¯ et le
H
J donné dans la définition de R-intégrabilité est égal à I¯ f.
Exemple. Si I est un semi-pavé de Rn , toute application constante c de Rn
dans Rp est R-intégrable sur I¯ et
J
I¯
c = µ(I)c.
353
10.1. INTÉGRABILITÉ SUR UN PAVÉ
En effet, pour toute P-partition Π = {(x1 , I 1 ), . . ., (xm, I m)} de I, on a
S(I, f, Π) =
m
$
µ(I j )c = µ(I)c,
j=1
et ! > 0 étant donné, n’importe quelle jauge constante convient dans la
définition de R-intégrabilité.
En procédant comme pour l’intégrabilité, on obtient évidemment une
condition nécessaire de Cauchy de R-intégrabilité.
Proposition. Si f est une fonction de Rn dans Rp R-intégrable sur l’adhérence I¯ d’un semi-pavé I de Rn , alors, pour chaque ! > 0, il existe une
jauge constante δ sur I¯ telle que, pour chaque P-partition δ-fine Π et chaque
P-partition δ-fine Π̃ de I, on a
|S(I, f, Π) − S(I, f, Π̃)|2 ≤ !.
Montrons que les fonctions R-intégrables sur I¯ y sont nécessairement
bornées.
Proposition. Toute fonction f de Rn dans Rp R-intégrable sur l’adhérence
¯
I¯ d’un semi-pavé I de Rn est bornée sur I.
Démonstration. Soit J =
δ sur I¯ telle que
#
H
I¯ f
et ! = 1. Il existe donc une jauge constante
#
#m
#
#$
#
j
j #
#
µ(I )f (x )# ≤ |J|2 + 1,
#
#j=1
#
2
pour toute P-partition δ-fine Π =
une partition de I en semi-pavés
{(x1 , I 1 ), . . ., (xm, I m)}
de I. Soit {K 1 , . . . , K m}
K j = ]cj1 , dj1 ] × . . . × ]cjn , djn]
tels que
dji − cji ≤ δ, (1 ≤ i ≤ n, 1 ≤ j ≤ m).
A
B
Alors, pour chaque xj ∈ K j , (1 ≤ k ≤ m), Π̃ = (xj , K j ) 1≤j≤m est une P¯ Il existera au
partition δ-fine de I. Supposons que f ne soit pas bornée sur I.
l
l
moins un K tel que f ne soit pas bornée sur K̄ , et donc tel que pour chaque
r > 0, il existe un y r ∈ K̄ l tel que |f (y r )|2 > r. En prenant successivement
r = k, (k ∈ N∗ ), on obtient une suite (y k )k∈N∗ dans K̄ l telle que
|f (y k )|2 > k, (k ∈ N∗ ).
354
CHAPITRE 10. FONCTIONS INTÉGRABLES
Si dès lors nous fixons xj ∈ K̄ j pour chaque 1 ≤ j ≤ m tel que j /= l, et que
nous prenons les P-partitions δ-fines
{(x1 , K 1 ), . . ., (xl−1, K l−1), (y k , K l ), (xl+1 , K l+1 ) . . . , (xm, K m)}, k ∈ N∗ ,
nous obtenons les inégalités
#
#
#
#
$
#
#
l
k
j
j
#µ(K )f (y ) +
# ≤ |J|2 + 1, (k ∈ N∗ ),
µ(K
)f
(x
)
#
#
#
#
{1≤j≤m : j(=l}
2
et dès lors
#
#
#
#
$
#
#
kµ(K l ) < µ(K l )|f (y k )|2 ≤ |J|2 + 1 + ##
µ(K j )f (xj )## , (k ∈ N∗ ),
#{1≤j≤m : j(=l}
#
2
ce qui est contradictoire dès que
k ≥ [µ(K )]
l
#
# 
#
#
$
#
#
j
j
#
|J|2 + 1 + #
µ(K )f (x )##  .
#{1≤j≤m : j(=l}
#

−1 
2
La fonction
f : x 2→ 2x sin
1
2
1
− cos 2 , x /= 0, f (0) = 0,
2
x
x
x
donnée au Chapitre 9, qui est primitivable sur tout intervalle contenant
l’origine sans y être bornée, est donc un exemple de fonction qui n’est pas
R-intégrable sur un tel intervalle, alors qu’elle y est intégrable en vertu du
théorème fondamental du calcul différentiel et intégral.
L’exemple suivant montre qu’il existe même des fonctions bornées et
intégrables sur un intervalle fermé et qui n’y sont pas R-intégrables.
Exemple. La fonction de Dirichlet d, définie au chapitre 2 par d(x) = 1 si x
est rationnel et d(x) = 0 si x est irrationnel, est bornée sur R et donc sur tout
intervalle fermé. Montrons que d n’est pas R-intégrable sur [0, 1]. Il suffit
de montrer qu’elle ne vérifie pas la condition de Cauchy de R-intégrabilité.
Soit δ > 0 et {I 1 , . . ., I m} une partition de ]0, 1] en semi-intervalles telle
que µ(I j ) ≤ δ, (1 ≤ j ≤ m). On sait que chaque I j contient au moins un
rationnel xj et au moins un irrationnel
x̃j . Dès lors, les P-partitions de ]0, 1]
A j j B
1 1
m m
Π = {(x , I ), . . . , (x , I )}, Π̃ = (x̃ , I ) 1≤j≤m sont δ-fines et, puisque
d(xj ) = 1, d(x̃j ) = 0, (1 ≤ j ≤ m),
355
10.1. INTÉGRABILITÉ SUR UN PAVÉ
ces P-partitions sont telles que
|S(]0, 1], d, Π) − S(]0, 1], d, Π̃)| =
$
µ(I j ) = µ(]0, 1]) = 1.
j=1
La négation de la condition de Cauchy de R-intégrabilité est donc satisfaite.
Montrons maintenant que la fonction de Dirichlet est intégrable sur [0, 1]
et que son intégrale y est nulle. Notons tout d’abord que Q ∩ [0, 1] est
dénombrable et peut donc s’écrire sous la forme {rk : k ∈ N}, où l’application
k 2→ rk est une bijection de N sur Q ∩ [0, 1]. Soit ! > 0; associons-lui la jauge
δ sur [0, 1] définie comme suit. Si x ∈ [0, 1] \ Q, on prend δ(x) = 1; si
!
x ∈ Q ∩ [0, 1], il existe un unique rk tel que x = rk et l’on prend δ(x) = 2k+2
.
1 1
m m
Soit Π = {(x , I ), . . ., (x , I )} une P-partition δ-fine de ]0, 1]. Comme
d(x) = 0 si x est irrationnel, on a
S(]0, 1], d, Π) =
m
$
$
d(xj )µ(I j ) =
j=1
{1≤j≤m :
µ(I j ).
xj ∈Q}
Soit q ∈ N tel que {xj ∈ Q : 1 ≤ j ≤ m} ⊂ {r0 , . . . , rq }. Alors,
$
{1≤j≤m
q
$
µ(I j ) =
: xj ∈Q}
≤
q
$
k=0
k=0
!
2k+1
=


$
{1≤j≤m :
xj =r
k}

µ(I j )
! 1 − (1/2)q+1
≤ !,
2 1 − (1/2)
puisque, pour tous les j tels que xj = rk , les I j correspondants forment
une famille formée d’un ou deux intervalles disjoints de ]0, 1] contenus dans
!
!
[rk − 2k+2
, rk + 2k+2
], ce qui entraı̂ne
$
µ(I ) ≤ µ
j
{1≤j≤m : xj =rk }
42
rk −
!
2k+2
, rk +
!
2k+2
35
=
!
.
2k+1
En conséquence, et en notant que S(I, f, Π) est positive et donc égale à sa
valeur absolue, on a |S(I, f, Π)| ≤ ! pour toutes les P-partitions δ-fines de
]0, 1] et le résultat est démontré.
On a vu qu’une fonction primitivable sur un intervalle fermé n’y est pas
nécessairement R-intégrable. L’exemple de la fonction
f (x) = −1 si x < 0, f (x) = 1 si x ≥ 0,
356
CHAPITRE 10. FONCTIONS INTÉGRABLES
considéré au début de la section, qui est R-intégrable sur [−1, 1], sans vérifier
la propriété de Darboux, montre l’existence de fonctions R-intégrables sur
un intervalle fermé qui n’y sont pas primitivables.
¯ Rp) l’ensemble des fonctions de Rn dans Rp RSi l’on désigne par R(I,
intégrables sur l’adhérence I¯ du semi-pavé I de Rn on a donc les inclusions
(strictes)
¯ Rp) ! P (I,
¯ Rp), N ([a, b], Rp) ! P ([a, b], Rp)
R(I,
alors que R([a, b], Rp) \ N ([a, b], Rp) et N ([a, b], Rp) \ R([a, b], Rp) sont non
vides. L’ensemble des fonctions intégrables contient donc différentes classes
de fonctions intéressantes.
La discussion qui précède montre que le concept d’intégrabilité que Bernard Riemann a introduit en 1854 est trop faible pour intégrer, sur un pavé,
les fonctions non bornées (en particulier certaines fonctions primitivables)
ainsi que des fonctions très discontinues comme la fonction de Dirichlet.
Vito Volterra a même donné en 1881 un exemple de fonction bornée,
primitivable mais non R-intégrable sur un intervalle. On peut chercher la
raison de ces limitations de l’intégrale de Riemann dans le fait que, ! > 0
étant donné, la condition imposée aux P-partitions pour lesquelles la somme
de Riemann doit approcher la valeur de l’intégrale à ! près, est d’être δ-fine
pour une jauge constante δ, c’est-à-dire pour une jauge qui ne force aucunement la P-partition à être particulièrement “fine” au voisinage des points de
I¯ où la fonction a un comportement peu régulier (discontinuités, limites à
gauche ou à droite infinies, oscillations non bornées...). Une définition mieux
adaptée à des fonctions présentant ces caractéristiques doit “forcer” les Ppartitions acceptables pour un ! > 0 donné à être plus “fines” aux endroits
pathologiques, afin de permettre aux sommes de Riemann d’épouser mieux
la quantité qu’elles sont censées approcher. C’est une idée que Leonard Euler avait déjà exprimée, sans l’exploiter, en 1768. Près de deux siècles plus
tard, Jaroslav Kurzweil et Ralph Henstock ont refait, indépendamment,
cette observation. Ils ont proposé une modification formelle simple mais
fondamentale de la définition de Riemann, qui conduit à une intégrale conservant, pour la partie élémentaire de la théorie, le support intuitif et la
simplicité conceptuelle de l’approche de Riemann, mais qui s’avère suffisamment puissante pour intégrer à la fois les fonctions primitivables et les
fonctions R-intégrables (et, comme on le verra, bien d’autres encore!).
10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE
10.2
357
Propriétés élémentaires de l’intégrale
Soit I un semi-pavé de Rn , f et g des fonctions de Rn dans Rp définies sur
¯
I.
¯ alors f + g est intégrable sur
Proposition. Si f et g sont intégrables sur I,
¯
I et
J
J
J
(f + g) = f + g.
I¯
Démonstration. Posons J1 =
jauge δ1 sur I¯ telle que
H
I¯ f
I¯
I¯
et J2 =
H
I¯ g
et soit ! > 0. Il existe une
|S(I, f, Π1) − J1 |2 ≤ !/2
pour toute P-partition δ1 -fine Π1 de I et une jauge δ2 sur I¯ telle que
|S(I, g, Π2) − J2 |2 ≤ !/2
pour toute P-partition δ2 -fine Π2 de I. Définissant sur I¯ la jauge δ par
δ(x) = min[δ1 (x), δ2(x)], et notant que toute P-partition δ-fine Π de I sera
à la fois δ1 -fine et δ2 -fine, on aura, pour une telle P-partition,
|S(I, f + g, Π) − (J1 + J2 )|2 = |S(I, f, Π) + S(I, g, Π) − J1 − J2 |2
≤ |S(I, f, Π) − J1 |2 + |S(I, g, Π) − J2 |2 ≤ !/2 + !/2 = !,
et la démonstration est complète.
Proposition. Si f est intégrable sur I¯ et c ∈ R, alors cf est intégrable sur
I¯ et
4J 5
J
(cf ) = c
f .
I¯
I¯
Démonstration.
Le résultat est évident si c = 0. Pour c /= 0, posons
H
J = I¯ f et soit ! > 0. Il existe donc une jauge δ sur I¯ telle que
|S(I, f, Π) − J|2 ≤ !/|c|,
pour toute P-partition δ-fine Π de I. En consequence, pour une telle Ppartition, on a
|S(I, cf, Π) − cJ|2 = |c[S(I, f, Π) − J]|2 ≤ |c|(!/|c|) = !,
et la démonstration est complète.
358
CHAPITRE 10. FONCTIONS INTÉGRABLES
¯ Rp) est un espace vectoriel sur R
Ces deux résultats montrent
que P (I,
H
¯ Rp) dans
et que l’application f 2→ I¯ f est une application linéaire de P (I,
p
R (et en particulier une fonctionnelle linéaire si p = 1). On démontre d’une
¯ Rp) est un sous-espace vectoriel de
manière tout à fait identique que R(I,
p
¯
P (I, R ).
La propriété suivante généralise aux intégrales le fait que la norme d’une
somme est inférieure ou égale à la somme des normes.
Proposition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp et
g une fonction de Rn dans R+ définies sur I¯ et telles que
|f (x)|i ≤ g(x),
¯ (i = 1, 2 ou ∞). Si f et g sont intégrables sur I,
¯ alors on a
pour tout x ∈ I,
#J #
J
#
#
# f# ≤
g, (i = 1, 2 ou ∞),
# ¯ #
¯
I
I
i
¯ on a
En particulier, si f et |f |i sont intégrables sur I,
#J #
J
#
#
# f# ≤
|f |i , (i = 1, 2 ou ∞).
# ¯ #
¯
I
I
i
Démonstration. On va montrer que
#J #
J
#
#
# f# ≤
g+!
# ¯ #
¯
I
I
i
pour chaque ! > 0. Pour un tel ! > 0, il existe une jauge δ $ et une jauge δ $$
sur I¯ telles que
#
#
J #
J #
#
#
#
#
#S(I, f, Π$) − f # ≤ !/2, #S(I, g, Π$$) − g # ≤ !/2.
#
#
¯ #
¯ #
I
I
i
Définissant la jauge δ sur I¯ par δ(x) =
et choisissant une
P-partition δ-fine Π de I, on a, en utilisant les propriétés des sommes de
Riemann et le fait que Π est à la fois δ $ -fine et δ $$ -fine,
min{δ $ (x), δ $$(x)},
#J #
#J
#
#
#
#
#
# f # ≤ # f − S(I, f, Π)# + |S(I, f, Π)|i
# ¯ #
# ¯
#
I
i
I
i
≤ !/2 + |S(I, f, Π)|i ≤ !/2 + S(I, |f |i, Π) ≤ !/2 + S(I, g, Π)
#
J #
J
J
#
#
#
≤ !/2 + g + #S(I, g, Π) − g ## ≤ !/2 + g + !/2 = g + !.
¯
¯
¯
¯
J
I
I
I
I
Pour obtenir la deuxième inégalité, il suffit de prendre g = |f |i.
359
10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE
Une conséquence aisée de la proposition précédente est le fait que l’intégrale préserve les relations d’ordre entre deux fonctions réelles.
Corollaire. Si I est un semi-pavé de Rn et f une fonction réelle intégrable
¯ alors
sur I¯ et telle que f (x) ≥ 0 pour tout x ∈ I,
J
I¯
f ≥ 0.
Démonstration. Il suffit de prendre f = 0 et g = f dans la Proposition
précédente.
Corollaire. Si I est un semi-pavé de Rn et si f et g sont deux fonctions
¯ alors on a
réelles intégrables sur I¯ et telles que f (x) ≤ g(x) pour tout x ∈ I,
J
I¯
f≤
J
I¯
g.
Démonstration. Il suffit d’appliquer le corollaire précédent à la fonction
g − f et d’utiliser la linéarité de l’intégrale.
Le résultat suivant montre que la théorie et le calcul de l’intégrale d’une
fonction de Rn dans Rp peuvent toujours se ramener au cas d’une fonction
à valeur réelle.
Proposition.
Rp définie sur
composante fk
Soit I un semi-pavé de Rn et f une fonction de Rn dans
¯ Alors f est intégrable sur I¯ si et seulement si chaque
I.
de f est intégrable sur I¯ (1 ≤ k ≤ p), auquel cas on a
4J
I¯
f
5
k
=
J
I¯
fk , (1 ≤ k ≤ p).
Démonstration. La condition nécessaire résulte aisément des définitions
et du fait que, pour toute P-partition Π de I, et tout 1 ≤ k ≤ p, on a
#
4J 5
#
#S(I, fk, Π) −
f
#
¯
I
k
#
#
#=
#
#2
J 3
#
# S(I, f, Π) − f
#
¯
I
k
H
# #
J #
# #
#
# ≤ #S(I, f, Π) − f # .
# #
¯ #
I
2
Pour la condition suffisante, si nous posons Jk = I¯ fk , (1 ≤ k ≤ p) et si ! > 0
étant donné, nous désignons par δk une jauge sur I¯ telle que la définition
!
d’intégrabilité de fk sur I¯ soit vérifiée pour p1/2
, il est facile de voir que la
définition d’intégrabilité de f sur I¯ relative à ! sera vérifiée pour le choix de
la jauge δ définie sur I¯ par δ(x) = min1≤k≤p δk (x).
360
CHAPITRE 10. FONCTIONS INTÉGRABLES
Les propriétés qui suivent montrent le comportement de l’intégrale par
rapport à une translation ou une homothétie du domaine d’intégration.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans
¯ Alors, pour tout a ∈ Rn , f (· − a) est intégrable sur
Rp intégrable sur I.
¯ et
a + I¯ = {a + x : x ∈ I}
J
a+I¯
f (x − a) dx =
J
I¯
f.
Démonstration. Soit ! > 0 et δ une jauge sur I¯ telle que
#
J #
#
#
#S(I, f, Π) − f # ≤ !
#
¯ #
I
2
pour toute P-partition δ-fine
Π de I. On définit la jauge η sur a + I¯ par
A j j B
η = δ(· − a). Soit Πa = (x , I ) 1≤j≤m une P-partition η-fine de a + I =
A
B
{a + x : x ∈ I}. Alors Π = (xj − a, −a + I j ) 1≤j≤m , où −a + I j = {−a + x :
x ∈ I j }, est une P-partition δ-fine de I puisque les relations
I j ⊂ B∞ [xj ; η(xj )], (1 ≤ j ≤ m),
entraı̂nent évidemment
−a + I j ⊂ B∞ [xj − a; δ(xj − a)], (1 ≤ j ≤ m).
En conséquence, puisque µ(−a + I j ) = µ(I j ), (1 ≤ j ≤ m), on a
#
#
#$
#
J #
J #
#m
#
#
#
#S(a + I, f (. − a), Πa ) − f # = #
µ(I j )f (xj − a) − f ##
#
#
#
I¯ 2
I¯ #
#j=1
2
#
#
#m
#
J #
J #
#$
#
#
#
= ## µ(−a + I j )f (xj − a) − f ## = ##S(I, f, Π) − f ## ≤ !,
I¯ #
I¯ 2
#j=1
2
et la démonstration est complète.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans
¯ Alors, pour chaque r > 0, f (r·) est intégrable sur
Rp intégrable sur I.
−1
−1
¯
¯ et
r I = {r x : x ∈ I}
J
r −1 I¯
f (rx) dx = r −n
J
I¯
f.
361
10.2. PROPRIÉTÉS ÉLÉMENTAIRES DE L’INTÉGRALE
Démonstration. Soit ! > 0 et δ une jauge sur I¯ telle que
#
J #
#
#
#S(I, f, Π) − f # ≤ !r n
#
¯ #
I
2
A
B
pour toute P-partition δ-fine Π de I. Soit Πr = (xj , I j ) 1≤j≤m une PA
B
partition (δ/r)-fine de r −1 I = {r −1 x : x ∈ I}. Alors Π = (rxj , rI j ) 1≤j≤m
est une P-partition δ-fine de I puisque les relations
xj ∈ I¯j , I j ⊂ B∞ [xj ; δ(xj )/r], (1 ≤ j ≤ m),
entraı̂nent évidemment
rxj ∈ r I¯j , rI j ⊂ B∞ [rxj ; δ(xj )], (1 ≤ j ≤ m).
Dès lors, puisque µ(rI j ) = r n µ(I j ), on aura
#
#
#m
#
J #
J #
$
#
#
#
#
#S(r −1 I, f (r·), Πr) − r −n f # = r −n #
µ(rI j )f (rxj ) − f ##
#
#
#
¯
¯
I
I #
#j=1
2
2
#
J #
#
#
= r −n ##S(I, f, Π) − f ## ≤ !,
¯
I
2
et la démonstration est complète.
Donnons maintenant deux propriétés utiles de l’intégrale simple. La
première s’appelle la formule d’intégration par parties.
Proposition. Soient f et g deux fonctions de R dans K dérivables sur [a, b].
Alors f $ g est intégrable sur [a, b] si et seulement si f g $ est intégrable sur [a, b],
auquel cas on a
J
b
a
f $ g = f (b)g(b) − f (a)g(a) −
J
b
a
f g $.
Démonstration. Par la formule de dérivation d’un produit de fonctions,
on a
f $ g = (f g)$ − f g $ ,
et, par le théorème fondamental du calcul différentiel et intégral, la fonction
(f g)$ est intégrable sur [a, b] et
J
b
a
(f g)$ = f (b)g(b) − f (a)g(a).
La thèse résulte alors de la linéarité de l’intégrale.
362
CHAPITRE 10. FONCTIONS INTÉGRABLES
La deuxième propriété s’appelle la formule d’intégration par substitution.
Proposition. Soit g une fonction de R dans R non constante et dérivable
sur [a, b] et h une fonction de g([a, b]) dans Rp primitivable sur g([a, b]). Alors
(h ◦ g)g $ est primitivable sur [a, b] et
J
b
a
(h ◦ g)g $ =
J
g(b)
h.
g(a)
Démonstration. Soit H une primitive de h sur g([a, b]); par le théorème de
primitivation par substitution, (h◦g)g $ = (H $ ◦g)g $ = (H ◦g)$ est primitivable
sur [a, b] et H ◦g en est une primitive. Par le théorème fondamental du calcul
différentiel et intégral, (h ◦ g)g $ est donc intégrable sur [a, b] et
J
b
a
(h ◦ g)g $ = H[g(b)] − H[g(a)].
Le même théorème appliqué à h montre que cette fonction est intégrable
sur tout intervalle fermé de g([a, b]), et en particulier à l’intervalle fermé
d’extrémités g(a) et g(b), et que
J
g(b)
g(a)
h = H[g(b)] − H[g(a)],
ce qui achève la démonstration.
10.3
Additivité de l’intégrale
Le but de cette section est de montrer que l’intégrale d’une fonction sur
l’adhérence d’un semi-pavé pavé I est égale à la somme des intégrales de
cette fonction sur les adhérences de semi-pavés formant une partition finie
de I. Pour démontrer cette propriété, nous aurons besoin d’un résultat
technique qui nous servira souvent par la suite, et que nous nommerons le
lemme des P-partitions subordonnées.
Lemme. Soit I un semi-pavé de Rn , {K 1 , . . . , K l } une partition de I en
¯ Il existe une jauge δ sur I¯ vérifiant la relasemi-pavés et δ0 une jauge sur I.
¯ et telle que, si Π = {(x1 , I 1 ), . . ., (xm, I m)}
tion δ(x) ≤ δ0 (x) pour tout x ∈ I,
est une P-partition δ-fine de I, chaque famille
Π̃i = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m}
363
10.3. ADDITIVITÉ DE L’INTÉGRALE
est une P-partition δ-fine de K i , (1 ≤ i ≤ l), la famille
Π̃ = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m, 1 ≤ i ≤ l, }
est une P-partition δ-fine de I et l’on a
S(I, f, Π) = S(I, f, Π̃) =
l
$
S(K i, f, Π̃i )
i=1
¯
pour toute fonction f de Rn dans Rp définie sur I.
¯ ApDémonstration. Construisons la jauge δ comme suit. Soit x ∈ I.
7
i
pelons J(x) l’ensemble {1 ≤ i ≤ l : x /∈ K }. Soit E(x) = i∈J(x) !K i si
J(x) /= ∅ et E(x) = Rn si J(x) = ∅. Comme E(x) est ouvert et x ∈ E(x),
il existe r(x) > 0 tel que B∞ [x; r(x)] ⊂ E(x). Ce choix de r(x) assure
que B∞ [x; r(x)] ne rencontre que des K i dont l’adhérence contient x. En
d’autres termes, si i est tel que B∞ [x : r(x)] ∩ K i /= ∅, alors x ∈ K i (car
B∞ [x; r(x)] ∩ K i /= ∅, et donc i /∈ J(x)).
Soit δ la jauge définie sur I¯ par δ(x) = min{δ0 (x), r(x)} et soit Π =
1
{(x , I 1 ), . . ., (xm, I m)} une P-partition δ-fine de I. Alors, pour chaque 1 ≤
i ≤ l, la famille
Π̃i = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m}
est une P-partition de K i . En effet,
I j ∩ K i /= ∅ ⇒ B∞ [xj ; δ(xj )] ∩ K i /= ∅ ⇒ B∞ [xj ; r(xj )] ∩ K i /= ∅
⇒ xj ∈ K i ⇒ xj ∈ K i ∩ I j ,
et dès lors xj ∈ K i ∩ I j puisque K i ∩ I j = K i ∩ I j lorsque I j ∩ K i /= ∅ (le
Mi est évidemment δ-fine puisque Π
vérifier). En outre, chaque P-partition Π
l’est. Bien entendu, la famille
N = {(xj , I j ∩ K i ) : I j ∩ K i /= ∅, 1 ≤ j ≤ m, 1 ≤ i ≤ l}
Π
Mi est une P-partition δ-fine de I.
formée de la réunion des éléments des Π
¯ alors
Enfin, si f est une fonction de Rn dans Rp définie sur I,
S(I, f, Π) =
m
$
j=1
µ(I j )f (xj )
364
CHAPITRE 10. FONCTIONS INTÉGRABLES
=
m
$
j=1
µ(I j ∩
l
>
K i )f (xj ) =
i=1
m
$
$
j=1 {1≤i≤l : I j ∩K i(=∅}
N =
= S(I, f, Π)
l
$
$
i=1 {1≤j≤m : I j ∩K i (=∅}
l
$
=
i=1
8
9
µ I j ∩ K i f (xj )
µ(I j ∩ K i )f (xj )
Mi ).
S(K i, f, Π
Le nom de ce lemme vient de ce que toute P-partition δ-fine pour la jauge
ainsi construite peut être remplacée, sans changer la somme de Riemann
correspondante, par une P-partition δ-fine que l’on dit subordonnée à la
partition {K 1 , . . . , K l }, puisque chacun de ses semi-pavés est contenu dans
l’un des semi-pavés K i .
Enonçons et démontrons maintenant la propriété d’additivité de l’intégrale.
Proposition. Soit I un semi-pavé de Rn , {K 1 , . . . , K l } une partition de I
en semi-pavés K i , (1 ≤ i ≤ l) et soit f une fonction de Rn dans Rp définie
¯ Si f est intégrable sur chaque K̄ i , (1 ≤ i ≤ l), alors f est intégrable
sur I.
¯
sur I et
J
I¯
f=
l J
$
i
i=1 K̄
f.
Démonstration. Si ! > 0 est donné, il existe une jauge δi sur K̄ i telle que
#
J
#
#S(K i, f, Πi) −
#
K̄ i
#
#
f ## ≤ !/l,
2
pour toute P-partition δi -fine Πi de K i (1 ≤ i ≤ l). Soit δ0 la jauge définie
sur I¯ par
δ0 (x) = min{δi (x) : x ∈ K̄ i , 1 ≤ i ≤ l},
et soit δ la jauge donnée par le lemme des P-partitions subordonnées à partir
de δ0 et {K 1 , . . . , K l }. Si Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition
δ-fine de I et Π̃i (1 ≤ i ≤ l) et Π̃ sont les P-partitions qui lui sont associées
par le lemme des P-partitions subordonnées, on a
#
#
#
#
l J
l J
#
#
#
#
$
$
#
#
#
#
f # = #S(I, f, Π̃) −
f#
#S(I, f, Π) −
#
#
K̄ i #
K̄ i #
i=1
2
i=1
2
10.4. CRITÈRE DE CAUCHY D’INTÉGRABILITÉ
365
#
3##
J
l 2
#$
#
#
=#
S(K i, f, Π̃i ) −
f # ≤ l(!/l) = !,
#
#
i
K̄
i=1
2
puisque par construction chaque Π̃i est δ i -fine (1 ≤ i ≤ l).
Remarques. 1. La propriété d’additivité est également vraie pour l’intégrabilité au sens de Riemann mais la démonstration est différente et plus
longue, car le lemme qui précède n’a pas d’équivalent pour l’intégration au
sens de Riemann. Nous ne la donnerons pas ici car nous n’aurons pas à
l’utiliser explicitement.
2. La propriété d’additivité possède une réciproque, dont la démonstration
nécessite la démonstration du caractère suffisant de la condition de Cauchy
d’intégrabilité.
10.4
Critère de Cauchy d’intégrabilité
Montrons que la condition d’intégrabilité de Cauchy est également suffisante, ce qui permettra de prouver l’intégrabilité de fonctions sans connaı̂tre
la valeur de leur intégrale.
Théorème. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Si, pour chaque ! > 0, il existe une jauge δ sur I¯ telle que,
définie sur I.
pour toute P-partition δ-fine Π de I et toute P-partition δ-fine Π$ de I, on a
|S(I, f, Π) − S(I, f, Π$)|2 ≤ !,
¯
alors f est intégrable sur I.
Démonstration. Construisons tout d’abord un candidat pour la valeur
¯ En prenant ! = 1 dans la condition de Cauchy, on
de l’intégrale de f sur I.
peut trouver une jauge δ1 sur I¯ telle que
|S(I, f, Π) − S(I, f, Π$)|2 ≤ 1
lorsque Π et Π$ sont des P-partitions δ1 -fines de I. En prenant ! = 1/2, on
¯ que l’on peut toujours choisir telle
peut trouver de même une jauge δ2 sur I,
¯ pour laquelle
que δ2 (x) ≤ δ1 (x) pour tout x ∈ I,
|S(I, f, Π) − S(I, f, Π$)|2 ≤
1
,
2
366
CHAPITRE 10. FONCTIONS INTÉGRABLES
lorsque Π et Π$ sont des P-partitions δ2 -fines de I. En continuant de la sorte
avec ! = 1/k, k ≥ 2 entier, on trouve une suite (δk )k∈N∗ de jauges sur I¯ telles
¯ et chaque k ∈ N∗ , on ait
que, pour chaque x ∈ I,
δk+1 (x) ≤ δk (x),
et pour lesquelles
1
,
k
lorsque Π et Π$ sont des P-partitions δk -fines de I. Fixons, pour chaque
k ∈ N∗ une P-partition δk -fine Πk de I et montrons que la suite
|S(I, f, Π) − S(I, f, Π$)|2 ≤
(S(I, f, Πk))k∈N∗
est une suite de Cauchy dans Rp. Par la propriété de décroissance de la suite
(δk (x))k∈N∗ , toute P-partition δq -fine sera δk -fine lorsque k ≤ q. Dès lors, si
q ≥ k sont des entiers supérieurs ou égaux à un, Πk et Πq seront δk -fines et
l’on a, par construction,
|S(I, f, Πk) − S(I, f, Πq)|2 ≤
1
.
k
En conséquence, si ! > 0 est donné, et si m ∈ N∗ est tel que 1/m ≤ !, il
suffira de prendre q ≥ k ≥ m pour que
|S(I, f, Πk) − S(I, f, Πq)|2 ≤
1
1
≤
≤ !.
k
m
Donc (S(I, f, Πk))k∈N∗ , suite de Cauchy dans Rp , est convergente et nous
désignerons sa limite par J. En faisant tendre q vers l’infini dans l’inégalité
ci-dessus, on obtient
|S(I, f, Πk) − J|2 ≤
1
, (k ∈ N∗ ).
k
Pour montrer que f est intégrable sur I¯ et que son intégrale y vaut J, soit
1
! > 0 et soit m ∈ N∗ tel que m
≤ !. Si Π est une P-partition δm -fine de I, et
si, pour tout q ≥ m, Πq est définie dans la première partie de la définition,
on a
1
|S(I, f, Π) − S(I, f, Πq)|2 ≤
≤ !.
m
Dès lors, si l’on fait tendre q vers l’infini, on obtient
|S(I, f, Π) − J|2 ≤ !,
et la démonstration est complète.
10.4. CRITÈRE DE CAUCHY D’INTÉGRABILITÉ
367
Remarque. En remplaçant partout, dans l’énoncé et la démonstration,
jauge par jauge constante, on obtient une condition suffisante de Cauchy
pour la R-intégrabilité.
Une conséquence importante de la condition suffisante d’intégrabilité
de Cauchy est la propriété de restriction de l’intégrale qui assure
¯
l’intégrabilité sur les sous-pavés de I¯ lorsqu’on a l’intégrabilité sur I.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Alors f est intégrable sur K̄ pour chaque semi-pavé K ⊂ I.
intégrable sur I.
Démonstration. On peut évidemment supposer que K ! I. On sait que
I \ K peut alors s’écrire sous la forme
I \K =
q
>
K i,
i=1
où les K i sont des semi-pavés mutuellement disjoints contenus dans I. Soit
! > 0; on va montrer que f vérifie la condition de Cauchy d’intégrabilité
¯ elle y vérifie la condition de Cauchy
sur K̄. Comme f est intégrable sur I,
d’intégrabilité, et il existe donc une jauge δ sur I¯ telle que
|S(I, f, Π) − S(I, f, Π$)|2 ≤ !,
lorsque Π et Π$ sont des P-partitions δ-fines de I. Bien entendu, la restriction
de δ à K̄ et aux K̄ i définit une jauge sur ces ensembles. Pour chaque 1 ≤
i ≤ q, fixons une P-partition δ-fine Πi de K i , et soient ΠK et Π$K deux Ppartitions δ-fines de K. Alors la famille Π formée par la réunion des éléments
de ΠK et de ceux des Πi , (1 ≤ i ≤ q) et la famille Π$ formée par la réunion
des éléments de Π$K et de ceux des Πi , (1 ≤ i ≤ q) sont des P-partitions
δ-fines de I telles que
S(I, f, Π) − S(I, f, Π$) = S(K, f, ΠK ) − S(K, f, Π$K ),
puisque les autres termes sont communs à S(I, f, Π) et à S(I, f, Π$). En
conséquence,
|S(K, f, ΠK) − S(K, f, Π$K )|2 = |S(I, f, Π) − S(I, f, Π$)|2 ≤ !,
et la démonstration est complète.
Remarque. La même démonstration montre évidemment que la propriété
de restriction est vraie pour la R-intégrabilité.
Nous pouvons maintenant énoncer et démontrer la réciproque de la
propriété d’additivité de l’intégrale.
368
CHAPITRE 10. FONCTIONS INTÉGRABLES
Corollaire. Soit I un semi-pavé de Rn , {K 1 , . . . , K q } une partition de I
¯ Alors f est
en semi-pavés et f une fonction de Rn dans Rp intégrable sur I.
i
intégrable sur chaque K et
J
I¯
f=
q J
$
i
i=1 K
f.
¯ l’est sur chaque K i par la propriété
Démonstration. f , intégrable sur I,
de restriction, et la formule se déduit alors de la propriété d’additivité de la
section précédente.
10.5
Fonctions continues ou monotones
Le critère de Cauchy permet de démontrer la R-intégrabilité sur I¯ d’une
¯
fonction continue sur I.
Proposition. Toute fonction f de Rn dans Rp continue sur l’adhérence I¯
¯
d’un semi-pavé I de Rn est R-intégrable sur I.
Démonstration. On va montrer que f vérifie la condition de Cauchy de R¯ Pour ce faire, notons d’abord que si Π = {(x1 , I 1 ), . . ., (xm, I m)}
intégrabilité
sur I.
8
9
et Π̃ = (x̃k , Ĩ k )
sont deux P-partitions de I et si l’on pose I j,k =
1≤k≤m̃
!
!m̃
j
˜k
I j ∩ I˜k , (1 ≤ j ≤ m; 1 ≤ k ≤ m̃), alors, comme I = m
j=1 I = k=1 I , on a
évidemment
I =I ∩
j
j
&
m̃
>
I˜k
k=1

I˜k = I˜k ∩ 
m
>
j=1
'

=
Ij =
m̃
>
I j,k , (1 ≤ j ≤ m),
m
>
I j,k , (1 ≤ k ≤ m̃),
k=1
j=1
et, puisque les I j sont mutuellement disjoints et les I˜k sont mutuellement
disjoints, on aura
µ(I j ) =
$
µ(I j,k ), (1 ≤ j ≤ m);
$
µ(I j,k ), (1 ≤ k ≤ m̃).
{1≤k≤m̃ : I j,k (=∅}
µ(I˜k ) =
{1≤j≤m : I j,k (=∅}
369
10.5. FONCTIONS CONTINUES OU MONOTONES
Dès lors, en désignant par y j,k , pour chaque (j, k) tel que I j,k /= ∅, un élément
arbitrairement fixé de I j,k , on a
|S(I, f, Π) − S(I, f, Π̃)|2
#
#
#m
#
m̃
$
$
$
#$
#
j,k
j
j,k
k
= ##
µ(I )f (x ) −
µ(I )f (x̃ )##
#j=1 {1≤k≤m̃ : I j,k (=∅}
#
k=1 {1≤j≤m : I j,k (=∅}
2
#
#
#
#
$
#
#
= ##
µ(I j,k )[f (xj ) − f (x̃k )]##
#{1≤j≤m; 1≤k≤m̃ : I j,k (=∅}
#
≤
$
{1≤j≤m; 1≤k≤m̃ :
2
µ(I
I j,k (=∅}
j,k
)[|f (x ) − f (y
j
j,k
)|2 + |f (y
j,k
) − f (x̃k )|2 ].
La continuité de f sur le fermé borné I¯ entraı̂ne sa continuité uniforme sur
¯ Dès lors, si ! > 0 est donné, il existe un δ > 0 tel que, pour chaque x ∈ I¯
I.
et chaque y ∈ I¯ ∩ B∞ [x; δ], on ait
|f (y) − f (x)|2 ≤
!
.
2µ(I)
¯ on voit, en utilisant les inégalités
Prenant ce δ comme jauge constante sur I,
ci-dessus, que si Π et Π̃ sont des P-partitions δ-fines de I, on aura évidemment
y j,k ∈ I j ⊂ B∞ [xj ; δ], y j,k ∈ I˜k ⊂ B∞ [x̃k ; δ],
et dès lors
|S(I, f, Π)−S(I, f, Π̃)|2 ≤
$
{1≤j≤m; 1≤k≤m̃ : I j,k (=∅}
µ(I j,k )
2
3
!
!
+
=!
2µ(I) 2µ(I)
et la démonstration est complète.
Le même critère de Cauchy permet de montrer qu’une fonction de R dans
R monotone sur [a, b] y est R-intégrable.
Proposition. Toute fonction f de R dans R monotone sur [a, b] y est Rintégrable.
Démonstration. Il suffit évidemment de prouver le résultat pour une
fonction croissante, puisque f et −f sont simultanément R-intégrables sur
[a, b]. Si f (a) = f (b), alors f est constante sur [a, b]A et le résultat Best déjà
connu. Supposons donc f (b) − f (a) > 0. Soient Π = (xj , ]aj−1 , aj ]) 1≤j≤m ,
370
CHAPITRE 10. FONCTIONS INTÉGRABLES
et Π̃ =
8
(x̃k , ]ãk−1 , ãk ])
9
1≤k≤m̃
, avec a0 = ã0 = a, am = ãm̃ = b, deux
P-partitions de ]a, b] telles que
S(I, f, Π) − S(I, f, Π̃) ≥ 0.
En vertu de la croissance de f , on a
|S(I, f, Π) − S(I, f, Π̃)| = S(I, f, Π) − S(I, f, Π̃)
=
m
$
j=1
≤
m
$
j=1
f (xj )(aj − aj−1 ) −
f (aj )(aj − aj−1 ) −
m̃
$
k=1
m̃
$
k=1
f (x̃k )(ãk − ãk−1 )
f (ãk−1 )(ãk − ãk−1 ).
Si l’on pose
I } = {a0 , . . . , am } ∪ {ã0 , . . . , ãm̃ },
Im
{I
a0 , . . . , a
avec
et
I = b,
I0 < a
I1 < . . . < a
Im
a=a
I j = ]aj−1 , aj ], (1 ≤ j ≤ m), I˜k = ]ãk−1 , ãk ], (1 ≤ k ≤ m̃),
I
IIl = ]I
al−1, I
al ], (1 ≤ l ≤ m),
alors la croissance de f entraı̂ne les inégalités
m̃
$
k=1
≥
f (ãk )(ãk − ãk−1 ) =
$
{1≤k≤m̃; 1≤l≤m
I : IIl ⊂I˜k }
=
≥
$
$
{1≤k≤m̃; 1≤l≤m
I : IIl ⊂I˜k }
Il−1 ) =
f (I
al )(I
al − a
$
{1≤j≤m; 1≤l≤m
I : IIl ⊂I j }
{1≤j≤m; 1≤l≤m
I : IIl ⊂I j }
f (ãk )(I
al − I
al−1 )
m
I
$
l=1
f (I
al )(I
al − I
al−1 )
Il−1 )
f (I
al )(I
al − a
f (aj−1 )(I
al − I
al−1 ) =
$
j=1
f (aj−1 )(aj − aj−1 ).
371
10.5. FONCTIONS CONTINUES OU MONOTONES
Par conséquent,
|S(I, f, Π) − S(I, f, Π̃)|
≤
+
$
f (aj )(aj − aj−1 ) −
m̃
$
f (ãk )(ãk − ãk−1 ) −
j=1
k=1
=
m
$
j=1
m̃
$
f (ãk−1 )(ãk − ãk−1 )
m
$
f (aj−1 )(aj − aj−1 )
m̃
$
[f (ãk ) − f (ãk−1 )](ãk − ãk−1 ).
k=1
[f (aj ) − f (aj−1 )](aj − aj−1 ) +
j=1
k=1
! > 0 étant donné, choisissons la jauge constante δ =
!
4[f (b)−f (a)] .
Si les P-
partitions Π et Π̃ sont δ-fines et (sans perte de généralité) choisies de telle
sorte que S(I, f, Π) − S(I, f, Π̃) ≥ 0, on aura, en utilisant l’inégalité qui
précède et le fait que
aj − aj−1 ≤
!
, (1 ≤ j ≤ m),
2[f (b) − f (a)]
ãk − ãk−1 ≤
!
, (1 ≤ k ≤ m̃),
2[f (b) − f (a)]
l’inégalité

|S(I, f, Π) − S(I, f, Π̃)|

m
m̃
$

$
!
≤
[f (aj ) − f (aj−1 )] +
[f (ãk ) − f (ãk−1 )]

2[f (b) − f (a)] j=1
k=1
=
!
[f (b) − f (a) + f (b) − f (a)] = !,
2[f (b) − f (a)]
et la démonstration est complète.
¯ Rp) l’ensemble des fonctions de Rn dans
Remarque. En désignant par C(I,
p
R continues sur I¯ et par M ([a, b], R) l’ensemble des fonctions de R dans R
définies et monotones sur [a, b], on a donc démontré les inclusions
¯ Rp) ⊂ R(I,
¯ Rp) et M ([a, b], R) ⊂ R([a, b], R).
C(I,
372
10.6
CHAPITRE 10. FONCTIONS INTÉGRABLES
Intégrale indéfinie
Soit f une fonction de R dans
Rp intégrable sur [a, b]. Par la propriété de
Ha
restriction et la convention a f = 0, f sera intégrable sur [a, x] quel que soit
x ∈ [a, b], ce qui permet de définir une application de [a, b] dans Rp par
x 2→
J
x
f.
a
Cette application est appelée l’intégrale indéfinie de f sur I¯ et est notée
J
·
f ou
a
J
·
f (t) dt
a
pour rappeler son mode de construction. Dans la seconde notation, la variable t peut évidemment être remplacée par n’importe quelle autre lettre. On
évitera cependant d’utiliser x car alors, dans la valeur en x
J
x
f (x) dx
a
de l’intégrale indéfinie, la lettre x aurait ou n’aurait pas de signification selon
sa position !
Lorsque f est une fonction de R dans Rp intégrable sur tout intervalle
fermé et borné contenu dans un intervalle quelconque I, on peut fixer un
élément a ∈ I et utiliser la convention de notation des intégrales simples pour
définir l’intégrale indéfinie de f correspondante comme étant l’application
de I dans Rp
J ·
J x
f : x 2→
f.
a
a
L’additivité
de l’intégrale entraı̂ne aussitôt que deux intégrales indéfinies
H·
f
et
f
de
f sur I associées à des choix différents de a diffèrent par une
"
a
a
constante.
Montrons maintenant que, pour une fonction f primitivable sur I, les
intégrales indéfinies de f ne sont rien d’autre que ses primitives.
H·
Proposition. Si f est une Hfonction de R dans Rp primitivable
sur un inH
tervalle I et si a ∈ I, alors a· f = Fa . En particulier, a· f est dérivable en
chaque point x de I et l’on a
4J
·
a
f
5$
(x) = f (x).
373
10.6. INTÉGRALE INDÉFINIE
Démonstration. Notons tout d’abord que, par le théorème fondamental
du calcul différentiel et intégral, f est intégrable sur tout intervalle fermé
borné contenu dans I, et si a ∈ I, x ∈ I avec x /= a, F désigne une primitive
quelconque de f sur I et Fa désigne la primitive de f sur I qui s’annule en
a, on a
J
x
a
f = F (x) − F (a) = Fa (x), (x ∈ I).
Comme la fonction définie par le second membre de cette égalité est dérivable
sur I et a pour dérivée f , la démonstration est complète.
Remarque. Ce résultat explique l’abus (regrettable) de langage qui consiste
à utiliser parfois le terme “intégrale indéfinie” et même le terme “intégrale”
H
au lieu du terme “primitive”. Il explique la similitude du symbole (un S
allongé) utilisé pour les deux concepts.
Lorsque f ∈ P ([a, b], Rp) \ N ([a, b], Rp), son intégrale indéfinie n’est plus
nécessairement dérivable en chaque point de [a, b] et, lorsqu’elle est dérivable
en x, sa dérivée n’est plus nécessairement égale à f (x). C’est ce que montrent
les exemples suivants.
Exemples. 1. En utilisant l’analogue d’un exemple antérieur et l’additivité
de l’intégrale, on sait que la fonction f définie par f (x) = 0 si x ≤ 0 et
f (x) = 1 si x > 0 est intégrable sur [−1, 1] sans y être primitivable et son
intégrale indéfinie se calcule aisément :
J
x
−1
f = 0 si x ∈ [−1, 0],
J
x
−1
f = x si x ∈ ]0, 1].
Elle n’est pas dérivable en 0.
2. La fonction de Dirichlet est intégrable, sans être primitivable, sur [0, x]
quel que soit x > 0 et son intégrale indéfinie est l’application nulle, dont la
dérivée, qui est l’application nulle, n’est pas égale à la fonction de Dirichlet.
Montrons maintenant qu’en chaque point de continuité d’une fonction
intégrable, la dérivée de l’intégrale indéfinie existe et est égale à la valeur de
la fonction en ce point.
Proposition. Soit f une fonction de R dans Rp intégrable sur [a, b], et soit
c ∈ [a, b] tel que f soit continue en c. Alors l’intégrale indéfinie de f est
dérivable en c et
4J
5$
·
(c) = f (c).
f
a
Démonstration. Il faut donc démontrer que
lim
h→0, c+h∈[a,b]
−1
h
&J
c+h
a
f−
J
c
a
f
'
= f (c),
374
CHAPITRE 10. FONCTIONS INTÉGRABLES
ou encore que
lim
h→0, c+h∈[a,b]
,J
−1
h
c+h
a
f−
J
c
a
-
f − hf (c) = 0.
Pour tout h ∈ R tel que c + h ∈ [a, b], on a, en vertu de l’additivité de
l’intégrale
J
a
c+h
f−
J
c
a
f − hf (c) =
=
J
c+h
a
J
c+h
c
f (x) dx +
J
c
a
f (x) dx −
J
c
c+h
f (c) dx
[f (x) − f (c)] dx.
Soit ! > 0; f étant continue en c, il existe un δ > 0 tel que, pour tout
x ∈ [a, b] vérifiant |x − c| ≤ δ, on a |f (x) − f (c)|2 ≤ !. Dès lors, si h est
tel que c + h ∈ [a, b] et |h| ≤ δ, on a, pour tout x compris entre c et c + h,
|x − c| ≤ |h| ≤ δ et donc
|f (x) − f (c)|2 ≤ !.
Comme f (·) − f (c) et la fonction constante ! sont intégrables sur l’intervalle
fermé d’extrémités c et c + h, on en déduit que
#J
#
#J
#
# c+h
#
# c+h
#
#
#
#
#
[f (x) − f (c)] dx# ≤ #
! dx# = !|h|,
#
# c
#
# c
#
2
et dès lors, si 0 < |h| ≤ δ et c + h ∈ [a, b], on a
#
;J
<#
#
#
c+h
#
# −1
[f (x) − f (c)] dx # ≤ !,
#h
#
#
c
2
et la démonstration est complète.
Corollaire. Si f est une fonction de R dans Rp continue sur un intervalle
I, chaque intégrale indéfinie de f est dérivable sur I et, pour chaque a ∈ I,
on a
4J
5
·
a
f
$
(x) = f (x), (x ∈ I).
Démonstration. Il suffit de noter que toute fonction continue sur I est Rintégrable sur tout intervalle fermé et borné de I et d’appliquer la proposition
précédente en chaque point de I.
375
10.7. EQUATIONS DIFFÉRENTIELLES SIMPLES
Une conséquence importante de ce corollaire est la primitivabilité sur un
intervalle I des fonctions continues sur I.
Corollaire. Toute fonction f de R dans Rp continue sur un intervalle I est
primitivable sur I.
Démonstration. L’intégrale indéfinie de f est, en vertu du corollaire
précédent, une primitive de f sur I.
On a donc, pour les fonctions d’une variable, les inclusions strictes
C([a, b], Rp) ! N ([a, b], Rp) ! P ([a, b], Rp),
C([a, b], Rp) ! R([a, b], Rp) ! P ([a, b], Rp),
M ([a, b], Rp) ! R([a, b], Rp) ! P ([a, b], Rp).
10.7
Equations différentielles simples
La résolution de certaines équations différentielles simples se ramène à des
intégrations indéfinies.
Définition. Soit I un intervalle, f et g des fonctions réelles continues sur I.
On appelle équation différentielle linéaire du premier ordre toute équation
différentielle de la forme
y $ (x) = f (x)y(x) + g(x),
(10.1)
dont l’inconnue y est une fonction réelle dérivable sur I. Une solution sur I
de cette équation différentielle sera toute application réelle y dérivable sur I
et vérifiant l’équation en chaque point de I. L’équation est dite homogène
si g = 0 et non homogène sinon.
Puisque f est continue sur I, elle y est primitivable et chaque intégrale
indéfinie de f est dérivable, et donc continue sur I. Si a ∈ I est fixé, la
fonction
4 J x 5
x 2→ exp −
f
a
est donc strictement positive et dérivable sur I. L’équation (10.1) est donc
équivalente à l’équation
4
y $ (x) exp −
J
x
a
f
5
4
= f (x)y(x) exp −
J
a
x
f
5
4
+ g(x) exp −
J
a
x
5
f ,
376
CHAPITRE 10. FONCTIONS INTÉGRABLES
c’est-à-dire à l’équation
2
4
y(x) exp −
J
x
f
a
53$
4
= g(x) exp −
J
5
x
f .
a
Le second membre étant continu, dont primitivable sur I, les solutions de
cette équation seront données par
4
y(x) exp −
J
x
f
a
5
= c+
J
x
a
2
4
g(y) exp −
J
y
f
a
53
dy,
où c est une constante réelle arbitraire, et dès lors les solutions de l’équation
linéaire (10.1) seront les fonctions y données par
U
y(x) = c +
= c exp
J
x
a
4J
2
x
f
a
4
g(y) exp −
5
+
J
a
x2
J
a
exp
y
f
53
4J
y
x
V
dy exp
5
3
4J
x
a
f
5
f g(y) dy.
Exemple. Considérons l’équation différentielle
1
y $ (x) = y(x) + x
x
sur l’intervalle I = ]0, +∞[. Prenant par exemple a = 1, on a
J x
1
dy = ln x, exp(ln x) = x,
y
1
et dès lors les solutions sont données par les fonctions y définies par
2
y(x) = c +
où c est un réel arbitraire.
J
1
x
3
dy x = [c + (x − 1)]x,
Définition. Soit I un intervalle, f une fonction réelle continue sur I et h
une application continue de R dans R. On appelle équation différentielle du
premier ordre à variables séparées toute équation différentielle de la forme
y $ (x) = f (x)h(y(x)),
(10.2)
où l’inconnue y est une fonction réelle. Si J ⊂ I est un intervalle, on appelle solution sur J de cette équation différentielle toute application réelle y
dérivable sur J et vérifiant l’équation pour chaque x ∈ J.
La terminologie “variables séparées” vient de ce que le second membre
de l’équation est le produit d’une fonction de x seulement par une fonction
de y seulement. Ainsi, une équation différentielle linéaire du premier ordre
est à variables séparées si elle est homogène ou si f et g sont constantes.
Notons tout d’abord le résultat simple suivant.
10.7. EQUATIONS DIFFÉRENTIELLES SIMPLES
377
Proposition. Pour tout y ∗ tel que h(y ∗ ) = 0, l’application constante y ∗ sur
I est une solution sur I de (10.2).
Démonstration. On a en effet, pour tout x ∈ I, (y ∗ )$ = 0 = f (x)h(y ∗ ).
Supposons maintenant que h vérifie une condition de Lipschitz sur chaque
borné de R. Ce sera en particulier le cas si h est de classe C 1 sur R. On
sait alors que, pour chaque x0 ⊂ I et chaque y0 ∈ R, le problème de Cauchy
correspondant
y $ (x) = f (x)h(y(x)), y(x0) = y0
possède au plus une solution. Dès lors, si y ∗ est un zéro de h et y une solution
de l’équation différentielle (10.2) telle que y(x0 ) = y ∗ pour un certain x0 ,
l’unicité de la solution du problème de Cauchy entraı̂ne que y(x) = y ∗ pour
chaque x ∈ I. Par conséquent, chaque solution de (10.2) différente d’un
zéro de h prendra ses valeurs dans un et un seul des intervalles ouverts de
R déterminés par les zéros de h. Soit K un tel intervalle. La fonction h1 est
donc continue sur K et y : I → K est solution de l’équation différentielle
(10.2) si et seulement si elle vérifie l’équation
y $ (x)
= f (x),
h(y(x))
ou encore, fixant a ∈ I et utilisant le théorème de dérivation des fonctions
composées et les propriétés de l’intégrale indéfinie, si et seulement si elle
vérifie l’équation
&J
'$
y(x) dt
= f (x).
h(t)
a
Comme le second membre est continu, donc primitivable sur I, cette dernière
équation équivaut à
J
y(x)
a
dt
=c+
h(t)
J
x
f (t) dt,
a
où c est une constante réelle arbitraire. Pour chaque valeur fixée de c, la
solution y s’obtiendra donc explicitement en résolvant alors le problème de
fonction implicite G(y, x) − c = 0, où G est définie par
G(x, y) =
J
a
y
dt
−
h(t)
J
x
f (t) dt.
a
Comme G est de la forme G(y, x) = M (y)−F (x) où M est une fonction con1
tinue et strictement monotone, puisque M $ (y) = h(y)
est de signe constant
378
CHAPITRE 10. FONCTIONS INTÉGRABLES
sur K, cette équation aura une solution unique y(x) pour chaque x ∈ I
tel que F (x) appartienne à M (K). On notera que la fonction G(x, y(x))
conserve une valeur constante c si y est solution de l’équation différentielle
(10.2). On dit que G est une intégrale première de l’équation différentielle
(10.2).
Exemples. 1. Considérons l’équation différentielle à variables séparées
y $ (x) = 2x[y(x)]2.
Notons tout d’abord que y = 0 est une solution sur R et recherchons maintenant les solutions à valeurs strictement positives ou à valeurs strictement
négatives. Les solutions sous forme implicite sont données, en prenant par
exemple a = 1, par
J y(x)
J x
dt
=c+
2t dt,
t2
1
1
c’est-à-dire par
1
1−
= c + x2 − 1,
y(x)
ce qui peut encore s’écrire, puisque c est une constante arbitraire,
y(x) =
1
.
c − x2
Dès lors, pour c < 0, cette solution est strictement négative et définie sur R.
Pour c = 0, cette formule fournit une solution strictement négative définie sur
] − ∞, 0[ et une solution strictement négative définie sur ]0, +∞[. Pour c > 0,
√
la formule fournit une solution strictement négative définie sur ] − ∞, − c[,
√
√
une solution strictement positive définie sur ] − c, + c[ et une solution
√
strictement négative définie sur ] c, +∞[. On voit que, contrairement au cas
de l’équation linéaire, les intervalles de définition des solutions peuvent être
strictement compris dans l’intervalle de définition de l’équation différentielle
(ici R) et peuvent dépendre de la solution elle-même.
2. L’équation différentielle
2
y(x)
y (x) = ay(x) 1 −
b
$
3
où a > 0 et b > 0, fut proposée en 1838 par le mathématicien belge PierreFrançois Verhulst pour remplacer la loi
y $ (x) = ay(x)
10.8. LEMME DE SAKS-HENSTOCK
379
donnée en 1798 par Thomas R. Malthus pour décrire l’évolution d’une
population. La loi de Malthus n’a évidemment, à côté de la solution constante y(x) = 0, que des solutions exponentielles y(x) = c exp ax, c ∈ R∗ .
L’équation de Verhulst possède les deux solutions constantes y(x) = 0 et
y(x) = b données par les zéros de la fonction h(y) = y(1 − yb ). On vérifie
aisément, en utilisant la méthode exposée plus haut, que les autres solutions
sont les fonctions y définies par
y(x) =
bc
, c ∈ R \ {0, b}.
c + (b − c) exp(−ax)
Si c > b, la solution correspondante est strictement décroissante sur
]a−1 ln(1 − bc ), +∞[ tend vers +∞ si x tend vers a−1 ln(1 − bc ) et tend vers b
lorsque x tend vers +∞. Si c ∈ ]0, b[ , la solution est strictement croissante
sur R, avec limx→−∞ y(x) = 0, limx→+∞ y(x) = b. Enfin, si c < 0, la solution (négative et donc sans intérêt pour la démographie !) est strictement
décroissante sur ] − ∞, a−1 ln(1 − bc )[ et elle tend vers 0 si x tend vers −∞
et vers −∞ si x tend vers a−1 ln(1 − bc ). La courbe décrite par cette solution
lorsque 0 < c < b est appelée la courbe logistique et joue un grand rôle dans
la description des phénomènes biologiques et sociologiques. Contrairement
au modèle de Malthus, qui mène à une croissance exponentielle, le modèle
de Verhulst conduit à une saturation de la population.
10.8
Lemme de Saks-Henstock
Le résultat technique suivant, qui porte le nom de lemme de Saks-Henstock, joue un rôle essentiel dans la démonstration de plusieurs résultats
importants en théorie de l’intégration. Il exprime essentiellement que, pour
une fonction f intégrable sur l’adhérence I¯ d’un semi-pavé I, la somme de
Riemann associée àH un “morceau” d’une P-partition Π dont la somme de
Riemann approche I¯ f à ! près est elle-même une approximation à ! près de
la somme des intégrales sur les adhérences des pavés constituant le morceau.
Lemme. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp intégra¯ Soit ! > 0 et δ une jauge sur I¯ telle que
ble sur I¯ et J son intégrale sur I.
l’on ait
|S(I, f, Π) − J|2 ≤ !,
pour toute P-partition δ-fine Π de I. Alors, pour toute famille
{(x1 , K 1 ), . . ., (xq , K q )}
380
CHAPITRE 10. FONCTIONS INTÉGRABLES
formée de semi-pavés K j mutuellement disjoints contenus dans I et de points
xj ∈ K̄ j tels que
K j ⊂ B∞ [xj , δ(xj )], (1 ≤ j ≤ q),
on a
#
#
# q 2
3#
J
#$
#
j
j
#
µ(K )f (x ) −
f ## ≤ !.
#
K̄ j
#j=1
#
2
Démonstration. On va montrer que
#
#
# q 2
3#
J
#$
#
j
j
#
µ(K )f (x ) −
f ## ≤ ! + η,
#
j
K̄
#j=1
#
2
!q
quel que soit η > 0. On sait que I \ j=1 K j peut s’écrire sous la forme
k
k
k=1 L , où les L (1 ≤ k ≤ r) sont des semi-pavés contenus dans I et
¯ l’est aussi sur
mutuellement disjoints. Bien entendu, f , intégrable sur I,
k
chaque L , et
!r
J
I¯
f=
q J
$
j
j=1 K̄
f+
r J
$
k
k=1 L̄
f.
En conséquence, si η > 0 est donné, il existera une jauge δk sur L̄k , que l’on
peut toujours choisir telle que δk (x) ≤ δ(x), (x ∈ L̄k , 1 ≤ k ≤ r), ayant la
propriété que
#
#
J
#
#
η
#S(Lk , f, Πk ) −
f ## ≤ ,
#
k
r
L̄
2
pour toute P-partition δk -fine Πk de Lk , (1 ≤ k ≤ r). Par conséquent, la
famille finie Π formée des (xj , K j ), (1 ≤ j ≤ k), et des éléments des familles
Πk , (1 ≤ k ≤ r) constitue une P-partition δ-fine de I telle que
S(I, f, Π) =
q
$
µ(K j )f (xj ) +
j=1
r
$
S(Lk , f, Πk ).
k=1
On aura donc, par hypothèse,
#
#
# q 2
3#
J
#$
#
j
j
#
µ(K )f (x ) −
f ##
#
j
K̄
#j=1
#
2
#
J
r
r J
#
$
$
#
= #S(I, f, Π) −
S(Lk , f, Πk ) − f +
#
I¯
L̄k
k=1
k=1
#
#
#
f#
#
2
381
10.8. LEMME DE SAKS-HENSTOCK
#
#
J
≤ ##S(I, f, Π) −
I¯
#
#
f ## +
2
≤ !+r
J
r ##
$
#S(Lk , f, Πk ) −
#
L̄k
k=1
η
= ! + η,
r
#
#
f ##
2
et la démonstration est complète.
Corollaire. Dans les conditions du lemme de Saks-Henstock, si f est réelle,
on a
#
J
q #
$#
#µ(K j )f (xj ) −
#
K̄ j
j=1
#
f ## ≤ 2!.
Démonstration. Soient K j1 , . . . , K jl (resp. K jl+1 , . . ., K jq ) les K j tels
que
µ(K )f (x ) −
j
j
J
f ≥ 0, (resp. µ(K )f (x ) −
j
K̄ j
j
J
K̄ j
f < 0).
Le théorème précédent s’applique à chaque famille {(xji , K ji ) : 1 ≤ i ≤ l} et
{(xji , K ji ) : l + 1 ≤ i ≤ q} et fournit les inégalités
J
l ##
$
#µ(K ji )f (xji ) −
#
K̄ ji
i=1
et
J
q #
$
#
#µ(K ji )f (xji ) −
#
K̄ ji
i=l+1
#
#
f ## =
#
#
l 2
$
i=1
f ## = −
µ(K ji )f (xji ) −
q 2
$
i=l+1
J
K̄ ji
µ(K ji )f (xji ) −
J
3
f ≤ !,
K̄ ji
3
f ≤ !.
La thèse résulte de l’addition membre à membre de ces inégalités.
Le résultat correspondant pour une fonction à valeurs dans Rp s’en déduit
aisément.
Corollaire. Dans les conditions du lemme de Saks-Henstock, on a, avec
i = 1, 2 ou ∞,
J
q #
$
#
#µ(K j )f (xj ) −
#
K̄ j
j=1
#
#
f ## ≤ 2p!.
i
Démonstration. En appliquant le corollaire précédent à chaque composante fk de f , qui vérifie aussi les conditions du lemme de Saks-Henstock,
on obtient
#
#
J
q
$
#
#µ(K j )fk (xj ) −
#
j=1
K̄ j
#
fk ## ≤ 2!, (1 ≤ k ≤ p).
382
CHAPITRE 10. FONCTIONS INTÉGRABLES
Dès lors, si i = 1, 2 ou ∞, on a
J
q #
$
#
#µ(K j )f (xj ) −
#
K̄ j
j=1
=
#
J
q #
$
#
#
#
#µ(K j )f (xj ) −
f# ≤
#
i
K̄ j
j=1
J
q $
p #
$
#
#µ(K j )fk (xj ) −
#
K̄ j
j=1 k=1
#
#
#
#
f ##
1
fk ## ≤ 2p!.
Enfin, la conséquence suivante du lemme de Saks-Henstock va nous conduire à la notion d’intégrabilité absolue.
Corollaire. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp
¯ Soit ! > 0 et δ une jauge sur I¯ telle
intégrable sur I¯ et J son intégrale sur I.
que l’on ait
|S(I, f, Π) − J|2 ≤ !,
pour toute P-partition δ-fine Π de I. Alors, pour ces mêmes P-partitions
Π = {(x1 , I 1), . . . , (xm, I m)}, on a, si i = 1, 2 ou ∞,
#
#
m #J
$
#
#
#S(I, |f |i, Π) −
#
#
# ¯j
#
j=1 I
#
#
f ##
#
#
#
# ≤ 2p!.
#
i#
Démonstration. En appliquant les inégalités classiques sur les normes et
le corollaire précédent à la famille Π = {(x1 , I 1 ), . . ., (xm, I m)}, on obtient
≤
10.9
#
#
m #J
$
#
#
#S(I, |f |i, Π) −
#
#
# ¯j
#
j=1 I
#
#
f ##
#J
m #
$
#
#
#µ(I j )|f (xj )|i − #
#
# ¯j
j=1
I
#
#
#
#=
#
i#
##
##
#
#m 2
#J
#$
#
j
j
#
µ(I )|f (x )|i − ##
#
I¯j
#j=1
f ## ## ≤
i
J
m #
$
#
#µ(I j )f (xj ) −
#
¯j
j=1
I
#
#
#
#
f ##
#
3#
#
#
#
i #
f ## ≤ 2p!.
i
L-intégrabilité sur un pavé
L’intégrabilité d’une fonction f sur un pavé I¯ de Rn n’entraı̂ne pas nécessairement l’intégrabilité de |f |i sur I¯ et l’intégrabilité de |f |i sur I¯ n’entraı̂ne
pas nécessairement celle de f sur I¯ (i = 1, 2 ou ∞). Nous donnerons plus loin
383
10.9. L-INTÉGRABILITÉ SUR UN PAVÉ
des exemples justifiant cette assertion. On va voir que la classe des fonctions
f telles que f et |f |i sont toutes deux intégrables sur I¯ est un sous-ensemble
¯ de
particulièrement important de l’ensemble des fonctions intégrables sur I,
la même manière que le sous-ensemble des séries absolument convergentes
constitue un sous-ensemble particulièrement intéressant de l’ensemble des
séries convergentes. Le dernier corollaire du lemme de Saks-Henstock montre
que, ! > 0 étant donné et δ étant une jauge associée à cet ! par l’intégrabilité
¯ les sommes de Riemann S(I, |f |i, Π) relatives à |f |i et aux Pde f sur I,
partitions δ-finesHΠ = {(x1 , I 1 ), . . ., (xm, I m)} diffèreront de moins de 2p! des
%
quantités m
j=1 | I¯j f |i . Cette observation suggère la condition nécessaire et
¯ Rp) soit telle que |f |i ∈
suffisante suivante pour qu’une fonction f ∈ P (I,
p
¯ R ).
P (I,
Proposition. Soit I un semi-pavé de Rn , f une fonction de Rn dans Rp
intégrable sur I¯ et i = 1, 2 ou ∞. Alors, |f |i est intégrable sur I¯ si et
seulement si le sous-ensemble de R+
; q #J
$#
#
Si =
#
K̄
l=1
<
#
#
1
q
#
f # : {K , . . ., K } ∈ P(I) ,
l
i
est majoré, où P(I) désigne l’ensemble de toutes les partitions {K 1 , . . .,
K q } de I en un nombre fini de semi-pavés. En outre, si Si est majoré, alors
J
I¯
|f |i = sup Si =
sup
{K 1 ,...,K q }∈P (I)
&
q #J
$
#
#
#
K̄
l=1
#'
#
f ## .
l
i
Démonstration. Condition nécessaire. Soit i = 1, 2 ou ∞. Si f et
¯ et si {K 1 , . . . , K q } ∈ P(I), alors f et |f |i sont
|f |i sont intégrables sur I,
l
intégrables sur chaque K et
#J
#
#
#
K̄ l
#
#
f ## ≤
i
J
K̄ l
|f |i, (1 ≤ l ≤ q).
Dès lors, en vertu de l’additivité de l’intégrale, on a
q #J
$
#
#
#
l=1
K̄ l
#
#
f ## ≤
i
q J
$
l=1
K̄ l
|f |i =
H
J
I¯
|f |i ,
ce qui montre que Si est majoré par I¯ |f |i .
Condition suffisante. i = 1, 2 ou ∞ étant fixé, posons
Ai = sup Si =
sup
{K 1 ,...,K q }∈P (I)
&
q #J
$
#
#
#
l=1
K̄
#'
#
f ## .
l
i
384
CHAPITRE 10. FONCTIONS INTÉGRABLES
Soit ! > 0 donné. Par la caractérisation du supremum, il existe {K 1 , . . . ,
K q } ∈ P(I) tel que
#
q #J
#
! $ ##
Ai − ≤
f # ≤ Ai .
2 l=1 # K̄ l #i
Par l’intégrabilité de f sur I¯ et le lemme des P-partitions subordonnées, il
existe une jauge δ sur I¯ telle que
#
J #
#
#
#S(I, f, Π) − f # ≤ !
#
#
4p
I¯ 2
pour toute P-partition δ-fine Π de I et telle que, pour chacune de ces Ppartitions Π = {(x1 , I 1 ), . . ., (xm, I m)}, la famille
Π̃ = {(xj , I j ∩ K l ) : I j ∩ K l /= ∅, 1 ≤ l ≤ q, 1 ≤ j ≤ m}
est une P-partition δ-fine de I pour laquelle S(I, |f |i, Π) = S(I, |f |i, Π̃). En
conséquence, on a
q
≤
q
$
#
#
J
q #
$
$
#
#
#
f ## =
#
l
j
K̄ l
i
l=1 #{1≤j≤m : I j ∩K l (=∅} K ∩I
#J
! $ ##
Ai − ≤
2 l=1 #
$
l=1 {1≤j≤m : I j ∩K l (=∅}
#J
#
#
#
K l ∩I
#
#
f ## ≤ Ai ,
j
#
#
#
f ##
#
i
i
et, en vertu du dernier corollaire du lemme de Saks-Henstock,
#
#
#
#J
##
$
#
#
##
!
#S(I, |f |i, Π̃) −
#
##
#
# l j f# # ≤ 2.
K ∩I
#
i#
{1≤j≤m, 1≤l≤q : I j ∩K l (=∅}
En conséquence, si Π est une P-partition δ-fine de I, on a
|S(I, |f |i, Π) − Ai | = |S(I, |f |i, Π̃) − Ai |
#
#
#
#J
##
$
#
#
##
#
##
≤ ##S(I, |f |i, Π̃) −
# l j f# #
K ∩I
#
i#
{1≤j≤m, 1≤l≤q : I j ∩K l (=∅}
#
#
#
#
#J
#
$
#
#
#
#
!
!
#
#
#
#
+#
# l j f # − Ai # ≤ 2 + 2 = !.
#{1≤j≤m, 1≤l≤q : I j ∩K l (=∅} K ∩I
#
i
10.9. L-INTÉGRABILITÉ SUR UN PAVÉ
385
Remarque. Les inégalités bien connues entre les trois types de normes
d’un élément de Rp montrent que si Si est majorée pour une des normes, il
¯
l’est pour les deux autres. En conséquence, lorsque f est intégrable sur I,
l’intégrabilité de l’une des fonctions |f |i entraı̂nera celle des deux autres, ce
qui justifie l’indépendance de la définition qui suit par rapport au choix de
la norme | · |2 .
Définition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ On dit que f est absolument intégrable sur I¯ ou intégrable
définie sur I.
au sens de Lebesgue sur I¯ ou encore L-intégrable sur I¯ si f et |f |2 sont
¯
intégrables sur I.
L’appellation “intégrable au sens de Lebesgue” vient de ce que cette
classe de fonctions fut introduite pour la première fois en 1902 par Henri
Lebesgue à partir d’une définition différente de celle utilisée ici. Toute
fonction L-intégrable sur I¯ y est donc évidemment intégrable. En d’autres
¯ Rp) l’ensemble des fonctions de Rn dans Rp
termes, si l’on désigne par L(I,
¯ on a l’inclusion
L-intégrables sur I,
¯ Rp) ⊂ P (I,
¯ Rp).
L(I,
On montrera plus loin que l’inclusion est stricte. Bien entendu, par définition, l’intégrabilité et la L-intégrabilité coı̈ncident pour des fonctions positives
¯
sur I.
Une conséquence simple mais importante de la proposition que nous
venons de démontrer est le test de comparaison de L-intégrabilité suivant.
Corollaire. Soit I un semi-pavé de Rn et g une fonction positive intégrable
¯ Alors, toute fonction f de Rn dans Rp intégrable sur I¯ et telle que,
sur I.
¯ on ait
pour i = 1, 2 ou ∞ et chaque x ∈ I,
|f (x)|i ≤ g(x),
¯ et l’on a
est L-intégrable sur I,
J
I¯
|f |i ≤
J
I¯
g.
Démonstration. Par hypothèse et par la propriété de restriction, f et g
sont intégrables sur K̄ pour tout semi-pavé K ⊂ I, on a,
#J
#
#
#
K̄
#
#
f ## ≤
i
J
K̄
g.
386
CHAPITRE 10. FONCTIONS INTÉGRABLES
Dès lors, si {K 1 , . . . , K q } ∈ P(I), on aura, en utilisant l’additivité de l’intégrale,
q #J
$
#
#
#
l=1
H
K̄ l
#
#
f ## ≤
i
q J
$
l
l=1 K̄
g=
J
I¯
g.
Donc I¯ g majore l’ensemble Si et la proposition ci-dessus entraı̂ne l’intégrabilité de |f |i sur I¯ et l’inégalité
J
I¯
|f |i ≤
J
I¯
g.
Ce test de comparaison a plusieurs conséquences intéressantes. La premi¯ entre l’intégrabilité et
ère est l’équivalence, pour les fonctions bornées sur I,
la L-intégrabilité.
Corollaire. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Alors f est L-intégrable sur I¯ si et seulement si f
définie et bornée sur I.
¯
est intégrable sur I.
Démonstration. La condition nécessaire est évidente. Pour la condition
suffisante, il existe par hypothèse une constante M ≥ 0 telle que
|f (x)|2 ≤ M
¯ Comme la fonction constante M est intégrable sur I,
¯ la
pour tout x ∈ I.
thèse résulte du test de comparaison.
¯ on déduit de
Comme toute fonction R-intégrable sur I¯ est bornée sur I,
¯ En
ce corollaire la L-intégrabilité sur I¯ de toute fonction R-intégrable sur I.
d’autres termes, on a l’inclusion
¯ Rp) ⊂ L(I,
¯ Rp),
R(I,
et l’inclusion est stricte puisque la fonction de Dirichlet, positive et intégrable sur [0, 1], y est évidemment L-intégrable. Le corollaire montre aussi que
c’est parmi les fonctions non bornées sur I¯ qu’il faudra chercher les éléments
¯ Rp) \ L(I,
¯ Rp).
de P (I,
Une autre conséquence du test de comparaison est le caractère d’espace
¯ Rp).
vectoriel de L(I,
10.9. L-INTÉGRABILITÉ SUR UN PAVÉ
387
Corollaire. Si I est un semi-pavé de Rn , si f et g sont des fonctions de Rn
dans Rp L-intégrables sur I¯ et si c ∈ R, alors f + g et cf sont L-intégrables
¯
sur I.
¯ et
Démonstration. Par hypothèse, f , g, |f |2 et |g|2 sont intégrables sur I,
¯ Rp )
il en est dès lors de même de f + g, |f |2 + |g|2 , cf et |c||f |2, puisque P (I,
¯ on a
est un espace vectoriel. D’ailleurs, pour chaque x ∈ I,
|(f + g)(x)|2 ≤ |f (x)|2 + |g(x)|2 = |f |2 (x) + |g|2(x),
|cf (x)|2 ≤ |c||f (x)|2 = |c||f |2(x).
La thèse résulte alors du test de comparaison.
Le test de comparaison montre aussi que les composantes d’une fonction
L-intégrable sur I¯ y sont L-intégrables.
Corollaire. Si I est un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Alors f est L-intégrable si et seulement si chaque composante
définie sur I.
fk de f est L-intégrable sur I¯ (1 ≤ k ≤ p).
Démonstration. Condition nécessaire. Par hypothèse et par les pro¯
priétés de l’intégrale, f , fk , (1 ≤ k ≤ p) et |f |2 sont intégrables sur I.
Comme on a
|fk (x)| ≤ |f (x)|2 ,
¯ la thèse résulte du
pour chaque entier k compris entre 1 et p et tout x ∈ I,
test de comparaison.
Condition suffisante. Par hypothèse, chaque fk et chaque |fk | est inté¯ (1 ≤ k ≤ p), et dès lors, par les propriétés de l’intégrabilité, il
grable sur I,
%
en est de même de f et de |f |1 = pk=1 |fk |, et donc de f et de |f |2 .
On peut donc ramener l’étude de la L-intégrabilité sur I¯ des fonctions
de Rn dans Rp à celle de fonctions réelles. Pour celles-ci, on possède une
version raffinée du test de comparaison.
Proposition. Soit f une fonction réelle intégrable sur l’adhérence I¯ d’un
semi-pavé I de Rn . Alors f est L-intégrable sur I¯ si et seulement s’il existe une fonction réelle g L-intégrable sur I¯ et telle que l’une des conditions
suivantes
f (x) ≤ g(x) ou f (x) ≥ g(x)
¯
soit satisfaite pour tout x ∈ I.
Démonstration. Condition nécessaire. Il suffit évidemment de prendre
g = f.
388
CHAPITRE 10. FONCTIONS INTÉGRABLES
Condition suffisante. Le deuxième cas se ramène au premier en considérant −f au lieu de f . On a f = g − (g − f ) avec g L-intégrable sur I¯ et
¯ donc L-intégrable sur I.
¯ Comme L(I,
¯ R)
g − f positive et intégrable sur I,
est un espace vectoriel, le résultat est démontré.
Enfin, une application directe de la définition et de la propriété d’additivité des fonctions intégrables fournit la propriété d’additivité pour les
fonctions L-intégrables.
Proposition. Soit I un semi-pavé de Rn et f une fonction de Rn dans Rp
¯ Etant donné {K 1 , . . ., K q } ∈ P(I), f est L-intégrable sur I¯ si
définie sur I.
et seulement si f est L-intégrable sur chaque K̄ l (1 ≤ l ≤ q).
10.10
Exercices
1. Montrer que si f est une fonction de R dans Rp R-intégrable sur [a, b], on
a
4
5
J b
m
b−a $
(j − 1)(b − a)
f = lim
f a+
.
m→∞ m
m
a
j=1
2. Si f et g sont deux fonctions de R dans R telles que f soit continue sur
[a, b], g intégrable et positive sur [a, b] et f g intégrable sur [a, b], montrer
qu’il existe c ∈ [a, b] tel que
J
b
a
f g = f (c)
J
a
b
g.
(Premier théorème de la moyenne du calcul intégral). Suggestion : par le
théorème de Weierstrass, il existera y et z dans [a, b] tels que
f (y)
J
b
a
g≤
J
b
a
f g ≤ f (z)
J
b
g,
a
et la thèse résulte
du théorème des valeurs intermédiaires appliqué à la foncH
tion continue ( ab g)f. Le cas particulier où g = 1 est intéressant.
3. Montrer que si f est uneH fonction réelle définie et croissante sur [a, b],
alors son intégrale indéfinie a· f est convexe sur [a, b].
4. Soit I un semi-pavé de Rn et ϕ une application positive définie sur
l’ensemble des semi-pavés contenus dans I et étendue à toute union finie
389
10.10. EXERCICES
I 1 ∪ . . . ∪ I r de semi-pavés contenus dans I et mutuellement disjoints par la
relation


ϕ
r
>
j=1
I j =
r
$
ϕ(I j ).
j=1
Montrer que la mesure µ d’un semi-pavé de Rn vérifie cette condition. Si
f est une fonction de Rn dans Rp définie sur I, on dit que f est intégrable
sur I au sens de Perron-Stieltjes par rapport à ϕ s’il existe J ∈ Rp tel que,
pour chaque ! >A0, on puisse
trouver une jauge δ sur I tel que, pour toute
B
P-partition Π = (xj , I j ) 1≤j≤m δ-fine de I, on ait
#
#
#m
#
#$
#
j
j
#
# ≤ !.
ϕ(I
)f
(x
)
−
J
#
#
#j=1
#
2
%m
L’expression S(I, ϕ, f, Π) = j=1 ϕ(I j )f (xj ) s’appelle la somme de Riemann-Stieltjes relative à I, ϕ, f et Π. Montrer qu’il existe au plus un J
vérifiant la définition ci-dessus. On l’appelle l’intégrale de Perron-Stieltjes
de f sur I par rapport à ϕ, et on le note
J
I¯
f dϕ ou
J
I¯
f (x) dϕ(x) ou
J
I¯
f (x)ϕ(dx).
Si l’on peut prendre la jauge δ constante dans la définition précédente, on
parle d’intégrale de Riemann-Stieltjes. Etudier les propriétés de l’intégrale
qui restent valables dans ce cadre plus général. Un cas particulier important
est celui où n = 1 et où, si I j = ]aj , bj ], on prend
ϕ(I j ) = g(bj ) − g(aj ),
où g est une fonction réelle définieH et croissante sur [a, b]. L’intégrale correspondante est alors souvent notée ab f dg.
5. Si f est une fonction de Rn dans Rp continue sur l’adhérence I¯ du semipavé I de Rn , et si
J
I¯
|f |2 = 0,
¯ On procédera par l’absurde en notant que l’existenmontrer que f = 0 sur I.
¯
ce d’un y ∈ I tel que |f (y)|2 > 0 et la continuité de f entraı̂nent l’existence
¯ On a donc,
d’un semi-pavé J ⊂ I tel que |f (x)|2 ≥ 12 |f (y)|2 pour tout x ∈ J.
si I = J ∪ I 1 ∪ I 2 ∪ . . . ∪ I r , où les I j sont des semi-pavés mutuellement
390
CHAPITRE 10. FONCTIONS INTÉGRABLES
¯
disjoints de I \ J,
0=
J
I¯
J
|f |2 =
r J
$
¯j
j=1 I
|f |2 +
J
J¯
|f |2
J
1
µ(J)
≥ |f |2 ≥
|f (y)|2 =
|f (y)|2 > 0,
¯
¯
2
2
J
J
ce qui est contradictoire.
6. Soient a > 0 et b > 0 des nombres réels. Démontrer la formule de Gauss
∞
$
(−1)k
k=0
a + bk
=
J
1
0
xa−1
dx.
1 + xb
Suggestion : on part de l’identité, valable pour tout x ≥ 0 et tout entier
n ≥ 1,
n−1
$
xa−1
(−1)n xa−1+bn
a−1
=
x
(−xb )k +
,
b
1+x
1 + xb
k=0
et l’on intègre les deux membres sur [0, 1], ce qui donne
J
1
0
où
n−1
$ (−1)k
xa−1
dx
=
+ Rn ,
1 + xb
a + bk
k=0
#
#
J 1 nb+a−1
#
#
x
#
#
n
|Rn | = #(−1)
dx
#≤
b
#
#
1+x
0
#J
#
#
#
1
x
nb+a−1
0
#
#
1
dx## =
.
a + bn
Donc Rn → 0 lorsque n → ∞. On en déduit en particulier la formule de
Mercator
1 1
(−1)k
log 2 = 1 − + − . . . +
+ . . ..
2 3
k+1
7. Si c /= 1 est un réel et si a et b sont deux applications de l’intervalle I ⊂ R
dans R, montrer que l’application y : I → R∗+ est solution de l’équation
différentielle de Bernoulli
y $ (x) = a(x)y(x) + b(x)y(x)c,
si et seulement si l’application z = y 1−c est solution sur I de l’équation
différentielle linéaire
z $ (x) = (1 − c)a(x)z(x) + (1 − c)b(x).
391
10.11. PETITE ANTHOLOGIE
8. Soit I ⊂ R un intervalle et g une application continue de I dans R.
Montrer que toute solution y sur I de l’équation différentielle
y $$ (x) = g[y(x)],
(c’est-à-dire toute application y de I dans R deux fois dérivable sur I vérifiant
cette relation sur I) vérifie l’équation différentielle du premier ordre
[y $ (x)]2 = 2[G(y(x)) + C],
où G est une primitive de g sur I et C une constante réelle arbitraire.
9. Montrer que l’équation fonctionnelle de Cauchy
f (x + y) = f (x) + f (y),
(x ∈ R, y ∈ R),
où l’inconnue f est une fonction continue, a pour solutions les fonctions
f (x) = cx, (c ∈ R). Suggestion. En prenant x = y = 0, on voit que
f (0) = 0. En intégrant les deux membres de l’égalité par rapport à y, x
étant fixé, on trouve
J
1
f (x + y) dy = f (x) +
0
J
1
f (y) dy,
0
et donc, par l’invariance de l’intégrale pour une translation,
f (x) =
J
x+1
x
f (u) du−
J
1
f (y) dy =
0
J
x+1
0
Donc f est dérivable et, pour tout x ∈ R,
f (u) du−
J
x
0
f (u) du−
J
1
f (y) dy.
0
f $ (x) = f (x + 1) − f (x) = f (1),
ce qui entraı̂ne f (x) = f (1)x.
10.11
Petite anthologie
Je ne ferai d’aucune difficulté d’user de cette expression la somme des ordonnées qui semble ne pas être géométrique à ceux qui n’entendent pas la doctrine des indivisibles, et qui s’imaginent que c’est pécher contre la géométrie
que d’exprimer un plan par un nombre infini de lignes; ce qui ne vient que
de leur manque d’intelligence puisqu’on n’entend autre chose par là sinon
la somme d’un nombre indéfini de rectangles faits de chaque ordonnée avec
de petites portions égales du diamètre, dont la somme est certainement un
plan, qui ne diffère de l’espace du demi-cercle que d’une quantité moindre
qu’aucune donnée.
392
CHAPITRE 10. FONCTIONS INTÉGRABLES
Blaise Pascal, 1660
Nous avons déjà noté que les distances aj − aj−1 , par lesquelles x est
supposé croı̂tre successivement, doivent être prises très petites pour que les
valeurs correspondantes f (aj−1 ), f (aj ) ne diffèrent à leur tour guère l’une
de l’autre; à partir de cela, il faut juger si les intervalles a1 − a, a2 − a1 , . . .
doivent être pris égaux ou inégaux. En fait, là où la valeur de f (x) ne change
guère lorsque x varie, l’intervalle par lequel x croı̂t peut être pris grand sans
danger. D’autre part, là où des changements peu importants de x conduisent
à des variations violentes de f (x), on devra prendre l’intervalle très petit.
Leonhard Euler, 1768
Je considère chaque intégrale comme étant juste la somme des valeurs
infiniment petites de l’expression différentielle placée sous le signe intégrale,
qui correspond aux différentes valeurs de la variable incluses entre les limites
en question. Quand on adopte cette manière de regarder l’intégrale définie,
on prouve aisément qu’une telle intégrale a une valeur unique et finie lorsque,
les deux limites de la variable étant finie, les intégrands restent finis et continus entre ces limites. Il me semble que cette manière de regarder une
intégrale définie devrait être adoptée de préférence, comme je l’ai fait, parce
qu’elle vaut également pour tous les cas, même ceux dans lesquels nous ne
pouvons pas passer généralement de la fonction sous le signe intégral à la
fonction primitive.
Augustin Cauchy, 1823
L’incertitude qui règne encore sur quelques points fondamentaux de la
théorie des intégrales définies nous oblige à placer ici quelques remarques
sur la notion de l’intégrale définie, et sur Hla généralité dont elle est susceptible. Et d’abord que doit-on entendre par ab f (x) dx? Pour répondre à cette
question, prenons entre a et b une série de valeurs x1 , x2 , . . . , xn−1 rangées
par ordre de grandeur, depuis a jusqu’à b, et désignons pour abréger x1 − a
par δ1 , x2 − x1 par δ2 , . . ., b − xn−1 par δn ; soient en outre !i des nombres
positifs plus petits que l’unité. Il est clair que la valeur de la somme
S = δ1 f (a + !1 δ1 ) + δ2 f (x1 + !2 δ2 ) + . . . + δn f (xn−1 + !n δn )
dépendra du choix des intervalles δ et des fractions !. Si elle a la propriété,
de quelque manière que les δ et les ! puissent être choisis, de s’approcher
indéfiniment d’une limite fixe A, quand les δ Htendent tous vers zéro, cette
limite s’appelle la valeur de l’intégrale définie ab f (x) dx.
10.11. PETITE ANTHOLOGIE
393
Bernard Riemann, 1854
Dans le cas des fonctions continues, il y a identité entre les notions
d’intégrale et de fonction primitive. Riemann a défini l’intégrale de certaines fonctions discontinues, mais toutes les fonctions dérivées ne sont
pas intégrables au sens de Riemann. Le problème des fonctions primitives
n’est donc pas résolu par l’intégration, et l’on peut désirer une définition de
l’intégrale comprenant comme cas particulier celle de Riemann et permettant
de résoudre le problème des fonctions primitives.
Henri Lebesgue, 1901
Un caractère important de la définition de Riemann est le suivant: la division en intervalles est entièrement indépendante des propriétés de la fonction; si l’on considère deux fonctions différentes, on prendra pour ces fonctions les mêmes intervalles, c’est-à-dire qu’on leur appliquera un procédé
de calcul uniforme. C’est évidemment là un grand avantage pour le calcul;
mais c’est en même temps un inconvénient : un tel procédé qui ne tient pas
compte des propriétés particulières de la fonction à laquelle il s’applique peut
être comparé à ces vêtements confectionnés, qui ne sauraient être exactement
ajustés, surtout s’il s’agit d’habiller un individu difforme : certaines fonctions singulières ont pu être justement comparées aux types monstrueux de
la biologie.
Emile Borel, 1909
Intégrer, c’est pousser à l’infini les deux règles conjointes de Descartes :
d’abord diviser la difficulté pour la mieux résoudre, ensuite recomposer cette
désagrégation préliminaire. Dans une masse étendue, une cause s’exerce, un
effet s’accomplit. Si l’intensité des phénomènes était constante aux divers
points, les résultats se manifesteraient proportionnels à cette intensité et à
cette masse à la fois. Un simple produit des facteurs les livrerait. Mais si
ces intensités sont fluctuantes, comment évaluer leur concours total ? Par la
pensée, on partage le corps en éléments tellement réduits et ainsi disposés que
sur chacun d’entre eux l’action et sa conséquence, rapportées l’une et l’autre
à la mesure de la parcelle, ne présentent plus de variation appréciable. Les
évaluer est donc immédiat. Additionner ensemble des infiniment petits, pour
calculer le phénomène total, c’est procéder à une intégration. Le tout est de
prendre la partition préalable par le bon biais.
Arnaud Denjoy, 1920
394
CHAPITRE 10. FONCTIONS INTÉGRABLES
Presque tout étudiant de premier cycle en mathématique, physique ou sciences de l’ingénieur étudie assez d’analyse pour rencontrer les intégrales de
Riemann, les intégrales “impropres”, les intégrales de lignes et de surfaces,
bref, tous les types d’intégration du dix-neuvième siècle. Mais le vingtième
siècle a produit des progrès en théorie de l’intégration qui furent indispensables pour l’analyse et se révélèrent plus tard magnifiquement adaptés à la
théorie des probabilités et à des applications comme la théorie quantique, la
théorie de la communication et le contrôle optimal de systèmes perturbés de
manière aléatoire. Pour toutes ces applications et pour beaucoup d’autres,
il convient de connaı̂tre les idées associées à la théorie de l’intégrale de
Lebesgue. Une solution logiquement fondée mais pédagogiquement inacceptable consiste à écarter l’intégrale de Riemann et enseigner l’intégrale de
Lebesgue dès le début du cours d’analyse. Mais ce choix ignore l’évidence
expérimentale que les différentes manières usuelles d’introduire l’intégrale
de Riemann sont toutes considérées par les étudiants comme plus naturelles
et plus facilement comprises que n’importe laquelle des manières usuelles
d’introduire l’intégrale de Lebesgue. Une voie pour sortir de cette impasse
apparente fut ouverte en 1957, lorsque J. Kurzweil publia pour l’intégrale
d’une fonction d’une variable une définition qui ressemblait fortement à celle
de Riemann, et était pourtant plus générale; en fait, l’intégrale de Kurzweil
est plus générale que celle de Lebesgue.
Edward J. McShane, 1983
Chapitre 11
Intégrale sur un intervalle et
séries
11.1
Théorème de Hake
Soit I = ]a, b] un semi-intervalle de R et f une fonction de R dans Rp
¯ Montrons d’abord que son intégrale indéfinie est continue
intégrable sur I.
¯
sur I.
Proposition. Si f est intégrable sur [a, b], alors
H·
af
est continue sur [a, b].
Démonstration. Soit c ∈ [a, b] et ! > 0; il faut montrer l’existence d’un
η > 0 tel que
#J x
J c #
#
#
#
f−
f ## ≤ !
#
a
a
2
lorsque x ∈ [a, b] et |x−c| ≤ η, c’est-à-dire, en vertu des propriétés d’additivité de l’intégrale, tel que
#J
#
#
#
#
x
c
#
f ## ≤ !,
2
pour ces mêmes x. Pour cet ! > 0, il existe une jauge δ sur [a, b] telle que
#
J b ##
#
#
#
f # ≤ !/2
#S(I, f, Π) −
#
#
a
2
pour toute P-partition δ-fine Π de I. Prenons
U
η = min δ(c),
V
!
,
2[1 + |f (c)|2 ]
395
396 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
et soit x ∈ [a, b] tel que |x − c| ≤ η. Alors, si x < c, on a
[x, c] ⊂ [c − η, c] ⊂ [c − δ(c), c + δ(c)],
et, pour x > c, on a de même
[c, x] ⊂ [c, c + η] ⊂ [c − δ(c), c + δ(c)].
Le lemme de Saks-Henstock appliqué, selon le cas, à {(c, ]x, c])} ou à
{(c, ]c, x])} entraı̂ne que
#J
#
#
#
c
x
ou
#J
#
#
#
c
d’où l’on déduit aussitôt
#J
#
#
#
c
x
x
#
#
f − f (c)(c − x)## ≤ !/2,
2
#
#
f − f (c)(x − c)## ≤ !/2,
2
#
#
!|f (c)|2
f ## ≤ !/2 + |f (c)|2 |x − c| ≤ !/2 +
< !,
2[1
+ |f (c)|2]
2
et la démonstration est complète.
Cette proposition et la propriété de restriction de l’intégrale impliquent
aussitôt que si f est intégrable sur [a, b], alors f est intégrable sur [a, c] pour
chaque c ∈ ]a, b[ et l’on a
lim
J
c
c→b− a
f=
J
b
f.
a
Nous allons montrer que cette condition nécessaire d’intégrabilité sur [a, b]
est également suffisante. Ce résultat, qui est très utile pour l’obtention de
tests pratiques d’intégrabilité sur un intervalle, porte le nom de théorème
de Hake. Il n’est pas valable pour la R-intégrabilité ou la L-intégrabilité
car l’existence de la limite du membre de gauche dans l’égalité ci-dessus
n’entraı̂ne pas nécessairement la R- ou la L-intégrabilité sur [a, b] de f ,
c’est-à-dire l’existence du membre de droite. Dans le cadre de ces types
d’intégration, cette limite doit être et est appelée intégrale impropre ou
intégrale généralisée.
397
11.1. THÉORÈME DE HAKE
Théorème. Soit f une fonction de R dans Rp définie sur [a, b]. Si f est
intégrable sur [a, c] pour chaque c ∈ ]a, b[ et si
lim
J
c
c→b− a
f = J,
alors f est intégrable sur [a, b] et
J
b
f = J.
a
Démonstration. Soit ! > 0; nous allons construire une jauge δ sur [a, b]
telle que
|S(]a, b], f, Π) − J|2 ≤ !
dès que Π est une P-partition δ-fine de ]a, b]. Si nous posons aj = b − 2−j (b −
a), (j ∈ N), alors a0 = a, a < aj < aj+1 < b pour chaque j ∈ N∗ et
[a, b[ =
>
[aj , aj+1 [.
j∈N
Dès lors, la fonction f est intégrable sur [aj , aj+1 ] pour chaque j ∈ N et il
existe donc une jauge δj sur [aj , aj+1 ] telle que
#
J aj+1 ##
#
!
#
#
f # ≤ j+2 ,
#S(]aj , aj+1 ], f, Πj ) −
#
#
2
aj
2
pour toute P-partition δj -fine Πj de ]aj , aj+1 ], (j ∈ N). D’ailleurs, puisque
f (b)(b − c) → 0 si c → b, c < b,
il existe, par hypothèse, un η > 0 tel que
#J
#
#
#
a
c
#
#
f − J + f (b)(b − c)## ≤ !/2,
2
pour tout c ∈ [b − η, b[. Définissons comme suit la jauge δ sur [a, b] :
δ(a) = min[δ0 (a), a1 − a],
δ(x) = min[δj (x), x − aj , aj+1 − x] si x ∈ ]aj , aj+1 [, (j ∈ N),
δ(aj ) = min[δj−1 (aj ), δj (aj ), aj − aj−1 ], (j ∈ N∗ ),
δ(b) = η.
398 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
Par un raisonnement strictement analogue à celuiA utilisé Bdans le lemme des
P-partitions subordonnées, on voit que si Π = (xj , I j ) 1≤j≤m est une Ppartition δ-fine de ]a, b] telle que xj ≤ xj+1 , (1 ≤ j ≤ m − 1), alors, pour
chaque k ∈ N,
Πk = {(xj , I j ∩ ]ak , ak+1 ]) : I j ∩ ]ak , ak+1 ] /= ∅, 1 ≤ j ≤ m}
est une P-partition δk -fine de ]ak , ak+1 ] et
$
S(]ak , ak+1 ], f, Πk ) =
{1≤j≤m:I j ∩ ]ak ,ak+1 ](=∅}
µ(I j ∩ ]ak , ak+1 ])f (xj ).
D’autre part, pour toute P-partition δ-fine Π de ]a, b] comme ci-dessus, on
a nécessairement xm = b puisque, si xm < b il existera r ∈ N tel que
xm ∈ [ar , ar+1 [, et donc, par construction de la jauge δ, tel que I m = ]d, b] ⊂
[ar−1 , ar+1 ] ⊂ [ar−1 , b[, ce qui est contradictoire. Désignons par q le plus
petit entier naturel tel que
m−1
>
j=1
On a donc
I j ⊂ ]a, aq+1 ].
#
#
#m
#
#$
#
|S(I, f, Π) − J|2 = ##
µ(I j )f (xj ) − J ##
#j=1
#
#
#q−1
$
#$
= ##
#k=0 {1≤j≤m:I j ∩ ]a
+
$
{1≤j≤m:I j ∩
−
k ,ak+1 ](=∅}
]aq ,d](=∅}
µ(I j ∩ ]ak , ak+1 ])f (xj )
µ(I j ∩ ]aq , d])f (xj ) + (b − d)f (b)
q−1
$ J ak+1
k=0 ak
2
f−
J
d
aq
f+
J
a
d
#
#
#
f − J ##
#
2
#
#
#q−1 2
J ak+1 3#
#$
#
≤ ##
S(]ak , ak+1 ], f, Πk ) −
f ##
ak
#k=0
#
2
#
#
#
J d #
$
#
#
j
j
+ ##
µ(I ∩ ]aq , d])f (x ) −
f ##
aq #
#{1≤j≤m:I j ∩ ]aq ,d](=∅}
2
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ
399
#J
#
# d
#
#
#
+#
f − J + (b − d)f (b)# .
# a
#
2
Le premier et le dernier terme de cette expression ont déjà été estimés. Pour
celui du milieu, il suffit de remarquer que la famille
{(xj , I j ∩ ]aq , d]) : I j ∩ ]aq , d] /= ∅, 1 ≤ j ≤ m}
vérifie les conditions du lemme de Saks-Henstock pour f et δq sur ]aq , aq+1 ].
En conséquence, on aura
q−1
$
|S(I, f, Π) − J|2 ≤
k=0
!
2k+2
+
!
2q+2
+
!
< !,
2
et la démonstration est complète.
On démontre d’une manière strictement analogue le théorème de Hake
correspondant à l’autre extrémité de l’intervalle.
Théorème. Soit f une fonction de R dans Rp définie sur [a, b]. Si f est
intégrable sur [c, b] pour chaque c ∈ ]a, b[ et si
lim
J
c→a+ c
b
f = J,
alors f est intégrable sur [a, b] et
J
b
f = J.
a
11.2
Intégrale sur un intervalle borné
Il est important de noter que les hypothèses du théorème de Hake ne font
pas intervenir, dans le premier cas, la valeur de la fonction f en b et, dans
le second cas, la valeur de f en a. Par conséquent, si f est une fonction de
R dans Rp définie sur I = [a, b[ ou sur I = ]a, b], chaque prolongement de f
à [a, b] sera intégrable sur [a, b] si un seul d’entre eux l’est, et tous auront la
même intégrale. Cette remarque justifie la définition suivante d’intégrabilité
sur un semi-intervalle borné [a, b[ ou ]a, b].
Définition. Soit f une fonction de R dans Rp définie sur [a, b[ (resp. ]a, b]).
On dira que f est intégrable sur [a, b[ (resp. ]a, b]) s’il existe un prolongement
400 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
f˜ de f à [a, b] qui est intégrable
sur [a, b], auquel
cas l’intégrale
de f sur
[a, b[
H
H
H
Hb
˜
(resp. ]a, b]) sera définie par [a,b] f et notée [a,b[ f (resp. ]a,b] f ) ou a f .
H
Il n’y a pas d’ambiguité dans la notation ab f puisque, lorsque f est
définie et intégrable sur [a, b], les trois notions coı̈ncident.
Exemples. 1. Soit b ∈ R et f la fonction définie par
f (x) = (b − x)−p ,
où p > 0. La fonction f est primitivable sur ]−∞, b[ et l’une de ses primitives
est donnée par la fonction F définie par F (x) = (p − 1)−1 (b − x)1−p si p /= 1
et F (x) = − ln(b − x) si p = 1. En conséquence, si a < b est donné, f est
intégrable sur [a, c] quel que soit c ∈ ]a, b[ et
J
c
a
f = (p − 1)−1 [(b − c)1−p − (b − a)1−p ]
si p /= 1 et
J
c
a
f = ln(b − a) − ln(b − c)
si p = 1. Le théorème de Hake montre alors que f est intégrable sur [a, b[ si
et seulement si p < 1, auquel cas
J
b
a
(b − x)−p dx = (1 − p)−1 (b − a)1−p.
2. Soit a ∈ R et f la fonction définie par
f (x) = (x − a)−p ,
où p > 0. La fonction f est primitivable sur ]a, +∞[ et l’une de ses primitives
est donnée par la fonction F définie par F (x) = (1 − p)−1 (x − a)1−p si p /= 1
et F (x) = ln(x − a) si p = 1. En conséquence, si b > a est donné, f est
intégrable sur [c, b] quel que soit c ∈ ]a, b[ et
J
c
si p /= 1 et
b
f = (1 − p)−1 [(b − a)1−p − (c − a)1−p ]
J
c
b
f = ln(b − a) − ln(c − a)
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ
401
si p = 1. Le théorème de Hake montre alors que f est intégrable sur ]a, b] si
et seulement si p < 1, auquel cas
J
b
a
(x − a)−p dx = (1 − p)−1 (b − a)1−p .
On peut également définir l’intégrabilité d’une fonction définie sur un
intervalle ouvert borné ]a, b[.
Définition. Soit f une fonction de R dans Rp définie sur un intervalle ouvert
borné ]a, b[. On dit que f est intégrable sur ]a, b[ s’il existe un c ∈]a, b[ tel que
f soit intégrable sur ]a, c]
et intégrable
sur [c, b[. S’il en est ainsi, l’intégrale
H
H
de f sur ]a, b[ est notée ]a,b[ f ou ab f et définie par
J
b
a
f=
J
c
a
f+
J
b
c
f.
L’additivité de l’intégrale usuelle entraı̂ne aisément que si un c ∈ ]a, b[
existe pour lequel la condition de la définition est vérifiée, alors elle le sera
pour tout autre c$ ∈ ]a, b[, avec la même valeur de l’intégrale. On peut
aussi vérifier aisément que f est intégrable sur ]a, b[ si et seulement si f est
intégrable sur [c, d] quels que soient c < d contenus dans ]a, b[ et
J
lim
(c,d)→(a,b),c>a,d<b c
d
f
existe.
Les propriétés élémentaires de l’intégrale (linéarité, propriétés d’ordre, passage aux composantes, comportement par rapport à une translation
ou une homothétie) et les propriétés d’additivité et de restriction s’étendent immédiatement, à partir des définitions et des propriétés correspondantes de l’intégrale ordinaire, aux intégrales sur un semi-intervalle ou sur
un intervalle ouvert bornés.
Le théorème fondamental du calcul différentiel et intégral peut
être étendu à l’intégration sur un intervalle borné quelconque.
Proposition. Soit f une fonction de R dans Rp primitivable sur ]a, b[ et F
une primitive de f sur ]a, b[. Si
lim F (c) et lim F (c)
c→a+
c→b−
existent, alors f est intégrable sur ]a, b[ et
J
b
a
f = lim F (c) − lim F (c).
c→b−
c→a+
402 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
Démonstration. La fonction f , primitivable sur ]a, b[, l’est sur [c, c$] quels
que soient c < c$ dans ]a, b[ et dès lors, par le théorème fondamental du calcul
différentiel et intégral et l’additivité de l’intégrale, si d ∈ ]a, b[ est fixé et si
c < d < c$ , f est intégrable sur [c, d] et sur [d, c$] et l’on a
J
d
c
f = F (d) − F (c),
J
c"
d
f = F (c$ ) − F (d).
Comme, par hypothèse,
lim
J
d
c→a+ c
et
lim
"
J
c"
c →b− d
f = lim [F (d) − F (c)] = F (d) − lim F (c),
c→a+
c→a+
f = "lim [F (c$ ) − F (d)] = "lim F (c$ ) − F (d),
c →b−
c →b−
le théorème de Hake entraı̂ne l’intégrabilité de f sur ]a, d] et sur [d, b[, avec
J
a
d
f = F (d) − lim F (c),
c→a+
J
d
b
f = "lim F (c$ ) − F (d),
c →b−
et la thèse résulte de la définition de l’intégrabilité de f sur ]a, b[ et de celle
de son intégrale sur cette intervalle.
Exemple. Les considérations que nous venons de développer permettent
de donner un exemple de fonction intégrable sur un intervalle sans y être
L-intégrable. Soit f la fonction de R dans R définie par
f (x) = 2x sin
1
2
1
− cos 2 si x /= 0, f (0) = 0.
x2 x
x
On a vu précédemment que f était la dérivée de la fonction F définie par
F (x) = x2 sin
1
si x /= 0, F (0) = 0.
x2
En particulier, f est intégrable sur [0, b] quel que soit b > 0 et
J
0
b
f = b2 sin
1
.
b2
Si nous définissons les fonctions g et h sur R par
g(x) =
2
1
cos 2 si x /= 0, g(0) = 0,
x
x
403
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ
h(x) = 2x sin
1
si x /= 0, h(0) = 0,
x2
nous constatons immédiatement que h, continue sur R, sera intégrable sur
[0, b] quel que soit b > 0, et il en sera dès lors de même de g = h − f.
En particulier, g est intégrable sur [0, 1]. Nous allons montrer que |g| n’est
pas intégrable sur [0, 1], ce qui entraı̂nera que g ∈ P ([0, 1], R) \ L([0, 1], R).
Notons tout d’abord que |g|, continue sur [c, 1] quel que soit c ∈ ]0, 1[, est
primitivable sur [c, 1]. Le théorème d’intégration par substitution s’applique
donc à |g| sur chaque intervalle [((k + 1)π)−1/2, (kπ)−1/2], (k ∈ N∗ ), et
fournit, en effectuant la substitution x2 2→ y1 ,
J
#
(kπ)−1/2
((k+1)π)−1/2
D’autre part,
J
#
2 ##
1#
cos 2 ## dx =
x#
x
| cos y|
1
dy ≥
y
(k + 1)π
(k+1)π
kπ
=
2
π
J
J
J
kπ
(k+1)π
kπ
J
dy
2
≥
k+1
π
k+2
k+1
(k+1)π
| cos y|
dy.
y
| cos y| dy =
k+2
k+1
2
(k + 1)π
dy
.
y
Dès lors, pour tout entier n ≥ 0, on a
J
1
((n+1)π)−1/2
≥
J
1
π−1/2
|g| +
|g| =
J
1
π−1/2
|g| +
n J
$
(kπ)−1/2
−1/2
k=1 ((k+1)π)
|g|
J 1
J
n J k+2
dy
2$
2 n+2 dy
|g| +
=
π k=1 k+1 y
π 2
y
π−1/2
=
J
1
π−1/2
|g| +
H
4
5
n+2
2
.
ln
π
2
Il en résulte aussitôt que limc→0+ c1 |g| n’existe pas et |g| n’est pas intégrable
sur [0, 1].
On peut aussi étendre à l’intégrabilité sur un intervalle borné quelconque la formule d’intégration par parties. Nous traiterons le cas
de l’intégration sur ]a, b[, l’adaptation à ]a, b] ou à [a, b[ étant aisée.
404 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
Proposition. Soient f et g deux fonctions de R dans K dérivables sur ]a, b[.
Si f $ g est intégrable sur ]a, b[ et si limx→a+ f (x)g(x) et limx→b− f (x)g(x)
existent, alors f g $ est intégrable sur ]a, b[ et l’on a
J
b
a
J
f g $ = lim f (c)g(c) − lim f (c)g(c) −
c→a+
c→b−
b
a
f $ g.
Démonstration. Soit d ∈ ]a, b[ fixé et soient c et c$ tels que a < c < d <
c < b. Par hypothèse, f $ g est intégrable sur [c, d] et sur [d, c$] et la formule
d’intégration par parties entraı̂ne l’intégrabilité de f g $ sur ces intervalles et
les formules
J
J
$
d
c
J
c"
d
f g $ = f (d)g(d) − f (c)g(c) −
f g $ = f (c$ )g(c$) − f (d)g(d) −
Par hypothèse, on a alors
lim
J
d
c→a+ c
lim
"
J
c"
c →b− d
d
c
J
f $ g,
c"
d
f $ g.
f g $ = f (d)g(d) − lim f (c)g(c) −
c→a+
J
f g $ = "lim f (c$ )g(c$) − f (d)g(d) −
c →b−
d
a
J
d
f $ g,
b
f $ g.
L’intégrabilité de f g $ sur ]a, b[ et la formule correspondante d’intégration par
parties résulte alors d’une double application du théorème de Hake et de la
définition d’intégrabilité sur ]a, b[.
Exemple. La fonction h définie sur R∗+ par h(x) = ln x est intégrable sur
]0, b] quel que soit b > 0. En effet, ln x = (x)$ ln x et dès lors si l’on pose
f (x) = ln x et g(x) = x, on a h = f g $ et (f $ g)(x) = 1, (f g)(x) = x ln x pour
tout x. Donc f $ g est intégrable sur [0, b] et, par le théorème de l’Hospital,
lim (f g)(x) = 0,
x→0+
tandis que f g est continue en b. Par conséquent, ln est intégrable sur [0, b]
et
J b
ln x dx = b ln b − b.
0
On peut évidemment définir une notion de L-intégrabilité sur des intervalles bornés quelconques.
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ
405
Définition. Soit I = [a, b[, ]a, b], ou ]a, b[ et f une fonction de R dans
Rp définie sur I. On dira que f est intégrable au sens de Lebesgue ou Lintégrable ou absolument intégrable sur I si f et |f |2 sont intégrables sur
I.
Les propriétés élémentaires de la L-intégrale, ainsi que les propriétés
d’additivité et de restriction s’étendent immédiatement à ce nouveau type
d’intégrale. Bien que le théorème de Hake ne soit pas vrai, comme on l’a
déjà remarqué plus haut, pour la L-intégrabilité, c’est-à-dire si l’on remplace
partout “intégrable” par “L-intégrable”, il en existe une version plus restrictive qui fait intervenir l’intégrale indéfinie de |f |2 . Donnons ce théorème
de Hake pour la L-intégrabilité, pour fixer les idées, dans le cas d’un
intervalle de type [a, b[, les autres cas étant analogues.
Proposition. Soit f une fonction de R dans Rp définie sur [a, b[. Alors f
est L-intégrable sur [a, b[ si et seulement si f est L-intégrable sur [a, c] quel
que soit c ∈ ]a, b[ et si
lim
J
c→b− a
c
|f |2
existe.
Démonstration. Condition nécessaire. Si f est L-intégrable sur [a, b[,
alors, par définition, il existe un prolongement f˜ de f à [a, b] tel que f˜
˜ 2 soient intégrables sur [a, b]. En conséquence, par la continuité de
et |f|
H
H
l’intégrale indéfinie, limc→b− ac |f |2 = limc→b− ac |f˜|2 existe.
Condition
suffisante. Par le théorème de Hake, il suffit de montrer que
Hc
limc→b− a f existe, ce qui sera le cas si la condition de Cauchy correspondant
à cette limite est vérifiée. Or, si a < c < c$ < b, on a
#J " #
J c"
# c #
#
#
f# ≤
|f |2 ,
#
# c
#
c
2
et la thèse résulte de ce que l’intégrale indéfinie de |f |2 vérifie la condition
de Cauchy pour la limite en b.
On a un test de comparaison pour la L-intégrabilité sur [a, b[.
Proposition. Soit g une fonction de R dans R+ intégrable sur [a, b[ et f
une fonction de R dans Rp définie sur [a, b[ et intégrable sur [a, c] quel que
soit c ∈ ]a, b[. Si
|f (x)|2 ≤ g(x)
406 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
pour tout x ∈ [a, b[, alors f est L-intégrable sur [a, b[.
Démonstration. La dernière hypothèse et le test de comparaison classique
entraı̂nent la L-intégrabilité de f sur [a, c] quel que soit c ∈ ]a, b[. En outre,
quels que soient c < c$ dans ]a, b[, on a
J
c
c"
|f |2 ≤
J
c
c"
g.
H
Comme g est intégrable sur [a, b[, limc→b− ac g existe et la condition de
Cauchy correspondante est donc satisfaite. En conséquence, elle l’est aussi
pour l’intégrale indéfinie de |f |2 et la thèse résulte de la proposition précédente.
On démontre d’une manière strictement analogue le résultat pour ]a, b]
et le cas de ]a, b[ s’en déduit alors aisément.
Proposition. Soit g une fonction de R dans R+ intégrable sur ]a, b] et f
une fonction de R dans Rp définie sur ]a, b], intégrable sur [c, b] quel que soit
c ∈ ]a, b[. Si
|f (x)|2 ≤ g(x)
pour tout x ∈ ]a, b], alors f est L-intégrable sur ]a, b].
Proposition. Soit g une fonction de R dans R+ intégrable sur ]a, b[ et f
une fonction de R dans Rp définie sur ]a, b[, intégrable sur [a, c] quel que soit
c ∈ ]a, b[. Si
|f (x)|2 ≤ g(x)
pour tout x ∈ ]a, b[, alors f est L-intégrable sur ]a, b[.
Une première conséquence du test de comparaison est le résultat suivant.
Corollaire. Soit I = [a, b[ (resp. ]a, b]) et f une fonction de R dans Rp
définie sur I et intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ ]a, b[. Si,
pour i = 1, 2 ou ∞, |f |i est intégrable sur I, alors f est L-intégrable sur I.
Démonstration. Il suffit de prendre g = |f |i dans le test de comparaison.
Une deuxième conséquence du test de comparaison est le test de la
limite pour l’intégrabilité de fonctions positives.
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ
407
Corollaire. Soit I = [a, b[ (resp. ]a, b]) et f et g deux fonctions de R dans
R+ définies sur I et intégrables sur [a, c] (resp. [c, b]) quel que soit c ∈ ]a, b[.
Supposons que, pour tout x ∈ I, on ait g(x) > 0 et que
f (x)
(resp.
x→b− g(x)
lim
f (x)
)
x→a+ g(x)
lim
existe au sens large et soit notée d.
1. Si d = 0 et si g est intégrable sur I, alors f est intégrable sur I.
2. Si d > 0 est fini, alors f est intégrable sur I si et seulement si g est
intégrable sur I.
3. Si d = +∞ et si f est intégrable sur I, alors g est intégrable sur I.
Démonstration. Considérons, pour fixer les idées, le cas où I = [a, b[,
l’autre se traitant de même. Dans le cas de l’hypothèse 1, il existe c ∈ ]a, b[
(x)
tel que, pour tout x ∈ [c, b[, on ait fg(x)
≤ 1 et dès lors 0 ≤ f (x) ≤ g(x). Par
hypothèse et par le test de comparaison, f est alors intégrable sur [c, b[, et
donc sur [a, b[ puisqu’elle l’est déjà sur [a, c]. Dans le cas de l’hypothèse 2,
en prenant ! = d/2 dans la définition de la limite, il existe c ∈ ]a, b[ tel que,
pour tout x ∈ [c, b[, on ait
−
et dès lors
0≤
d
f (x)
d
≤
−d≤ ,
2
g(x)
2
4 5
d
g(x) ≤ f (x) ≤
2
4
5
3d
g(x).
2
Comme les fonctions ( d2 )g, ( 3d
2 )g et g sont simultanément intégrables sur I,
la thèse en résulte en appliquant deux fois le test de comparaison. Enfin,
dans le cas de l’hypothèse 3, il existe c ∈ ]a, b[ tel que, pour tout x ∈ [c, b[,
on ait f (x) > 0. En outre, l’hypothèse équivaut à
g(x)
= 0,
x→b− f (x)
lim
et il suffit d’appliquer la première partie du résultat en permutant le rôle de
f et g.
Exemple. Si a > 0 et b > 0, la fonction f donnée par
f (x) = xa−1 (1 − x)b−1
408 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
est définie sur ]0, 1[ et telle que
f (x)
f (x)
= 1, lim
= 1.
a−1
x→0+ x
x→1− (1 − x)b−1
lim
On a vu précédemment que la fonction x 2→ xa−1 est intégrable sur ]0, 1] et
que la fonction x 2→ (1 − x)b−1 est intégrable sur [0, 1[. Le test de la limite
entraı̂ne alors l’intégrabilité de f sur ]0, d] et sur [d, 1[ quel que soit d ∈ ]0, 1[,
et donc l’intégrabilité de f sur ]0, 1[. L’intégrale correspondante
J
0
1
xa−1 (1 − x)b−1 dx
s’appelle l’intégrale d’Euler de première espèce et se note B(a, b) (lire “bêta
majuscule” de (a, b)). On notera que, quels que soient c < d dans ]0, 1[, le
changement de variable x = 1 − y sur [c, d] entraı̂ne l’égalité
J
c
d
xa−1 (1 − x)b−1 dx =
J
1−c
1−d
(1 − y)a−1y b−1 dy,
et dès lors, si c → 0+ et d → 1−, on obtient l’égalité
B(a, b) = B(b, a)
quels que soient a > 0 et b > 0.
On peut combiner le test de comparaison que nous venons d’obtenir avec
la formule d’intégration par parties pour obtenir d’utiles tests d’intégrabilité pour des produits de fonctions. Ils se fondent sur le lemme suivant.
Lemme. Soit I = [a, b[ (resp. ]a, b]), f et g des fonctions de R dans K
définies sur I et vérifiant les conditions suivantes.
1. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[.
H
2. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f )
est bornée sur I.
3. g est dérivable sur I.
4. g $ est L-intégrable sur I.
Alors f g est intégrable sur I si et seulement si
5. limc→b− F (c)g(c) (resp. limc→a+ F (c)g(c)) existe.
Démonstration. Considérons, pour fixer les idées, le cas où I = [a, b[.
Par la formule d’intégration par parties sur [a, c], avec c ∈ ]a, b[, on a
J
c
a
f g = F (c)g(c) − F (a)g(a) −
J
c
a
F g$.
409
11.2. INTÉGRALE SUR UN INTERVALLE BORNÉ
L’hypothèse 2 entraı̂ne l’existence d’un M ≥ 0 tel que |F (x)| ≤ M pour
tout x ∈ I, et dès lors, pour les mêmes x, |F (x)g $(x)| ≤ M |g $ (x)|. Comme
M |g $ | est intégrable sur I par l’hypothèse 4, le test de comparaison entraı̂ne
la L-intégrabilité de F g $ sur I, et dès lors l’existence de la limite du dernier
terme du membre de droite lorsque c tend vers b dans ]a, b[. L’hypothèse 1,
la continuité de l’intégrale indéfinie et le théorème de Hake permettent alors
de conclure.
On déduit de ce lemme quatre tests pratiques d’intégrabilité. Les deux
premiers requièrent l’intégrabilité de f sur I. Le premier s’appelle le test
d’intégrabilité de Du Bois-Reymond.
Corollaire. Soit I = [a, b[ (resp. ]a, b]), f et g des fonctions de R dans K
définies sur I et vérifiant les conditions suivantes.
a. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[.
H
b. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f )
est telle que
lim F (c) (resp. lim F (c))
c→a+
c→b−
existe.
c. g est dérivable sur I.
d. g $ est L-intégrable sur I.
Alors f g est intégrable sur I.
Démonstration. Par l’hypothèse b, |F | est majorée sur [c, b[ (resp. ]a, c])
pour un certain c ∈ ]a, b[. Comme F est continue sur [a, c] (resp. [c, b]),
|F | y est également majorée. Enfin, par le théorème fondamental du calcul
différentiel et intégral et la continuité de l’intégrale indéfinie, on a
2
lim g(c) = lim g(a) +
c→b−
c→b−
J
c
a
2
(resp. lim g(c) = lim g(b) +
c→a+
c→a+
3
g $ = g(a) +
J
b
c
3
J
b
a
g $ = g(b) −
g $,
J
b
a
g $ ),
ce qui assure l’existence de la limite correspondante pour F g.
Le deuxième test s’appelle le test d’intégrabilité d’Abel.
Corollaire. Soit I = [a, b[ ou ]a, b], f une fonction de R dans K et g une
fonction de R dans R vérifiant les hypothèses (a), (b), (c) du test de du
Bois-Reymond. Si en outre
410 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
d$ . g est monotone et bornée sur I,
alors f g est intégrable sur I.
Démonstration. Comme g est monotone sur I, g $ y est de signe constant
et la L-intégrabilité de g $ sur I équivaut à son intégrabilité. Celle-ci résulte
de la forme généralisée du théorème fondamental du calcul différentiel et
intégral puisque g, bornée et monotone sur I, possède une limite pour x
tendant vers b ou a selon que I = [a, b[ ou ]a, b]. Il suffit alors d’appliquer le
test de Du Bois-Reymond.
Exemple. Comme la fonction f définie par f (x) = x2 cos x12 est intégrable
sur ]0, 1] et la fonction g définie
parE g(x) = ln(x + 1) est croissante et bornée
D
sur ]0, 1], la fonction x 2→ 2 ln(x+1)
cos x12 est également intégrable sur ]0, 1].
x
Les deux derniers tests ne requièrent plus l’intégrabilité de f sur I. Le
premier s’appelle le test d’intégrabilité de Dedekind.
Corollaire. Soit I = [a, b[ (resp. ]a, b]), f , g des fonctions de R dans K
définies sur I et telles que les conditions suivantes soient vérifiées.
A. f g est intégrable sur [a, c] (resp. [c, b]) quel que soit c ∈ H]a, b[.
H
B. f est primitivable sur I et son intégrale indéfinie F = a· f (resp. ·b f )
est bornée sur I.
C. g est dérivable sur I.
D. g $ est L-intégrable sur I.
E. limx→b− g(x) = 0 (resp. limx→a+ g(x) = 0).
Alors f g est intégrable sur I.
Démonstration. Elle résulte directement du lemme si l’on note que, par
les hypothèses B et E, on a
lim F (x)g(x) = 0 (resp.
x→b−
lim F (x)g(x) = 0).
x→a+
Le deuxième test s’appelle le test d’intégrabilité de Dirichlet.
Corollaire. Soit I = [a, b[ ou ]a, b], f une fonction de R dans K et g une
fonction de R dans R vérifiant les hypothèses A, B, C, E du test de Dedekind.
Si en outre
D $ . g est monotone sur I,
alors f g est intégrable sur I.
Démonstration. On montre, comme dans le test d’Abel, que les hypothèses D $ et E entraı̂nent l’hypothèse D.
11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ
411
Exemple. Pour tout α ∈ [0, 2[, la fonction h : x 2→ x−α cos x1 est intégrable
sur ]0, 1]. En effet, elle peut s’écrire h = f g avec
f (x) = x−2 cos
4
1
1
= − sin
x
x
5$
, g(x) = x2−α,
qui vérifient les conditions du test de Dirichlet.
11.3
Intégrale sur un intervalle non borné
Soient a et b des nombres réels, I = [a, +∞[ (resp. ]a, +∞[, ] − ∞, b],
] − ∞, b[) un intervalle non borné. Soit f une fonction de R dans Rp définie
sur I. La condition nécessaire et suffisante d’intégrabilité sur un intervalle
borné donnée par le théorème de Hake et sa réciproque suggère la définition
suivante d’intégrabilité de f sur I.
Définition. On dit que f est intégrable sur I si f est intégrable sur I ∩ [a, b]
quel que soit b > a et si
lim
J
lim
J
b
f
b→+∞ a
ou
b
a→−∞ a
f
existe selon que I est non majoré ou non
minoré, auquel cas cette limite est
H
appelée l’intégrale de f sur I et notée I f ou, plus explicitement, pour les
quatre choix de I,
J
f ou
+∞
f,
a
[a,+∞[
J
J
f ou
]−∞,b]
J
J
f ou
−∞
f,
J
+∞
f,
a
]a,+∞[
b
J
f ou
]−∞,b[
J
b
−∞
f,
ou encore par les variantes faisant intervenir f (x) dx.
On peut également définir la notion d’intégrale sur R =] − ∞, +∞[.
Définition. Soit f une application de R dans Rp. On dit que f est intégrable sur R s’il existe c ∈ R tel que
f soit Hintégrable sur ] − ∞, c] et sur
Hc
p
[c, +∞[, auquel cas l’élément de R −∞ f + c+∞ f est appelé l’intégrale de
f sur R et noté
J
R
f ou
J
+∞
−∞
f ou
J
R
f (x) dx ou
J
+∞
−∞
f (x) dx.
412 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
On vérifiera sans peine que si la condition de la définition ci-dessus est
satisfaite pour un élément c de R, elle le sera pour n’importe quel d ∈ R avec
la même valeur de l’intégrale. Il est également facile de montrer que f est
intégrable sur R si et seulement si f est intégrable sur [a, b] quels que soient
a < b dans R et si
J
b
lim
(a,b)→(−∞,+∞) a
f
existe, auquel cas cette limite est l’intégrale de f sur R. On peut également
vérifier sans peine que si f est une fonction de R dans Rp définie sur [a, b] et
si l’on définit l’application f[a,b] de R dans Rp par f[a,b](x) = f (x) si x ∈ [a, b]
et f[a,b] (x) = 0 si x ∈ R \ [a, b], alors f est intégrable sur [a, b] si et seulement
si f[a,b] est intégrable sur R.
Définition. Soit I l’un des intervalles non bornés considérés dans les définitions précédentes et soit f une fonction de R dans Rp définie sur I. On
dit que f est intégrable au sens de Lebesgue ou L-intégrable ou absolument
intégrable sur I si f et |f |2 sont intégrables sur I.
Exemples. 1. Si a > 0, la fonction f : x 2→ x−c est L-intégrable sur
I = [a, +∞[ si et seulement si c > 1. En effet, f étant positive sur l’intervalle
considéré, elle y est L-intégrable si et seulement si elle y est intégrable. En
outre, f est primitivable sur I, une primitive étant donnée par F (x) =
(1 − c)−1 x1−c si c /= 1 et par F (x) = ln x si c = 1. Dès lors, si b > a, on a
J
a
b
b
f = (1 − c)−1 (b1−c − a1−c ) ou ln ,
a
H
selon que c /= 1 ou c = 1, et par conséquent limb→+∞ ab f existe si et
seulement si 1 − c < 0. On énoncera et démontrera aisément le résultat
correspondant pour le cas de ] − ∞, a] lorsque a < 0.
2. Aucune fonction constante non nulle n’est intégrable sur ] − ∞, a] ou
[a, +∞[. De même, la fonction cos n’est
pas intégrable sur ces intervalles
H
puisque, par exemple, la fonction b 2→ ab cos x dx = sin b − sin a n’a pas de
limite lorsque b → +∞.
3. La fonction f : x 2→ exp(−|x|) est L-intégrable sur R. En effet, f
positive et continue, et donc primitivable sur R, est L-intégrable sur [a, 0] et
sur [0, b] quels que soient a < 0 < b et l’on a
J
0
a
f=
J
a
0
exp x dx = 1 − exp a,
J
0
b
f=
J
0
b
exp(−x) dx = 1 − exp(−b),
11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ
413
ce qui entraı̂ne la L-intégrabilité de f sur ] − ∞, 0] et sur [0, +∞] avec
J
0
−∞
exp(−|x|) dx = 1,
J
+∞
exp(−|x|) dx = 1,
0
et dès lors
J
R
exp(−|x|) dx = 2.
Les propriétés élémentaires de l’intégrale et de la L-intégrale,
ainsi que les propriétés d’additivité et de restriction de ces intégrales
s’étendent immédiatement au cas d’un intervalle non borné. Il en est de
même, avec des démonstrations strictement analogues, pour l’extension
du théorème du calcul différentiel et intégral, de la formule d’intégration par parties, du test de comparaison de L-intégrabilité, du
test de la limite et des tests de Du Bois-Reymond, Abel, Dedekind
et Dirichlet pour l’intégrabilité d’un produit.
Exemples. 1. Si c > 0, la fonction f définie sur ]0, +∞[ par f (x) =
xc−1 exp(−x) est continue (donc primitivable) et telle que
lim
x→0+
f (x)
= 1,
xc−1
lim
x→+∞
f (x)
= 0,
exp(−x/2)
puisque
lim
x→+∞
2
3
f (x)
x
= lim exp − + (c − 1) ln x =
exp(−x/2) x→+∞
2
4
lim exp −
x→+∞
5 2
3
x
ln x
. 1 − 2(c − 1)
= 0.
2
x
Dès lors, par le test de la limite et l’intégrabilité de la fonction x 2→ xc−1 sur
]0, 1] et de la fonction x 2→ exp(− x2 ) sur [1, +∞[, on voit que l’intégrale
J
0
+∞
xc−1 exp(−x) dx
existe pour chaque c > 0. Elle s’appelle l’intégrale d’Euler de deuxième
espèce et sa valeur est notée Γ(c). En intégrant par parties, on trouve
aisément, pour c > 1,
Γ(c) = (c − 1)Γ(c − 1),
et, comme Γ(1) = 1, on en déduit aussitôt que, pour chaque n ∈ N∗ , on a
Γ(n) = (n − 1)!.
414 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
2. On appelle intégrales trigonométriques les intégrales de la forme
J
+∞
g(x) cos λx dx ou
0
J
+∞
g(x) sin λx dx,
0
où λ > 0 et g est une fonction définie au moins sur ]0, +∞[. Si f désigne
l’une des fonctions cos(λ·) ou sin(λ·), alors f est continue sur R et
#J
#
#
#
0
x
#
#
cos λt dt## =
#
#
J
# x
#
| sin λx|
|1 − cos λx|
sin λt dt## =
≤ λ−1 , ##
≤ 2λ−1 .
λ
λ
0
Dès lors, en appliquant le test de Dirichlet, l’existence des intégrales trigonométriques sera assurée si l’on suppose que g est dérivable et décroissante sur
[0, +∞[, et telle que limx→+∞ g(x) = 0. Ce sera en particulier le cas pour
les intégrales
J +∞
J +∞
cos λx
sin λx
dx
et
dx,
p
x
xp
0
0
lorsque 0 < p < 1, et pour l’intégrale
J
0
+∞
sin λx
dx.
x
En effet, le test de Dirichlet s’applique à l’intégrale de ces fonctions sur
[c, +∞[ lorsque c > 0 et, sur ]0, c],
#
#
# cos λx #
−p
#
#
# xp # ≤ x ,
et, comme on l’a vu au paragraphe précédent, le second membre est intégrable sur ]0, c], tandis que la fonction x 2→ sinxpλx , qui peut être prolongée
continûment en 0 en lui donnant la valeur 0 si p < 1 et λ si p = 1, est
alors R-intégrable sur [0, c]. Lorsque p = 1/2, ces intégrales portent le nom
d’intégrales de Fresnel et elles jouent un rôle important en optique. Notons
√
que la substitution y = x transforme, pour chaque a < b strictement
positifs,
J b
J b
sin λx
cos λx
√ dx et
√ dx
x
x
a
a
respectivement en
2
J
b2
a2
sin λy 2 dy et 2
J
b2
a2
cos λy 2 dy,
11.3. INTÉGRALE SUR UN INTERVALLE NON BORNÉ
415
et dès lors, en faisant tendre a vers 0 et b vers +∞ et en utilisant les
définitions, on trouve
J
+∞
0
et
J
0
+∞
sin λx
√ dx = 2
x
J
cos λx
√ dx = 2
x
J
+∞
sin λy 2 dy
0
+∞
cos λy 2 dy.
0
On notera finalement qu’un raisonnement analogue à celui utilisé dans l’exemple de fonction intégrable et non L-intégrable sur un intervalle borné
montre que chaque intégrand des intégrales trigonométriques ci-dessus est
intégrable sur ]0, +∞[ sans y être L-intégrable.
Remarque. Le lecteur peut s’être posé la question de savoir si l’intégrabilité
d’une fonction f sur un intervalle non borné pouvait être définie en termes de
sommes de Riemann. La réponse est positive et, pour [a, +∞[ par exemple,
la définition est la suivante.
Définition. Soit f une fonction de R dans Rp
dit que f est intégrable sur I s’il existe J ∈ Rp
pour chaque ! > 0, il existe une jauge δ sur I
pour chaque b ≥ B et chaque P-partition δ-fine
définie sur I = [a, +∞[. On
ayant la propriété suivante:
et il existe B > a tels que,
Π de ]a, b], on ait
|S(]a, b], f, Π) − J|2 ≤ !.
On peut alors démontrer, à partir de cette définition, l’analogue du
théorème de Hake sur [a, +∞[ et montrer ainsi que cette définition est
équivalente à celle que nous avons adoptée ici pour court-circuiter cette
démonstration. Le cas de I = ] − ∞, b] est évidemment analogue et celui
des intervalles ouverts se traite par la technique de prolongement. Enfin,
la définition d’intégrabilité sur R en termes de sommes de Riemann est la
suivante.
Définition. Soit f une fonction de R dans Rp définie sur R. On dit que
f est intégrable sur R s’il existe J ∈ Rp ayant la propriété suivante : pour
chaque ! > 0, il existe une jauge δ sur I et il existe ρ > 0 tels que, pour
chaque a ≤ −ρ, chaque b ≥ ρ et chaque P-partition δ-fine Π de ]a, b], on ait
|S(]a, b], f, Π) − J|2 ≤ !.
416 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
11.4
Tests de convergence des séries
Montrons tout d’abord que l’étude de la convergence d’une série dans Rp
équivaut à l’étude de l’intégrabilité sur [0, +∞[ d’une certaine fonction de R
dans Rp construite à partir des termes de la série.
%
Soit k∈N ak une série dans Rp . Associons à la suite (ak )k∈N de ses
termes l’application
a[·] : R+ → Rp , x 2→ a[x],
où [x] désigne le plus grand entier inférieur ou égal à x. C’est donc l’application définie pour chaque x ∈ R+ par a[x] = ak si x ∈ [k, k + 1[, (k ∈ N).
Proposition. Pour chaque b ≥ 1, la fonction a[·] est intégrable sur [0, b] et
l’on a
J
0
b
[b]−1
a[x] dx =
$
k=0
ak + (b − [b])a[b].
Démonstration. En vertu de l’additivité de l’intégrale, il suffit de montrer
que a[.] est intégrable sur [0, 1], [1, 2], . . ., [[b]−1, [b]] et sur [[b], b] (si ce dernier
intervalle n’est pas réduit à un point) et que
J
k+1
k
a[x] dx = ak , (0 ≤ k ≤ [b] − 1),
J
b
[b]
a[x] dx = (b − [b])a[b].
C’est évident pour la dernière intégrale puisque a[·] a sur [[b], b] la valeur
constante a[b] . Pour l’intervalle [k, k + 1], la fonction a[·] a, sur [k, k + 1[ la
valeur constante ak et dès lors
J
c
k
a[x] dx = (c − k)ak ,
pour tout c ∈ ]k, k + 1[, ce qui entraı̂ne que
lim
J
c
c→(k+1)− k
a[x] dx = ak .
L’intégrabilité de a[·] sur [k, k + 1] et la valeur de l’intégrale correspondante
résultent alors du théorème de Hake.
Remarque. On notera que a[·] , bornée sur chaque sous-intervalle borné de
[0, +∞[, y est en fait L-intégrable.
Nous pouvons maintenant démontrer les deux résultats fondamentaux
ramenant la convergence d’une série à l’intégrabilité de la fonction associée.
11.4. TESTS DE CONVERGENCE DES SÉRIES
417
%
Proposition. La série k∈N ak converge si et seulement si la fonction associée a[·] est intégrable sur [0, +∞[, auquel cas l’on a
∞
$
ak =
k=0
J
∞
0
a[x] dx.
Démonstration. Condition nécessaire. Soit A la somme de la série con%
vergente k∈N ak . Par la proposition précédente, il suffit de montrer que
H
%
limb→+∞ 0b a[x] dx = A. Si Aq = qk=0 ak , (q ∈ N), on a, pour chaque b ≥ 1,
#J
#
# b
#
#
#
a[x] dx − A# = |A[b]−1 − A + (b − [b])a[b]|2 ≤ |A[b]−1 − A|2 + |a[b]|2 ,
#
# 0
#
2
puisque 0 ≤ b − [b] < 1. Si ! > 0 est donné, il existe m ∈ N tel que
|A − Ak |2 ≤ !/2, |ak |2 ≤ !/2,
pour chaque k ≥ m, et dès lors, si b ≥ m + 1, on aura [b] − 1 ≥ m et
#J
#
# b
#
#
#
a[x] − A# ≤ !/2 + !/2 = !.
#
# 0
#
2
Condition suffisante. Puisque limb→+∞
J
lim
b→+∞,b∈N 0
b
Hb
0
a[x] dx existe,
a[x] dx
existe aussi, avec la même valeur, et comme, pour tout q ∈ N, on a
Aq =
J
q+1
0
on voit que
lim Aq = lim
q→∞
et la démonstration est complète.
a[x] dx,
J
b→+∞ 0
b
a[x] dx,
%
Proposition. La série k∈N ak converge absolument si et seulement si la
fonction associée a[·] est L-intégrable sur [0, +∞[.
Démonstration. On vérifie immédiatement que |a[·]|2 est la fonction as%
sociée à la série k∈N |ak |2 . La thèse résulte alors de la proposition précédente appliquée à a[·] et à |a[·] |2 .
418 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
Il est maintenant facile de traduire dans le langage des séries, via les
propositions précédentes et la fonction associée, un certain nombre de résultats d’intégrabilité obtenus dans la section précédente. Le premier fournit
un test de comparaison pour la convergence absolue d’une série.
%
%
Proposition. Si la série k∈N ak dans Rp et la série k∈N bk dans R+ sont
telles que, pour un certain entier q ≥ 0 et chaque entier k ≥ q, on ait
et si la série
%
|ak |2 ≤ bk ,
k∈N bk
converge, alors la série
%
k∈N ak
converge absolument.
Le deuxième est le test de la limite pour la convergence des séries
à termes positifs.
%
%
Corollaire. Soit k∈N ak et k∈N bk deux séries réelles pour lesquelles il
existe un entier q ≥ 1 tel que ak ≥ 0 et bk > 0 si k ≥ q. Supposons en outre
que limk→+∞ abkk existe au sens large, et notons la d.
%
%
1. Si d = 0 et si k∈N bk converge, alors k∈N ak converge.
%
%
2. Si d > 0 est fini, k∈N ak et k∈N bk convergent et divergent simultanément.
%
%
3. Si d = +∞ et si k∈N ak converge, alors k∈N bk converge.
Le test de comparaison permet de démontrer le test intégral de Maclaurin-Cauchy pour la convergence de séries positives dont les termes sont
donnés par la restriction à N d’une fonction positive et décroissante sur
[0, +∞[.
Proposition. Soit f une fonction réelle définie, positive et décroissante sur
%
[0, +∞[. Alors la série k∈N f (k) converge si et seulement si f est intégrable
sur [0, +∞[.
Démonstration. Notons tout d’abord que f , décroissante sur [0, +∞[,
est R-intégrable sur [0, b] quel que soit b > 0, et dès lors
l’intégrabilité de f
H
sur [0, +∞[ équivaut à l’existence de la limite limb→+∞ 0b f. Par ailleurs, les
%
%
séries k∈N f (k) et k∈N f (k + 1) convergent et divergent simultanément.
%
Soit fˆ : x 2→ f ([x]) la fonction associée à la série k∈N f (k) et fˇ : x 2→
%
f ([x] + 1) la fonction associée à la série k∈N f (k + 1). Par la décroissance
de f , on a évidemment
0 ≤ fˇ(x) = f ([x] + 1) ≤ f (x) ≤ f ([x]) = fˆ(x),
pour tout x ∈ [0, +∞[, et le test de comparaison montre alors que f, fˆ et
%
fˇ sont simultanément intégrables sur [0, +∞[. En conséquence, k∈N f (k)
converge si et seulement si f est intégrable sur [0, +∞[.
419
11.4. TESTS DE CONVERGENCE DES SÉRIES
Remarques. 1. L’inégalité entre f, fˆ et fˇ montre que
∞
$
k=1
f (k) ≤
J
+∞
f≤
0
∞
$
f (k),
k=0
dès que l’un des trois termes existe.
%
2. La convergence de k∈N∗ f (k) équivaut évidemment à l’intégrabilité
de f sur [1, +∞[.
%
Exemples. 1. La série de Riemann k∈N∗ k−c , où c ≥ 0, converge si c > 1
et diverge si c ∈ [0, 1]. En effet, les termes de cette série sont les valeurs
de la restriction à N∗ de la fonction f définie sur [1, +∞[ par f (x) = x−c ,
qui est positive et décroissante sur cet intervalle. On a vu au paragraphe
précédent que cette fonction était intégrable sur [1, +∞[ si et seulement si
c > 1. On en déduit en particulier une nouvelle preuve de la divergence de
%
la série harmonique k∈N∗ k1 . Cette série “diverge très lentement”, puisque
l’inégalité, déduite des considérations qui précèdent,
q
$
1
k=1
J
≥
k
q
1
dx
= ln q,
x
montre qu’il faudra plus de exp 10 = 22.026 termes pour que les sommes
partielles dépassent 10 ! La différence
q
$
1
k=1
k
− ln q
entre la q e somme partielle de la série harmonique et ln q =
puisque
q
q
$
$
k
ln q =
[ln k − ln(k − 1)] =
ln
,
k−1
k=2
k=2
à
1+
q 4
$
1
k=2
k
− ln
Hq
dx
1 x
est égale,
5
k
.
k−1
D’autre part, en utilisant l’expression de Lagrange du reste du développement de Taylor, il existera, pour chaque entier k ≥ 2, un θk ∈ ]0, 1[ tel
que
− ln
4
k
1
= ln 1 −
k−1
k
5
= ln 1 −
1
−
k
4 54
1
2
5


1 
1

8
9 .
2
k
θk 2
1− k
420 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
Par conséquent,
q
$
q
$
4 54
1
1
− ln q = 1 +
k
2
k=1
k=2
Comme
lim
2
k→∞
( 12 )( k12 )


1 
1

8
9 .
2
k
θk 2
1− k
1
k
4
5
1
θ
(1− kk )2
5 = 2,
%
le test de la limite et la convergence de la série de Riemann k∈N∗ k12 entraı̂ne
%
k
la convergence de la série 1+ k≥2 ( k1 −ln k−1
), et donc l’existence de la limite
lim
q→∞
,
q
$
1
k=1
k
-
− ln q .
Cette limite est appelée la constante d’Euler, désignée par C et joue un
grand rôle dans différentes questions d’analyse et de théorie analytique des
nombres. Sa valeur approximative est
C = 0, 577215664901532860606512090082....
On ignore toujours si la constante d’Euler est un nombre rationnel ou un
nombre irrationnel, un nombre algébrique ou un nombre transcendant. Pour
s > 1, la somme de la série de Riemann, que l’on désigne par ζ(s), peut se
calculer, par des moyens qui sortent du cadre de ce chapitre, lorsque s est
2
4
π6
pair. Ainsi, ζ(2) = π6 , ζ(4) = π90 , ζ(6) = 945
. Plus généralement, Leonard
Euler a montré que, pour chaque entier positif k, ζ(2k) = ak π 2k pour un
certain nombre rationnel ak . On peut en déduire que ζ(2k) est toujours
irrationnel, et même transcendant. Par contre on ignore si ζ(2k + 1) est
ou non irrationnel lorsque k ≥ 2. Ce n’est qu’en 1978 que Roger Apery a
démontré que ζ(3) était irrationnel.
%
1
2. La série d’Abel k≥2 k ln
k est telle que
1
k
1
k→∞
k ln k
lim
= +∞
tandis que, pour chaque c > 1,
1
kc
1
k→∞
k ln k
lim
= 0.
421
11.5. TESTS DE LA RACINE ET DU QUOTIENT
Le test de la limite combiné aux résultats sur la convergence de la série de
Riemann ne permettent donc pas de décider de sa convergence. Mais, pour
tout x ≥ 2, on a
J
2
x
dy
=
y ln y
J
ln x
ln 2
dt
= ln(ln x) − ln(ln 2),
t
1
et la fonction décroissante x 2→ x ln
x n’est pas intégrable sur [2, +∞[. Le
test de Maclaurin-Cauchy montre aussitôt que la série d’Abel est divergente.
%
Par contre, le même test montre que, pour tout a > 1, la série k≥2 k(ln1k)a
est convergente.
11.5
Tests de la racine et du quotient
Des combinaisons judicieuses du test de comparaison et des résultats sur la
convergence de la série géométrique fournissent d’utiles tests de convergence
absolue. Le premier s’appelle le test de la racine de Cauchy.
%
Proposition. Soit k∈N ak une série dans Rp . Posons L = +∞ si la suite
1/k
(|ak |2 )k∈N n’est pas majorée et
L = lim
q→∞
&
sup
{k∈N:k≥q}
1/k
|ak |2
'
,
sinon.
%
1. Si L < 1, la série k∈N ak converge absolument.
%
2. Si L > 1, la série k∈N ak diverge.
%
3. Si L = 1, on ne peut pas conclure, c’est-à-dire la série k∈N ak peut
converger ou diverger.
8
Démonstration. 9Notons tout d’abord que, si elle est définie, la suite
1/k
sup{k∈N:k≥q} |ak |2
est décroissante et positive, et sa limite L existe
q∈N
bien. Si l’hypothèse 1 est satisfaite, choisissons ! > 0 tel que L + ! < 1 (par
exemple ! = 1−L
2 ). Il existera dès lors un m ∈ N tel que
L−! ≤
sup
{k∈N:k≥q}
1/k
|ak |2
≤ L + !,
1/k
pour tout q ≥ m, et dès lors, pour tout k ≥ m, on aura |ak |2 ≤ L + !,
%
c’est-à-dire |ak |2 ≤ (L + !)k . Comme la série géométrique k∈N (L + !)k est
convergente, la thèse résulte du test de comparaison.
422 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
Supposons maintenant que L > 1 et considérons le cas où L est fini (on
procède de même pour L = +∞). La décroissance de la suite
&
sup
{k∈N:k≥q}
entraı̂ne que, pour tout q ∈ N, on a
sup
{k∈N:k≥q}
1/k
|ak |2
1/k
|ak |2
'
q∈N
≥ L > 1.
Choisissons ! > 0 tel que L−! > 1 (par exemple ! = L−1
2 ). La caractérisation
du supremum appliquée à l’inégalité ci-dessus entraı̂ne alors l’existence, pour
chaque q ∈ N, d’un entier kq ≥ q tel que
1/kq
|akq |2
≥
1/k
sup
{k∈N:k≥q}
|ak |2
− ! ≥ L − ! > 1,
et donc tel que |akq |2 > 1. Par conséquent, la suite (ak )k∈N des termes de
%
la série ne tend pas vers zéro et la série k∈N ak diverge. Enfin, la série de
%
Riemann k∈N∗ k1c , avec c > 0 est telle que (k−c )1/k = [k1/k ]−c . Par ailleurs,
l’étude élémentaire du comportement de la fonction x 2→ x1/x montre que
cette fonction décroı̂t pour x ≥ e et tend vers 1 lorsque x tend vers l’infini
(calculer la dérivée et utiliser la règle de l’Hospital). En conséquence, la
suite ([k1/k ]−c )k≥3 est croissante et a pour limite 1, ce qui entraı̂ne, puisque
sup
([k1/k ]−c ) = 1,
{k∈N:k≥q}
dès que q ≥ 3, que L = 1. Or la série de Riemann diverge pour c ≤ 1 et
converge pour c > 1.
Le résultat qui suit simplifie fortement, lorsqu’il s’applique, le calcul de
L.
Proposition. Avec les notations du test de la racine de Cauchy, si
1/k
limk→∞ |ak |2 existe, alors L est égal à cette limite.
1/k
Démonstration. Soit a = limk→∞ |ak |2 et soit ! > 0. Il existe donc
m ∈ N tel que, pour tout entier k ≥ m, on ait
1/k
a − ! ≤ |ak |2
et dès lors, pour tout q ≥ m, on a
1/q
a − ! ≤ |aq |2
ce qui implique L = a.
≤
≤ a + !,
sup
{k∈N:k≥q}
1/k
|ak |2
≤ a + !,
11.5. TESTS DE LA RACINE ET DU QUOTIENT
423
Le deuxième test s’appelle le test du quotient de d’Alembert.
%
Proposition. Soit k∈N ak une série dans Rp telle que ak /= 0 pour tout
|a
|2
k ∈ N. Si la suite ( |ak+1
)k∈N n’est pas majorée, posons Q2 = +∞. Sinon,
k |2
posons
&
'
|ak+1 |2
Q2 = lim
sup
,
q→∞ {k∈N:k≥q} |ak |2
Q1 = lim
q→∞
%
&
|ak+1 |2
inf
{k∈N:k≥q} |ak |2
'
.
1. Si Q2 < 1, la série k∈N ak converge absolument.
%
2. si Q1 > 1, la série k∈N ak diverge.
%
3. Si Q1 ≤ 1 ≤ Q2 , le test ne peut conclure, c’est-à-dire la série k∈N ak
peut converger ou diverger.
Démonstration. Notons tout d’abord que, lorsqu’elle est définie, la suite
&
|ak+1 |2
sup
{k∈N:k≥q} |ak |2
'
q∈N
est décroissante et positive, donc convergente, et chacun de ses termes majore
le terme correspondant de la suite croissante et positive
&
|ak+1 |2
inf
{k∈N:k≥q} |ak |2
'
,
q∈N
qui convergera donc également. En conséquence, Q2 et Q1 existent et Q1 ≤
Q2 . Dans le cas de l’hypothèse 1, soit ! > 0 tel que Q2 + ! < 1. Il existera
un entier naturel m tel que
|ak+1 |2
≤ Q2 + !,
{k∈N:k≥q} |ak |2
sup
pour tout q ≥ m et donc tel que
|ak+1 |2
(Q2 + !)k+1
≤ Q2 + ! =
,
|ak |2
(Q2 + !)k
pour tout k ≥ m. Pour ces mêmes k, on a donc
|ak+1 |2
|ak |2
≤
,
k+1
(Q2 + !)
(Q2 + !)k
424 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
et la suite
8
k ≥ m, on a
|ak |2
(Q2+!)k
9
k≥m
est donc décroissante. Par conséquent, pour tout
|ak |2 ≤ Cm (Q2 + !)k ,
%
|2
k
avec Cm = (Q|a2m
k∈N (Q2 + !) converge,
+!)m . Comme la série géométrique
le test de comparaison et l’inégalité ci-dessus entraı̂nent aussitôt la conver%
gence absolue de k∈N ak . Si Q1 > 1, (et nous nous contenterons de traiter
explicitement le cas où Q1 est fini, l’autre étant semblable), il existe ! > 0
tel que Q1 − ! > 1. Pour cet !, il existe un entier naturel m tel que
Q1 − ! ≤
|ak+1 |2
≤ Q1 + !,
{k∈N:k≥q} |ak |2
inf
si q ≥ m, et donc tel que, pour tout k ≥ m,
1<
|ak+1 |2
.
|ak |2
En conséquence, on a, pour tout k ≥ m, |ak+1 |2 ≥ |ak |2 ≥ |am |2 > 0,
et la suite (ak )k∈N ne tend pas vers zéro, ce qui entraı̂ne la divergence de
%
k∈N ak . Enfin, on montre aisément que la série de Riemann fournit, quel
que soit c > 0, les valeurs Q1 = Q2 = 1 et l’on sait qu’elle diverge pour c ≤ 1
et converge pour c > 1.
Le résultat suivant facilite, lorsqu’il s’applique, le calcul des expressions
Q1 et Q2 . Sa démonstration, semblable au résultat analogue pour le critère
de Cauchy, est laissée au lecteur.
Proposition. Avec les notations du test du quotient de d’Alembert, si
|a
|2
limk→∞ |ak+1
existe, alors Q1 = Q2 et leur valeur commune est égale à
k |2
cette limite.
Remarque. Le test du quotient est en général plus facile à appliquer que le
test de la racine, car il est en général plus facile de calculer des quotients que
des racines. Cependant, le test de la racine est plus général que le test du
quotient dans le sens suivant : si le test du quotient entraı̂ne la convergence
ou la divergence, il en est de même du test de la racine; si le test de la racine
ne peut conclure, il en est du même du test du quotient. Ce fait résulte des
inégalités ci-dessous, dont le lecteur vérifiera aisément la validité pour toute
suite strictement positive (ck )k∈N :
lim
q→∞
4
inf
k≥q
ck+1
ck
5
≤ lim
q→∞
4
1/k
inf ck
k≥q
5
,
425
11.6. SÉRIES POTENTIELLES
lim
q→∞
11.6
&
1/k
sup ck
k≥q
'
≤ lim
q→∞
&
ck+1
sup
k≥q ck
'
.
Séries potentielles
Une application importante des tests de la racine et du quotient est fournie
par l’étude des séries potentielles, qui constituent la généralisation naturelle
des polynômes sur C.
Définition. Etant donnés une suite (ck )k∈N dans C et deux nombres complexes a et z, on appelle série potentielle ou série de puissances ou série
%
entière une série de la forme k∈N ck (z − a)k .
%
Les sommes partielles de la série potentielle k∈N ck (z − a)k sont les
%
polynômes qk=0 ck (z − a)k . Ces expressions ont un sens quel que soit z ∈
%
C. L’exemple de la série géométrique k∈N z k de raison z ∈ C qui ne
converge que pour |z| < 1 montre que la somme d’une série potentielle n’est
pas nécessairement définie pour tout z ∈ C. On a dans cette direction
l’important théorème de convergence d’une série potentielle.
%
Théorème. Considérons la série potentielle k∈N ck (z − a)k . Si la suite
(|ck |1/k )k∈N n’est pas majorée, posons C = +∞. Sinon, posons
C = lim
q→∞
&
sup
{k∈N:k≥q}
|ck |
1/k
'
.
%
1. Si C > 0 est fini, et si l’on pose R = 1/C, la série k∈N ck (z −a)k converge
absolument si |z − a| < R et diverge si |z − a| > R.
%
2. Si C = 0, la série k∈N ck (z − a)k converge absolument pour tout z ∈ C.
%
3. si C = +∞, la série k∈N ck (z − a)k converge absolument pour z = a et
diverge pour tout z /= a.
Démonstration. Appliquons le test de la racine de Cauchy à la série
$
k∈N
ck (z − a)k .
Comme |ck (z − a)k | = |ck ||z − a|k pour chaque k ∈ N, on a
#
#1/k
#
#
= |ck |1/k |z − a|,
#ck (z − a)k #
426 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
8
et, pour z /= a, la suite |ck (z − a)k |1/k
la suite (|ck |
1/k
9
k∈N∗
est majorée si et seulement si
)k∈N∗ l’est. Dans ce cas, on a, pour chaque q ∈ N,
sup
{k∈N:k≥q}
#
#1/k
#
#
=
#ck (z − a)k #
= |z − a|
sup
{k∈N:k≥q}
sup
{k∈N:k≥q}
|ck |1/k |z − a|
|ck |1/k ,
et dès lors L = |z − a|C. Dès lors, si C > 0 est fini, L < 1 si et seulement si
|z − a| < 1/C = R et L > 1 si et seulement si |z − a| > 1/C = R, et la thèse
résulte du critère de la racine de Cauchy. Si C = 0, L = 0 quel que soit z ∈ C
et le critère de la racine de Cauchy permet encore de conclure. Si C = +∞,
alors, pour chaque z /= a, L = +∞ et la série diverge. Sa convergence pour
z = a est triviale puisque ses termes sont nuls dès que k ≥ 1.
Lorsque C > 0 est fini, le nombre R = 1/C s’appelle le rayon de con%
vergence de la série k∈N ck (z − a)k et le disque ouvert de centre a et de
rayon R s’appelle son disque de convergence. Lorsque limk→∞ |ck |1/k existe
et est strictement positive, les résultats de la section précédente entraı̂nent
évidemment que le rayon de convergence est égal à l’inverse de cette limite.
En utilisant un cas particulier du critère du quotient de d’Alembert, on
peut obtenir un théorème de convergence moins général, mais souvent plus
facile à appliquer que le précédent.
%
Proposition. Soit k∈N ck (z − a)k une série potentielle telle que ck /= 0
|c
|
pour chaque k ∈ N. Si la limite limk→∞ |ck+1
existe et est strictement
k|
positive, elle est égale à l’inverse du rayon de convergence de la série. Si elle
est nulle, la série converge absolument pour tout z ∈ C. Si elle est égale à
+∞, la série diverge pour tout z /= a.
Démonstration. Etudions la convergence absolue de la série
$
k∈N
ck (z − a)k
par le test du quotient de d’Alembert. On a
et dès lors
|ck+1 ||z − a|k+1
|ck+1 |
= |z − a|
,
|ck ||z − a|k
|ck |
lim
k→∞
|ck+1 ||z − a|k+1
= |z − a|r,
|ck ||z − a|k
427
11.6. SÉRIES POTENTIELLES
|c
|
si r = limk→∞ |ck+1
. La thèse se déduit alors du cas particulier du test de
k|
d’Alembert où Q1 = Q2 .
Exemples. 1. Rappelons que si z ∈ C, la série exponentielle de z est la
%
k
série potentielle k∈N zk! . Puisque
1
(k+1)!
lim
1
k→∞
k!
= lim
k→∞
1
= 0,
k+1
la proposition précédente montre que cette série converge absolument pour
tout z ∈ C. On montre de même que les séries potentielles
$
(−1)k
k∈N
$
z 2k
z 2k+1
et
(−1)k
(2k)!
(2k + 1)!
k∈N
convergent pour chaque z ∈ C. On les appelle respectivement la série potentielle cosinus de z et la série potentielle sinus de z et leurs sommes respectives
sont désignées par cos z et sin z.
%
2. La série potentielle k∈N∗ kk z k est telle que
8
lim kk
k→∞
91/k
= lim k = +∞,
k→∞
et dès lors elle converge pour z = 0 et diverge pour z /= 0.
%
k
3. La série potentielle k∈N∗ zkc où c ∈ R est telle que
1
(k+1)c
1
k→∞
kc
lim
= lim
k→∞
4
k
k+1
5c
= 1,
et dès lors elle converge absolument pour |z| < 1 et diverge pour |z| > 1. Le
théorème fondamental de convergence d’une série entière ne fournit aucune
information sur sa convergence lorsque |z| = 1 et il faut étudier chaque
∗
série cas
# k #par cas. Si nous remarquons que, pour |z| = 1 et chaque k ∈ N ,
#z #
1
on a # kc # = kc , le test de comparaison et la convergence de la série de
Riemann pour c > 1 entraı̂nent dans ce cas la convergence absolue de la
%
k
série potentielle k∈N∗ zkc pour chaque z tel que |z| = 1. Lorsque c ∈ ]0, 1],
et z = 1, la série potentielle se réduit à la série de Riemann divergente
%
1
k∈N∗ kc , et l’on montrera plus loin qu’elle converge pour les autres valeurs
∗
#dek #z telles que |z| = 1. Enfin, si c ≤ 0, on a, pour |z| = 1 et k ∈ N ,
#z #
# kc # = k |c| et la série diverge puisque la suite de ses termes ne tend pas vers
zéro. On voit donc qu’une série potentielle peut converger en tous les points
428 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
tels que |z − a| soit égal au rayon de convergence, diverger en tous ces points,
ou encore converger en certains de ces points et diverger en d’autres. Nous
reviendrons sur cette question dans la section suivante.
On peut associer à une série potentielle une famille d’autres séries potentielles ayant le même rayon de convergence.
Définition. On appelle série dérivée de la série potentielle
la série potentielle
$
k∈N∗
kck (z − a)k−1 =
$
k∈N
%
k∈N ck (z − a)
k
(k + 1)ck+1 (z − a)k ,
dont chaque terme est la valeur en z de la C-dérivée par rapport à z du
terme correspondant de la série originelle.
Ainsi, la série dérivée de la série géométrique
$
k∈N∗
kz k−1 =
$
k∈N∗
k
k∈N z
k
est la série
(k + 1)z k .
k∈N
La série dérivée de la série exponentielle de z
$
%
%
zk
k∈N k!
est la série
$
$ zk
z k−1
zk
(k + 1)
=
=
,
k!
(k + 1)! k∈N k!
k∈N
c’est-à-dire la série exponentielle de z elle-même. La série dérivée de la série
cosinus de z est égale à moins la série sinus de z et la série dérivée de la série
sinus de z est égale à la série cosinus de z.
Proposition. Une série potentielle et sa série dérivée ont le même rayon de
convergence.
Démonstration. Notons tout d’abord que, pour z /= a, les termes de
%
%
la série dérivée k∈N∗ kck (z − a)k−1 et ceux de la série k∈N∗ kck (z − a)k
ne diffèrent que par un facteur constant z − a et les deux séries convergent
ou divergent donc simultanément. Pour étudier la convergence de la série
%
k
1/k pour q ≥ 1.
k∈N∗ kck (z − a) , il faut étudier les quantités supk≥q (k|ck |)
On a vu précédemment que la fonction x 2→ x1/x décroı̂t monotonément vers
1 dès que x ≥ e. En conséquence, on aura, pour tout k ≥ q ≥ 3,
|ck |1/k ≤ (k|ck |)1/k = k1/k |ck |1/k ≤ q 1/q |ck |1/k ,
et dès lors
sup |ck |1/k ≤ sup (k|ck |)1/k ≤ sup q 1/q |ck |1/k = q 1/q sup |ck |1/k .
k≥q≥3
k≥q≥3
k≥q≥3
k≥q≥3
429
11.7. SÉRIES TRIGONOMÉTRIQUES
On en déduit aussitôt que les suites correspondantes sont simultanément
majorées, et que, s’il en est ainsi,
C = lim
q→∞
≤ lim
q→∞
&
q
&
sup |ck |
1/k
k≥q≥3
1/q
sup |ck |
1/k
k≥q≥3
= lim
'
q→∞
&
≤ lim
,
sup (k|ck |)
1/k
q→∞ k≥q≥3
'
= lim q
1/q
q→∞
sup |ck |1/k
k≥q
. lim
q→∞
'
&
-
= C$
sup |ck |
1/k
k≥q
'
= C,
et dès lors C = C $ .
On peut évidemment itérer le processus de passage à la série dérivée et
considérer la série dérivée de la série dérivée
$
k≥2
(k − 1)kck (z − a)k−2 =
$
k∈N
(k + 1)(k + 2)ck+2 (z − a)k ,
que l’on appellera la série dérivée seconde de la série potentielle
$
k∈N
ck (z − a)k .
En continuant de la sorte, on définira, pour chaque entier m ≥ 1, la série
%
dérivée me de k∈N ck (z − a)k comme étant la série
$
k≥m
=
$
k∈N
(k − m + 1) . . . (k − 1)kck (z − a)k−m
(k + 1)(k + 2) . . .(k + m)ck+m (z − a)k .
Toutes ces séries dérivées ont évidemment le même rayon de convergence
%
que la série k∈N ck (z − a)k .
11.7
Séries trigonométriques
%
Soit k∈N ck (z −a)k une série potentielle et R > 0 son rayon de convergence.
Les points z tels que |z − a| = R, peuvent s’écrire z = a + R exp it, t ∈ R, et,
%
en ces points, la série potentielle prend la forme k∈N ck Rk exp ikt, avec
lim
q→∞
&
sup (|ck |R )
k≥q≥1
k 1/k
'
= R lim
q→∞
&
sup |ck |
k≥q≥1
1/k
'
= 1.
430 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
%
Il s’agit d’un cas particulier de séries de la forme k∈N dk exp ikt où t ∈ R
et (dk )k∈N est une suite de nombres complexes. Ces séries s’appellent des
%
séries trigonométriques et elles sont du type k∈N ak bk avec bk = dk et
ak = exp ikt. Pour de tels ak , on a pour chaque q ∈ N,
Aq =
q
$
exp ikt =
k=0
1 − exp[i(q + 1)t]
si t /= 2πm, m ∈ Z
1 − exp it
et Aq = q + 1 si t = 2πm, m ∈ Z. En conséquence, pour chaque t /=
2
2πm, m ∈ Z et chaque q ∈ N, on a |Aq | ≤ |1−exp
. Nous allons voir qu’il
% it|
est possible d’obtenir pour les séries de type k∈N ak bk pour lesquelles la
suite (|Aq |)q∈N est majorée d’intéressants résultats de convergence qui sont
l’analogue de tests d’intégrabilité obtenus précédemment pour des produits
de fonctions. Ces résultats reposent sur la proposition suivante, appelée le
lemme d’Abel.
Lemme. Soient (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les conditions suivantes.
%q
1. La suite (Aq )q∈N des sommes partielles Aq = k=0 ak est bornée.
%
2. La série k∈N(bk − bk+1 ) converge absolument.
%
Alors la série k∈N ak bk converge si et seulement si limq→∞ Aq bq existe.
Démonstration. La démonstration utilise la transformation d’Abel qui
est l’analogue, pour les séries, de l’intégration par parties :
q
$
k=0
ak bk = a0 b0 +
q
$
k=1
(Ak − Ak−1 )bk = A0 b0 +
= Aq bq +
q−1
$
k=0
q
$
k=1
Ak bk −
q−1
$
Ak bk+1
k=0
Ak (bk − bk+1 ) (q ∈ N).
Si M > 0 est tel que |Ak | ≤ M pour chaque k ∈ N, alors
|Ak (bk − bk+1 )| ≤ M |bk − bk+1 |
%
pour chaque k ∈ N et, comme la série k∈N M |bk − bk+1 | converge par
l’hypothèse 2, le test de comparaison entraı̂ne la convergence absolue de la
%
série k∈N Ak (bk − bk+1 ). La thèse résulte alors facilement de la formule
d’Abel.
On déduit de ce lemme des tests de convergence utiles. Les deux premiers
%
requièrent la convergence de k∈N ak . On a d’abord le test de convergence
de Du Bois-Reymond.
431
11.7. SÉRIES TRIGONOMÉTRIQUES
Corollaire. Soit (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les conditions suivantes.
%
a. La série k∈N ak converge.
%
b. La série k∈N (bk − bk+1 ) converge absolument.
%
Alors la série k∈N ak bk converge.
Démonstration. Par l’hypothèse a, la suite des sommes partielles
(Aq )q∈N est convergente, et donc bornée. Les sommes partielles de la série
%
k∈N (bk − bk+1 ) sont données par
q
$
k=0
(bk − bk+1 ) =
q
$
k=0
bk −
q+1
$
k=1
bk = b0 − bq+1 .
Par l’hypothèse b, la suite (b0 − bq+1 )q∈N converge, et il en est donc de même
de (Aq bq )q∈N. Le lemme d’Abel permet de conclure.
Le deuxième résultat s’appelle le test de convergence d’Abel.
Corollaire. Soit (ak )k∈N une suite dans K et (bk )k∈N une suite dans R
vérifiant les conditions suivantes.
%
a. La série k∈N ak converge.
b$ . La suite (bk )k∈N est monotone et convergente.
%
Alors la série k∈N ak bk converge.
Démonstration. Comme (bk )k∈N est monotone, les expressions bk − bk+1
%
ont toutes le même signe et la série k∈N (bk − bk+1 ) converge absolument si
et seulement si elle converge, ce qui est le cas puisque, comme on l’a montré
plus haut, la suite de ses sommes partielles est la suite (b0 − bq+1 )q∈N qui
converge par l’hypothèse b’.
Les test suivants ne requièrent plus la convergence de
d’abord le test de convergence de Dedekind.
%
k∈N ak .
On a
Corollaire. Soit (ak )k∈N et (bk )k∈N deux suites dans K vérifiant les conditions suivantes.
A. La suite (Aq )q∈N est bornée.
%
B. La série k∈N (bk − bk+1 ) converge absolument.
C. La suite (bk )k∈N converge vers zéro.
%
Alors la série k∈N ak bk converge.
Démonstration. Si M majore tous les |Aq |, on a |Aq bq | ≤ M |bq | pour
tout q ∈ N, et dès lors limq→∞ Aq bq = 0. La thèse résulte du lemme d’Abel.
432 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
On a enfin le test de convergence de Dirichlet.
Corollaire. Soit (ak )k∈N une suite dans K et (bk )k∈N une suite dans R
vérifiant les conditions suivantes.
A. La suite (Aq )q∈N est bornée.
B $ . La suite (bk )k∈N est monotone et converge vers zéro.
%
Alors la série k∈N ak bk converge.
Démonstration. On montre, comme dans le test d’Abel, que la condition
B’ entraı̂ne l’hypothèse B du test de Dedekind.
Exemples. 1. Le test de Dirichlet s’applique aux séries trigonométriques
%
k∈N dk exp ikt pour t /= 2πm, m ∈ Z, lorsque la suite (dk )k∈N est décroissante et a une limite nulle. Ce sera en particulier le cas pour les séries
$
k−c exp(ikt)
k∈N
quel que soit c > 0 et t /= 2πm, m ∈ Z. On en déduit en particulier la
%
convergence de la série potentielle k∈N k−c z k considérée plus haut pour
tout z /= 1 tel que |z| = 1 et tout c ∈ ]0, 1]. Rappelons qu’on avait déjà
démontré la convergence absolue de cette série pour tout z tel que |z| = 1
et tout c > 1.
2. Une autre classe intéressante de séries auxquelles le test de Dirichlet
%
s’applique est celle des séries alternées k∈N (−1)k bk où les bk sont réels et
positifs. En posant ak = (−1)k , on trouve aussitôt que A2q = 1, A2q+1 =
0, et donc |Aq | ≤ 1 quel que soit q ∈ N. Le test de Dirichlet entraı̂ne
alors que la série alternée converge dès que la suite (bk )k∈N décroit vers
zéro. Ce sera en particulier le cas pour les séries de Riemann alternées
%
(−1)k
qui convergent quel que soit c > 0. On savait déjà qu’elles
k∈N∗ kc
convergeaient absolument si et seulement si c > 1. Elles sont donc non
absolument convergente pour c ∈ ]0, 1]. C’est en particulier le cas pour la
k
%
série harmonique alternée k∈N∗ (−1)
k .
Remarque. On appellera plus généralement série trigonométrique toute
série de la forme
$
[d−k exp(−ikt) + dk exp(ikt)]
k∈N
où les d−k et dk sont des nombres complexes et t ∈ R. Lorsque d−k = dk
pour chaque k ∈ N, la série est réelle et peut encore s’écrire
a0 +
$
(ak cos kt + bk sin kt)
k∈N
433
11.8. EXERCICES
avec ak = dk + d−k , bk = i(dk − d−k ), (k ∈ N). Si l’on pose Ak = (a2k + b2k )1/2
et θk = arctan abkk , cette dernière série prend la forme équivalente
$
Ak sin(kt + θk ).
k∈N
L’étude de la convergence des séries trigonométriques est l’un des chapitres
les plus importants et les plus délicats de l’analyse.
11.8
Exercices
1. Utiliser le théorème de Hake, la convergence de la série harmonique
alternée et la divergence de la série harmonique pour montrer que la fonction
f de R dans R définie par f (0) = 0 et
f (x) = (−1)[ x ]
1
2 3
1
,
x
pour x ∈ ]0, 1] (où [u] désigne la partie entière de u) est intégrable sur [0, 1]
mais n’y est pas L-intégrable.
2. Soit g une fonction de R dans R de classe C 1 sur R et a− , a+ deux zéros
consécutifs de g entre lesquels g est strictement positive. Utiliser le théorème
de Lagrange et le test de la limite d’intégrabilité pour montrer que, si a− et
a+ sont des zéros simples de g (c’est-à-dire des zéros tels que g $ (a− ) /= 0 et
g $ (a+ ) /= 0) alors la fonction x 2→ √ 1 est intégrable sur ]a− , a+ [. Ce type
g(x)
d’intégrale intervient dans la discussion, à partir de l’intégrale d’énergie, du
mouvement d’un système mécanique conservatif à un degré de liberté.
3. Montrer que la fonction f de R dans R définie par f (0) = 0 et f (x) = x1
si x /= 0 n’est pas intégrable sur ]a, b[ lorsque a < 0 < b. Montrer toutefois
que
,J
J b
−c dx
dx
b
lim
= log .
+
c→0+
x
|a|
a
c x
Cette limite s’appelle la valeur principale de Cauchy de l’“intégrale” de f
sur ]a, b[ et s’écrit
J b
dx
b
vp
= log .
|a|
a x
4. Soit p ≥ 1 un entier, f une fonction de R dans R de classe C p sur [0, 1],
et α ∈ ]0, 1[. En utilisant le reste de Lagrange du développement de Taylor
434 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
et le test d’intégrabilité de la limite, montrer que la fonction
x 2→
p−1
f (x) − Tf,0
(x)
xp+α
est intégrable sur [0, 1]. Son intégrale est appellée la partie finie de l’“inté(x)
grale” de la fonction x 2→ xfp+α
, et notée
Pf
J
0
1
f (x)
dx.
xp+α
En particulier, montrer que
Pf
J
1
0
1+x
1
dx =
.
x1+α
1−α
5. Démontrer le théorème de Kummer : la série à termes strictement positifs
k∈N ak converge si et seulement s’il
8 existe une suite
9 (bk )k∈N de nombres
ak
strictement positifs tels que limk→∞ bk ak+1 − bk+1 > 0. Suggestion: pour
%
%q
la condition nécessaire, si A = ∞
k=0 ak , et Aq =
k=0 ak , il suffit de prendre
A−Ak
bk = ak ; pour la condition suffisante, il existe h > 0 et m ∈ N tels que
%
bk
ak
− bk+1 > h,
ak+1
pour tout k ≥ m. on en déduit aisément que, pour tout k ≥ m, on a
h(Ak − Am ) < bmam − bk ak < bm am ,
et dès lors la suite (Ak )k≥m est majorée par Am + bmham . En déduire le test
k
de Raabe : si limk→∞ k( aak+1
− 1) > 1, alors la série à termes strictement
%
positifs k∈N ak converge.
%
m(m−1)...(m−k+1) k
6. Montrer que, si m ∈ R, la série binomiale k∈N
z a un
k!
rayon de convergence égal à un. Cette série se réduit au développement de
(1 + z)m par le binôme de Newton si m ≥ 1 est un entier.
11.9
Petite anthologie
Si on élève 1 + µ à la puissance m, le terme ne de la série sera
µn−1
m(m − 1) . . .(m − n + 2)
,
2.3.4. . . ..(n − 1)
435
11.9. PETITE ANTHOLOGIE
et le suivant, c’est-à-dire le (n + 1)e , sera
µn
m(m − 1) . . . (m − n + 2)(m − n + 1)
;
2.3.4. . . .(n − 1).n
donc le rapport du (n + 1)e terme au ne sera µ (m−n+1)
; or pour que la série
n
soit convergente, il faut que ce rapport (abstraction faite du signe qu’il doit
avoir) soit plus petit que l’unité.
Jean Le Rond d’Alembert, 1768
Lorsque la série
u0 , u1 , u2 , . . . , un , etc, . . .
a tous ses termes positifs, on peut ordinairement décider si elle est convergente ou divergente, à l’aide du théorème suivant. Théorème. Cherchez la
limite ou les limites vers lesquelles converge, tandis que n croı̂t indéfiniment,
l’expression (un )1/n ; et désignez par k la plus grande de ces limites, ou, en
d’autres termes, la limite des plus grandes valeurs de l’expression dont il
s’agit. La série sera convergente, si l’on a k < 1, et divergente, si l’on a
k > 1.
Augustin Cauchy, 1821
Soit
a0 , a1 x, a2 x2 , . . . , an xn , etc . . . ,
une série ordonnée suivant les puissances entières et ascendantes de la variable x. Théorème. Soit A la limite vers laquelle converge, pour des valeurs
croissantes de n, la racine ne des plus grandes valeurs numériques de an .
La série sera convergente pour toutes les valeurs de x comprises entre les
limites
1
1
x=− , x=+ ,
A
A
et divergentes pour toutes les valeurs de x situées hors des mêmes limites.
Augustin Cauchy, 1821
Etant donné une série
a0 + a1 x + . . . + am xm + . . . ,
on peut se proposer de déterminer, s’il y a lieu, son cercle de convergence.
Cette question a été traitée par M. Lecornu (Comptes rendus, 7 février 1887)
436 CHAPITRE 11. INTÉGRALE SUR UN INTERVALLE ET SÉRIES
1/m
dans le cas où le module de am+1
a une limite. Cette limite
am ou celui de am
est alors l’inverse du rayon de convergence. L’objet de la présente note est
de résoudre le problème dans tous les cas. Pour cela, je rappellerai quelques
principes relatifs aux suites infinies.
Soit une suite infinie de nombres positifs
u0 , u1 , . . . , um, . . . .
Il peut arriver, comme premier cas, que cette suite contienne des termes
supérieures à tout nombre donné A.
S’il n’en est pas ainsi, il y a lieu de distinguer deux classes de nombres.
Dans la première, on mettra tout nombre A tel qu’il existe dans la suite des
termes d’un rang aussi élevé qu’on le veut supérieurs à A; dans la seconde,
tout nombre B, tel que tous les termes de la suite, à partir d’un certain
rang, soient moindres que B. Il est clair que si un nombre A appartient à la
première classe, il en est de même de tous les nombres inférieurs, et que si
un nombre B est de la seconde classe, il en est de même de tous les nombres
supérieurs. La supposition que nous avons faite au commencement de cet
alinée consiste dans l’existence des nombres de la seconde classe.
Il est alors facile de définir, par des procédés bien connus, un nombre
α, tel que la première classe soit composée des nombres plus petits que α,
et la seconde, des nombres plus grands que α; en sorte que α − !(! > 0)
appartiendra à la première classe, et α + ! à la seconde. Pour abréger, nous
appellerons ce nombre α la limite supérieure de la suite.
Cette limite est nulle dans le cas où la suite tend vers 0, et dans ce cas
seulement.
Cela posé, pour rechercher le cercle de convergence de la série donnée, il
suffira de considérer la suite
|a1 |, |a2|1/2, . . . , |am|1/m, . . . .
1. Si cette suite contient des termes supérieurs à toute quantité donnée, la
série n’est jamais convergente;
2. Si cette suite ne renferme pas de termes augmentant indéfiniment, elle
admet une limite supérieure α. Le rayon de convergence de la série est alors
ρ = α1 .
3. La condition nécessaire et suffisante pour que la série soit convergente
dans tout le plan et représente une fonction entière est que |am |1/m tende
vers zéro.
Jacques Hadamard, 1888
Chapitre 12
Suites et séries de fonctions
12.1
Convergence ponctuelle
De nombreuses fonctions intervenant en analyse s’obtiennent comme limites
de suites de fonctions plus simples. Le but de ce chapitre est d’étudier la
conservation éventuelle, après passage à la limite, de différentes propriétés
des fonctions de la suite. Nous allons voir que cette conservation dépend du
mode de passage à la limite.
Soit (fk )k∈N une suite de fonctions de Rn dans Rp, c’est-à-dire une application de N dans l’ensemble des fonctions de Rn dans Rp , soit E une partie
de Rn contenue dans dom fk pour chaque k ∈ N et soit f une application
de E dans Rp .
Définition. On dit que la suite (fk )k∈N converge simplement ou ponctuellement sur E vers f si, pour chaque x ∈ E, la suite (dans Rp) (fk (x))k∈N
converge vers f (x).
Cette définition et l’unicité de la limite d’une suite dans Rp entraı̂nent
aussitôt qu’il existe au plus une application f de E dans Rp vérifiant les
conditions de cette définition. Lorsqu’elle existe, cette application s’appelle
la limite ponctuelle sur E de la suite (fk )k∈N.
En explicitant la définition de convergence d’une suite dans Rp, on trouve
immédiatement que (fk )k∈N converge ponctuellement sur E vers f si et seulement si
(∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : |fk (x) − f (x)|2 ≤ !, (12.1)
la norme | · |2 pouvant évidemment être remplacée par une autre. On voit
que le m donné dans (12.1) dépendra en général d’ ! et de x. Il est évident
437
438
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
que, si G ⊂ E, la convergence ponctuelle sur E vers f de la suite (fk )k∈N
entraı̂ne la convergence ponctuelle de cette suite sur G vers la restriction de
f à G.
Exemples. 1. Si E = [0, 1], la suite de fonctions réelles (fk )k∈N définies par
fk (x) = xk converge ponctuellement sur E vers l’application réelle f définie
par f (x) = 0 si x ∈ [0, 1[ et f (1) = 1. Pour chaque 0 < ! < 1 et chaque
x ∈ [0, 1], le plus petit entier m = m(!, x) pour lequel (12.1) est satisfaite est
ln !
donné par m(!, 0) = 0, m(!, 1) =D 0 et,
pour 0 < x < 1, m(!, x) = ln
x si ce
E
ln !
dernier nombre est entier et par ln
x + 1, s’il ne l’est pas, où [y] désigne la
partie entière du réel y. On voit donc que m(!, x) tend vers l’infini lorsque
x tend vers 1 par valeurs strictement inférieures à un.
2. Considérons la suite (fk )k∈N de fonctions réelles d’une variable réelle
1
définies par fk (x) = 1+(x−k)
2 . Pour chaque k ∈ N, on vérifie facilement que
lim
k→∞
1
= 0.
1 + (x − k)2
Par conséquent, cette suite converge ponctuellement sur R vers l’application
nulle. Le lecteur vérifiera facilement que la quantité m(!, x) introduite dans
l’exemple précédent tend vers +∞ lorsque x tend vers l’infini.
3. Si E = R, la suite de fonctions réelles (fk )k∈N définies par f0 (x) = 0
et fk (x) = k−1/2 sin kx pour k ≥ 1 converge ponctuellement sur R vers
l’application nulle sur R.
La conséquence immédiate suivante de la définition et des propriétés des
suites dans Rp montre qu’on peut se ramener à l’étude de la convergence
ponctuelle des suites de fonctions réelles.
Proposition. La suite (fk )k∈N converge ponctuellement sur E vers f si et
seulement si chaque suite de fonctions réelles (pq ◦fk )k∈N converge ponctuellement sur E vers pq ◦ f .
Le critère de Cauchy de convergence d’une suite dans Rp appliqué à
chaque suite (fk (x))k∈N fournit évidemment un critère de Cauchy de
convergence ponctuelle sur E.
Proposition. La suite (fk )k∈N converge ponctuellement sur E si et seulement si
(∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) :
|fk (x) − fq (x)|2 ≤ !.
On peut évidemment considérer aussi des séries de fonctions.
439
12.1. CONVERGENCE PONCTUELLE
Définition. On appelle série de fonctions de termes fk , k ∈ N, et l’on note
%
k∈N fk , la suite de fonctions (Fq )q∈N , où chaque fonction somme partielle
Fq est définie par
Fq =
q
$
fk .
k=0
Définition. Soit F une application de E dans Rp . On dit que la série
k∈N fk converge simplement ou ponctuellement sur E vers F si la suite
(Fq )q∈N converge ponctuellement sur E vers F .
%
Si elle existe, l’unique application F vérifiant cette définition s’appelle
%
%
alors la somme de la série de fonctions k∈N fk et se note ∞
k=0 fk . Il résulte
%
immédiatement de la définition que k∈N fk converge ponctuellement sur E
%
vers F si et seulement si, pour chaque x ∈ E, la série (dans Rp ) k∈N fk (x)
converge vers F (x).
Exemple. Si, pour chaque k ∈ N, la fonction réelle d’une variable réelle fk
est définie par fk (x) = xk /k, on a vu en étudiant les séries entières que la
%
série k∈N fk converge ponctuellement sur [−1, 1[.
La notion de convergence absolue d’une série dans Rp conduit à un second
type de convergence pour une série de fonctions.
%
Définition. On dit que la série de fonctions k∈N fk converge absolument
%
sur E si, pour chaque x ∈ E, la série numérique k∈N |fk (x)|2 converge,
%
c’est-à-dire si, pour chaque x ∈ E, la série (dans Rp) k∈N fk (x) converge
absolument.
La propriété suivante est une conséquence immédiate de la définition et
d’une propriété connue des séries dans Rp .
Proposition. Si la série de fonctions
elle converge ponctuellement sur E.
%
k∈N fk
converge absolument sur E,
Exemples. 1. Soit fk les fonctions réelles d’une variable réelle définies par
%
fk (x) = k−x et soit E =]1, +∞[. La série k∈N fk converge absolument sur E
et sa somme est la restriction à ]1, +∞[ d’une fonction complexe d’une variable complexe appelée la fonction zeta (ζ). Cette fonction joue un grand rôle
en théorie analytique des nombres. Bernhard Riemann a conjecturé en 1859
que les zéros non triviaux de cette fonction ont tous une partie réelle égale
à 1/2. Vérifiée pour les quelques premiers millions de zéros de la fonction,
cette hypothèse de Riemann attend encore sa démonstration. Celle-ci permettrait de préciser le théorème des nombres premiers, conjecturé en 1792 par
Karl-Friedrich Gauss et seulement démontré en 1896 (indépendamment) par
440
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
Jacques Hadamard et Charles-Jean de La Vallée Poussin . Ce théorème
affirme que le nombre π(k) de nombre premiers inférieurs ou égaux à un entier positif k est tel que
π(k)
lim
= 1.
k→∞ k/ ln k
2. Soit fk les fonctions complexes d’une variable complexe définies par
fk (z) = z k et considérée comme fonction de R2 dans R2 . En vertu des
%
résultats sur la convergence de la série géométrique, la série k∈N fk converge
1
absolument sur B2 (0; 1) vers l’application F définie par F (z) = 1−z
.
3. Si les fonctions réelles d’une variable réelle fk sont définies par fk (x) =
x(1 − x)k , alors, pour chaque q ∈ N, on a Fq (0) = 0 et Fq (x) = 1 − (1 − x)q+1
si x /= 0. Par conséquent, puisque fk (x) = |fk (x)| pour chaque x ∈ [0, 1], la
%
%
k
série k∈N fk converge absolument sur [0, 1] et ∞
k=1 x(1 − x) = 0 si x = 0
et est égale à 1 si x ∈]0, 1].
Enfin, on traduit aisément dans le langage des séries les critères de
Cauchy de convergence ponctuelle et de convergence absolue.
%
Proposition. La série de fonctions
absolument) sur E si et seulement si
k∈N fk
converge ponctuellement (resp.
(∀x ∈ E)(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m) :
#
#
# q
#
# $
#
#
# ≤ !. (resp.
f
(x)
j
#
#
#j=k+1
#
2
q
$
j=k+1
|fj (x)|2 ≤ !.)
L’exemple 1 de suite de fonctions et l’exemple 3 de série de fonctions
montrent que la limite ponctuelle d’une suite de fonctions continues ou la
somme d’une série absolument convergente de fonctions continues n’est pas
nécessairement continue sur l’ensemble de convergence. D’ailleurs, dans ces
exemples, les fonctions sont indéfiniment dérivables et la limite ou la somme
ne l’est évidemment pas. La limite ponctuelle sur un ensemble d’une suite de
fonctions bornées sur cet ensemble n’y est pas nécessairement bornée. Ainsi,
pour chaque k ∈ N, la fonction réelle d’une variable réelle fk définie sur R∗+
par
k
fk (x) =
,
kx + 1
est bornée sur R+ par k et la suite converge ponctuellement sur R∗+ vers
l’application f définie par f (x) = 1/x qui n’est pas bornée sur R∗+ . Enfin,
la convergence ponctuelle ne préserve pas non plus l’intégrabilité. Dans
441
12.2. CONVERGENCE UNIFORME
l’exemple précédent, chaque fk est intégrable sur ]0, 1] alors que f ne l’est
pas, ainsi que cela se vérifie en utilisant le théorème de Hake.
Si l’on note que les propriétés des fonctions que nous venons d’analyser
expriment une certaine “solidarité” entre les valeurs de la fonction et que la
convergence ponctuelle (c’est-à-dire “point par point”) est un concept tout
à fait “individualiste”, on ne doit pas s’étonner trop que ces propriétés ne
subsistent pas nécessairement après passage à la limite. Il convient donc
d’introduire une notion de convergence plus globale si l’on veut que la fonction limite conserve de telles propriétés.
12.2
Convergence uniforme
Soit (fk )k∈N une suite de fonctions de Rn dans Rp , soit E une partie de Rn
contenue dans dom fk pour chaque k ∈ N et soit f une application de E
dans Rp . Nous allons introduire un type de convergence plus restrictif que
la convergence ponctuelle en imposant que la quantité m figurant dans la
définition (12.1) puisse être choisie indépendamment de x dans E.
Définition. On dit que la suite (fk )k∈N converge uniformément sur E vers
f si
(∀! > 0)(∃m ∈ N)(∀x ∈ E)(∀k ∈ N : k ≥ m) : |fk (x) − f (x)|2 ≤ !. (12.2)
Bien entendu, si G ⊂ E, la convergence uniforme vers f de (fk )k∈N sur
E entraı̂ne la convergence uniforme sur G de (fk )k∈N vers la restriction de
f à G.
Les propriétés du supremum entraı̂nent aussitôt le résultat suivant.
Proposition. Les propositions suivantes sont équivalentes :
1. (fk )k∈N converge uniformément sur E vers f .
2.
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m) : sup |fk (x) − f (x)|2 ≤ !.
(12.3)
x∈E
3. La suite réelle (supx∈E |fk (x) − f (x)|2 )k∈N converge vers zéro.
Exemple. Dans l’exemple 3 de suite de fonctions donné dans la section
précédente, il y a converge uniforme sur R vers l’application nulle puisque
la suite
4
5
−1/2
sup |k
sin kx|
= (k−1/2)k∈N∗
R
k∈N∗
converge vers zéro.
Signalons une autre conséquence immédiate de la définition.
442
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
Proposition. Si (fk )k∈N converge uniformément sur E vers f , alors
(fk )k∈N converge ponctuellement sur E vers f .
L’unicité de la limite ponctuelle entraı̂ne alors qu’il existe au plus un f
vérifiant (12.2). On l’appelle souvent la limite uniforme de (fk )k∈N sur E et
elle est nécessairement égale à sa limite ponctuelle.
L’exemple 2 de suite de fonctions donné dans la section précédente montre que la convergence ponctuelle sur un ensemble n’entraı̂ne pas nécessairement la convergence uniforme sur cet ensemble. En effet, la suite de fonctions
donnée dans cet exemple converge ponctuellement sur R vers l’application
nulle alors que la suite
&
#
#'
#
#
1
#
#
sup #
1 + (x − k)2 #
x∈R
,
k∈N
qui est la suite constante 1, ne converge évidemment pas vers zéro.
On dispose d’un critère de Cauchy de convergence uniforme.
Théorème. La suite de fonctions (fk )k∈N converge uniformément sur E si
et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m)(∀x ∈ E) :
(12.4)
|fk (x) − fq (x)|2 ≤ !,
ou encore si et seulement si,
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) :
sup |fk (x) − fq (x)|2 ≤ !.
x∈E
Démonstration. Condition nécessaire. Si ! > 0 est donné, alors, par
définition,
(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E) : |fk (x) − f (x)|2 ≤ !/2.
Dès lors, pour tout k ≥ m, tout q ≥ m et tout x ∈ E, on a
|fk (x) − fq (x)|2 ≤ |fk (x) − f (x)|2 + |f (x) − fq (x)|2 ≤ !/2 + !/2 = !.
Condition suffisante. Construisons tout d’abord un candidat pour l’application limite f . Si la suite (fk )k∈N vérifie la condition de Cauchy (12.4),
alors, pour chaque x ∈ E, la suite (fk (x))k∈N est une suite de Cauchy dans
12.2. CONVERGENCE UNIFORME
443
Rp et elle converge dès lors vers un élément de Rp que nous désignerons par
f (x). On obtient ainsi une application f de E dans Rp .
Montrons maintenant que (fk )k∈N converge uniformément sur E vers f .
Si ! > 0 est donné, la condition (12.4) implique que
(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E)(∀q ∈ N : q ≥ m) : |fk (x) − fq (x)|2 ≤ !.
En faisant tendre q vers l’infini, on obtient alors, par continuité de l’application norme et conservation des inégalités par passage à la limite
(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀x ∈ E) : |fk (x) − f (x)|2 ≤ !,
et la démonstration est complète.
Le critère de Cauchy permet de prouver la convergence uniforme sur
adh E de certaines suites de fonctions convergeant uniformément sur E.
Proposition. Soit (fk )k∈N une suite de fonctions de Rn dans Rp continues
sur adh E \ E qui converge uniformément sur E. Alors (fk )k∈N converge
uniformément sur adh E.
Démonstration. On peut évidemment supposer que adh E /= E. Si ! > 0
est donné, le critère de Cauchy de convergence uniforme sur E entraı̂ne
l’existence d’un m ∈ N tel que
(∀y ∈ E)(∀k ∈ N : k ≥ m)(∀q ∈ N : q ≥ m) : |fk (y) − fq (y)|2 ≤ !/3.
D’autre part, pour chaque x ∈ adh E \ E, la continuité de chaque fonction
fk au point x entraı̂ne l’existence d’un δ = δ(k, x) > 0 tel que
(∀y ∈ E : |y − x|2 ≤ δ(k, x)) : |fk (y) − fk (x)|2 ≤ !/3.
Dès lors, pour chaque x ∈ adh E \ E, k ≥ m et chaque q ≥ m, si nous
choisissons (ce qui est toujours possible puisque x ∈ adh E \ E) un y ∈ E
tel que
|y − x|2 ≤ min[δ(k, x), δ(q, x)],
nous obtenons
|fk (x) − fq (x)|2 ≤ |fk (x) − fk (y)|2 + |fk (y) − fq (y)|2 + |fq (y) − fq (x)|2
≤ !/3 + !/3 + !/3 = !,
ce qui entraı̂ne la convergence uniforme de (fk )k∈N sur adh E puisque la
condition de Cauchy était déjà satisfaite, avec le même m, pour chaque
x ∈ E.
444
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
Une forme contraposée et affaiblie de cette proposition est souvent utile.
Corollaire. Soit (fk )k∈N une suite de fonctions de Rn dans Rp continues
sur adh E. Si cette suite ne converge pas uniformément sur adh E, alors elle
ne converge pas uniformément sur E.
Passons maintenant à la convergence uniforme des séries de fonctions.
%
Soit k∈N fk une série dont les termes sont des fonctions définies sur E ⊂ Rn
et F une application de E dans Rp.
%
Définition. On dit que la série de fonctions k∈N fk converge uniformément sur E vers F si la suite (Fq )q∈N des sommes partielles converge uniformément sur E vers F .
%
Définition. On dit que la série de fonctions k∈N fk converge absolument
%
uniformément sur E si la série de fonctions positives k∈N |fk |2 converge
uniformément sur E.
On notera que cette notion est plus forte que celle de convergence absolue
%
et uniforme de k∈N fk sur E.
%
Exemple. Considérons la série k∈N fk de fonctions complexes d’une variable complexe fk définies par fk (z) = z k . On a vu que cette série converge
1
ponctuellement sur B2 (0; 1) vers l’application F : z 2→ 1−z
. Elle ne converge
pas uniformément sur B2 (0; 1) vers F car, pour chaque q ∈ N, on a
sup
z∈B2 (0;1)
|Fq (z) − F (z)| =
Toutefois, pour chaque r < 1,
vers F puisque
sup
z∈B2 [0;r]
%
|z|q+1
= +∞.
z∈B2 (0;1) |1 − z|
k∈N fk
|Fq (z) − F (z)| =
sup
converge uniformément sur B2 [0; r]
|z|q+1
r q+1
=
,
1−r
z∈B2 [0;r] |1 − z|
sup
et que le dernier terme peut être rendu inférieur ou égal à ! > 0 donné
en prenant q ≥ m pour m tel que r m+1 ≤ !(1 − r). Le même raisonnement
%
%
appliqué à la série k∈N |z|k montre que k∈N fk converge en fait absolument
et uniformément sur B2 [0; r].
On traduit sans peine, dans le langage des séries, le critère de Cauchy
de convergence uniforme (resp. de convergence absolue uniforme).
445
12.2. CONVERGENCE UNIFORME
%
Corollaire. La série de fonctions k∈N fk converge uniformément (resp.
absolument uniformément) sur E si et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m)(∀x ∈ E) :
#
#
# q
#
# $
#
#
fj (x)## ≤ !, (resp.
#
#j=k+1
#
2
q
$
j=k+1
|fj (x)|2 ≤ !),
ou, d’une manière équivalente, si et seulement si
(∀! > 0)(∃m ∈ N)(∀k ∈ N : k ≥ m)(∀q ∈ N : q > k ≥ m) :
#
#


# q
#
q
$
# $
#
sup ##
fj (x)## ≤ !. (resp. sup 
|fj (x)|2  ≤ !).
#
x∈E #j=k+1
x∈E j=k+1
2
En particulier, puisqu’on a toujours l’inégalité

sup 
x∈E
q
$
j=k+1

|fj (x)|2 ≤
q
$
sup |fj (x)|2 ,
j=k+1 x∈E
on voit qu’il y aura toujours convergence absolue uniforme sur E pour la série
%
%
de fonctions k∈N fk si la série à termes positifs k∈N supx∈E |fk (x)|2 est de
Cauchy, c’est-à-dire est convergente. Cette remarque suggère l’introduction
d’un nouveau type de convergence pour une série de fonctions.
%
Définition. On dit que la série k∈N fk de fonctions de Rn dans Rp con%
verge normalement sur E si la série à termes positifs k∈N supx∈E |fk (x)|2
converge.
Par la remarque que nous venons de faire, la convergence normale sur E
entraı̂ne évidemment la convergence absolue uniforme sur E.
On a l’intéressant test de comparaison de Weierstrass pour la
convergence normale.
%
Théorème. Considérons la série k∈N fk de fonctions de Rn dans Rp . S’il
%
existe une série convergente à termes positifs k∈N Mk telle que, pour chaque
k ∈ N et chaque x ∈ E on ait
alors la série
%
|fk (x)|2 ≤ Mk ,
k∈N fk
est normalement convergente sur E.
Démonstration. Pour chaque k ∈ N, on a, par hypothèse,
sup |fk (x)|2 ≤ Mk ,
x∈E
446
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
et la thèse résulte de la définition et du test de comparaison pour les séries
numériques.
Exemple. Soit s > 1 et fk la fonction complexe d’une variable réelle définie
par fk (x) = (k + 1)−s exp i(k + 1)x. Pour chaque k ∈ N et chaque x ∈ R, on
a
|fk (x)| ≤ (k + 1)−s
%
et la série numérique k∈N (k + 1)−s est convergente. Donc la série
est normalement convergente sur R.
12.3
%
k∈N fk
Régularité de la limite uniforme
Le résultat suivant est fondamental pour étudier la continuité et la dérivabilité de la limite uniforme d’une suite de fonctions continues ou dérivables.
Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies sur
E, f une application de E dans Rp et a ∈ adh E. Si les conditions suivantes
sont réalisées
1. La suite (fk )k∈N converge uniformément sur E vers f .
2. Pour chaque k ∈ N, limx→a, x∈E fk (x) = bk .
Alors la suite (bk )k∈N converge et
lim
x→a, x∈E
f (x) = lim bk .
k→∞
En d’autres termes,
lim
2
3
lim fk (x) = lim
x→a, x∈E k→∞
2
lim
k→∞ x→a, x∈E
3
fk (x) .
Démonstration. Pour montrer que la suite (bk )k∈N converge, il suffit de
montrer qu’elle est une suite de Cauchy. Si ! > 0 est donné, la condition de
Cauchy de convergence uniforme de (fk )k∈N sur E entraı̂ne l’existence d’un
m ∈ N tel que
(∀k ≥ m)(∀q ≥ m)(∀x ∈ E) : |fk (x) − fq (x)|2 ≤ !.
Dès lors, en faisant tendre x vers a et en utilisant la conservation d’une
inégalité par passage à la limite et la continuité de la fonction | · |2 , on
obtient
|bk − bq |2 ≤ !,
447
12.3. RÉGULARITÉ DE LA LIMITE UNIFORME
pour tout k ≥ m et tout q ≥ m, et (bk )k∈N est une suite de Cauchy dans Rp.
Si nous désignons sa limite par b, il reste à montrer que
lim
x→a, x∈E
f (x) = b.
Etant donné un ! > 0, la convergence de (bk )k∈N vers b et la convergence
uniforme de (fk )k∈N vers f entraı̂nent respectivement l’existence d’un m$ ∈ N
et d’un m$$ ∈ N tels que, si m = max(m$ , m$$), on a
|bm − b|2 ≤ !/3
et
|fm (x) − f (x)|2 ≤ !/3
quel que soit x ∈ E. D’autre part, puisque limx→a, x∈E fm (x) = bm , il existe
un δ > 0 tel que
|fm (x) − bm|2 ≤ !/3
pour tout x ∈ E tel que |x − a|2 ≤ δ. Pour ces mêmes x, on aura donc
|f (x) − b|2 ≤ |f (x) − fm (x)|2 + |fm (x) − bm |2 + |bm − b|2
≤ !/3 + !/3 + !/3 = !,
et la démonstration est complète.
On a un résultat similaire pour les séries de fonctions.
%
Corollaire. Soit k∈N fk une série de fonctions de Rn dans Rp définies sur
E, F une application de E dans Rp et a ∈ adh E. Si les conditions suivantes
sont satisfaites :
%
1. La série k∈N fk converge uniformément sur E vers F .
2. Pour chaque k ∈ N, limx→a, x∈E fk (x) = bk .
%
Alors la série k∈N bk converge et
lim
x→a, x∈E
F (x) =
∞
$
bk .
k=0
En d’autres termes,
lim
x→a, x∈E
,
∞
$
k=0
-
fk (x) =
∞ 2
$
k=0
lim
x→a, x∈E
3
fk (x) .
448
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
Démonstration. En vertu des définitions, il suffit d’appliquer le théorème ci-dessus à la suite des sommes partielles (Fq )q∈N et de noter que, par
suite des propriétés des limites des valeurs d’une fonction, on a, pour chaque
q ∈ N,
lim
x→a, x∈E
Fq (x) =
lim
x→a, x∈E
,
q
$
-
fk (x) =
k=0
q 2
$
k=0
lim
x→a, x∈E
3
fk (x) =
q
$
bk .
k=0
%
Remarque. La convergence uniforme de la série k∈N fk sur E autorise
%
donc la permutation des symboles limx→a, x∈E et ∞
k=0 .
Les résultats suivants sont des conséquences immédiates du théorème et
du corollaire précédents et de la définition de continuité.
Corollaire. Si (fk )k∈N converge uniformément sur E vers f et si chaque
fonction fk est continue sur E, alors f est continue sur E.
%
Corollaire. Si k∈N fk converge uniformément sur E vers F et si chaque
fonction fk est continue sur E, alors F est continue sur E.
Considérons maintenant le problème de la conservation de la dérivabilité
par passage à la limite. La convergence uniforme d’une suite de fonctions
dérivables ne suffit pas à assurer la dérivabilité de la limite. Ainsi, la suite
k+2
(fk )k∈N de fonctions réelles d’une variable réelle définies par fk (x) = |x| k+1
et dérivables en chaque point de R converge uniformément sur [−1, 1] vers
la fonction valeur absolue qui n’est pas dérivable à l’origine. Il peut arriver
aussi que la limite soit dérivable mais ne soit pas égale à la limite des dérivées
des fonctions de la suite. Le résultat suivant fournit des conditions sous
lesquelles de telles conclusions sont exclues.
Théorème. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies sur
un ouvert E et soit f une application de E dans Rp . Supposons satisfaites
les conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur E vers f .
2. Il existe 1 ≤ j ≤ n tel que, pour chaque k ∈ N, la dérivée partielle
Dj fk (x) existe pour chaque x ∈ E.
3. La suite de fonctions (Dj fk )k∈N converge uniformément sur E.
Alors Dj f (x) existe pour chaque x ∈ E et est égale à limk→∞ Dj fk (x). En
d’autres termes, on a
Dj
4
5
lim fk (x) = lim Dj fk (x).
k→∞
k→∞
449
12.3. RÉGULARITÉ DE LA LIMITE UNIFORME
Démonstration. Soit x ∈ E fixé, r > 0 tel que Ix = [−r, r] ⊂ Ex = {h ∈
R : x + hej ∈ E}, et φ, φk les fonctions définies pour chaque k ∈ N par les
quotients différentiels
φ(h) =
f (x + hej ) − f (x)
fk (x + hej ) − fk (x)
, φk (h) =
.
h
h
Par construction, les fonctions φ et φk sont définies sur Ix \ {0} et sont telles
que
lim φk (h) = Dj fk (x), k ∈ N,
h→0, h∈Ix
et
lim φk (h) = φ(h), h ∈ Ix \ {0}.
k→∞
D’autre part, en appliquant l’inégalité de la moyenne à fk − fq , on trouve,
pour chaque h ∈ Ix \ {0}, chaque k ∈ N et chaque q ∈ N,
|φk (h) − φq (h)|2 = |h|−1 |fk (x + hej ) − fq (x + hej ) − [fk (x) − fq (x)]|2
≤ |Dj fk (x + h$ ej ) − Dj fq (x + h$ ej )|2 ,
pour un certain h$ tel que 0 < |h$ | < |h|.
Si ! > 0 est donné, la condition de Cauchy de convergence uniforme sur
E de (Dj fk )k∈N entraı̂ne l’existence d’un m ∈ N tel que, pour chaque k ≥ m,
chaque q ≥ m et chaque y ∈ E, on ait
|Dj fk (y) − Dj fq (y)|2 ≤ !.
Dès lors, puisque x + h$ ej ∈ E si h ∈ Ix \ {0}, on aura, pour chaque k ≥ m,
chaque q ≥ m et chaque h ∈ Ix \ {0},
|φk (h) − φq (h)|2 ≤ !.
En conséquence, la suite de fonctions (φk )k∈N converge uniformément sur
Ix \ {0} vers φ et, en lui appliquant le premier théorème de cette section, on
en déduit que
lim
2
3
lim φk (h) = lim
h→0, h∈Ix k→∞
2
lim
k→∞ h→0, h∈Ix
c’est-à-dire, par des calculs faits plus haut, que
lim
h→0, h∈Ix
φ(h) = lim Dj fk (x).
k→∞
Donc Dj f (x) existe et est égal à limk→∞ Dj fk (x).
3
φk (h) ,
450
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
On a évidemment un résultat analogue pour les séries.
%
Corollaire. Soit k∈N fk une série de fonctions de Rn dans Rp dont les
termes sont définis sur un ouvert E et soit F une application de E dans Rp.
Supposons satisfaites les conditions suivantes.
%
1. La série k∈N fk converge ponctuellement sur E vers F .
2. Il existe 1 ≤ j ≤ n tel que, pour chaque k ∈ N, la dérivée partielle
Dj fk (x) existe pour chaque x ∈ E.
%
3. La série de fonctions k∈N Dj fk converge uniformément sur E.
%
Alors Dj F (x) existe pour chaque x ∈ E et est égale à ∞
k=0 Dj fk (x). En
d’autres termes, on a
Dj
&
∞
$
k=0
'
fk (x) =
∞
$
Dj fk (x).
k=0
Démonstration. Elle consiste à appliquer le théorème précédent à la suite
des sommes partielles. Les détails sont laissés au lecteur.
Montrons maintenant que la limite uniforme d’une suite de fonctions
bornées est bornée.
Proposition. Soit (fk )k∈N une suite de fonctions de Rn dans Rp définies
sur E et soit f une application de E dans Rp . Supposons satisfaites les
conditions suivantes.
1. La suite (fk )k∈N converge uniformément sur E vers f .
2. Pour chaque k ∈ N, il existe Mk ≥ 0 tel que |fk (x)|2 ≤ Mk , pour tout
x ∈ E.
Alors il existe M ≥ 0 tel que |f (x)|2 ≤ M pour tout x ∈ E.
Démonstration. En prenant ! = 1 dans la définition de convergence
uniforme de (fk )k∈N sur E, on obtient un entier positif m tel que, pour
chaque x ∈ E, on a
|fm (x) − f (x)|2 ≤ 1,
ce qui entraı̂ne
|f (x)|2 = |f (x) − fm (x) + fm (x)|2 ≤ 1 + |fm (x)|2 ≤ 1 + Mm
pour tout x ∈ E et achève la démonstration.
Remarque. On pourrait démontrer maintenant que la limite uniforme
sur un pavé d’une suite de fonctions intégrables (resp. L-intégrables, Rintégrables) sur ce pavé y est également intégrable (resp. L-intégrable,
451
12.4. UNE FONCTION CONTINUE SANS DÉRIVÉE
R-intégrable). Mais on trouvera plus loin des résultats plus généraux sur
l’intégrabilité ou la L-intégrabilité de la limite d’une suite de fonctions intégrables.
12.4
Une fonction continue sans dérivée
Les résultats que nous venons de développer permettent de construire un
exemple, donné par Henri Lebesgue en 1940, de fonction réelle d’une variable réelle continue partout et dérivable nulle part. Considérons la série de
%
fonctions k∈N∗ fk où, pour chaque k ∈ N∗ , fk est l’application de R dans
R définie par
2
sin 2k x
fk (x) =
.
2k
Chaque fk est évidemment continue sur R et telle que
sup |fk (x)| ≤
x∈R
1
.
2k
%
Le test de Weierstrass assure donc la convergence normale de k∈N∗ fk sur
R et la somme F de cette série sera une application continue de R dans R.
D’autre part, on aura, pour tout x ∈ R et tout h /= 0,
∞
∞
$
F (x + h) − F (x)
sin 2k (x + h) − sin 2k x $
gk (x, h),
=
=
h
2k h
k=1
k=1
2
2
et dès lors, par le théorème de Lagrange, on aura, pour tout k ∈ N∗ , tout
x ∈ R et tout h /= 0,
2
|gk (x, h)| ≤ 2k −k = ak .
Comme ak < 12 ak+1 , on a, pour tout entier m ≥ 2,
m−1
$
ak < am−1
k=1
1 − (1/2)m−1
2
2
< 2am−1 = 2(m−1) −(m−1)+1 = 2m −3m+3 .
1 − (1/2)
Donnons à h les quatre suites suivantes de valeurs tendant vers zéro lorsque
m tend vers l’infini
h1,m =
π
π
3π
3π
, h2,m = − m2 +1 , h3,m = m2 +1 , h4,m = − m2 +1 .
2
2m +1
2
2
2
452
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
2
Pour chaque m ∈ N∗ fixé, et chaque 1 ≤ j ≤ 4, 2k hj,m sera un multiple de
2π lorsque k > m, et dès lors gk (x, hj,m ) = 0. Pour k = m, on a, en posant
2
xk = 2k x,
4
gm (x, h1,m) = sin xm +
4
π
2
gm (x, h3,m) = sin xm +
3π
2
4
gm (x, h4,m) = sin xm −
5
5
gm (x, h2,m) = sin xm −
4
Comme
π
2
− sin xm = − cos xm − sin xm ,
5
3π
2
− sin xm = cos xm − sin xm ,
− sin xm = − cos xm − sin xm ,
5
− sin xm = cos xm − sin xm .
(cos xm − sin xm )2 + (cos xm + sin xm )2 = 2,
la valeur absolue d’un des termes au moins est supérieure ou égale à un, et
dès lors, pour les deux termes correspondants gm (x, hj,m), (avec j = 1, 4 ou
j = 2, 3), on aura
|gm(x, hj,m )| ≥
1
2m
3π
2
2m +1
=
2 −m+1
2m
3π
.
En outre les termes correspondants seront de signe contraire. En résumé, on
aura donc
#
#
2
# F (x + h ) − F (x) #
2
2m −m+1
#
#
j,m
− 2m −3m+3 .
#
#>
#
#
hj,m
3π
Comme le membre de droite tend vers l’infini avec m, on pourra donc toujours trouver une suite (hjm ,m )m∈N∗ tendant vers zéro telle que la suite correspondante
#'
&#
# F (x + h
#
#
jm ,m ) − F (x) #
,
#
#
#
#
hjm ,m
m∈N∗
tende vers l’infini, et de telle sorte que pour chaque m le quotient différentiel
ait un signe choisi d’avance. En conséquence, la fonction F ainsi construite
n’a de dérivée (ni même de dérivée au sens large) en aucun point de R. On
notera que chaque somme partielle de la suite dont F est la limite est de
classe C ∞ !
453
12.5. SOMME D’UNE SÉRIE ENTIÈRE
Jusqu’à la moitié du XIXe siècle, les mathématiciens pensaient qu’une
fonction continue admet une dérivée sauf en quelques point exceptionnels.
Après un exemple partiellement discuté par Bernard Bolzano en 1830, et
un travail non publié de Charles Cellérier, le premier traitement rigoureux
d’un exemple de fonction continue non dérivable fut publié par Karl Weierstrass en 1872; il s’agit de la somme de la série trigonométrique
F (x) =
∞
$
ak cos(bk πx),
k=0
où b est un entier impair et a un réel tel que 0 < a < 1 et ab > 1 + (3/2)π.
Godefrey Harold Hardy a d’ailleurs montré en 1916 que la dernière condition pouvait être remplacée par ab ≥ 1. De nombreux autres exemples
ont alors été proposés. Le graphe de telles fonctions constitue un ensemble fractal dans la terminologie de Benoı̂t Mandelbrot. Après n’avoir été
pendant de nombreuses années que des “monstres mathématiques”, ces ensembles, souvent caractérisés par des propriétés d’auto-similarité quelle que
soit l’échelle à laquelle on les examine, sont depuis quelques années l’objet
d’un intérêt croissant et leur champ d’application aux sciences de la nature
ne cesse d’augmenter. Felix Hausdorff a introduit en 1919 une notion
de dimension qui redonne respectivement, pour les courbes, surfaces ou volumes “réguliers”, les valeurs usuelles un, deux ou trois mais attribue, aux
ensembles fractals, des valeurs non entières! On sait que la dimension de
Hausdorff du graphe de la fonction de Weierstrass est strictement comprise
entre un et deux, mais on ignore toujours sa valeur exacte.
12.5
Somme d’une série entière
%
Soit k∈N ck (z − a)k une série entière, avec z ∈ C, a ∈ C, , ck ∈ C pour
chaque k ∈ N. Si R = 1/C avec
,
8
C = lim sup |ck |
q→∞
k≥q
1/k
9
-
,
désigne le rayon de convergence de cette série entière, elle convergera absolument sur son disque de convergence B2 (a; R), avec la convention B2 (a; R) =
{a} si R = 0 et B2 (a; R) = C si R = +∞. On peut évidemment con%
sidérer aussi cette série comme une série k∈N fk de fonctions complexes
d’une variable complexe fk définies par fk (z) = ck (z − a)k . On la notera
454
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
%
%
alors k∈N ck (· − a)k . L’exemple de la série géométrique k∈N z k considérée
plus haut montre qu’une série entière peut ne pas converger uniformément
sur son disque de convergence. On va montrer qu’elle converge normalement
sur tout disque fermé centré en a et de rayon strictement inférieur au rayon
de convergence.
Proposition. Soit R le rayon de convergence de la série entière
$
k∈N
ck (z − a)k .
Alors la série de fonctions correspondante converge absolument sur B2 (a; R)
et normalement sur B2 [a; r] pour tout r ∈]0, R[.
Démonstration. La convergence absolue sur B2 (a; R) n’est qu’une reformulation du théorème fondamental de convergence d’une série entière. Soit
r ∈]0, R[; pour chaque k ∈ N, on a
sup
z∈B2 [a;r]
|ck (z − a)k | = |ck |r k .
%
D’autre part, la série numérique k∈N |ck |r k est convergente en vertu du
critère de la racine de Cauchy, puisque
,
8
lim sup |ck |r
q→∞
k≥q
k
91/k
-
,
8
= r lim sup |ck |
q→∞
k≥q
1/k
9
-
=
r
< 1.
R
La thèse résulte alors du test de comparaison de Weierstrass.
Etudions maintenant les propriétés de la somme d’une série entière sur
son disque de convergence, c’est-à-dire les propriétés de l’application F :
B2 (a; R) → C définie par
F (z) =
∞
$
k=0
ck (z − a)k .
Proposition. F est continue sur B2 (a; R).
Démonstration. Notons tout d’abord que chaque terme fk de la série
entière est un polynôme de C dans C et est donc continu sur C. Soit maintenant z ∈ B2 (a; R) fixé et r > 0 tel que |z − a| < r < R. Evidemment,
z ∈ int B2 [a; r] et, puisque la série converge uniformément sur B2 [a; r], sa
somme est continue sur cette boule et en particulier au point z.
455
12.5. SOMME D’UNE SÉRIE ENTIÈRE
Considérant maintenant la série entière comme une série de fonctions de
dans R2 , nous pouvons étudier l’existence des dérivées partielles de sa
somme. Notons tout d’abord que chaque terme fk étant un polynôme sur
C, il sera C-dérivable en chaque point de C et vérifiera les conditions de
Cauchy-Riemann
R2
D1 fk (z) = (1/i)D2fk (z) = fk$ (z) = kck (z − a)k−1
(12.5)
pour chaque z ∈ C et chaque k ∈ N∗ . On notera que le dernier terme de ces
égalités est le terme général de la série dérivée de la série entière de départ.
Proposition. En chaque point z ∈ B2 (a; R), la somme F de la série entière
k
k∈N ck (z − a) possède des dérivées partielles premières qui vérifient les
égalités
%
D1 F (z) = (1/i)D2F (z) =
∞
$
k=1
kck (z − a)k−1 .
Démonstration. Pour appliquer le théorème de dérivabilité de la somme
d’une série de fonctions, il suffit de remarquer que la série entière considérée converge ponctuellement sur B2 (a; R), que chaque terme fk possède en
chaque point z ∈ C des dérivées partielles premières par rapport à toutes les
variables vérifiant les conditions (12.5) et que les séries des dérivées partielles
%
qui sont respectivement égales à la série dérivée de k∈N ck (z − a)k et au
produit de cette série par 1/i ont le même rayon de convergence R que la série
%
k
k∈N ck (z − a) et convergent donc normalement sur B2 [a; r] quel que soit
r ∈]0, R[. Dès lors, pour obtenir la dérivabilité partielle de F en z ∈ B2 (a; R),
%
il suffit d’appliquer le théorème général à la série k∈N ck (z −a)k sur l’ouvert
B2 (a, r) où r ∈]0, R[ est tel que |z − a| < r. On a aussitôt
D1 F (z) =
∞
$
D1 fk (z) =
k=1
=
∞
$
(1/i)D2fk (z) = (1/i)D2
k=1
et la démonstration est complète.
∞
$
k=1
,
∞
$
k=1
kck (z − a)k−1
-
fk (z) = (1/i)D2F (z),
Corollaire. En chaque point z ∈ B2 (a; R), la somme F de la série entière
%
k
C-dérivable et sa C-dérivée F $ (z) est égale à la valeur en z
k∈N ck (z−a) est%
k−1 . La fonction F est dès lors indéfiniment
de la série dérivée ∞
k=1 kck (z−a)
456
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
C-dérivable et, pour chaque j ∈ N∗ , on a
F (j) (z) =
∞
$
k=j
k(k − 1) . . .(k − j + 1)ck (z − a)k−j .
Démonstration. C’est une conséquence immédiate de la Proposition
précédente, de la condition nécessaire et suffisante de C-dérivabilité de Fréchet-Young et du fait que le rayon de convergence reste le même quand on
passe d’une série entière à sa série dérivée.
Ainsi, la fonction exponentielle exp de C dans C définie pour chaque
z ∈ C comme somme de la série exponentielle de z est C-dérivable en chaque
point z de C et (exp)$ (z) = exp z. De même, la fonction sinus (resp. cosinus)
sin (resp. cos) de C dans C définie en chaque z ∈ C par la somme de la série
sinus (resp. cosinus) est C-dérivable en chaque z ∈ C et (sin)$ (z) = cos z
(resp. (cos)$ (z) = − sin z). Si α, β et γ sont des nombres complexes et si γ
n’est pas un entier strictement négatif, la somme de la série hypergéométrique
1+
$ α(α + 1) . . . (α + k − 1)β(β + 1) . . .(β + k − 1)
k∈N∗
k!γ(γ + 1) . . .(γ + k − 1)
zk ,
définit sur son disque de convergence B2 (0; 1) une fonction indéfiniment Cdérivable que l’on appelle la fonction hypergéométrique et dont la valeur en
z ∈ B2 (0; 1) est notée F (α, β; γ; z).
Désignons par C(a; R) la frontière du disque B2 (a; R), c’est-à-dire l’ensemble {z ∈ C : |z − a| = R}. Le résultat suivant, qui porte le nom de
théorème d’Abel, fournit des compléments d’information sur la convergence d’une série entière et sur la régularité de sa somme lorsqu’il y a convergence en un point de C(a; R).
%
Proposition. Si la série entière k∈N ck (z − a)k possède un rayon de con%
vergence R > 0 et s’il existe u ∈ C(a; R) tel que la série k∈N ck (u − a)k
%
converge, alors la série k∈N ck (.−a)k converge uniformément sur l’ensemble
[a, u] = {a + t(u − a) : t ∈ [0, 1]}
et, si F désigne sa somme sur B2 (a; R), alors
lim
z→u,z∈[a,u]\{u}
F (z) =
∞
$
k=0
ck (u − a)k .
Démonstration. Pour démontrer la convergence uniforme de la série sur
[a, u], on utilise le critère de Cauchy et la transformation d’Abel. Si nous
457
12.5. SOMME D’UNE SÉRIE ENTIÈRE
%
posons, pour chaque q ∈ N, Sq = qk=0 ck (u − a)k , alors, en notant que
ck (u − a)k = Sk − Sk−1 pour k ≥ 1, nous obtenons, pour tout r > q ≥ 0,
r
$
k=q+1
=
r
$
ck [a + t(u − a) − a]k =
k=q+1
=
r
$
k=q+1
=
r−1
$
k=q+1
=
r−1
$
k=q+1
tk (Sk − Sk−1 ) =
tk Sk −
r−1
$
tk+1 Sk =
k=q
(Sk − Sq )(tk − tk+1 ) +
r−1
$
k=q+1
k=q+1
r−1
$
k=q+1
(Sk − Sq )(tk − tk+1 ) +
=
r
$
r−1
$
k=q+1
k=q+1
ck tk (u − a)k
tk Sk −
r
$
tk Sk−1
k=q+1
Sk (tk − tk+1 ) + Sr tr − Sq tq+1
k=q+1
r−1
$
r
$
Sq (tk − tk+1 ) + Sr tr − Sq tq+1
Sq tk −
r−1
$
k=q+1
Sq tk+1 + Sr tr − Sq tq+1
(Sk − Sq )(tk − tk+1 ) + (Sr − Sq )tr .
%
Par hypothèse, la suite (Sq )q∈N des sommes partielles de k∈N ck (u − a)k
converge et est donc de Cauchy; pour ! > 0 donné, il existe donc m ∈ N ne
dépendant que d’! tel que
|Sk − Sq | ≤ !/2
si k ≥ q ≥ m. Dès lors, en introduisant cette inégalité dans l’égalité ci-dessus
et en notant que 0 ≤ tk − tk+1 = tk (1 − t) ≤ 1 et 0 ≤ tr ≤ 1, on obtient
#
#
# r
#
r−1
$
# $
#
k#
#
ck [a + t(u − a) − a] # ≤
|Sk − Sq |(tk − tk+1 ) + |Sr − Sq |tr
#
#k=q+1
# k=q+1
≤ (!/2)
r−1
$
k=q+1
(tk − tk+1 ) + (!/2) = (!/2)(tq+1 − tr ) + (!/2)
= (!/2)[tq+1 (1 − tr−q−1 ) + 1] ≤ !.
458
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
En conséquence, il existe m ∈ N tel que, pour tout r > q ≥ m et tout
z ∈ [a, u], on ait
#
#
# $
#
# r
#
k#
#
c
(z
−
a)
k
#
# ≤ !,
#k=q+1
#
ce qui implique la convergence uniforme de la série entière sur [a, u]. La
restriction à [a, u] de chaque terme de la série y étant continue, l’application
%
G définie sur [a, u] par G(z) = k∈N ck (z − a)k sera continue sur [a, u]. Mais
comme [a, u] \ {u} ⊂ B2 (a; R), on a nécessairement G(z) = F (z) pour tout
z ∈ [a, u] \ {u}, et dès lors
∞
$
k=0
ck (u − a)k = G(u) =
lim
z→u,z∈[a,u]\{u}
G(z) =
lim
z→u,z∈[a,u]
G(z) =
lim
z→u,z∈[a,u]\{u}
F (z),
et la démonstration est complète.
12.6
Equations différentielles linéaires
Les propriétés des séries entières permettent de rechercher des solutions de
certaines équations différentielles linéaires à coefficients variables. A titre
d’exemple, considérons l’équation différentielle d’Hermite
y $$ (z) − 2zy $ (z) + 2νy(z) = 0,
où ν est un nombre réel, et voyons si elle possède des solutions qui peuvent
s’écrire comme somme d’une série entière dont le disque de convergence n’est
pas réduit à un point. Si
y(z) =
∞
$
ck z k
k=0
est une telle solution, alors on aura, par les résultats de la section précédente,
y $ (z) =
∞
$
kck z k−1 , y $$ (z) =
k=1
∞
$
k=2
(k − 1)kck z k−2 ,
et, en introduisant ces expressions dans l’équation on obtient
∞
$
k=2
(k − 1)kck z k−2 − 2
∞
$
k=1
kck z k + 2ν
∞
$
k=0
ck z k = 0,
459
12.6. EQUATIONS DIFFÉRENTIELLES LINÉAIRES
c’est-à-dire, en regroupant les coefficients des termes de même puissance de
z,
2(c2 + νc0 ) +
∞
$
k=1
[(k + 1)(k + 2)ck+2 − 2(k − ν)ck ]z k = 0.
Cette relation sera évidemment satisfaite si les ck sont tels que
(k + 1)(k + 2)ck+2 = 2(k − ν)ck , (k ∈ N).
Partant d’un c0 arbitraire et résolvant de proche en proche, on obtient
c2k =
2k (−ν)(2 − ν)(4 − ν) . . . (2k − 2 − ν)
c0 , (k ∈ N∗ )
(2k)!
et
c2k+1 =
2k (1 − ν)(3 − ν) . . . (2k − 1 − ν)
c1 , (k ∈ N∗ ).
(2k + 1)!
Posant u = z 2 , il est facile de voir que ces deux séries convergent pour tout
z ∈ C. Par conséquent, les calculs précédents sont justifiés pour ces séries et
chaque fonction de la forme cj yj où cj ∈ C est arbitraire et, j = 1, 2, y1 est
la somme de la série entière
y1 (z) = 1 +
∞ k
$
2 (−ν)(2 − ν)(4 − ν) . . . (2k − 2 − ν)
k=1
(2k)!
z 2k
et y2 est la somme de la série entière
y2 (z) = 1 +
∞ k
$
2 (1 − ν)(3 − ν) . . . (2k − 1 − ν)
k=1
(2k + 1)!
z 2k+1 ,
est une solution de l’équation différentielle donnée définie sur C. Il en est
dès lors de même pour c1 y1 + c2 y2 . Lorsque ν est un entier positif, il est
immédiat que l’une des fonctions yj se réduit à un polynôme en z, que l’on
appelle polynôme d’Hermite et qui joue un grand rôle en analyse.
La méthode peut encore fournir des solutions de ce type pour des équations différentielles linéaires singulières en 0, c’est-à-dire dont le coefficient
de la dérivée d’ordre le plus élevé s’annule en z = 0. Par exemple, si a et b
sont des nombres complexes tels que a ne soit pas nul et b ne soit pas égal à
un entier négatif, considérons l’équation différentielle
zy $$ (z) + (b − z)y $ (z) − ay(z) = 0
460
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
et recherchons ses solutions pouvant s’écrire sous la forme de la somme d’une
série entière
y(z) =
∞
$
ck z k .
k=0
Procédant comme ci-dessus, on trouve, en introduisant cette expression dans
l’équation différentielle et en regroupant les coefficients des mêmes puissances
de z que l’on doit avoir
∞
$
k=0
[(k + 1)(k + b)ck+1 − (k + a)ck ]z k = 0,
ce qui sera le cas si les coefficients ck vérifient les relations
ck+1 =
a+k
ck , k ∈ N,
(b + k)(k + 1)
qui fournissent aisément l’expression
ck =
(a + k − 1)(a + k − 2) . . .a
c 0 , k ∈ N∗ .
k!(b + k − 1)(b + k − 2) . . . b
On vérifie aisément que la série entière
$ (a + k − 1)(a + k − 2) . . .a
k!(b + k − 1)(b + k − 2) . . . b
k∈N
zk
a un disque de convergence égal à C et dès lors sa somme, que l’on appelle
la fonction hypergéométrique confluente de Kummer et que l’on désigne par
M (a, b; z) est telle que, pour chaque c ∈ C, cM (a, b; ·) est une solution sur
C de l’équation différentielle donnée.
On peut montrer de la même manière que, pour chaque n ∈ N fixé,
l’équation différentielle de Bessel
z 2 y $$ (z) + zy $ (z) + (z 2 − n2 )y(z) = 0
possède les solutions cy où c ∈ C est arbitraire et y est la somme de la série
entière
$
(−1)k
z n+2k ,
n+2k k!(n + k)!
2
k∈N
dont le disque de convergence est égal à C. La fonction définie par la somme
de cette série entière s’appelle la fonction de Bessel d’ordre n et se note Jn .
On vérifiera aisément qu’on a la relation
J0$ (z) = −J1 (z).
461
12.7. SOMME D’UNE SÉRIE TRIGONOMÉTRIQUE
Les fonctions de Bessel jouent un grand rôle en analyse et dans ses applications à la physique.
Une équation différentielle linéaire importante est l’équation hypergéométrique de Gauss
z(1 − z)y $$ (z) + [γ − (α + β + 1)z]y $ (z) − αβy(z) = 0
où α, β et γ sont des nombres complexes. La méthode que nous venons de
développer permet de montrer que si γ n’est pas un entier négatif, la somme
F (α, β; γ; z) de la série hypergéométrique
1+
$ α(α + 1) . . . (α + k − 1)β(β + 1) . . .(β + k − 1)
k!γ(γ + 1) . . .(γ + k − 1)
k∈N∗
zk ,
est solution, sur son disque de convergence B2 (0, 1), de l’équation hypergéométrique de Gauss. En fait, pour des valeurs particulières de α, β et γ, la
série hypergéométrique fournit comme cas particulier ou comme cas limite
la plupart des fonctions élémentaires et de nombreuses fonctions transcendantes comme par exemple les fonctions de Bessel et les fonctions de Kummer considérées plus haut. Carl-Friedrich Gauss a démontré l’importante
formule
F (α, β, γ; 1) =
Γ(γ)Γ(γ − α − β)
, si 8(γ − α − β) > 0,
Γ(γ − α)Γ(γ − β)
reliant la valeur de la somme de la série hypergéométrique au point 1 de la
frontière de son disque de convergence à la fonction Γ.
12.7
Somme d’une série trigonométrique
On a vu précédemment qu’une série trigonométrique est une série de la forme
$
(ak cos kx + bk sin kx)
k∈N
où x ∈ R et les ak et bk sont des nombres réels. Bien entendu, une série
trigonométrique peut également s’écrire sous la forme complexe
$
[c−k exp(−ikx) + ck exp ikx]
k∈N
avec
c−k = (1/2)(ak + ibk ) = ck , k ∈ N,
462
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
ce qui conduit aussi à considérer les séries trigonométriques complexes quelconques
$
[c−k exp(−ikx) + ck exp ikx]
k∈N
où les c−k et ck sont des nombres complexes arbitraires. On a vu que
de telles séries trigonométriques apparaissaient lorsqu’on étudiait la convergence d’une série entière sur la frontière de son disque de convergence.
Une série trigonométrique peut évidemment être considérée comme une série
%
de fonctions k∈N fk où les fonctions fk définies par
fk (x) = c−k exp(−ikx) + ck exp ikx
sont indéfiniment dérivables et 2π-périodiques sur R, c’est-à-dire telles que
fk (x + 2π) = fk (x)
pour tout x ∈ R. On ne dispose pas, comme pour les séries entières, de
résultat général pour la convergence uniforme des séries trigonométriques.
Toutefois, les résultats généraux sur la continuité et la dérivabilité des sommes de séries de fonctions fournissent les conditions suffisantes suivantes.
%
Proposition. Si la série numérique k∈N(|ak | + |bk |) (resp.
|ck |) converge, alors la série de fonctions
$
%
k∈N (|c−k |
+
[ak cos(k·) + bk sin(k·)]
k∈N
(resp.
$
k∈N
[c−k exp(−ik·) + ck exp(ik·)])
converge normalement sur R et sa somme est une fonction continue et 2πpériodique sur R.
Démonstration. Si nous considérons, pour fixer les idées, le premier cas,
l’autre se traitant de même, nous voyons que, pour chaque k ∈ N et chaque
x ∈ R, on a
|fk (x)| = |ak cos kx + bk sin kx| ≤ |ak | + |bk |,
et la convergence normale sur R découle de l’hypothèse et du test de comparaison de Weierstrass. Comme la convergence normale entraı̂ne la convergence uniforme sur R de la série et que chaque fk est continue sur R, sa
somme sera également continue sur R. Enfin, la convergence ponctuelle sur
R et les égalités Fq (x + 2π) = Fq (x) valables pour chaque x ∈ R et chaque
somme partielle Fq entrainent la propriété de 2π-périodicité pour la somme
de la série.
463
12.7. SOMME D’UNE SÉRIE TRIGONOMÉTRIQUE
Exemple. Pour chaque réel s > 1, la série trigonométrique
$
k−s [cos(k·) + sin(k·)]
k∈N∗
converge normalement sur R vers une fonction continue et 2π-périodique.
On a la condition suffisante suivante de dérivabilité de la somme d’une
série trigonométrique.
Proposition. S’il existe un entier m ≥ 1 tel que la série numérique
$
k∈N
(resp.
$
k∈N
km (|ak | + |bk |)
km (|c−k | + |ck |))
converge, alors la somme F de la série trigonométrique
$
[ak cos(k·) + bk sin(k·)]
k∈N
(resp.
$
k∈N
[c−k exp(−ik·) + ck exp(ik·)])
est m-fois continûment dérivable sur R et, pour chaque x ∈ R, et chaque
1 ≤ j ≤ m, la dérivée j-ème s’obtient en dérivant j fois sous le signe somme.
Démonstration. Il est aisé de voir que le résultat pour m ≥ 2 découle
aisément, par récurrence, du résultat pour m = 1 et il suffit de démontrer ce
dernier. Nous le ferons dans le cas d’une série trigonométrique réelle. Pour
chaque k ∈ N, et chaque x ∈ R, on a
|fk$ (x)| = | − kak sin kx + kbk cos kx| ≤ k(|ak | + |bk |),
et un argument semblable à celui de la Proposition précédente montre que la
%
série k∈N fk$ converge normalement sur R et que sa somme est une fonction
continue. D’ailleurs, comme
|ak | + |bk | ≤ k(|ak | + |bk |)
%
pour tout k ∈ N , la Proposition précédente montre que la série k∈N fk
converge aussi normalement sur R. Les conditions du théorème de dérivabilité de la somme d’une série de fonctions sont donc satisfaites. Donc F est
dérivable sur R et
∗
F $ (x) =
∞
$
k=0
fk$ (x),
464
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
ce qui montre que F est continûment dérivable et achève la démonstration.
Exemple. Si s > 2, la somme de la série trigonométrique
$
k−s [cos(k·) + sin(k·)]
k∈N∗
est m-fois continûment dérivable sur R, où m désigne la partie entière de
s − 1.
12.8
Convergence monotone
Soit (fk )k∈N une suite de fonctions réelles définies sur E ⊂ Rn .
Définition. On dit que (fk )k∈N est une suite croissante (resp. décroissante)
sur E de fonctions réelles si, pour chaque x ∈ E, la suite réelle (fk (x))k∈N est
croissante (resp. décroissante), c’est-à-dire si, pour chaque x ∈ E et chaque
k ∈ N, on a
fk+1 (x) ≥ fk (x). (resp. fk+1 (x) ≤ fk (x)).
Une suite de fonctions réelles sur E qui est croissante ou qui est décroissante est appelée une suite monotone sur E de fonctions réelles. Bien
entendu, (fk )k∈N est croissante si et seulement si (−fk )k∈N est décroissante.
Définition. On dit que (fk )k∈N est une suite majorée (resp. minorée) sur
E de fonctions réelles s’il existe une application g de E dans R telle que,
pour chaque k ∈ N et chaque x ∈ E, on ait
fk (x) ≤ g(x). (resp. fk (x) ≥ g(x)).
Il est clair que (fk )k∈N est minorée sur E si et seulement si (−fk )k∈N est
majorée sur E et que (fk )k∈N est majorée (resp. minorée) sur E si et seulement si la suite réelle (fk (x))k∈N est majorée (resp. minorée) pour chaque
x ∈ E. En combinant cette remarque à la condition nécessaire et suffisante
de convergence d’une suite réelle monotone, on obtient immédiatement un
critère de convergence ponctuelle d’une suite monotone de fonctions réelles.
Proposition. Une suite croissante (resp. décroissante) sur E de fonctions
réelles converge ponctuellement sur E si et seulement si elle est majorée
(resp. minorée) sur E.
On a vu plus haut que la convergence uniforme sur un ensemble était
une condition suffisante pour que la continuité des fonctions de la suite se
12.8. CONVERGENCE MONOTONE
465
transmette à la fonction limite. L’exemple de la suite (fk )k∈N de fonctions
continues définies par
1
fk (x) =
1 + (x − k)2
qui converge ponctuellement (mais non uniformément) sur R vers la fonction
continue zéro montre que la convergence uniforme n’est pas nécessaire pour
que la limite soit continue. Le théorème de Dini ou théorème de convergence monotone pour les fonctions continues montre que lorsque
E est fermé borné et que la suite est monotone, la convergence uniforme
est une condition nécessaire et suffisante pour que la limite d’une suite de
fonctions continues sur E soit continue sur E.
Théorème. Soit E ⊂ Rn un fermé borné, (fk )k∈N une suite de fonctions
réelles définies sur E et f une application de E dans R vérifiant les conditions
suivantes.
1. La suite (fk )k∈N converge ponctuellement sur E vers f .
2. Chaque fonction fk est continue sur E.
3. La suite (fk )k∈N est monotone sur E.
Alors f est continue sur E si et seulement si (fk )k∈N converge uniformément
sur E vers f .
Démonstration. Condition suffisante. C’est une conséquence immédiate
de la préservation de la continuité par la convergence uniforme.
Condition nécessaire. On peut, sans perte de généralité, supposer que
(fk )k∈N est croissante. On a donc fq (x) ≥ fk (x), pour chaque entier q ≥
k et chaque x ∈ E, ce qui entraı̂ne, en faisant tendre q vers l’infini, que
f (x) ≥ fk (x) pour chaque entier k ∈ N et chaque x ∈ E. Si ! > 0 est donné,
l’hypothèse 1 entraı̂ne que
(∀x ∈ E)(∃m ∈ N)(∀k ∈ N : k ≥ m) : 0 ≤ f (x) − fk (x) ≤ !/2.
(12.6)
Pour chaque x ∈ E, désignons par m(x) le plus petit entier positif m pour
lequel la condition (12.6) est satisfaite.
L’hypothèse 2, la continuité de f sur E, le caractère fermé borné de E et
le théorème de Heine entraı̂nent la continuité uniforme de chaque fonction
f − fk sur E. En conséquence,
(∀k ∈ N)(∃δk > 0)(∀x ∈ E)(∀y ∈ E : |y − x|∞ ≤ δk ) :
0 ≤ f (y) − fk (y) ≤ f (x) − fk (x) + !/2.
Si nous définissons la jauge δ sur E par la relation
δ(x) = δm(x) , x ∈ E,
(12.7)
466
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
A
le théorème de Cousin entraı̂ne l’existence d’une division (xj , E j )
telle que
q
>
j=1
B
(1≤j≤q)
E j = E, xj ∈ E j ⊂ B∞ [xj ; δ(xj )] = B∞ [xj ; δm(xj ) ], 1 ≤ j ≤ q.
Posons
m = max m(xj ),
1≤j≤q
et soit y ∈ E. Il existe donc un entier j compris entre 1 et q tel que y ∈ E j et
donc tel que y ∈ B∞ [xj ; δm(xj ) ]. En conséquence, en utilisant (12.6), (12.7)
et la croissance de (fk )k∈N , on trouve, pour tout k ≥ m,
0 ≤ f (y) − fk (y) ≤ f (y) − fm(xj ) (y) ≤ f (xj ) − fm(xj ) (xj ) + !/2
≤ !/2 + !/2 = !,
et la démonstration est complète.
%
En se rappelant que la suite des sommes partielles d’une série k∈N fk de
fonctions fk positives sur un ensemble E dès que k ≥ 1 est nécessairement
croissante sur E, on a évidemment une formulation du théorème de Dini
pour ce type de séries.
%
Corollaire. Soit E ⊂ Rn un fermé borné, k∈N fk une série de fonctions
définies sur E et F une application de E dans R vérifiant les conditions
suivantes.
%
1. La série k∈N fk converge ponctuellement sur E vers F .
2. Chaque fonction fk est continue sur E.
3. fk est positive sur E pour chaque k ≥ 1.
%
Alors F est continue sur E si et seulement si k∈N fk converge uniformément
sur E vers F .
On possède, pour une suite monotone de fonctions intégrables, un théorème dont la forme est analogue à celle du théorème de Dini. C’est l’important
théorème de Levi ou théorème de convergence monotone pour les
fonctions intégrables.
Théorème. Soit I ⊂ Rn un semi-pavé, (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R vérifiant les conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
¯
2. Chaque fonction fk est intégrable sur I.
467
12.8. CONVERGENCE MONOTONE
¯
3. La suite (fk )k∈N est monotone sur I.
H
¯
Alors f est intégrable sur I si et seulement si la suite réelle ( I¯ fk )k∈N converge, auquel cas l’on a
J
I¯
c’est-à-dire
J
f = lim
J
k→∞ I¯
fk ,
lim fk = lim
I¯ k→∞
J
k→∞ I¯
fk .
Démonstration. Sans perte de généralité, on peut supposer que la suite
¯ auquel cas on a évidemment
(fk )k∈N est croissante sur I,
fk (x) ≤ fk+1 (x) ≤ f (x)
¯
pour chaque k ∈ N et chaque x ∈ I.
¯ l’inégalité ci-dessus enCondition nécessaire. Si f est intégrable sur I,
traı̂ne aussitôt que
J
I¯
H
fk ≤
J
I¯
fk+1 ≤
J
I¯
f.
Dès lors, la suite réelle ( I¯ fk )k∈N , croissante et majorée, est convergente.
H
Condition suffisante. Par hypothèse, la suite réelle ( I¯ fk )k∈N est croissante et convergente, et nous poserons
J = lim
J
k→∞ I¯
fk .
Il faut donc démontrer que f est intégrable sur I¯ et que son intégrale vaut
J. En d’autres termes, ! > 0 étant donné, il faut construire une jauge δ sur
I¯ pour laquelle la définition d’intégrabilité sur I¯ est satisfaite pour f .
Soit donc ! > 0 donné. Il existera un entier naturel q1 tel que, pour tout
entier k ≥ q1 , on ait
0≤J−
J
I¯
fk ≤ !/3.
D’autre part, puisque la suite (fk )k∈N converge ponctuellement sur I¯ vers f ,
on aura
¯
(∀x ∈ I)(∃q(x)
∈ N, q(x) ≥ q1 )(∀k ∈ N : k ≥ q(x)) :
!
|fk (x) − f (x)| ≤
.
3µ(I)
(12.8)
468
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
Si maintenant Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition quelconque
de I, on aura
#
#
#m
#
#$
#
j
j
j
|S(I, f, Π) − J| ≤ ## [f (x ) − fq(xj ) (x )]µ(I )##
#j=1
#
#
#
# #
#m 2
#
3# # $
J
m J
#$
#
#
#
+ ##
fq(xj ) (xj )µ(I j ) −
fq(xj ) ## + ##
fq(xj ) − J ## .
I¯j
#j=1
#
# #j=1 I¯j
Comme
#
#
#$
# $
m
#m
#
j
j
j
# [f (x ) − f j (x )]µ(I )# ≤
|f (xj ) − fq(xj ) (xj )|µ(I j )
q(x )
#
#
#j=1
# j=1
≤
et que, si
m
! $
µ(I j ) = !/3
3µ(I) j=1
r = min q(xj ), s = max q(xj ),
1≤j≤m
1≤j≤m
on a q1 ≤ r ≤ s et donc, en utilisant la croissance de (fk )k∈N,
0≤J−
≤J−
on obtient
m J
$
¯j
j=1 I
J
I¯
fs = J −
fq(xj ) ≤ J −
m J
$
¯j
j=1 I
m J
$
¯j
j=1 I
fs
fr = J −
J
I¯
fr ≤ !/3,
#
#
#m 2
3#
J
#$
#
|S(I, f, Π) − J| ≤ 2!/3 + ##
fq(xj ) (xj )µ(I j ) −
fq(xj ) ## .
I¯j
#j=1
#
Il nous reste maintenant à construire une jauge δ sur I¯ telle que le dernier
terme de l’inégalité soit majoré par !/3 lorsque la P-partition Π est δ-fine.
Pour ce faire, notons que si nous groupons dans la somme ci-dessus les termes
pour lesquels les q(xj ) sont égaux à une même valeur k, nous obtenons,
#
#
#m 2
3#
J
#$
#
#
fq(xj ) (xj )µ(I j ) −
fq(xj ) ##
#
j
¯
I
#j=1
#
469
12.8. CONVERGENCE MONOTONE
#

#
# s 
2
3#
J
$
#$
#
= ##
fk (xj )µ(I j ) −
fk ##


j
I¯
#k=r {1≤j≤m : q(xj )=k}
#
#
#
2
3#
J
s ##
$
$
#
#
≤
fk (xj )µ(I j ) −
fk ## .
#
j
¯
I
#
k=r #{1≤j≤m : q(xj )=k}
Puisque chaque somme partielle regroupe tous les indices q(xj ) ayant la
même valeur k, on peut lui appliquer le lemme de Saks-Henstock relatif à la
¯ il existera
fonction fk . Comme, pour chaque k ∈ N, fk est intégrable sur I,
une jauge ηk sur I¯ telle que
#
#
J
#
#
#S(I, fk , Πk ) − fk # ≤ 1
#
¯ #
2k
I
pour toute P-partition ηk -fine Πk de I. Choisissons un entier positif q2 tel
que
l
$
1
≤ !/3
2j
j=k
dès que l ≥ k ≥ q2 . C’est toujours possible en vertu du critère de Cauchy
%
appliqué à la série géométrique convergente k∈N (1/2)k. Choisissons main¯ le plus petit entier q(x) ≥ max(q1 , q2 ) qui vérifie
tenant, pour chaque x ∈ I,
la relation (12.8) et définissons la jauge δ sur I¯ par la relation
¯
δ(x) = ηq(x)(x), x ∈ I.
Si la P-partition Π = {(x1 , I 1), . . . , (xm, I m)} est δ-fine, alors chaque famille
{(xj , I j ) : q(xj ) = k, 1 ≤ j ≤ m} sera telle que
I j ⊂ B∞ [xj ; δ(xj )] = B∞ [xj ; ηq(xj ) (xj )] = B∞ [xj ; ηk (xj )],
et, par le lemme de Saks-Henstock, on aura
#
#
#
2
3#
J
$
#
#
j
j
#
fq(xj )(x )µ(I ) −
fq(xj ) ##
#
I¯j
#{1≤j≤m : q(xj )=k}
#
#
#
#
2
3#
J
$
#
#
1
j
j
= ##
fk (x )µ(I ) −
fk ## ≤ k ,
j
¯
2
I
#
#{1≤j≤m : q(xj )=k}
470
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
et par conséquent,
#
#
2
3#
J
s #
$
$
#
#
#
fq(xj ) (xj )µ(I j ) −
fq(xj ) ##
#
I¯j
#
k=r #{1≤j≤m : q(xj )=k}
≤
On aura donc
dès que Π est δ-fine.
s
$
1
k=r
2k
≤ !/3.
|S(I, f, Π) − J| ≤ 2!/3 + !/3 = !,
Le théorème de Levi est vrai pour la L-intégrabilité.
Corollaire. Soit I ⊂ Rn un semi-pavé, (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R vérifiant les conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
¯
2. Chaque fonction fk est L-intégrable sur I.
¯
3. La suite (fk )k∈N est monotone sur I.
H
Alors f est L-intégrable sur I¯ si et seulement si la suite réelle ( I¯ fk )k∈N
converge, auquel cas l’on a
J
I¯
c’est-à-dire
J
f = lim
J
k→∞ I¯
lim fk = lim
I¯ k→∞
fk ,
J
k→∞ I¯
fk .
Démonstration. Supposons pour fixer les idées que (fk )k∈N soit croissante
¯ La condition nécessaire se démontre exactement de la même manière.
sur I.
Pour la condition suffisante, notons tout d’abord que la croissance de la suite
(fk )k∈N entraı̂ne la positivité des fonctions fk − f0 . D’autre part, la suite
(fH k − f0 )k∈N vérifie les conditions 1 àH3 du théorème de Levi et la suite réelle
( I¯(fk − f0 ))k∈N converge vers J − I¯ f0 . Le théorème de Levi appliqué à
cette suite entraı̂ne l’intégrabilité de sa limite f − f0 qui est une fonction
¯ Donc f − f0 est L-intégrable sur I¯ et comme f0 l’est aussi
positive sur I.
par hypothèse, il en est de même de f = (f − f0 ) + f0 .
En remarquant que les sommes partielles d’une série de fonctions fk
intégrables sur I¯ forment une suite croissante de fonctions intégrables sur I¯ si
elles sont positives pour k ≥ 1, on déduit facilement des résultats précédents
un théorème de convergence monotone de Levi pour les séries de
fonctions intégrables positives.
471
12.8. CONVERGENCE MONOTONE
%
Corollaire. Soit I ⊂ Rn un semi-pavé, k∈N fk une série de fonctions
réelles définies sur I¯ et F une application de I¯ dans R vérifiant les conditions suivantes.
%
1. La série k∈N fk converge ponctuellement sur I¯ vers F .
¯
2. Chaque fonction fk est intégrable (resp. L-intégrable) sur I.
3. fk est positive sur I¯ pour chaque k ≥ 1.
Alors F est Hintégrable (resp. L-intégrable) sur I¯ si et seulement si la série
%
réelle k∈N I¯ fk converge, auquel cas l’on a
J
I¯
c’est-à-dire
F =
J $
∞
I¯ k=0
∞ J
$
¯
k=0 I
fk =
fk ,
∞ J
$
¯
k=0 I
fk .
On a également un théorème de convergence monotone de Levi
pour l’intégrabilité sur un intervalle non borné de R.
Corollaire. Soit U un intervalle non borné de R, (fk )k∈N une suite de fonctions réelles définies sur U et f une application de U dans R vérifiant les
conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur U vers f .
2. Chaque fonction fk est intégrable sur U .
3. La suite (fk )k∈N est monotone sur U .
H
Alors f est intégrable sur U si et seulement si la suite réelle ( U fk )k∈N
converge, auquel cas l’on a
J
f = lim
U
c’est-à-dire
J
J
k→∞ U
lim fk = lim
U k→∞
fk ,
J
k→∞ U
fk .
Démonstration. Sans perte de généralité, on peut supposer que la suite
(fk )k∈N est croissante sur U et, en considérant (fk −f0 )k∈N au lieu de (fk )k∈N,
on peut supposer que chaque fonction fk est positive sur U . Enfin, on se
limitera au cas où U = [a, +∞[, les autres se traitant de même. La condition nécessaire se démontre comme dans le cas classique. Pour la condition
suffisante, il faut donc prouver que f Hest intégrable sur [a,H b] pour chaque
b > a et que, si l’on pose J = limk→∞ U fk , alors limb→+∞ ab f = J.
472
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
H
Soit donc b > a;Hla suite réelle ( ab fk )k∈N est croissante et majorée par la
suite convergente ( U fk )k∈N, donc est convergente, et le théorème de Levi
appliqué à la restriction à [a, b] de la suite (fk )k∈N entraı̂ne son intégrabilité
sur [a, b] et la relation
J
b
J
f = lim
b
k→∞ a
a
(12.9)
fk .
Pour chaque k ∈ N, l’intégrale indéfinie de fk est croissante sur U , puisque
fk est positive sur U , et dès lors, pour tout b > a, on a
J
b
J
fk ≤ lim
b
b→+∞ a
a
fk =
J
U
fk ,
ce qui implique, par (12.9), que, pour tout b > a, on a
J
b
a
J
f ≤ lim
k→∞ U
fk = J.
(12.10)
Par conséquent, l’intégrale indéfinie de f , croissante sur U puisque f y est
positive, est majorée, et possède donc une limite inférieure ou égale à J.
Donc f est intégrable sur U et, pour tout b > a, on a
J
b
a
f≤
J
(12.11)
f ≤ J.
U
Il reste à montrer qu’on a en fait l’égalité. Soit ! > 0; comme
fk = lim
&
J − (!/2) ≤ lim
J
J = lim
J
k→∞ U
k→∞
il existera r ∈ N tel que
lim
J
b
b→+∞ a
'
fk ,
b
b→+∞ a
fk ≤ J
dès que k ≥ r. En particulier, il existera c ∈ U tel que, pour tout b ≥ c, on
a
J
b
H
J −! ≤
a
fr ≤ J.
Comme la suite ( ab fk )k∈N est croissante et majorée par J, on aura donc,
pour tout k ≥ r et tout b ≥ c,
J −! ≤
J
a
b
fk ≤ J,
12.9. CONVERGENCE MAJORÉE ET MINORÉE
473
ce qui implique, en faisant tendre k vers l’infini, et en utilisant (12.9), que
J −! ≤
J
a
b
f ≤J
dès que b ≥ c, et la démonstration est complète.
Nous laisserons au lecteur le soin de formuler le résultat correspondant
pour une série de fonctions.
12.9
Convergence majorée et minorée
On a vu dans la section précédente que la convergence ponctuelle sur E d’une
suite monotone sur E de fonctions réelles pouvait se caractériser en termes
de majoration ou de minoration sur E. Nous allons démontrer dans cette
section un important résultat sur la conservation de l’intégrabilité (ou de
la L-intégrabilité) de la limite d’une suite de fonctions intégrables qui n’est
plus nécessairement monotone mais est maintenant minorée et majorée sur
E.
La démonstration de ce résultat repose sur le théorème de Levi et sur
une étude préliminaire de la conservation de l’intégrabilité par passage au
maximum ou au minimum de deux fonctions réelles intégrables. Rappelons
que si f et g sont deux fonctions réelles, les fonctions max(f, g) et min(f, g)
sont les fonctions réelles de domaine dom f ∩ dom g définies respectivement
par
max(f, g)(x) = max(f (x), g(x)), min(f, g)(x) = min(f (x), g(x)),
et que l’extension se fait facilement, de proche en proche, à un nombre fini
quelconque de fonctions. On vérifie facilement qu’on a aussi
max(f, g) = (1/2)(f + g + |f − g|), min(f, g) = (1/2)(f + g − |f − g|).
En particulier,
min(f, g) = − max(−f, −g),
et dès lors, si f et g sont intégrables sur un pavé fermé,
min(f, g)
le sera si et seulement si
max(f, g)
474
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
l’est. On ne peut pas espérer que le maximum et le minimum de deux fonctions intégrables mais non L-intégrables sur un pavé fermé soient toujours
intégrables sur ce pavé fermé, puisqu’un tel resultat appliqué à une fonction f intégrable mais non L-intégrable et à la fonction g = 0 entraı̂nerait
l’intégrabilité de |f | = max(f, 0) − min(f, 0). Par contre, ces opérations
préservent toujours la L-intégrabilité.
Proposition. Si I est un semi-pavé de Rn et f et g des fonctions réelles
¯ alors max(f, g) et min(f, g) sont L-intégrables sur I.
¯
L-intégrables sur I,
Démonstration. Par hypothèse, f + g et f − g sont L-intégrables sur I¯
et donc |f − g| l’est aussi. La thèse résulte alors des formules ci-dessus.
On en déduit aisément une condition suffisante pour que l’intégrabilité
soit préservée.
Proposition. Si I est un semi-pavé de Rn et f, g et h sont des fonctions
réelles intégrables sur I¯ telles que f et g soient toutes deux minorées ou
¯ alors max(f, g) et min(f, g) sont intégrables sur I¯ et
majorées par h sur I,
J
I¯
max(f, g) ≥ max
4J
I¯
f,
J
I¯
5 J
g ,
I¯
min(f, g) ≤ min
4J
I¯
f,
J
I¯
5
g .
Démonstration. Par hypothèse, f − h et g − h sont de signe constant et
intégrables sur I¯ et y sont donc L-intégrables. Il en est dès lors de même,
par la proposition précédente, pour max(f − h, g − h) = max(f, g) − h et
min(f − h, g − h) = min(f, g) − h, ce qui entraı̂ne aussitôt l’intégrabilité sur
I¯ de max(f, g) et min(f, g).
Les deux propositions ci-dessus s’étendent immédiatement à un nombre
fini de fonctions et au cas de l’intégrale sur un intervalle non borné.
Définition. Si f est une fonction réelle, on définit la partie positive f + de
f par f + = max(f, 0) et la partie négative f − de f par f − = max(−f, 0) =
− min(f, 0).
En conséquence, f + et f − sont deux fonctions positives telles que
f = f + − f − , |f | = f + + f − , f + = (1/2)(|f | + f ), f − = (1/2)(|f | − f ).
Ces formules fournissent une intéressante caractérisation de la L-intégrabilité pour les fonctions réelles.
475
12.9. CONVERGENCE MAJORÉE ET MINORÉE
Proposition. Soit I un semi-pavé de Rn et f une fonction réelle définie sur
¯ Alors f est L-intégrable sur I¯ si et seulement si f + et f − sont intégrables
I.
¯
sur I.
Démonstration. Cela résulte des égalités |f | = f + 2f − = 2f + − f et de
la définition de L-intégrabilité.
Corollaire. Soit I un semi-pavé de Rn et f une fonction réelle définie sur
¯ Si f est intégrable sur I¯ et n’est pas L-intégrable sur I,
¯ alors f + et f −
I.
¯
ne sont pas intégrables sur I.
Nous pouvons maintenant énoncer et démontrer l’important théorème
de Lebesgue ou théorème de convergence majorée et minorée pour
les suites de fonctions réelles intégrables.
Théorème. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions
réelles définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
¯
2. Chaque fonction fk est intégrable sur I.
3. Il existe des fonctions réelles g et h intégrables sur I¯ et telles que
g(x) ≤ fk (x) ≤ h(x)
¯
pour chaque k ∈ N et chaque x ∈ I.
Alors f est intégrable sur I¯ et l’on a
J
I¯
c’est-à-dire
J
f = lim
J
k→∞ I¯
lim fk = lim
I¯ k→∞
fk ,
J
k→∞ I¯
fk .
Démonstration. k et q étant des entiers naturels, posons
φk,q = min(fk , fk+1 , . . ., fk+q ), Φk,q = max(fk , fk+1 , . . . , fk+q ).
En vertu des hypothèses 2 et 3 et de la discussion qui précède, φk,q et Φk,q
sont intégrables sur I¯ pour chaque entier naturel k et q et, par construction,
¯
on a, pour tout k, tout q ≥ 1 et tout x ∈ I,
g(x) ≤ φk,q+1 (x) ≤ φk,q (x) ≤ φk+1,q−1 (x) ≤ fk+1 (x)
≤ Φk+1,q−1 (x) ≤ Φk,q (x) ≤ Φk,q+1 (x) ≤ h(x).
(12.12)
476
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
Dès lors, pour chaque k ∈ N fixé, la suite de fonctions réelles (φk,q )q∈N (resp.
¯ et
(Φk,q )q∈N) est décroissante et minorée (resp. croissante et majorée) sur I,
¯
elle converge donc ponctuellement sur I vers une application φk (resp. Φk )
de I¯ dans R. On déduit de (12.12), en faisant tendre q vers l’infini, que l’on
a
g(x) ≤ φk (x) ≤ φk+1 (x) ≤ fk+1 (x) ≤ Φk+1 (x) ≤ Φk (x) ≤ h(x), (12.13)
pour chaque x ∈ I¯ et chaque k ∈ N. D’ailleurs, par intégration sur I¯
des
inégalités (12.12),
on voit que, pour chaque k ∈ N fixé, la suite
réelle
H
H
H
( I¯ φk,q )q∈N (resp. ( I¯ Φk,q )Hq∈N) est décroissante et minorée par I¯ g (resp.
croissante et majorée par I¯ h), et est donc convergente. On peut donc
appliquer le théorème de convergence monotone de Levi aux deux suites
(φk,q )q∈N et (Φk,q )q∈N et en déduire, pour chaque k ∈ N, l’intégrabilité sur I¯
de φk et Φk et les relations
lim
J
q→∞ I¯
φk,q =
J
I¯
φk , lim
J
q→∞ I¯
Φk,q =
J
I¯
Φk .
(12.14)
D’autre part, la relation (12.13) montre que la suite de fonctions (φk )k∈N
(resp. (Φk )k∈N) est croissante et majorée par h (resp. décroissante et minorée
¯ En fait, on a, pour chaque
par g), et donc ponctuellement convergente, sur I.
¯
x ∈ I,
lim φk (x) = lim Φk (x) = lim fk (x) = f (x),
k→∞
k→∞
k→∞
(12.15)
¯ l’hypothèse 1 entraı̂ne l’existence
puisque, si ! > 0 est donné et si x ∈ I,
d’un entier naturel m tel que
f (x) − ! ≤ fk (x) ≤ f (x) + !
si k ≥ m. Par conséquent, pour tout k ≥ m et tout q ∈ N, on a aussi
f (x) − ! ≤ φk,q (x) ≤ fk (x) ≤ Φk,q (x) ≤ f (x) + !,
et dès lors, en faisant tendre q vers l’infini, on a, pour chaque k ≥ m,
f (x) − ! ≤ φk (x) ≤ fk (x) ≤ Φk (x) ≤ f (x) + !,
ce qui prouve (12.15).
Par intégration
sur I¯ des inégalités (12.13), on voit que
H
H
la suite réelle ( I¯ φk )k∈N (resp. ( I¯ Φk )k∈N ) est croissante et majorée (resp.
décroissante et minorée), et donc convergente. En appliquant le théorème
477
12.9. CONVERGENCE MAJORÉE ET MINORÉE
de convergence monotone de Levi aux suites (φk )k∈N et (Φk )k∈N, on voit que
f est intégrable sur I¯ et que, par suite de (12.15),
J
I¯
f = lim
J
k→∞ I¯
J
φk = lim
k→∞ I¯
Φk .
Mais, en intégrant (12.13) sur I¯ et en passant à la limite, on trouve que
J
I¯
f = lim
J
k→∞ I¯
φk ≤ lim
J
k→∞ I¯
fk ≤
J
I¯
Φk =
J
I¯
f,
ce qui achève la démonstration.
Remarque. Le théorème de convergence majorée et minorée de
Lebesgue et sa démonstration restent valables pour l’intégration sur un
intervalle non borné.
Le théorème de convergence majorée et minorée de Lebesgue
est vrai pour la L-intégrabilité, avec une conclusion un peu plus forte.
Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les
conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
¯
2. Chaque fonction fk est L-intégrable sur I.
¯ telles que
3. Il existe deux fonctions réelles g et h L-intégrables sur I,
g(x) ≤ fk (x) ≤ h(x)
¯
pour chaque k ∈ N et chaque x ∈ I.
¯
Alors f est L-intégrable sur I et l’on a
J
I¯
c’est-à-dire
J
f = lim
k→∞ I¯
lim fk = lim
I¯ k→∞
et
J
lim
J
k→∞ I¯
fk ,
J
k→∞ I¯
fk ,
|f − fk | = 0.
¯ En
Démonstration. Par le théorème précédent, f est intégrable sur I.
outre, l’hypothèse 3 entraı̂ne que
g(x) ≤ f (x) ≤ h(x)
478
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
pour tout x ∈ I¯ et dès lors, f − g, positive et intégrable sur I¯ y est Lintégrable. Par conséquent, f = (f − g) + g est également L-intégrable sur
¯ Dès lors, la suite de fonctions (|f − fk |)k∈Nconverge ponctuellement sur I¯
I.
vers zéro et est formée de fonctions L-intégrables sur I¯ telles que
min(g − f, f − h)(x) ≤ |f (x) − fk (x)| ≤ max(h − f, f − g)
¯ avec min(g − f, f − h) et max(h − f, f − g) L-intégrables sur
pour tout x ∈ I,
¯
I. Il suffit de lui appliquer le théorème de convergence majorée et minorée
de Lebesgue pour obtenir la conclusion finale.
Une conséquence de cette version du théorème de Lebesgue est ce que
l’on appelle parfois le théorème de convergence dominée de Lebesgue
pour des suites de fonctions pouvant avoir des valeurs vectorielles.
Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions de
Rn dans Rp définies sur I¯ et f une application de I¯ dans Rp . Supposons
satisfaites les conditions suivantes.
1. La suite (fk )k∈N converge ponctuellement sur I¯ vers f .
¯
2. Chaque fonction fk est L-intégrable sur I.
¯ telle que
3. Il existe une fonction réelle g L-intégrable sur I,
|fk (x)|2 ≤ g(x)
¯
pour chaque k ∈ N et chaque x ∈ I.
¯
Alors f est L-intégrable sur I et l’on a
J
I¯
c’est-à-dire
J
f = lim
J
k→∞ I¯
lim fk = lim
I¯ k→∞
fk ,
J
k→∞ I¯
fk .
Démonstration. Il suffit de passer aux composantes des fk et de f et de
noter que, pour chaque 1 ≤ j ≤ p, la suite des composantes (pj ◦ fk )k∈N et
fj vérifient les conditions du Corollaire précédent, puisqu’on a
|pj ◦ fk (x)| ≤ |fk (x)|2 ≤ g(x),
et dès lors
−g(x) ≤ pj ◦ fk (x) ≤ g(x),
¯ chaque k ∈ N et chaque 1 ≤ j ≤ p.
pour chaque x ∈ I,
12.9. CONVERGENCE MAJORÉE ET MINORÉE
479
Remarque. Un cas particulier important du corollaire précédent est celui
où, dans les hypothèse 3, g est une constante. On l’appelle parfois le
théorème de convergence bornée de Lebesgue.
Le théorème de Lebesgue permet de démontrer que la convergence uniforme préserve l’intégrabilité et la L-intégrabilité.
Corollaire. Soit I un semi-pavé de Rn , (fk )k∈N une suite de fonctions réelles
définies sur I¯ et f une application de I¯ dans R. Supposons satisfaites les
conditions suivantes.
1. La suite (fk )k∈N converge uniformément sur I¯ vers f .
¯
2. Chaque fonction fk est intégrable (resp. L-intégrable) sur I.
¯
Alors f est intégrable (resp. L-intégrable) sur I et l’on a
J
I¯
c’est-à-dire
J
f = lim
J
k→∞ I¯
lim fk = lim
I¯ k→∞
fk ,
J
k→∞ I¯
fk .
Démonstration. Par hypothèse, la suite (fk )k∈N vérifie la condition de
Cauchy de convergence uniforme sur I¯ et il existe donc un entier naturel m
tel que, pour tout entier k ≥ m, on ait
fm (x) − 1 ≤ fk (x) ≤ fm (x) + 1.
Il suffit donc d’appliquer la version correspondante du théorème de convergence minorée et majorée de Lebesgue à la suite (fk )k≥m avec le choix
g = fm − 1 et h = fm + 1.
Enfin, il est facile de déduire des résultats précédents les versions du
théorème de convergence majorée et minorée de Lebesgue pour
une série de fonctions. On obtient en particulier le résultat suivant.
%
Corollaire. Soit I un semi-pavé de Rn ,
k∈N fk une série de fonctions
réelles définies sur I¯ et F une application de I¯ dans R. Supposons satisfaites
les conditions suivantes.
%
1. La série k∈N fk converge ponctuellement sur I¯ vers F .
¯
2. Chaque fonction fk est intégrable sur I.
3. Il existe des fonctions réelles g et h intégrables sur I¯ et telles que
g(x) ≤
q
$
k=0
fk (x) ≤ h(x)
480
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
¯
pour chaque q ∈ N et chaque x ∈ I.
¯
Alors F est intégrable sur I et l’on a
J
I¯
c’est-à-dire
F =
J $
∞
I¯ k=0
12.10
∞ J
$
¯
k=0 I
fk =
fk ,
∞ J
$
¯
k=0 I
fk .
Exercices
1. Soit (fk )k∈N la suite d’applications de R dans R définies par
fk (x) = lim [cos(k!πx)]2j .
j→∞
Montrer que fk (x) = 1 si (k!x) ∈ Z et 0 si (k!x) /∈ Z.
Montrer que (fk )k∈N converge ponctuellement sur R vers la fonction de
Dirichlet. On notera que, si x /∈ Q, k!x /∈ Z, et fk (x) = 0 pour tout k ∈ N;
si x ∈ Q, avec pq comme représentation irréductible, alors k! pq ∈ Z, ce qui
entraı̂ne fk (x) = 1 dès que k ≥ q.
%
z2k+1
2. Montrer que la série entière k∈N∗ (2k+1)(2k−1)
admet 1 comme rayon de
convergence et converge uniformément sur la boule fermée B2 [1].
3. Montrer que l’équation différentielle linéaire
zy $$ (z) − y(z) = 0
admet des solutions sur C de la forme
,
-
∞
$
zk
y(z) = c
,
[(k − 1)!]2 k
k=1
où c est une constante complexe arbitraire.
12.11
Petite anthologie
Convergence ponctuelle et uniforme
%
Lorsque les différents termes de la série
un sont des fonctions d’une
même variable x, continues par rapport à cette variable dans le voisinage
d’une valeur particulière pour laquelle la série est convergente, la somme s
de la série est aussi, dans le voisinage de cette valeur particulière, fonction
continue de x.
481
12.11. PETITE ANTHOLOGIE
Augustin Cauchy, 1821
Où cela est-t-il prouvé que l’on obtient la dérivée d’une série infinie en
prenant la dérivée de chaque terme ?
Niels Henrik Abel, 1839
Si une série convergente de fonctions continues est discontinue au point
x0 , alors, dans le voisinage immédiat de x0 , il y a des valeurs de x pour
lesquelles la série converge aussi lentement que l’on veut.
Philipp Ludwig von Seidel, 1847
On dit ici que la convergence devient infiniment lente si, n étant le
nombre de termes qu’on doit prendre de façon que la somme des termes
négligés soit en valeur absolue plus petite qu’une quantité e donnée, qu’on
peut prendre aussi petite que l’on veut, n croı̂t indéfiniment lorsque x décroı̂t
indéfiniment.
Georges Stokes, 1847
Fonctions continues non dérivables
On peut même dire que le rapport de deux choses homogènes ne dépendant
ni de leur nature, ni de leurs grandeurs absolues, par la définition même du
rapport, la quantité (Dy/Dx) a toujours une limite; et c’est ce que la considération d’une courbe et de sa tangente, dont l’existence n’est pas douteuse,
fait voir d’ailleurs avec la dernière évidence.
Louis Poinsot, 1815
On peut demander si une fonction continue quelconque a une dérivée.
Nous répondrons d’abord qu’en fait nous allons trouver, dans les paragraphes
suivants, les dérivées des principales fonctions; ce qui démontrera leur existence a posteriori. Comme en chaque point une courbe continue a une
tangente bien déterminée, la fonction admet une dérivée.
Joseph Bertrand, 1878
Considérons la fonction donnée par la série suivante
$ sin an x
sin ax sin a2 x sin a3 x
+
+
.
.
.
=
,
+
a
a2
a3
an
dans laquelle a est un entier constant que nous supposerons positif et très
grand. Cette série nous fournira un exemple soit d’une fonction qui n’a jamais de dérivée, soit d’une fonction qui n’a jamais aucune période de croissance ou de décroissance.
f (x) =
482
CHAPITRE 12. SUITES ET SÉRIES DE FONCTIONS
Charles Cellerier, s.d.
Je me détourne avec effroi et horreur de cette plaie lamentable des fonctions continues qui n’ont point de dérivée.
Charles Hermite, 1893
Suites de fonctions intégrables
Si une suite de fonctions sommables, ayant des intégrales, f1 , f2 , f3 , . . .
a une limite f et si |f − fn | reste, quel que soit n, inférieure à un nombre
fixe M , f a une intégrale qui est la limite des intégrales des fonctions fn . Le
cas particulier le plus intéressant de ce théorème, celui où f et les fi sont
des fonctions continues, a déjà été obtenu, à l’aide de considérations toutes
différentes, par Mr. Osgood.
Henri Lebesgue, 1902
Chapitre 13
Fonctions et ensembles
mesurables
13.1
Intégrale sur un borné
Le but de cette section est d’étendre la notion d’intégrale au cas d’un borné
quelconque de Rn . Pour ce faire, nous aurons besoin d’une conséquence du
théorème de Levi, montrant que l’intégrabilité d’une fonction sur un pavé
fermé et la valeur de l’intégrale ne dépendent pas des valeurs prises par la
fonction sur la frontière du pavé.
Lemme. Soit Q =]c1 , d1 ]×. . . ×]cn , dn] un semi-pavé de Rn et g une fonction
de Rn dans Rp définie sur Q̄. Si g(x) = 0 pour tout x ∈ int Q, alors g est
L-intégrable sur Q̄ et
J
J
g = 0,
Q̄
Q̄
|g|2 = 0.
Démonstration. Comme on a
|S(Q, g, Π)|2 ≤ S(Q, |g|2, Π),
A
B
pour toute P-partition Π = (xj , Qj ) 1≤j≤m de Q, il suffit évidemment de
H
montrer que |g|2 est intégrable sur Q̄ et que Q̄ |g|2 = 0.
Démontrons d’abord le résultat sous l’hypothèse supplémentaire que g
soit bornée sur Q̄ et soit M > 0 tel que
|g(x)|2 ≤ M, x ∈ Q̄.
Soit ! > 0 et cherchons à déterminer une jauge constante δ, telle que
S(Q, |g|2, Π) ≤ !,
483
484
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
A
si Π = (xj , Qj )
S(Q, |g|2, Π) =
B
1≤j≤m
est δ-fine. On a, puisque g(x) = 0 pour x ∈ int Q,
$
{1≤j≤m :
xj ∈f r
Q}
|g(xj )|2 µ(Qj ) ≤ M
$
{1≤j≤m :
xj ∈f r
µ(Qj ).
Q}
Mais, comme Π est δ-fine, on a
>
{1≤j≤m :
xj ∈f r
Q}
Qj ⊂ Q̄ \ Qδ ,
où
Qδ = ]c1 + δ, d1 − δ[ × . . . × ]cn + δ, dn − δ[,
avec la convention ]cj + δ, dj − δ[ = ∅ si cj + δ ≥ dj − δ. Dès lors, les Qj étant
mutuellement disjoints, on a
$
{1≤j≤m : xj ∈f r Q}
où
S=2
n
$
µ(Qj ) ≤ 2
6
n
$
k=1
k=1 {1≤i≤n : i(=k}
δ
6
{1≤i≤n : i(=k}
(di − ci ) = 2
(di − ci ) = δS,
n
$
µ(Q)
k=1
dk − ck
est la somme des (n-1)-mesures des faces de Q̄ qui constituent fr Q. En
conséquence,
S(Q, |g|2, Π) ≤ δM S ≤ !,
à condition de prendre δ = !/M S.
Soit maintenant g une fonction quelconque de Rn dans Rp telle que Q̄ ⊂
dom g et g(x) = 0 si x ∈ int Q. Pour chaque k ∈ N, définissons gk par
gk (x) = min(|g(x)|2, k), x ∈ Q̄.
Par construction, la suite de fonctions de Rn dans R+ est croissante sur Q̄,
0 ≤ gk (x) ≤ k pour chaque k ∈ N et chaque x ∈ Q̄, et, si x ∈ int Q, gk (x) =
min{0, k} = 0, k ∈ N. En vertu du résultat de la première partie de la
démonstration appliqué à gk , on voit donc que gk est L-intégrable sur Q̄ et
J
Q̄
gk = 0, k ∈ N.
D’autre part, pour chaque x ∈ Q̄, on a gk (x) = |g(x)|2 dès que k ≥ |g(x)|2,
ce qui montre la convergence ponctuelle de la suite (gk )k∈N vers |g(x)|2 sur
485
13.1. INTÉGRALE SUR UN BORNÉ
Q̄. Le théorème de convergence monotone de Levi entraı̂ne alors que |g|2 est
L-intégrable sur Q̄ et que
J
Q̄
|g|2 = lim
J
k→∞ Q̄
gk = 0,
et la démonstration est complète.
Si f est une fonction de Rn dans Rp et si A ⊂ dom f , nous désignerons
par fA l’application de Rn dans Rp définie par
fA (x) = f (x) si x ∈ A,
fA (x) = 0 si x ∈ Rn \ A.
En particulier, nous appellerons fonction caractéristique de A ⊂ Rn , et nous
désignerons par 1A , l’application de Rn dans R définie par
1A (x) = 1 si x ∈ A,
1A (x) = 0 si x ∈ Rn \ A.
Lemme. Soit I ⊂ Rn un semi-pavé et h une fonction de Rn dans Rp définie
¯ Alors h est intégrable (resp. L-intégrable) sur I¯ si et seulement si h ¯
sur I.
I
est intégrable (resp. L-intégrable) sur J¯ pour tout semi-pavé J ⊂ Rn tel que
I¯ ⊂ J, auquel cas on a
J
J
hI¯
J¯
=
I¯
h.
Démonstration. Soit J ⊂ Rn un semi-pavé tel que I¯ ⊂ J. Alors I ⊂ J et
l’on a
& r
'
J =I∪
>
Ii ,
i=1
où
est une partition de J en semi-pavés. Comme I¯ ∩ int I i = ∅
pour chaque 1 ≤ i ≤ r, on a hI¯(x) = 0 pour tout x ∈ int I i, 1 ≤ i ≤ r, et le
lemme précédent entraı̂ne la L-intégrabilité de hI¯ sur chaque I¯i avec
{I, I 1, . . ., I r }
J
I¯i
hI¯ = 0, 1 ≤ i ≤ r.
Combinant ces résultats avec la propriété d’additivité de l’intégrale, on voit
que hI¯ sera intégrable (resp. L-intégrable) sur J¯ si et seulement si hI¯ est
¯ c’est-à-dire (puisque h ¯ = h sur I)
¯ si et
intégrable (resp. L-intégrable) sur I,
I
486
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
¯ auquel cas on aura,
seulement si h est intégrable (resp. L-intégrable) sur I,
en outre,
J
J¯
hI¯ =
J
I¯
hI¯ +
et la démonstration est complète.
r J
$
¯i
i=1 I
hI¯ =
J
I¯
h,
Soit A une partie bornée de Rn et f une fonction de Rn dans Rp définie
sur A. La définition suivante est naturelle.
Définition. On dit que f est intégrable sur A (resp. L-intégrable sur A) s’il
existe un semi-pavé I ⊂ Rn tel que
A ⊂ I¯ et telHque fA soit intégrable (resp.
H
¯
L-intégrable) sur I, auquel cas I¯ fA est notée A f et appelée l’intégrale de
f sur A.
Cette définition et la terminologie seront justifiées si l’intégrabilité (resp.
H
la L-intégrabilité) de fA sur I¯ et la valeur de I¯ fA ne dépendent pas du
choix de I. Cette indépendance résulte de la proposition suivante.
Proposition. Si I ⊂ Rn est un semi-pavé tel que A ⊂ I¯ et tel que fA soit
¯ alors, pour tout semi-pavé K ⊂ Rn tel
intégrable (resp. L-intégrable) sur I,
H
H
que A ⊂ K̄, fA est intégrable (resp. L-intégrable) sur K̄ et K̄ fA = I¯ fA .
Démonstration. Soit J ⊂ Rn un semi-pavé tel que I¯ ⊂ J et K̄ ⊂ J.
Notons tout d’abord que (fA )I¯ = (fA )K̄ = fA puisque A ⊂ I¯ ∩ K̄. Par le
second lemme ci-dessus et l’intégrabilité (resp. L-intégrabilité) de fA sur
¯ (fA ) ¯ = fA est intégrable (resp. L-intégrable) sur J¯ et H ¯ fA = H ¯ fA . Par
I,
I
I
J
ce même lemme, l’intégrabilité (resp. la L-intégrabilité) de (fA )K̄ = fA sur
J¯ entraı̂ne
l’intégrabilité (resp. la L-intégrabilité) de fA sur K̄ et l’égalité
H
H
f
=
f
¯
A
K̄
J A.
Remarques. 1. La proposition ci-dessus montre encore que la définition
et la notation que nous venons d’introduire sont compatibles, lorsque A
est l’adhérence I¯ d’un semi-pavé I de Rn , avec la définition et la notation
¯ puisque f ¯ = f
originales d’intégrabilité (resp. de L-intégrabilité) sur I,
I
¯ et avec les notions d’intégrabilité (resp. de L-intégrabilité) sur des
sur I,
intervalles non fermés. En outre, la même proposition montre que si B ⊂ A,
alors f est intégrable (resp. L-intégrable) sur B si et seulement si fB est
intégrable (resp. L-intégrable) sur A.
2. Il résulte aisément de la définition ci-dessus que les propriétés élémentaires de l’intégrale (sauf celles de restriction et d’additivité),
le test de comparaison de L-intégrabilité, l’identité entre les fonctions intégrables et L-intégrables lorsqu’elles sont bornées ou positives, le
13.2. BORNÉS INTÉGRABLES ET LEUR MESURE
487
théorème de Levi et le théorème de Lebesgue s’étendent à l’intégrabilité (resp. L-intégrabilité) sur un borné A de Rn en remplaçant simplement
I¯ par A. En particulier, l’ensemble P (A; Rp) (resp. L(A; Rp)) des fonctions
de Rn dans Rp intégrables (resp. L-intégrables) sur A forme un espace vectoriel sur R. On verra plus loin que l’extension des propriétés de restriction
et d’additivité est plus délicate. Elle nécessite l’introduction de la notion de
partie n-intégrable de Rn .
13.2
Bornés intégrables et leur mesure
Soit A une partie bornée de Rn .
Définition. On dit que A est n-intégrable si la fonction
constante 1 est
H
intégrable sur A, auquel cas le nombre positif ou nul A 1 est appelé la nmesure (de Lebesgue) de A et noté µ(A). On dit aussi longueur de A pour
n = 1, aire d’un ensemble plan de A pour n = 2 et volume de A pour n = 3.
H
On a donc, par définition, µ(A) = I¯ 1A pour tout semi-pavé I ⊂ Rn tel
¯ En particulier, l’adhérence I¯ de tout semi-pavé I = ]a1 , b1 ] ×
que A ⊂ I.
. . . × ]an , bn] de Rn est n-intégrable et a pour n-mesure de Lebesgue
¯ =
µ(I)
J
I¯
1I¯ =
J
I¯
1=
n
6
i=1
(bi − ai ).
En utilisant le premier lemme de cette section, on voit aussi que fr I =
I¯ \ int I et I¯ \ I sont n-intégrables et que
µ(fr I) = µ(I¯ \ I) = 0,
puisque 1fr I (x) = 1I\I
¯ (x) = 0 si x ∈ int I. Comme 1int I = 1I¯ − 1fr I et
1I = 1I¯ − 1I\I
¯ , on en déduit aussitôt la n-intégrabilité de int I et de I et les
relations
¯ =
µ(int I) = µ(I) = µ(I)
n
6
i=1
(bi − ai ),
qui montrent la compatibilité de la nouvelle notation avec la notation µ(I)
introduite précédemment pour désigner le dernier terme de l’égalité.
Les propriétés élémentaires de la n-mesure résultent aisément de
la définition et des propriétés élémentaires de l’intégrale.
488
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
Proposition. Si A, B, A1 , . . . , Aq sont des parties bornées n-intégrables de
Rn , on a les propriétés suivantes.
1. Si B ⊂ A, alors µ(B) ≤ µ(A) (monotonie).
!
7
2. qk=1 Ak et qk=1 Ak sont n-intégrables,
µ
&
q
>
Ak
k=1
'
≤
q
$
µ(Ak ) (sous-additivité),
k=1
et si les Ak sont mutuellement disjoints (Aj ∩ Ak = ∅ si j /= k),
µ
&
q
>
Ak
k=1
'
=
q
$
µ(Ak ) (additivité).
k=1
3. µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B),
4. A \ B est n-intégrable et, si B ⊂ A, µ(A \ B) = µ(A) − µ(B).
Démonstration. Il suffit d’appliquer à la définition les propriétés élémentaires de l’intégrale en tenant compte des propriétés suivantes des fonctions
caractéristiques, que l’on démontre aisément:
1) B ⊂ A si et seulement si 1B (x) ≤ 1A (x) pour tout x ∈ Rn .
2) 1!q Ak = max1≤k≤q 1Ak , 17q Ak = min1≤k≤q 1Ak , et 1!q Ak =
%q
k=1
k=1
k=1
1Ak si les Ak sont mutuellement disjoints.
3) 1A∪B = 1A + 1B − 1A∩B .
4) A \ B = A ∩ (Rn \ B) et, si B ⊂ A, 1A\B = 1A − 1B . En particulier,
1Rn \B = 1 − 1B .
k=1
Le théorème de Levi permet de généraliser la propriété 2 de la proposition
ci-dessus aux familles dénombrables d’ensembles. Un résultat préliminaire est
nécessaire.
Lemme. Si (Ak )k∈N est une suite croissante (resp. décroissante) de parties
de Rn , alors la suite de fonctions (1Ak )k∈N converge ponctuellement sur Rn
vers 1! Ak (resp. 17 Ak ).
k∈N
k∈N
Démonstration. Si, pour fixer les idées, on suppose (Ak )k∈N croissante,
!
et si x /∈ A = k∈N Ak , x n’appartient à aucun Ak et on a donc
lim 1Ak (x) = 0 = 1A (x).
k→∞
Si x ∈ A, il existe un m ∈ N tel que x ∈ Am . Comme (Ak )k∈N est croissante,
on aura donc x ∈ Ak pour tout k ≥ m, et dès lors
lim 1Ak (x) = 1 = 1A (x).
k→∞
Le cas d’une suite décroissante se démontre de la même manière.
489
13.2. BORNÉS INTÉGRABLES ET LEUR MESURE
Proposition. Soit (Ak )k∈N une suite croissante de parties bornées et n!
intégrables de Rn telles que A = k∈N Ak soit bornée. Alors A est nintégrable et
µ(A) = lim µ(Ak ) = sup µ(Ak ).
k→∞
k∈N
¯ Par hypothèse,
Démonstration. Soit I un semi-pavé de Rn tel que A ⊂ I.
(1Ak )k∈N est une suite croissante de fonctions intégrables sur I¯ qui, en vertu
du lemme précédent,
converge ponctuellement vers 1A . En outre, la suite
H
(µ(Ak ))k∈N = ( I¯ 1Ak )k∈N est croissante et majorée par µ(I), donc convergente. On déduit aussitôt du théorème de Levi que 1A = limk→∞ 1Ak est
intégrable sur I¯ (donc que A est n-intégrable) et que
µ(A) =
J
I¯
1A = lim
J
k→∞ I¯
1Ak = lim µ(Ak ) = sup µ(Ak ).
k→∞
k∈N
Proposition. Soit (Ak )k∈N une suite décroissante de parties bornées et n7
intégrables de Rn . Alors A = k∈N Ak est n-intégrable et
µ(A) = lim µ(Ak ) = inf µ(Ak ).
k→∞
k∈N
¯ Par hypothèse,
Démonstration. Soit I un semi-pavé de Rn tel que A0 ⊂ I.
(1Ak )k∈N est une suite décroissante de fonctions intégrables sur I¯ qui, en
vertu du lemme précédent,
converge ponctuellement vers 1A . En outre, la
H
suite (µ(Ak ))k∈N = ( I¯ 1Ak )k∈N est décroissante et minorée par 0, donc convergente. On déduit aussitôt du théorème de Levi que 1A = limk→∞ 1Ak est
intégrable sur I¯ (donc que A est n-intégrable) et que
µ(A) =
J
I¯
1A = lim
J
k→∞ I¯
1Ak = lim µ(Ak ) = inf µ(Ak ).
k→∞
k∈N
Un lemme est nécessaire pour démontrer l’importante propriété d’additivité complète de la mesure.
Lemme. Si (Ak )k∈N est une suite de parties de Rn mutuellement disjointes,
%
alors la série de fonctions k∈N 1Ak converge ponctuellement vers 1! Ak .
k∈N
Démonstration. Comme les Ak sont mutuellement disjoints, on a, pour
tout q ∈ N,
1!q
k=0
Ak
=
q
$
k=0
1Ak .
490
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
!
Si x /∈ A = k∈N Ak , alors x /∈ Ak pour tout k ∈ N et
tout q ∈ N. En conséquence,
q
$
lim
q→∞
%q
k=0
1Ak (x) = 0 pour
1Ak (x) = 0 = 1A (x).
k=0
Si x ∈ A, il existe un (et un seul) entier m tel que x ∈ Am . Dès lors, pour
tout q ≥ m, on a
q
$
1Ak (x) = 1Am (x) = 1,
k=0
et
lim
q→∞
q
$
1Ak (x) = 1 = 1A (x).
k=0
Nous pouvons maintenant démontrer la propriété d’additivité complète de la mesure.
Proposition. Si (Ak )k∈N est une suite de parties de Rn bornées, n-intégra!
bles, mutuellement disjointes et telles que A = k∈N Ak soit bornée, alors A
%
est n-intégrable, la série k∈N µ(Ak ) converge et
µ(A) =
∞
$
µ(Ak ).
k=0
¯ Par hypothèse,
Démonstration. Soit I un semi-pavé de Rn tel que A ⊂ I.
¯
k∈N 1Ak est une série de fonctions positives et intégrables sur I et, par le
lemme, cette série converge ponctuellement sur Rn vers 1A . En outre, la
série à termes positifs
J
%
$
¯
k∈N I
1Ak =
$
µ(Ak )
k∈N
est convergente, puisque, pour tout q ∈ N, on a
q
$
µ(Ak ) = µ
k=0
&
q
>
k=0
Ak
'
≤ µ(I).
Par le théorème de Levi pour les séries de fonctions, la fonction 1A est
intégrable sur I¯ et
µ(A) =
J
I¯
1A =
∞ J
$
¯
k=0 I
1Ak =
∞
$
k=0
µ(Ak ).
13.3. ADDITIVITÉ COMPLÈTE DE LA L-INTÉGRALE
13.3
491
Additivité complète de la L-intégrale
On sait que l’intégrabilité (resp. la L-intégrabilité) d’une fonction sur un
pavé fermé I¯ entraı̂ne son intégrabilité (resp. sa L-intégrabilité) sur tout
¯ On pourrait penser que l’intégrabilité d’une
pavé fermé contenu dans I.
fonction sur une partie bornée A entraı̂ne son intégrabilité sur toute partie
de A. Qu’il n’en soit rien résulte de l’existence de parties bornées de Rn qui
ne sont pas n-intégrables, un résultat fondé sur l’axiome du choix et qui est
esquissé dans les exercices. En effet, si B est un tel ensemble borné et non
¯ la fonction constante 1 est
n-intégrable, et I un semi-pavé tel que B ⊂ I,
intégrable sur I¯ et ne l’est pas sur B.
On peut alors penser que l’intégrabilité d’une fonction sur une partie
bornée A entraı̂ne son intégrabilité sur toute partie n-intégrable de A. Ce
résultat est faux pour les fonctions intégrables mais non L-intégrables sur A.
En effet, si f ∈ P (A; R) \ L(A; R), on a vu précédemment que f + et f − ne
sont pas intégrables sur A. Dès lors, si
A+ = {x ∈ A : f (x) ≥ 0},
on a f + (x) = fA+ (x) pour tout x ∈ A et f n’est pas intégrable sur A+ .
Dans le cas de f (x) = (2/x) cos(1/x2) si x /= 0 et f (0) = 0, qui est un
élément de P ([0, 1], R) \ L([0, 1], R), il est facile de voir que A+ est une
union dénombrable d’intervalles fermés bornés mutuellement disjoints contenus dans [0, 1], donc que A+ est 1-intégrable. On ne connaı̂t pas de classe
intéressante, autre que l’union finie de pavés, pour laquelle l’intégrabilité
d’une fonction intégrable mais non L-intégrable sur un borné A se transmette à une partie de A appartenant à cette classe. C’est évidemment un
handicap important de l’extension de la notion d’intégrabilité à une partie
bornée quelconque.
La situation est meilleure pour la L-intégrabilité sur une partie bornée
qui se transmet à tout sous-ensemble n-intégrable. C’est la propriété de
restriction de la L-intégrale sur un borné.
Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp
définie et L-intégrable sur A. Alors, pour toute partie n-intégrable B de A,
f est L-intégrable sur B.
Démonstration. En passant aux composantes fj de f et puis en notant
que fj = fj+ − fj− , on voit qu’il suffit de démontrer le résultat pour une
fonction f de Rn dans R+ , ce que nous supposerons. Soit B ⊂ A n-intégrable
¯ Définissons sur A la suite (fk )k∈N
et I un semi-pavé de Rn tel que A ⊂ I.
492
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
de fonctions de Rn dans R+ par
fk (x) = min[f (x), k.1B (x)], k ∈ N.
Chaque fk est telle que
0 ≤ fk (x) ≤ f (x),
pour x ∈ A, et est L-intégrable sur A puisqu’il en est ainsi de f et de k.1B .
En outre, (fk )k∈N converge ponctuellement sur A vers fB . En effet, si x ∈ B,
k.1B (x) = k et dès lors fk (x) = f (x) = fB (x) dès que k ≥ fB (x), tandis que,
si x ∈ A\B, k.1B (x) = 0 pour tout k ∈ N, et dès lors fk (x) = 0 = fB (x) pour
tout k ∈ N. Le théorème de convergence majorée et minorée de Lebesgue
entraı̂ne alors la L-intégrabilité de fB sur A, c’est-à-dire la L-intégrabilité
de f sur B.
On en déduit aisément la propriété d’additivité finie pour la Lintégrale sur un borné.
Proposition. Soit A un borné de Rn , {A1 , . . . , Aq } une partition de A en un
nombre fini de parties n-intégrables, et f une fonction de Rn dans Rp définie
sur A. Alors f est L-intégrable sur A si et seulement si f est L-intégrable
sur chaque Ak , 1 ≤ k ≤ q, auquel cas on a
J
f=
A
q J
$
f.
k=1 Ak
Démonstration. Si f est L-intégrable sur A, la propriété de restriction
que nous venons de démontrer entraı̂ne sa L-intégrabilité sur chaque Ak , 1 ≤
k ≤ q, et donc l’intégrabilité de chaque fAk sur A. Comme en outre
f=
q
$
fAk ,
k=1
la formule cherchée s’en déduit par intégration sur A. Réciproquement, si f
est L-intégrable sur chaque Ak , 1 ≤ k ≤ q, fAk est L-intégrable sur A, et la
formule ci-dessus entraı̂ne que f est L-intégrable sur A.
Le théorème de Levi pour les séries de fonctions positives fournit la propriété d’additivité complète pour la L-intégrale sur un borné.
Proposition. Soit A un borné de Rn , (Ak )k∈N une suite de parties nintégrables de A telle que {A0 , A1 , . . .} forme une partition de A et f une
fonction de Rn dans Rp définie sur A. Alors, f est L-intégrable sur A si
493
13.4. EXEMPLES DE BORNÉS INTÉGRABLES
et seulement si f est L-intégrable sur chaque Ak , k ∈ N et
converge, auquel cas
J
f=
A
∞ J
$
%
H
k∈N Ak
|f |2
f.
k=0 Ak
Démonstration. Comme ci-dessus, on peut se ramener au cas où f est à
valeurs positives. Comme, pour chaque x ∈ A, on a
%
fAk (x) = f (x).1Ak (x) ≥ 0,
%
on voit que la série k∈N fAk = f.( k∈N 1Ak ) converge ponctuellement sur
A vers f.1A = fA . On peut donc appliquer le théorème de convergence de
Levi pour les séries de fonctions positives,
qui assure Hl’intégrabilité de f sur
H
%
%
A si et seulement si la série k∈N A f.1Ak = k∈N Ak f converge, auquel
cas on a
J
J
f=
A
∞
$
f.
k=0 Ak
Enfin, le théorème de Levi pour une suite croissante de fonctions fournit
à son tour une condition nécessaire et suffisante du type de Hake
pour la L-intégrabilité sur une partie bornée.
Proposition. Soit (Ak )k∈N une suite croissante de parties bornées et n!
intégrables telle que A = k∈N Ak soit bornée, et soit f une fonction de Rn
dans Rp définie sur A. Alors f est L-intégrable sur
A si et seulement si f est
H
L-intégrable sur chaque Ak , k ∈ N et la suite ( Ak |f |2 )k∈N est convergente,
auquel cas on a
J
J
f = lim
A
k→∞ Ak
f.
Démonstration. On peut de nouveau, sans perte de généralité, se ramener
au cas d’une fonction f positive et l’on procède comme dans la démonstration
précédente.
13.4
Exemples de bornés intégrables
Le premier résultat, qui porte le nom d’inégalité de Tchebycheff, associe
à une fonction positive intégrable sur un borné A une intéressante classe de
parties intégrables de A.
494
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
Proposition. Soit A un borné de Rn et f une fonction de Rn dans R+
intégrable sur A. Alors, pour chaque r > 0, l’ensemble
Ar = {x ∈ A : f (x) > r}
est n-intégrable et
µ(Ar ) ≤ r
−1
J
f.
A
¯
Démonstration. Soit r > 0 et I un semi-pavé de Rn tel que A ⊂ I;
n
définissons sur R la suite d’applications (fk )k∈N par
fk (x) = min[1, k. max(fA (x) − r, 0)], k ∈ N, x ∈ Rn .
Chaque fk est intégrable sur I¯ et telle que
0 ≤ fk (x) ≤ 1, k ∈ N, x ∈ Rn .
En outre, la suite (fk )k∈N converge ponctuellement sur Rn vers 1Ar . En
effet, si x ∈ Rn \ Ar , alors fA (x) − r ≤ 0 et fk (x) = 0 pour tout k ∈ N,
ce qui entraı̂ne que fk (x) → 0 = 1Ar (x) si k → ∞. Si x ∈ Ar , fk (x) =
min[1, k(f (x) − r)] et dès lors fk (x) = 1 dès que k ≥ 1/(f (x) − r); donc
fk (x) → 1 = 1Ar (x) si k → ∞.
On peut donc appliquer le théorème de convergence majorée et mi¯ c’est-à-dire la
norée de Lebesgue pour obtenir l’intégrabilité de 1Ar sur I,
n-intégrabilité de Ar . Par la propriété de restriction (puisque, f étant positive, son intégrabilité équivaut à sa L-intégrabilité), f sera alors intégrable
sur Ar et comme
r.1Ar (x) ≤ fAr (x) ≤ f (x), x ∈ A,
on en déduit, par intégration sur A que
rµ(Ar ) ≤
J
Ar
f≤
J
f,
A
et la démonstration est complète.
Remarque. La fonction
df : R∗+ → R+ , r 2→ µ(Ar )
définie par la Proposition précédente s’appelle la fonction de distribution de
f et joue un grand rôle en analyse.
495
13.4. EXEMPLES DE BORNÉS INTÉGRABLES
Corollaire. Dans les conditions de la proposition précédente, l’ensemble
A∗r = {x ∈ A : f (x) ≥ r} est n-intégrable et
µ(A∗r )
≤r
−1
J
f.
A
Démonstration. Avec les notations de la Proposition précédente, on a
A∗r =
"
Ar−(1/k).
{k∈N:k>r −1 }
Comme Ar−(1/k) ⊃ Ar−(1/k+1) pour k ≥ 1 et comme, par la proposition
précédente, chaque Ar−(1/k) est n-intégrable, on en déduit que A∗r est nintégrable et que
µ(A∗r ) = lim µ(Ar−(1/k)) ≤ lim
k→∞
k→∞
4
r−
1
k
5−1 J
A
f = r −1
J
A
f.
Corollaire. Si A est un borné de Rn et si f est une fonction de Rn dans
Rp L-intégrable sur A, alors l’ensemble
S(f ) = {x ∈ A : f (x) /= 0}
est n-intégrable.
Démonstration. On a
S(f ) = {x ∈ A : |f (x)|2 > 0} =
>
Sk ,
k∈N∗
où Sk = {x ∈ A : |f (x)|2 > 1/k}. Par le théorème de Tchebycheff, chaque
Sk est n-intégrable et, par construction, Sk ⊂ Sk+1 ⊂ A pour tout k ∈ N∗ .
La n-intégrabilité de S(f ) en découle aussitôt.
L’obtention de classes concrètes d’ensembles n-intégrables repose sur le
lemme de recouvrement suivant.
Proposition. Soit I un semi-pavé de Rn , E une partie non vide
8 de I et9δ une
jauge sur E. Alors il existe une famille au plus dénombrable (xk , J k )
,
k∈M
avec M = {0, 1, . . . , s} ou N, telle que chaque J k est un semi-pavé contenu
dans I et semblable à I, J k ∩J l = ∅ si j /= l, xk ∈ E ∩J k , J k ⊂ B∞ [xk ; δ(xk )]
pour chaque k ∈ M, l ∈ M, et
E⊂
>
k∈M
J k ⊂ I.
496
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
Démonstration. Effectuons des divisions successives de I en 2n , 22n , . . .,
2kn , . . . semi-pavés congruents par bissection des intervalles dont I est le produit cartésien, et appelons respectivement D1 , D2 , . . ., Dk , . . . les collections
finies de semi-pavés ainsi obtenues. Chaque Dk constitue évidemment une
partition de I en semi-pavés congruents semblables à I. Posons
E1 = {J ∈ D1 : il existe x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]},
E2 = {J ∈ D2 : J n’est pas contenu dans un semi-pavé de E1 et il existe
x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]},
et, d’une manière générale, pour chaque k ∈ N∗ ,
!
Ek = {J ∈ Dk : J n’est pas contenu dans un semi-pavé de k−1
j=1 Ej et il
existe x ∈ E ∩ J tel que J ⊂ B∞ [x; δ(x)]}.
!
Posons E = k∈N∗ Ek . C’est une famille au plus dénombrable de semi-pavés
contenus dans I et mutuellement disjoints. Montrons que tout point de E appartient à l’un au moins de ces semi-pavés. Soit x ∈ E et δ(x) la valeur correspondante de la jauge. Il existe un entier k1 ≥ 1 tel que, pour tout k ≥ k1 , le
semi-pavé Jk,x de Dk qui contient x soit contenu dans B∞ [x; δ(x)], et dès lors
Jk1 ,x vérifie la deuxième condition de définition de Ek1 . Par conséquent, ou
! 1 −1
bien Jk1 ,x ∈ Ek1 , ou bien Jk1 ,x est contenu dans un semi-pavé de kj=1
Ej . Par
conséquent, x appartient à un semi-pavé de la famille E. Si nous désignons
les semi-pavés de cette famille par (Jk )k∈M , avec M = {0, 1, . . ., s} un ensemble fini ou M = N, nous avons par construction, pour
8 chaque
9 k ∈ M,
k
k
k
k
k
k
k
un x ∈ E ∩ J tel que J ⊂ B∞ [x ; δ(x )]. La famille (x , J )
a les
k∈M
propriétés voulues.
Le lemme de recouvrement fournit un intéressant résultat sur la structure des ouverts bornés de Rn .
Proposition. Soit E un ouvert borné non vide de Rn et I un semi-pavé
tel que E ⊂ I. Il existe une suite (J k )k∈N de semi-pavés contenus dans I et
semblables à I qui partitionne E.
Démonstration. Puisque E est ouvert, il existe, pour chaque x ∈ E,
un δ(x) > 0 tel que B∞ [x; δ(x)] ⊂ E, ce qui nous définit une jauge δ sur
E. Par le lemme
de 9recouvrement, on peut trouver une famille au plus
8
k
dénombrable (x , J k )
où chaque J k est un semi-pavé contenu dans I
k∈M
et semblable à I, les J k sont mutuellement disjoints, xk ∈ E ∩ J k , J k ⊂
!
B∞ [xk ; δ(xk )], k ∈ M, et E ⊂ k∈M J k . Comme, pour chaque k ∈ M , on
!
a J k ⊂ B∞ [xk ; δ(xk )] ⊂ E, on en déduit que k∈M J k ⊂ E, et donc que
!
k
k
k∈M J = E. Comme une union finie de semi-pavés J ne peut donner un
ouvert, on a nécessairement M = N et la démonstration est complète.
13.4. EXEMPLES DE BORNÉS INTÉGRABLES
497
On en déduit aussitôt l’intégrabilité de tout ouvert borné.
Proposition. Tout ouvert borné de Rn est n-intégrable.
Démonstration. C’est trivial si l’ouvert est vide. Si E est un ouvert
non vide de Rn , et I un semi-pavé qui le contient, E peut s’écrire, par la
Proposition précédente, comme une union dénombrable de semi-pavés J k
mutuellement disjoints et contenus dans I. E est donc n-intégrable par la
propriété d’additivité complète, puisque chaque J k l’est.
On ne s’étonnera pas que la propriété s’étende aux fermés bornés.
Proposition. Tout fermé borné de Rn est n-intégrable.
Démonstration. Soit F un fermé borné de Rn et I un semi-pavé tel que
F ⊂ int I. Alors E = (Rn \ F ) ∩ int I est un ouvert borné de Rn et est donc
n-intégrable. Comme F = int I \ E, F est également n-intégrable.
Terminons par une intéressante propriété d’approximation des bornés n-intégrables par une union au plus dénombrable de semi-pavés mutuellement disjoints.
Proposition. Soit A une partie bornée et n-intégrable de Rn et I un semipavé contenant A. Pour chaque ! > 0, il existe une famille au plus dénombrable (J k )k∈M de semi-pavés mutuellement disjoints contenus dans I et tels
!
que A ⊂ k∈M J k et
$
µ(J k ) ≤ µ(A) + !.
k∈M
Démonstration. Si ! > 0 est donné, il existe une jauge δ sur I¯ telle que,
pour toute P-partition δ-fine Π de I, on ait
|S(I, 1A, Π) − µ(A)| ≤ !.
8
9
Pour cette jauge δ et l’ensemble A, soit (xk , J k )
la famille au plus
k∈M
dénombrable donnée par le lemme de recouvrement. En vertu du lemme de
Saks-Henstock, on aura, pour chaque q ∈ M ,
# q 2
3##
J
#$
#
#
k
k
1A (x )µ(J ) −
1A # ≤ !,
#
#
#
k
¯
J
k=1
c’est-à-dire, puisque xk ∈ A, k ∈ M ,
# q 2
3##
J
#$
#
#
k
µ(J ) −
1A # ≤ !.
#
#
#
J¯k
k=1
498
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
En conséquence, on a, pour tout q ∈ M ,
q
$
k=1
µ(J ) ≤
k
q J
$
¯k
k=1 J
1A + ! ≤
J
I¯
1A + ! = µ(A) + !,
et le résultat s’en déduit en faisant tendre q vers l’infini dans le cas où M = N.
13.5
Ensembles négligeables
On a vu plus haut qu’une fonction de Rn dans Rp définie sur l’adhérence
I¯ d’un semi-pavé I de Rn et nulle sur int I est L-intégrable sur I¯ et son
¯
intégrale est nulle. Toutes ces fonctions ont donc la même intégrale sur I.
On avait vu également que l’intégrale d’une fonction sur un intervalle ne
dépendait pas de sa valeur aux extrémités de l’intervalle. Ce sont là des manifestations particulières d’un phénomène général en théorie de l’intégration:
l’indépendance de la propriété d’intégrabilité et de la valeur de l’intégrale
sur un ensemble par rapport aux valeurs prises par la fonction sur des parties suffisamment “petites” de l’ensemble d’intégration. Dans cette section, ces parties suffisamment “petites” pour pouvoir être négligées dans
l’opération d’intégration vont être caractérisées d’une manière indépendante de la théorie de l’intégrale et de la mesure. Nous en déduirons alors
une extension des notions d’intégrabilité et de L-intégrabilité facilitant la
démonstration de l’intégrabilité d’une fonction ou d’un ensemble, et une
généralisation des théorèmes de convergence monotone et dominée.
La propriété d’approximation des parties bornées n-intégrables donnée
dans la section précédente suggère la définition suivante.
Définition. On dit que E ⊂ Rn est n-négligeable si, pour chaque ! > 0, il
existe une famille au plus dénombrable (Ek )k∈M de semi-pavés de Rn , avec
M = {0, 1, . . ., s} ou N, telle que les propriétés suivantes soient satisfaites :
!
1. E ⊂ k∈M Ek .
%
2. k∈M µ(Ek ) ≤ !.
Exemples. 1. ∅ est n-négligeable.
2. Tout singleton {a} de Rn est n-négligeable.
En effet, si ! > 0 est donné, il suffit de prendre M = {0} et
E0 =
n
6
i=1
]ai − (1/2)!1/n, ai + (1/2)!1/n].
499
13.5. ENSEMBLES NÉGLIGEABLES
3. Toute partie dénombrable de Rn est n-négligeable.
En effet, une telle partie peut s’écrire E = {ak : k ∈ N} et, si ! > 0 est
donné, il suffit de prendre M = N et
Ek =
n
6
i=1
]aki − (1/2)(!/2k+1 )1/n, aki + (1/2)(!/2k+1 )1/n], k ∈ N,
ce qui donne E ⊂
!
k∈N Ek
∞
$
et
µ(Ek ) =
k=0
∞
$
(!/2k+1 ) = !.
k=0
En particulier, N, Z et Q sont 1-négligeables, ce qui montre qu’une partie
n-négligeable n’est pas nécessairement bornée.
4. Tout hyperplan de Rn de la forme E = R × . . . × {ci} × . . . × R est
n-négligeable.
En effet, si ! > 0 est donné, il suffit de prendre M = N et, pour k ∈ N,
3
Ek =]−(k +1), k +1]×. . .× ci −
!
!
, ci + n+k+1
n+k+1
n−1
2
(k + 1)
2
(k + 1)n−1
3
× . . . × ] − (k + 1), k + 1],
ce qui entraı̂ne aussitôt que E ⊂
∞
$
!
k∈N Ek
µ(Ek ) = 2!
k=0
&
∞
$
k=0
et
2
−k−2
'
= !.
Les propriétés suivantes des ensembles n-négligeables permettent d’en
construire d’autres.
Proposition. Si E est une partie n-négligeable de Rn et si F ⊂ E, alors F
est n-négligeable.
Démonstration. Immédiat.
Ainsi, toute partie du type [a1 , b1 ] × . . . × {ci } × . . . × [an , bn] sera nnégligeable. En particulier, les faces et la frontière d’un pavé de Rn sont
n-négligeables.
500
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
Proposition. Si (Fj )j∈N est une suite de parties n-négligeables de Rn , alors
!
j∈N Fj est n-négligeable.
Démonstration. Soit ! > 0. Pour chaque j ∈ N, il existe une famille
(Ekj )k∈Mj de semi-pavés de Rn , avec Mj = {0, 1, . . ., sj } ou N, telle que
Fj ⊂
>
$
Ekj ,
k∈Mj
k∈Mj
µ(Ekj ) ≤ !/2j+1 .
Dès lors, (Ekj )k∈Mj ;j∈N est une famille dénombrable de semi-pavés de Rn telle
que
>
> >
Fj ⊂
Ekj ,
j∈N
j∈N k∈Mj
et, dès lors,
$
µ(Ekj )
=
∞
$
j=0
k∈Mj ;j∈N


$
k∈Mj

µ(Ekj )
≤
∞
$
(!/2j+1 ) = !,
j=0
puisque tout réarrangement d’une série convergente à termes positifs converge vers la même somme.
Ainsi, Qn est n-négligeable.
La Proposition suivante établit l’identité, parmi les ensembles bornés,
entre les parties n-négligeables et les parties n-intégrables de n-mesure nulle.
Proposition. Toute partie bornée de Rn est n-négligeable si et seulement
si elle est n-intégrable et de n-mesure nulle.
Démonstration. Condition nécessaire. Soit E un borné n-négligeable de
¯ Il faut montrer que la fonction 1E est
Rn et I un semi-pavé telH que E ⊂ I.
intégrable sur I¯ et que I¯ 1E = 0. Soit ! > 0; par hypothèse, il existe une
famille au plus dénombrable (Ek )k∈M de semi-pavés de Rn telle que
E⊂
>
k∈M
Ek ,
$
k∈M
µ(Ek ) ≤ !/2.
Soit (Fk )k∈M une famille de semi-pavés tels que
Ek ⊂ int Fk , k ∈ M,
$
k∈M
µ(Fk ) ≤ !.
Une telle famille est facile à construire en agrandissant légèrement les Ek .
¯ Si x ∈ I¯ \ E, prenons δ(x) = 1. Si
Définissons comme suit une jauge δ sur I.
501
13.5. ENSEMBLES NÉGLIGEABLES
x ∈ E, il existe un Ek tel que x ∈ Ek et donc tel que x ∈ int Fk . Désignons
par k(x) le plus petit entier appartenant à M tel que x ∈ int Fk , et soit
δ(x) > 0 tel que B∞ [x; δ(x)] ⊂ Fk(x) ; ce δ(x) fournit la valeur de la jauge
pour un tel x. Soit Π = {(x1 , I 1), . . . , (xm, I m)} une P-partition δ-fine de I;
alors,
S(I, 1E, Π) =
m
$
1E (xj )µ(I j ) =
j=1
$
µ(I j ).
{1≤j≤m : xj ∈E}
Mais, si xj ∈ E, on a I j ⊂ B∞ [xj ; δ(xj )] ⊂ Fk(xj ), et dès lors, en posant
r = max{k(xj ) : xj ∈ E, 1 ≤ j ≤ m} et en regroupant, dans la dernière
somme, les termes pour lesquels k(xj ) prend la valeur i, on obtient
S(I, 1E , Π) =
r
$
i=1
≤
r
$
i=1


$
{1≤j≤m : k(xj )=i}
µ(Fi ) ≤
µ(I j )
$
µ(Fi ) ≤ !,
$
µ(J k ) ≤ !,
i∈M

et la démonstration est complète.
Condition suffisante. Soit E un borné de Rn n-intégrable et de n-mesure
nulle et soit ! > 0. Par la propriété d’approximation des parties bornées et nintégrables, il existe une famille au plus dénombrable (J k )k∈M de semi-pavés
mutuellement disjoints et tels que
E⊂
>
Jk,
k∈M
k∈M
et le résultat s’en déduit aussitôt.
Terminons par une condition nécessaire utile pour qu’une partie bornée
soit de n-mesure nulle.
Proposition. Soit E une partie bornée et n-intégrable de Rn . Si E est de
n-mesure nulle, alors int E = ∅.
Démonstration. On démontre le contraposé. Si int E /= ∅, il existe a ∈ E
et r > 0 tels que B∞ [a; r] ⊂ E, et dès lors
0 < (2r)n ≤ µ(E).
502
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
Etudions maintenant l’intégrabilité d’une fonction sur une partie bornée
n-négligeable.
Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp
définie sur A. Alors f est L-intégrable sur A et
J
|f |2 = 0
A
si et seulement si l’ensemble
S(f ) = {x ∈ A : f (x) /= 0}
est n-négligeable, auquel cas on a
H
Af
= 0.
Démonstration. Notons tout d’abord que
S(f ) = {x ∈ A : |f (x)|2 > 0} =
où
>
Sk ,
k∈N∗
Sk = {x ∈ A : |f (x)|2 > k−1 } ⊂ Sk+1 , k ∈ N∗ .
En conséquence, S(f ) sera n-intégrable et de n-mesure nulle si et seulement
s’il en est ainsi de chaque Sk .
H
Condition nécessaire. Si f est L-intégrable sur A et A |f |2 = 0, alors,
en appliquant l’inégalité de Tchebycheff à |f |2 , on voit que chaque Sk est
n-intégrable et que
J
0 ≤ µ(Sk ) ≤ k
A
|f |2 = 0,
ce qui montre que chaque Sk est de n-mesure nulle.
Condition suffisante. Démontrons-la tout d’abord sous l’hypothèse supplémentaire que f soit bornée sur A, et soit r > 0 tel que |f (x)|2 ≤ r pour
¯ et montrons que
tout x ∈ A. Soit I un semi-pavé
de Rn tel que A ⊂ I,
H
fA est L-intégrable sur I¯ et que I¯ |fA |2 = 0. Soit ! > 0; puisque S(f ) est
n-intégrable et de n-mesure nulle, il existe une jauge δ sur I¯ telle que
S(I, 1S(f ), Π) =
m
$
1S(f )(xj )µ(I j ) =
j=1
$
{1≤j≤m :
xj ∈S(f )}
µ(I j ) ≤ !/r,
pour toute P-partition δ-fine Π = {(x1 , I 1 ), . . ., (xm , I m)} de I, et dès lors
|S(I, fA, Π)|2 ≤ S(I, |fA|2 , Π) =
$
{1≤j≤m : xj ∈S(f )}
|f (xj )|2 µ(I j )
503
13.5. ENSEMBLES NÉGLIGEABLES
≤
$
{1≤j≤m
: xj ∈S(f )}
rµ(I j ) ≤ !.
H
On voit donc que fA et |fA |2 sont L-intégrables sur I¯ et que I¯ |f |2 = 0.
Passons maintenant au cas d’une fonction f quelconque. Pour chaque
k ∈ N, posons
gk = min(|f |2 , k).
Chaque fonction gk est bornée sur A, et la suite (gk )k∈N est croissante sur
A. On vérifie comme d’habitude que (gk )k∈N converge ponctuellement sur
A vers |f |2 . En outre, gk (x) = |f (x)|2 dès que k ≥ |f (x)|2, ce qui entraı̂ne
aussitôt que, pour chaque k ∈ N, S(gk ) = S(f ) est de n-mesure nulle. Le
résultat de la première partie de la démonstration
entraı̂ne la L-intégrabilité
H
de chaque gk sur A et les relations A gk = 0, k ∈ N. Une application du
théorème de Levi entraı̂ne alors l’intégrabilité de |f |2 sur A et l’égalité
J
|f |2 = lim
J
k→∞ A
A
gk = 0.
Comme on l’a vu précédemment, cela implique l’intégrabilité de f sur A et
la démonstration est complète.
Corollaire. Si A est une partie bornée et n-négligeable de Rn , toute fonction
f de Rn dans Rp définie sur A est L-intégrable sur A et
J
f = 0,
A
J
A
|f |2 = 0.
Démonstration. On a
S(f ) = {x ∈ A : f (x) /= 0} ⊂ A,
et S(f ) est donc n-négligeable.
Introduisons maintenant une terminologie utile.
Définition. Soit A une partie non vide de Rn . On dit qu’une propriété est
vraie presque partout sur A (en abrégé p.p. sur A) ou pour presque tout
point de A, s’il existe un ensemble E ⊂ A n-négligeable tel que la propriété
soit vraie sur A \ E.
Exemples. Soit f une fonction de Rn dans Rp.
1. f est définie p.p. sur A si A \ dom f est n-négligeable.
2. f est continue p.p. sur A s’il existe E ⊂ A n-négligeable tel que f
soit continue en chaque point de A \ E.
504
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
3. Si g est une fonction de Rn dans Rp , f = g p.p. sur A si l’ensemble
des points x de A pour lesquels f (x) /= g(x) est n-négligeable.
On vérifie aisément que l’égalité p.p. de deux fonctions sur un ensemble
est une relation d’équivalence. On notera la différence entre une fonction
continue p.p. sur A et une fonction égale p.p. sur A à une fonction continue.
Ainsi, 1Q n’est continue en aucun point de R, alors qu’elle est égale p.p. sur
R à la fonction continue zéro.
4. Considérons une suite (fk )k∈N de fonctions de Rn dans Rp définies p.p.
sur A ⊂ Rn . Pour chaque k ∈ N, il existe Ek ⊂ A n-négligeable tel que fk soit
!
définie sur A \ Ek , et comme E = k∈N Ek est encore n-négligeable, chaque
fonction fk est définie sur A\E. On dira que (fk )k∈N converge ponctuellement
p.p. sur A vers une fonction f de Rn dans Rp s’il existe une partie nnégligeable F de A telle que la suite converge ponctuellement vers f sur
A \ (E ∪ F ).
L’intégrabilité des fonctions sur un ensemble borné n-négligeable donnée
plus haut se formule de manière très suggestive dans la terminologie “presque
partout”.
Proposition. Soit A un borné de Rn et f uneH fonction de Rn dans Rp
définie sur A. Alors f est L-intégrable sur A et A |f |2 = 0 si et seulement
si f est égale à zéro presque partout sur A.
On en déduit aussitôt le résultat suivant.
Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp
intégrable (resp. L-intégrable) sur A. Alors toute fonction g de Rn dans Rp
définie sur A et égale p.p. sur A à f est intégrable (resp. L-intégrable) sur
A et
J
J
f=
g.
A
A
Démonstration. Par hypothèse, la fonction h = g − f est définie sur A
et égale à zéro p.p. sur A. Elle est donc L-intégrable sur A et
J
h = 0.
A
En conséquence, g = f + h est intégrable (resp. L-intégrable) sur A et
J
A
g=
J
f+
A
J
A
h=
J
A
f.
505
13.5. ENSEMBLES NÉGLIGEABLES
Notons en passant que, I¯ \ I étant n-négligeable pour tout semi-pavé I
de Rn , une fonction de Rn dans Rp sera définie p.p. sur I si et seulement si
¯ On pourra donc utiliser indifféremment l’une ou
elle est définie p.p. sur I.
l’autre terminologie.
Nous pouvons maintenant étendre les notions d’intégrabilité et de Lintégrabilité sur un borné A de Rn aux fonctions définie p.p. sur A. Cette
extension utile se fonde sur le résultat suivant.
Proposition. Soit A un borné de Rn et f une fonction de Rn dans Rp
définie p.p. sur A. Si f possède un prolongement f˜ à A qui est intégrable
(resp. L-intégrable) sur A, alors tout autre prolongement fˆ de f à A sera
intégrable (resp. L-intégrable) sur A et l’on aura
J
A
fˆ =
J
f˜.
A
Démonstration. Comme f est définie p.p. sur A, il existe E ⊂ A nnégligeable tel que A \ E ⊂ dom f. Par conséquent, pour tout x ∈ A \ E, on
a
fˆ(x) − f˜(x) = f (x) − f (x) = 0,
ce qui montre que fˆ = f˜ p.p. sur A. La thèse résulte alors de la Proposition
précédente.
La définition suivante est donc justifiée.
Définition. Soit A un borné de Rn et f une fonction de Rn dans Rp définie
p.p. sur A. On dit que f est intégrable (resp. L-intégrable) sur A s’il existe
un prolongement
f˜ de f à A qui soit intégrable (resp. L-intégrable) surH A,
H
˜
auquel cas A f , qui ne dépend pas du prolongement f˜ choisi, est noté A f
et appelé l’intégrale de f sur A.
On en déduit aussitôt que deux fonctions de Rn dans Rp définies p.p.
et égales p.p. sur un borné A de Rn sont simultanément intégrables (resp.
L-intégrables) sur A, auquel cas leurs intégrales sur A sont égales.
Les propriétés élémentaires de l’intégrale, le test de comparaison, les théorèmes de Levi et Lebesgue, les propriétés de restriction
et d’additivité et les inégalités de Tchebycheff s’étendent à la nouvelle
définition avec des affaiblissements évidents des hypothèses. A titre indicatif,
donnons la forme généralisée du théorème de convergence majorée et
minorée de Lebesgue.
506
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
Théorème. Soit A un borné de Rn , (fk )k∈N une suite de fonctions de Rn
dans R et f une fonction de Rn dans R. Supposons satisfaites les conditions
suivantes.
1. Chaque fk est définie p.p. et intégrable sur A.
2. La suite (fk )k∈N converge ponctuellement p.p. sur A vers f .
3. La suite (fk )k∈N est minorée p.p. sur A par une fonction h de Rn dans R
définie p.p. et intégrable sur A, et majorée p.p. sur A par une fonction H
de Rn dans R définie p.p. et intégrable sur A.
Alors f est intégrable sur A et
J
f = lim
J
k→∞ A
A
fk .
La convergence de la suite des intégrales sur un ensemble d’une suite de
fonctions n’entraı̂ne évidemment pas la convergence ponctuelle des fonctions
sur cet ensemble. On construira facilement des contre-exemples. Pour une
suite monotone, elle entraı̂ne toutefois la convergence ponctuelle presque
partout.
Proposition. Soit A un borné de Rn et (fk )k∈N une suite de fonctions de
Rn dans R. Supposons satisfaites les conditions suivantes.
1. Chaque fk est définie p.p. et intégrable sur A.
2. La suite (fk )k∈NH est monotone p.p. sur A.
3. La suite réelle ( A fk )k∈N converge.
Alors la suite de fonctions (fk )k∈N converge ponctuellement p.p. sur A.
Démonstration. Supposons, pour fixer les idées, que (fk )k∈N soit croissante p.p. sur A; en considérant si nécessaire la suite (fk − f0 )k∈N au lieu
de (fk )k∈N , on peut, sans perte de généralité, supposer que
fk (x) ≥ 0 pour
H
chaque k ∈ N et presque tout x ∈ A. Puisque la suite ( A fk )k∈N est croissante et convergente, elle est majorée et nous désignerons par M un de ses
majorants. D’ailleurs, la suite réelle (fk (x))k∈N est croissante pour presque
tout x ∈ A, ce qui implique, pour presque tout x ∈ A, l’existence au sens
7
large de sa limite. Posons F = k∈N dom fk et
E = {x ∈ A ∩ F : lim fk (x) = +∞}.
k→∞
La Proposition revient à montrer que E est de n-mesure nulle. Comme
on a
E = {x ∈ A ∩ F : (∀j ∈ N∗ )(∃m ∈ N∗ )(∀k ≥ m) : fk (x) ≥ j},
E=
"
j∈N∗
>
m∈N∗
"
k≥m
Fkj ,
507
13.5. ENSEMBLES NÉGLIGEABLES
où l’on a posé
Fkj = {x ∈ A ∩ F : fk (x) ≥ j},
pour tous les j et k dans N∗ . Par l’hypothèse 1 et l’inégalité de Tchebycheff,
chaque Fkj est n-intégrable et
µ(Fkj ) ≤ j −1
D’autre part, on a
J
A
fk ≤ j −1 M.
j
Fkj+1 ⊂ Fkj ⊂ Fk+1
,
ce qui entraı̂ne
"
j
j
Fk = Fm
,
k≥m
pour tous les j et k dans N∗ . Pour chaque j ∈ N∗ fixé, la suite



"
Fkj 
k≥m
j
= (Fm
)m∈N∗
m∈N∗
est donc une suite croissante de parties n-intégrables de A. Il en résulte que
>
m∈N∗
"
Fkj =
>
j
Fm
m∈N∗
k≥m
est également n-intégrable et, pour chaque j ∈ N∗ ,

µ
>
"
m∈N∗ k≥m

Fkj 
Si nous posons maintenant F j =
j
= lim µ(Fm
) ≤ j −1 M.
m→∞
!
m∈N∗
E=
"
j , alors
Fm
Fj,
j∈N∗
avec chaque F n-intégrable et tel que
j
µ(F j ) ≤ j −1 M.
j entraı̂nent les relations
Enfin, les propriétés des Fm
F j+1 =
>
m∈N∗
j+1
Fm
⊂
>
j
Fm
= Fj,
m∈N∗
pour chaque j ∈
c’est-à-dire la décroissance de la suite (F j )j∈N∗ . Par
7
conséquent, E = j∈N∗ F j est n-intégrable et
N∗ ,
0 ≤ µ(E) = lim µ(F j ) ≤ lim j −1 M = 0;
j→∞
la démonstration est complète.
j→∞
508
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
En combinant ce résultat à l’extension de la notion d’intégrale que nous
venons de donner et au théorème de Levi, nous obtenons l’intéressante
généralisation du théorème de convergence monotone de Levi.
Théorème. Soit A un borné de Rn et (fk )k∈N une suite de fonctions de Rn
dans R. Supposons satisfaites les conditions suivantes.
1. Chaque fk est définie p.p. et intégrable (resp. L-intégrable) sur A.
2. La suite (fH k )k∈N est monotone p.p. sur A.
3. La suite ( A fk )k∈N converge.
Alors la suite (fk )k∈N converge ponctuellement p.p. sur A vers une fonction
f définie p.p. et intégrable (resp. L-intégrable) sur A et l’on a
J
A
f = lim
J
k→∞ A
fk .
Le lecteur formulera aisément la version correspondante pour une série
de fonctions.
13.6
Intégrabilité sur une partie non bornée
L’extension de la notion d’intégrale de Denjoy-Perron à des parties non bornées de Rn lorsque n ≥ 2 est un problème délicat qui attend encore sa
solution définitive. Nous nous contenterons dès lors de développer cette
extension dans l’important cas particulier de la L-intégrabilité, en modelant
la définition sur une condition nécessaire et suffisante de L-intégrabilité sur
un borné obtenue dans l’étude de l’additivité complète.
Définition. Soit A une partie non bornée de Rn et f une fonction de Rn
dans Rp définie p.p. sur A. On dit que f est L-intégrable sur A si les conditions suivantes sont satisfaites.
1. f est L-intégrable sur Ak = A ∩ B∞ [0; k] pour chaque k ∈ N∗ .
H
2. limk→∞ Ak |f |2 existe.
La définition de l’intégrale de f sur A requiert le résultat suivant.
Proposition.
Si f est L-intégrable sur l’ensemble non borné A de Rn , alors
H
limk→∞ Ak f existe.
Démonstration. Pour chaque 1 ≤ j ≤ p et chaque x ∈ dom f, on a
0 ≤ fj+ (x) ≤ |fj (x)| ≤ |f (x)|2 , 0 ≤ fj− (x) ≤ |fj (x)| ≤ |f (x)|2 ,
13.6. INTÉGRABILITÉ SUR UNE PARTIE NON BORNÉE
509
et, puisque chacune de ces fonctions est L-intégrable sur Ak quel que soit
k ∈ N∗ , on a
0≤
J
Ak
fj+
≤
J
|f |2 , 0 ≤
Ak
J
Ak
fj−
≤
J
Ak
|f |2 ,
quels que soient k ∈ N∗ et 1 ≤ j ≤ p. Comme Ak ⊂ Ak+1 pour tout k ∈ N∗ ,
les suites
4J
5
4J
5
4J
5
fj+
,
fj−
,
|f |2
,
Ak
Ak
k∈N∗
k∈N∗
Ak
k∈N∗
sont croissantes pour chaque 1 ≤ j ≤ p et la dernière est convergente par
hypothèse. La convergence des autres découle
alors du test de comparaison
H
et entraı̂ne la convergence de chaque suite ( Ak fj )k∈N∗ , (1 ≤ j ≤ p), puisque
J
Ak
fj =
J
Ak
(fj+ − fj− ), 1 ≤ j ≤ p.
Définition. Si f est L-intégrable
sur l’ensemble non borné A de RnH , l’intéH
grale de f sur A, notée A f est l’élément de Rp défini par limk→∞ Ak f.
Exemples. 1. La fonction
constante 1 n’est pas L-intégrable sur Rn . Pour
H
∗
chaque k ∈ N , on a B∞ [0;k] 1 = (2k)n, et (2k)n → ∞ si k → ∞.
2. La fonction f de Rn dans R définie par
f (x) = 1, x ∈ B∞ [0; 1],
1
, x ∈ B∞ [0; k] \ B∞ [0; k − 1], k ≥ 2,
kn
est L-intégrable sur Rn . En effet, on a
f (x) =
J
J
f=
B∞ [0;k]
= 2 +k
n
et dès lors
−n


B∞ [0;1]
J
f = 2n ,
f+
B∞ [0;1]
k
$
j=2
(2j) −
n
lim
J
k
$
j=2
k J
$
f
j=2 B∞ [0;j]\B∞[0;j−1]
(2(j − 1))
k→∞ B∞ [0;k]

n
f = 2n+1 .
= 2n+1 − 2n k−n ,
510
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
Les propriétés élémentaires de la L-intégrale sur un borné, ainsi
que le test de comparaison s’étendent aussitôt, via la définition ci-dessus,
à l’intégrale sur une partie non bornée. Montrons qu’il en est de même pour
le théorème de convergence monotone de Levi.
Théorème. Soit A une partie non bornée de Rn et (fk )k∈N une suite de
fonctions de Rn dans R. Supposons satisfaites les conditions suivantes.
1. Chaque fk est définie p.p. et L-intégrable sur A.
2. La suite de fonctions
(fk )k∈N est monotone p.p. sur A.
H
3. La suite réelle ( A fk )k∈N converge.
Alors la suite de fonctions (fk )k∈N converge ponctuellement p.p. sur A vers
une fonction f définie p.p. et L-intégrable sur A, et l’on a
J
f = lim
J
k→∞ A
A
fk .
Démonstration. Supposons pour fixer les idées que (fk )k∈N soit croissante. En considérant la suite (fk − f0 )k∈N au lieu de (fk )k∈N , on peut
toujours, sans perte de généralité, supposer que fk (x)H ≥ 0 pour presque tout
x ∈ A et chaque k ∈ N. Si nous posons J = limk→∞ A fk , alors
J = lim
k→∞
&
lim
J
q→∞ Aq
'
fk .
Pour chaque q ∈ N∗ fixé, la convergence de la suite croissante (
résulte des inégalités
J
J
fk ≤
fk , k ∈ N,
Aq
H
Aq
fk )k∈N
A
et de l’hypothèse 3. On peut donc appliquer le théorème de Levi sur un borné
à la suite (fk )k∈N restreinte à Aq et en déduire l’existence d’une fonction f q
définie p.p. et L-intégrable sur Aq , telle que (fk )k∈N converge ponctuellement
p.p. sur Aq vers f q et telle que
J
Aq
f q = lim
J
k→∞ Aq
fk ≤ lim
J
k→∞ A
fk = J.
Notons aussi qu’on a nécessairement f q+1 = f q p.p. sur Aq pour chaque
q ∈ N∗ et que l’on peut ainsi définir p.p. sur A une fonction f par la relation
f = f q p.p. sur Aq , q ∈ N∗ . Cette fonction fH est évidemment
supérieure
H
ou égale à zéro p.p. sur A et, comme la suite ( Aq f )q∈N∗ = ( Aq f q )q∈N∗ est
croissante et majorée par J, elle converge et l’on a
lim
J
q→∞ Aq
f ≤ J.
13.6. INTÉGRABILITÉ SUR UNE PARTIE NON BORNÉE
Il reste à démontrer que
lim
J
q→∞ Aq
511
f = J.
Soit ! > 0; par l’expression de J comme double limite donnée plus haut, il
existe m ∈ N∗ tel que
J
J − (!/2) ≤ lim
q→∞ Aq
fk ≤ J,
lorsque k ≥ m. En conséquence, il existe r ∈ N∗ tel que
J −! ≤
J
Aq
fm ≤ J,
dès que q ≥ r. La croissance de la suite (fk )k∈N entraı̂ne alors que pour tout
q ≥ r et tout k ≥ m, on a
J−!≤
J
Aq
dès lors, pour tout q ≥ r, on aura
J − ! ≤ lim
J
fk ≤ J;
k→∞ Aq
fk ≤ J,
et la démonstration est complète.
Comme la définition et les propriétés correspondantes de l’intégration sur
un borné impliquent aisément que max(f, g) et min(f, g) sont L-intégrables
sur un non-borné de Rn lorsque les fonctions réelles f et g le sont, on peut
étendre à l’intégrale sur une partie non bornée la méthode utilisée dans le
cas d’un pavé fermé pour déduire le théorème de convergence majorée et
minorée de Lebesgue du théorème de Levi. Le théorème de convergence
majorée et minorée de Lebesgue tel qu’il est énoncé dans la section
précédente reste donc valable lorsque A est non borné.
Etendons maintenant la notion d’ensemble n-intégrable au cas non borné.
Définition. Soit A une partie non bornée de Rn . On dit que A est nintégrable si sa fonction
caractéristique 1A est L-intégrable sur Rn , auquel
H
cas le nombre positif Rn 1A est noté µ(A) et appelé sa n-mesure (sa longueur
si n = 1, son aire d’un ensemble plan si n = 2, son volume si n = 3).
Exemple. Soit A la partie non bornée de R2 définie par
A = ({0} × [0, 1]) ∪ {(x, y) : 0 ≤ y ≤ 1/k2 si x ∈]k − 1, k], k ∈ N∗ }.
512
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
Pour chaque k ∈ N∗ , on a
Ak = ({0} × [0, 1]) ∪ {(x, y) : 0 ≤ y ≤ 1/j 2 si x ∈]j − 1, j], 1 ≤ j ≤ k},
%
et dès lors Ak est 2-intégrable avec µ(Ak ) = kj=1 (1/j 2). Comme la série
%
2
j∈N∗ (1/j ) converge, A est 2-intégrable.
Les propriétés élémentaires des parties n-intégrables bornées ainsi
que les propriétés d’intégrabilité de l’intersection d’une suite décroissante de parties bornées n-intégrables s’étendent aussitôt, avec le même énoncé, au cas non borné. Dans le cas d’une suite croissante (Ak )k∈N de
!
parties non bornées, il faut remplacer l’hypothèse que k∈N Ak soit bornée
par la condition que (µ(Ak ))k∈N soit majorée et utiliser dans la démonstration la version que nous venons de donner du théorème de Levi. On
en déduit la sous-additivité complète de la mesure: si (Ak )k∈N est une
%
!
suite de parties n-intégrables et si n∈N µ(Ak ) converge, alors k∈N Ak est
!
%
n-intégrable et µ( k∈N Ak ) ≤ k∈N µ(Ak ). On vérifie également que les propriétés de L-intégrabilité pour la restriction à une partie n-intégrable
bornée ou non d’une fonction L-intégrable sur un ensemble non
borné, l’additivité finie ou complète de la L-intégrale et l’inégalité de
Tchebycheff s’étendent sans peine au cas non borné. Il en est de même
des propriétés des ensembles de n-mesure nulle et de l’équivalence
entre une partie n-négligeable et une partie de n-mesure nulle.
13.7
Ensembles et fonctions mesurables
L’extension suivante de la classe des parties n-intégrables de Rn joue un
grand rôle en analyse.
Définition. On dit qu’une partie A de Rn est n-mesurable si Ak = A ∩
B∞ [0; k] est n-intégrable pour chaque k ∈ N∗ .
A est donc n-mesurable si et seulement si la fonction 1A est intégrable
sur B∞ [0; k] pour chaque k ∈ N∗ . Toute partie n-intégrable de Rn est
évidemment n-mesurable, mais Rn , qui est évidemment n-mesurable puisque
chaque fermé borné B∞ [0; k] est n-intégrable, n’est pas n-intégrable puisque
µ(B∞ [0; k]) = (2k)n tend vers l’infini si k tend vers l’infini. Pour les parties bornées, il y a évidemment identité entre les parties n-intégrables et les
parties n-mesurables.
Proposition. Tout ouvert de Rn est n-mesurable.
13.7. ENSEMBLES ET FONCTIONS MESURABLES
513
Démonstration. Si E ⊂ Rn est ouvert et si k ∈ N∗ , alors
Ek = E ∩ B∞ [0; k] = (E ∩ B∞ (0; k)) ∪ (E ∩ fr B∞ [0; k])
est l’union d’un ouvert borné et d’une partie n-négligeable et est par conséquent n-intégrable.
Proposition. Tout fermé de Rn est n-mesurable.
Démonstration. Si F ⊂ Rn est fermé et si k ∈ N∗ , alors F ∩ B∞ [0; k] est
fermé et borné, et donc n-intégrable.
Corollaire. L’intérieur, l’adhérence et la frontière d’une partie quelconque
de Rn sont n-mesurables.
Donnons quelques propriétés élémentaires des ensembles n-mesurables.
Proposition. Si A, B et Ak , k ∈ N sont des parties n-mesurables de Rn ,
!
7
alors A \ B, k∈N Ak et k∈N Ak sont n-mesurables.
Démonstration. Conséquence immédiate de la définition et des propriétés
des parties n-intégrables.
Proposition. Toute partie n-mesurable contenue dans une partie n-intégrable est n-intégrable.
Démonstration. Soit A n-mesurable contenue dans B n-intégrable. Si
Ak = A ∩ B∞ [0; k], on a 1Ak (x) ≤ 1B (x) pour chaque x ∈ Rn , la suite
(1Ak )k∈N converge ponctuellement sur Rn vers 1A et 1B est L-intégrable sur
Rn . La thèse résulte du théorème de convergence majorée et minorée de
Lebesgue.
L’inégalité de Tchebycheff suggère l’introduction d’une classe de fonctions réelles qui sera aux fonctions réelles L-intégrables ce que les parties
n-mesurables sont aux parties n-intégrables.
Définition. Soit f une fonction de Rn dans R définie p.p. sur A ⊂ Rn . On
dit que f est n-mesurable sur A si, pour chaque r ∈ R l’ensemble
A[f > r] = {x ∈ A : f (x) > r}
est n-mesurable.
Proposition. Si f est n-mesurable sur A, alors A est n-mesurable.
Démonstration. On a A =
−k] est n-mesurable.
!
k∈N A[f
> −k] et chaque ensemble A[f >
514
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
On étend la définition aux fonctions à valeurs dans Rp en passant aux
composantes.
Définition. Soit f une fonction de Rn dans Rp définie p.p. sur A ⊂ Rn . On
dit que f est n-mesurable sur A si chaque composante fj de f est n-mesurable
sur A.
Il suffit donc d’étudier la n-mesurabilité des fonctions réelles. La terminologie est justifiée par le résultat suivant.
Proposition. Une partie A de Rn est n-mesurable si et seulement si la
fonction constante 1 est n-mesurable sur A.
Démonstration. La condition suffisante résulte de la Proposition qui
précède. Pour la condition nécessaire, A[1 > r], égal à A si r < 1 et vide si
r ≥ 1 est n-mesurable pour tout r ∈ R.
Les caractérisations suivantes des fonctions n-mesurables sont souvent
utiles.
Proposition. Soit f une fonction réelle définie p.p. sur une partie nmesurable A de Rn . Les quatre conditions suivantes sont équivalentes.
1. A[f > r] = {x ∈ A : f (x) > r} est n-mesurable pour chaque r ∈ R.
2. A[f ≥ r] = {x ∈ A : f (x) ≥ r} est n-mesurable pour chaque r ∈ R.
3. A[f < r] = {x ∈ A : f (x) < r} est n-mesurable pour chaque r ∈ R.
4. A[f ≤ r] = {x ∈ A : f (x) ≤ r} est n-mesurable pour chaque r ∈ R.
Démonstration. C’est une conséquence facile des relations, aisément
vérifiées,
A[f ≥ r] =
A[f ≤ r] =
"
k∈N∗
"
k∈N∗
A[f > r − (1/k)], A[f < r] = A \ A[f ≥ r],
A[f > r + (1/k)], A[f > r] = A \ A[f ≤ r],
et des propriétés élémentaires des parties n-mesurables.
Le résultat suivant montre que l’ensemble des fonctions n-mesurables est
stable pour de très nombreuses opérations d’algèbre et d’analyse.
Proposition. Si f et g sont des fonctions réelles n-mesurables sur A ⊂ Rn ,
et si (fk )k∈S est une famille finie ou une suite de telles fonctions, on a les
propriétés suivantes.
1. cf + b est n-mesurable sur A pour chaque b, c ∈ R.
2. f + g est n-mesurable sur A.
13.7. ENSEMBLES ET FONCTIONS MESURABLES
515
3. f 2 est n-mesurable sur A.
4. f g est n-mesurable sur A.
5. f est n-mesurable sur B pour toute partie n-mesurable B de A.
6. 1/f est n-mesurable sur A si f (x) /= 0 p.p. sur A.
7. La fonction supk∈S fk donnée par [supk∈S fk ](x) = supk∈S [fk (x)] est nmesurable sur A lorsqu’elle y est définie p.p..
8. La fonction inf k∈S fk donnée par [inf k∈S fk ](x) = inf k∈S [fk (x)] est nmesurable sur A lorsqu’elle y est définie p.p..
9. Si (fk )k∈N converge ponctuellement p.p. sur A vers f , alors f est nmesurable sur A.
10. f + , f − et |f |s sont n-mesurables sur A pour tout s > 0.
Démonstration. 1. Si c = 0, A[b > r] = A si r < b et est vide si r ≥ b; il
est donc n-mesurable. Si c > 0, on a A[cf + b > r] = A[f + (b/c) > r/c] =
A[f > (r − b)/c] qui est n-mesurable quel que soit r ∈ R. Si c < 0 on a
A[cf + b > r] = A[f + (b/c) < r/c] = A[f < (r − b)/c] et l’on conclut de
même.
2. Pour tout r ∈ R, on a A[f + g > r] = A[f > r − g]. Si f (x) > r − g(x),
il existe un rationnel q tel que f (x) > q > r − g(x), et réciproquement, s’il
existe un rationnel q tel que f (x) > q et r − g(x) < q, alors f (x) > r − g(x).
Par conséquent,
A[f > r − g] =
>
(A[f > q] ∩ A[r − g < q]),
q∈Q
et le résultat découle des propriétés des parties n-mesurables puisque Q est
dénombrable et les ensembles A[f > q] et A[r − g < q] sont n-mesurables.
3. Résulte de ce que A[f 2 > r] = A si r < 0 et
A[f 2 > r] = A[f > r 1/2] ∪ A[f < −r 1/2]
si r ≥ 0.
4. On a f g = (1/2)[(f +g)2 −f 2 −g 2 ] et le résultat découle des propriétés
1, 2 et 3.
5. Pour tout r ∈ R, B[f > r] = B ∩ A[f > r] est n-mesurable.
6. Notons tout d’abord que A[f = 0] = {x ∈ A : f (x) = 0} est nnégligeable et donc de n-mesure nulle, et dès lors A[f /= 0] = {x ∈ A :
f (x) /= 0} = A\A[f = 0] est n-mesurable. En outre, si r > 0, A[(1/f ) > r] =
A[f /= 0] ∩ A[f < (1/r)] est n-mesurable tandis que si r < 0, A[(1/f ) > r] =
A[(1/f ) > 0] ∪ A[f < (1/r)] est également n-mesurable. Enfin, A[(1/f ) >
0] = A[f > 0] est n-mesurable et le résultat s’ensuit.
516
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
!
7. Montrons que A[supk∈S fk > r] = k∈S A[fk > r] pour tout r ∈ R.
Si [supk∈S fk ](x) > r, il existe, par la caractérisation du supremum (ou
trivialement si S est fini) un k0 ∈ S tel que fk0 (x) − r > 0 et dès lors
x ∈ A[fk0 > r]. Réciproquement, si fk (x) > r pour un certain k ∈ S, alors
[supk∈S fk ](x) > r. La thèse en résulte aisément.
8. Soit r ∈ R. On montre comme ci-dessus que A[inf k∈S fk < r] =
!
k∈S A[fk < r] et l’on conclut de la même manière.
9. Un argument utilisé dans l’étude des tests de la racine ou du quotient
montre que, pour presque tout x ∈ A, on a
f (x) = inf ∗ sup fk (x) = sup inf fk (x),
m∈N k≥m
m∈N∗ k≥m
et la thèse résulte alors des propriétés 7 et 8.
10. On a f + = max(f, 0), f − = max(−f, 0), |f | = f + + f − , et la thèse
résulte des propriétés 7 et 2 et du raisonnement fait en 3 pour le cas de |f |s.
Donnons maintenant deux classes importantes de fonctions n-mesurables.
Proposition. Toute fonction réelle continue p.p. sur une partie n-mesurable A de Rn est n-mesurable sur A.
Démonstration. Si f est une telle fonction, sa continuité sur A \ B avec
B de n-mesure nulle entraı̂ne que pour chaque r ∈ R, (A \ B)[f > r] =
(A \ B) ∩ E pour un certain ouvert E de Rn . Comme tout ouvert est nmesurable, le résultat s’ensuit.
Proposition. Toute fonction réelle définie p.p. et L-intégrable sur une
partie n-mesurable A de Rn est n-mesurable sur A.
Démonstration. Si f est une telle fonction, on peut toujours, en passant
à f et f − , supposer sans perte de généralité que f (x) ≥ 0 pour presque
tout x ∈ A. Par hypothèse, f est L-intégrable sur l’ensemble n-mesurable
Ak = A ∩ B∞ [0; k] pour chaque k ∈ N∗ . Dès lors, si r > 0, l’inégalité de
Tchebycheff entraı̂ne la n-intégrabilité, et donc la n-mesurabilité de Ak [f >
r]; d’autre part, si r ≤ 0, Ak [f ≥ r] = Ak est également n-mesurable. Il en
!
résulte aussitôt que A[f ≥ r] = k∈N∗ Ak [f ≥ r] est n-mesurable quel que
soit r ∈ R.
+
La réciproque de cette proposition est fausse : la fonction constante 1
est n-mesurable sur Rn sans y être L-intégrable. Même si A est n-intégrable,
une fonction peut-être n-mesurable sur A sans y être L-intégrable. Ainsi, la
13.7. ENSEMBLES ET FONCTIONS MESURABLES
517
fonction f définie sur ]0, 1] par f (x) = 1/x est 1-mesurable sur ]0, 1] puisque
qu’elle y est continue alors qu’une application facile du théorème de Hake
montre qu’elle n’est pas intégrable sur ]0, 1]. Nous allons toutefois établir un
important test de comparaison de L-intégrabilité sur A pour les fonctions
n-mesurables sur A. Sa démonstration nécessite l’introduction de quelques
concepts et résultats préliminaires.
Définition. Soit E une partie de Rn et s une fonction de Rn dans Rp . On
dit que s est simple sur E si s est définie sur E et si s(E) est une partie finie
de Rp.
Si s est simple sur E, si s(E) = {y 1 , . . . , y r } et si Ej = s−1 ({y j }) = {x ∈
E : s(x) = y j }, 1 ≤ j ≤ r, on aura, pour tout x ∈ E,
s(x) =
r
$
1Ej (x).y j .
j=1
Par conséquent, toute fonction simple sur E peut s’écrire comme une somme
finie de produits, par des éléments de Rp , de fonctions caractéristiques de
parties de E qui partitionnent cet ensemble. Nous allons montrer que toute
fonction réelle définie sur un ensemble est la limite ponctuelle sur cet ensemble d’une suite de fonctions simples.
Proposition. Soit f une fonction réelle définie sur une partie E de Rn .
Alors il existe une suite (sk )k∈N∗ de fonctions simples sur E qui converge
ponctuellement sur E vers f et une suite (tk )k∈N∗ croissante sur E de fonctions simples et positives sur E convergeant ponctuellement sur E vers |f |.
Si f est bornée sur E, la suite ainsi obtenue converge uniformément sur E
vers f .
Démonstration. Supposons tout d’abord que f (x) ≥ 0 pour tout x ∈ E.
Définissons Ekj et Fk pour 1 ≤ j ≤ k.2k , k ∈ N∗ par
Ekj = {x ∈ E : 2−k (j − 1) ≤ f (x) < 2−k j}, Fk = {x ∈ E : f (x) ≥ k},
et sk : Rn → R par
sk (x) =
k
k.2
$
j=1
2−k (j − 1).1E j (x) + k.1Fk (x).
k
Etant donnés x ∈ E et ! > 0, choisissons m ∈ N∗ tel que m > f (x) et
2−m ≤ !; on aura donc f (x) < k pour tout k ≥ m et il existera donc un
518
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
1 ≤ j ≤ k.2k tel que x ∈ Ekj . En conséquence,
et donc
sk (x) = 2−k (j − 1), 2−k (j − 1) ≤ f (x) < 2−k j,
0 ≤ f (x) − sk (x) < 2−k ≤ 2−m ≤ !.
On voit ainsi que la suite (sk )k∈N∗ converge ponctuellement sur E vers f .
Notons en outre que si f est majorée par M sur E, la convergence sera
uniforme sur E puisqu’on pourra toujours prendre m > M et 2−m ≤ ! dans
le raisonnement ci-dessus. Montrons maintenant que la suite (sk )k∈N∗ est
croissante sur E. Soient x ∈ E et k ∈ N∗ ; si f (x) ≥ k + 1, alors, puisque
f (x) > k, on a
sk+1 (x) = k + 1 > k = sk (x);
si k ≤ f (x) < k + 1, il existe 2k+1 k ≤ j ≤ 2k+1 (k + 1) tel que
k ≤ 2−k−1 (j − 1) ≤ f (x) < 2−k−1 j,
et dès lors
sk+1 (x) = 2−k−1 (j − 1) ≥ k = sk (x);
enfin, si f (x) < k, il existera 1 ≤ j < k.2k+1 tel que
2−k−1 (j − 1) ≤ f (x) < 2−k−1 j,
et il existera 1 ≤ l < k.2k tel que
2−k (l − 1) ≤ f (x) < 2−k l,
ce qui entraı̂ne
Comme
sk+1 (x) = 2−k−1 (j − 1), sk (x) = 2−k (l − 1).
2(l − 1)2−k−1 ≤ f (x) < (2l)2−k ,
on a
et par conséquent,
2l − 2 = 2(l − 1) ≤ j − 1 < j ≤ 2l,
sk+1 (x) = 2−k−1 (j − 1) ≥ 2−k−1 2(l − 1) = 2−k (l − 1) = sk (x);
la croissance est démontrée.
Lorsque f (x) n’est pas positive pour tout x ∈ E, on applique séparément
la construction ci-dessus à f + et à f − et comme les suites associées respectivement à f + et à f − sont croissantes, leur somme sera croissante et
convergera ponctuellement sur E vers |f |.
13.7. ENSEMBLES ET FONCTIONS MESURABLES
519
Corollaire. Si f est une fonction réelle n-mesurable sur E ⊂ Rn , alors les
suites de fonctions simples construites dans la proposition précédente sont
formées de combinaisons linéaires de fonctions caractéristiques de parties
n-mesurables de E et sont donc n-mesurables sur E.
Démonstration. Supposons tout d’abord que f (x) ≥ 0 pour tout x ∈ E
et reprenons les notations de la démonstration de la proposition précédente.
Pour chaque r ≥ 0, posons Fr = {x ∈ E : f (x) ≥ r}, ce qui entraı̂ne aussitôt
que Fs ⊂ Fr si s > r, et Ekj = F2−k (j−1) \ F2−k j . On en déduit aussitôt que,
pour chaque k ∈ N∗ et chaque x ∈ Rn , on a
k
sk (x) =
2 k
$
j=1
2−k (j − 1)[1F2−k (j−1) − 1F2−k j (x)] =
k
2 k
$
j=2
2−k (j − 1)[1F2−k (j−1) − 1F2−k j (x)].
En vertu de la n-mesurabilité de f sur E, chaque fonction 1F2−k j et 1Fk est
n-mesurable, et le résultat s’en déduit. Si f n’est pas positive sur E, il suffit
de considérer séparément f + et f − .
Nous pouvons maintenant énoncer et démontrer un très utile test de
comparaison pour la L-intégrabilité des fonctions n-mesurables.
Théorème. Soit f une fonction réelle définie p.p. et n-mesurable sur A ⊂
Rn . S’il existe une fonction positive g L-intégrable sur A et telle que, pour
presque tout x ∈ A, on ait
|f (x)| ≤ g(x),
alors f est L-intégrable sur A.
Démonstration. Supposons tout d’abord que f soit positive p.p. sur A.
Par le corollaire ci-dessus, il existe une suite croissante (sk )k∈N∗ de fonctions
positives p.p. et n-mesurables sur A, explicitement donnée dans le corollaire,
qui converge ponctuellement p.p. sur A vers f . En outre, si l’on pose
Fr = {x ∈ A : f (x) ≥ r} et Gr = {x ∈ A : g(x) ≥ r}, on aura évidemment
Fr ⊂ Gr pour chaque r ∈ R. Comme l’inégalité de Tchebycheff entraı̂ne la nintégrabilité de Gr pour chaque r > 0, chaque ensemble Fr sera également nintégrable pour chaque r > 0. Dès lors, chaque fonction sk sera L-intégrable
sur A et telle que, pour presque tout x ∈ A, on a
0 ≤ sk (x) ≤ f (x) ≤ g(x), k ∈ N∗ ,
520
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
Le théorème de convergence majorée et minorée de Lebesgue entraı̂ne alors
la L-intégrabilité de f sur A. Si f n’est pas positive p.p. sur A, on applique le résultat que nous venons de démontrer séparément à f + et f − et
la démonstration est complète.
Corollaire. Toute fonction réelle n-mesurable sur A ⊂ Rn dont la valeur
absolue est L-intégrable sur A, est elle-même L-intégrable sur A.
Démonstration. Prendre g = |f | dans le test de comparaison.
On a aussi un intéressant résultat sur la L-intégrabilité d’un produit de
fonctions.
Corollaire. Si f est une fonction réelle L-intégrable sur A ⊂ Rn et g une
fonction réelle n-mesurable et bornée p.p. sur A, alors f g est L-intégrable
sur A.
Démonstration. On sait que f g est n-mesurable sur A et si M est un
majorant p.p. de |g| sur A, on aura, pour presque tout x ∈ A,
|f (x)g(x)| ≤ M |f (x)|,
et le test de comparaison permet de conclure puisque M |f | est L-intégrable
sur A.
Exemple. Soit f une fonction réelle L-intégrable sur I = [0, 2π]. Le dernier
corollaire implique que, pour chaque k ∈ N, les fonctions x 2→ f (x) cos kx
et x 2→ f (x) sin kx sont également L-intégrables sur I. Les nombres réels
a0 , ak , bk , k ∈ N∗ définis par les formules
a0 = (2π)−1
J
0
2π
f (x) dx, ak = π −1
bk = π −1
J
2π
0
J
2π
f (x) cos kx dx,
0
f (x) sin kx dx, k ∈ N∗ ,
sont appelés les coefficients de Fourier de f , et la série trigonométrique
correspondante
$
a0 +
(ak cos kx + bk sin kx)
k∈N∗
s’appelle la série de Fourier de f . L’étude de la convergence de cette
série est un problème délicat qui ne sera pas abordé ici. Ainsi, Andrej
N. Kolmogorov a donné en 1926 un exemple de fonction L-intégrable
sur I dont la série de Fourier diverge partout sur I ! Il a fallu attendre
521
13.7. ENSEMBLES ET FONCTIONS MESURABLES
1966 pour que Lennart Carleson démontre que la série de Fourier de
f converge ponctuellement p.p. sur I vers f sous l’hypothèse plus forte
que f soit 1-mesurable sur I et f 2 soit L-intégrable sur I (ce qui entraı̂ne
la L-intégrabilité de f sur I par le test de comparaison ci-dessus puisque
|f (x)| ≤ (1/2)(1 + |f (x)|2 )). Ce résultat avait été conjecturé par Nicolas
N.Lusin en 1913 ! Même pour le cas encore plus particulier d’une fonction
f continue sur I, on n’a pas nécessairement convergence ponctuelle partout
sur I de la série de Fourier de f vers f . Par contre, si f est de classe C 1 sur I
et si f (0) = f (2π), on peut démontrer que la série de Fourier de f converge
uniformément sur I vers f . La théorie des séries de Fourier et ses diverses
extensions ont joué et jouent encore un rôle absolument fondamental dans
le développement des mathématiques pures et appliquées.
Une autre conséquence utile du test de comparaison est le résultat suivant.
Corollaire. Si f est une fonction réelle continue sur un fermé borné A de
Rn , alors f est L-intégrable sur A.
Démonstration. A, fermé et borné, est n-intégrable et f , continue sur A,
y est n-mesurable. D’autre part, le théorème de Weierstrass entraı̂ne que f
est bornée sur A et la thèse résulte du test de comparaison ci-dessus et du
fait que toute fonction constante sur A y est L-intégrable.
Les notions de fonctions L-intégrables et n-mesurables permettent d’introduire de nouvelles notions de convergence pour les suites de fonctions: la
convergence en moyenne et la convergence en moyenne quadratique.
Définition. Si (fk )k∈N est une suite de fonctions de Rn dans Rp L-intégrables sur A (resp. n-mesurables sur A et telles que chaque |fk |22 soit Lintégrable sur A), et si f est une fonction de Rn dans Rp L-intégrable sur A
(resp. n-mesurable sur A et telle que |f |22 soit L-intégrable sur A), on dit que
(fk )k∈N converge en moyenne sur A (resp. converge en moyenne quadratique
sur A) vers f si la suite
4J
A
|fk − f |2
5
k∈N
(resp.
4J
A
|fk − f |22
5
)
k∈N
converge vers zéro.
On a également une notion importante de convergence pour les suites de
fonctions n-mesurables: la convergence en mesure.
Définition. Si (fk )k∈N est une suite de fonctions de Rn dans R n-mesurables sur A, on dit que (fk )k∈N converge en mesure sur A vers f si, pour
522
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
chaque k ∈ N suffisamment grand et chaque ! > 0, l’ensemble {x ∈ A :
|fk (x) − f (x)| ≥ !} est n-intégrable et si
lim µ ({x ∈ A : |fk (x) − f (x)| ≥ !}) = 0.
k→∞
Cette notion joue un rôle important en calcul des probabilités.
Le lien entre ces types de convergence et ceux déjà introduits sera étudié
au Chapitre 17.
13.8
Exercices
1. Montrer que tout borné n-intégrable de mesure non nulle contient un
ensemble qui n’est pas n-intégrable. Suggestion : soit E ⊂ B∞ [ρ] ⊂ Rn un
tel borné et définissons-y la relation d’équivalence x = y si et seulement
si x − y ∈ Qn ; soit (Eα)α∈A la partition correspondante de E en classes
d’équivalence; si x ∈ Eα, alors Eα = (x + Qn ) ∩ E est dénombrable et donc
n-négligeable; en déduire que A est non dénombrable (puisque µ(E) > 0);
par l’axiome du choix, on choisit, pour chaque α ∈ A, un xα ∈ Eα et l’on
définit F par F = {xα : α ∈ A}; F n’est pas dénombrable et, pour r ∈ Qn ,
on pose Fr = r + F (noter que Fr ∩ Fr" = ∅ si r /= r $ ) et
G=
>
>
Fr =
r∈Qn ; |r|∞ ≤2ρ
>
(xα + r) ⊃ E;
r∈Qn ; |r|∞ ≤2ρ α∈A
si F est n-intégrable, G l’est aussi et dès lors, si µ(F ) = 0, alors
µ(E) =
$
µ(Fr ) = 0,
r∈Qn , |r|∞ ≤2ρ
(contradiction), tandis que si µ(F ) > 0, alors
µ(G) ≤
$
µ(Fr ) = +∞,
r∈Qn , |r|∞ ≤2ρ
(contradiction); donc F n’est pas n-intégrable.
2. Soit f une fonction de Rn dans R et A ∈ Rn . Montrer que si |f | (resp.
f 2 ) est n-mesurable sur A, f ne l’est pas nécessairement.
Suggestion. Si E ⊂ Rn est une partie non n-intégrable (voir exercice précédent), alors f = 1E − 1Rn \E n’est pas n-mesurable sur Rn alors que |f | = 1
et f 2 = 1 le sont.
523
13.8. EXERCICES
3. Montrer que l’ensemble de Cantor défini aux Exercices du Chapitre 4
est 1-négligeable. Cela fournit un exemple d’ensemble 1-négligeable et non
dénombrable.
4. Montrer que si (fk )k∈N est une suite de fonctions de Rn dans R intégrables
sur A ⊂ Rn et telles que, pour presque tout x ∈ A, on ait, pour une certaine
fonction g de Rn dans R intégrable sur A,
fk (x) ≥ g(x) (resp. fk (x) ≤ g(x)), (k ∈ N),
alors, si
lim inf
k→∞
J
A
fk (resp. lim sup
k→∞
J
A
fk ),
existe et si la fonction lim inf k→∞ fk (resp. lim supk→∞ fk ) existe, cette
fonction est intégrable sur A et l’on a
J
lim inf fk ≤ lim inf
A k→∞
(resp.
J
A
k→∞
J
A
fk ,
lim sup fk ≥ lim sup
k→∞
k→∞
J
A
fk ).
Ce résultat s’appelle le lemme de Fatou. Considérant, pour fixer les idées, le
cas de lim inf et travaillant sur fk − g au lieu de fk , on peut supposer les fk
positives p.p. sur A. On notera que l’on a, p.p. sur A,
lim inf fk = lim
k→∞
k→∞
4
inf fj
j≥k
5
= lim
2
lim
k→∞ l→∞
4
min fj
k≤j≤l
53
,
et le lemme de Fatou se déduit de deux applications successives du théorème
de convergence monotone de Levi.
5. Montrer que si f est une fonction de Rn dans R et A une partie de Rn
telles que f soit mesurable sur A et |f |2 soit intégrable sur A, alors, pour
tout r > 0, on a, si Ar = {x ∈ A : |f (x)| > r},
µ(Ar ) ≤
1
r2
J
A
|f |2 .
(Inégalité de Tchebycheff pour les fonctions de carré intégrable). Cette
inégalité joue un grand rôle en calcul des probabilités: en appliquant ce
H
8
1
1
résultat à f − f , où f = µ(A)
A f, et en posant σ(f ) = µ(A)
on trouve
µ{x ∈ A : |f (x) − f | > tσ(f )}
1
≤ 2,
µ(A)
t
H
A |f
− f |2
91/2
,
524
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
ce qui donne une limite à la dispersion, autour de sa moyenne f , d’une
variable aléatoire f admettant un écart quadratique moyen σ(f ), et permet
de prouver la loi faible des grands nombres.
6. Montrer que si f est une fonction de Rn dans Rp L-intégrable sur Rn , alors
f n’a pas nécessairement de limite à l’infini, et n’est même pas nécessairement
bornée au voisinage de l’infini.
Suggestion. Utiliser le théorème de Hake pour montrer que la fonction de R
dans R définie par
f (x) =
∞
$
k=1
2k 1Yk−
1
2k
,k+
1
2k
:
est L-intégrable sur R alors qu’elle n’est pas bornée au voisinage de l’infini.
7. Montrer que si f est une fonction de Rn dans Rp L-intégrable sur Rp et
si limx→∞ f (x) existe, alors cette limite est nulle.
Suggestion. Si L = limx→∞ f (x) /= 0, il existe m ∈ N tel que |f (x)|2 ≥ |L|2 2
pour tout x ∈ Rn tel que |x|∞ ≥ m. En conséquence, pour tout k ≥ m,
J
B∞ [k]
≥
|f |2 =
J
B∞ [m]
J
B∞ [m]
|f |2 +
|f |2 +
J
B∞ [k]\B∞[m]
|f |2
|L|2
[(2k)n − (2m)n ] ,
2
H
ce qui montre que limk→∞ B∞ [k] |f |2 = ∞.
On comparera utilement les résultats des exercices 6 et 7 à ceux correspondants pour une série.
13.9
Petite anthologie
Tous les ensembles que nous considérerons seront formés de points compris
entre 0 et 1. Lorsqu’un ensemble sera formé de tous les points compris
dans une infinité dénombrable d’intervalles n’empiétant pas les uns sur les
autres et ayant une longueur totale s, nous dirons que l’ensemble a pour
mesure s. Lorsque deux ensembles n’ont pas de points communs, et que
leurs mesures sont s et s$ , l’ensemble obtenu en les réunissant, c’est-à-dire
leur somme, a pour mesure s + s$ . D’ailleurs il importe peu que dans la
définition de la mesure d’un ensemble, ou dans celle de la somme de deux ensembles, qu’on néglige ou qu’on tienne tel compte qu’on veut des extrémités
des intervalles, en infinité dénombrable. Plus généralement, si l’on a une
infinité dénombrable d’ensembles n’ayant deux à deux aucun point commun
13.9. PETITE ANTHOLOGIE
525
et ayant respectivement pour mesures s1 , s2 , . . ., sn , . . . , leur somme (ou ensemble formé par leur réunion) a pour mesure
s1 + s2 + . . . + sn + . . . .
Tout cela est une conséquence de la définition de la mesure. Voici maintenant des définitions nouvelles : si un ensemble E a pour mesure s, et
contient tous les points d’un ensemble E $ dont la mesure est s$ , l’ensemble
E − E $ , formé des points de E qui n’appartiennent pas à E $ , sera dit avoir
pour mesure s − s$ ; de plus, si un ensemble est la somme d’une infinité
dénombrable d’ensembles sans partie commune, sa mesure sera la somme
des mesures de ses parties et enfin les ensembles E et E $ ayant, en vertu de
ces définitions, s et s$ comme mesures, et E renfermant tous les points de
E $ , l’ensemble E − E $ aura pour mesure s − s$ .
Emile Borel, 1898
Nous nous proposons d’attacher à chaque ensemble borné un nombre positif ou nul que nous appellerons sa mesure et satisfaisant aux conditions suivantes :
1. Il existe des ensembles dont la mesure n’est pas nulle.
2. Deux ensembles égaux ont même mesure.
3. La mesure de la somme d’un nombre fini ou d’une infinité dénombrable
d’ensembles, sans points communs deux à deux, est la somme des mesures
de ces ensembles.
Nous ne résoudrons ce problème de la mesure que pour les ensembles que
nous appellerons mesurables.
Henri Lebesgue, 1902
Une fonction sera dite sommable si, quels que soient a et b, l’ensemble
des valeurs de x pour lesquelles on a a < f (x) < b est mesurable. Les
fonctions continues par rapport à l’ensemble des variables sont sommables.
La somme, le produit de deux fonctions sommables, la limite d’une suite
de fonctions sommables sont des fonctions sommables. Donc les fonctions
discontinues que Mr. Baire appelle fonctions de première classe, de seconde
classe, etc. sont sommables. Les fonctions de n variables continues par
rapport à chacune d’elles sont de n − 1e classe au plus, donc elles sont
sommables.
Henri Lebesgue, 1902
526
CHAPITRE 13. FONCTIONS ET ENSEMBLES MESURABLES
La question de l’existence des classes d’ensembles se ramène à celle des
classes de fonctions et réciproquement. ... Commençons par montrer la
dépendance des deux classifications. Soit E un ensemble mesurable (B).
Définissons une fonction φ(x) égale à 1 dans E et à 0 dans !E. Nous
l’appellerons la fonction caractéristique de E.
Charles-Jean de La Vallée Poussin, 1915
Chaque progrès avait consisté à estimer la mesure d’un ensemble E au
moyen de la longueur totale d’un ensemble d’intervalles couvrant E. Mais
on avait toujours pris ces intervalles parmi des intervalles choisis d’avance.
Borel a écrit lui-même que son point de départ a été de prendre, pour chaque
ensemble, des intervalles non seulement couvrant l’ensemble, mais dépendant
directement de cet ensemble. En prenant comme intervalles ceux qu’on obtient en divisant un segment en parties égales, Jordan arrivait à la conclusion que l’ensemble R des points d’abscisse rationnelle entre 0 et 1 avait
pour mesure l’unité. En attachant, avec Borel, à chaque point d’abcisse rationnelle rn un segment de longueur !/n2 , on constate que R est couvert
%
par un ensemble d’intervalles dont la longueur totale est ! n12 ; sa mesure
devant intuitivement être inférieure à ce total est aussi petite que l’on veut
avec !. Borel arrivait ainsi à cette conclusion, qui, à l’époque, a paru surprenante, que l’ensemble des nombres rationnels, pourtant dense partout,
était de mesure nulle. C’est par cet exemple que Borel a été conduit à la
notion générale de mesure.
Maurice Fréchet, 1965
Chapitre 14
Représentations et
transformations
14.1
Limites et continuité
Si f est une fonction de R dans R intégrable sur [a, b],H on sait que son
intégrale indéfinie est l’application F : [a, b] → R, x 2→ ax f (t) dt. Si nous
définissons g : [a, b] × [a, b] → R, (x, t) 2→ 1[a,x]f (t), l’intégrale indéfinie de f
peut encore se définir par la formule
F (x) =
J
b
a
g(x, t) dt.
On a vu précédemment que la fonction Gamma d’Euler était définie pour
chaque x ∈ ]0, ∞[ par la formule
Γ(x) =
J
+∞
0
tx−1 exp(−t) dt.
Si f est une fonction de Rn dans C L-intégrable sur Rn , la transformée de
Fourier de f est la fonction de Rn dans C définie par la formule
fˆ(x) =
J
Rn
exp[−2iπ(x|y)]f (y) dy.
Plus généralement, si, pour
p = (ξ1 + iη1 , . . . , ξn + iηn ) ∈ Cn ,
527
528
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
%
et y ∈ Rn , on pose (p|y) = nj=1 pj yj , et si f est une fonction de Rn dans C,
la transformée de Laplace de f est la fonction de Cn dans C définie sur
Γf = {p ∈ Cn : exp[−(p|·)]f est intégrable sur Rn }
par
Lf (p) =
J
Rn
exp[−(p|y)]f (y) dy.
Le potentiel du champ de gravitation créé par un corps matériel M de densité
variable ρ en un point x ∈ R3 extérieur à M est donné par la formule
V (x) = −G
J
M
ρ(y)
dy,
|x − y|2
où G désigne la constante de gravitation.
Les fonctions données dans tous ces exemples ont en commun d’être définies
à partir d’une fonction de plusieurs variables que l’on intègre, sur un ensemble fixe, par rapport à une partie des variables seulement. On les appelle
des représentations intégrales, des intégrales paramétriques ou des fonctions
définies par une intégrale. Dans toute ce chapitre, sauf mention contraire,
l’expression “intégrable sur B” devra se lire “L-intégrable sur B” lorsque B
est une partie non bornée contenue dans un espace vectoriel de dimension
supérieure ou égale à 2.
Si q ≥ 1 et s ≥ 1 sont des entiers tels que q + s = n, nous écrirons Rn
sous la forme Rq × Rs avec l’écriture correspondante x = (y, z) pour chaque
élément x de Rn .
Définition. Soit f une fonction de Rn dans Rp , A une partie de Rq et B
une partie de Rs . Si, pour chaque y ∈ A (resp. pour presque tout y ∈ A), la
fonction f (y, ·) de Rs dans Rp est intégrable sur B, alors l’application F de
A dans Rp définie (resp. définie p.p.) par
F (y) =
J
f (y, z) dz
B
est appelée une intégrale paramétrique ou une application définie par une
intégrale. On dit aussi que le membre de droite est une représentation
intégrale de F. Dans le cas particulier important où h est une fonction de Rs
dans C et K une fonction de Rn dans C telles que, pour chaque y ∈ A (resp.
pour presque tout y ∈ A), la fonction f (y, ·), avec f définie (resp. définie
529
14.1. LIMITES ET CONTINUITÉ
p.p.) sur A par f (y, z) = K(y, z)h(z), soit intégrable sur B, l’application
correspondante H définie (resp. définie p.p.) sur A par
H(y) =
J
K(y, z)h(z)dz
B
est appellée la transformée intégrale de h de noyau K. Lorsque g et h
sont des fonctions de Rq dans C telles que, pour presque tout y ∈ Rq , la
fonction f (y, ·), avec f définie par f (y, z) = g(y − z)h(z), est L-intégrable
sur
Rq , l’application correspondante g ∗ h définie p.p. sur Rq par (g ∗ h)(y) =
H
Rq g(y − z)h(z) dz s’appelle le produit de convolution de g et h.
Comme pour les fonctions définies par la limite d’une suite de fonctions
ou la somme d’une série de fonctions, il est intéressant de savoir sous quelles
conditions certaines propriétés de la fonction f sont conservées par F . En
passant, si nécessaire, aux composantes de F et f , on peut, sans perte de
généralité, supposer que p = 1.
Considérons tout d’abord le problème fondamental de l’existence d’une
limite pour F (y) lorsque y tend vers a ∈ adh A ou tend vers l’infini.
Proposition. Soit a ∈ adh A (resp. A non borné) et supposons satisfaites
les conditions suivantes.
1. f (y, ·) est intégrable sur B pour chaque y ∈ A.
2. limy→a, y∈A f (y, z) (resp. limy→∞, y∈A f (y, z)) existe pour presque tout
z ∈ B.
3. Il existe r > 0 et des fonctions réelles g et h intégrables sur B telles que,
pour tout y ∈ A ∩ B∞ [a; r] (resp. y ∈ !B∞ [0; r] ∩ A) et presque tout z ∈ B,
on a
g(z) ≤ f (y, z) ≤ h(z).
Alors la fonction ϕ définie presque partout sur B par
ϕ(z) =
lim
y→a, y∈A
f (y, z) (resp.
lim
y→∞, y∈A
f (y, z))
est intégrable sur B et
lim
y→a, y∈A
F (y) =
J
ϕ(z) dz (resp.
B
lim
y→∞, y∈A
F (y) =
J
ϕ(z) dz).
B
En d’autres termes, on a
lim
y→a, y∈A
2J
B
3
f (y, z) dz =
J 2
lim
B y→a, y∈A
3
f (y, z) dz
530
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
(resp.
lim
y→∞, y∈A
2J
3
f (y, z) dz =
B
J 2
B
lim
y→∞, y∈A
3
f (y, z) dz.
Démonstration. Considérons, pour fixer les idées, le cas où y → a. Soit
(yk )k∈N une suite dans A∩B∞ [a; r] qui converge vers a. La suite (f (yk , ·))k∈N
de fonctions intégrables sur B converge ponctuellement p.p. sur B vers ϕ et
est telle que
g(z) ≤ f (yk , z) ≤ h(z)
pour tout k ∈ N et presque tout z ∈ B. Le théorème de convergence majorée et minorée de Lebesgue entraı̂ne alors l’intégrabilité de ϕ sur B et les
relations
J
J
lim F (yk ) = lim
f (yk , z) dz =
ϕ(z) dz.
k→∞
k→∞ B
B
La proposition résulte du caractère local de la notion de limite et de sa
caractérisation par les suites.
Une conséquence facile de cette proposition est la continuité de F en a
lorsque f (·, z) est continue en a pour presque tout z ∈ B et que les hypothèses
1 et 3 sont vérifiées.
Corollaire. Supposons satisfaites les conditions suivantes.
1. f (y, ·) est intégrable sur B pour chaque y ∈ A.
2. f (·, z) est continue en a ∈ A pour presque tout z ∈ B.
3. Il existe r > 0 et des fonctions réelles g et h intégrables sur B tels que,
pour tout y ∈ B∞ [a; r] ∩ A et presque tout z ∈ B, on ait
g(z) ≤ f (y, z) ≤ h(z).
Alors F est continue en a.
Corollaire. Si f est continue sur A × B, A est ouvert et B est fermé et
borné, alors F est continue sur A.
Démonstration. Par hypothèse, f (y, ·) est continue sur B, et donc intégrable sur B pour chaque y ∈ A, et f (·, z) est continue sur A pour chaque
z ∈ B. D’autre part, si a ∈ A, il existe r > 0 tel que B∞ [a; r] ⊂ A et dès
lors, f étant continue sur le fermé borné B∞ [a; r] × B, il existe C > 0 tel
que
−C ≤ f (y, z) ≤ C
pour tout (y, z) ∈ B∞ [a; r] × B. Il suffit donc de prendre g = −C = −h dans
la Proposition précédente.
531
14.2. RÈGLE DE LEIBNIZ
14.2
Règle de Leibniz
Passons maintenant à la dérivabilité d’une fonction définie par une intégrale.
Le résultat suivant s’appelle la règle de Leibniz de dérivation sous le
signe d’intégration.
Proposition. Supposons que int A /= ∅ et que les conditions suivantes
soient satisfaites.
1. f (y, ·) est intégrable sur B pour chaque y ∈ A.
2. Il existe un entier 1 ≤ i ≤ q, un point a ∈ int A et un réel r > 0 tels que
B∞ [a; r] ⊂ A et tels que f (·, z) possède pour presque tout z ∈ B une dérivée
partielle par rapport à yi en chaque point y ∈ B∞ [a; r].
3. Il existe deux fonctions réelles g et h intégrables sur B telles que, pour
tout y ∈ B∞ [a; r] et presque tout z ∈ B, on ait
g(z) ≤ Dyi f (y, z) ≤ h(z).
Alors F possède en a une dérivée partielle par rapport à yi , Dyi f (a, ·) est
intégrable sur B et
J
Di F (a) =
Dyi f (a, z) dz.
B
En d’autres termes,
Di
2J
3
f (a, z) dz =
B
J
B
Dyi f (a, z) dz.
Démonstration. Soit ψ la fonction définie sur ([−r, r] \ {0}) × B par le
quotient différentiel
ψ(h, z) = h−1 [f (a + hei , z) − f (a, z)].
Par construction, ψ(h, ·) est intégrable sur B pour chaque h ∈ [−r, r] \ {0}
et
lim ψ(h, z) = Dyi f (a, z)
h→0, h(=0
pour presque tout z ∈ B. En outre, en appliquant le théorème de Lagrange
à la fonction h → f (a + hei , z), on obtient, pour chaque h ∈ [−r, r] et pour
presque tout z ∈ B un h$ ∈ R tel que 0 < |h$ | < |h| et
f (a + hei , z) − f (a, z) = hDyi (a + h$ ei , z).
En conséquence, par l’hypothèse 3, on a
g(z) ≤ ψ(h, z) ≤ h(z)
532
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
pour tout h ∈ [−r, r]\{0} et presque tout z ∈ B. On peut donc appliquer à ψ
la Proposition relative à la limite d’une intégrale paramétrique, qui implique
l’intégrabilité de Dyi f (a, ·) sur B et l’égalité
J
lim
h→0, h(=0 B
ψ(h, z) dz =
J
B
Dyi f (a, z) dz.
Comme on a évidemment
lim
J
h→0, h(=0 B
ψ(h, z) dz =
=
lim
1
h→0, h(=0 h
h→0, h(=0
lim
J
B
[f (a + hei , z) − f (a, z)] dz
h−1 [F (a + hei ) − F (a)],
on voit que DiF (a) existe et vaut
H
B
Dyi f (a, z) dz.
Corollaire. Si A est ouvert, B est fermé borné et s’il existe 1 ≤ i ≤ q
tel que, pour chaque (y, z) ∈ A × B, f possède une dérivée partielle par
rapport à yi en (y, z) et si la fonction dérivée partielle Dyi f est continue sur
A × B, alors F possède en chaque y ∈ A une dérivée partielle par rapport yi ,
la fonction dérivée partielle Di F est continue sur A et l’on a, pour chaque
y ∈ A,
J
Di F (y) =
B
Dyi f (y, z) dz.
Démonstration. Soit a ∈ A et r > 0 tels que B∞ [a; r] ⊂ A. Pour chaque
y ∈ B∞ [a; r], la fonction Dyi f (y, ·) est continue, et donc intégrable, sur B
et, Dyi f étant continue sur le fermé borné B∞ [a; r] × B, il existera C > 0
tel que
−C ≤ Dyi f (y, z) ≤ C
pour tout (y, z) ∈ B∞ [a; r] × B. Les conditions de la Proposition précédente
sont donc satisfaites. Le seul point qui n’en découle pas, à savoir la continuité
de DiF , est une conséquence de la formule de Leibniz et du Corollaire cidessus sur la continuité d’une intégrale paramétrique.
La règle de Leibniz peut être utilisée pour calculer certaines intégrales.
Pour montrer, par exemple que, si a et b sont strictement positifs, on a
J
0
+∞
exp(−ax) − exp(−bx)
b
dx = ln
x
a
il suffit de noter tout d’abord que les deux membres, considérés comme
fonctions de b, sont tous deux égaux (à zéro) si b = a. Ces fonctions seront
533
14.2. RÈGLE DE LEIBNIZ
donc égales pour tout b > 0 si leurs dérivées sont égales pour tout b > 0. Celle
du deuxième membre est égale à 1/b. En utilisant la règle
de Leibniz (vérifier
H
les hypothèses!), celle du premier membre est égale à 0+∞ exp(−bx) dx, et
donc à 1/b.
Comme autre exemple, montrons que cette règle jointe aux résultats
sur la limite d’une intégrale paramétrique permet de calculer l’intégrale de
Poisson
J ∞
exp(−x2 ) dx,
0
qui joue un rôle important en analyse et en calcul des probabilités. Cette
intégrale existe évidemment puisque l’intégrand est continu et tel que, pour
tout x ≥ 1, on a
exp(−x2 ) ≤ exp(−x),
le second membre de l’inégalité étant évidemment intégrable. Posons
f (y) =
4J
y
exp(−z ) dz
2
0
52
, g(y) =
J
1
0
exp[−y 2 (z 2 + 1)]
dz.
z2 + 1
Il est facile de voir que ces fonctions sont définies et continues pour tout
y ≥ 0, et que
f (0) = 0, g(0) =
J
0
1
dz
π
= arctg 1 = .
z2 + 1
4
On a, par les propriétés de dérivabilité d’une intégrale indéfinie et par la
règle de Leibniz (vérifier que les hypothèses sont satisfaites)
f $ (y) = 2
J
0
y
exp[−(y 2 + z 2 )] dz, g $ (y) = −2
J
1
y exp[−y 2 (z 2 + 1)] dz.
0
En particulier, si y > 0, on trouve, en posant t = zy, que
g $ (y) = −2
J
0
y
exp[−(y 2 + t2 )] dt = −f $ (y).
Donc la fonction f + g est constante sur ]0, +∞[, et comme elle est continue
en 0, on aura, pour tout y ≥ 0,
π
f (y) + g(y) = f (0) + g(0) = ,
4
ce qui entraı̂ne particulier que (justifier le passage à la limite sous le signe
intégral)
π
= lim [f (y) + g(y)]
y→+∞
4
534
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
=
4J
∞
0
=
4J
∞
52
+ lim
52
+
exp(−z 2 ) dz
exp(−z 2 ) dz
0
4J
=
J
exp[−y 2 (z 2 + 1)]
dz
z2 + 1
1
y→+∞ 0
∞
J
1
lim [
0 y→+∞
exp[−y 2 (z 2 + 1)]
] dz
z2 + 1
exp(−z 2 ) dz
0
52
.
On en déduit aussitôt la valeur de l’intégrale de Poisson
J
∞
exp(−x ) dx =
2
√
0
14.3
π
.
2
Théorème de Fubini
Passons maintenant au problème de l’intégrabilité d’une fonction définie par
une intégrale. Les “hypothèses naturelles” pour la validité de l’intégrabilité (c’est-à-dire l’analogue des “hypothèses naturelles” 1 et 2 des résultats
sur l’existence de la limite ou des dérivées pour F ) sont évidemment les
suivantes:
1. f (y, ·) est intégrable sur B pour presque tout y ∈ A.
2. f (·, z) est intégrable sur A pour presque tout z ∈ B.
En tenant compte de la symétrie de ces hypothèses par rapport aux deux
groupes de variables, la conclusion souhaitée,H qui doit évidemment respecter
cette symétrie, est que la fonction
F : y 2→ B f (y, z) dz soit intégrable sur
H
A, que la fonction G : z 2→ A f (y, z) dy soit intégrable sur B et que l’on ait
l’égalité
J
F (y) dy =
A
c’est-à-dire
J 2J
A
B
J
G(z) dz,
B
3
f (y, z) dz dy =
J 2J
B
A
3
f (y, z) dy dz.
Comme pour la limite et la dérivabilité, ces “hypothèses naturelles” ne suffisent pas à assurer la validité du résultat, ainsi que le montre l’exemple
suivant.
Exemple. Soit f la fonction réelle définie comme suit sur [0, 1] × [0, 1] :
f (y, z) = z −2 si 0 < y < z < 1, f (y, z) = −y −2 si 0 < z < y < 1
535
14.3. THÉORÈME DE FUBINI
et f (y, z) = 0 ailleurs dans [0, 1] × [0, 1]. On vérifie facilement que, pour
chaque 0 < z < 1, on a
J
1
f (y, z) dy =
0
et dès lors
J
0
J
z
0
1 2J 1
dy
−
z2
3
f (y, z) dy dz =
0
1
0
et dès lors,
J
0
1
f (y, z) dz = −
2J
1
3
J
0
y
z
J
dz
+
y2
f (y, z) dz dy =
0
1
1
dy
= 1,
y2
1 dz = 1.
0
De même, on a, pour chaque 0 < y < 1,
J
J
J
0
1
J
y
1
dz
= −1,
z2
(−1) dy = −1.
Il faut donc remplacer l’hypothèse “naturelle” par une hypothèse plus forte.
Celle-ci s’exprime dans le théorème de Fubini que nous commencerons par
énoncer et démontrer dans le cas où A et B sont des pavés fermés. L’importance de ce théorème proviendra également de ce qu’il nous permettra de
ramener le calcul d’une intégrale sur un pavé de Rn à une succession de n
intégrales sur des intervalles de R.
Soit I = J × K un semi-pavé de Rn , avec J ⊂ Rq et K ⊂ Rs des semipavés, q + s = n, et soit f une fonction de Rn dans R. Notons tout d’abord
que {y} × K̄ étant de n-mesure nulle pour chaque y ∈ J¯, toute fonction f
intégrable sur I¯ le reste, avec la même intégrale, si, pour un nombre fini et
même une infinité dénombrable de y, on remplace f (y, ·) par une fonction
quelconque de z, et en particulier une fonction non intégrable sur K̄. Par
conséquent, cette fonction modifiée montre que l’intégrabilité de f sur I¯
n’entraı̂ne pas celle de f (y, ·) sur K̄ pour tout y ∈ J¯. Le résultat qui suit
montre cependant que cette conclusion est valide pour presque tout y ∈ J¯.
Théorème. Si f est intégrable sur I¯ et si l’on pose
T = {y ∈ J¯ : f (y, ·) n’est pas intégrable sur K̄},
alors T est de q-mesure nulle.
Démonstration. Par la condition nécessaire et suffisante de Cauchy pour
l’intégrabilité de f (y, ·) sur K̄, on a
536
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
T = {y ∈ J¯ : il existe ! > 0 tel que, pour toute jauge δK sur K̄,
il existe deux P-partitions δK -fines ΠK et Π̃K de K telles que
S(K, f (y, ·), ΠK) − S(K, f (y, ·), Π̃K) > !}.
Si dès lors, pour chaque i ∈ N∗ , on pose
Ti = {y ∈ J¯ : pour toute jauge δK sur K̄,
il existe deux P-partitions δK -fines ΠK et Π̃K de K telles que
S(K, f (y, ·), ΠK ) − S(K, f (y, ·), Π̃K) > 1i },
!
alors Ti ⊂ Ti+1 ⊂ J¯, (i ∈ N∗ ), et T = i∈N∗ Ti . Par les propriétés de la
mesure, il suffit donc de prouver que chaque ensemble Ti est de q-mesure
nulle. Soit i ∈ N∗ et ! > 0 fixés. Nous allons montrer qu’il existe une jauge
δJ¯ sur J¯ telle que, pour toute P-partition δJ¯-fine Π de J, on a S(J, 1Ti , Π) ≤ !.
Pour cet !, la condition nécessaire et suffisante de Cauchy d’intégrabilité de
f sur I¯ entraı̂ne l’existence d’une jauge δ sur I¯ telle que
!
|S(I, f, Π) − S(I, f, Π̃)| ≤ ,
i
lorsque Π et Π̃ sont des P-partitions δ-fines de I. Pour chaque y ∈ J¯, δ(y, ·)
est une jauge sur K̄. Si y ∈ Ti , la définition de Ti implique l’existence de
deux P-partitions δ(y, ·)-fines de K
ΠyK = {(zyj , Kyj ) : 1 ≤ j ≤ my }, Π̃yK = {(z̃yl , K̃yl ) : 1 ≤ l ≤ m̃y },
telles que
1
S(K, f (y, ·), ΠyK ) − S(K, f (y, ·), Π̃yK) ≥ .
i
Posons
δJ (y) = min[ min δ(y, zyj ), min δ(y, z̃yl )].
1≤j≤my
Si y ∈ J¯ \ Ti , prenons
y
1≤l≤m̃y
y
ΠK = Π̃K = {(zyj , Kyj ) : 1 ≤ j ≤ my },
avec ΠyK une P-partition δ(y, ·)-fine quelconque de K, et posons
δJ (y) = min δ(y, zyj ).
1≤j≤my
8
Nous avons ainsi défini une jauge δJ sur J¯. Soit ΠJ = (y h , J h )
P-partition δJ -fine de J. Par construction et choix de la jauge,
Π=
?8
9
9
(y h , zyj h ), J h × Kyjh : 1 ≤ j ≤ myh , 1 ≤ h ≤ m
1≤h≤m
@
une
537
14.3. THÉORÈME DE FUBINI
et
Π̃ =
?8
9
(y h , z̃yj h ), J h × K̃yjh : 1 ≤ j ≤ m̃yh , 1 ≤ h ≤ m
sont des P-partitions δ-fines de I = J × K. Dès lors, on trouve
@
!
≥ |S(I, f, Π) − S(I, f, Π̃)|
i
#
m
#
m̃y h
#
# m
yh
$
$
#
#$
j
j
h 
h
h l
l #
#
=#
µ(J )
f (y , zyh )µ(Kyh ) −
f (y , z̃yh )µ(K̃yh ) #
#
#h=1
j=1
l=1
#
m
#
m̃y h
#
#
yh
$
$
$
#
#
j
j
h
h
h
l
l
= ##
µ(J ) 
f (y , zyh )µ(Kyh ) −
f (y , z̃yh )µ(K̃yh )##
#
#{1≤h≤m : yh ∈T }
j=1
l=1
i
#
#
#
#
$
#
#
h
h
= ##
µ(J h )[S(K, f (y h, ·), ΠyK ) − S(K, f (y h, ·), Π̃yK )]##
#{1≤h≤m : yh ∈T }
#
i
$
=
h
{1≤h≤m : yh ∈Ti}
≥
1
i
h
µ(J h )[S(K, f (y h, ·), ΠyK ) − S(K, f (y h, ·), Π̃yK )]
$
µ(J h ) =
{1≤h≤m : yh ∈Ti }
m
1$
1
1Ti (y h )µ(J h ) = S(J, 1Ti , ΠJ ).
i j=1
i
On a donc, 0 ≤ S(J, 1Ti , ΠJ ) ≤ !, et la démonstration est complète.
Le théorème queH nous venons de démontrer montre que la fonction F
¯ La deuxième partie
donnée par F (y) = K̄ f (y, z) dz est définie p.p. sur J.
du
théorème
de Fubini consiste à prouver l’intégrabilité de F sur J¯ et l’égalité
H
H
J¯ F = I¯ f.
¯ alors la fonction F définie p.p. sur J¯
Théorème. Si f est intégrable sur I,
par
J
F (y) =
f (y, z) dz
K̄
est intégrable sur J¯ et
J
J¯
F =
J
I¯
f,
ce qui s’écrit encore
J 2J
J¯
K̄
3
f (y, z) dz dy =
J
¯ K̄
J×
f.
538
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
Démonstration. Soit ! > 0. L’intégrabilité de f sur I¯ entraı̂ne l’existence
d’une jauge δ sur I¯ telle que, si Π et Π̃ sont des P-partitions δ-fines de I, on
a
#
J #
#
#
#S(I, f, Π) − f # ≤ !/4,
#
#
I¯
et
|S(I, f, Π) − S(I, f, Π̃)| ≤ !/4.
Avec les notations du théorème précédent, et en désignant encore par F une
extension quelconque de F à J¯, soit y ∈ T et soit
Π̄yK = {(z̄yj , K̄yj ) : 1 ≤ j ≤ my }
une P-partition fixée δ(y, ·)-fine de K. Posons
δ̃J (y) = min δ(y, z̄yj ),
1≤j≤my
Q1 = {y ∈ T : |F (y)| + |S(K, f (y, ·), Π̄yK)| ≤ 1},
Qk = {y ∈ T : k − 1 < |F (y)| + |S(K, f (y, ·), Π̄yK)| ≤ k}, k = 2, 3, . . .,
ce qui implique
T =
>
k∈N∗
Qk , Qk ∩ Ql = ∅ si k /= l.
On a donc, pour tout k ∈ N∗ et tout y ∈ Rq ,
1Qk (y) ≤ 1T (y),
et dès lors, pour toute P-partition ΠJ de J, on a
0 ≤ S(J, 1Qk , ΠJ ) ≤ S(J, 1T , ΠJ ).
Par le théorème précédent,
il existe une jauge δJk sur J¯ telle que, pour toute
A i i B
P-partition ΠJ = (y , J ) 1≤i≤m δJk -fine de J, on ait,
S(J, 1T , ΠJ ) ≤
!
,
k.2k+2
et dès lors
0≤
$
{1≤i≤m : y∈Qk }
µ(J i ) = S(J, 1Qk , ΠJ ) ≤
!
.
k.2k+2
539
14.3. THÉORÈME DE FUBINI
Si y ∈ T , il existe un et un seul Qk tel que y ∈ Qk ; on posera
δJ (y) = min{δ̃J (y), δJk (y)}.
Soit maintenant y ∈ J¯ \ T et soit
Π̃yK = {(z̃yj , K̃yj ) : 1 ≤ j ≤ m̃y }
une P-partition δ(y, ·)-fine de K; puisque f (y, ·) est intégrable sur K̄ et a
F (y) comme intégrale, on peut choisir une P-partition
Π̂ = {(ẑyl , K̂yl ) : 1 ≤ l ≤ m̂y }
δ(y, ·)-fine de K telle que
|S(K, f (y, ·), Π̂yK) − F (y)| ≤ (1/2)|S(K, f (y, ·), Π̃yK) − F (y)|.
Posons
δJ (y) = min
U
V
min δ(y, z̃yj ), min δ(y, ẑyl ) ,
1≤j≤m̃y
1≤l≤m̂y
¯
ce qui achève de définir uneA jauge δBJ sur J.
i
i
Soit maintenant ΠJ = (y , J ) 1≤i≤m une P-partition δJ -fine de J. Si
i
y ∈ T , posons
i
i
i
i
ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̄yK
et
Si y i ∈ J¯ \ T et
posons
Π̆yK = {(z̆yj i , K̆yji ) : 1 ≤ j ≤ m̆yi } = Π̄yK .
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) > 0,
i
i
ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̃yK ,
yi
j
yi
j
Π̆K = {(z̆yi , K̆yi ) : 1 ≤ j ≤ m̆yi } = Π̂K ,
tandis que si y i ∈ J¯ \ T et
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) ≤ 0,
posons
i
i
ΠyK = {(zyj i , Kyji ) : 1 ≤ j ≤ myi } = Π̂yK ,
540
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
i
Par construction,
i
Π̆yK = {(z̆yj i , K̆yji ) : 1 ≤ j ≤ m̆yi } = Π̃yK .
j
Π = {((y i, zyi ), J i × Kyi ) : 1 ≤ j ≤ myi , 1 ≤ i ≤ m}
et
Π̆ = {((y i, z̆yi ), J i × K̆yji ) : 1 ≤ j ≤ m̆yi , 1 ≤ i ≤ m}
sont des P-partitions δ-fines de I, ainsi qu’on le vérifie aisément, et dès lors
|S(I, f, Π) − S(I, f, Π̆)| ≤ !/4.
D’ailleurs, par construction on a aussi
S(I, f, Π) =
m
$
S(K, f (y i, ·), ΠyK )µ(J i )
m
$
S(K, f (y i, ·), Π̆yK )µ(J i ).
i=1
et
S(I, f, Π̆) =
i=1
D’autre part, on a
i
i
|S(I, f, Π) − S(J, F, ΠJ )|
= |S(I, 1T f, Π) + S(I, 1J̄\T f, Π) − S(J, 1T F, ΠJ ) − S(J, 1J\T
¯ F, ΠJ )|
≤ |S(I, 1T f, Π) − S(J, 1T F, ΠJ )| + |S(I, 1J̄\T f, Π) − S(J, 1J\T
¯ F, ΠJ )|.
Mais,
|S(I, 1T f, Π) − S(J, 1T F, ΠJ )|
≤
#
#
#
#
$
#
#
i
= ##
[S(K, f (y i, ·), ΠyK ) − F (y i )]µ(J i )##
#{1≤i≤m : yi ∈T }
#

∞ 
D
E
$
$
i
k=1

≤
{1≤i≤m : yi ∈Qk }
∞
$
k=1


$
|S(K, f (y
{1≤i≤m : yi ∈Qk }
D’ailleurs, si y i ∈ J¯ \ T et si
, ·), ΠyK )|
i

kµ(J i ) ≤ !
i
∞
$
+ |F (y )| µ(J )
k=1
i
1
2k+2
S(K, f (y i, ·), Π̃yK ) − F (y i ) > 0,
= !/4.
i



541
14.3. THÉORÈME DE FUBINI
alors
i
i
S(K, f (y i, ·), Π̂yK ) − F (y i ) ≤ (1/2)[S(K, f (y i, ·), Π̃yK ) − F (y i )],
et donc
i
i
0 < S(K, f (y i, ·), ΠyK ) − F (y i ) = S(K, f (y i, ·), Π̃yK ) − F (y i )
i
i
≤ 2[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )],
tandis que si y i ∈ J¯ \ T et si
i
S(K, f (y i, ·), Π̃yK ) − F (y i ) ≤ 0,
alors
i
i
−S(K, f (y i, ·), Π̂yK ) + F (y i ) ≤ (1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )];
cela entraı̂ne en particulier que
i
i
(−1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )] ≤ S(K, f (y i, ·), Π̂yK ) − F (y i ),
et dès lors,
i
i
|S(K, f (y i, ·), ΠyK ) − F (y i )| = |S(K, f (y i, ·), Π̂yK ) − F (y i )|
i
≤ (1/2)[F (y i) − S(K, f (y i, ·), Π̃yK )]
i
i
i
i
≤ S(K, f (y i, ·), Π̂yK ) − S(K, f (y i, ·), Π̃yK )
= S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK ).
En résumé, si y i ∈ J¯ \ T, on a
i
i
i
|S(K, f (y i, ·), ΠyK ) − F (y i )| ≤ 2[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )].
i
i
Comme, pour y i ∈ T, on a par construction Π̆yK = ΠyK , on a
S(I, f, Π) − S(I, f, Π̆) = S(I, 1J̄\T f, Π) − S(I, 1J̄\T f, Π̆)
=
$
i
i
[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )]µ(J i ).
¯ }
{1≤i≤m : yi ∈J\T
542
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
D’autre part,
|S(I, 1J̄\T f, Π) − S(J, 1J\T
¯ F, ΠJ )|
≤2
#
#
#
#
$
#
#
i
= ##
[S(K, f (y i, ·), ΠyK ) − F (y i )]µ(J i )##
#{1≤i≤m : yi ∈J\T
#
¯ }
$
i
i
[S(K, f (y i, ·), ΠyK ) − S(K, f (y i, ·), Π̆yK )]µ(J i )
¯ }
{1≤i≤m : yi ∈J\T
= 2[S(I, f, Π) − S(I, f, Π̆)] ≤ !/2.
Dès lors,
|S(I, f, Π) − S(J, F, ΠJ )| ≤ !/4 + !/2 = 3!/4,
et par conséquent,
#J
# #J
#
#
# #
#
# f − S(J, F, ΠJ )# ≤ # f − S(I, f, Π)# + |S(I, f, Π) − S(J, F, ΠJ )|
# ¯
# # ¯
#
I
I
≤ !/4 + 3!/4 = !.
En inversant le rôle des variables y et z, on obtient évidemment la version
duale du théorème de Fubini.
Théorème. Si f est intégrable sur I¯ et si l’on pose
S = {z ∈ K̄ : f (·, z) n’est pas intégrable sur J¯},
alors S est de s-mesure nulle, la fonction G définie p.p. sur K̄ par
J
G(z) =
J¯
est intégrable sur K̄ et
f (·, z) =
J
G=
K̄
J
J
I¯
J¯
f (y, z) dy
f,
ce qui s’écrit encore
J
K̄
2J
J¯
3
f (y, z) dy dz =
J
I¯
f.
Le résultat suivant montre que le calcul d’un intégrale sur un pavé de Rn
se ramène au calcul de n intégrales successives sur un intervalle fermé.
543
14.3. THÉORÈME DE FUBINI
Corollaire. Si f est une fonction de Rn dans Rp intégrable sur I¯ = I¯1 ×
. . . × I¯n , alors, pour toute permutation {i1 , . . . , in} de {1, . . ., n}, on a
J
I¯
f=
J
I¯in
,J
I¯in−1
,
...
,J
I¯i1
-
-
-
f (x1 , . . ., xn )dxi1 . . . dxin−1 dxin .
Démonstration. Elle consiste en des applications successives du théorème
de Fubini pour différentes décompositions de I¯ :
J
I¯
=
=
J
J
I¯i1 +1 ×...×I¯n
I¯i1 +1 ×...×I¯n
=
J
,J
f=
,J
J
(I¯1 ×...×I¯i1 )×(I¯i1 +1 ×...×I¯n )
I¯1 ×...×I¯i1
I¯1 ×...×I¯i1 −1
,J
I¯i1
I¯1 ×...×I¯i1 −1 ×I¯i1 +1 ×...×I¯n
f
-
f (x) dx1 . . . dxi1 dxi1 +1 . . . dxn
-
-
f (x) dxi1 dx1 . . . dxi1 −1 dxi1 +1 . . . dxn
,J
I¯i1
-
Zi . . . dxn ,
f (x) dxi1 dx1 . . . dx
1
Z signifie que l’expression dx manque. En écrivant
où dx
i1
i1
I¯1 × . . . × I¯i1 −1 × I¯i1 +1 × . . . × I¯n
sous la forme
(I¯1 × . . . × I¯i2 ) × (I¯i2 +1 × . . . × I¯n )
avec le terme I¯i1 omis dans celui des deux facteurs où il se trouve, on obtient,
en procédant exactement comme ci-dessus pour i1 ,
J
I¯
f=
avec
J ,J
J¯
I¯i2
,J
I¯i1
-
-
"
f (x) dxi1 dxi2 dx1 . . . dx"
min(i1 ,i2 ) . . . dxmax(i1 ,i2 ) . . . dxn ,
",i ) × . . . × Imax(i
",i ) × . . . × In .
J = I1 × . . . × Imin(i
1 2
1 2
En continuant de la sorte jusqu’à in , on obtient le résultat.
Remarque. Le théorème de Fubini est valable si l’on remplace partout
intégrable par L-intégrable. Pour le démontrer, il suffit d’appliquer les théorèmes ci-dessus à f et à |f |.
Nous allons maintenant étendre le théorème de Fubini au cas de l’intégrale sur une partie quelconque de Rn . Comme plus haut, dans le cas d’une
544
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
partie non bornée de Rn , intégrable signifiera L-intégrable. Fixons tout
d’abord les notations. Si C ⊂ Rn = Rq × Rs , posons
A = {y ∈ Rq : ∃z ∈ Rs : (y, z) ∈ C}, B = {z ∈ Rs : ∃y ∈ Rq : (y, z) ∈ C}.
Ce sont respectivement les projections orthogonales de C sur Rq et sur Rs .
Pour chaque y ∈ A, posons
B(y) = {z ∈ Rs : (y, z) ∈ C},
et pour chaque z ∈ B, posons
A(z) = {y ∈ Rq : (y, z) ∈ C}.
On notera que
C = {(y, z) : y ∈ A et z ∈ B(y)} = {(y, z) : z ∈ B et y ∈ A(z)},
et dès lors, pour tout x = (y, z) ∈ Rn = Rq × Rs , on a
1C (x) = 1C (y, z) = 1A (y)1B(y)(z) = 1A (z)(y)1B (z).
Nous pouvons maintenant énoncer et démontrer le théorème de Fubini
pour l’intégration sur une partie quelconque de Rn .
Théorème. Si f est intégrable (resp. L-intégrable) sur C ⊂ Rn , et si, avec
les notations ci-dessus, on pose
à = {y ∈ A : f (y, ·) n’est pas intégrable (resp. L-intégrable) sur B(y)},
B̃ = {z ∈ B : f (·, z) n’est pas intégrable (resp. L-intégrable) sur A(z)},
alors à est de q-mesure nulle, B̃ est de s-mesure nulle, la fonction F définie
p.p. sur A par
J
F (y) =
f (y, z) dz
B(y)
est intégrable (resp. L-intégrable) sur A, la fonction G définie p.p. sur B
par
J
G(z) =
f (y, z) dy
A(z)
est intégrable (resp. L-intégrable) sur B, et l’on a
J
A
F =
J
B
G=
J
C
f,
545
14.3. THÉORÈME DE FUBINI
ce qui s’écrit encore
J ,J
A
-
f (y, z) dz dy =
B(y)
J ,J
B
-
f (y, z) dy dz =
A(z)
J
f.
C
Démonstration. Supposons tout d’abord que C soit borné et soit I =
¯ Démontrons le résultat
J × K un semi-pavé de Rn = Rq × Rs tel que C ⊂ I.
sous l’hypothèse d’intégrabilité, le cas de la L-intégrabilité s’obtenant en
remplaçant partout “intégrable” par “L-intégrable” dans l’argument. Si f˜
¯ on a, pour presque tout x ∈ I,
¯
est un prolongement arbitraire de f à I,
˜
fC (x) = 1C (x)f(x),
¯ Par ailleurs,
et dès lors 1C .f˜ est intégrable sur I.
˜ ·) n’est pas intégrable sur K̄}
T = {y ∈ J¯ : 1C (y, ·)f(y,
˜ ·) n’est pas intégrable sur K̄}
= {y ∈ J¯ : 1A (y).1B(y)(·).f(y,
˜ ·) n’est pas intégrable sur B(y)}
= {y ∈ J¯ : 1A (y).f(y,
= {y ∈ A : f (y, ·) n’est pas intégrable sur B(y)} = Ã.
Par le théorème de Fubini pour un pavé fermé, T est de q-mesure nulle et il
en est donc de même pour Ã. L’autre cas se traite de manière analogue. En
appliquant la seconde partie du théorème de Fubini pour un pavé fermé, on
trouve que la fonction F̃ définie par
F̃ (y) =
= 1A (y)
J
J
K̄
˜ z) dz = 1A (y)
1C (y, z)f(y,
B(y)
f˜(y, z) dz = 1A (y)
est intégrable sur J¯ et que
J ,
J¯
1A (y)
J
J
B(y)
J
K̄
˜ z) dz
1B(y)(z)f(y,
f (y, z) dz = 1A (y)F (y)
-
f (y, z) dz dy =
B(y)
J
I¯
fC .
En d’autres termes, F est intégrable sur A et l’on a
J ,J
A
B(y)
-
f (y, z) dz dy =
J
f.
C
L’autre cas se traite d’une manière strictement analogue. Enfin, le cas de f
L-intégrable sur un ensemble C non borné se déduit aisément de la définition
de l’intégrale et du résultat pour le cas d’un ensemble borné.
546
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
L’application du théorème de Fubini à la fonction caractéristique d’un
ensemble fournit immédiatement le résultat suivant, où l’on conserve les
mêmes notations que ci-dessus.
Corollaire. Si C est une partie n-intégrable de Rn , et si l’on pose
à = {y ∈ A : B(y) n’est pas n-intégrable},
B̃ = {z ∈ B : A(z) n’est pas n-intégrable},
alors à est de q-mesure nulle, B̃ est de s-mesure nulle, la fonction définie
p.p. sur A par y 2→ µ(B(y)) est intégrable sur A, la fonction définie p.p. sur
B par z 2→ µ(A(z)) est intégrable sur B et l’on a
J
µ(B(y)) dy =
A
J
µ(A(z)) dz = µ(C).
B
Exemple. Si C = B2 (0; r) ⊂ R2 , alors
3 G
A = ] − r, r[, B(y) = −
L
r2
G
− y2 ,
r2
−
y2
2
,
et dès lors µ(B(y)) = 2 r 2 − y 2 et l’aire de B2 (0, r) vaut
µ(B2 (0, r)) = 2
J
r
−r
G
r 2 − y 2 dy = 2r 2
J
π/2
−π/2
G
1 − sin2 t cos t dt = πr 2 .
Montrons enfin que l’emploi simultané du théorème de Fubini et du test
de comparaison pour les fonctions n-mesurables conduit à un critère utile de
L-intégrabilité sur un ensemble pour des fonctions réelles n-mesurables sur
cet ensemble. C’est le critère de L-intégrabilité de Tonelli.
Théorème. Si f est une fonction réelle n-mesurable sur A ⊂ Rn et s’il
existe un groupement (y1 , y2 , . . . , yr ) de (x1 , x2, . . . , xn ) tel que l’expression
J
A1
,J
A2 (y1 )
...
,J
Ar−1 (y1 ,...,yr−2 )
,J
Ar (y1 ,...,yr−1 )
-
-
-
|f | dyr dyr−1 . . . dy2 dy1
ait un sens (c’est-à-dire telle que chacune des intégrales successives à partir
du centre existe), où, pour chaque 1 ≤ k ≤ r,
Ak (y1 , . . . , yk−1 )
= {yk : (y1 , . . . , yk , yk+1 , . . ., yr ) ∈ A pour un (yk+1 , . . . , yr ) au moins},
547
14.3. THÉORÈME DE FUBINI
alors f est L-intégrable sur A.
Démonstration. Soit (fk )k∈N la suite de fonctions réelles définies p.p. sur
A par
fk = min(|f |, k)1Ak , k ∈ N,
où Ak = A ∩ B∞ [k]. Cette suite converge ponctuellement p.p. sur A vers |f |
et l’on a
0 ≤ fk (x) ≤ fk+1 (x) ≤ |f (x)|
pour presque tout x ∈ A et tout k ∈ N. En outre, chaque fonction fk est
n-mesurable et bornée p.p. sur Ak par k. Elle est donc L-intégrable sur
Ak en vertu du test de comparaison pour les fonctions mesurables, et donc
L-intégrable sur A puisqu’elle est nulle sur l’ensemble n-mesurable A \ Ak . .
Enfin, par le théorème de Fubini, on a
J
A
=
J
A1
≤
J
A1
,J
...
A2 (y1 )
,J
...
A2 (y1 )
,J
Ar−1 (y1 ,...,yr−2 )
,J
Ar−1 (y1 ,...,yr−2 )
fk
,J
Ar (y1 ,...,yr−1 )
,J
Ar (y1 ,...,yr−1 )
-
-
-
fk dyr dyr−1 . . . dy2 dy1
-
-
-
|f | dyr dyr−1 . . . dy2 dy1 ,
H
pour chaque k ∈ N, ce qui montre que la suite croissante ( A fk )k∈N est
majorée, et donc convergente. Le théorème de convergence monotone de
Levi entraı̂ne donc l’intégrabilité sur A de |f | et, comme f est n-mesurable
sur A, un Corollaire du test de comparaison pour les fonctions mesurables
entraı̂ne sa L-intégrabilité.
Exemple. En guise d’application du critère de Tonelli, montrons que si
g et h sont des fonctions de Rn dans C L-intégrables sur Rn , alors leur
produit de convolution g ∗ h est défini p.p. sur Rn et est L-intégrable sur
Rn . Par hypothèse, g et h sont n-mesurables sur Rn et il en résulte que la
fonction f : (y, z) 2→ g(y − z)h(z) est 2n-mesurable sur R2n . D’autre part, en
utilisant l’invariance de l’intégrale pour une translation, on a, pour presque
tout z ∈ Rn ,
J
J
Rn
|g(y − z)| dy =
Rn
|g|,
et dès lors
J
Rn
|h(z)|
4J
Rn
|g(y − z)| dy
5
dz =
J
Rn
h(z)
4J
Rn
5
|g| dz
548
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
=
4J
Rn
|h|
5 4J
Rn
5
|g| .
Par le critère de Tonelli, f est L-intégrable sur R2n et, par le théorème
de Fubini, pour presque tout y ∈ Rn , la Hfonction z 2→ f (y − z)g(z) est Lintégrable sur Rn et la fonction g∗h : y 2→ Rn g(y−z)h(z) dz est L-intégrable
sur Rn , avec
4J
5 4J
5
J
Rn
14.4
g∗h=
g
Rn
Rn
h .
Transformations affines
Nous avons étudié précédemment l’effet d’un changement de variables sur
l’existence et le calcul des primitives d’une fonction de R dans Rp et nous en
avons déduit une formule donnant l’effet d’un changement de variable sur
le calcul de l’intégrale sur un intervalle fermé d’une fonction primitivable.
Nous allons étudier l’extension de ce résultat aux intégrales multiples.
Nous commencerons par le cas d’une transformation affine et considérerons tout d’abord une translation dans Rn , c’est-à-dire une application du
type
ta : Rn → Rn , x 2→ x + a,
pour un certain a ∈ Rn fixé. On notera que, pour tout x ∈ Rn , on a
det(ta )$x = det I = 1,
et l’on désignera par Jta (jacobien de ta ) l’application de Rn dans R définie
par Jta (x) = det(ta )$x.
Soit I un semi-pavé de Rn et f une
fonction de Rn dans Rp définie et
H
¯ Nous poserons J = ¯ f et nous désignerons par I − a le
intégrable sur I.
I
translaté
I − a = {x − a ∈ Rn : x ∈ I} = t−1
a (I)
de I par a. C’est évidemment un semi-pavé de Rn . Le résultat suivant a été
démontré parmi les propriétés élémentaires de l’intégrale.
¯ alors f ◦ ta = (f ◦ ta )|Jta |
Proposition. Si f est définie et intégrable sur I,
−1 ¯
¯
est intégrable sur ta (I) = I − a et
J
¯
I−a
J
f (· + a) =
¯
t−1
a (I)
J
¯
t−1
a (I)
f ◦ ta =
(f ◦ ta )|Jta | =
J
I¯
f.
549
14.4. TRANSFORMATIONS AFFINES
Passons maintenant au cas d’un automorphisme de Rn . Nous aurons
besoin des résultats suivants d’algèbre linéaire.
Lemme. Tout automorphisme de Rn peut s’obtenir comme composé d’un
nombre fini d’automorphismes élémentaires appartenant aux types suivants:
a. hr : x 2→ (rx1 , x2 , . . . , xn ), (r > 0);
b. s : x 2→ (−x1 , x2 , . . ., xn );
c. pkl : x = (x1 , . . . , xk , . . . , xl , . . . , xn ) 2→ (x1 , . . ., xl , . . ., xk , . . . , xn);
d. r : x 2→ (x1 + x2 , x2 , . . . , xn).
Lemme. Si L1 , . . . , Lm sont des endomorphismes de Rn ,, alors
det(L1 ◦ . . . ◦ Lm ) = (det L1 ). . . ..(det Lm ).
On notera que, pour tout x ∈ Rn , on a
Jhr (x) = det(hr )$x = det hr = r,
Js (x) = det s$x = det s = −1,
Jpkl (x) = det(pkl )$x = det pkl = −1,
Jr (x) = det rx$ = det r = 1.
La démonstration des formules de changement de variables pour les transformations hr , s et pkl est similaire. Considérons tout d’abord le cas de hr .
¯ alors r.(f ◦hr) = (f ◦hr )|Jr |
Proposition. Si f est définie et intégrable sur I,
¯
est intégrable sur h−1
(
I)
et
on
a
r
J
¯
h−1
r (I)
r.(f ◦ hr ) =
J
¯
h−1
r (I)
(f ◦ hr )|Jhr | =
J
I¯
f.
Démonstration. On notera tout d’abord que puisque
−1
h−1
r : x 2→ (r x1 , x2 , . . ., xn ),
n
¯
h−1
r (I) est un semi-pavé de R . Soit ! > 0; il existe une jauge δ sur I telle
que
|S(I, f, Π) − J|2 ≤ !.
−1
−1 ¯
Soit δ̃ la jauge définie sur
8 hr (I)
9 = hr (I) par δ̃ = c.(δ ◦ hr ) où c =
−1
j ˜j
min(1, r ), et soit Π̃ = (x̃ , I )
une P-partition δ̃-fine de h−1
r (I).
Posons
1≤j≤m
xj = hr (x̃j ), I j = hr (I˜j ), (1 ≤ j ≤ m).
550
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
Par construction, xj ∈ I¯j , (1 ≤ j ≤ m) et hr (I˜j ) est un semi-pavé contenu
dans I. En outre, puisque hr est une bijection de Rn sur Rn et que les
j
I˜j , (1 ≤ j ≤ m) partitionnent h−1
r (I), les I , (1 ≤ j ≤ m) partitionnent I.
Enfin, les relations
I˜j ⊂ B∞ [x̃j ; δ̃(x̃j )], (1 ≤ j ≤ m),
entraı̂nent, si I˜j = I˜1j × . . . × I˜nj et I j = I1j × . . . × Inj , les inclusions
I˜kj ⊂ [x̃jk − δ(x̃j ), x̃jk + δ(x̃j )], (1 ≤ k ≤ n, 1 ≤ j ≤ m).
Dès lors, si 2 ≤ k ≤ n, on a
Ikj = I˜kj ⊂ [x̃jk − δ̃(x̃j ), x̃jk + δ̃(x̃j )] = [xjk − cδ(hr (x̃j )), xjk + cδ(hr (x̃j ))]
j
j
j
j
= [xk − cδ(xj ), xk + cδ(xj ))] ⊂ [xk − δ(xj ), xk + δ(xj )],
tandis que, si k = 1, on a
I1j = r I˜1j ⊂ [rx̃j − r δ̃(x̃j ), rx̃j + r δ̃(x̃j )] = [xj1 − δ(xj ), xj1 + δ(xj )].
Dès lors I j ⊂ B∞ [xj ; δ(xj )] pour chaque 1 ≤ j ≤ m et Π = {(x1 , I 1), . . . , (xm, I m)}
est une P-partition δ-fine de I. En conséquence, si l’on note en outre que
µ(I j ) = rµ(I˜j ) pour chaque 1 ≤ j ≤ m, on obtient
#
#
#$
#
m
#
#
−1
j
j
˜
#
|S(hr (I), r.(f ◦ hr ), Π̃) − J|2 = #
rf (hr (x̃ ))µ(I ) − J ##
#j=1
#
2
#
#
#m
#
#$
#
j
j
= ##
f (x )µ(I ) − J ## = |S(I, f, Π) − J|2 ≤ !,
#j=1
#
2
et la démonstration est complète.
Considérons maintenant le cas des transformations de type s.
¯ alors f ◦ s = (f ◦ s)|Js |
Proposition. Si f est définie et P-intégrable sur I,
−1 ¯
est P-intégrable sur s (I) et l’on a
J
¯
s−1 (I)
f ◦s=
J
¯
s−1 (I)
(f ◦ s)|Js | =
J
I¯
f.
Démonstration. Notons tout d’abord que si I = I1 × . . . × In avec Ii =
]ai , bi], 1 ≤ i ≤ n, alors, puisque s−1 = s, on a
s−1 (I) = s(I) = (−I1 ) × I2 × . . . × In = [−b1 , −a1 [ ×I2 × . . . × In ,
551
14.4. TRANSFORMATIONS AFFINES
n’est pas un semi-pavé, mais
¯ = s−1 (I) = K̄,
s−1 (I)
si K = K 1 × . . . × K n désigne le semi-pavé ] − b1 , −a1 ] × I2 × . . . × In . Il
¯ remplacé par K̄. Si ! > 0
suffit donc de démontrer le théorème avec s−1 (I)
est donné, il existe une jauge δ sur I¯ telle que
|S(I, f, Π) − J|2 ≤ !
pour toute P-partition
δ-fine BΠ de I. Définissons la jauge δ̃ sur K̄ par
A
δ̃ = δ ◦ s, et soit Π̃ = (x̃j , K j ) 1≤j≤m une P-partition δ̃-fine de K̄. On peut,
sans perte de généralité, supposer les K j = K1j × . . .× Knj numérotés de telle
sorte que K1j =]cj , cj+1 ], avec c1 = −b1 , cm+1 = −a1 , cj < cj+1 , (1 ≤ j ≤ m).
Posons, pour chaque 1 ≤ j ≤ m,
j
j
xj = s(x̃j ), I j = I1 × . . . × Inj = ] − cj+1 , −cj ] × I2 × . . . × Inj .
De la relation
−b1 = c1 < c2 < . . . < cm < cm+1 = −a1 ,
on tire aussitôt
a1 = −cm+1 < −cm < . . . < −c2 < −c1 = b1 ,
et les I j , (1 ≤ j ≤ m) partitionnent I. D’ailleurs, par construction, xj ∈ I¯j
pour chaque 1 ≤ j ≤ m et, des relations
K j ⊂ B∞ [x̃j ; δ̃(x̃j )], 1 ≤ j ≤ m,
on déduit aisément, pour 2 ≤ k ≤ n,
Ikj = Kkj ⊂ [x̃jk − δ̃(x̃j ), x̃jk + δ̃(x̃j )] = [xjk − δ(s(x̃j )), xjk + δ(s(x̃j ))]
et, pour k = 1,
= [xjk − δ(xj ), xjk + δ(xj )],
I1j =] − cj+1 , −cj ] ⊂ [−cj+1 , −cj ] = −K1j
= −K1j ⊂ [−x̃j1 − δ̃(x̃j ), −x̃j1 + δ̃(x̃j )]
552
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
= [xj1 − δ(s(x̃j )), xj1 + δ(s(x̃j ))] = [xj1 − δ(xj ), xj1 + δ(xj )].
Donc Π = {(x1 , I 1), . . . , (xm, I m)} est une P-partition δ-fine de I telle que,
pour chaque 1 ≤ j ≤ m, on a µ(I j ) = µ(I˜j ). En conséquence,
#
#
#m
#
#$
#
|S(K, f ◦ s, Π̃) − J|2 = ##
f (s(x̃j ))µ(I j ) − J ##
#j=1
#
2
#
#
#$
#
#m
#
j
j
= ##
f (x )µ(I ) − J ## = |(S(I, f, Π) − J|2 ≤ !,
#j=1
#
2
et la démonstration est complète.
n.
Considérons pour suivre le cas de la transformation pkl avec 1 ≤ k < l ≤
¯ alors f ◦pkl = (f ◦pkl )|Jp |
Proposition. Si f est définie et intégrable sur I,
kl
−1 ¯
est intégrable sur pkl (I) et l’on a
J
¯
p−1
(I)
kl
f ◦ pkl =
J
¯
p−1
(I)
kl
f ◦ pkl |Jpkl | =
J
I¯
f.
Démonstration. Notons tout d’abord que p−1
kl = pkl et dès lors, si I =
I1 × . . . × In , alors
p−1
kl (I) = I1 × . . . × Il × . . . × Ik × . . . × In
est un semi-pavé de Rn . Soit ! > 0 et δ une jauge sur I¯ telle que |S(I, f, Π)−
J|2 ≤ ! pour toute P-partition δ-fine Π de I. Définissons
la 9jauge δ̃ sur
8
−1
−1 ¯
j ˜j
pkl (I) = pkl (I) par la relation δ̃ = δ ◦ pkl , et soit Π̃ = (x̃ , I )
une
P-partition δ̃-fine de p−1
kl (I). Posons, pour chaque 1 ≤ j ≤ m,
1≤j≤m
j
j
j
xj = pkl (x̃j ), I j = pkl (I j ) = I˜1 × . . . × I˜l × . . . × I˜k × . . . × I˜nj ,
ce qui implique aussitôt µ(I j ) = µ(I˜j ) et xj ∈ I¯j , 1 ≤ j ≤ m. D’ailleurs,
puisque pkl est une bijection de Rn sur Rn et que les I˜j partitionnent p−1
kl (I),
les I j partitionnent I. Enfin, puisque I˜j ⊂ B∞ [x̃j ; δ̃(x̃j )], 1 ≤ j ≤ m, on a,
pour chaque i /= k et /= l compris entre 1 et n,
Iij = I˜ij ⊂ [x̃ji − δ̃(x̃j ), x̃ji + δ̃(x̃j )] = [xji − δ(pkl (x̃j )), xji + δ(pkl (x̃j ))]
= [xji − δ(xj ), xji + δ(xj )],
553
14.4. TRANSFORMATIONS AFFINES
tandis que, si i = k,
j
j
j
j
j
j
Ik = I˜l ⊂ [x̃l − δ̃(x̃j ), x̃l + δ̃(x̃j )] = [xK − δ(xj ), xk + δ(xj )],
et de même,
Ilj ⊂ [xjl − δ(xj ), xjl + δ(xj )].
Donc Π = {(x1 , I 1 ), . . ., (xm, I m)} est une P-partition δ-fine de I, ce qui
entraı̂ne
#
#
#m
#
$
#
#
−1
j
j
#
˜
|S(pkl (I), f ◦ pkl , Π̃) − J|2 = #
f (pkl (x̃ ))µ(I ) − J ##
#j=1
#
2
#
#
#m
#
#$
#
j
j
#
=#
f (x )µ(I ) − J ## = |S(I, f, Π) − J|2 ≤ !,
#j=1
#
2
et achève la démonstration.
Le cas de la transformation r diffère substantiellement des précédents
par le fait que, si I = I1 × . . . × In , l’adhérence de
r −1 (I) = {x ∈ Rn : x1 + x2 ∈ I1 , x2 ∈ I2 , . . . , xn ∈ In }
n’est pas un pavé fermé de Rn , ce qui exclut un traitement direct à partir de
la définition d’intégrabilité sur un pavé fermé. En fait, on peut construire
un exemple de fonction f de R2 dans R qui est intégrable (mais non Lintégrable) sur l’adhérence I¯ d’un semi-pavé I de R2 et telle que f ◦ r ne
¯ (c’est-à-dire telle que f ◦ r ne soit intégrable
soit pas intégrable sur r −1 (I)
¯
sur aucun pavé fermé contenant r −1 (I)).
On a toutefois une formule de
changement de variable pour une transformation de type r lorsque f est
¯
L-intégrable sur I.
¯ alors f ◦ r = (f ◦ r)|Jr | est LProposition. Si f est L-intégrable sur I,
−1 ¯
intégrable sur r (I) et l’on a
J
¯
r −1 (I)
f ◦r =
J
¯
r −1 (I)
(f ◦ r)|Jr | =
J
I¯
f.
¯ sont nDémonstration. Les fonctions f et |f |2 , L-intégrables sur I,
¯
¯
mesurables sur I et dès lors f ◦ r et |f ◦ r|2 sont n-mesurables sur r −1 (I).
En vertu du théorème de Fubini, on a
J
I¯
f=
J
I¯2 ×...×I¯n
2J
I¯1
3
f (x1 , x2 , . . . , xn ) dx1 dx2 . . . dxn ,
554
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
et pour les (x2 , . . ., xn ) pour lesquels f (·, x2 , . . ., xn ) est L-intégrable sur I¯1 ,
la première proposition de cette section entraı̂ne la L-intégrabilité sur I¯1 −x2
de la fonction f (· + x2 , x2 , . . . , xn ) et les égalités
J
I¯1
f (x1 , x2 , . . ., xn ) dx1 =
=
J
I¯1 −x2
J
I¯1 −x2
f (x1 + x2 , x2 , . . . , xn) dx1
(f ◦ r)(x1 , . . ., xn ) dx1 .
Par conséquent, (f ◦r)(·, x2, . . . , xn ) est L-intégrable sur I¯1 −x2 pour presque
tout (x2 , . . . , xn) ∈ I¯2 × . . . × I¯n et l’on a l’égalité
J
I¯
f=
J
I¯2 ×...×I¯n
2J
I¯1 −x2
3
(f ◦ r)(x1 , . . . , xn) dx1 dx2 . . . dxn .
On montre de la même manière que |f ◦ r|2 (·, x2, . . . , xn ) est L-intégrable sur
I¯1 − x2 pour presque tout (x2 , . . . , xn ) ∈ I¯2 × . . . × I¯n et que
J
I¯
|f |2 =
J
I¯2 ×...×I¯n
2J
I¯1 −x2
3
|f ◦ r|2 (x1 , . . . , xn) dx1 dx2 . . . dxn .
Le critère de Tonelli implique alors que f ◦ r est L-intégrable sur l’ensemble
¯
{x ∈ Rn : x1 ∈ I¯1 − x2 , x2 ∈ I¯2 , . . . , xn ∈ I¯n } = r −1 (I),
H
et la dernière formule obtenue pour I¯ f avec une nouvelle application du
¯ fournit l’égalité
théorème de Fubini à la fonction f ◦ r sur r −1 (I)
J
¯
r −1 (I)
la démonstration est complète.
f ◦r =
J
I¯
f;
En combinant les résultats d’algèbre linéaire rappelés plus haut et les
propositions que nous venons de démontrer, nous obtenons aussitôt le théorème du changement de variable affine dans une intégrale suivant.
Théorème. Si f est L-intégrable sur I¯ et si
g : Rn → Rn , x 2→ g(x) = a + A(x)
avec a ∈ Rn et A est un automorphisme de Rn , alors (f ◦g)|Jg | = (f ◦g)| det A|
¯ et l’on a
est L-intégrable sur g −1 (I)
J
¯
g −1 (I)
(f ◦ g)|Jg | =
J
I¯
f.
Une conséquence utile de ce théorème fournit une expression pour la
mesure du transformé d’un pavé fermé par une application affine.
555
14.5. DIFFÉOMORPHISMES
Corollaire. Si I est un semi-pavé de Rn et h : Rn → Rn , x 2→ a + A(x) est
¯ est n-intégrable et l’on
une application affine telle que det A /= 0, alors h(I)
a
¯ = | det A|µ(I)
¯ = |Jh |µ(I).
¯
µ(h(I))
Démonstration. Appliquons le théorème précédent à f = 1 et g = h−1 .
On a donc, pour tout x ∈ Rn ,
g(x) = −A−1 a + A−1 (x),
et dès lors
Jg (x) = det A−1 = (det A)−1 , f ◦ g = 1 ◦ g = 1.
Par le théorème précédent, (f ◦ g)|Jg | = | det A|−1 (et donc toute fonction
¯ = h(I)
¯ et l’on a
constante) est L-intégrable sur g −1 (I)
J
¯
h(I)
| det A|
−1
=
J
I¯
1.
¯ est n-intégrable et
Par conséquent, h(I)
¯ = | det A|µ(I).
¯
µ(h(I))
14.5
Difféomorphismes
L’extension du théorème de changement de variables à certaines transformations non affines requiert quelques résultats préliminaires.
Définition. Soit E un ouvert non vide de Rn et g une application de E
dans Rn . On dit que g est un difféomorphisme de E sur g(E) si g est une
bijection de E sur l’ouvert g(E) telle que g et g −1 soient de classe C 1 sur E
et g(E) respectivement.
Soit E un ouvert non vide de Rn , g un difféomorphisme de E sur g(E).
Comme g −1 ◦ g = I entraı̂ne Jg−1 (x).Jg (x) = 1, on aura Jg (x) /= 0 pour tout
x ∈ E.
556
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
Lemme. Soit η > 0 donné. Pour chaque a ∈ E, il existe δ(a) > 0 tel que,
pour tout semi-cube I de côté c pour lequel
a ∈ I¯ ⊂ B∞ [a; δ(a)],
on a
g(I) ⊂ h(I $ ),
où h est l’application affine de Rn dans Rn définie par
h(x) = g(a) + ga$ (x − a),
et I $ est le semi-cube de Rn concentrique à I et de côté (1 + η)c.
Démonstration. Puisque (ga$ )−1 existe et est linéaire, il existe une constante b = b(a) > 0 telle que
|(ga$ )−1 (x)|∞ ≤ b|x|∞
pour tout x ∈ Rn . Soit σ ∈ ]0, η/2b[ ; comme g est dérivable en a, il existe δ(a) > 0 (que l’on peut toujours supposer suffisamment petit pour que
B∞ [a; δ(a)] ⊂ E puisque E est ouvert) tel que
|g(x) − h(x)|∞ = |g(x) − g(a) − ga$ (x − a)|∞ ≤ σ|x − a|∞
pour tout x ∈ B∞ [a; δ(a)]. Soit I un semi-cube tel que
a ∈ I¯ ⊂ B∞ [a; δ(a)],
et soit y ∈ g(I). Il existe un et un seul x ∈ I ⊂ B∞ [a; δ(a)] tel que y = g(x)
et, h étant une bijection de Rn sur Rn , il existe un et un seul u ∈ Rn tel que
y = h(u). Si nous posons v = h(x), nous obtenons
et dès lors
y − v = h(u) − h(x) = ga$ (u − x),
|u − x|∞ = |(ga$ )−1 (y − v)|∞ ≤ b|y − v|∞ = b|g(x) − h(x)|∞ ≤ bσ|x − a|∞ .
¯ on a |x − a|∞ ≤ c, et dès lors
Mais, puisque x ∈ I et a ∈ I,
|u − x|∞ ≤ bσc < (η/2)c,
ce qui implique, si w désigne le centre de I, que
|u − w|∞ ≤ |u − x|∞ + |x − w|∞ < (η/2)c + c/2 = (c/2)(1 + η).
Donc u appartient au semi-cube I $ de centre w et de côté (1 + η)c et y =
h(u) ∈ h(I $ ).
557
14.5. DIFFÉOMORPHISMES
Lemme. Soit f une fonction de Rn dans R+ continue sur g(E) et soit ! > 0.
Pour chaque a ∈ E, il existe δ(a) > 0 tel que B∞ [a; δ(a)] ⊂ E et tel que,
pour tout semi-cube I vérifiant les relations
a ∈ I¯ ⊂ B∞ [a; δ(a)],
la fonction f est L-intégrable sur g(I) et l’on a
J
g(I)
f≤
J
(f ◦ g)|Jg | + !µ(I).
I¯
Démonstration. Notons tout d’abord que la fonction (f ◦ g)|Jg | continue
sur E, est L-intégrable sur tout pavé fermé I¯ contenu dans E et dès lors
l’intégrale du membre de droite dans l’inégalité ci-dessus existe. D’autre
part, pour tout semi-pavé I = ]a1 , b1] × . . . × ]an , bn] contenu dans E, on a
I = I¯ \
n
>
i=1
(K i ∪ Li ),
où
K i = [a1 , b1 ] × . . . × {ai } × . . . × [an , bn],
Li = [a1 , b1] × . . . × {bi } × . . . × [an , bn].
Dès lors, g étant injective, on a
¯ \g
g(I) = g(I)
,
n
>
i=1
-
(K ∪ L ) ,
i
i
¯ et g[!n (K i ∪Li )] ⊂ g(I)
¯ sont des fermés bornés et
et g étant continue, g(I)
i=1
!
la fonction continue f y est L-intégrable. Comme 1g(I) = 1g(I)
¯ −1 n (K i ∪Li)
i=1
on en déduit aussitôt la L-intégrabilité de f sur g(I). Soit maintenant a ∈
E, b = g(a), et posons
A = f (b) = (f ◦ g)(a) ≥ 0, B = |Jg (a)| > 0.
Définissons la fonction réelle ψ sur R2 par
ψ(ξ, η) = (A − ξ)(B − ξ) − (A + ξ)B(1 + η)n;
elle est continue sur R2 et telle que ψ(0, 0) = 0; en conséquence, pour l’!
donné dans l’énoncé, on pourra trouver un δ $ > 0 tel que pour tout ξ vérifiant
|ξ| ≤ δ $ et tout η vérifiant |η| ≤ δ $ , on aura |ψ(ξ, η)| ≤ !.
558
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
En particulier, si ξ ∈ ]0, b[ ∩ ]0, δ $ [ et si η ∈ ]0, δ $[ sont fixés, on a
(A + ξ)B(1 + η)n ≤ (A − ξ)(B − ξ) + !.
D’autre part, f étant continue en b, il existera un δ $$ > 0 (que l’on peut
toujours choisir suffisamment petit pour que B∞ [b; δ $$] ⊂ g(E)) tel que
A − ξ ≤ f (y) ≤ A + ξ
pour tout y ∈ B∞ [b; δ $$]. Enfin, g et |Jg | étant continues en a, il existera
δ(a) > 0 (que l’on peut toujours choisir inférieur ou égal au δ(a) associé à η
par le lemme précédent et suffisamment petit pour que B∞ [a; δ(a)] ⊂ E) tel
que
|g(x) − g(a)|∞ = |g(x) − b|∞ ≤ δ $$
et
|Jg (x)| ≥ B − ξ,
pour tout x ∈ B∞ [a; δ(a)]. En conséquence, si I est un semi-cube tel que
a ∈ I¯ ⊂ B∞ [a; δ(a)], on obtient, en vertu du lemme précédent et du corollaire
du théorème de changement de variables affine,
J
g(I)
f ≤ (A + ξ)µ(g(I)) ≤ (A + ξ)µ(h(I $)) = (A + ξ)|Jg (a)|µ(I $)
= (A + ξ)B(1 + η)n cn = (A + ξ)B(1 + η)nµ(I).
D’autre part, pour tout x ∈ B∞ [a; δ(a)], on a, par les inégalités qui précèdent,
f (g(x))|Jg(x)| ≥ (A − ξ)(B − ξ),
et dès lors
J
(f ◦ g)|Jg | ≥ (A − ξ)(B − ξ)µ(I)
I¯
≥ (A + ξ)B(1 + η)nµ(I) − !µ(I) ≥
ce qui achève la démonstration.
J
g(I)
f − !µ(I),
Lemme. Soit f une fonction de Rn dans R+ continue sur g(E). Pour tout
semi-cube I tel que I¯ ⊂ E, on a
J
g(I)
f≤
J
(f ◦ g)|Jg |.
I¯
559
14.5. DIFFÉOMORPHISMES
Démonstration. L’existence des deux intégrales a déjà été prouvée dans
la première partie de la démonstration du lemme précédent. Si ! > 0 est
donné, l’application strictement positive δ définie pour chaque a ∈ E par le
δ(a) fournit par le lemme précédent est évidemment une jauge sur E. Soit
I un semi-cube tel que I¯ ⊂ E. Par le théorème de Cousin, il existe une
P-partition régulière et δ-fine Π = {(x1 , I 1 ), . . ., (xm, I m)} de I; les I j sont
donc des semi-cubes partitionnant I et tels que
xj ∈ I¯j ⊂ B∞ [xj ; δ(xj )], 1 ≤ j ≤ m.
Dès lors, par le lemme précédent, on a
J
g(I j )
f≤
J
(f ◦ g)|Jg | + !µ(I j ), 1 ≤ j ≤ m.
I¯j
D’autre part, g étant injective, les g(I j ) partitionnent g(I); dès lors, si K
est un semi-pavé tel que g(I) ⊂ K̄, on a
J
f=
g(I)
m J
$
j
j=1 g(I )
J
K̄
f≤
1g(I)f =
m J
$
j
j=1 I
J
K̄


m
$
j=1

1g(I j ) f  =

(f ◦ g)|Jg| + ! 
m
$
j=1

m 4J
$
K̄
j=1
µ(I j ) =
J
1g(I j ) f
5
=
(f ◦ g)|Jg | + !µ(I).
I¯
Comme ! > 0 est arbitraire, la thèse en résulte.
Nous pouvons maintenant énoncer et démontrer le théorème du changement de variables dans l’intégrale sur un fermé borné d’une fonction réelle continue.
Théorème. Soit f une fonction réelle continue sur g(E) et F ⊂ g(E) un
fermé borné. Alors on a
J
F
f=
J
g −1 (F )
(f ◦ g)|Jg |.
Démonstration. Notons tout d’abord que les deux membres de la formule
ont un sens puisque, F et g −1 (F ) étant des fermés bornés et f et (f ◦ g)|Jg |
des fonctions continues sur ces ensembles, elles y seront L-intégrables. Soit
I un semi-cube tel que G = g −1 (F ) ⊂ int I, ce qui implique en outre
que F ⊂ g(I). Le théorème de structure des ouverts bornés qui suit le
lemme de recouvrement et le fait que int I \ G soit un ouvert borné entraı̂nent l’existence d’une suite (gk )k∈N de fonctions réelles et d’une suite
560
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
k
({I1k , . . . , Im
})k∈N de partitions de I en semi-cubes telles que chaque gk soit
k
constante p.p. sur Ijk , 1 ≤ j ≤ mk , et telle que, pour tout x ∈ I, on ait
0 ≤ gk (x) ≤ gk+1 (x) ≤ 1, lim gk (x) = 1G (x).
k→∞
Dès lors, en utilisant le théorème de Levi, le lemme qui précède et le caractère injectif de g, on trouve, en désignant par xk,l un élément arbitraire
de Ilk et en supposant provisoirement que f est une fonction de Rn dans R+ ,
J
g −1 (F )
=

= lim 
k→∞
J 4
I¯
k→∞

= lim 
k→∞
= lim
J
mk
$
gk (xk,j )
k
j=1 g(Ij )
k→∞ g(I)
1G .(f ◦ g)|Jg |
J
k→∞ I¯


gk .(f ◦ g)|Jg | = lim 
j=1
mk J
$
I¯
lim gk .(f ◦ g)|Jg| = lim
¯k
j=1 Ij
≥ lim 
5
k→∞
mk J
$

(f ◦ g)|Jg | =
J
gk (g
−1
J
g(Ijk )
(g(x
(gk ◦ g −1 )f =
On a donc
J
k→∞

mk
$
k→∞

gk (xk,j )
j=1

f  = lim 
k,j
gk .(f ◦ g)|Jg |
mk J
$
k
j=1 g(Ij )

)))f  = lim 
k→∞
mk J
$
lim [(gk ◦ g −1 )f ] =
g −1 (F )
(f ◦ g)|Jg | ≥
J
I¯jk
J

(f ◦ g)|Jg |

gk (xk,j )f 
k
j=1 g(Ij )
g(I) k→∞
J
J
(gk ◦ g
g(I)

−1
1F f =
J
)f 
f.
F
f.
F
En appliquant cette inégalité avec g, F, f respectivement remplacés par
g −1 , g −1 (F ), (f ◦ g)|Jg |, on obtient
J
g −1 (F )
≤
J
(g −1 )−1 (g −1 (F ))
=
J
F
(f ◦ g)|Jg |
((f ◦ g) ◦ g −1 ).|Jg | ◦ g −1 .|Jg−1 |
f.|(Jg ◦ g −1 ).Jg−1 | =
J
F
f,
561
14.5. DIFFÉOMORPHISMES
puisque, de l’identité sur g(E),
g ◦ g −1 = I,
on déduit, par le théorème de dérivation des fonctions composées, pour tout
y ∈ g(E),
I = (g ◦ g −1 )$y = gg$ −1 (y) ◦ (g −1 )$y ,
et dès lors, en prenant les déterminants,
8
9
D
1 = det gg$ −1 (y) ◦ (g −1 )$y = det gg$ −1 (y)
D
ED
det(g −1 )$y )
E
E
= Jg (g −1 (y)).Jg−1 (y) = (Jg ◦ g −1 ).Jg−1 (y).
En conséquence, on a, pour une fonction continue et positive sur g(E),
J
f=
F
J
g −1 (F )
(f ◦ g)|Jg |.
Si maintenant f est une fonction réelle continue sur g(E), alors f = f + − f −
avec f + et f − des fonctions réelles positives L-intégrables sur g(E) et,
puisque |Jg | est une fonction à valeurs strictement positives, on trouve
aisément que
[(f ◦ g)|Jg|]+ = (f + ◦ g)|Jg |, [(f ◦ g)|Jg |]− = (f − ◦ g)|Jg |.
Dès lors, en appliquant le résultat à f + et f − et en recombinant, on obtient
le résultat désiré.
Remarque. La formule que nous venons de démontrer s’étend facilement au
cas d’une fonction continue sur un fermé non borné en utilisant la définition
de L-intégrabilité sur un ensemble non borné et le théorème précédent.
Terminons cette section en énonçant, sans démonstration, le théorème
général de changement de variables dans une intégrale multiple.
Théorème. Soit g un difféomorphisme de l’ouvert E de Rn sur l’ouvert
g(E) de Rn et soit f une fonction de Rn dans Rp définie p.p. sur une partie
A de g(E). Alors f est L-intégrable sur A si et seulement si (f ◦ g)|Jg | est
L-intégrable sur g −1 (A), auquel cas on a la formule
J
A
f=
J
g −1 (A)
(f ◦ g)|Jg |.
562
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
Ce théorème peut se démontrer à partir du cas particulier traité ici en
utilisant un théorème d’approximation, pour la convergence en moyenne,
des fonctions L-intégrables par des fonctions continues, que nous n’avons
pas démontré ici.
Dans le cas particulier où n = 1 et où A = [a, b], l’hypothèse faite sur g
entraı̂ne que g est strictement croissante ou strictement décroissante. Dans
le premier cas, g $ est strictement positive,
g −1 ([a, b]) = [g −1 (a), g −1 (b)]
et la formule devient
J
b
f=
a
J
g −1 (b)
g −1 (a)
(f ◦ g)g $.
Dans le deuxième cas, g $ est strictement négative,
g −1 ([a, b]) = [g −1 (b), g −1(a)]
et la formule devient
J
b
a
f =−
J
g −1 (a)
g −1 (b)
(f ◦ g)g $ =
J
g −1 (b)
g −1 (a)
(f ◦ g)g $.
On retrouve donc bien la formule démontrée dans le cas des fonctions primitivables.
Les théorèmes de Fubini, Tonelli et du changement de variable fournissent
une autre méthode pour calculer l’intégrale de Poisson
I=
J
∞
exp(−x2 ) dx.
0
On a, par les théorèmes de Tonelli et Fubini,
I =
2
=
J
0
∞ 2J ∞
0
4J
0
∞
exp(−x ) dx
2
3
5 4J
exp[−(x + y )] dx dy =
2
2
0
∞
exp(−y ) dy
J
]0,∞ × ]0,∞[
2
5
exp[−(x2 + y 2 )] dx dy.
La transformation g (passage aux coordonnées polaires) définie par
g(ρ, θ) = (ρ cos θ, ρ sin θ)
563
14.6. EXERCICES
est un difféomorphisme de ]0, ∞[ × ]0, π2 [ sur ]0, ∞[ × ]0, ∞[ et l’on calcule
aisément que Jg (ρ, θ) = ρ. En conséquence, le théorème du changement de
variables et le théorème de Fubini entraı̂nent
J
]0,∞[ × ]0,∞[
=
=
π
2
J
exp[−(x2 + y 2 )] dx dy
J
]0,∞[ × ]0, π
[
2
π
4
exp(−ρ2 )ρ dρ =
]0,∞[
d’où l’on déduit aussitôt la valeur
14.6
exp(−ρ2 )ρ dρ dθ
√
π
2
J
∞
exp(−t) dt =
0
π
,
4
de l’intégrale de Poisson.
Exercices
1. Soit f une fonction continue de R2 dans R possédant une dérivée partielle
par rapport à la première variable continue sur R et soient a et b deux
fonctions dérivables de R dans R. Si F est l’application de R dans R définie
par
F (y) =
J
b(y)
f (y, z) dz,
a(y)
montrer que F est dérivable en tout point de R et que
$
$
$
F (y) = f (y, b(y))b (y) − f (y, a(y))a (y) +
J
b(y)
a(y)
D1 f (y, z) dz.
Pour ce faire, on définira l’application H de R3 dans R par
H(u, v, y) =
J
v
f (y, z) dz,
u
qui est donc telle que F (y) = H(a(y), b(y), y), et on calculera F $ (y)
utilisant le théorème de dérivation des fonctions composées et la règle
Leibniz.
2. Utiliser la règle de Leibniz pour montrer que le potentiel V du champ
gravitation créé par un corps matériel M de densité continue ρ vérifie,
tout point x n’appartenant pas à M , l’équation de Laplace
∆V (x) ≡
3
$
j=1
2
Djj
V (x) = 0.
en
de
de
en
564
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
3. Pour chaque n ∈ N, soit Jn la fonction définie par l’intégrale
Jn (x) =
1
π
J
0
π
cos(nt − x sin t) dt.
En utilisant la règle de Leibniz, montrer que Jn vérifie l’équation différentielle
de Bessel. On notera que
Dt[cos(nt − x sin t)] = −[sin(nt − x sin t)](n − x cos t)
= −n sin(nt − x sin t) + xDx[cos(nt − x sin t)].
En déduire que le membre de droite de cette expression constitue une représentation intégrale de la fonction de Bessel Jn .
4. Soit v : R → R une fonction L-intégrable. Montrer que la fonction u
donnée par
1
u(t, x) = √
2 πt
J
,
-
,
-
(x − y)2
1
(·)2
exp −
v(y) dy = √ exp −
∗ v,
4t
4t
2 πt
−∞
∞
est bien définie sur ]0, ∞[ ×R. Montrer que, pour chaque x ∈ R, on a
lim u(t, x) = v(x),
t→0+
et, en utilisant la règle de Leibniz, montrer que u vérifie sur ]0, ∞[ ×R,
l’équation de la chaleur
2
Dt u(t, x) − Dxx
u(t, x) = 0.
5. Soit E ⊂ Rn un ensemble n-intégrable et f et g des fonctions de Rn dans
R intégrables sur E et telles que la fonction de Rn × Rn dans R définie par
(x, y) 2→ [f (x) − f (y)][g(x) − g(y)]
soit intégrable sur E × E. Utiliser le théorème de Fubini pour montrer que
f g est intégrable sur E et que l’on a l’identité de Tchebycheff
1
2
J
E×E
[f (x) − f (y)][g(x) − g(y)] dx dy = µ(E)
J
E
fg −
4J
E
f
5 4J
E
5
g .
Si n = 1, E est un intervalle et si f et g sont toutes deux croissantes sur E
ou décroissantes sur E, en déduite l’inégalité de Tchebycheff
J
E
fg ≥
1
µ(E)
4J
E
f
5 4J
E
5
g .
565
14.6. EXERCICES
6. Soit E ⊂ Rn et f et g des fonctions de Rn dans R telles que f 2 et g 2
soient intégrables sur E et telles que la fonction de Rn × Rn dans R définie
par
(x, y) 2→ [f (x)g(y) − f (y)g(x)]2
soit intégrable sur E × E. Utiliser le théorème de Fubini pour montrer que
f g est intégrable sur E et que l’on a l’identité de Lagrange
1
2
J
E×E
[f (x)g(y) − f (y)g(x)] dx dy =
2
4J
f
2
E
5 4J
g
E
2
5
−
4J
E
fg
52
.
En déduire l’inégalité de Cauchy-Schwarz-Bouniakowsky
4J
E
fg
52
≤
4J
f2
E
5 4J
5
g2 .
E
7. Soit I = ]0, b]× ]0, d] un semi-pavé de R2 et P une partition de I en un
nombre fini de semi-pavés. Montrer que si chaque semi-pavé de P possède
un côté de longueur entière, alors I possède un côté de longueur entière. On
notera que
J
β
α
sin 2πx dx =
1
[sin π(β + α). sin π(β − α)],
π
et que dès lors cette intégrale est nulle si et seulement si β + α ou β − α
est entier. D’autre part, le théorème de Fubini entraı̂ne que si f (x, y) =
sin 2πx. sin 2πy, et si K = ]α, β]× ]γ, δ], alors
J
K̄
f (x, y) dx dy =
1
[sin π(β + α). sin π(β − α)][sin π(δ + γ). sin π(δ − γ)].
π2
Cette intégrale est donc nulle si l’un des côtés de K a une longueur entière.
D’ailleurs, si P = {I 1 , . . . , I m}, on a, par le calcul ci-dessus, l’additivité de
l’intégrale et l’hypothèse sur les I j ,
1
sin2 πb sin2 πd =
π2
J
I¯
f=
m J
$
¯j
j=1 I
f = 0,
ce qui entraı̂ne que b ou d est entier.
8. Les coordonnées polaires dans Rn (qui généralisent les coordonnées polaires dans R2 et les coordonnées sphériques dans R3 ) sont définies par les
relations
x1 = r cos ϕ1 ,
566
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
x2 = r sin ϕ1 cos ϕ2 ,
...
xn−1 = r sin ϕ1 sin ϕ2 . . . sin ϕn−2 cos ϕn−1 ,
xn = r sin ϕ1 sin ϕ2 . . . sin ϕn−2 sin ϕn−1 .
Montrer que si g est l’application de E =]0, ∞[ × ]0, π[n−2 × ]0, 2π[ dans Rn
définie par le second membre de ces relations, alors g est un difféomorphisme
de E sur g(E) et
Jg (r, ϕ1, . . . , ϕn−1 ) = r n−1 sinn−2 ϕ1 sinn−3 ϕ2 . . . sin ϕn−2 .
En déduire que si f est une fonction de ]0, ∞[ dans R, alors la fonction
radiale x 2→ f (|x|2 ) est L-intégrable sur Rn si et seulement si la fonction
r 2→ r n−1 f (r) est L-intégrable sur ]0, ∞[, auquel cas l’on a
J
Rn
f (|x|2) dx = ωn
J
∞
f (r)r n−1 dr,
0
où ωn est une constante positive ne dépendant que de n (en fait, ωn =
14.7
2πn/2
).
Γ( n
)
2
Petite anthologie
Si la fonction donnée est telle que tous les ensembles e$p soient mesurables
(B), auquel cas on pourra dire que la fonction est sommable (B), la formule
se simplifie et devient
J
0ACB
ϕ(x, y) dx dy =
J
0
A
&J
0
B
ϕ(x, y) dy
'
dx.
C’est la formule classique. On sait que cette formule doit être remplacée par
une formule plus compliquée, analogue à celle que nous avons obtenue, quand
on s’occupe de l’intégration, au sens de Riemann, appliquée dans toute sa
généralité.
Henri Lebesgue, 1902
M. Lebesgue a traité le problème de la réduction des intégrales doubles
dans son mémoire des Annali di Matematica de 1902. Pour faire cette
réduction, M. Lebesgue définit ce qu’il appelle les intégrales supérieure et
567
14.7. PETITE ANTHOLOGIE
inférieure d’une fonction. Quand la fonction est mesurable, les deux intégrales coı̈ncident et réciproquement. M. Lebesgue étend, sans nouvelle démonstration, cette formule aux intégrales de fonctions non bornées, pourvu
que celles-ci existent. M. Fubini a montré que l’introduction des intégrales
supérieures et inférieures est inutile et que la réduction peut toujours se faire
à l’aide des intégrales ordinaires. De plus, il a donné la démonstration de la
formule pour le cas où f est sommable dans Γ sans être bornée. Si on laisse
de côté cette dernière démonstration, on peut observer que le théorème de
M. Fubini peut se déduire, sans autre examen, de la formule de M. Lebesgue.
... La formule de M. Lebesgue prend donc la forme définitive
J J
f dx dy =
J
dx
J
f dy.
Mais il faut négliger au second membre l’ensemble (de mesure nulle) des
valeurs de x pour lesquelles l’intégrale intérieure n’existerait pas. C’est le
résultat indiqué par M. Fubini. A cause de son importance, nous allons
démontrer à nouveau cette formule de réduction par la voie qui nous paraı̂t
la plus naturelle. Cette démonstration détaillée, où nous ne ferons appel à
aucun théorème étranger, aura peut-être l’avantage de préciser sur certains
points les conditions de validité de la formule.
Charles-Jean de La Vallée Poussin, 1910
L’approximation par des sommes intégrales (qui est analogue à l’approche
usuelle de l’intégrale de Riemann) est utilisée pour obtenir le théorème de
Fubini pour l’intégrale de Perron dans une forme générale; on trouve des
conditions nécessaires et suffisantes pour l’existence de l’intégrale itérée.
Jaroslav Kurzweil, 1973
Parlons d’abord du changement de variables dans les intégrales multiples. La véritable origine de la formule obtenue est dans le fait que le jacobien d’une transformation ponctuelle, pris en valeur absolue, représente
le rapport de deux aires infiniment petites correspondantes, ou, s’il s’agit
d’intégrales triples, de deux volumes infiniment petits correspondants. ... Ce
résultat conduit évidemment à écrire
la formule classique pour le changeH H
ment de variables sous le signe
. Il n’en constitue pas cependant une
démonstration satisfaisante, au moins au premier abord, et l’on a, jusqu’ici,
présenté la démonstration autrement. Deux méthodes sont connues : l’une
consistant à faire successivement un changement de variable sur x seul et un
changement de variable sur y seul; l’autre dans laquelle on obtient l’aire S
568
CHAPITRE 14. REPRÉSENTATIONS ET TRANSFORMATIONS
de l’image d’une portion s du premier plan en la ramenant à une intégrale
étendue à la frontière de s et établissant ainsi la formule S = sj $ , où j $
est compris entre le minimum et le maximum du jacobien j dans l’aire s :
formule qui entraı̂ne, sans nouvelle difficulté, celle du changement de variables. Ne peut-on obtenir une démonstration rigoureuse de la formule du
changement de variables en partant de ce fait fondamental ?
Jacques Hadamard, 1938
L’idée la plus naı̈ve (pour démontrer le théorème de changement de variables dans un intégrale multiple) serait de diviser D1 en parallélipipèdes
rectangles “infinitésimaux”, d’observer que l’image par h d’un tel parallélipipède rectangle est un parallélipipède rectangle infinitésimal, de calculer
le volume de ce parallélipipède, de sommer tous les infinitésimaux produits
de cette manière, et ainsi d’arriver à la formule. ... Transformer cette approche heuristique en une démonstration rigoureuse n’est pas entièrement
trivial. Cela est seulement fait, à ma connaissance, en deux places : le
Cours d’Analyse de Jordan et le Differential-und Integralrechnung unter
besondere Berucksichtigung neuere Ergebnisse de Haupt. Dans chacune de
ces démonstrations, un petit rectangle C est considéré et, par une construction soignée, deux parallélipipèdes, le premier contenant h(C) et le second
entièrement contenu dans h(C) sont obtenus. De cette manière, on trouve
pour le volume de h(C) des bornes suffisamment exactes pour que la formule puisse s’obtenir par passage à la limite. La principale difficulté de
cette démonstration est l’obtention du parallélipipède intérieur à h(C), car
le parallélipipède extérieur peut s’obtenir sans difficulté.
Jacob T. Schwartz, 1954
Chapitre 15
Analyse vectorielle et
extérieure
15.1
Intégrale sur une courbe
Soit C ⊂ Rn non vide et image d’une application Γ : [a, b] → Rn continue sur
[a, b], injective sur [a, b[ et telle que Γ(a) = Γ(b), ou injective sur [a, b]. En
géométrie différentielle, C s’appelle le support ou la trace d’un arc de courbe
simple (fermée dans le premier cas), et Γ est une représentation paramétrique
de C.
Un exemple extrêmement simple est celui du segment de droite [c, d]
joignant c ∈ Rn à d ∈ Rn , défini par [c, d] = {c + t(d − c) : t ∈ [0, 1]}, et muni
de sa représentation paramétrique canonique
Σ : [0, 1] → Rn , t 2→ c + t(d − c).
Il est alors naturel d’appeler longueur de [c, d] (pour la représentation paramétrique Σ) le nombre positif L([c, d]) = |d−c|2 = |T ([c, d])|2, où T ([c, d]) =
d − c est le vecteur tangent à [c, d].
Si nous voulons donner un sens à la notion de longueur de C (dans
la représentation paramétrique Γ), il est naturel, comme nous l’avons fait
dans la discussion de la notion d’aire d’une figure plane servant à motiver la
notion d’intégrale, de considérer une partition {I 1 , . . . , I m} de I = ]a, b] en
semi-intervalles consécutifs I j = ]aj−1 , aj ], 1 ≤ j ≤ m, et de considérer les
“valeurs approchées” de la longueur données par les “sommes de Riemann”
569
570
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
du type
m
$
j=1
|T ([Γ(aj−1 ), Γ(aj )])|2 =
=
m
$
j=1
m
$
j=1
|Γ(aj ) − Γ(aj−1 )|2
(15.1)
L([Γ(aj−1 ), Γ(aj )]),
où L([Γ(aj−1 ), Γ(aj )]) = |Γ(aj ) − Γ(aj−1 )|2 est la longueur, au sens considéré plus haut, du segment de droite [Γ(aj−1 ), Γ(aj )]. On est alors amené
à dire que le nombre positif L est la longueur de C (dans la représentation
paramétrique Γ) si toutes les expressions (15.1) peuvent être rendues arbitrairement proches de L en prenant des partitions de pas
max (aj − aj−1 )
1≤j≤m
suffisamment petit.
Plus généralement, soit f une fonction de Rn dans Rp définie sur C et Γ
une représentation paramétrique de C. Certains problèmes de mathématique, de science ou de technique, et en particulier celui de la détermination de
la masse d’un fil dont on connaı̂t la densité linéaire, conduisent à considérer
des “sommes de Riemann” du type
SL (Γ, f, Π) =
=
m
$
j=1
f (Γ(tj ))|Γ(aj ) − Γ(aj−1 )|2
f (Γ(tj ))L([Γ(aj−1 ), Γ(aj )]) =
j=1
A
m
$
m
$
(15.2)
f (Γ(tj ))|T ([Γ(aj−1 ), Γ(aj )])|2,
j=1
B
où Π = (tj , I j ) 1≤j≤m est une P-partition de I, avec I j = ]aj−1 , aj ]. Le cas
particulier f = 1 correspond évidemment au problème de la longueur analysé
plus haut et celui de la détermination de la masse d’un fil dont on connaı̂t
la densité linéaire correspond à p = 1. La somme de Riemann revient à
approcher l’arc de courbe par une ligne brisée et à supposer que, sur chaque
segment, la densité est constante et égale à sa valeur en un point de la partie
de la courbe approchée par le segment de droite. Il est alors assez naturel
d’obtenir la masse du fil par un processus de passage à la limite sur ces
sommes de Riemann analogue à celui introduit pour le concept d’intégrale.
Cela conduit à la définition suivante.
571
15.1. INTÉGRALE SUR UNE COURBE
Définition. On dit que f est L−intégrable sur l’arc de courbe simple C
de représentation paramétrique Γ s’il existe J ∈ Rp tel que, pour chaque
! > 0,
il existe une jauge δ sur I¯ telle que, pour chaque P-partition δ−fine
A j j B
Π = (t , I ) 1≤j≤m de I, on ait |SL (Γ, f, Π) − J|2 ≤ !.
Comme précédemment, on montre facilement l’unicité d’un tel J, on
l’appelle l’intégrale de f sur l’arc de courbe simple C de représentation
paramétrique Γ, et on le note
J
C
f L(dΓ) ou
J
f dL(Γ) ou
C
J
f dL ou
CΓ
J
CΓ
f |dT |2 ,
H
pour rappeler son mode de construction. En particulier, si C dL(Γ) existe, on l’appelle la longueur de l’arc de courbe simple C de représentation
paramétrique Γ, et on la note L(CΓ ).
On peut bien entendu, à partir de cette définition, construire une théorie
de l’intégration sur un arc de courbe analogue à celle que nous avons développée pour l’intégrale ordinaire. Dans ce cours, nous nous contenterons de
montrer qu’en se limitant aux fonctions f bornées sur C et aux arcs de
courbe C dont la représentation paramétrique Γ est de classe C 1 sur [a, b],
l’intégrale que nous venons d’introduire se ramène à une intégrale ordinaire
sur I¯ d’une expression faisant intervenir f, Γ et Γ$ , et à laquelle nous pourrons
donc appliquer tous les résultats obtenus pour l’intégrale d’une fonction sur
un intervalle fermé. La Proposition suivante est à la base de ce résultat.
Pour la motiver, notons que si Γ est dérivable sur ]a, b[, on a, en utilisant le
théorème de Lagrange,
SL (Γ, f, Π) =
=
m
$
m
$
f (Γ(t ))
j
j=1
i=1
f (Γ(t ))
j
j=1
=
m
$
, n
$
[Γi (a ) − Γi (a
j
(Γ$i (tji ))2 (aj
i=1
f (Γ(t ))
j
j=1
j
ti
; n
$
, n
$
(Γ$i (tji ))2
i=1
j−1
)
j−1 2
−a
-1/2
)]
2
<1/2
-1/2
(aj − aj−1 ),
j
où
∈ ]a , a [, 1 ≤ j ≤ m, 1 ≤ i ≤ n. Si on remplace ti par tj dans la
dernière expression, elle devient
j−1
j
m
$
j=1
f (Γ(t ))
j
, n
$
i=1
(Γ$i (tj ))2
-1/2
(aj − aj−1 )
572
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
=
m
$
j=1
f (Γ(tj ))|Γ$ (tj )|2 (aj − aj−1 ) = S(I, (f ◦ Γ)|Γ$ |2 , Π),
où le second membre est une somme de Riemann usuelle. Le problème est
donc de voir sous quelles conditions sur f et sur Γ ce remplacement est licite.
Proposition. Si f est bornée sur C et si Γ est de classe C 1 sur [a, b], alors,
¯ telle que pour toute
pour chaque ! > 0, il existe une jauge constante η sur I,
P-partition η-fine Π de I, on ait
|SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)|2 ≤ !.
Démonstration.
En
vertu du calcul effectué ci-dessus, on a, pour la PA
B
partition Π = (tj , I j ) 1≤j≤m de I, avec I j = ]aj−1 , aj ],
SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)
=
m
$
f (Γ(tj ))
j=1
=
m
$
j=1
,
n
 $

i=1
(Γ$i (tji ))2
-1/2
−
,
n
$
(Γ$i (tj ))2
i=1
-1/2 


(aj − aj−1 )
f (Γ(tj ))[h(tj1 , . . . , tjn ) − h(tj , . . . , tj )](aj − aj−1 ),
tji
avec ∈ ]aj−1 , aj [, 1 ≤ j ≤ m, 1 ≤ i ≤ n, si l’on définit l’application h de
[a, b] × . . . × [a, b] dans R par
h(t1 , . . . , tn ) =
, n
$
i=1
(Γ$i (ti ))2
-1/2
.
Puisque Γ est de classe C 1 sur [a, b], h est uniformément continue sur [a, b] ×
. . . × [a, b]. Par conséquent, si M > 0 désigne un majorant de |f (x)|2 sur
C et si ! > 0 est donné, il existe une constante η > 0 telle que pour tout
(t1 , . . . , tn ) ∈ [a, b]×. . .×[a, b] et tout (t$1 , . . . , t$n ) ∈ [a, b]×. . .×[a, b] vérifiant
l’inégalité
|(t1 , . . . , tn ) − (t$1 , . . . , t$n )|∞ ≤ η,
on ait
|h(t1 , . . . , tn ) − h(t$1 , . . . , t$n )| ≤ !/M (b − a).
Si l’on prend cet η comme jauge constante sur [a, b] et si Π est une P-partition
η-fine de I, on aura
tji ∈ ]aj−1 , aj [ ⊂ [tj − η, tj + η], 1 ≤ i ≤ n, 1 ≤ j ≤ m,
573
15.1. INTÉGRALE SUR UNE COURBE
donc,
|(tj1 , . . ., tjn ) − (tj , . . . , tj )|∞ ≤ η,
et dès lors
|SL (Γ, f, Π) − S(I, (f ◦ Γ)|Γ$ |2 , Π)|2
≤
m
$
j=1
M (!/M (b − a))(aj − aj−1 ) = !,
et la démonstration est complète.
L’équivalence annoncée résulte aisément de cette Proposition.
Proposition. Dans les conditions de la Proposition qui précède, les intégrales
J
J
f dL(Γ) et (f ◦ Γ)|Γ$ |2
I¯
C
existent simultanément et sont égales.
Démonstration. Nous démontrerons le résultat dans un sens, l’autre
cas étant strictement analogue. Supposons donc f L-intégrable sur C (de
représentation paramétrique Γ) et montrons
que (f ◦ Γ)|Γ$ |2 est P-intégrable
H
¯
¯
sur I et a pour intégrale sur I la quantité C f dL(Γ). Si ! > 0 est donné, on
peut trouver une jauge δ1 sur I¯ telle que, pour toute P-partition δ1 -fine Π
de I, on ait
#
#
J
#
#
#SL (Γ, f, Π) −
f dL(Γ)## ≤ !/2,
#
C
2
Si maintenant η est la constante associée par la Proposition précédente à
!/2, si δ est la jauge sur I¯ définie par δ(t) = min(δ1 (t), η), et si Π est une
P-partition δ-fine de I, on aura alors
#
#
J
#
#
#S(I, (f ◦ Γ)|Γ$ |2 , Π) −
f dL(Γ)##
#
C
#
#
2
≤ |S(I, (f ◦ Γ)|Γ$ |2 , Π) − SL (Γ, f, Π)|2 + ##SL (Γ, f, Π) −
≤ !/2 + !/2 = !.
J
C
#
#
f dL(Γ)##
2
574
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
Corollaire. Si Γ est de classe C 1 sur [a, b], alors la longueur de l’arc de
courbe simple C de représentation paramétrique Γ est donnée par
J
L(CΓ ) =
dL(Γ) =
J
b
a
C
$
|Γ |2 =
J
b
a
, n
$
(Γ$i )2
i=1
-1/2
.
Soit maintenant Γ̃ : [c, d] → Rn une représentation paramétrique de
classe C 1 équivalente à Γ, c’est-à-dire telle que Γ = Γ̃ ◦ h pour un difféomorphisme h : [a, b] → [c, d]. Alors, on a
J
L(CΓ ) =
b
a
|Γ$ |2 =
J
b
a
|(Γ̃$ ◦ h)h$ |2 =
J
b
a
|Γ̃$ ◦ h|2 |h$ |.
Comme h est bijective sur [a, b], elle y est monotone et h$ y a un signe
constant. Par le théorème de changement de variable dans une intégrale
simple, on obtient alors
L(CΓ ) = sign h$
J
b
a
|Γ̃ ◦ h|2 h$ = sign h$
J
h(b)
h(a)
|Γ̃$ |2 =
J
d
c
|Γ̃$ |2 = L(CΓ̃ ),
puisque, si h$ ≥ 0 (resp. ≤ 0) sur [a, b], h est croissante (resp. décroissante)
et h(a) = c, h(b) = d (resp. h(a) = d, h(b) = c). Donc, la longueur de l’arc de
courbe simple ne dépend pas de la représentation paramétrique à l’intérieur
de la classe définie par la relation d’équivalence ci-dessus.
Considérons par exemple la représentation paramétrique usuelle du cercle
C(r) de centre 0 et de rayon r > 0, à savoir
Γr : [0, 2π] → R2 , t 2→ (r cos t, r sin t).
On trouve la formule familière
L(CΓr )) =
J
2π
(r 2 sin2 t + r 2 cos2 t)1/2 dt =
0
J
2π
r dt = 2πr.
0
Dans le cas particulier d’un arc de courbe simple dont la trace dans R2
est le graphe F = {(x, f (x)) : x ∈ [a, b]} d’une fonction f de R dans R
de classe C 1 sur [a, b], on a évidemment la représentation paramétrique de
classe C 1 correspondante
et, puisque
Φ : [a, b] → R2 , x 2→ (x, f (x)),
Φ$ (x) = (1, f $ (x)), x ∈ [a, b],
on obtient immédiatement la formule
L(FΦ ) =
J
a
b
[1 + (f $ )2 ]1/2.
575
15.2. INTÉGRALE SUR UNE SURFACE
15.2
Intégrale sur une surface
Soit S une partie non vide de R3 qui est l’image d’une application
Σ : K = [a1 , b1] × [a2 , b2] ⊂ R2 → R3
continue sur K et injective sur int K. En géométrie différentielle, S est appelé le support ou la trace d’un arc ou d’un élément de surface simple, et Σ
s’appelle une représentation paramétrique de S. Un exemple extrêmement
simple est celui du parallélogramme [c, d, e] construit sur les points non
colinéaires c, d, e (dans l’ordre) de R3 ,
[c, d, e] = {c + u1 (d − c) + u2 (e − c) : (u1 , u2 ) = u ∈ K = [0, 1] × [0, 1]},
et muni de sa représentation paramétrique canonique
Π : K → R3 , u 2→ c + u1 (d − c) + u2 (e − c).
En accord avec la géométrie élémentaire, il est naturel d’appeler aire de
[c, d, e] (pour la représentation paramétrique Π) le nombre positif
A([c, d, e]) = |(d − c) ∧ (e − c)|2 = |N ([c, d, e])|2,
où N ([c, d, e]) = (d − c) ∧ (e − c) désigne le produit vectoriel de d − c par
e − c, c’est-à-dire l’élément de R3 (normal à P ) défini par
(d − c) ∧ (e − c) = ((d2 − c2 )(e3 − c3 ) − (e2 − c2 )(d3 − c3 ),
(d3 − c3 )(e1 − c1 ) − (e3 − c3 )(d1 − c1 ), (d1 − c1 )(e2 − c2 ) − (e1 − c1 )(d2 − c2 ))
=
&
det
&
d2 − c2 d3 − c3
e2 − c2 e3 − c3
det
&
'
, det
&
d3 − c3 d1 − c1
e3 − c3 e1 − c1
d1 − c1 d2 − c2
e1 − c1 e2 − c2
''
'
,
.
Pour donner un sens à la notion d’aire de S (pour la représentation paramétrique Σ), il est naturel de considérer une partition {I 1 , . . . , I m} de I =
]a1 , b1 ]× ]a2 , b2 ] en semi-pavés I j = ]aj1 , bj1 ]× ]aj2 , bj2 ], 1 ≤ j ≤ m, et de considérer les “valeurs approchées” de l’aire données par les “sommes de Riemann”
m
$
j=1
A([cj , dj , ej ]) =
m
$
j=1
|(dj − cj ) ∧ (ej − cj )|2 =
m
$
j=1
|N ([cj , dj , ej ])|2 (15.3)
576
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
où cj = Σ(aj1 , aj2 ), dj = Σ(bj1 , aj2 ), ej = Σ(aj1 , bj2 ), où l’on a assimilé l’élément
de surface correspondant à la restriction de Σ à I j au parallélogramme
[cj , dj , ej ] et où l’on a sommé les aires correspondantes. On est alors amené
à dire que le réel positif A est l’aire de S (pour la représentation paramétrique Σ) si les expressions (15.3) deviennent arbitrairement proches de A en
prenant des partitions de I suffisamment fines.
Plus généralement, et pour pouvoir donner un sens par exemple à la
notion de masse d’une plaque dont on connaı̂t la densité superficielle, on est
conduit, si f est une fonction de R3 dans Rp définie sur l’élément de surface
S de représentation paramétrique Σ, à considérer des “sommes de Riemann”
du type
SA (Σ, f, Π) =
=
m
$
m
$
f (Σ(uj ))A([cj , dj , ej ])
j=1
f (Σ(uj ))|N ([cj , dj , ej ])|2 ,
(15.4)
j=1
A
relatives à la P-partition Π = (uj , I j )
Σ(aj1 , aj2 ), dj
Σ(bj1, aj2 ), ej
posé c =
=
ainsi à la définition suivante.
j
B
1≤j≤m de I, où,
= Σ(aj1 , bj2 ), 1 ≤
de nouveau, on a
j ≤ m. On arrive
Définition. On dit que f est A-intégrable sur l’élément de surface S de
représentation paramétrique Σ s’il existe J ∈ Rp tel que pour tout ! > 0,
il existe une jauge δ sur I¯ telle que, pour toute P-partition δ-fine Π =
A j j B
(u , I ) 1≤j≤m de I, on ait
|SA (Σ, f, Π) − J|2 ≤ !.
On montre comme précédemment, qu’il existe au plus un tel J, on
l’appelle l’intégrale de f sur l’élément de surface simple S de représentation
paramétrique Σ, et on le note
J
S
f A(dΣ)) ou
J
S
f dA(Σ) ou
J
SΣ
f dA ou
J
SΣ
f |dN |2,
H
pour rappeler son mode de construction. En particulier, si S dA(Σ) existe,
on l’appelle l’aire de l’élément de surface S de représentation paramétrique
Σ et on la note A(SΣ ).
On peut de nouveau, à partir de cette définition, construire une théorie
de l’intégrale sur un élément de surface analogue à celle développée pour
577
15.2. INTÉGRALE SUR UNE SURFACE
l’intégrale sur un pavé fermé. Comme dans le cas de l’intégrale sur un
arc de courbe, nous nous contenterons ici de montrer qu’en se limitant aux
fonctions bornées et aux éléments de surface de classe C 1 , l’intégrale que
nous venons d’introduire se ramène à l’intégrale ordinaire sur I¯ = K d’une
expression faisant intervenir la fonction, la représentation paramétrique et
ses dérivées partielles. On pourra donc appliquer à cette dernière intégrale
tous les résultats précédemment obtenus. Pour motiver la forme de cette
¯ on obtient,
expression, notons que, si Σ possède des dérivées partielles sur I,
en utilisant le théorème de Lagrange,
A([cj , dj , ej ]) =
#8
9
#
j,1 j
j
j
j,2 j
j
j
j,3 j
j
j
# D1 Σ1 (u1 , a2 )(b1 − a1 ), D1Σ2 (u1 , a2 )(b1 − a1 ), D1Σ3 (u1 , a2 )(b1 − a1 ) ∧
8
9#
#
j
j
j
j,2
j
j
j
j,3
j
j
D2 Σ1 (aj1 , uj,1
2 )(b2 − a2 ), D2 Σ2 (a1 , u2 )(b2 − a2 ), D2 Σ3 (a1 , u2 )(b2 − a2 ) #
#
&
j
#
D1 Σ2 (uj,2
#
1 , a2)
= #det
#
D2 Σ2 (aj1 , uj,2
2 )
det
det
&
&
j
D1 Σ3 (uj,3
1 , a2 )
D2 Σ3 (aj1 , uj,3
2 )
'
j
j,1 j
D1 Σ3 (uj,3
1 , a2 ) D1 Σ1 (u1 , a2 )
j
j,3
j
D2 Σ3 (a1 , u2 ) D2 Σ1 (a1 , uj,1
2 )
j
j,2 j
D1 Σ1 (uj,1
1 , a2 ) D1 Σ2 (u1 , a2 )
j
j,2
D2 Σ1 (aj1 , uj,1
2 ) D2 Σ2 (a1 , u2 )
'
2
,
,
'#
#
#
# µ(I j ),
#
2
où les uj,k
appartiennent à ]ajl , bjl [ , (1 ≤ j ≤ m, 1 ≤ k ≤ 3, 1 ≤ l ≤ 2).
l
Si, dans cette expression, on remplace les arguments des Dl Σk par uj
(1 ≤ j ≤ m, 1 ≤ k ≤ 3, 1 ≤ l ≤ 2), on trouve, au lieu de A([cj , dj , ej ]),
l’expression
|D1 Σ(uj ) ∧ D2 Σ(uj )|2 µ(Ij )
= |(JΣ2 ,Σ3 (uj ), JΣ3 ,Σ1 (uj ), JΣ1 ,Σ2 (uj ))|2 µ(Ij ),
où JΣi ,Σj désigne comme d’habitude le jacobien de l’application
u 2→ (Σi(u), Σj (u)), 1 ≤ i, j ≤ 3.
On notera que la direction de l’élément NΣ (u) défini par
NΣ (u) = D1 Σ(u) ∧ D2 Σ(u)
578
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
est orthogonale à celle des éléments D1 Σ(u) et D2 Σ(u) parallèles au plan
tangent à la surface S en Σ(u), et est donc normale à S en Σ(u). Les sommes
de Riemann après ce remplacement deviennent les expressions
m
$
f (Σ(uj ))|NΣ (uj )|2 µ(I j ),
(15.5)
j=1
c’est-à-dire les sommes de Riemann usuelles pour l’intégration sur I¯ de la
fonction (f ◦ Σ)|NΣ |2 . Le problème consiste de nouveau à voir sous quelles
conditions on peut remplacer, sans changer les conclusions, les sommes de
Riemann SA (Σ, f, Π) par les sommes de Riemann usuelles
S(I, (f ◦ Σ)|NΣ |2 , Π).
Dans cette direction, on a le résultat suivant, qui se démontre d’une manière
strictement analogue au résultat correspondant pour l’intégration sur un arc
de courbe, et dont les détails de la démonstration seront laissés au lecteur.
Proposition. Si f est bornée sur S et si Σ est de classe C 1 sur K, alors
J
f dA(Σ)
S
et
J
K
(f ◦ Σ)|NΣ |2 =
J
K
(f ◦ Σ)[JΣ2 2 ,Σ3 + JΣ2 3 ,Σ1 + JΣ2 1 ,Σ2 ]1/2
existent simultanément et sont égales.
Corollaire. Si Σ est de classe C 1 sur K, alors l’aire de l’élément de surface
simple S de représentation paramétrique Σ est donnée par
A(SΣ ) =
J
K
|NΣ |2 =
J
K
[JΣ2 2 ,Σ3 + JΣ2 3 ,Σ1 + JΣ2 1 ,Σ2 ]1/2.
En utilisant le théorème de changement de variables dans une intégrale
multiple, on peut montrer, comme dans le cas d’un arc de courbe, que
l’aire d’un élément de surface simple ne dépend pas de la représentation
paramétrique à l’intérieur de la classe d’équivalence des représentations paramétriques au sens de la géométrie différentielle.
Si nous considérons, à titre d’exemple, la représentation paramétrique
usuelle de la sphère S(r) de centre 0 et de rayon r > 0, c’est-à-dire l’application
Σr : [0, π] × [0, 2π] → R3 ,
15.3. CIRCULATION D’UN CHAMP VECTORIEL
579
(u1 , u2 ) 2→ (r sin u1 cos u2 , r sin u1 sin u2 , r cos u1 ),
nous obtenons aisément, en utilisant le théorème de Fubini, le résultat familier
J 2π J π
A(SΣr ) =
(r 4 sin4 u1 cos2 u2 + r 4 sin4 u1 sin2 u2
0
0
+r sin2 u1 cos2 u2 )1/2 du1 du2
4
= r2
J
2π
0
J
0
π
sin u1 du1 du2 = 2r 2
J
2π
0
du2 = 4πr 2 .
Dans le cas particulier d’un élément de surface simple dont la trace dans
R3 est le graphe F = {(x1 , x2, f (x1 , x2 )) : (x1 , x2 ) ∈ K} d’une fonction f de
R2 dans R de classe C 1 sur le pavé fermé K, on considère la représentation
paramétrique naturellement associée
Σ : K → R3 , (x1 , x2 ) 2→ (x1 , x2 , f (x1 , x2 )).
Comme
JΣ2 ,Σ3 = −D1 f, JΣ3 ,Σ1 = −D2 f, JΣ1 ,Σ2 = 1,
on trouve immédiatement la formule importante
A(F ) =
15.3
J
K
[1 + (D1 f )2 + (D2 f )2 ]1/2.
Circulation d’un champ vectoriel
Si n ≥ 2 est un entier, convenons d’appeler champ vectoriel dans Rn toute
fonction de Rn dans Rn , et rappelons la notation (x|y) du produit scalaire
%n
n
i=1 xi yi des éléments x et y de R .
Si [c, d] est le segment de droite joignant c ∈ Rn et d ∈ Rn introduit
précédemment, et si f est un champ vectoriel constant sur [c, d], dont nous
désignerons également par f la valeur constante, différentes questions de
physique conduisent à considérer l’expression
(f |d − c) = (f |T ([c, d])) =
n
$
i=1
fi (di − ci ).
Ainsi, lorsque n = 3 et que f représente une force constante, (f |d − c)
fournit le travail de cette force le long du segment orienté [c, d]. L’extension
nécessaire de ces notions au cas où f n’est plus nécessairement constant
et où [c, d] est remplacé par un arc de courbe simple C de représentation
580
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
paramétrique Γ : [a, b] ⊂ R → Rn conduit à la considération de “sommes de
Riemann” du type
SC (Γ, f, Π) =
=
m
$
m
$
j=1
(f (Γ(tj ))|Γ(aj ) − Γ(aj−1 ))
(f (Γ(tj ))|T ([Γ(aj−1 ), Γ(aj )])),
j=1
A
B
si Π =
1≤j≤m est une P-partition de I =]a, b]. De telles
sommes apparaissent lorsqu’on remplace la restriction de Γ à [aj−1 , aj ] par
le segment de droite [Γ(aj−1 ), Γ(aj )] et que l’on suppose que, sur ce segment,
le champ vectoriel garde la valeur constante f (Γ(tj )).
On est ainsi conduit à la définition suivante.
(tj , ]aj−1 , aj ])
Définition. On dit que J ∈ R est la circulation du champ vectoriel f le
long de l’arc de courbe C de représentation paramétrique Γ si pour chaque
! > 0 il existe une jauge δ sur I¯ telle que pour toute P-partition δ-fine Π de
I, on a
|SC (Γ, f, Π) − J| ≤ !.
On montre comme d’habitude l’unicité d’un tel J, ce qui justifie la terminologie, et on le désigne par
J
C
(f |T (dΓ)) ou
J
(f |dT (Γ)) ou
C
J
CΓ
(f |dT )
pour rappeler son mode de construction. Comme pour les autres extensions
de l’intégrale introduites précédemment, on peut déduire de cette définition
un certain nombre de propriétés. Nous nous contenterons de montrer que si
f est borné sur C et si Γ est de classe C 1 , la circulation de f le long de Γ se
ramène à l’intégrale usuelle sur [a, b] d’une fonction de R dans R construite
à partir de f, Γ et Γ$ . Pour déterminer heuristiquement la forme de cette
fonction, il suffit encore, lorsque Γ est dérivable, d’appliquer le théorème de
Lagrange aux composantes Γi dans l’expression de la somme de Riemann.
On trouve ainsi
SC (Γ, f, Π) =
=
, n
m $
$
j=1
, n
m $
$
j=1
i=1
i=1
8
fi (Γ(t )) Γi (a ) − Γi (a
j
fi (Γ(t
j
))Γ$i (tji )(aj
j
j−1
j−1
−a
-
) ,
)
9
581
15.3. CIRCULATION D’UN CHAMP VECTORIEL
pour des tji ∈]aj−1 , aj [, 1 ≤ i ≤ n, 1 ≤ j ≤ m. Si, dans la dernière expression,
j
on remplace les ti par tj , 1 ≤ i ≤ n, 1 ≤ j ≤ m, on obtient
, n
m $
$
j=1
m
$
=
j=1
fi (Γ(t
j
))Γ$i (tj )(aj
i=1
j−1
−a
)
-
(f (Γ(tj ))|Γ$ (tj ))(aj − aj−1 ) = S(I, (f ◦ Γ|Γ$ ), Π),
c’est-à-dire la somme de Riemann usuelle pour la fonction (f ◦ Γ|Γ$ ) et la Ppartition Π de I = ]a, b]. D’une manière strictement analogue à celle utilisée
dans le cas de l’intégration sur un arc de courbe, on peut démontrer la condition suffisante suivante pour que SC (Γ, f, Π) et S(I, (f ◦ Γ|Γ$ ), Π) fournissent
la même intégrale.
Proposition. Si f est bornée sur C et si Γ est de classe C 1 sur [a, b], alors
J
C
et
J
a
b
$
(f |dT (Φ))
(f ◦ Γ|Γ ) =
J
n
b$
a i=1
existent simultanément et sont égales.
(fi ◦ Γ)Γ$i
Si Γ̃ : [c, d] → Rn est une représentation paramétrique de C équivalente à
Γ, c’est-à-dire si Γ = Γ̃ ◦ h pour un certain difféomorphisme h : [a, b] → [c, d],
le théorème du changement de variable dans une intégrale entraı̂ne que
J
C
(f |dT (Γ)) =
=±
J
c
J
d
b
a
$
(f ◦ Γ|Γ ) =
(f ◦ Γ̃|Γ̃$ ) = ±
J
a
J
C
b
(f ◦ Γ̃ ◦ h|Γ̃$ ◦ h)h$
(f |dT (Γ̃)),
avec le signe + ou le signe − selon que h est croissante ou décroissante. Donc,
dans
la classe des représentations paramétriques considérées, seul le signe de
H
C (f |dT (Φ)) dépend du choix de la représentation. On dit en géométrie
différentielle que Γ et Γ̃, liés par la relation ci-dessus, correspondent à une
même orientation de C si h$ est positive sur [a, b] et correspondent à des
orientations opposées si h$ est négative sur [a, b]. Dans le cas du segment de
droite, on vérifie aisément que les orientations différentes correspondent aux
deux sens de parcours possibles sur le segment.
582
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
Si nous supposons maintenant que Γ, bijective et de classe C 1 , est en
outre telle que, pour tout t ∈ [a, b], on ait |Γ$ (t)|2 /= 0, nous pouvons définir
la tangente unitaire à C dans la représentation paramétrique Γ par
τΓ =
Γ$ ◦ Γ−1
,
|Γ$ ◦ Γ−1 |2
ce qui implique immédiatement que
Γ$ = (τΓ ◦ Γ)|Γ$ |2 .
Dès lors, par les propriétés de l’intégrale sur un arc de courbe, on obtient
J
C
=
J
a
b
(f |dT (Γ)) =
J
b
a
(f ◦ Γ|Γ$ )
(f ◦ Γ|τΓ ◦ Γ)|Γ$ |2 =
J
C
(f |τΓ )dL(Γ),
ce qui montre que, dans ces conditions, la circulation de f le long de l’arc
de courbe C de représentation paramétrique Γ est égale à l’intégrale sur C
de la fonction (f |τΓ ).
15.4
Flux d’un champ vectoriel
Soit maintenant S un élément de surface dans R3 de représentation paramétrique Σ et soit f un champ vectoriel dans R3 . Si [c, d, e] représente
de nouveau le parallélogramme construit sur les points c, d, e de R3 avec
sa représentation paramétrique canonique, et si f est un champ vectoriel
constant sur [c, d, e], différentes questions de mécanique ou de physique conduisent à considérer l’expression
(f |(d − c) ∧ (e − c)) = (f |N ([c, d, e])),
qui représente le flux de f à travers l’élément de surface [c, d, e] dans le sens
de la normale N ([c, d, e]). La terminologie provient de l’hydrodynamique
lorsque f représente le champ des vitesses d’un fluide en mouvement. Pour
étendre cette notion au cas où f n’est plus nécessairement constant et où S
est un élément de surface de représentation paramétrique Σ, on est conduit
à des “sommes de Riemann” du type
SF (Σ, f, Π) =
m
$
j=1
(f (Σ(uj ))|N ([cj , dj , ej ]))
583
15.4. FLUX D’UN CHAMP VECTORIEL
=
m 8
$
9
f (Σ(uj ))|(Σ(dj ) − Σ(cj )) ∧ (Σ(ej ) − Σ(cj )) ,
j=1
où les notations sont celles utilisées pour les intégrales de surface. De telles
sommes correspondent à l’approximation qui consiste à remplacer la restriction de Σ à I j par le parallélogramme [cj , dj , ej ] et de supposer que le champ
f y a la valeur constante f (Σ(uj )). On est ainsi conduit à la définition
suivante.
Définition. On dit que J ∈ R est le flux du champ vectoriel f : S → R3
à travers l’élément de surface S de représentation paramétrique Σ si pour
chaque ! > 0, il existe une jauge δ sur I¯ telle que, pour toute P-partition
δ-fine Π de I, on a
|SF (Σ, f, Π) − J|2 ≤ !.
On montre comme d’habitude qu’il existe au plus un tel J et on le note
J
S
(f |N (dΣ)) ou
J
S
(f |dN (Σ)) ou
J
SΣ
(f |dN ),
pour rappeler son mode de construction.
De nouveau, plutôt que de reconstruire une théorie de l’intégration basée
sur la définition ci-dessus, nous nous contenterons de montrer que, sous
certaines hypothèses supplémentaires relatives à f et Σ, cette intégrale se
¯ Pour motiver la forme de cette
ramène à une intégrale habituelle sur I.
intégrale, il suffit encore de supposer Σ dérivable et d’appliquer le théorème
de Lagrange à chaque composante Σi . On obtient ainsi
m
$
SF (Σ, f, Π) =
,
f1 (Σ(u )) det
j=1
j
+f2 (Σ(u )) det
j
+ f3 (Σ(u )) det
j
&
&
&
j
j,3 j
D1 Σ2 (uj,2
1 , a2 ) D1 Σ3 (u1 , a2 )
j
j,3
D2 Σ2 (aj1 , uj,2
2 ) D2 Σ3 (a1 , u2 )
j
j,1 j
D1 Σ3 (uj,3
1 , a2 ) D1 Σ1 (u1 , a2 )
j
j,1
D2 Σ3 (aj1 , uj,3
2 ) D2 Σ1 (a1 , u2 )
j,1
j
j,2
j
D1 Σ1 (u1 , a2 ) D1 Σ2 (u1 , a2 )
j
j,1
j
j,2
D2 Σ1 (a1 , u2 ) D2 Σ2 (a1 , u2 )
'-
'
'
µ(I j ),
où les uj,k
appartiennent à ]ajl , bjl [, (1 ≤ j ≤ m; 1 ≤ k ≤ 3; 1 ≤ l ≤ 2).
l
Si, dans cette expression, on remplace les arguments des Dl Σk par uj , on
obtient la somme de Riemann usuelle
m
$
j=1
[f1 (Σ(uj ))JΣ2 ,Σ3 (uj ) + f2 (Σ(uj ))JΣ3 ,Σ1 (uj )
584
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
+f3 (Σ(uj ))JΣ1 ,Σ2 (uj )]µ(I j ) = S(I, (f ◦ Σ|NΣ ), Π),
où l’application “normale” NΣ a été introduite précédemment. D’une manière similaire à celle utilisée dans l’intégration sur un arc de surface, on
démontre la condition suffisante suivante pour que les sommes de Riemann
SF (Σ, f, Π) et S(I, (f ◦ Σ|NΣ ), Π) conduisent à la même intégrale.
¯
Proposition. Si fH est bornée sur S et si Σ est de classe C 1 sur K = I,
alors les intégrales S (f |dN (Σ)) et
J
K
(f ◦ Σ|NΣ ) =
J
K
[(f1 ◦ Σ)JΣ2 ,Σ3 + (f2 ◦ Σ)JΣ3 ,Σ1 + (f3 ◦ Σ)JΣ1 ,Σ2 ]
existent simultanément et sont égales.
En utilisant encore le théorème de changement de variables dans une
intégrale on peut encore montrer, comme dans le cas de la circulation, que
si Σ̃ est une représentation paramétrique de S régulièrement C 1 -équivalente
à Σ, c’est-à-dire si Σ = Σ̃ ◦ h pour un difféomorphisme h de K sur K̃, on
trouve que
J
J
S
(f |dN (Σ̃)) = sign Jh
S
(f |dN (Σ)).
Dans le langage de la géométrie différentielle, on voit donc que les intégrales
sont donc égales ou opposées selon que les représentations ont même orientation ou des orientations opposées.
Si l’on suppose maintenant que Σ est injective sur K et que |NΣ (u)|2 /= 0
pour tout u ∈ K, on peut définir l’application normale unitaire à S dans la
représentation Σ par
NΣ ◦ Σ−1
νΣ =
,
|NΣ ◦ Σ−1 |2
ce qui entraı̂ne
NΣ = (νΣ ◦ Σ)|NΣ |2 ,
et, dès lors,
=
J
K
J
S
(f |dN (Σ)) =
J
K
(f ◦ Σ|NΣ )
(f ◦ Σ|νΣ ◦ Σ)|NΣ |2 =
J
S
(f |νΣ )dA(Σ).
Donc, dans les conditions mentionnées ci-dessus, le flux du champ vectoriel
f à travers l’élément de surface S de représentation paramétrique Σ est égal
à l’intégrale sur S de la fonction (f |νΣ ).
15.4. FLUX D’UN CHAMP VECTORIEL
585
En conclusion, les intégrales de circulation et de flux conduisent à des
intégrales ordinaires d’expressions du type
(f1 ◦ Γ)Γ$1 + . . . + (fn ◦ Γ)Γ$n ,
sur un intervalle fermé de R, et du type
(f1 ◦ Σ)JΣ2 ,Σ3 + (f2 ◦ Σ)JΣ3 ,Σ1 + (f3 ◦ Σ)JΣ1 ,Σ2
sur un pavé fermé de R2 . D’autre part, le théorème du changement de variables dans les intégrales a conduit à la considération d’intégrales du type
(f ◦ Ψ)JΨ où Ψ applique Rn en lui-même. Si l’on remarque que, dans la
première expression, on a évidemment Γ$i = JΓi , (1 ≤ i ≤ n), on voit que
toutes ces expressions possèdent une structure semblable et sont des cas
particuliers d’expressions de la forme
n
$
i1 =1
...
n
$
ik =1
(fi1 ,...,ik ◦ Φ)JΦi1 ,...,ik ,
où k est un entier compris entre 1 et n, les fi1 ,...,ik sont des fonctions de Rn
dans R, Φ : K ⊂ Rk → Rn est une application de classe C 1 sur le pavé
fermé K et JΦi1 ,...,ik : K → R, u 2→ det[(Φi1 , . . . , Φik )$u ] est le jacobien de
l’application (Φi1 , . . . , Φik ) de K dans Rk . Le premier exemple correspond à
k = 1 et n quelconque, le deuxième à k = 2 et n = 3 et le troisième à k = n.
Des expressions du type général se présentent lorsqu’on cherche à étendre
les notions des deux dernières sections du cas particulier des courbes et des
surfaces dans R2 ou R3 au cas général des “variétés de dimension k dans
Rn ”. Elles possèdent par ailleurs des propriétés algébriques et différentielles
remarquables qui unifient les opérateurs différentiels de l’analyse vectorielle
et fournissent le langage naturel pour la généralisation aux intégrales multiples du théorème fondamental du calcul différentiel et intégral. Cette
généralisation s’appelle le théorème de Stokes-Cartan et fournit en outre un
traitement unifié et rigoureux des résultats d’analyse vectorielle, rencontrés
en physique et en mécanique, sur la réduction d’intégrales de volume à des
intégrales de surface, et d’intégrales de surface à des intégrales curvilignes.
C’est à ces questions et à des applications à l’analyse complexe que nous
consacrerons les sections et le chapitre suivants. Sans perte de généralité, on
pourra toujours supposer, en faisant si nécessaire une reparamétrisation, que
K est le produit cartésien d’intervalles unitaires [0, 1]. Pour des raisons de
simplicité, on se limitera au cas où les fonctions fi1 ,...,ik sont au moins continues sur K, ce qui suffit pour bon nombre d’applications. Enfin, l’élément
586
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
primordial dans une théorie analytique étant la représentation paramétrique
plutôt que l’être géométrique, on abandonnera les hypothèses d’injectivité
faites sur Φ.
15.5
Algèbre des formes extérieures
Soient n ≥ 1 et k ≥ 1 des entiers.
Définition. Si J = (j1 , j2 , . . . , jk ) est un k-uple d’entiers (1 ≤ ji ≤ n), la
k-forme (extérieure ou alternée ou antisymétrique) élémentaire pJ sur Rn
est l’application de Rn × . . . × Rn = Rnk dans R définie par
#
# h1
# j1
# h2
# j1
pJ (h1 , h2 , . . ., hk ) = ## .
# ..
# k
# hj
1
h1j2
h2j2
..
.
hkj2
. . . h1jk
. . . h2jk
..
..
.
.
. . . hkjk
#

#
(h1 )J
#
#

#
 (h2 )J
# = det 
..
#

#
.

#
#
(hk )J



,


où, si hi = (hi1 , hi2 , . . . , hin ), on pose (hi )J = (hij1 , hij2 , . . ., hijk ).
Si k = 1, les 1-formes élémentaires pj sont simplement les applications
projection sur la j e composante pj : Rn → R, h 2→ hj (1 ≤ j ≤ n). Si n = 4 et
k = 2, les 2-formes élémentaires sur R4 sont les applications pi,j de R4 × R4
dans R définies par
p1,1 (h1 , h2 ) = h11 h21 − h21 h11 , p1,2 (h1 , h2 ) = h11 h22 − h21 h12 ,
p1,3 (h1 , h2 ) = h11 h23 − h21 h13 , p1,4 (h1 , h2 ) = h11 h24 − h21 h14 ,
p2,1 (h1 , h2 ) = h12 h21 − h11 h22 , p2,2 (h1 , h2 ) = h12 h22 − h22 h12 ,
p2,3 (h1 , h2 ) = h12 h23 − h22 h13 , p2,4 (h1 , h2 ) = h12 h24 − h22 h14 ,
et ainsi de suite pour p3,1 , p3,2 , p3,3, p3,4 , p4,1, p4,2, p4,3 et p4,4 .
Par les propriétés des déterminants, on a
pj1 ,...,ji ,...,jl ,...,jk = −pj1 ,...,jl ,...,ji ,...,jk ,
et dès lors,
pj1 ,...,ji ,...,jl ,...,jk = 0
s’il existe i =
/ l tel que ji = jl . En particulier, si k > n, un tel couple existe
toujours et donc pJ = 0 quel que soit J.
15.5. ALGÈBRE DES FORMES EXTÉRIEURES
587
Posons
B(n, k) = {J = (j1 , . . . , jk ) : 1 ≤ j1 ≤ n, . . . , 1 ≤ jk ≤ n},
A(n, k) = {J = (j1 , . . . , jk ) ∈ B(n, k) : jr /= js si r /= s, 1 ≤ r, s ≤ k},
C(n, k) = {J = (j1 , . . . , jk ) ∈ B(n, k) : j1 < j2 < . . . < jk },
de telle sorte que B(n, k) ⊃ A(n, k) ⊃ C(n, k), et que B(n, k), A(n, k) et
n!
n!
C(n, k) contiennent respectivement nk , (n−k)!
et k!(n−k)!
éléments. Il résulte
de la discussion précédente que pJ /= 0 si et seulement si J ∈ A(n, k) et que si
J ∈ A(n, k), il existe un élément unique I ∈ C(n, k) et une permutation π(I)
de I telle que J = π(I), et donc, en vertu des propriétés des déterminants,
telle que
pJ = pπ(I) = (sign π(I))pI,
où sign π(I) = 1 si π(I) s’obtient par un nombre pair de permutations de
deux éléments seulement et sign π(I) = −1 si π(I) s’obtient par un nombre
impair de telles opérations.
Dès lors, toutes les k-formes élémentaires non nulles pJ s’expriment
en fonction des k-formes pI , I ∈ C(n, k), qui sont appelées les k-formes
(extérieures, alternées ou antisymétriques) fondamentales et sont en nombre
n!
k!(n−k)! . Ainsi, pour k = 1, les n 1-formes élémentaires pi (1 ≤ i ≤ n) sont
fondamentales, pour k = n−1, il y a également n (n-1)-formes fondamentales
p2,3,...,n , p1,3,...,n , . . . , p1,2,...,n−1 ,
et pour k = n, il y a une seule n-forme fondamentale p1,2,...,n . Les 2-formes
fondamentales dans R3 sont p1,2 , p1,3, p2,3 , et les 2-formes fondamentales
dans R4 sont p1,2 , p1,3, p1,4, p2,3 , p2,4, p3,4 .
Définition. Une k-forme extérieure (ou alternée ou antisymétrique) réelle
(resp. complexe) sur Rn est une application u de Rn × . . . × Rn = Rnk dans
R (resp. C) de la forme
$
u=
uJ pJ ,
J∈B(n,k)
où les uJ ∈ R (resp. C).
Les 1-formes extérieures réelles (resp. complexes) sont donc les formes
linéaires réelles (resp. complexes) sur Rn , c’est-à-dire les éléments de
L(Rn , R) (resp. L(Rn , C)).
588
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
L’application 5p1,2 + 12 p2,1 + 8p4,3 est une 2-forme extérieure réelle sur Rn .
[
Si K = R ou C, l’ensemble k (Rn , K) des k-formes extérieures à valeurs
dans K est donc l’espace vectoriel sur K engendré par les k-formes élémentaires pI. C’est évidemment un sous-espace vectoriel de l’ensemble Lk (Rn , K)
des applications k-linéaires de Rn dans K.
Il est utile également de donner un sens à la notion de 0-forme extérieure.
Toute application u : {0} → K est caractérisée par son unique valeur u =
u(0), et l’on peut ainsi associer une 0-forme à chaque élément de K.
%
[
Si u = J∈B(n,k) uJ pJ ∈ k (Rn , K), alors, on a
$
u=
uJ pJ =
J∈A(n,k)
=
$

I∈C(n,k)
si l’on pose



$
I∈C(n,k)
$
permutations
ũI =
π(I)
$


permutations
de I
$
permutations
π(I)
de I


de I

uπ(I) pπ(I)
uπ(I) sign π(I) pI =
π(I)

$
ũI pI,
I∈C(n,k)
uπ(I) sign π(I).
[k
On voit donc que tout u ∈
(Rn , K) peut s’exprimer comme combinaison linéaire à coefficients dans K des k-formes fondamentales. Que cette
expression soit unique résulte du lemme suivant.
Lemme.
%
I∈C(n,k) uI pI
= 0 si et seulement si uI = 0, (I ∈ C(n, k)).
Démonstration. La condition suffisante est évidente. Pour la condition
nécessaire, si I = (i1 , . . . , ik ) ∈ C(n, k), de telle sorte que 1 ≤ i1 < i2 < . . . <
ik ≤ n, alors, en prenant h = (h1 , . . . , hk ) ∈ Rnk défini par
hm
il = δl,m (symbole de Kronecker) , 1 ≤ m ≤ k, 1 ≤ l ≤ k,
hm
i = 0, i ∈ {1, 2, . . ., n} \ {i1 , . . ., ik },
on trouve
0=
$
uJ pJ (h1 , . . . , hk ) = uI ,
J∈C(n,k)
et la démonstration est complète.
15.5. ALGÈBRE DES FORMES EXTÉRIEURES
Dès lors, si u ∈
[k
(Rn , K) et si
u=
$
uIpI =
$
(uI − u$I)pI = 0,
I∈C(n,k)
on en déduit
589
I∈C(n,k)
$
u$I pI ,
I∈C(n,k)
et donc, par le Lemme, uI = u$I , (I ∈ C(n, k)).
En résumé, toute k-forme extérieure u sur Rn s’exprime d’une manière
unique comme combinaison linéaire des k-formes fondamentales pI
u=
$
uI pI,
I∈C(n,k)
et cette expression s’appelle l’écriture canonique de u. Il en résulte que
n!
(Rn , K) est un espace vectoriel sur K de dimension k!(n−k)!
, et que si
%
%
u = I∈C(n,k) uI pI , v = I∈C(n,k) vI pI sont deux k-formes extérieures en
%
%
écriture canonique, et si c ∈ K, alors I∈C(n,k) (uI +vI )pI et I∈C(n,k) cuIpI
sont les écritures canoniques de u + v et de cu respectivement.
Soient n ≥ 1, k ≥ 1 et l ≥ 1 des entiers. Nous allons d’abord définir le
produit extérieur d’une k-forme fondamentale pI et d’une l-forme fondamentale pJ .
[k
Définition. Le produit extérieur pI ∧ pJ de pI = pi1 ,...,ik par pJ = pj1 ,...,jl
est la (k+l)-forme élémentaire dans Rn
pI ∧ pJ = p(I,J),
où (I, J) désigne le (k+l)-uple (i1 , . . . , ik , j1 , . . . , jl ). Si α, β ∈ {−1, 1}, on
définit (αpI ) ∧ (βpJ ) par
(αpI ) ∧ (βpJ ) = (αβ)p(I,J).
En d’autres termes, pi1 ,...,ik ∧pj1 ,...,jl = pi1 ,...,ik ,j1 ,...,jl . Si (I, J) /∈ A(n, k +
l) (c’est-à-dire si I et J ont un élément en commun), alors, par ce qui précède,
pI ∧ pJ = 0. Si (I, J) ∈ A(n, k + l), désignons par [I, J] ∈ C(n, k + l) le (k+l)uple obtenu en réordonnant les éléments de I∪J dans l’ordre croissant: p[I,J]
est donc une (k+l)-forme fondamentale.
590
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
Proposition. Si I ∈ C(n, k), J ∈ C(n, l) et (I, J) ∈ A(n, k + l), on a
pI ∧ pJ = (−1)α(I,J)p[I,J],
où α(I, J) désigne le nombre de différences jr − is strictement négatives
(1 ≤ r ≤ l, 1 ≤ s ≤ k).
Démonstration. Partant de (I, J) = (i1 , . . ., ik , j1, . . . , jl ), on arrivera pas
à pas à [I, J] en permutant successivement ik avec tous les jr tels que jr < ik ,
puis en permutant successivement ik−1 avec tous les jr tels que jr < ik−1 , et
ainsi de suite jusqu’à i1 . Comme, à chaque opération pI ∧ pJ est multiplié
par (−1), la formule est prouvée.
Proposition. Si I ∈ C(n, k), J ∈ C(n, l) et K ∈ C(n, m), on a
(pI ∧ pJ ) ∧ pK = pI ∧ (pJ ∧ pK ),
dont on désigne la valeur commune par pI ∧ pJ ∧ pK .
Démonstration. Si (I, J, K) /∈ A(n, k + l + m), les deux membres de
l’égalité à prouver sont nuls et donc égaux. On peut donc supposer que
(I, J, K) ∈ A(n, k + l + m). Par la définition et la proposition précédentes,
on a
(pI ∧ pJ ) ∧ pK = p(I,J) ∧ pK = (−1)α(I,J)p[I,J] ∧ pK
= (−1)α(I,J)p([I,J],K) = (−1)α(I,J)(−1)α([I,J],K)p[I,J,K]
= (−1)α(I,J)+α(I,K)+α(J,K)p[I,J,K].
On montre de la même manière que pI ∧ (pJ ∧ pK ) est égal à cette dernière
expression.
Passons maintenant à la définition du produit extérieur de deux formes
quelconques.
Définition. Si
u=
%
I∈C(n,k) uI pI
∈
[k
(Rn , K), v =
%
J∈C(n,l) vJ pJ
∈
[l
(Rn , K),
sont respectivement une k-forme extérieure et une l-forme extérieure sur Rn ,
[
le produit extérieur u ∧ v de u par v est l’élément de k+l (Rn , K) défini par
u∧v =
$
$
uI vJ p(I,J).
I∈C(n,k) J∈C(n,l)
Le produit extérieur possède les propriétés suivantes.
591
15.5. ALGÈBRE DES FORMES EXTÉRIEURES
Proposition. 1. Si u ∈
2. Si u ∈
[k
(Rn , K), v ∈
[k
(Rn , K), v ∈
[l
[k
(Rn , K) et w ∈
(Rn , K) et k + l > n, alors
u ∧ v = 0.
[l
(Rn , K), c ∈ K, alors
(u + v) ∧ w = (u ∧ w) + (v ∧ w),
w ∧ (u + v) = (w ∧ u) + (w ∧ v),
(cu) ∧ w = u ∧ (cw) = c(u ∧ w).
3. Si u ∈
[k
(Rn , K), v ∈
[l
(Rn , K) et w ∈
[m
(Rn , K), alors
(u ∧ v) ∧ w = u ∧ (v ∧ w),
et la valeur commune s’écrit u ∧ v ∧ w.
[
[
4. Si u ∈ k (Rn , K) et v ∈ l (Rn , K), alors
u ∧ v = (−1)kl (v ∧ u).
5. Si I = (i1 , . . . , ik ) ∈ B(n, k), alors
pi1 ∧ pi2 ∧ . . . ∧ pik = pi1 ,...,ik = pI .
Démonstration. Les propriétés 1, 2 et 5 sont des conséquences immédiates de la définition. Par la propriété 2, il suffit de démontrer la propriété
3 pour des formes fondamentales, ce qui a été fait plus haut. Quant à la
propriété 4, elle découle de la propriété 2 et du fait que, si I = (i1 , . . . , ik ) ∈
C(n, k) et J = (j1 , . . . , jl ) ∈ C(n, l), alors les deux membres sont nuls si
(I, J) /∈ A(n, k + l) tandis que, dans le cas contraire, on a
p(I,J) = pi1 ,...,ik ,j1 ,...,jl = (−1)kl pj1 ,...,jl ,i1 ,...,ik = (−1)kl p(J,I).
Exemple. Si u =
%3
i=1
ui pi et v =
%3
j=1
%3
k=1 vj,k pj,k ,
on a
u ∧ v = u1 v2,3 p1,2,3 + u1 v3,2 p1,3,2 + u2 v1,3 p2,1,3
+u2 v3,1 p2,3,1 + u3 v1,2 p3,1,2 + u3 v2,1 p3,2,1
= [u1 (v2,3 − v3,2 ) + u2 (v3,1 − v1,3 ) + u3 (v1,2 − v2,1 )]p1,2,3.
Soient n ≥ 1 et k ≥ 0 des entiers.
592
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
%
%
Définition. Si u = I∈C(n,k) uIpI et v = I∈C(n,k) vI pI sont deux élé[
ments de k (Rn , K), le produit scalaire (u|v) de u par v est l’élément de K
défini par
$
(u|v) =
uI vI ,
I∈C(n,k)
où vI est le conjugué de vI .
%
En particulier, si u = ni=1 ui pi est une 1-forme, on peut lui associer
%
biunivoquement l’élément u = (u1 , . . . , un) de Kn . Si alors v = ni=1 vi pi
est aussi une 1-forme, on voit que le produit scalaire (u|v) n’est rien d’autre
que le produit scalaire usuel (u|v) des éléments de Kn qui leur sont respectivement associés. On vérifie sans peine les propriétés suivantes du produit
scalaire.
[
Proposition. Si u, v, w ∈ k (Rn , K), on a
1. (u|v) = (v|u)
2. (u + v|w) = (u|w) + (v|w)
3. Si c ∈ K, (cu|v) = c(u|v).
Soient n ≥ 1 et 0 ≤ k ≤ n des entiers.
%
[
Définition. Si u = I∈C(n,k) uI pI ∈ k (Rn , K), l’adjointe (de Hodge) 7u
[
de u est l’élément de n−k (Rn , K) défini par
7u =
$
!(I)uI pI∗ ,
I∈C(n,k)
où, pour chaque I = (i1 , . . . , ik ) ∈ C(n, k), on pose I∗ = (i∗1 , . . . , i∗n−k ),
où les 1 ≤ i∗1 < i∗2 < . . . < i∗n−k ≤ n sont tels que {i∗1 , . . . , i∗n−k } =
{1, 2, . . ., n} \ {i1 , . . . , ik }, tandis que !(I) est la signature de la permutation (i1 , . . . , ik , i∗1 , . . . , i∗n−k ) 2→ (1, 2, . . ., n).
Bien entendu, si u est une 0-forme de valeur constante u ∈ K cette
définition signifie que
7u = ūp1,...,n ,
et si u = u1,...,n p1,...,n est une n-forme, cette définition signifie que 7u est la
0-forme associée à l’élément u1,...,n de K.
On notera que (I∗ )∗ = I et que !(I∗ ) = (−1)k(n−k) !(I).
%
Exemple. Si u = 3i=1 ui pi , alors 7u = u1 p2,3 − u2 p1,3 + u3 p1,2 .
L’adjointe de Hodge est caractérisée par la propriété importante suivante,
qui relie les produits extérieur et scalaire.
593
15.5. ALGÈBRE DES FORMES EXTÉRIEURES
Proposition. Soient n ≥ 1 et 0 ≤ k ≤ n des entiers et soit u ∈
[
Alors 7u est l’unique élément de n−k (Rn, K) tel que l’on ait
[k
(Rn , K).
v ∧ 7u = (v|u)p1,...,n (= 7(v|u) = 7(u|v)),
pour tout v ∈
[k
(Rn , K),
Démonstration. En vertu des propriétés des produits extérieur et scalaire, il suffit de démontrer le résultat pour des k-formes fondamentales u =
pI , I = (i1 , . . . , ik ) ∈ C(n, k) (u = 1 si k = 0) et v = pL , L = (l1 , . . ., lk ) ∈
C(n, k) (v = 1 si k = 0). Alors, laissant les cas particuliers k = 0 et k = n
au lecteur, on a 7u = !(I)pI∗ , et dès lors
v ∧ 7u = !(I)p(L,I∗)
et le second membre est égal à !(I)p(I,I∗) = p1,...,n si L = I, et est égal à zéro
si L /= I. D’autre part, (pI |pL ) est égal à zéro si L /= I, et à un si L = I, et
la formule s’en déduit aussitôt.Pour montrer l’unicité de l’élément vérifiant
la propriété de la proposition, on remarque que si w et z sont des éléments
[
de n−k (Rn , K) tels que l’on ait
v ∧ w = v ∧ z = (v|u)p1,...,n ,
pour tout v ∈
[k
(Rn , K), alors, pour ces v, on aura
v ∧ (w − z) = 0.
En posant
w−z=
$
cIpI ,
I∈C(n,n−k)
et en prenant v = 7(w − z), on trouve alors
0 = 7(w − z) ∧ (w − z) = (−1)k(n−k) (w − z) ∧ [7(w − z)]
= (−1)k(n−k) (w − z|w − z)p1,...,n = (−1)k(n−k)
$
I∈C(n,k)
et donc w − z = 0.
L’adjointe d’une forme a les propriétés suivantes.
|cI|2 p1,...,n ,
594
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
[k
Proposition. Si u, v ∈
1. 7(cu) = c̄(7u)
2. 7(u + v) = 7u + 7v
3. 77u = (−1)k(n−k) u.
(Rn , K) et si c ∈ K, on a
Démonstration. Les propriétés 1 et 2 sont évidentes. Pour la propriété
%
%
3, si u = I∈C(n,k) uI pI, alors 7u = I∈C(n,k) !(I)uIpI∗ et
7(7u) =
$
I∈C(n,k)
uI pI = (−1)k(n−k) u.
I∈C(n,k)
Exemples. 1. Si u =
[1 3
(R , R), alors
et
$
!(I∗ )!(I)uIpI∗∗ = (−1)k(n−k)
%3
i=1
ui pi et v =
%3
i=1 vi pi
sont des éléments de
u ∧ v = (u1 v2 − u2 v1 )p1,2 + (u1 v3 − u3 v1 )p1,3 + (u2 v3 − u3 v2 )p2,3 ,
7(u ∧ v) = (u1 v2 − u2 v1 )p3 − (u1 v3 − u3 v1 )p2 + (u2 v3 − u3 v2 )p1
= (u2 v3 − u3 v2 )p1 + (u3 v1 − u1 v3 )p2 + (u1 v2 − u2 v1 )p3 ,
qui est la 1-forme dans R3 associée au produit vectoriel u ∧ v des éléments u
et v de R3 naturellement associés à u et v.
2. Avec les mêmes notations que dans l’exemple 1, on a aussi
ou encore
(7u) ∧ v = (u|v)p1,2,3 = u ∧ (7v)
7[(7u) ∧ v] = 7[u ∧ (7v)] = (u|v).
15.6
Formes différentielles
Soit E ⊂ Rn un ouvert et f ∈ C 1 (E, K). En chaque point x ∈ E, la dérivée
totale fx$ de f est l’application linéaire de Rn dans K telle que
fx$ (h) =
n
$
i=1
Di f (x) hi =
n
$
i=1
Di f (x) pi(h).
%
En d’autres termes, pour chaque x ∈ E, fx$ = ni=1 Dif (x) pi ∈ L(Rn , K)
[
= 1 (Rn , K). En conséquence, l’application x 2→ fx$ peut être considérée
[
comme une application de E dans 1 (Rn , K). Il est utile de considérer, plus
[
généralement, des applications de E dans k (Rn , K).
Soit E ⊂ Rn non vide et k ≥ 1 un entier.
595
15.6. FORMES DIFFÉRENTIELLES
Définition. On appelle k-forme différentielle (extérieure) sur E toute ap[
plication ω de E dans k (Rn , K) de la forme
ω : x 2→
$
wI pI,
I∈B(n,k)
où, pour chaque I ∈ B(n, k), wI est une application de E dans K.
D’une manière équivalente, une k-forme différentielle sur E peut être
considérée comme une application de E × Rn × . . . × Rn = E × Rnk dans K
de la forme
ω(x; h1 , . . . , hk ) =
$
wI(x)pI(h1 , . . . , hk ).
I∈B(n,k)
Ainsi, l’application ω définie par
ω(x1 , x2 , x3 ; h1 , h2 )) = x2 p1,2 (h1 , h2 ) + sin(x1 x2 x3 )p3,2 (h1 , h2 )
est une 2-forme dans R3 .
%
Si ω = I∈B(n,k) wI pI est une k-forme différentielle sur E, alors, pour
%
chaque x ∈ E, la k-forme extérieure ω(x) =
I∈B(n,k) wI (x)pI possède
%
une écriture canonique unique I∈C(n,k) w̃I (x)pI. La k-forme différentielle
%
I∈C(n,k) w̃I pI est appelée l’écriture canonique de ω. Notons en particulier
qu’une 0-forme différentielle sur E sera identifiée à une application de E
dans K.
%
La k-forme différentielle ω = I∈C(n,k) wI pI sera dite réelle (resp. complexe) si K = R (resp. C). Elle sera dite de classe C l (l ≥ 0, entier)
si, pour chaque I ∈ C(n, k), wI est de classe C l sur E. On désignera par
[
C l (E, k (Rn , K)) l’ensemble des k-formes différentielles (réelles pour K = R,
complexes pour K = C) de classe C l sur E.
On définit de façon naturelle les opérations d’addition, de multiplication
extérieure, de produit scalaire et d’adjointe de la manière suivante :
(ω + λ)(x) = ω(x) + λ(x), (gω)(x) = g(x)ω(x),
(ω ∧ µ)(x) = ω(x) ∧ µ(x), (ω|λ)(x) = (ω(x)|λ(x)), (7ω)(x) = 7(ω(x)),
pour tout x ∈ E, où ω et λ sont des k-formes différentielles sur E, µ une
l-forme différentielle sur E et g est une application de E dans K.
Exemples. 1. Une 1-forme différentielle réelle dans E ⊂ Rn s’écrit d’une
manière unique
ω=
n
$
i=1
wipi ,
596
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
où les wi : E ⊂ Rn → R. Sa donnée correspond donc à celle d’un champ w
sur E, c’est-à-dire d’une application w : E ⊂ Rn → Rn . Réciproquement, à
un champ w sur E, on peut associer la 1-forme différentielle
1
ωw
=
n
$
wi pi .
i=1
Mais on peut également lui associer la (n-1)-forme différentielle
n−1
ωw
=
n
$
i=1
wip1,...,Ii,...,n ,
où (1, . . . , Ii, . . . , n) = (1, . . . , i − 1, i + 1, . . ., n), puisque chaque élément I ∈
C(n, n − 1) peut-être caractérisé par l’élément i de {1, 2, . . ., n} qu’il ne
contient pas.
%
2. La 1-forme différentielle ni=1 Dif pi introduite au début de ce para1
1
graphe est la 1-forme ωgrad
ou ω∇f
associée au champ gradient de f défini
f
par grad f = ∇f = (D1 f, . . . , Dn f ).
3. A une application f : E → K on peut non seulement associer la
0-forme différentielle correspondante, mais aussi la n-forme différentielle
ωfn = f p1,...,n .
Supposons maintenant que E ⊂ Rn soit un ouvert et que f ∈ C 1 (E, K).
On a vu que la notion de dérivée totale permet d’associer à f (ou à la 0-forme
différentielle correspondante) la 1-forme différentielle
n
$
Dif pi
i=1
que nous noterons df et appellerons la différentielle extérieure de f . Nous
étendrons comme suit cette notion aux k-formes différentielles de classe C 1
sur E.
%
Définition. Soit E ⊂ Rn un ouvert et ω = I∈C(n,k) wIpI une k-forme
différentielle de classe C 1 sur E. On appelle différentielle extérieure dω de ω
la (k+1)-forme différentielle de classe C 0 sur E définie par
dω =
$
I∈C(n,k)
dwI ∧ pI ,
597
15.6. FORMES DIFFÉRENTIELLES
où les dwI sont donnés, conformément à ce qui précède, par
dwI =
n
$
Di wIpi .
i=1
Explicitement, on a donc,
dω =
$
n
$
Di wIp(i,I).
I∈C(n,k) i=1
En particulier, les dérivées partielles d’une fonction constante étant nulles,
on a
dpI = 0,
pour tout I ∈ C(n, k). D’autre part, en appliquant la définition de différentielle extérieure à la projection sur la j e composante pj : Rn → R, considérée
ici comme une 0-forme dans Rn (ce que l’on traduit par l’emploi d’un symbole
en caractère non gras), on voit que
dpj = pj , (1 ≤ j ≤ n),
et, comme il est d’usage de commettre l’abus d’écriture qui consiste à remplacer pj par sa valeur xj en x, on écrit traditionnellement dxj au lieu de
dpj . Comme, par ailleurs, on sait que
pI = pi1 ,...,ik = pi1 ∧ . . . ∧ pik ,
on écrira, pour suivre la tradition,
pI = dxi1 ∧ . . . ∧ dxik = dxI ,
ce qui fournit, pour la k-forme différentielle ω =
tions usuelles
$
wI dxI,
ou
%
I∈B(n,k) wI pI ,
les nota-
I∈B(n,k)
n $
n
$
...
dwI =
n
$
i1 =1 i2 =1
n
$
ik =1
En particulier, on écrira
i=1
wi1,i2 ,...,ik dxi1 ∧ dxi2 ∧ . . . ∧ dxik .
Di wI dxi , dω =
$
I∈C(n,k)
dwI ∧ dxI.
La différentielle extérieure d’une forme possède les propriétés suivantes.
598
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
[
Proposition. Soit E ⊂ Rn un ouvert, k ≥ 0, l ≥ 0, ω ∈ C 1 (E, k (Rn , K)),
[
[
[
λ ∈ C 1 (E, k (Rn , K)), µ ∈ C 1 (E, l (Rn , K)), ν ∈ C 2 (E, k (Rn , K)), c ∈ K
et f ∈ C 1 (E, K). Alors, on a
[
[
1. ω + λ ∈ C 1 (E, k (Rn , K)), cω ∈ C 1 (E, k (Rn , K)) et
d(ω + λ) = dω + dλ, d(cω) = cdω.
2. f ω ∈ C 1 (E,
[k
3. ω ∧ µ ∈ C 1 (E,
(Rn , K)) et
d(f ω) = df ∧ ω + f dω.
[k+l
(Rn , K)) et
d(ω ∧ µ) = dω ∧ µ + (−1)k (ω ∧ dµ).
4. d2 ν = d(dν) = 0 (Théorème de Poincaré).
Démonstration. La propriété 1 est immédiate et il suffit dès lors de
démontrer la propriété 2 dans le cas où ω = wI dxI. Alors, f ω = f wI dxI ∈
[
C 1 (E, k (Rn , K)) et
d(f wIdxI) = d(f wI) ∧ dxI =
=
n
$
i=1
=
n
$
i=1
n
$
i=1
Di (f wI)dxi ∧ dxI
[(Dif )wI + f DiwI ]dxi ∧ dxI
[Dif dxi ∧ wIdxI] + f
n
$
i=1
Di wI dxi ∧ dxI = df ∧ ω + f dω.
Il suffit également de démontrer la propriété 3 lorsque ω = wI dxI et µ =
mJ dxJ. On a, par la propriété 2,
d(ω ∧ µ) = d(wImJ dx(I,J)) = d(wImJ ) ∧ dx(I,J) + wI mJd(dx(I,J))
=
n
$
i=1
+
n
$
i=1
Di (wImJ)dxi ∧ dx(I,J) =
I
J
wI (DimJ )dxi ∧ dx ∧ dx =
n
$
i=1
&
(Di wI)mJ dxi ∧ dxI ∧ dxJ
n
$
i=1
(DiwI)dxi ∧ dx
I
'
∧ mJ dxJ
599
15.6. FORMES DIFFÉRENTIELLES
I
+(−1) wIdx ∧
k
&
n
$
i=1
Di mJ dxi ∧ dx
J
'
= dω ∧ µ + (−1)k ω ∧ dµ.
Enfin, il suffit de prouver la propriété 4 lorsque ν = wI dxI avec wI ∈
C 2 (E, K). On a, en utilisant les propriétés 1 et 3,
d ν = d(dwI
2
=
n
$
i=1

=
$
1≤i<j≤n
∧ dxI)
= d(dwI
) ∧ dxI − dw
I
d(Di wI) ∧ dxi ∧ dx =

n
$
i=1
∧ d(dxI)
I


n
$
j=1

2
Dij
wI dxj ∧ dxi  ∧ dxI + 


$
1≤i<j≤n
=d
& n
$
i=1
Di wI dxi ∧ dxI

2
Dij
wI dxj  ∧ dxi
$
1≤j<i≤n
'
∧ dxI

2
Dij
wI dxj ∧ dxi  ∧ dxI =

2
2
(Dij
wI − Dji
wI )dxj ∧ dxi  ∧ dxI = 0,
2 w = D 2 w . Dans l’avant-dernière ligne du calcul, on a remplacé
puisque Dij
I
ji I
i par j et j par i dans la deuxième somme et utilisé le fait que dxi ∧ dxj =
−dxj ∧ dxi.
Exemples. 1. Soit E ⊂ Rn un ouvert et f ∈ C 2 (E, R). On a vu plus haut
que
1
df = ωgrad
f =
n
$
Di f dxi .
i=1
Dès lors,
7df =
n
$
!(i) Dif dxi∗ =
i=1
n
$
i=1
Z ∧ . . . ∧ dx ,
(−1)i−1 Dif dx1 ∧ . . . ∧ dx
i
n
Zi indique que le terme correspondant est absent. Par conséquent,
où dx
d 7 df =
n
$
i=1
=
n
$
i=1
Z ∧ . . . ∧ dx
(−1)i−1d(Dif ) ∧ dx1 ∧ . . . ∧ dx
i
n
(−1)i−1
n
$
j=1
2
Zi ∧ . . . ∧ dxn
Dij
f dxj ∧ dx1 ∧ . . . ∧ dx
600
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
=
n
$
i=1
=
&
%n
où ?f =
i=1
n
$
n
$
i=1
+
2
Dii
f
i=1
'
dx1 ∧ . . . ∧ dxn = ?f dx1 ∧ . . . ∧ dxn ,
2 f s’appelle le laplacien de f . On a donc aussi
Dii
1
2. Soit ωw
=
Alors,
1
dωw
=
2
Z ∧ . . . ∧ dx
(−1)i−1 Dii
f dxi ∧ dx1 ∧ . . . ∧ dx
i
n
7d 7 df = ?f.
%n
i=1 wi
dwi ∧ dxi =
$
1≤j<i≤n
dxi ∈ C 1 (E,
n $
n
$
i=1 j=1
(Rn , R)), où E ⊂ Rn est ouvert.
Dj wi dxj ∧ dxi =
Dj wi dxj ∧ dxi =
En particulier, si n = 2,
[1
$
1≤i<j≤n
$
1≤i<j≤n
Dj wi dxj ∧ dxi
(Diwj − Dj wi)dxi ∧ dxj .
1
1
dωw
= (D1 w2 − D2 w1 )dx1 ∧ dx2 , 7dωw
= D1 w2 − D2 w1 .
Si n = 3,
1
7dωw
= (D1 w2 − D2 w1 )dx3 − (D1 w3 − D3 w1 )dx2 + (D2 w3 − D3 w2 )dx1
1
= (D2 w3 − D3 w2 )dx1 + (D3 w1 − D1 w3 )dx2 + (D1 w2 − D2 w1 )dx3 = ωrot
w,
où l’opérateur différentiel rotationnel est défini par
rot w = (D2 w3 − D3 w2 , D3 w1 − D1 w3 , D1w2 − D2 w1 ),
et parfois noté symboliquement ∇ ∧ w. D’autre part,
1
7ωw
=
n
$
i=1
et
1
d 7 ωw
=
n
$
i=1
=
n
$
i=1
(−1)i−1
Z ∧ . . . ∧ dx ,
wi(−1)i−1 dx1 ∧ . . . ∧ dx
i
n
Z ∧ . . . ∧ dx
(−1)i−1 dwi ∧ dx1 ∧ . . . ∧ dx
i
n
n
$
j=1
Zi ∧ . . . ∧ dxn
Dj wi dxj ∧ dx1 ∧ . . . ∧ dx
601
15.6. FORMES DIFFÉRENTIELLES
=
n
$
i=1
Z ∧ . . . ∧ dx
(−1)i−1 Di wi dxi ∧ dx1 ∧ . . . ∧ dx
i
n
=
&
n
$
i=1
'
n
Di wi dx1 ∧ . . . ∧ dxn = ωdiv
w,
où l’opérateur différentiel divergence est défini par
div w =
n
$
Di wi ,
i=1
et parfois noté symboliquement (∇|w). La formule peut encore s’écrire
1
7d 7 ωw
= div w.
L’opérateur 7d7 est appelé l’opérateur de codifférentiation extérieure et est
noté δ.
3. Si f ∈ C 2 (E, R) et w ∈ C 2 (E, R3), avec E ⊂ R3 ouvert, on aura, par
ce qui précède,
1
1
0 = 7d2 f = 7dωgrad
f = ωrot grad f ,
et donc
rot grad f = 0,
tandis que
1
1
1
3
0 = d2 ωw
= d(7 7 dωw
) = d(7ωrot
w ) = ωdiv rot w ,
et donc
div rot w = 0.
L’étude des propriétés des opérateurs différentiels gradient, divergence,
rotationnel et de leurs dérivés s’appelle l’analyse vectorielle. La théorie des
formes différentielles lui fournit un cadre général et systématique.
Si F ⊂ Rm et E ⊂ Rn sont des ouverts, si f ∈ C 1 (E, K) et g ∈ C 1 (F, E),
on sait, par le théorème de dérivation des fonctions composées, que f ◦ g ∈
C 1 (F, K) et que
$
d(f ◦ g)(y, h) = (f ◦ g)$y (h) = (fg(y)
◦ gy$ )(h)

$
$

= fg(y)
(gy$ (h)) = fg(y)
m
$
j=1

hj Dj g(y) =
n
$
i=1


m
$
Di f (g(y)) 
Dj gi (y)hj 
j=1
602
CHAPITRE 15. ANALYSE VECTORIELLE ET EXTÉRIEURE
=
n
$
Di f (g(y))dgi(y, h),
i=1
m
pour tout y ∈ F et tout h ∈ R . On a donc
d(f ◦ g) =
n
$
i=1
[(Dif ) ◦ g]dgi,
(15.6)
et l’on voit qu’en définissant le changement de variables x = g(y) dans la
1-forme différentielle df par le membre de droite de (15.6), cette opération
commutera avec l’opération de différentiation extérieure. On est ainsi conduit à la définition suivante, dans le cas général.
[
Définition. Soient E ⊂ Rn , ω ∈ C 0 (E, k (Rn , K)), où n, k ≥ 1 sont des
entiers, F ⊂ Rm et g ∈ C 1 (F, E). La transformée par g de
ω=
$
wIdxI
I∈C(n,k)
est l’élément g ∗ ω de C 0 (F,
[k
(Rm, K)) défini par
$
g ∗ω =
(wI ◦ g)dgI,
I∈C(n,k)
où, si dxI = dxi1 ∧ . . . ∧ dxik , on a posé

dgI = dgi1 ∧ . . . ∧ dgik = 
m
$
j1 =1


Dj1 gi1 dyj1  ∧ . . . ∧ 
m
$
jk =1

Djk gik dyjk  ,
les dyj désignant les 1-formes fondamentales dans Rm . Si f ∈ C 0 (E, K), la
transformée par g de f (considérée comme 0-forme) est définie par
g ∗ f = f ◦ g,
c’est-à-dire par le composé de f avec g.
La transformée possède les propriétés suivantes.
[
Proposition. Soient E ⊂ Rn , F ⊂ Rm des ouverts, ω ∈ C 0 (E, k (Rn , K)),
[
[
λ ∈ C 0 (E, k (Rn, K)), µ ∈ C 0 (E, l (Rn , K)), f ∈ C 0 (E, K) et g ∈ C 1 (F, E).
Alors, on a
1. g ∗ (ω + λ) = g ∗ ω + g ∗ λ
2. g ∗ (f ω) = (f ◦ g)g ∗ω
15.6. FORMES DIFFÉRENTIELLES
603
3. g ∗ (ω ∧ µ) = g ∗ ω ∧ g ∗ µ
4. Si f ∈ C 1 (E, K), d(g ∗f ) = g ∗ (df )
[
5. Si ω ∈ C 1 (E, k (Rn , K)), k ≥ 1 et g ∈ C 2 (F, E),
d(g ∗ω) = g ∗ dω.
6. Si G ⊂ Rl est un ouvert et h ∈ C 1 (G, F ),
(g ◦ h)∗ ω = h∗ (g ∗ω).
Démonstration. Les propriétés 1 à 3 sont des conséquences immédiates
de la définition et la propriété 4 est une écriture différente de (15.6). Elles
impliquent qu’il suffit de démontrer les propriétés 5 et 6 pour ω = wIdxI où
I ∈ C(n, k). Pour la propriété 5, on a
d(g ∗ (wIdxI )) = d[(wI ◦ g)dgi1 ∧ . . . ∧ dgik ]
= d(wI ◦ g) ∧ dgi1 ∧ . . . ∧ dgik + (wI ◦ g)d2 gi1 ∧ dgi2 ∧ . . . ∧ dgik
−(wI ◦ g)dgi1 ∧ d2 gi2 ∧ . . .∧ dgik + . . .+ (−1)k−1(wI ◦ g)dgi1 ∧ dgi
Téléchargement