ANALYSE avec ultrapetits - Analysis with ultrasmall numbers

publicité
ANALYSE
avec
ultrapetits
Introduction pour l’enseignant
Richard O’Donovan
[email protected]
27 juin 2016
2
Table des matières
I
Principes de base
4
II
La dérivée
8
III
Continuité
12
IV
L’intégrale
15
V
Limite
18
VI
Équivalence des définitions de la limite
19
VII
Corrigés des exercices
20
3
Première partie
Principes de base
L’observabilité est une primitive de cette approche. La métaphore d’échelle d’observation peut
être utile. Il y a les objets que l’on voit à l’œil nu. Puis il y a aussi des objets si petits ou des objets
si lointains que l’on a besoin d’une aide optique (microscope ou télescope) : une autre échelle
d’observation. Mais il y a encore des objets encore plus petits ou des objets encore plus lointains
qui nécessitent une aide électronique : les microscopes électroniques ou les radio-télescopes :
là aussi, une nouvelle échelle d’observation.
Les propriétés suivantes sont les conséquences d’axiomes ajoutés aux axiomes classiques de
la théorie des ensembles. Lorsqu’on enseigne l’analyse il est coutumier de présenter non pas
les axiomes, mais leurs conséquence en termes de propriétés des nombres réels. Les principes
suivants seront donc considérés axiomatiquement.
Principe de clôture (1)
Les nombres définis sans référence à l’observabilité sont toujours observables (ou standards).
Ceci permet de qualifier les nombres que l’on connaît
déjà.
√
Les nombres « familiers » tels que 1; 3; 1010 ; 2 ou π sont donc toujours observables (ou
standards).
Définition 1
Le contexte d’une propriété, fonction ou ensemble est la liste des paramètres utilisés dans sa
définition. 1 Le contexte peut être vide.
Un contexte est étendu si des paramètres sont ajoutés à la liste.
Le mot « observable » se réfère toujours, par convention, à un contexte. Déterminer le contexte
suppose de pouvoir dire de quoi l’on parle et ce que l’on en dit.
Existence et comparabilité des niveaux d’observation
— x est aussi observable que x.
— Etant donnée x1 et x2 , si x1 n’est pas observable quand x2 est observable, alors x2
est observable quand x1 est observable.
— Si x1 est aussi observable que x2 et x2 est aussi observable que x3 , alors x1 est aussi
observable que x3 .
La première partie de cet axiome dit que tout nombre est observable dans un contexte. La
deuxième partie dit que quels que soient deux nombres (ou plus), il existe un contexte d’où ils
sont tous observables. La troisième partie fixe la transitivité de l’observabilité.
Si un nombre est calculé en utilisant certains paramètres (observables puisque dans le
contexte), le résultat (unique) sera observable. Les nombres non observable ne se montrent pas
s’ils ne sont pas explicitement convoqués.
1. On notera qu’on considère qu’au gymnase, les fonctions sont données par des règles. Les paramètres dans une
définition déterminent ce dont on parle.
4
Exemple
Soit f : x 7→ x2 + 3, Les constantes de f sont 2 et 3 qui sont toujours observables. Il n’y a pas
de paramètre. 4 est toujours observable. Le nombre f (4) est donc aussi toujours observable. En
générale, pour cette fonction sans paramètre, f (x) sera aussi observable que x.
Définition 2
Un nombre réel est ultrapetit s’il est non nul et plus petit en valeur absolue que n’importe quel
nombre observable positif.
Cette définition fait une référence implicite à un contexte.
Principe d’existence des ultrapetits
Quel que soit le contexte, il existe des réels ultrapetits.
En particulier, si ε est ultrapetit relativement à un contexte contenant a, alors ε n’est pas
observable dans ce contexte, ni a + ε. Mais, par clôture, a est observable dans le contexte étendu
contenant aussi ε.
Définition 3
Un réel est ultragrand s’il est plus grand en valeur absolue que n’importe quel nombre observable
positif.
!
4
Notez que 0 n’est pas ultrapetit. Cela se justifie en observant que l’inverse d’un
ultragrand est ultrapetit et qu’ainsi la réciproque est vraie.
!
4
Notez aussi l’asymétrie : si h est ultrapetit dans le contexte de a alors il n’est pas
observable dans ce contexte. Mais, par comparabilité, a est observable dans le contexte de h et
n’est donc pas ultragrand relativement à h.
Exercice 1 (corrigé page 20)
En utilisant les principes et les dénitions, montrer que (pour un contexte donné)
(1) Si ε est ultrapetit, alors 1ε est ultragrand.
(2) If M est ultragrand, alors M1 est ultrapetit.
Définition 4
Soit un contexte donné. Soient des réels a et b. On dit que a est ultraproche de b , noté
a ' b,
si b − a est ultrapetit ou si a = b.
En particulier, x ' 0 si x est ultrapetit ou nul.
Notation contextuelle
Les seules propriétés acceptables sont celles qui ne se réfèrent pas à l’observabilité ou celles
qui utilisent le symbole “'".
5
Comme le montre l’exercice 1, l’inverse d’un ultrapetit est ultragrand, ainsi n ultragrand peut
se caractériser par 1/n ' 0. (Ainsi il n’est pas nécessaire d’introduire de nouveaux symboles
autre que “'”.)
Principe de clôture (2)
Soit un contexte donné, et P une propriété qui ne se réfère pas au contexte ou qui utilise le
symbole « ' ».
Si un nombre satisfait la propriété P , alors il y a un nombre observable satisfaisant cette
propriété.
(L’observabilité étant ici donnée par la propriété).
En classe, selon le degré de difficulté que l’on souhaite atteindre, il est possible de remplacer
la seconde partie du principe de clôture par une de ses conséquences, en utilisant la notation
contextuelle :
f (a) est observable
On se réfère ici à un contexte, par le mot "observable". Cette affirmation parle de f (ses paramètres) et de a, ceux-ci forment donc le contexte.
Principe de stabilité
Une propriété est vraie si et seulement si elle est vraie si son contexte est étendu.
Ceci signifie que le contexte est peu important pourvu qu’il contienne au moins tous les
paramètres. Si, par exemple, f et g sont des fonctions, alors les dérivées f 0 (a) et g 0 (a) ne
changent pas même si f 0 (a) est calculé en considérant les paramètres supplémentaires de g.
Pour toutes le fonctions données explicitement par des règles, cela se constate par inspection.
Comme c’est le cas des fonctions étudiées en classe, ce principe peut ne pas être mentionné au
départ.
Ce principe est rarement utilisée de manière explicite, on peut le signaler (sans donner de
principe générale) de la manière suivante :
Comme un nombre reste observable si on zoom dessus – il reste
observable dans les contextes étendus . De même, les propriétés
des nombres restent inchangés si on étend le contexte.
Pourquoi ultragrand plutôt qu’infini ?
On ne change pas le sens de mots utilisés dans les mathématiques qui n’utilisent pas les
axiomes d’ultrapetits.
La définition classique que les entiers sont des cardinaux finis demeure valable. Donc des entiers naturels ultragrands ne peuvent être infinis. Ils sont très, très grands, mais pas infinis.
En conséquence, leurs inverses ne sont pas infinitésimaux mais ultrapetits. Tous ces nombres
6
sont des réels.
Cette approche ne contredit aucune propriété classique, mais en utilisant une distinction supplémentaire, le langage est enrichi et l’on peut désormais dire des choses impossibles à dire
sans cette grammaire et ce vocabulaire étendu.
Pour un contexte donné : Si a ' x alors a et x sont voisins. Si a est voisin de x et si a est
observable alors a est le voisin observable de x.
Principe du voisin observable
Soit un contexte donné.
Tout réel qui n’est pas ultragrand est ultraproche d’un nombre observable.
Un réel x n’est pas ultragrand s’il existe deux nombres observables a et b tels que a ≤ x ≤ b.
Dans ce cas il existe un c observable, tel que c ' x. On peut aussi écrire x = c + h avec h ' 0.
a est le voisin observable de x ou encore la partie observable part de x.
Exercice 2 (corrigé page 20) Soit un contexte donné.
Montrer que, si a et b sont observables, alors
a'b⇒a=b
et qu'en conséquence, le voisin observable est unique.
Ceci est équivalent à l’unicité de la limite et à la complétude des réels.
Exercice 3 (corrigé page 20)
Démontrer la règle 1.
Règle 1
Soit un contexte donné et soient a observable non nul et h et ε ultrapetits. Alors
(1) a · h ' 0
a
(2)
est ultragrand.
h
(3) ε · h ' 0
(4) ε + h ' 0
Exercice 4 (corrigé page 21)
Démontrer la règle 2.
Règle 2
Soit un contexte donné et soient a et b observables avec x et y tels que a ' x et b ' y. Alors
(1) a ± b ' x ± y.
(2) a · b ' x · y.
(3) Si b 6= 0 alors
a
x
' .
b
y
Nous appelons ces règles, l’« ultracalcul » Ces preuves sont algébriques et un bon entraînement pour faire travailler les étudiants à partir de définitions.
7
Notez que l’existence
du voisin observable n’est pas garantie dans Q. Soit x un rationnel
√
ultraproche
de
2
(pour
N entier positif ultragrand, prendre les N premières décimales de
√ √
2). 2 est standard, par clôture : c’est la seule solution de x2 = 2 qui n’a pas de paramètre.
Cette équation ne fait pas référence
à l’observabilité donc ses solutions seront standards – ou
√
toujours observables. Puisque 2 est standard et non rationnel le voisin observable de x n’est
pas dans Q.
Note sur la présentation aux étudiants :
Il n’est pas nécessaire de démontrer tous les résultats donnés ici avant d’étudier la dérivée.
Avec des règles explicites pour les fonctions, il est possible de les démontrer au moment où leur
utilité est manifeste.
Deuxième partie
La dérivée
Nous ne démontrons pas ici tous les théorèmes concernant les dérivées mais nous espérons
en montrer suffisamment pour que les autres puissent être démontrés en exercice.
La définition de la dérivée en un point suppose que la fonction soit définie au moins sur un
intervalle ]b, c[ contenant a. Comme le domaine est déterminé par f (clôture), il est observable
et on peut donc toujours supposer que b et c sont observables.
Comme x est la variable indépendante, son incrément peut toujours être choisi non nul sans
toutefois spécifier s’il est positif ou négatif. On écrira dx pour cet incrément ultrapetit (non nul).
Définition 5
Soit f une fonction réelle défini sur un intervalle ouvert contenant a.
On dit que f est dérivable en a s’il y a un nombre observable D tel que pour tout dx ultrapetit,
on a
f (a + dx) − f (a)
'D
dx
On écrit D = f 0 (a), la dérivée de f en a.
(Le contexte est donné par f et a)
— Le résultat ne doit pas dépendre de dx
— Quand elle existe, la dérivée est le voisin observable de
f (a+dx)−f (a)
.
dx
Exemple
Soit
f : x 7→ x2 + 3x
pour la dérivée en x = 5. Les paramètres sont 2, 3 et 5 (le contexte). Soit dx ultrapetit. Alors
f (5 + dx) − f (5)
((5 + dx)2 + 3(5 + dx)) − (25 + 15)
10dx + 3dx + dx2
=
=
= 10 + 3 + dx.
dx
dx
dx
8
On a 13 + dx ' 13 qui est observable et ne dépend pas pas du choix de dx, c’est donc la
dérivée.
!
4
La même preuve peut être faite pour x en général. Alors x fait partie du contexte.
Notez que la preuve serait valable pour tout x ; pas seulement pour les x standards. Ceci est
une des différences majeures entre cette approche et l’analyse non standard de Robinson ou
celle de Nelson.
!
Notez aussi qu’il est possible d’être raisonnablement « négligent » dans la détermination du contexte. Lorsque la formule est développée, dx doit être ultrapetit relativement à
chaque terme.
4
Exemple
Soit
g : x 7→ |x|
en 0. Soi dx ultrapetit. Si dx > 0, alors
g(0 + dx) − g(0)
g(dx) − g(0)
dx − 0
dx
=
=
=
= 1.
dx
dx
dx
dx
Mais si dx < 0, alors
g(0 + dx) − g(0)
g(dx) − g(0)
−dx − 0
−dx
=
=
=
= −1.
dx
dx
dx
dx
Il n’y a pas de nombre observable ultraproche des deux valeurs, le résultat dépend donc de dx.
La conclusion est que la dérivée de g n’existe pas pour x = 0.
La fonction valeur absolue est définie sans référence à l’observabilité. Mais en fait, on pourrait
aussi ignorer ceci est poser que dx doit être ultrapetit relativement au contexte qui est celui de
g et de 0 sans plus de précision.
La droite tangente à une courbe en x0 peut donc être maintenant définie en utilisant la
dérivée. La tangente t : x 7→ ax + b est la droite (unique) satisfaisant t(x0 ) = f (x0 ) et t0 (x0 ) =
a = f 0 (x0 ).
Règles de dérivation
Soit le contexte de f et a, on pose dx ultrapetit. On écrit
∆f (a) = f (a + dx) − f (a).
Alors
∆f (a)
' f 0 (a).
dx
Et aussi f (a + dx) = f (a) + ∆f (a).
9
Théorème 1 (Equation de l’incrément)
Si f est dérivable en a, alors
f (a + dx) = f (a) + f 0 (a) · dx + ε · dx
avec ε ' 0
Réciproquement : s’il existe un nombre observable D tel que pour tout dx
f (a + dx) = f (a) + D · dx + ε · dx
avec ε ' 0
alors D = f 0 (a)
Les preuves sont immédiates et découlent de la définition.
f (a + dx)
Notez que le dessin ci-contre montre
des valeurs réelles. La version “limite”
ne peut être dessinée.
∆f (a)
f (a)
dx
a a + dx
Nous montrons sans plus de commentaires quelques preuves des résultats usuels sur la
dérivée et laissons les autres en exercice.
On ne spécifiera pas à chaque fois le contexte. Notez que dx n’est pas un paramètre, pas
plus que ne le sont les ε et δ des preuves classiques. Ce sont des variables muettes. Ce n’est
pas de ces variables que la formules parle, ce ne sont que des auxiliaires de calcul. De fait.
la notation contextuelle ne permet l’utilisation de quantités ultrapetites que pour ces variables
muettes.
Théorème 2
Si f 0 (a) existe, alors ∆f (a) ' 0.
Preuve: ∆f (a) =
∆f (a)
dx
· dx ' f 0 (a) · 0 = 0 (par la règle 1.1).
Preuve alternative : ∆f (a) = f (a + dx) − f (a) = f 0 (a) · dx + ε · dx pour ε ' 0 (l’équation
de l’incrément). Il est alors immédiat que ∆f (a) ' 0 (par les règles 1.1 et 1.4).
Ceci montre que la dérivabilité implique la continuité, mais comme on a choisi ici de montrer
la dérivée avant de parler de continuité, ce concept n’est pas mentionné.
Théorème 3
Soit f et g des fonctions dérivables en a. Alors la fonction f · g est dérivable en a et
(f · g)0 (a) = f 0 (a) · g(a) + f (a) · g 0 (a).
10
Preuve:
∆(f · g)(a)
dx
=
f (a + dx) · g(a + dx) − f (a) · g(a)
dx
f (a) + ∆f (a) · g(a) + ∆g(a) − f (a) · g(a)
=
=
dx
f (a) · ∆g(a) + ∆f (a) · g(a) + ∆f (a) · ∆g(a)
dx
= f (a) ·
∆g(a) ∆f (a)
∆f (a) · ∆g(a)
+
· g(a) +
dx
dx
dx
' f 0 (a) · g(a) + f (a) · g 0 (a),
∆f (a) · ∆g(a)
' f 0 (a) · 0 = 0
dx
(Ce dernier points parce que ∆g(a) ' 0 par le théorème 2 et f 0 (a) est observable (par sa
définition) et un observable fois un ultrapetit est ultrapetit, par la règle 1).
Comme f 0 (a) · g(a) + f (a) · g 0 (a) est observable, c’est la dérivée.
car
!
4
La stabilité est en fait cachée dans la preuve. Si g(a) n’est pas aussi observable que
f (a) alors le contexte pour f 0 est étendu pour contenir aussi les paramètres de g(a) et ceci
devient le contexte pour toute la preuve. En classe, quasiment toutes le fonctions sont standards
et cette subtilité n’est pas problématique, d’autant plus que si l’on a auparavant travaillé avec
des fonctions données par des règles, le résultat s’observe par inspection.
Théorème 4 (Dérivée de la composition)
Soit g une fonction dérivable en a et f une fonction dérivable en g(a). Alors la fonction f ◦ g
est dérivable en a et
(f ◦ g)0 (a) = f 0 (g(a)) · g 0 (a).
Preuve: On considère deux cas (1) ∆g(a) = 0 et (2) ∆g(a) 6= 0.
(1) Si ∆g(a) 6= 0, alors
f (g(a + dx)) − f (g(a))
dx
f (g(a) + ∆g(a)) − f (g(a))
dx
f (g(a) + ∆g(a)) − f (g(a)) ∆g(a)
=
·
∆g(a)
dx
' f 0 (g(a)) · g 0 (a)
=
Comme f est dérivable en g(a) et comme g est dérivable en a on a ∆g(a) ' 0.
Cette preuve peut être plus facile en utilisant la notation de Leibniz en remplaçant g(a)
par y et ∆g(a) par ∆y, alors
∆f (y)
∆f (y) ∆y
=
·
' f 0 (y) · y 0
dx
∆y
dx
11
(2) Si ∆g(a) = 0 alors g(a + dx) = g(a) et g 0 (a) = 0, donc
f (g(a))0 = f 0 (g(a)) · g 0 (a).
f (g(a + dx)) − f (g(a))
= 0. Et
dx
On peut aussi utiliser l’équation de l’incrément :.
f (g(a + dx)) = f (g(a) + ∆g(a)) − f (g(a)) = f (g(a)) + f 0 (g(a))∆g(a) + ε · ∆g(a)
= f (g(a)) + f 0 (g(a))(g 0 (a) · dx + δ · dx) + ε · (g 0 (a) · dx + δ · dx)
d’où
(f (g(a))0 = f 0 (g(a))(g 0 (a)
Théorème 5 (Règle de l’Hôpital pour 0/0 – forme simple )
Soient f et g des fonctions dérivables en a. Supposons que f (a) = g(a) = 0 mais que g 0 (a) 6= 0.
Alors
f (a + dx)
f 0 (a)
' 0
g(a + dx)
g (a)
Exercice 5 (corrigé page 21)
Démontrer le théorème 5.
Troisième partie
Continuité
Définition 6
Soit f une fonction définie sur un intervalle contenant a. On dit que f est continue en a si
f (x) ' f (a)
pour chaque x ' a.
Ceci est une propriété de f et de a qui déterminent donc le contexte.
Alternativement : f est continue en a si
f (a + dx) ' f (a)
ou encore :
∆f (a) ' 0
Si f est dérivable en a alors f est continue en a. Ceci est une reformulation du théorème 2.
Théorème 6
Soient f et g deux fonctions continues en a. Alors
(1) f ± g est continue en a.
(2) f · g est continue en a.
f
(3)
est continue en a si g(a) 6= 0.
g
12
Preuve: Ce théorème est un conséquence directe de la règle 2
Théorème 7
Si g est continue en a et f en g(a). Alors f ◦ g est continue en a.
Preuve: Soit x ' a. Alors g(x) ' g(a) par continuité de g en a donc f (g(x)) ' f (g(a)) par
continuité de f en g(a).
Exemple
√
On utilise que x 7→ x2 est continue pour montrer que x 7→ x est continue.
Preuve:
Soit x ' a.
√
√
On considère x et son voisin observable b ' x.
Par continuité de x 7→ x2 on a b2 ' x.
Comme x ' a on a b2 ' a donc b2 = a (voir exercice 2).
√
√
√
D’où b = a, et on conclut que x ' a.
En général :
Théorème 8 (Continuité de la réciproque)
Soit f : I → J (I et J fermés bornés) une fonction continue et bijective. Alors rf : J → I est
continue.
Preuve: Soit a observable dans I.
On note f (a) = d et a = rf (y). Soit y ' f (a), il faut montrer que rf (y) ' a
Comme J est fermé borné, tout y ∈ J a un voisin observable dans J.
On note c le voisin observable de rf (y). Par continuité de f on a f (c) ' f (rf (y)) = y ' d
Donc f (c) = d (par exercice 2) et c = rf (d) = a puisque f est bijective, d’où rf (y) ' a.
Ayant déterminé la continuité de la réciproque on peut regarder sa dérivée.
Théorème 9 (Dérivée de la réciproque)
Soit f : (a, b) → R continue et ayant une réciproque. Soit y = f (x). Si f est dérivable en
x ∈ (a, b) avec f 0 (x) 6= 0, alors f −1 est dérivable en y et
r 0
f (y) =
1
1
= 0 r
.
f 0 (x)
f ( f (y))
13
Preuve:
rf
x + dx
f
dx
x
∆y
y + ∆y
∆y
y
dx
y
x
y + ∆y
Ainsi
x + dx
∆rf (y)
1
1
dx
1
=
' 0
=
=
,
∆y
∆f (x)
∆y
∆y
f (x)
dx
dx
∆f (x)
puisque
' f 0 (x) 6= 0 par hypothèse. Mais f 01(x) est observable par clôture, donc (rf (y))0
dx
existe et
1
1
(rf (y))0 = 0
= 0 r
.
f (x)
f ( f (y))
Pour les propriétés locales (dérivée, continuité), la méthode est de regarder des voisins
ultraproches pour trouver une approximation de la valeur recherchée ; le voisin observable étant
cette valeur. Pour les propriétés globales (valeurs intermédiaires, valeurs extrêmes, intégrale) le
principe est de diviser un intervalle en un nombre ultragrand de parties, de trouver la meilleure
approximation et de prendre le voisin observable.
Théorème 10 (de la valeur intermédiaire)
Soit f une fonction continue sur [a; b] telle que f (a) < 0 < f (b). Alors il existe c ∈ [a; b] tel que
f (c) = 0.
Preuve: (Le contexte est donné par f , a et b.)
Soit N un entier ultragrand positif. Soit dx = (b−a)/N (donc dx ' 0). Soient xi = a+i·dx,
pour i = 0, . . . , N (donc x0 = a et xN = b). Comme c’est une collection finie, il y a un premier
indice j tel que f (xj+1 ) ≥ 0. On a donc
f (xj ) ≤ 0 ≤ f (xj+1 ).
Soit c le voisin observable de xj (il existe puisque xj est borné par a et b dans le contexte). 2
Donc xj ' c. Par ailleurs, c ∈ [a; b] et c ' xj+1 car xj ' xj+1 . Par continuité de f en c on a
f (c) ' f (xj ) < 0
et
f (c) ' f (xj+1 ) ≥ 0.
On déduit que
f (c) ' 0.
2. c’est ici la première utilisation explicite du principe du voisin observable
14
Mais f (c) est observable (par clôture) de même que que 0, donc on a
f (c) = 0.
Quatrième partie
L’intégrale
On considère deux approches de l’intégrale. D’abord en considérant qu’une fonction aire
existe 3 , ensuite en faisant une somme ultragrande de valeurs ultrapetites.
On considère une fonction non-négative f continue sur [a; b]. Soit A(x) l’aire entre la fonction
et l’axe des x de a à x.
La variation de l’aire entre x et x + dx est notée ∆A(x).
f
A(x)
a
∆A(x)
x
x + dx
b
Théorème 11
Soit f une fonction non-négative continue sur [a; b]. Alors la fonction
A : x 7→ A(x),
(où A(x) est l’aire sous la courbe de a à x) satisfait les deux propriétés suivantes :
(1) A0 (x) = f (x), pour tout x ∈ [a; b].
(2) A(a) = 0.
Preuve: (2) est évident. On montre (1).
Le contexte est a, f et x. Soit dx ultrapetit positif. Puisque f est continue sur l’intervalle
[x; x + dx] elle possède atteint un maximum et un minimum sur [x; x + dx]. On note (xM , f (xM ))
pour le maximum et (xm , f (xm )) pour le minimum. Alors
f (xm ) · dx ≤ ∆A(x) ≤ f (xM ) · dx.
3. Formellement il faudrait définir ce qu’est une aire. En classe, on admettra que le concept est bien défini sans
plus de discussion ni de théorie de la mesure.
15
Donc
∆A(x)
≤ f (xM ).
dx
Comme f est continue en x (qui est dans le contexte) et x ' xM et x ' xm on a f (x) ' f (xM )
et f (x) ' f (xm ) (donc aussi f (xM ) ' f (xm )). Ceci implique que
f (xm ) ≤
∆A(x)
' f (x).
dx
On obtient le même résultat si dx est négatif et
A0 (x) = f (x),
puisque f (x) est observable par clôture.
L’aire peut aussi être calculée en additionnant un nombre ultragrand de tranches ultrafines et
on montre que l’erreur totale (les quasi triangles sur le dessus) totalisent une erreur ultrapetite.
On considère ici que f est continue et qu’on en connaît une primitive F 0 (x) = f (x) pour tout
x dans [a, b]. Soit N ultragrand positif et dx = (b − a)/N avec xi = a + i · dx, pour i = 0, . . . , N .
L’aire totale est approximée par
N
−1
X
f (xi ) · dx.
i=0
f (xi )
l’aire du rectangle est f (xi ) · dx
xi
dx
a
xi
b
16
Définition 7
Soit f un fonction définie sur [a; b]. On dit que f est intégrable sur [a; b] s’il y a un nombre
b−a
observable I tel que pour tout n entier naturel ultragrand avec dx =
and xi = a + i · dx
n
pour i = 0, . . . , n
!
n−1
X
f (xi ) · ∆x ' I.
i=0
Si un tel nombre existe, on l’appelle l’intégrale de f entre a et b, noté
Z
b
f (x) · dx.
a
Théorème 12 (Théorème fondamentale de l’analyse)
Soit f une fonction continue sur [a; b]. Soit F une primitive de f sur [a; b]. Alors
b
Z
f (x) · dx = F (b) − F (a).
a
Preuve:
Soit N un entier positif ultragrand 4 et soit dx = (b − a)/N avec xi = a + i · dx pour
i = 0, . . . , N . On écrit F (b) − F (a) sous forme de somme télescopique :
F (b) − F (a) =
N
−1
X
F (xi+1 ) − F (xi ) =
N
−1
X
i=0
F (xi + dx) − F (xi ).
i=0
Par le théorème des accroissement finis, il y a un x dans [xi , xi+1 ] tel que F (xi+1 ) − F (xi ) =
F 0 (x) · dx. Soit c le voisin observable de x, alors F 0 (x) ' F 0 (c) ' F 0 (xi ). Donc F 0 (x) '
F 0 (xi ) + εi et
F (xi+1 ) − F (xi ) = F 0 (xi ) · dx + εi · dx = f (xi ) · dx + εi · dx.
On a donc
F (b) − F (a) =
N
−1
X
f (xi ) · dx +
i=0
N
−1
X
εi · dx.
i=0
Il faut montrer que
N
−1
X
εi · dx ' 0.
i=0
Soit ε le max{|εi |} alors
−1
N
−1
N
−1
−1
NX
NX
X
X
|εi | · dx ≤
ε · dx = ε ·
dx = ε · (b − a) ' 0
0≤
εi · dx ≤
i=0
i=0
i=0
4. Le contexte est a, b et f .
17
i=0
Donc
F (b) − F (a) '
N
−1
X
f (xi ) · dx,
i=0
mais F (b) − F (a) est observable ; f est donc intégrable et
Z b
F (b) − F (a) =
f (x) · dx.
a
Ce théorème montre qu’un fonction dont on connaît une primitive est intégrable. On peut
montrer raisonnablement facilement que toutes les fonctions continues sont intégrables. Comme
en analyse classique, une fois démontré les propriétés de l’intégrale, on définit que l’aire sous
une fonction positive est donnée par l’intégrale.
Cinquième partie
Limite
!
4
Le concept de limite n’est pas absolument nécessaire pour faire de l’analyse avec
ultrapetits. Il y a néanmoins de bonnes raisons de l’introduire. Une raison très terre à terre et
que le plan d’études l’exige. Par ailleurs les étudiants en verront dans des publications et des
formulaires et aussi parce que c’est un raccourci commode.
La continuité étant définie sans référence à la limite, celle-ci peut être définie au moyen de
la continuité sans crainte de circularité.
La limite de f en a est la valeur que f devrait prendre pour être continue en a.
Définition 8
Soit f une fonction définie autour de a. On dit que la limite de f en a existe s’il y a un réel
observable L tel que
f (x) ' L dès que x ' a (x 6= a).
Exemple
On considère la fonction
f : x 7→
2x2 − 7x + 3
,
x−3
avec Dom(f ) = R \ {3},
et sa limite en a = 3. La fonction f est définie autour de 3. Soit x ' 3 (x 6= 3). Alors
f (x) =
2x2 − 7x + 3
(2x − 1) · (x − 3)
=
= 2x − 1 ' 5
x−3
x−3
Théorème 13
Si la limite de f en a existe, alors elle est unique.
18
Preuve: Supposons que L1 et L2 soient observables tels que
f (x) ' L1
and f (x) ' L2
dès que x ' a (x 6= a) .
Alors
L1 ' L2
sont tous deux observables.
donc L1 = L2 (par la règle 2.4)
On écrit
lim f (x) = L
x→a
si la limite de f en a est L.
Sixième partie
Équivalence des définitions de la limite
C’est un exercice assez simple de vérifier que les définitions de dérivées, continuité et d’intégrale peuvent être réécrites avec des limites selon la définition ci-dessus. Pour se convaincre
que les propriétés démontrées au moyen d’ultrapetits ne contredisent aucun résultat classique,
il nous suffit de montrer l’équivalence avec la définition classique de la limite.
Ceci ne peut se faire que dans un univers où les deux définitions coexistent. Nous montrons
donc que si on revient à la définition classique et qu’on passe par le foncteur “oubli”, on obtient
la version classique de l’analyse.
Définition 1 La fonction f a une limite en a s’il existe L, tel que
∀ε > 0, ∃δ > 0
0 < |x − a| < δ ⇒ |f (x) − L| < ε
Définition2 La fonction f a une limite en a s’il existe L observable, tel que
∀x
Théorème 14
Définition (1)
⇐⇒
x'a
(x 6= a)
⇒ f (x) ' L
Définition (2)
Preuve: (2) ⇒ (1)
Admettons x ' a(x 6= a) ⇒ f (x) ' L. Le contexte est donné par f, a et L. On choisit ε et
on étend le contexte à f, a, L et ε
Soit δ ultrapetit. Si 0 < |x − a| < δ alors x ' a. Par hypothèse de départ ceci implique
f (x) ' L ou |f (x) − L| ' 0. Or ε est observable, donc |f (x) − L| < ε
Ceci est vrai pour n’importe quel ε, on a donc bien
x ' a(x 6= a) ⇒ f (x) ' L) =⇒ ∀ε > 0, ∃δ > 0 |x − a| < δ ⇒ |f (x) − L| < ε
19
(1) ⇒ (2)
Admettons ∀ε > 0, ∃δ > 0 0 < |x − a| < δ ⇒ |f (x) − L| < ε. Le contexte est donné par
f, a et L. On choisit ε et on étend le contexte à f, a, L et ε
On a donc : ∃δ > 0 0 < |x − a| < δ ⇒ |f (x) − L| < ε. S’il existe δ ayant une propriété, par
clôture, il existe un δ observable ayant cette propriété. D’où : pour tout x ' a on a |x − a| < δ
(δ observable) ce qui implique |f (x) − L| < ε, c’est-à-dire : Pour tout ε observable, x ' a ⇒
|f (x) − L| < ε donc f (x) ' L, on a donc bien
∀ε > 0, ∃δ > 0
0 < |x − a| < δ ⇒ |f (x) − L| < ε =⇒ x ' a(x 6= a) ⇒ f (x) ' L
Septième partie
Corrigés des exercices
Corrigé de l’exercice 1, page 5
On fixe un contexte.
(1) Par contradiction : considérons ε ultrapetit et positif et que 1ε n’est pas ultragrand, c.à.d.
qu’il y a a observable tel que 1ε < a. Alors a1 < ε, mais par clôture 1/a est observable
(et positif) contredisant que ε est ultrapetit.
(2) Par contradiction comme ci-dessus, admettant qu’il y a un b observable non-nul tel que
1
b< M
ce qui entraîne M < 1b . Ce dernier terme est observable par clôture et contredit
que M est ultragrand.
!
4
On s’arrêtera un moment sur ces démonstrations pour constater l’importance de la
clôture.
Corrigé de l’exercice 2, page 7
Preuve: Si a ' b alors a − b ' 0. Comme a et b sont observables, par clôture, leur différence est
observable, elle ne peut donc être ultrapetite. Elle est donc nulle.
Corrigé de l’exercice 3, page 7
Preuve: Sans perte de généralité, on considère tous les termes comme positifs.
(1) . Supposons que a · h ≥ b pour un b observable non nul. Alors h ≥ ab . Par clôture b/a est
observable et ceci contredit que h est ultrapetit.
(2) Par contradiction : on suppose
que h est ultrapetit..
a
h
< b pour un b observable. D’où
a
b
< h ce qui contredit
(3) Pour tout a observable non nul, on a 0 < h < a d’où 0 < ε · h < ε · a ' 0.
(4) ε + h ≤ 2 · max{ε, h} ' 0 par le point (1).
| {z }
'0
20
Corrigé de l’exercice 4, page 7
Preuve:
(1) On peut écrire x = a + ε et y = b + δ. Avec ε, h ' 0.
x ± y = (a + ε) ± (b + δ) = (a ± b) + (ε ± δ),
| {z }
'0
donc a ± b ' x ± y.
(2) De même pour le produit :
x · y = (a + ε) · (b + δ) = a · b + |{z}
a · δ + |{z}
b · ε + |{z}
ε·δ
'0
'0
'0
par le règle 1 donc a · b ' x · y.
(3) On montre d’abord y1 ' 1b : Comme y ' b 6= 0, alors y n’est pas ultrapetit, donc y1 n’est
pas ultragrand. Soit c le voisin observable de y1 . Alors, par (2) b · c ' y · y1 = 1, donc
b · c = 1 (tous observables) donc c = 1b .
On en déduit par une nouvelle application de (2) que xy = x · y1 ' a · 1b = ab .
Corrigé de l’exercice 5, page 12
Preuve: Le contexte est a, f et g. Soit x ' a avec x 6= a. On écrit x = a + dx). Alors
∆f (a)
f 0 (a)
f (a + dx)
f (a) + ∆f (a)
∆f (a)
=
=
= dx ' 0
.
∆g(a)
g(a + dx)
g(a) + ∆g(a)
∆g(a)
g (a)
dx
On peut aussi utiliser : f (a+dx) = f (a)+f 0 (a)·dx+ε·dx et g(a+dx) = g(a)+g 0 (a)·dx+δ·dx,
donc
f (a + dx)
f 0 (a) · dx + ε · dx
f 0 (a) + ε
f 0 (a)
= 0
= 0
' 0
g(a + dx)
g (a) · dx + δ · dx
g (a) + δ
g (a)
21
Que se passe-t-il si la notation contextuelle n’est pas utilisée ?
Le symbole "'" n’est défini qu’en référence à un contexte. Une référence non contextuelle (en
se référant à un nombre qui n’est pas dans la liste des paramètres, par exemple) nécessiterait
d’inventer une nouvelle notation. On peut trouver amusant d’inventer une telle notation et produire des objets syntactiques qui semblent définir un fonction qui serait partout constante, sans
aucun point de discontinuité mais globalement croissante. Nous ne nous attarderons pas sur ces
objets « externes » qui peuvent avoir des comportements « pathologiques ». Il a été démontré
(par Hrbacek) que la notation contextuelle garantit que les ensembles, fonctions ou propriétés
sont les ensembles, fonctions et propriétés habituelles et peuvent être utilisées sans crainte de
voir apparaître de contradiction, y compris dans les démonstrations par récurrence.
Le problème de la récurrence
!
4
Il n’est pas possible de procéder par récurrence pour montrer que tous les nombres
sont standards.
Il est vrai que 1 est standard et, par clôture, que si n est standard alors n + 1 est aussi
standard (puisque le contexte de n + 1 est donné par n et 1 qui est toujours observable, donc
le contexte est celui de n). Mais il serait faux de conclure que donc tout entier naturel n est
standard. Ce n’est pas vrai : il y a des entiers naturels qui ne sont pas standards. La récurrence
est une propriété classique qui est vraie pour les propriétés classiques (ne faisant donc pas
référence à l’observabilité).
La propriété « est standard » n’est pas une propriété classique et ne peut ni être utilisée
pour l’induction ni pour définir un ensemble : il n’y a pas d’ensemble des nombres toujours
observables ou d’ensemble de nombres ultrapetits. La récurrence peut être employée pour les
propriétés ne faisant pas référence à l’observabilité ou faisant une référence contextuelle.
Références
[1] Karel Hrbacek. Stratified analysis ? In I. van den Berg V. Neves, editor, Nonstandard Methods
and Applications in Mathematics, pages 47–63. Springer, 2007.
[2] Karel Hrbacek, Olivier Lessmann, and Richard O’Donovan. Analysis with ultrasmall numbers.
American Mathematical Monthly, 117(9), November 2010.
[3] Karel Hrbacek, Olivier Lessmann, and Richard O’Donovan. Analysis With Ultrasmall Numbers. CRC Press, 2015.
[4] Richard O’Donovan. Pre-university analysis. In I. van den Berg V. Neves, editor, The Strength
of Nonstandard Analysis, pages 395–401. Springer, 2007.
Voir aussi le site www.ultrasmall.org
22
Téléchargement