Annexe J Quelques compléments de logique mathématique.

publicité
1
21/10/2016
Annexe J. Logique mathématique.
Annexe J
Quelques compléments de logique mathématique.
NB. A côté de questions, que j’espère avoir éclairées, j’en ai rencontré beaucoup
d’autres, auxquelles je n’ai pas de réponse. Elles sont posées, en notes en caractères « arial », à
mesure de leur apparition dans ce « text in progress ». Là où – sans être sûr de la réponse – je
penche d’un côté, je l’indique par un (oui ?) ou un (non ?). Les questions proprement dites sont
mises en italiques. Leur numérotation peut comporter des trous : ils correspondent à des questions
antérieures, qui ont trouvé leur solution.
Je serai reconnaissant à mes lecteurs de me donner (par courriel –
[email protected]) leur point de vue, ou de m’indiquer quelles lectures ils pourraient
me recommander.
Cette annexe « technique » emploie quelques notations courantes en logique et en
analyse :  (appartient à)…,  (il existe…),  (pour tout…),  (non…). M  a (M est un
modèle de a).
Les références de type 14-4B concernent la section 4B du chapitre 14 de « Science et
philosophie ». Comme dans l’ensemble de cet ouvrage, les définitions sont en caractères gras,
mes positions personnelles en caractères Arial. Les * après les noms des auteurs renvoient aux
références à la fin de l’annexe.
Table des matières.
1. La théorie des modèles.
2. La logique du deuxième ordre.
3. Les théorèmes d’incomplétude.
4. L’hypothèse du continu.
5. L’axiome de choix.
6. Les Reverse Mathematics.
7. Les infinis.
Rappelons qu’on désigne par PA1 (PA pour le mathématicien Peano)
l’axiomatisation de l’arithmétique en premier ordre, par PA2 celle en deuxième
ordre.
Cette annexe se propose d’approfondir (ou de présenter de façon plus
technique) divers éléments, assez dispersés, mais dont chacun peut éclairer le
bref chapitre 1 « la logique et les mathématiques » de sp. Malheureusement, le
sujet est malaisé : complexité des définitions et des notations ; accent trop mis
sur l’aspect formel des axiomes, et pas assez sur leur sens profond ; longueur des
démonstrations formelles ; diversité des écoles et obscurité de certaines positions
(par exemple sur les rôles respectifs du deuxième ordre et de la théorie des
ensembles) ; situation intermédiaire entre mathématiques et métamathématique.
Nous n’avons évidemment pas eu la possibilité d’aborder tous les sujets de cette
immense discipline. Si nous avons certainement simplifié certaines questions
subtiles, il nous a semblé, qu’au-delà des variantes, apparaissaient des points
communs.
1. La théorie des modèles.
Elle travaille essentiellement en logique du premier ordre, et arrive à
toute une série de résultats remarquables, dont on trouvera ci-dessous un bref
résumé. Rappelons que, de deux modèles qui satisfont aux mêmes formules du
2
21/10/2016
Annexe J. Logique mathématique.
premier ordre sans variables libres, on dit qu’ils sont élémentairement
équivalents ; on définit parallèlement les extensions élémentaires). Un exemple
concret est fourni par le modèle de l’arithmétique du premier ordre que l’on peut
former en ajoutant aux entiers naturels un nombre plus grand que chacun d’entre
eux (modèle qui prouve que cette arithmétique n’est pas ℵ0-catégorique)1 ; un
exemple encore plus simple est celui de l’axiomatisation de la seule fonction
successeur : un modèle non-standard en est N +Z. La α-cardinalité est plus forte
que la complétude ; une théorie catégorique, qui n’a pas de modèles finis, est
complète. Les structures ℵ0-catégoriques ont beaucoup de belles propriétés.
- Une théorie est modèle-complète, si toute extension B d’un modèle A
est élémentaire.
- Une propriété est (finiment) axiomatisable, s’il existe une théorie qui
la modélise (finiment) par une formule close.
- Une théorie a l’élimination des quantificateurs, si toute formule est
équivalente à une combinaison de formules atomiques. Exemple, pour les élèves
de première : sur R,  x : Ax2 + Bx + C = 0 est équivalent à : B2 - 4AC ≥ 0. Cette
propriété permet d’obtenir des résultats de décidabilité.
- Il existe des cas où il est facile de démontrer qu’une extension T’ (de
deuxième ordre) de T (de premier ordre) est conservative (définition donnée à la
note* de sp) en contraposant : si T ne prouve pas F, alors la complétude du calcul
des prédicats en premier ordre entraîne qu’il existe un modèle de T + ¬F ; ce
modèle peut souvent être prolongé en un modèle de T’ + ¬F).
En algèbre (et dans une moindre mesure pour des théories plus
simples, comme celles de l’ordre), les concepts développés par la théorie des
modèles s’avèrent très éclairants. Des applications intéressantes de la théorie des
modèles ont été trouvées récemment en analyse et en théorie des catégories.
1
Une théorie est dite α-catégorique pour un nombre cardinal α si elle a exactement un
modèle de cardinalité α.
3
21/10/2016
Annexe J. Logique mathématique.
2. Un peu plus sur la logique (les logiques) du deuxième ordre.
Rappelons que cette logique considère deux types de variables : les
éléments et les sous-ensembles d’éléments. Sa syntaxe est identique à celle du
premier ordre. C’est uniquement quand on assigne aux variables du deuxième
type de représenter la totalité des sous-ensembles que sa sémantique diffère de
celle du premier ordre. Les logiques des ordres supérieurs à deux se ramènent
pratiquement à la logique du deuxième ordre. Il y a aussi des logiques
infinitaires, et des logiques où le temps intervient; nous ne les considérerons pas.
Techniquement, il y a plusieurs sémantiques pour la logique du
deuxième ordre. J’en resterai à la plus naturelle, celle « standard » qui,
interprétant les formules du deuxième ordre en parcourant la totalité des objets,
nous assure de la catégoricité.
Il faut, bien entendu, distinguer soigneusement ce qui est exprimable et
ce qui est démontrable en premier ou en deuxième ordre. Le deuxième ordre est
indispensable pour tenir compte de notions essentielles, comme l’infini, le bon
ordre ou la clôture.
Les relations entre deuxième ordre et théorie des ensembles sont
complexes. La notion d’appartenance à un ensemble (x  E) et celle - plus
difficile - d’ensemble des parties sont communes à ZFC et à la logique du
deuxième ordre.
A toute théorie T du deuxième ordre, ayant un modèle M, on peut faire
correspondre, dans la théorie ZFC du premier ordre, une formule T(x) signifiant
que M est un modèle de T; et à toute formule Φ de T une formule Φ’ signifiant
que Φ est vrai dans T. Pour fonder arithmétique et analyse, les spécialistes nous
disent qu’on peut se borner à l’ensemble V2ω dans l’emboîtement des modèles
possibles (ce qui correspond encore à une théorie naïve des ensembles). Il y a
lieu en revanche de s’interroger sur l’artifice qui consiste à passer du second
ordre au premier ordre par la substitution, dans les axiomes d’induction d’un «
schéma d’axiomes » au lieu d’axiomes complets (comme G. Kreisel l’a
remarqué, l’évidence d’un tel schéma repose sur celle de l’axiome général du
deuxième ordre, qui lui correspond).
Il est faux que le passage par la théorie des ensembles assure, en
premier ordre, la catégoricité de N ou de R. Elle ne vaut qu’à l’intérieur d’un
modèle de ZFC, elle-même incomplète.2
2
Citons encore la position originale de J. Hintikka. Sa partie critique est assez proche de la mienne : la
théorie des ensembles, plus incertaine que l’arithmétique élémentaire, ne saurait lui servir de fondement.
Le deuxième ordre fait trop appel aux notions ensemblistes pour pouvoir en être dissocié.
Hintikka constate que certaines propositions logiques ne se prêtent pas à une expression en premier ordre
(techniquement, il s’agit – en particulier en combinatoire – de propositions contenant des alternances de
quantificateurs existentiels et universels ; les difficultés apparaissent quand on veut les traduire en
deuxième ordre à l’aide de “fonctions de Henkin”; il n’est pas toujours possible d’indiquer de quelles
variables exactes ces fonctions dépendent. Hintikka substitue donc à la logique ordinaire du premier ordre
une logique nouvelle “IF-premier ordre” surmontant ces obstacles (IF pour « independence-friendly
logic). Il estime que cette logique a de nombreux avantages : la vérité (pour moi, plutôt la prouvabilité) s’y
exprime par une formule du même langage ; des “jeux de vérité” permettent de la rechercher. Restant du
premier ordre, sa logique évite ce recours critiqué aux notions ensemblistes. Plusieurs des qualités bien
connues du premier ordre (compacité, Löwenheim-Skolem, théorème de séparation…) y restent valables.
Malheureusement, le tiers exclu ne s’y applique plus. Mais Hintikka montre que sa logique est assez proche
des logiques du deuxième ordre « Σ11 », qui l’admettent.
4
21/10/2016
Annexe J. Logique mathématique.
Quelques mots sur les autres logiques. Les complexes logiques
modales voudraient traiter du possible, mais c’est une notion philosophique,
étroitement liée à nos conceptions du déterminisme, du hasard, de la liberté ; il
est bien préférable d’aborder ces problèmes directement, avec notre logique
ordinaire, avec l’avantage supplémentaire de minimiser les sophismes de la
contrefactualité (cf. 12-2). De même, le réel de la physique quantique, si
différent du réel de l’échelle humaine, n’a pas besoin d’une logique quantique
pour être analysé (cf. 5-5B).
De même enfin, la logique linéaire peut traiter certains problèmes de
ressources, mais ils s’expriment déjà aisément en logique classique.
Second ordre et axiomes de compréhension.
La théorie des ensembles pose d’abord les axiomes courants
définissant paire, union, sous-ensembles, ensemble des parties. Simpson
introduit ensuite des axiomes de compréhension, de complexité juste adaptée
au sous-système arithmétique qu’il étudie. Par là, il définit des ensembles
correspondant aux différentes fonctions arithmétiques, et c’est par
l’application des axiomes des ensembles qu’il prouve ses théorèmes. Un
paradoxe est que le choix, vu plus haut, de travailler en deuxième ordre, me
semblait motivé par le souci de partir d’une conception simple et intuitive
des entiers, alors que – sans nécessité – S. repart de la théorie des
ensembles. Appelons « ensemble naïf » un ensemble de nombres défini par
une formule arithmétique ; il est évident que de tels ensembles possèdent les
propriétés correspondant aux axiomes de la théorie abstraite (par exemple,
pour les deux formules : (n, f(n)) et (n, g(n)), l’union des deux ensembles
d’entiers auxquels correspondent respectivement f et g est l’ensemble défini
par la formule : (n, (f(n) ou g(n)).
Ceci est évidemment en pleine contradiction avec l’esprit des
« reverse mathematics ». Pourquoi imposerais-je à mes raisonnements des
limitations non justifiées ?
Annexe
Page 5
Révision du 21/10/2016
3. Les théorèmes d’incomplétude.
En arithmétique, la difficulté de comprendre le vrai va se situer, comme
nous l’avons esquissé dans sp-1, au niveau des propositions gödéliennes.3 En
premier ordre, vrai et démontrable sont encore équivalents pour les formules
indéfinies « existentielles » (  p, A(n, p)) : pour en démontrer une, si elle est
vraie, il suffit de remonter la succession des entiers pour trouver le premier p
satisfaisant à la formule. Ce point va être utilisé dans les raisonnements subtils,
analysant les liens complexes entre vrai, démontrable et consistant, qui
aboutissent à la formule de Gödel. Partons du théorème de Church : la formule
existentielle (  x T[a, a, x]) est indécidable par les méthodes récursives. Dans
PA1, il correspond biunivoquement à cette « formule informelle », une formule
codée Ca. Si la formule existentielle «  x T(a, a, x) » est vraie, elle est
démontrable, donc Ca est elle aussi démontrable. On définit ensuite une
machine de Turing, indexée par p, trouvant (quand elle existe) une
démonstration de  Ca (ainsi  x T(p, a, x) équivaut à dire :  Ca est prouvable
dans l’arithmétique). A partir de là, une analyse implacable se porte sur  Cp (la
proposition de Gödel). La clé en est l’étude de la proposition « positive »  x
T(p, p, x) : on montre successivement qu’elle entraîne son contraire, donc – si
PA1 est cohérent – qu’elle est fausse, donc que son contraire est vrai, donc que
 Cp, qui en dérive, est vrai. Enfin le sens de  Cp est qu’elle n’est pas
démontrable (on voit l’analogie avec le paradoxe du menteur, mais les
imprécisions du langage courant ont disparu dans la formulation
mathématique). Bien entendu, toujours par la cohérence, Cp n’est pas non plus
démontrable. Ainsi,  Cp n’est, ni réfutable, ni démontrable. PA1 n’est pas
complet.
La contradiction apparente, entre affirmer la vérité d’une proposition et
affirmer l’impossibilité de la démontrer, se lève quand on remarque que l’on
supposait la consistance de l’arithmétique. C’est aussi par là que l’on obtient le
deuxième théorème de Gödel : PA1 ne peut pas démontrer sa propre consistance,
sauf s’il est inconsistant.
La formule de Gödel, dépendant d’un codage, est artificielle et, par une
sorte d’imprédicativité, dit encore quelque chose sur elle-même ! Les
spécialistes ont donc élaboré des formules, vraies et non prouvables, de plus en
plus naturelles (donc de plus en plus inquiétantes), pour la remplacer.
En deuxième ordre, beaucoup de théories sont catégoriques ; le
tiers exclu, appliqué à leur unique modèle, exige que toute proposition y soit
3
Nous ne pouvons pas ici échapper à un exposé assez technique, qui suit l’excellent traité de S. Kleene,
toujours actuel. La présentation part des machines de Turing ; elle équivaut à celle de Gödel, mais est plus
simple. Rappelons que la formule T(i, a, x) signifie : i est l’index d’une machine de Turing qui,
appliquée à l’argument a, terminera à l’instant x le calcul d’une valeur « φi(a) ».
Nous introduirons aussi quelques définitions essentielles. Un ensemble d’entiers est récursif, si sa fonction
caractéristique est totale, récursivement énumérable si sa fonction caractéristique est partielle. Le
récursivement énumérable correspond aux formules existentielles. On peut montrer, de l’ensemble ( x T[a,
a, x]), typique des ensembles créatifs), qu’il est récursivement énumérable, mais non récursif. La
démonstration suppose qu’il existe un programme pour en décider, et montre, par des arguments diagonaux,
l’endroit où ce programme défaille. La thèse de Church assimile calculabilité « intuitive » à la notion
précise de fonction récursive.
Annexe
Page 6
Révision du 21/10/2016
vraie ou fausse ; d’où une grande richesse de propositions potentiellement
vraies et non prouvables. Les méthodes de Gödel permettent de coder les
termes, les formules et les démonstrations de l’arithmétique. Elles relient
ainsi à l’arithmétique une méta-mathématique, celle des démonstrations.
Rappelons qu’une théorie T, contenant l’arithmétique, est dite décidable, si
l’ensemble des numéros de Gödel de ses formules est récursif. On en dérive
les notions de fonction récursive partielle, d’ensemble récursivement
énumérable et de formule semi-décidable (intuitivement, on peut énumérer
les nombres satisfaisant la formule - mais pas forcément ceux du sousensemble complémentaire. Cela correspond aux formules existentielles4 Σ1 :
s’il existe p tel que F(p), une énumération finira par le trouver. Si les deux
énumérations sont possibles, on retrouve alors le récursif; on montre qu’à
toute formule semi-décidable correspond une formule récursive avec une
existentielle supplémentaire).
Pour les formules Σ1 closes, il y a identité entre vrai dans N et
démontrable dans P .5 C’est un résultat « positif » d’une grande portée.
En revanche, il y a aussi beaucoup de résultats « négatifs », fondés
sur des théorèmes proches du paradoxe du menteur :
a. Tarski : l’ensemble des codes d’énoncés valides de
l’arithmétique n’est pas définissable par une formule arithmétique (mais
seulement par une formule du deuxième ordre « Σ11 ».
b. Toute théorie cohérente, contenant P0, est indécidable (très
proche de a, compte tenu de l’identité vrai/démontrable du calcul des
prédicats). Pour celui-ci, et pour les langages contenant celui de
l’arithmétique, c’est le théorème de Church, déjà cité.
c. Toute théorie récursive, cohérente, contenant P0, est
syntaxiquement incomplète (parce que une théorie récursive et complète est
décidable) : il y a des propositions F, telles que ni F, ni ¬F, ne soient
prouvables; mais on n’explicite pas une telle proposition.
d. Gödel-1 va plus loin. Il explicite une proposition G de la théorie,
qui exprime sa propre non-prouvabilité. Ainsi, si G était faux, G serait
0
prouvable, donc PA1 ne serait pas cohérent; par contraposition, si PA1
est cohérent6 (hypothèse « méta », en dehors de PA1), G est non
prouvable (dans PA1) et vrai.
e. On en déduit Gödel 2 : toute théorie du premier ordre, cohérente,
récursive, et contenant PA1, ne peut démontrer7 sa propre cohérence. La
4
Rappel de définitions : Σ concerne les formules du type :
 x, f(x) (plus précisément, il peut y avoir
plusieurs  successifs, mais sans  intercalés). Π concerne les formules du type :  x, g(x). Δ les
ensembles à la fois Σ et Π ; Δ1 correspond au décidable.
L’exposant 0 correspond aux formules arithmétiques, l’exposant 1 à celles où l’on quantifie aussi sur
le deuxième ordre.
5
P0 est l’arithmétique de Peano, sans l’induction.
6
Techniquement, on distingue entre cohérence simple et ω-cohérence ; Gödel s’est limité à la seconde
; J. Rosser a étendu le résultat de Gödel à la première. Par ailleurs, en théorie des modèles, si G n’est pas
prouvable dans une théorie T, alors on peut former les deux théories cohérentes (T et G), et (T et ¬G). Ici,
la méta-sémantique interdit de former la deuxième!
7
La démonstration formalisée utilise l’induction, donc PA1. Cette impossibilité de démontrer sa
cohérence s’applique en particulier à ZFC.
Annexe
Page 7
Révision du 21/10/2016
démonstration formalisée dans PA1 est complexe, mais intuitivement se
ramène à la remarque suivante : partons de la formule G; si on prouve la
cohérence de PA1, alors on a prouvé (indirectement) G, et retombe sur la
contradiction. Mais la démonstration de cette cohérence, découlant de la
cohérence intuitive de N, échappe à l’axiomatique du premier ordre.
Revenons à Gödel 1. On peut lui objecter la complexité – et,
surtout, le caractère artificiel - de la formule qui lui correspond. Nous
voudrions ici en dire un peu plus sur les résultats plus récents, qui obtiennent
des formules non démontrables, plus proches des mathématiques réelles. Ils
se fonderont souvent sur la combinatoire, partie assez intuitive des
mathématiques, et proche de l’arithmétique, mais qui, posant des problèmes
complexes sur l’infini, aide à notre compréhension des grands ordinaux. Les
théorèmes de combinatoire sur les arbres et les partitions utilisent les notions
les plus simples d’ordre, mais requièrent déjà une axiomatisation de
deuxième ordre; c’est le cas du célèbre lemme de König : tout arbre, à
branchements finis, et ayant des chemins finis partiels arbitrairement longs, a
un chemin infini. C’est le moment de faire une digression sur ce fameux
lemme.
Le lemme de König.
Sa démonstration classique (Kuratowski-Mostowski, reprise par
Simpson) est la suivante : on définit la relation arithmétique φ(x) : pour tout
n, il y a au dessus de x une branche de longueur n ; par l’axiome de
compréhension arithmétique, cette relation définit un ensemble. On démontre
ensuite facilement (par contraposition sur un ensemble fini d’alternatives)
que x a forcément au moins un successeur immédiat y satisfaisant φ(y). Par
un choix limité à un nombre fini (qui donc ne nécessite pas l’axiome de
choix général), on en choisit un. La chaîne infinie résulte d’une induction
banale sur ce successeur.
Ainsi ce théorème est valable dans «ACAO ». Il est clair qu’il
n’est pas constructif (on ne sait jamais, quand on veut construire pas à pas la
chaîne infinie, si le chemin testé s’arrêtera ou non en temps fini). Dans
« RCA0 » (l’arithmétique récursive), où les axiomes de compréhension sont
plus faibles, on peut trouver un contre-exemple (tordu !) au lemme de König.
Dans ses « reverse mathematics », Simpson prouve même que, au dessus de
RCA0 , ce lemme et ACAO sont équivalents.
La contraposition du lemme de König est assez proche du « Fan
Theorem » de Brouwer. Pour l’intuitionnisme, le principe d’omniscience (cf.
annexe K-1D) et le lemme de König sont équivalents.
Le lemme de König est utilisé par Kleene pour démontrer la
complétude du calcul des prédicats.
Joint à l’axiome de choix, il démontre aussi les théorèmes de
combinatoire de Ramsey :
Annexe
Page 8
Révision du 21/10/2016
- La formulation, a fortiori la démonstration, du « théorème « infini
» (concernant des partitions infinies) supposent le second ordre.8 Celle de sa
version finie se prouve dans PA1.
- Le théorème infini de Ramsey est utilisé pour prouver - dans PA2 une variante de la version finie, due à Paris-Harrington. Etant finie, cette
variante est - elle aussi - exprimable dans PA1. On montre en revanche
qu’elle y est équivalente à la consistance de PA1, qui est ainsi prouvée dans PA2. En revanche, elle ne peut, après Gödel 2 (qui suppose Gödel 1),
être prouvée dans PA1. L’intérêt est que l’on a ainsi mis en évidence une
formule infiniment plus parlante que la célèbre formule de Gödel, mais
comme elle non prouvable en premier ordre, et vraie (parce que prouvable
en deuxième ordre). Je m’interroge cependant sur la portée de ce
résultat, puisque - impliquant la consistance de PA1 – il utilise le deuxième
théorème de Gödel qui, lui-même fondé sur le premier, nécessite la formule
initiale critiquée de Gödel. Sur un autre plan, D. Isaacson soutient qu’il y
aura toujours dans de telles formules de l’infinitaire ou du second ordre
cachés ; même, pour lui, les formules vraies, non codées, de l’arithmétique
pure du premier ordre seraient prouvables dans cette logique même.
L’ensemble des théorèmes de l’arithmétique (et plus généralement des
mathématiques) est dénombrable. La position d’Isaacson est donc tenable,
mais l’a-t-il vraiment justifiée ?
Sur le plan pratique, on sait comme il a été difficile de démontrer une
proposition arithmétique particulière, celle du théorème de Fermat-Wiles ;
que penser de toutes les propositions analogues, de formulation à peine plus
compliquées ? Les difficultés augmenteront a fortiori, quand on passera à
l’analyse et à ses innombrables problèmes particuliers : ee est-il rationnel ?
Cf. annexe K-1.
Il est enfin intéressant de noter que l’analyse récursive computationnelle,
avec des méthodes très semblables à celles de Gödel, arrive à des résultats
d’incomplétude analogues, et à des problèmes de codage encore plus
difficiles (cf. annexe K-2B).
Le théorème de Matisajevic est très parlant lui aussi, puisqu’il
prouve qu’il y a une correspondance biunivoque entre équations
diophantiennes (équations polynomiales à coefficients entiers) et relations
récursivement énumérables ; comme il existe des ensembles récursivement
énumérables, mais non récursifs, on en déduit qu’il n’y a pas de procédure de
décision pour les équations diophantiennes (c’était le dixième problème de
Hilbert). On peut appliquer ce dernier résultat pour démontrer l’indécidabilité
de problèmes concrets de la mécanique ou de la physique; ainsi, quand on
étudie la trajectoire d’une particule, il n’est pas toujours possible de prédire si
elle va sortir d’un domaine compact préalablement défini. Il faut cependant
remarquer que, à l’inverse des résultats précédents, Matisajevic ne nous dit
8
Techniquement, on utilise ACA0. La démonstration utilise l’axiome de choix, pour N et pour les
parties de N.
Annexe
Page 9
Révision du 21/10/2016
pas laquelle – dans l’infinité dénombrable des équations diophantiennes – est
indécidable !
Un autre exemple d’indécidabilité concerne le caractère aléatoire
d’un nombre. Mais la notion d’aléatoire est encore plus complexe que celle
d’indécidabilité! (cf. annexe 2). Comme le théorème de Gödel contourne le
paradoxe du menteur, le concept de nombre aléatoire contourne le paradoxe
de Berry (sur la possibilité de définir certains nombres). Ils se rejoignent à
propos du fameux nombre Ω de Chaitin.
Notons enfin que l’ensemble N des entiers « naturels » a comme propriété
d’être « segment initial » de tout modèle de PA1, ce qui est une façon informelle
de le distinguer (de se convaincre de son caractère unique).
4. Une remarque sur l’hypothèse du continu.
Des travaux de H. Woodin (1995) voudraient y ajouter un axiome posant l’existence
d’un « grand cardinal ». Il est conjecturé que ce type d’axiome entraînerait la
fausseté de l’hypothèse du continu.
5. Un peu plus sur l’axiome (les axiomes) de choix.
Cet axiome est très ambigu : sous sa forme directe, il paraît
évident; par sa conséquence la plus simple : « il existe un bon ordre sur R »,
il défie l’intuition (encore plus, peut-être par le théorème de Banach-Tarski,
qui en découle). Beaucoup de mathématiciens aiment la généralité que sa
formulation la plus courante, celle du lemme de Zorn, donne à leurs
démonstrations (la rançon est qu’ils perdent la constructivité). Déjà la
logique mathématique en fait un large usage, ne serait-ce que par les
“fonctions de Henkin”.
K. Gödel a prouvé que, sa théorie des ensembles « constructibles »
(restreints, par rapport aux ensembles bien fondés, par l’exigence qu’ils
puissent être « définis ») impliquait la vérité de l’axiome du choix;
inversement, P. Cohen a montré que certains modèles « forcés » des
ensembles n’y satisfaisaient pas. Il existe donc des théories des ensembles «
zerméliennes » (ZFC), et d’autres « non-zerméliennes » (ZF, plus un axiome
incompatible avec le choix). Les commentateurs disent fréquemment que,
puisque il y a ces deux catégories de modèles, nous sommes libres de choisir;
comme l’axiome du choix est commode en mathématiques, nous
l’accepterons. Cette présentation n’est pas claire : l’axiome du choix n’est «
sûr » que si nous nous limitons aux seuls ensembles constructibles, peu
riches, et aux propriétés parfois pathologiques. Or l’intérêt de l’axiome du
choix est qu’il permet de démontrer des résultats extrêmement généraux,
s’appliquant à des transfinis élevés. Ainsi, sur le plan des principes, il n’est
utilisable « sûrement » que là où l’on n’en a pas besoin ! Que sa validité
pratique soit étayée par les nombreux usages qu’en font les mathématiciens,
sans contradictions apparentes, ne change rien.
L’axiome du choix général entraîne le tiers exclu ; il est donc
incompatible avec les formes de constructionnisme, qui rejettent le
tiers exclu. En revanche, des formes plus faibles de l’axiome de choix
(l’axiome de choix dénombrable, comme l’axiome de choix
dépendant) sont plus naturelles et compatibles avec le
Annexe
Page 10
Révision du 21/10/2016
constructionnisme9 ; moins puissantes, elles permettent néanmoins de
satisfaire aux mathématiques courantes. Une autre axiomatisation a
été proposée par R. Solovay : il rejette l’axiome de choix, mais pose
que tous les ensembles sont mesurables (hypothèse conforme aux
différents constructivismes, puisque l’on sait qu’on ne peut construire
d’ensemble non mesurable).
6. Quelques compléments sur les « Reverse Mathematics ».
Une définition rapide des Reverse mathematics a été donnée en
sp1. Les mathématiques traditionnelles partent d’axiomes et aboutissent à des
théorèmes. Leur « renversement » consiste, pour chacun de leurs résultats
notables, à évaluer l’axiomatisation minimum qui permet de l’obtenir.
Un autre système, plus faible, et plus paradoxal (cf. annexe K-2B),
« RCA0 », correspond au récursif, à l’algorithmique.
En pratique, l’on se penche sur la façon dont, à partir des axiomes
de Peano, on accède aux grands résultats de l’analyse ou de la combinatoire.
On travaille en second ordre, et l’ajustement se fait par le recours à des
axiomes de compréhension, plus ou moins puissants (qui font correspondre
à toute formule l’ensemble des éléments, qui y satisfont).
Les spécialistes en retiennent cinq, s’emboîtant les uns dans les
autres. Quand un résultat résiste à un système et est prouvé par le système
suivant, il est fréquent que ce dernier équivaille au système faible, auquel on
a ajouté le dit résultat comme axiome supplémentaire.
Trois systèmes me semblent les plus importants, par ordre de force
croissante : « RCA0 » (R pour récursif), « ACA0 » (A pour « arithmetical
comprehension), enfin le plein axiome de compréhension (qui permet
d’obtenir tous les résultats des mathématiciens).
RCA0 ne s’intéresse qu’aux formules arithmétiques bornées,
existentielles « Σ10 », universelles « П10, ou « Δ10 » (les deux). Σ10 correspond
aux ensembles récursivement énumérables, Δ10 aux ensembles récursifs.
L’induction concerne les formules existentielles, le schéma de
compréhension les troisièmes (d’où le R dans RCA) Il prouve déjà des
théorèmes aussi variés que : en analyse, celui des valeurs intermédiaires ; en
logique, une version de la complétude ; en algèbre, l’existence de la clôture
d’un corps dénombrable…
A côté de son fort pouvoir exploratoire, la notion de récursivité
souffre des inconvénients inhérents du codage : discussions difficiles sur la
portée de la formule de Gödel, paradoxes du constructivisme russe (voir
annexe K1E)… Elle permet de forger un exemple – artificiel – de séquence
d’intervalles rationnels, ne satisfaisant pas le lemme de recouvrement de
Heine-Borel, donc où le théorème, que toute fonction continue est
uniformément continue, n’est plus valable.
9
L’axiome de choix dénombrable « AC0 », qui découle de notre intuition des entiers,
permet déjà de prouver des résultats importants pour la physique (par exemple que les espaces de
Hilbert ont une base).
Annexe
Page 11
Révision du 21/10/2016
ACA0 est beaucoup plus fort. Sa part de premier ordre est PA. Il
considère toutes les formules arithmétiques. L’intérêt général des axiomes de
compréhension est qu’ils permettent de transposer à des formules des notions
importantes et générales de la théorie des ensembles (comme l’union de deux
ensembles, ou l’ensemble des parties d’un ensemble). Mais, quand on se limite
à des formules arithmétiques, où la quantification ne se fait que sur des entiers
et non sur des ensembles, ces mêmes notions sont évidentes et le système n’est
qu’une extension conservative de PA1, part de premier ordre de ACA0 . ACA0
reste prédicatif ; cela lui permet d’accéder à ce premier niveau de base de
« mathématiques sûres » (en analyse, la théorie des fonctions continues ; en
combinatoire, le lemme de König), que vise la fin de sp-1 (il ya aussi une
démarche parallèle de Weyl-Feferman). Donc, pour ma démarche, tous les
systèmes « inférieurs » sont sans intérêt. Dans ACA0, on prouve aussi – sans
axiome de choix – qu’un espace de Hilbert sur le corps des rationnels a une
base.
En revanche, les théorèmes de l’analyse, qui ne s’obtiennent que par
des méthodes imprédicatives, nécessitent d’aller au-delà de ACA0 ; c’est le cas
de la complétude de R (quand elle n’est pas limitée aux suites).
Les constructivistes ont, eux aussi, développé des « Reverse
Mathematics », mais sans tiers exclu (voir l’annexe K1).
7. Les très grands nombres finis et les infinis (cf. chapitre 20-6).
Après Frege, nous avons le vertige quand nous évoquons de très
grands nombres - faciles à écrire avec seulement deux exponentielles ! Mais
le mathématicien établit une distinction fondamentale entre très grand
nombre fini et l’infini. S. Lavine a tenté de passer outre à cette distinction : à
la suite de J. Mycielski, il rattache à toute théorie infinie T une théorie finie
Fin(T), en restreignant son domaine à des entiers « indéfiniment grands ».
Des théorèmes, applicables à l’arithmétique ou à la théorie des ensembles,
font le raccord; T est consistant ssi tout sous-ensemble fini de Fin(T) a un
modèle fini. Le recours à ces nombres indéfiniment grands (les “zillions”)
permet par exemple de clarifier les définitions de limites ou de dérivées. Il
n’en reste pas moins que, pour moi, l’intuition de la succession indéfinie des
entiers est fondamentale ; je ne pense donc pas que Lavine évite une
circularité dans le processus d’extrapolation du fini à l’infini.
Rejoignant les problèmes de frontières, il y a aussi le paradoxe dit
du « sorite » (cf. note 323 de sp) : un tas de sable reste un tas quand on lui
enlève un grain, puis un autre, mais jusqu’où? C’est un peu le processus
inverse des nombres indéfiniment grands. R. Parikh a su le transformer en un
théorème profond (comme Gödel a transformé le paradoxe du menteur).
Fondamentalement, la notion de « grand nombre » est vague, non
axiomatisable; ceci condamne le finitisme strict (même si le nominalisme
traditionnel l’exige).
Tout mathématicien, même constructiviste, accepte l’infini
dénombrable. Ceux qui ne sont pas constructivistes vont au-delà, même si
Annexe
Page 12
Révision du 21/10/2016
seule une petite minorité s’intéresse aux infinis vertigineux de la théorie des
ensembles, par nature hautement non prédicatifs.10
Remarques et questions diverses
Question J1, sur l’arithmétique finitiste PRA.
Dans les reverse mathematics, WKL0 (RCA0 + lemme faible
de König) est une extension conservative de PRA. Dois-je pour
autant, recherchant la sûreté des fondements, préférer partir de PRA
minimale plutôt que de PA ? Non ? car mon intuition s’accommode
très bien de l’induction de PA.
J2. Remarques sur ZFC.
On peut faire le choix de prendre pour fondement la théorie
des ensembles. Si on veut profiter de la notion d’ordinal, qui y est
fondamentale, on doit admettre l’axiome de choix et donc partir de ZFC.
Toute théorie T (quel que soit son ordre) peut alors être traduite par une
formule du premier ordre de ZFC, disant : x est modèle de T. De même,
on peut exprimer la catégoricité de T.
La rançon de rester en ZFC premier ordre est que cette
axiomatisation est incomplète. Prenons l’exemple où T est PA2 : à deux
modèles différents de ZFC peuvent correspondre deux modèles de N
non isomorphes; la catégoricité dans un modèle n’entraîne pas la
catégoricité « absolue »; on a perdu ce qui était pour moi l’essentiel de
l’intérêt de PA2. On retrouve les difficultés de Skolem.
Autres inconvénients. L’axiomatique de ZFC, et en
particulier l’axiome de choix, sont moins clairs que la notion d’entier
naturel, qu’ils prétendent retrouver. Arithmétique et analyse se
satisfont d’ensembles « naïfs » (inclus dans le « petit » univers Vω +
ω).
Quelques remarques sur les axiomes de ZFC.
10
On peut déjà construire, par des extensions successives – et indéfinies - de grands ordinaux, dépassant
largement ω (qui représente N), mais naturellement toujours dénombrables. C’est ainsi que G. Gentzen a
retrouvé la consistance de l’arithmétique en admettant l’induction jusqu’à l’ordinal ε 0. Ceci se conçoit si
on réfléchit que, déjà pour les formules Π1 (avec un seul  ), “il n’y a qu’à” les tester une à une jusqu’à
l’infini (avec un seul quantificateur, on monte à ω ; avec un nombre indéterminé de quantificateurs, on
monte à ε0). En paraphrasant librement Grégoire de Nysse, cela me semble accessible aux bienheureux,
progressant dans leur sempiternité, mais de peu d’intérêt pour moi aujourd’hui! Une autre conception de
l’éternité est celle de don Quichotte : « Il n’est donné qu’à Dieu de connaître le temps en sa totalité, pour
Lui, il n’y a ni passé ni futur ; tout est présent) ».
Les « infinis vertigineux » sont ceux des alephs extrêmes, bien supérieurs à ℵ1 (la puissance du continu,
elle même si supérieure au dénombrable). Leur classification est d’une extrême complexité. Sur leur
existence, on ne peut faire que des conjectures.
Annexe
Page 13
Révision du 21/10/2016
L’axiome de remplacement est plus fort que celui de
compréhension. Le premier, nécessaire à la théorie des ordinaux (mais
Lévine dit qu’il suffit, soit du choix, soit du remplacement ?), ne serait pas
nécessaire à l’essentiel des mathématiques.
Question générale : quand il est démontré qu’une proposition
(ou un axiome) est indépendante des autres axiomes de ZF (c’est le cas
de l’axiome de choix, de celui de fondation), a-t-on intérêt à l’ajouter
comme axiome ? (ou à ajouter son contraire ? ou à ne rien faire ?) Ce
sont des questions d’opportunité, à répondre cas par cas.
Pour l’axiome de choix, je suggère dans le texte principal d’en
rester toutes les fois qu’on peut à l’axiome de choix dénombrable,
constructif, mais de savoir que des théorèmes généraux et importants
requièrent sa forme générale.
Ma position sur l’axiome de fondation est différente. Il apporte
une certaine clarté à la notion d’ensemble. Dans ma conception d’une
axiomatisation minimale, il traduirait l’idée de base de « mon »
constructivisme : considérer les entiers naturels comme des « urelements, interdisant tout cycle.
Enfin, une question voisine pourrait être posée sur les cardinaux
inaccessibles. On sait qu’en poser l’existence aboutit à prouver la
consistance de ZFC, et inversement que l’axiome niant leur existence est
compatible avec ZFC. Tout ce qu’on peut envisager se limite donc à ajouter
à ZFC cet axiome négatif. Mais on n’en voit pas l’intérêt : il enlèverait le
pain de la bouche de quelques théoriciens des ensembles, et n’aurait
aucune utilité pour des constructionnistes !
Hintikka, J. (1996) The Principles of Mathematics revisited.
Cambridge.
Jech K. (2003) Set Theory. North Holland.
Kaye, R. (1991), Models of Peano Arithmetic. Oxford.
Kleene, S. (tr. 1971), Logique mathématique. A. Colin.
Lavine, S. (1994) Understanding the Infinite. Harvard.
Poizat, B. (1985) Cours de théorie des modèles.
ISSN.
Tarski, A. The Semantic Conception of Truth, in
Philosophical and Phenomenological Research 4 (1944).
Téléchargement