1 21/10/2016 Annexe J. Logique mathématique. Annexe J Quelques compléments de logique mathématique. NB. A côté de questions, que j’espère avoir éclairées, j’en ai rencontré beaucoup d’autres, auxquelles je n’ai pas de réponse. Elles sont posées, en notes en caractères « arial », à mesure de leur apparition dans ce « text in progress ». Là où – sans être sûr de la réponse – je penche d’un côté, je l’indique par un (oui ?) ou un (non ?). Les questions proprement dites sont mises en italiques. Leur numérotation peut comporter des trous : ils correspondent à des questions antérieures, qui ont trouvé leur solution. Je serai reconnaissant à mes lecteurs de me donner (par courriel – [email protected]) leur point de vue, ou de m’indiquer quelles lectures ils pourraient me recommander. Cette annexe « technique » emploie quelques notations courantes en logique et en analyse : (appartient à)…, (il existe…), (pour tout…), (non…). M a (M est un modèle de a). Les références de type 14-4B concernent la section 4B du chapitre 14 de « Science et philosophie ». Comme dans l’ensemble de cet ouvrage, les définitions sont en caractères gras, mes positions personnelles en caractères Arial. Les * après les noms des auteurs renvoient aux références à la fin de l’annexe. Table des matières. 1. La théorie des modèles. 2. La logique du deuxième ordre. 3. Les théorèmes d’incomplétude. 4. L’hypothèse du continu. 5. L’axiome de choix. 6. Les Reverse Mathematics. 7. Les infinis. Rappelons qu’on désigne par PA1 (PA pour le mathématicien Peano) l’axiomatisation de l’arithmétique en premier ordre, par PA2 celle en deuxième ordre. Cette annexe se propose d’approfondir (ou de présenter de façon plus technique) divers éléments, assez dispersés, mais dont chacun peut éclairer le bref chapitre 1 « la logique et les mathématiques » de sp. Malheureusement, le sujet est malaisé : complexité des définitions et des notations ; accent trop mis sur l’aspect formel des axiomes, et pas assez sur leur sens profond ; longueur des démonstrations formelles ; diversité des écoles et obscurité de certaines positions (par exemple sur les rôles respectifs du deuxième ordre et de la théorie des ensembles) ; situation intermédiaire entre mathématiques et métamathématique. Nous n’avons évidemment pas eu la possibilité d’aborder tous les sujets de cette immense discipline. Si nous avons certainement simplifié certaines questions subtiles, il nous a semblé, qu’au-delà des variantes, apparaissaient des points communs. 1. La théorie des modèles. Elle travaille essentiellement en logique du premier ordre, et arrive à toute une série de résultats remarquables, dont on trouvera ci-dessous un bref résumé. Rappelons que, de deux modèles qui satisfont aux mêmes formules du 2 21/10/2016 Annexe J. Logique mathématique. premier ordre sans variables libres, on dit qu’ils sont élémentairement équivalents ; on définit parallèlement les extensions élémentaires). Un exemple concret est fourni par le modèle de l’arithmétique du premier ordre que l’on peut former en ajoutant aux entiers naturels un nombre plus grand que chacun d’entre eux (modèle qui prouve que cette arithmétique n’est pas ℵ0-catégorique)1 ; un exemple encore plus simple est celui de l’axiomatisation de la seule fonction successeur : un modèle non-standard en est N +Z. La α-cardinalité est plus forte que la complétude ; une théorie catégorique, qui n’a pas de modèles finis, est complète. Les structures ℵ0-catégoriques ont beaucoup de belles propriétés. - Une théorie est modèle-complète, si toute extension B d’un modèle A est élémentaire. - Une propriété est (finiment) axiomatisable, s’il existe une théorie qui la modélise (finiment) par une formule close. - Une théorie a l’élimination des quantificateurs, si toute formule est équivalente à une combinaison de formules atomiques. Exemple, pour les élèves de première : sur R, x : Ax2 + Bx + C = 0 est équivalent à : B2 - 4AC ≥ 0. Cette propriété permet d’obtenir des résultats de décidabilité. - Il existe des cas où il est facile de démontrer qu’une extension T’ (de deuxième ordre) de T (de premier ordre) est conservative (définition donnée à la note* de sp) en contraposant : si T ne prouve pas F, alors la complétude du calcul des prédicats en premier ordre entraîne qu’il existe un modèle de T + ¬F ; ce modèle peut souvent être prolongé en un modèle de T’ + ¬F). En algèbre (et dans une moindre mesure pour des théories plus simples, comme celles de l’ordre), les concepts développés par la théorie des modèles s’avèrent très éclairants. Des applications intéressantes de la théorie des modèles ont été trouvées récemment en analyse et en théorie des catégories. 1 Une théorie est dite α-catégorique pour un nombre cardinal α si elle a exactement un modèle de cardinalité α. 3 21/10/2016 Annexe J. Logique mathématique. 2. Un peu plus sur la logique (les logiques) du deuxième ordre. Rappelons que cette logique considère deux types de variables : les éléments et les sous-ensembles d’éléments. Sa syntaxe est identique à celle du premier ordre. C’est uniquement quand on assigne aux variables du deuxième type de représenter la totalité des sous-ensembles que sa sémantique diffère de celle du premier ordre. Les logiques des ordres supérieurs à deux se ramènent pratiquement à la logique du deuxième ordre. Il y a aussi des logiques infinitaires, et des logiques où le temps intervient; nous ne les considérerons pas. Techniquement, il y a plusieurs sémantiques pour la logique du deuxième ordre. J’en resterai à la plus naturelle, celle « standard » qui, interprétant les formules du deuxième ordre en parcourant la totalité des objets, nous assure de la catégoricité. Il faut, bien entendu, distinguer soigneusement ce qui est exprimable et ce qui est démontrable en premier ou en deuxième ordre. Le deuxième ordre est indispensable pour tenir compte de notions essentielles, comme l’infini, le bon ordre ou la clôture. Les relations entre deuxième ordre et théorie des ensembles sont complexes. La notion d’appartenance à un ensemble (x E) et celle - plus difficile - d’ensemble des parties sont communes à ZFC et à la logique du deuxième ordre. A toute théorie T du deuxième ordre, ayant un modèle M, on peut faire correspondre, dans la théorie ZFC du premier ordre, une formule T(x) signifiant que M est un modèle de T; et à toute formule Φ de T une formule Φ’ signifiant que Φ est vrai dans T. Pour fonder arithmétique et analyse, les spécialistes nous disent qu’on peut se borner à l’ensemble V2ω dans l’emboîtement des modèles possibles (ce qui correspond encore à une théorie naïve des ensembles). Il y a lieu en revanche de s’interroger sur l’artifice qui consiste à passer du second ordre au premier ordre par la substitution, dans les axiomes d’induction d’un « schéma d’axiomes » au lieu d’axiomes complets (comme G. Kreisel l’a remarqué, l’évidence d’un tel schéma repose sur celle de l’axiome général du deuxième ordre, qui lui correspond). Il est faux que le passage par la théorie des ensembles assure, en premier ordre, la catégoricité de N ou de R. Elle ne vaut qu’à l’intérieur d’un modèle de ZFC, elle-même incomplète.2 2 Citons encore la position originale de J. Hintikka. Sa partie critique est assez proche de la mienne : la théorie des ensembles, plus incertaine que l’arithmétique élémentaire, ne saurait lui servir de fondement. Le deuxième ordre fait trop appel aux notions ensemblistes pour pouvoir en être dissocié. Hintikka constate que certaines propositions logiques ne se prêtent pas à une expression en premier ordre (techniquement, il s’agit – en particulier en combinatoire – de propositions contenant des alternances de quantificateurs existentiels et universels ; les difficultés apparaissent quand on veut les traduire en deuxième ordre à l’aide de “fonctions de Henkin”; il n’est pas toujours possible d’indiquer de quelles variables exactes ces fonctions dépendent. Hintikka substitue donc à la logique ordinaire du premier ordre une logique nouvelle “IF-premier ordre” surmontant ces obstacles (IF pour « independence-friendly logic). Il estime que cette logique a de nombreux avantages : la vérité (pour moi, plutôt la prouvabilité) s’y exprime par une formule du même langage ; des “jeux de vérité” permettent de la rechercher. Restant du premier ordre, sa logique évite ce recours critiqué aux notions ensemblistes. Plusieurs des qualités bien connues du premier ordre (compacité, Löwenheim-Skolem, théorème de séparation…) y restent valables. Malheureusement, le tiers exclu ne s’y applique plus. Mais Hintikka montre que sa logique est assez proche des logiques du deuxième ordre « Σ11 », qui l’admettent. 4 21/10/2016 Annexe J. Logique mathématique. Quelques mots sur les autres logiques. Les complexes logiques modales voudraient traiter du possible, mais c’est une notion philosophique, étroitement liée à nos conceptions du déterminisme, du hasard, de la liberté ; il est bien préférable d’aborder ces problèmes directement, avec notre logique ordinaire, avec l’avantage supplémentaire de minimiser les sophismes de la contrefactualité (cf. 12-2). De même, le réel de la physique quantique, si différent du réel de l’échelle humaine, n’a pas besoin d’une logique quantique pour être analysé (cf. 5-5B). De même enfin, la logique linéaire peut traiter certains problèmes de ressources, mais ils s’expriment déjà aisément en logique classique. Second ordre et axiomes de compréhension. La théorie des ensembles pose d’abord les axiomes courants définissant paire, union, sous-ensembles, ensemble des parties. Simpson introduit ensuite des axiomes de compréhension, de complexité juste adaptée au sous-système arithmétique qu’il étudie. Par là, il définit des ensembles correspondant aux différentes fonctions arithmétiques, et c’est par l’application des axiomes des ensembles qu’il prouve ses théorèmes. Un paradoxe est que le choix, vu plus haut, de travailler en deuxième ordre, me semblait motivé par le souci de partir d’une conception simple et intuitive des entiers, alors que – sans nécessité – S. repart de la théorie des ensembles. Appelons « ensemble naïf » un ensemble de nombres défini par une formule arithmétique ; il est évident que de tels ensembles possèdent les propriétés correspondant aux axiomes de la théorie abstraite (par exemple, pour les deux formules : (n, f(n)) et (n, g(n)), l’union des deux ensembles d’entiers auxquels correspondent respectivement f et g est l’ensemble défini par la formule : (n, (f(n) ou g(n)). Ceci est évidemment en pleine contradiction avec l’esprit des « reverse mathematics ». Pourquoi imposerais-je à mes raisonnements des limitations non justifiées ? Annexe Page 5 Révision du 21/10/2016 3. Les théorèmes d’incomplétude. En arithmétique, la difficulté de comprendre le vrai va se situer, comme nous l’avons esquissé dans sp-1, au niveau des propositions gödéliennes.3 En premier ordre, vrai et démontrable sont encore équivalents pour les formules indéfinies « existentielles » ( p, A(n, p)) : pour en démontrer une, si elle est vraie, il suffit de remonter la succession des entiers pour trouver le premier p satisfaisant à la formule. Ce point va être utilisé dans les raisonnements subtils, analysant les liens complexes entre vrai, démontrable et consistant, qui aboutissent à la formule de Gödel. Partons du théorème de Church : la formule existentielle ( x T[a, a, x]) est indécidable par les méthodes récursives. Dans PA1, il correspond biunivoquement à cette « formule informelle », une formule codée Ca. Si la formule existentielle « x T(a, a, x) » est vraie, elle est démontrable, donc Ca est elle aussi démontrable. On définit ensuite une machine de Turing, indexée par p, trouvant (quand elle existe) une démonstration de Ca (ainsi x T(p, a, x) équivaut à dire : Ca est prouvable dans l’arithmétique). A partir de là, une analyse implacable se porte sur Cp (la proposition de Gödel). La clé en est l’étude de la proposition « positive » x T(p, p, x) : on montre successivement qu’elle entraîne son contraire, donc – si PA1 est cohérent – qu’elle est fausse, donc que son contraire est vrai, donc que Cp, qui en dérive, est vrai. Enfin le sens de Cp est qu’elle n’est pas démontrable (on voit l’analogie avec le paradoxe du menteur, mais les imprécisions du langage courant ont disparu dans la formulation mathématique). Bien entendu, toujours par la cohérence, Cp n’est pas non plus démontrable. Ainsi, Cp n’est, ni réfutable, ni démontrable. PA1 n’est pas complet. La contradiction apparente, entre affirmer la vérité d’une proposition et affirmer l’impossibilité de la démontrer, se lève quand on remarque que l’on supposait la consistance de l’arithmétique. C’est aussi par là que l’on obtient le deuxième théorème de Gödel : PA1 ne peut pas démontrer sa propre consistance, sauf s’il est inconsistant. La formule de Gödel, dépendant d’un codage, est artificielle et, par une sorte d’imprédicativité, dit encore quelque chose sur elle-même ! Les spécialistes ont donc élaboré des formules, vraies et non prouvables, de plus en plus naturelles (donc de plus en plus inquiétantes), pour la remplacer. En deuxième ordre, beaucoup de théories sont catégoriques ; le tiers exclu, appliqué à leur unique modèle, exige que toute proposition y soit 3 Nous ne pouvons pas ici échapper à un exposé assez technique, qui suit l’excellent traité de S. Kleene, toujours actuel. La présentation part des machines de Turing ; elle équivaut à celle de Gödel, mais est plus simple. Rappelons que la formule T(i, a, x) signifie : i est l’index d’une machine de Turing qui, appliquée à l’argument a, terminera à l’instant x le calcul d’une valeur « φi(a) ». Nous introduirons aussi quelques définitions essentielles. Un ensemble d’entiers est récursif, si sa fonction caractéristique est totale, récursivement énumérable si sa fonction caractéristique est partielle. Le récursivement énumérable correspond aux formules existentielles. On peut montrer, de l’ensemble ( x T[a, a, x]), typique des ensembles créatifs), qu’il est récursivement énumérable, mais non récursif. La démonstration suppose qu’il existe un programme pour en décider, et montre, par des arguments diagonaux, l’endroit où ce programme défaille. La thèse de Church assimile calculabilité « intuitive » à la notion précise de fonction récursive. Annexe Page 6 Révision du 21/10/2016 vraie ou fausse ; d’où une grande richesse de propositions potentiellement vraies et non prouvables. Les méthodes de Gödel permettent de coder les termes, les formules et les démonstrations de l’arithmétique. Elles relient ainsi à l’arithmétique une méta-mathématique, celle des démonstrations. Rappelons qu’une théorie T, contenant l’arithmétique, est dite décidable, si l’ensemble des numéros de Gödel de ses formules est récursif. On en dérive les notions de fonction récursive partielle, d’ensemble récursivement énumérable et de formule semi-décidable (intuitivement, on peut énumérer les nombres satisfaisant la formule - mais pas forcément ceux du sousensemble complémentaire. Cela correspond aux formules existentielles4 Σ1 : s’il existe p tel que F(p), une énumération finira par le trouver. Si les deux énumérations sont possibles, on retrouve alors le récursif; on montre qu’à toute formule semi-décidable correspond une formule récursive avec une existentielle supplémentaire). Pour les formules Σ1 closes, il y a identité entre vrai dans N et démontrable dans P .5 C’est un résultat « positif » d’une grande portée. En revanche, il y a aussi beaucoup de résultats « négatifs », fondés sur des théorèmes proches du paradoxe du menteur : a. Tarski : l’ensemble des codes d’énoncés valides de l’arithmétique n’est pas définissable par une formule arithmétique (mais seulement par une formule du deuxième ordre « Σ11 ». b. Toute théorie cohérente, contenant P0, est indécidable (très proche de a, compte tenu de l’identité vrai/démontrable du calcul des prédicats). Pour celui-ci, et pour les langages contenant celui de l’arithmétique, c’est le théorème de Church, déjà cité. c. Toute théorie récursive, cohérente, contenant P0, est syntaxiquement incomplète (parce que une théorie récursive et complète est décidable) : il y a des propositions F, telles que ni F, ni ¬F, ne soient prouvables; mais on n’explicite pas une telle proposition. d. Gödel-1 va plus loin. Il explicite une proposition G de la théorie, qui exprime sa propre non-prouvabilité. Ainsi, si G était faux, G serait 0 prouvable, donc PA1 ne serait pas cohérent; par contraposition, si PA1 est cohérent6 (hypothèse « méta », en dehors de PA1), G est non prouvable (dans PA1) et vrai. e. On en déduit Gödel 2 : toute théorie du premier ordre, cohérente, récursive, et contenant PA1, ne peut démontrer7 sa propre cohérence. La 4 Rappel de définitions : Σ concerne les formules du type : x, f(x) (plus précisément, il peut y avoir plusieurs successifs, mais sans intercalés). Π concerne les formules du type : x, g(x). Δ les ensembles à la fois Σ et Π ; Δ1 correspond au décidable. L’exposant 0 correspond aux formules arithmétiques, l’exposant 1 à celles où l’on quantifie aussi sur le deuxième ordre. 5 P0 est l’arithmétique de Peano, sans l’induction. 6 Techniquement, on distingue entre cohérence simple et ω-cohérence ; Gödel s’est limité à la seconde ; J. Rosser a étendu le résultat de Gödel à la première. Par ailleurs, en théorie des modèles, si G n’est pas prouvable dans une théorie T, alors on peut former les deux théories cohérentes (T et G), et (T et ¬G). Ici, la méta-sémantique interdit de former la deuxième! 7 La démonstration formalisée utilise l’induction, donc PA1. Cette impossibilité de démontrer sa cohérence s’applique en particulier à ZFC. Annexe Page 7 Révision du 21/10/2016 démonstration formalisée dans PA1 est complexe, mais intuitivement se ramène à la remarque suivante : partons de la formule G; si on prouve la cohérence de PA1, alors on a prouvé (indirectement) G, et retombe sur la contradiction. Mais la démonstration de cette cohérence, découlant de la cohérence intuitive de N, échappe à l’axiomatique du premier ordre. Revenons à Gödel 1. On peut lui objecter la complexité – et, surtout, le caractère artificiel - de la formule qui lui correspond. Nous voudrions ici en dire un peu plus sur les résultats plus récents, qui obtiennent des formules non démontrables, plus proches des mathématiques réelles. Ils se fonderont souvent sur la combinatoire, partie assez intuitive des mathématiques, et proche de l’arithmétique, mais qui, posant des problèmes complexes sur l’infini, aide à notre compréhension des grands ordinaux. Les théorèmes de combinatoire sur les arbres et les partitions utilisent les notions les plus simples d’ordre, mais requièrent déjà une axiomatisation de deuxième ordre; c’est le cas du célèbre lemme de König : tout arbre, à branchements finis, et ayant des chemins finis partiels arbitrairement longs, a un chemin infini. C’est le moment de faire une digression sur ce fameux lemme. Le lemme de König. Sa démonstration classique (Kuratowski-Mostowski, reprise par Simpson) est la suivante : on définit la relation arithmétique φ(x) : pour tout n, il y a au dessus de x une branche de longueur n ; par l’axiome de compréhension arithmétique, cette relation définit un ensemble. On démontre ensuite facilement (par contraposition sur un ensemble fini d’alternatives) que x a forcément au moins un successeur immédiat y satisfaisant φ(y). Par un choix limité à un nombre fini (qui donc ne nécessite pas l’axiome de choix général), on en choisit un. La chaîne infinie résulte d’une induction banale sur ce successeur. Ainsi ce théorème est valable dans «ACAO ». Il est clair qu’il n’est pas constructif (on ne sait jamais, quand on veut construire pas à pas la chaîne infinie, si le chemin testé s’arrêtera ou non en temps fini). Dans « RCA0 » (l’arithmétique récursive), où les axiomes de compréhension sont plus faibles, on peut trouver un contre-exemple (tordu !) au lemme de König. Dans ses « reverse mathematics », Simpson prouve même que, au dessus de RCA0 , ce lemme et ACAO sont équivalents. La contraposition du lemme de König est assez proche du « Fan Theorem » de Brouwer. Pour l’intuitionnisme, le principe d’omniscience (cf. annexe K-1D) et le lemme de König sont équivalents. Le lemme de König est utilisé par Kleene pour démontrer la complétude du calcul des prédicats. Joint à l’axiome de choix, il démontre aussi les théorèmes de combinatoire de Ramsey : Annexe Page 8 Révision du 21/10/2016 - La formulation, a fortiori la démonstration, du « théorème « infini » (concernant des partitions infinies) supposent le second ordre.8 Celle de sa version finie se prouve dans PA1. - Le théorème infini de Ramsey est utilisé pour prouver - dans PA2 une variante de la version finie, due à Paris-Harrington. Etant finie, cette variante est - elle aussi - exprimable dans PA1. On montre en revanche qu’elle y est équivalente à la consistance de PA1, qui est ainsi prouvée dans PA2. En revanche, elle ne peut, après Gödel 2 (qui suppose Gödel 1), être prouvée dans PA1. L’intérêt est que l’on a ainsi mis en évidence une formule infiniment plus parlante que la célèbre formule de Gödel, mais comme elle non prouvable en premier ordre, et vraie (parce que prouvable en deuxième ordre). Je m’interroge cependant sur la portée de ce résultat, puisque - impliquant la consistance de PA1 – il utilise le deuxième théorème de Gödel qui, lui-même fondé sur le premier, nécessite la formule initiale critiquée de Gödel. Sur un autre plan, D. Isaacson soutient qu’il y aura toujours dans de telles formules de l’infinitaire ou du second ordre cachés ; même, pour lui, les formules vraies, non codées, de l’arithmétique pure du premier ordre seraient prouvables dans cette logique même. L’ensemble des théorèmes de l’arithmétique (et plus généralement des mathématiques) est dénombrable. La position d’Isaacson est donc tenable, mais l’a-t-il vraiment justifiée ? Sur le plan pratique, on sait comme il a été difficile de démontrer une proposition arithmétique particulière, celle du théorème de Fermat-Wiles ; que penser de toutes les propositions analogues, de formulation à peine plus compliquées ? Les difficultés augmenteront a fortiori, quand on passera à l’analyse et à ses innombrables problèmes particuliers : ee est-il rationnel ? Cf. annexe K-1. Il est enfin intéressant de noter que l’analyse récursive computationnelle, avec des méthodes très semblables à celles de Gödel, arrive à des résultats d’incomplétude analogues, et à des problèmes de codage encore plus difficiles (cf. annexe K-2B). Le théorème de Matisajevic est très parlant lui aussi, puisqu’il prouve qu’il y a une correspondance biunivoque entre équations diophantiennes (équations polynomiales à coefficients entiers) et relations récursivement énumérables ; comme il existe des ensembles récursivement énumérables, mais non récursifs, on en déduit qu’il n’y a pas de procédure de décision pour les équations diophantiennes (c’était le dixième problème de Hilbert). On peut appliquer ce dernier résultat pour démontrer l’indécidabilité de problèmes concrets de la mécanique ou de la physique; ainsi, quand on étudie la trajectoire d’une particule, il n’est pas toujours possible de prédire si elle va sortir d’un domaine compact préalablement défini. Il faut cependant remarquer que, à l’inverse des résultats précédents, Matisajevic ne nous dit 8 Techniquement, on utilise ACA0. La démonstration utilise l’axiome de choix, pour N et pour les parties de N. Annexe Page 9 Révision du 21/10/2016 pas laquelle – dans l’infinité dénombrable des équations diophantiennes – est indécidable ! Un autre exemple d’indécidabilité concerne le caractère aléatoire d’un nombre. Mais la notion d’aléatoire est encore plus complexe que celle d’indécidabilité! (cf. annexe 2). Comme le théorème de Gödel contourne le paradoxe du menteur, le concept de nombre aléatoire contourne le paradoxe de Berry (sur la possibilité de définir certains nombres). Ils se rejoignent à propos du fameux nombre Ω de Chaitin. Notons enfin que l’ensemble N des entiers « naturels » a comme propriété d’être « segment initial » de tout modèle de PA1, ce qui est une façon informelle de le distinguer (de se convaincre de son caractère unique). 4. Une remarque sur l’hypothèse du continu. Des travaux de H. Woodin (1995) voudraient y ajouter un axiome posant l’existence d’un « grand cardinal ». Il est conjecturé que ce type d’axiome entraînerait la fausseté de l’hypothèse du continu. 5. Un peu plus sur l’axiome (les axiomes) de choix. Cet axiome est très ambigu : sous sa forme directe, il paraît évident; par sa conséquence la plus simple : « il existe un bon ordre sur R », il défie l’intuition (encore plus, peut-être par le théorème de Banach-Tarski, qui en découle). Beaucoup de mathématiciens aiment la généralité que sa formulation la plus courante, celle du lemme de Zorn, donne à leurs démonstrations (la rançon est qu’ils perdent la constructivité). Déjà la logique mathématique en fait un large usage, ne serait-ce que par les “fonctions de Henkin”. K. Gödel a prouvé que, sa théorie des ensembles « constructibles » (restreints, par rapport aux ensembles bien fondés, par l’exigence qu’ils puissent être « définis ») impliquait la vérité de l’axiome du choix; inversement, P. Cohen a montré que certains modèles « forcés » des ensembles n’y satisfaisaient pas. Il existe donc des théories des ensembles « zerméliennes » (ZFC), et d’autres « non-zerméliennes » (ZF, plus un axiome incompatible avec le choix). Les commentateurs disent fréquemment que, puisque il y a ces deux catégories de modèles, nous sommes libres de choisir; comme l’axiome du choix est commode en mathématiques, nous l’accepterons. Cette présentation n’est pas claire : l’axiome du choix n’est « sûr » que si nous nous limitons aux seuls ensembles constructibles, peu riches, et aux propriétés parfois pathologiques. Or l’intérêt de l’axiome du choix est qu’il permet de démontrer des résultats extrêmement généraux, s’appliquant à des transfinis élevés. Ainsi, sur le plan des principes, il n’est utilisable « sûrement » que là où l’on n’en a pas besoin ! Que sa validité pratique soit étayée par les nombreux usages qu’en font les mathématiciens, sans contradictions apparentes, ne change rien. L’axiome du choix général entraîne le tiers exclu ; il est donc incompatible avec les formes de constructionnisme, qui rejettent le tiers exclu. En revanche, des formes plus faibles de l’axiome de choix (l’axiome de choix dénombrable, comme l’axiome de choix dépendant) sont plus naturelles et compatibles avec le Annexe Page 10 Révision du 21/10/2016 constructionnisme9 ; moins puissantes, elles permettent néanmoins de satisfaire aux mathématiques courantes. Une autre axiomatisation a été proposée par R. Solovay : il rejette l’axiome de choix, mais pose que tous les ensembles sont mesurables (hypothèse conforme aux différents constructivismes, puisque l’on sait qu’on ne peut construire d’ensemble non mesurable). 6. Quelques compléments sur les « Reverse Mathematics ». Une définition rapide des Reverse mathematics a été donnée en sp1. Les mathématiques traditionnelles partent d’axiomes et aboutissent à des théorèmes. Leur « renversement » consiste, pour chacun de leurs résultats notables, à évaluer l’axiomatisation minimum qui permet de l’obtenir. Un autre système, plus faible, et plus paradoxal (cf. annexe K-2B), « RCA0 », correspond au récursif, à l’algorithmique. En pratique, l’on se penche sur la façon dont, à partir des axiomes de Peano, on accède aux grands résultats de l’analyse ou de la combinatoire. On travaille en second ordre, et l’ajustement se fait par le recours à des axiomes de compréhension, plus ou moins puissants (qui font correspondre à toute formule l’ensemble des éléments, qui y satisfont). Les spécialistes en retiennent cinq, s’emboîtant les uns dans les autres. Quand un résultat résiste à un système et est prouvé par le système suivant, il est fréquent que ce dernier équivaille au système faible, auquel on a ajouté le dit résultat comme axiome supplémentaire. Trois systèmes me semblent les plus importants, par ordre de force croissante : « RCA0 » (R pour récursif), « ACA0 » (A pour « arithmetical comprehension), enfin le plein axiome de compréhension (qui permet d’obtenir tous les résultats des mathématiciens). RCA0 ne s’intéresse qu’aux formules arithmétiques bornées, existentielles « Σ10 », universelles « П10, ou « Δ10 » (les deux). Σ10 correspond aux ensembles récursivement énumérables, Δ10 aux ensembles récursifs. L’induction concerne les formules existentielles, le schéma de compréhension les troisièmes (d’où le R dans RCA) Il prouve déjà des théorèmes aussi variés que : en analyse, celui des valeurs intermédiaires ; en logique, une version de la complétude ; en algèbre, l’existence de la clôture d’un corps dénombrable… A côté de son fort pouvoir exploratoire, la notion de récursivité souffre des inconvénients inhérents du codage : discussions difficiles sur la portée de la formule de Gödel, paradoxes du constructivisme russe (voir annexe K1E)… Elle permet de forger un exemple – artificiel – de séquence d’intervalles rationnels, ne satisfaisant pas le lemme de recouvrement de Heine-Borel, donc où le théorème, que toute fonction continue est uniformément continue, n’est plus valable. 9 L’axiome de choix dénombrable « AC0 », qui découle de notre intuition des entiers, permet déjà de prouver des résultats importants pour la physique (par exemple que les espaces de Hilbert ont une base). Annexe Page 11 Révision du 21/10/2016 ACA0 est beaucoup plus fort. Sa part de premier ordre est PA. Il considère toutes les formules arithmétiques. L’intérêt général des axiomes de compréhension est qu’ils permettent de transposer à des formules des notions importantes et générales de la théorie des ensembles (comme l’union de deux ensembles, ou l’ensemble des parties d’un ensemble). Mais, quand on se limite à des formules arithmétiques, où la quantification ne se fait que sur des entiers et non sur des ensembles, ces mêmes notions sont évidentes et le système n’est qu’une extension conservative de PA1, part de premier ordre de ACA0 . ACA0 reste prédicatif ; cela lui permet d’accéder à ce premier niveau de base de « mathématiques sûres » (en analyse, la théorie des fonctions continues ; en combinatoire, le lemme de König), que vise la fin de sp-1 (il ya aussi une démarche parallèle de Weyl-Feferman). Donc, pour ma démarche, tous les systèmes « inférieurs » sont sans intérêt. Dans ACA0, on prouve aussi – sans axiome de choix – qu’un espace de Hilbert sur le corps des rationnels a une base. En revanche, les théorèmes de l’analyse, qui ne s’obtiennent que par des méthodes imprédicatives, nécessitent d’aller au-delà de ACA0 ; c’est le cas de la complétude de R (quand elle n’est pas limitée aux suites). Les constructivistes ont, eux aussi, développé des « Reverse Mathematics », mais sans tiers exclu (voir l’annexe K1). 7. Les très grands nombres finis et les infinis (cf. chapitre 20-6). Après Frege, nous avons le vertige quand nous évoquons de très grands nombres - faciles à écrire avec seulement deux exponentielles ! Mais le mathématicien établit une distinction fondamentale entre très grand nombre fini et l’infini. S. Lavine a tenté de passer outre à cette distinction : à la suite de J. Mycielski, il rattache à toute théorie infinie T une théorie finie Fin(T), en restreignant son domaine à des entiers « indéfiniment grands ». Des théorèmes, applicables à l’arithmétique ou à la théorie des ensembles, font le raccord; T est consistant ssi tout sous-ensemble fini de Fin(T) a un modèle fini. Le recours à ces nombres indéfiniment grands (les “zillions”) permet par exemple de clarifier les définitions de limites ou de dérivées. Il n’en reste pas moins que, pour moi, l’intuition de la succession indéfinie des entiers est fondamentale ; je ne pense donc pas que Lavine évite une circularité dans le processus d’extrapolation du fini à l’infini. Rejoignant les problèmes de frontières, il y a aussi le paradoxe dit du « sorite » (cf. note 323 de sp) : un tas de sable reste un tas quand on lui enlève un grain, puis un autre, mais jusqu’où? C’est un peu le processus inverse des nombres indéfiniment grands. R. Parikh a su le transformer en un théorème profond (comme Gödel a transformé le paradoxe du menteur). Fondamentalement, la notion de « grand nombre » est vague, non axiomatisable; ceci condamne le finitisme strict (même si le nominalisme traditionnel l’exige). Tout mathématicien, même constructiviste, accepte l’infini dénombrable. Ceux qui ne sont pas constructivistes vont au-delà, même si Annexe Page 12 Révision du 21/10/2016 seule une petite minorité s’intéresse aux infinis vertigineux de la théorie des ensembles, par nature hautement non prédicatifs.10 Remarques et questions diverses Question J1, sur l’arithmétique finitiste PRA. Dans les reverse mathematics, WKL0 (RCA0 + lemme faible de König) est une extension conservative de PRA. Dois-je pour autant, recherchant la sûreté des fondements, préférer partir de PRA minimale plutôt que de PA ? Non ? car mon intuition s’accommode très bien de l’induction de PA. J2. Remarques sur ZFC. On peut faire le choix de prendre pour fondement la théorie des ensembles. Si on veut profiter de la notion d’ordinal, qui y est fondamentale, on doit admettre l’axiome de choix et donc partir de ZFC. Toute théorie T (quel que soit son ordre) peut alors être traduite par une formule du premier ordre de ZFC, disant : x est modèle de T. De même, on peut exprimer la catégoricité de T. La rançon de rester en ZFC premier ordre est que cette axiomatisation est incomplète. Prenons l’exemple où T est PA2 : à deux modèles différents de ZFC peuvent correspondre deux modèles de N non isomorphes; la catégoricité dans un modèle n’entraîne pas la catégoricité « absolue »; on a perdu ce qui était pour moi l’essentiel de l’intérêt de PA2. On retrouve les difficultés de Skolem. Autres inconvénients. L’axiomatique de ZFC, et en particulier l’axiome de choix, sont moins clairs que la notion d’entier naturel, qu’ils prétendent retrouver. Arithmétique et analyse se satisfont d’ensembles « naïfs » (inclus dans le « petit » univers Vω + ω). Quelques remarques sur les axiomes de ZFC. 10 On peut déjà construire, par des extensions successives – et indéfinies - de grands ordinaux, dépassant largement ω (qui représente N), mais naturellement toujours dénombrables. C’est ainsi que G. Gentzen a retrouvé la consistance de l’arithmétique en admettant l’induction jusqu’à l’ordinal ε 0. Ceci se conçoit si on réfléchit que, déjà pour les formules Π1 (avec un seul ), “il n’y a qu’à” les tester une à une jusqu’à l’infini (avec un seul quantificateur, on monte à ω ; avec un nombre indéterminé de quantificateurs, on monte à ε0). En paraphrasant librement Grégoire de Nysse, cela me semble accessible aux bienheureux, progressant dans leur sempiternité, mais de peu d’intérêt pour moi aujourd’hui! Une autre conception de l’éternité est celle de don Quichotte : « Il n’est donné qu’à Dieu de connaître le temps en sa totalité, pour Lui, il n’y a ni passé ni futur ; tout est présent) ». Les « infinis vertigineux » sont ceux des alephs extrêmes, bien supérieurs à ℵ1 (la puissance du continu, elle même si supérieure au dénombrable). Leur classification est d’une extrême complexité. Sur leur existence, on ne peut faire que des conjectures. Annexe Page 13 Révision du 21/10/2016 L’axiome de remplacement est plus fort que celui de compréhension. Le premier, nécessaire à la théorie des ordinaux (mais Lévine dit qu’il suffit, soit du choix, soit du remplacement ?), ne serait pas nécessaire à l’essentiel des mathématiques. Question générale : quand il est démontré qu’une proposition (ou un axiome) est indépendante des autres axiomes de ZF (c’est le cas de l’axiome de choix, de celui de fondation), a-t-on intérêt à l’ajouter comme axiome ? (ou à ajouter son contraire ? ou à ne rien faire ?) Ce sont des questions d’opportunité, à répondre cas par cas. Pour l’axiome de choix, je suggère dans le texte principal d’en rester toutes les fois qu’on peut à l’axiome de choix dénombrable, constructif, mais de savoir que des théorèmes généraux et importants requièrent sa forme générale. Ma position sur l’axiome de fondation est différente. Il apporte une certaine clarté à la notion d’ensemble. Dans ma conception d’une axiomatisation minimale, il traduirait l’idée de base de « mon » constructivisme : considérer les entiers naturels comme des « urelements, interdisant tout cycle. Enfin, une question voisine pourrait être posée sur les cardinaux inaccessibles. On sait qu’en poser l’existence aboutit à prouver la consistance de ZFC, et inversement que l’axiome niant leur existence est compatible avec ZFC. Tout ce qu’on peut envisager se limite donc à ajouter à ZFC cet axiome négatif. Mais on n’en voit pas l’intérêt : il enlèverait le pain de la bouche de quelques théoriciens des ensembles, et n’aurait aucune utilité pour des constructionnistes ! Hintikka, J. (1996) The Principles of Mathematics revisited. Cambridge. Jech K. (2003) Set Theory. North Holland. Kaye, R. (1991), Models of Peano Arithmetic. Oxford. Kleene, S. (tr. 1971), Logique mathématique. A. Colin. Lavine, S. (1994) Understanding the Infinite. Harvard. Poizat, B. (1985) Cours de théorie des modèles. ISSN. Tarski, A. The Semantic Conception of Truth, in Philosophical and Phenomenological Research 4 (1944).