La théorie des modèles et l`architecture des mathématiques

publicité
LA THEORIE DES MODELES ET L’ARCHITECTURE DES
MATHEMATIQUES
par Philippe de Rouilhan
(Version n°3, 25 mars 2006)
Avertissement pour cette version. - Ceci n’est qu’un document de travail. D’une part la
version définitive ne sera mise au point qu’après le 1er avril, en tenant compte des remarques
qui m’auront été faites ; d’autre part, une grande partie (formelle) de ce qui est écrit ne sera
pas reprise à l’oral, et, inversement, une partie (dialectique) de ce qui sera dit le 1er avril
n’est sans doute pas écrite. L’idée de départ était de déterminer la place qui revient de jure,
sinon de facto, à la « théorie des modèles » (ainsi nommée par les logiciens depuis les
années 50 du siècle dernier) dans l’architecture des mathématiques, et, corollairement, de
réfuter nombre d’idées reçues à son sujet. La principale différence entre cette version et la
précédente est dans le paragraphe 5, consacré à cette réfutation, rédigé ici pour la première
fois.
Table des matières
I. Une théorie des modèles d’avant la « théorie des modèles »
II. Structures
II.1. Echelles d’ensembles
II.2. Structures
II.2.1. Structures au sens restreint
II.2.2. Structures au sens général
II.2.3. Remarque
II.3. Extensions canoniques d’applications
II.4. Isomorphismes
II.4.1. Isomorphismes de structures au sens restreint
II.4.2. Isomorphismes de structures au sens général
II.4.3. Sur d’autres usages possibles du mot « structure »
III. Genres et espèces de structure dans les termes de l’ancienne théorie des modèles
III.1. Genres de structure
III.1.1. Construction d’une théorie de genre de structure, première étape : théorie
d’arrière-plan et termes de base auxiliaires
III.1.2. Construction d’une théorie de genre de structure, deuxième étape : constantes
de base principales et axiomes de position
III.1.3. Complément sur les échelles d’ensembles
III.1.4. Construction d’une théorie de genre de structure, troisième étape: constantes
structurales et axiomes de typification
III.1.5. Structures de genre donné ; genres de structure
III.2. Espèces de structure
III.2.1. Transportabilité
III.2.2. Quatrième étape pour la construction d’une théorie d’espèce de structure à
partir d’une théorie de genre de structure : axiomes de spécification ; structures
d’espèce donnée ; espèces de structure
III.2.3. Exemples de théories d’espèce de structure
III.3. La reconstruction des mathématiques traditionnelles
III.3.1. La reconstruction axiomatique moderne des théories mathématiques
traditionnelles comme théories d’espèce de structure catégorique
III.3.2. Sur la méthode usuelle de développement non axiomatique de ces théories ; un
(premier) théorème de coopération
III.3.3. Excursus. Une autre morale pour la fable d’Ernie et de Johnny
IV. Genres et espèces de structure dans les termes de la nouvelle théorie des modèles
IV.1. Un nouveau langage pour les axiomes de spécification
IV.1.1. Que les axiomes de spécification peuvent en général s’exprimer plus
simplement dans un certain autre langage que celui d’une extension de la théorie des
ensembles
IV.1.2. Exemples
IV.2. La nouvelle théorie des modèles
IV.2.1. Structures d’interprétations et univers du discours
IV.2.2. Modèle
IV.2.3. Conséquence
IV.2.4. Un (second) théorème de coopération
IV.2.5. Théories d’espèce de structure nouvelle version
IV.3. La nouvelle architecture des mathématiques modernes
IV.3.1. Esquisse de la nouvelle architecture
IV.3.2. Deux exemples de nouvelle théorie
V. Réfutation de quelques idées reçues concernant la nouvelle théorie des modèles
V.I. Les deux théories des modèles existent-elles ?
V.2. En quoi consiste la différence des deux théories ?
V.3. La nouvelle théorie des modèles est-elle applicable à la théorie des ensembles et à
toutes ses extensions de même ordre?
V.3.1. Une idée reçue, un diagnostic
V.3.2. Le test de Kreisel et son résultat
V.3.3. Un faux théorème de coopération et sa réfutation
2
I.
Une théorie des modèles d’avant la « théorie des modèles »
I.1.
Il y a au moins deux théories des modèles dignes de ce nom.
La première, trop peu connue des logiciens, a été esquissée par Tarski dans
son article classique de 1936 sur le concept de conséquence logique ; on y
retrouve, mutatis mutandis, des idées avancées par Bolzano en 1837 dans sa
Wissenschaftslehre (que Tarski ne connaissait pas). Elle est simple et naturelle,
et ses concepts fondamentaux sont d’excellentes explications des notions
informelles correspondantes. Je lui ai donné par ailleurs le nom de théorie des
modèles BT ; mais, en fait, c’est une variante de cette théorie que vise, dans le
titre de ce paragraphe I, l’expression « théorie des modèles » (sans
guillemets). J’appellerai cette variante MT1.
La seconde, trop peu connue des mathématiciens, a fait florès dans les
années 50 du siècle dernier, sous l’impulsion notamment de Tarski (encore
lui !). Elle explique excellemment nombre de notions à l’œuvre dans la
tradition de l’algèbre de la logique. Ses premiers grands théorèmes remontent
aux années 10 et 20. Je l’ai souvent notée par ailleurs MT, mais, en fait, c’est
une variante, dite inclusive, de cette théorie que je vise, dans le titre de ce
paragraphe, avec l’expression « « théorie des modèles » » (avec guillements).
La seule différence entre la « théorie des modèles » et sa variante inclusive est
que, dans cette dernière, on n’exclut pas les structures d’interprétation dont
l’univers (ou domaine, ou ensemble) de base est vide. Pour être tout à fait
général, je devrais plutôt parler de multi-univers (ou multidomaine, etc.) de
base, pour prendre en compte le cas où plusieurs sortes d’« individus » 1 sont en
jeu. Il m’est arrivé par ailleurs de noter MTi la variante inclusive de la « théorie
des modèles », mais, dans cet article, je la noterai MT2.
Je suppose MT2 connue et je présente rapidement MT1.
I.2.
D’abord BT. La référence fondamentale est l’article de Tarski de 1936,
mais, comme il ne s’agit pas pour moi d’histoire et d’exégèse, je reprendrai ici
les idées de Tarski dans un autre cadre que le sien. Le rôle qu’il confiait à la
théorie des types simple, je le ferai jouer à la théorie élémentaire des
1
La réserve des guillemets ici pour rappeler que c’est en un sens relatif qu’il faut entendre
ce terme, d’usage courant en MT et dans toutes ses variantes.
3
ensembles, disons, pour fixer les idées, à ZF (sans exclure les individus2 ). En
particulier je considèrerai cette théorie des ensembles comme une théorie
purement logique.
Soit M un langage obtenu à partir du langage de la théorie des ensembles par
adjonction d’un nombre fini de constantes d’objet, a1, ..., an, données dans cet
ordre, tenues pour des signes extra-logiques, et, dont la référence est, comme
on disait autrefois des paramètres en mathématiques élémentaires,
« indéterminée [pour nous], mais fixée [en elle-même] ». M est donc un langage
non-interprété. Voici, exposés librement et de façon informelle, les concepts
fondamentaux de BT appliqués à M. Qu’il soit dit une fois pour toutes que je ne
me laisserai pas arrêter par les paradoxes sémantiques qui rendent la
formulation de certaines définitions explicites impossible dans le cadre choisi.
Pour résoudre cette difficulté, il faut, soit élargir le cadre de départ, en le
remplaçant, par exemple, par celui de la théorie des ensembles du second
ordre, ZF2, soit, si l’on tient à rester dans le cadre de départ, se contenter de
définitions schématiques.
Une interprétation pour M est un n-uplet d’objets, ⟨x1, ..., xn⟩. Un énoncé A
de M est vrai dans l’interprétation ⟨x1, ..., xn⟩, si, et seulement si, il devient vrai
lorsque a1, ..., an prennent respectivement les valeurs x1, ..., xn. 3 Un modèle
d’un ensemble (fini ou infini) E d’énoncés est une interprétation dans laquelle
les énoncés de E sont vrais. Un énoncé A est conséquence logique d’un
ensemble E d’énoncés si, et seulement si, tout modèle E est un modèle de A. A
partir de là, on peut naturellement définir les notions d’analyticité logique (ou
caractère tautologique), de consistance (ou cohérence), d’inconsistance (ou
incohérence, ou caractère contradictoire), d’un ensemble E d’énoncés ; ou les
2
Pas de guillemets, ici, le terme étant à prendre au sens absolu. On parle souvent, dans le
même sens, d’Urelemente. Les objets de la théorie élémentaire des ensembles sont les
ensembles et, s’il y en a, les individus en ce sens. Les termes primitifs proprement
ensemblistes (set-theoretical) sont le prédicat unaire « ens » (vrai des ensembles et d’eux
seulement)) et le prédicat binaire « ∈ » ; les axiomes proprement ensemblistes sont les
axiomes habituels de ZF revus et corrigés pour tenir compte de la présence éventuelle
d’individus, à savoir les axiomes (Ind), (Ext), (Union), (Power), (Inf), et les clôtures
universelles des formules de la forme (Repl), où « !t» est le quantificateur d’unicité (« il
existe au plus un ») et A[z, t] une formule du langage de la théorie où ne figurent ni « x » ni
«y»:
(Ind)
∀x∀y(x ∈ y ⇒ ens y),
(Ext)
∀x∀y{(ens x & ens y) ⇒ [∀z(z ∈ x ⇔ z ∈ y) ⇒ x = y]},
(Repl)
∀x{(ens x & ∀z!tA[z, t]) ⇒ ∃y[ens y & ∀t(t ∈ y ⇔ ∃z(z ∈ x & A[z, t]))]},
(Union)
∀x{[ens x & ∀y(y ∈ x ⇒ ens y)] ⇒ ∃z[ens z & ∀t(t ∈ z ⇔ ∃u(t ∈ u ∈ x))]},
(Power)
∀x{ens x ⇒ ∃y[ens y & ∀z(z ∈ y ⇔ z ⊆ x)],
(Inf)
∃x[ens x & ∅ ∈ x & ∀y(y ∈ x ⇒ {y} ∈ x)].
3
Je passe ici sur la définition de la vérité, la référence obligée étant évidemment le fameux
mémoire de Tarski sur le sujet (1933, en polonais ; 2e éd. 1936, en allemand).
4
notions de dépendance et d’indépendance d’un énoncé A par rapport à E ; et
l’on peut facilement établir quelques petits résultats 4 reliant les diverses
notions définies jusque-là.
Vers la fin de son article de 1936 de Tarski note que la distinction entre les
signes logiques et signes extra-logiques semble dénuée de fondement objectif,
conventionnelle. D’où l’idée de relativiser les notions définies jusque-là à telle
ou telle distinction entre signes logiques et les signes extra-logiques. Dans la
suite de cet article, j’accepterai cette relativisation dans la mesure limitée où
j’envisagerai que certaines des constantes a1, ..., an de M puissent être
considérées, traitées, comme des signes logiques. Dans ce cas, notant ai1, ...,
aim (avec m < n) les constantes extra-logiques restantes, données dans cet
ordre, les définitions données ci-dessus doivent être revues et corrigées : une
interprétation pour M est un m-uplet d’objets, ⟨x1, ..., xm⟩ ; un énoncé A de M
est vrai dans l’interprétation ⟨x1, ..., xm⟩, si, et seulement si, il devient vrai
lorsque ai1, ..., aim prennent respectivement les valeurs x1, ..., xm ; etc.
La théorie des modèles que j’envisage ainsi, c’est la théorie des modèles BT
à deux modifications près : d’une part, le cadre n’est plus celui de la théorie des
types simple, c’est celui de la théorie élémentaire des ensembles ZF ; d’autre
part, la liberté de choix de la distinction entre signes logiques et signes extralogiques est limitée à la possibilité de traiter comme des signes logiques telles
ou telles constantes d’objet habituellement réputées extra-logiques. J’apporterai
encore une troisième modification, qui me sera très utile pour la suite:
j’admettrai que les constantes extra-logiques de M puissent être données, non
pas sous la forme d’une simple séquence, comme ci-dessus, mais comme un
couple de séquences de la forme ⟨⟨a1, ..., an⟩, ⟨b1, ..., bp⟩⟩, que je noterai ⟨a1,
..., an ; b1, ..., bp⟩. Dans ce cas, les définitions données ci-dessus doivent être à
nouveau revues et corrigées : une interprétation pour M est un couple de
séquences de la forme ⟨⟨x1, ..., xn⟩, ⟨y1, ..., yp⟩⟩, noté ⟨x1, ..., xn ; y1, ..., yp⟩ ; un
énoncé A de M est vrai dans l’interprétation ⟨x1, ..., xp ; y1, ..., yp⟩, si, et
seulement si, il devient vrai lorsque a1, ..., an, b1, ..., bp prennent
respectivement les valeurs x1, ..., xn, y1, ..., yp ; etc. C’est la théorie des
modèles ainsi obtenue que j’appelle MT1.
C’est la version MT1 de la théorie des modèles BT, et non la version MT2
de la théorie des modèles MT chère aux logiciens, qui est à l’œuvre, en fait,
dans les mathématiques modernes. Les paragraphes II et III fourniront la
4
Du genre de ceux dont Carnap faisait ses délices dans la Syntaxe.
5
preuve de cette thèse. Pour fixer les idées, je m’en tiendrai aux mathématiques
modernes telles que rassemblées et mises en forme par Bourbaki. 5
5
La théorie des modèles BT ou MT1 chez Bourbaki ne montre explicitement le bout de son
nez que rarement, je n’en connais que deux exemples, voir note 29. Elle n’en est pas moins
implicitement à l’œuvre tout au long des Eléments.
6
II.
Structures 6
C’est un lieu commun que de dire que les mathématiques dites modernes
sont l’étude, selon la méthode axiomatique moderne, ou formelle, des certaines
structures, ou mieux de certaines espèces de structure, comme par exemple, les
ensembles ordonnés, les groupes, les espaces vectoriels sur un corps
commutatif donné, les espaces topologiques, etc. Une structure est un couple
de séquences de la forme ⟨x1, ..., xn ; y1, ..., yp⟩ (voir § I), ou, selon les
notations que j’adopterai pour leur définition précise, ⟨U1, ..., Un ; V1, ..., Vp⟩,
les composantes de cette structure remplissant certaines conditions qui en font
une structure, précisément.
Ce paragraphe II est consacré à la notion de structure et, corrélativement, à
celle d’isomorphisme. Pour définir la notion de structure (§ II.2), nous aurons
besoin de la notion d’échelle d’ensembles (§ II.1) ; de même, pour définir
ultérieurement la notion d’isomorphisme (§ II.4), nous aurons besoin de celle
d’extension canonique d’applications (§ II.3).
6
Les paragraphes II et III font librement écho aux NN° 1-5 du §1 du chapitre 4 du livre I de
la première partie des Eléments de Bourbaki, soit un peu moins de neuf pages. Les
différences sont nombreuses et d’importance variable. J’en soulignerai quelques-unes en
note, mais je renonce à en tenir exactement le compte.
La première partie des Eléments de mathématique est intitulée « Les structures
fondamentales de l’analyse » et divisée en six livres, publiés par fascicules, vingt-six en
tout. Le livre I, Théorie des ensembles, de cette première partie est divisé en quatre
chapitres : 1. Description de la mathématique formelle ; 2. Théorie des ensembles ; 3.
Ensembles ordonnés. Cardinaux. Nombres entiers ; 4. Structures. Ce dernier chapitre 4
comporte trois paragraphes (et un long appendice supprimé à partir de la seconde édition),
dont le premier nous intéresse au premier chef : Structures et isomorphismes. Ce paragraphe
est à son tour divisé en numéros, dont les cinq premiers sont : 1. Echelons ; 2. Extensions
canoniques d’applications ; 3. Relations transportables ; 4. Espèces de structure ; 5.
Isomorphismes et transport de structures .
Le texte en question de Bourbaki est d’une extrême difficulté de lecture, pour deux ou
trois raisons très différentes. La première tient au style général de l’auteur des Eléments, qui
ne fait aucun droit, si peu que ce soit, au souci pédagogique. Je m’efforcerai, quant à moi,
vers plus d’intelligibilité. La deuxième raison est la confusion quasi-permanente que
Bourbaki s’autorise entre usage et mention. Dans les mathématiques ordinaires, et j’inclus
sous ce chef les Eléments eux-mêmes à partir du livre II, ce genre d’abus de langage est le
plus souvent bienvenu, qui facilite la communication ; mais au livre I, et singulièrement aux
chapitre, paragraphe, et numéros qui nous intéressent, il est difficilement pardonnable. C’est
pour y échapper que je sépare nettement ce qui relève des structures en général et telles
qu’en elles-mêmes (§ II) de ce qui relève des théories de genre ou d’espèce de structure (§
III). Il y a peut-être une troisième raison pour laquelle notre texte de prédilection est si
difficile à lire, hautement respectable, celle-là, puisqu’elle tiendrait tout simplement à la
difficulté de « la chose même ».
7
II.1. Echelles d’ensembles
Soient E1 , ..., En des ensembles (n > 0). On appelle échelle d’ensembles sur
E1 , ..., En et l’on note E(E1 , ..., En), le plus petit ensemble X tel que
(i)
(ii)
(iii)
E1 , ..., En ∈ X ;
si F1 , ..., Fk ∈ X, alors P(F1 × ... × Fk) ∈ X ; 7
si F1 , ..., Fk, Fk+1 ∈ X, alors F(F1 × ... × Fk, Fk+1) ∈ X. 8
Les éléments de l’échelle sont ses échelons ; E1 , ..., En sont les échelons (ou
simplement : ensembles) de base de l’échelle ; les autres éléments sont les
échelons supérieurs.
On attribue à chaque échelon d’une échelle d’ensembles E(E1 , ..., En) un
certain indice permettant de repérer sa place dans l’échelle indépendamment de
la nature des ensembles de base. Cette attribution se fait par induction en
suivant le mode de construction des échelons :
(i)
(ii)
(iii)
77
8
E1 , ..., En sont les échelons d’indices respectifs 1, ..., n ;
si F1 , ..., Fk sont des échelons d’indices respectifs τ1, ..., τk, alors P(F1
× ... × Fk) est d’indice ⟨τ1, ..., τk ⟩ ;
si F1 , ..., Fk, Fk+1 sont des échelons d’indices respectifs τ1, ..., τk, τk+1,
alors F(F1 × ... × Fk, Fk+1) est d’indice ⟨τ1, ..., τk ; τk+1⟩. 9
P(F1 × ... × Fk) est l’ensemble des parties de F1 × ... × Fk.
F(F1 × ... × Fk, Fk+1) est l’ensemble des (graphes d’)applications de F1 × ... × Fk dans
Fk+1. J’ai introduit la clause (iii), qui n’a pas son équivalent dans la définition de Bourbaki,
pour simplifier la présentation, le moment venu, de certains exemples d’espèces de structure.
Inversement, il y a dans la définition de Bourbaki une clause qui n’a pas son équivalent dans
la mienne, à savoir (avec mes notations) que, si F1 , ..., Fk ∈ X, alors F1 × ... × Fk ∈ X.
Bourbaki en tire un profit bien mince, dont je me passe allègrement.
9
Au lieu de repérer la place des échelons dans une échelle en s’inspirant, comme moi, de la
théorie logique des types simple, Bourbaki le fait des séquences finies de couples d’entiers,
représentant de façon codée des procédés de construction de ces échelons et baptisées par lui
« schémas de construction d’échelon ». L’échelon d’une échelle E(E1 , ..., En)
correspondant à un tel schéma S est « l’échelon de schéma S sur les ensembles de base E1,
..., En », noté S(E1, ..., En). En exercice, il propose, de façon plus naturelle, de parvenir au
même but en utilisant des termes bien formés (« assemblages équilibrés ») où ne figurent
que des signes choisis parmi deux foncteurs (« signes substantifiques ») « P » et « × »,
primitifs, supposés donnés pour la circonstance, de poids respectifs 1 et 2, et n lettres
distinctes de poids 0, « x1 », ..., « xn ». Un tel terme est un « type d’échelon », et l’échelon
8
On pourra commodément noter τ(E1 , ..., En) l’échelon d’indice τ de l’échelle
E(E1 , ..., En).
Un élément de l’échelon τ(E1, ..., En) d’indice τ d’une échelle d’ensembles
E(E1 , ..., En) est dit objet de type τ de (ou dans, ou sur, ou relativement à)
cette échelle. Sur cette échelle, on peut distinguer :
1°) les objets de type 1 ou ... ou n, qui sont les éléments de base, ou
« individus » 10 , de l’échelle :
2°) les objets de type de la forme ⟨τ1, ..., τk⟩, qui sont les relations à k
arguments de types respectifs τ1, ..., τk (ou, plus précisément, les graphes de
ces relations) ;
3°) les objets de type de la forme ⟨τ1, ..., τk ; τk+1⟩, qui sont les fonctions à k
arguments de types respectifs τ1, ..., τk et à valeurs de type τk+1 (ou, plus
précisément, les graphes de ces fonctions).
II.2.. Structures
Je commencerai par une définition provisoire, qui manque de généralité,
mais qui est relativement simple et constitue une bonne introduction en vue de
la définition définitive.
II.2.1. Structures au sens restreint.
Une structure au sens restreint est un objet, S , de la forme
⟨U1, ..., Un ; V1, ..., Vp⟩,
où U1, ..., Un, avec n > 0, sont des ensembles, et V1, ..., Vp, avec p ≥ 0, sont
des éléments d’échelons de l’échelle E(U1 , ..., Un). U1, ..., Un, sont les
d’une échelle E(E1, ..., En) correspondant à un type d’échelon T est la « réalisation du type
d’échelon T sur E1, ..., En », notée T(E1 , ..., En).
Ajoutons, pour finir, que, étant donnée la confusion déjà dénoncée plus haut entre usage
et mention, les schémas de construction d’échelons et les types d’échelon de Bourbaki
peuvent aussi bien être compris comme des versions codées de procédés de construction,
non pas d’échelons, mais de certains termes désignant lesdits échelons (vide infra, § III.1.3).
10
Soulignons que le terme d’« individu » est à entendre ici en un sens relatif à une échelle
donnée, d’où la réserve des guillemets.
9
composantes de base, ou ensembles de base (ou ensembles sous-jacents, ou
univers) de S ; ⟨U1, ..., Un ⟩ est la base de S ; V1, ..., Vp sont les
composantes structurales de S. 11
Beaucoup de structures mathématiques sont des structures au sens restreint.
Exemples.
(i)
Un ensemble ordonné est un objet de la forme ⟨E ; R⟩, avec E pour ensemble de base
et R ∈ P(E × E) pour composante structurale, et où E et R sont par ailleurs liés par
des relations spécifiques aux ensembles ordonnés. La composante structurale R est
donc un objet de type ⟨1, 1⟩ dans l’échelle E(E).
(ii)
Un groupe est un objet de la forme ⟨G ; e, μ⟩, avec G pour ensemble de base, et e ∈
G et μ ∈ F(G × G, G) pour les composantes structurales, et où G, e et μ sont par
ailleurs liés par des relations spécifiques aux groupes. Les composantes structurales e
et μ sont donc respectivement des objets de types 1 et ⟨1, 1 ; 1⟩ dans l’échelle E(G).
(iii)
Un corps est un objet de la forme ⟨K ; 0, 1, +, ×⟩, avec K pour ensemble de base, et 0
∈ K, 1 ∈ K, + ∈ F(K × K, K), × ∈ F(K × K, K) pour composantes structurales, et où
K, 0, +, et • sont par ailleurs liés par des relations spécifiques aux corps. Les
composantes structurales 0, 1, + et × sont donc respectivement des objets de types 1,
1, ⟨1, 1 ; 1⟩ et ⟨1, 1 ; 1⟩ dans l’échelle E(K).
(iv)
Un espace topologique est un objet de la forme ⟨E ; O⟩, avec E pour ensemble de
base, et O ∈ P(P(E)) pour composante structurale, et où E et O sont par ailleurs liés
par des relations spécifiques aux espaces topologiques. La composante structurale O
est donc un objet de type ⟨⟨1⟩⟩ dans l’échelle E(E).
(v)
Une progression 12 (ou système simplement infini 13 ) est un objet de la forme ⟨N ; 0,
s⟩, avec N pour ensemble de base, et 0 ∈ N et s ∈ F(N, N) pour composantes
structurales, et où N, 0 et s sont par ailleurs liés par des relations spécifiques aux
progressions. Les composantes structurale 0 et s sont donc respectivement des objets
de types 1 et ⟨1 ; 1⟩ dans l’échelle E(K).
11
Il est facile de voir que la définition d’une structure comme multiplet dont un certain
nombre non nul des premières composantes sont des ensembles, dits ensembles de base , et
dont les composantes suivantes, dites composantes structurales, sont éléments d’échelons de
l’échelle construite sur les ensembles de base – cette définition ne déterminerait pas
univoquement la distinction entre ensembles de base et composantes structurales. C’est la
raison pour laquelle j’ai intégré cette distinction dans la notion de structure, en définissant
une structure, non pas comme un multiplet de la forme ⟨U1, ..., Un , V1, ..., Vp⟩, mais
comme un couple de multiplets de la forme ⟨U1, ..., Un ; V1, ..., Vp⟩. Bourbaki, quant à lui,
ne définit la notion de structure que dans le contexte de ce qu’il appelle une « espèce de
structure », et la distinction en question pour une structure est relative à telle ou telle espèce
à laquelle cette structure appartient.
12
Terminologie de Russell
13
Terminologie de Dedekind.
10
(vi)
Une structure amorphe à n ensembles de base, ou un n-ensemble (ou simplement un
ensemble, si n = 1 et qu’aucune confusion n’est à craindre) est un objet de la forme
⟨E1, ..., En ⟩, avec E1, ..., En pour ensembles de base, et sans composantes
structurales.
(vii)
Une ZF2-structure 14 est un objet de la forme ⟨U ; ENS, APP⟩, avec U pour ensemble
de base, et ENS ∈ U et APP ∈ P(U × U) pour composantes structurales. Les
composantes structurale ENS et APP sont donc respectivement des objets de types
⟨1⟩ et ⟨1, 1⟩ dans l’échelle E(U).
II.2.2. Structures au sens général.
Mais, pour des raisons qui tiennent à la façon dont les structures sont
habituellement étudiées, c’est-à-dire non pas individuellement, mais par
espèces, et qui apparaîtront clairement quand nous en viendrons précisément au
concept d’espèce de structure (§ III.2), toutes les structures mathématiques ne
se présentent pas sous la forme retenue dans la définition précédente. Celle-ci
doit être amendée pour couvrir tous les cas.
Appelons structure au sens général un objet, S, de la forme
⟨U1, ..., Un ; V1, ..., Vp⟩,
où U1, ..., Un , avec n > 0, sont des ensembles, et tel que, pour une (au moins)
séquence d’ensembles, ⟨W1, ..., Wm⟩, avec m ≥ 0, V1, ..., Vp, avec p ≥ 0,
soient des éléments d’échelons de l’échelle
E(U1 , ..., Un, W1, ..., Wm).
U1, ..., Un sont les ensembles de base principaux (ou ensembles sous-jacents
principaux, ou etc.) de S ; ⟨U1, ..., Un ⟩ est la base principale de S ; V1, ..., Vp
sont les composantes structurales de S. Quant à W1, ..., Wm, ils ne sont pas
déterminés de façon unique par la structure elle-même, ils ne sont qu’un choix
possible d’ensembles de base auxiliaires (ou ensembles sous-jacents
auxiliaires, ou etc.) pour S ; ⟨W1, ..., Wm⟩ est une base auxiliaire possible
pour S.
Remarquez que la notion de structure ainsi définie est d’une extrême
généralité : tout objet de la forme
⟨U1, ..., Un ; V1, ..., Vp⟩,
14
Terminologie mienne, voir plus loin, § III.2.3.
11
où U1, ..., Un , V1, ..., Vp , avec n > 0 et p ≥ 0, sont des ensembles est une
structure en ce sens, dont ⟨V1, ..., Vp⟩ est une base auxiliaire ! Notez aussi que
si l’on change l’ordre des composantes d’une base auxiliaire, ou que l’on
agrandit certaines d’entre elles, ou encore que l’on ajoute de nouvelles
composantes, on obtient une nouvelle base auxiliaire pour la même structure.
On en déduit facilement qu’il existe toujours une base auxiliaire commune
pour un nombre fini de structures données. Nous verrons par ailleurs qu’il
existe une base auxiliaire commune à toutes les structures d’un même genre, a
fortiori d’une même espèce. Dans le contexte de l’étude d’une espèce de
structure, une base auxiliaire commune sera fixée une fois pour toutes. C’est la
raison pour laquelle elle n’est pas intégrée à la notion de structure au sens
général 15
Les structures au sens restreint apparaissent, rétrospectivement, comme les
structures (au sens général) pour lesquelles on peut choisir la séquence vide
comme base auxiliaire. Par abus de langage, je dirai que ce sont les structures
sans ensembles auxiliaires. Voici un exemple de structure pour laquelle on
peut choisir comme base auxiliaire une séquence à une seule composante. Par
abus de langage, je dirai qu’il s’agit d’une structure avec un ensemble de base
auxilaire.
(viii) Soit K (ou plus exactement ⟨K ; 0, 1, +, ×⟩), un corps commutatif préalablement
donné. Un espace vectoriel sur K (on devrait parler, en toute rigueur , d’« espace
vectoriel sur ⟨K ; 0, 1, +, ×⟩ ») est un objet de la forme ⟨V ; 0, +, •⟩, avec K pour
ensemble de base auxiliaire, V pour ensemble de base principal, 0 ∈ K, + ∈ F(V ×
V, V), et • ∈ F(K × V, V) pour composantes structurales, et où V, 0, +, • sont par
ailleurs liés par des relations (pouvant mobiliser K, 0, 1, + et ×) spécifiques aux
espaces vectoriels sur K. 16 Les composantes structurales 0, + et • sont donc des
objets de types respectifs 1, ⟨1, 1 ; 1⟩, ⟨2, 1 ; 1⟩ dans l’échelle E(V, K). D’une
structure à l’autre de l’espèce considérée, l’ensemble de base principal, V, peut
varier, mais non l’ensemble de base auxiliaire, K, qui est invariable, comme le sont
aussi ses composantes structurales (ou plus exactement, les composantes structurales
de ⟨K ; 0, 1, +, ×⟩, à savoir 0, 1, + et ×).
15
Elle aurait pu l’être, par exemple, en définissant une structure (au sens général) comme
un objet, S, de la forme
⟨⟨U1, ..., Un ⟩, ⟨V1, ..., Vp ⟩, ⟨W1, ..., Wm⟩⟩,
satisfaisant les conditions énoncées dans la définition choisie dans le corps du texte.
16
L’usage des caractères gras « 0 » et « + » est simplement destiné à éviter la confusion
avec les caractères « 0 » et « + », déjà pris pour le corps commutatif K.
12
II.2.3. Remarque.
N’aurions-nous pu éviter la complication qui conduit au structures au sens
général pour en rester aux structures au sens restreint? Prenons un exemple. Au
lieu de définir la notion d’espace vectoriel sur le corps commutatif K comme
nous l’avons fait ci-dessus, nous aurions aussi bien pu définir plutôt la notion
d’espace vectoriel sur un corps commutatif, sans fixer le corps commutatif en
question, en le laissant varier comme un ensemble de base principal. Nous
aurions pu définir un espace vectoriel sur un corps commutatif comme un objet
de la forme ⟨V, K ; 0, 0, 1, +,+, ×, •⟩, avec V et K pour ensembles de base
principaux, et pas d’ensemble de base auxiliaire, et toutes les composantes
vérifiant en fait exactement les même conditions qui font de ⟨V ; 0, +, •⟩ un
espace vectoriel sur le corps commutatif ⟨K ; 0, 1, +, ×⟩. Il reviendrait
manifestement au même de considérer ⟨V, K, 0, 0, 1, +,+, ×, •⟩, espace
vectoriel sur un corps commutatif, ou l’espace vectoriel ⟨V, 0, +, •⟩ sur le
corps commutatif ⟨K, 0, 1, +, ×⟩. C’est que la différence profonde n’est pas
individuelle, elle est spécifique : l’espèce de structure d’espace vectoriel sur un
corps commutatif préalablement fixé et celle d’espace vectoriel sur un corps
commutatif variable, ne sont pas identiques, la première est une sous-espèce
(stricte) de la seconde.
II.3. Extensions canoniques d’applications
Comme je l’ai indiqué plus haut, nous aurons besoin de la notion
d’extension canonique d’applications pour définir la notion d’isomorphisme.
Ce paragraphe II.3 est dans la ligne du paragraphe II.1.
Etant donnés des ensembles E1, E2, E’1, E’2 et une bifonction ⟨f1, f2⟩
appliquant E1 dans E’1, et E’2 dans E’2, on sait ce qu’est l’extension
canonique de ⟨f1, f2⟩ aux produits cartésiens : notant g l’extension en question,
pour tout ⟨x1, x2⟩ ∈ E1 × E2, g(⟨x1, x2⟩) = ⟨f1(x1), f2(x2)⟩) ∈ E’1 × E’2. Si les
fonctions f1, f2 sont injectives (resp. surjectives, bijectives), il en est de même
de g. Tout cela est facilement généralisable au cas d’une multifonction de
degré (non nul) quelconque. Etant donné deux ensembles E, E’ et une
application f de E dans E’, on sait aussi ce qu’est l’extension canonique de f
aux ensembles des parties : notant g l’extension en question, pour tout X ∈
P(E), g(X) = {y⏐(∃x ∈ X)y = f(x)} ∈ P(E’). Si f est injective (resp. surjective,
bijective), il en est de même de g. En combinant les notions ainsi introduites,
on sait donc ce qu’est l’extension canonique d’une multifonction aux ensembles
de parties des produits cartésiens.
La notion d’extension canonique d’une bifonction aux ensembles
d’applications soulève une difficulté que l’on évitera ici en se limitant aux
13
bifonctions bijectives, ou bi-bijections. Soient donc des ensembles E1, E2, E’1,
E’2 et une bi-bijection ⟨f1, f2⟩ appliquant E1 sur E’1, et E’2 sur E’2. On définit
l’extension canonique de ⟨f1, f2⟩ aux ensembles d’applications comme ayant
pour valeur en ϕ ∈ F(E1, E2), la transmuée 17 de ϕ par f1 et f2 : notant g
l’extension en question, g(ϕ) = f2 ° ϕ ° f1-1 ∈ F(E’1, E’2), autrement dit le
diagramme suivant est commutatif :
E1 ⎯ f1→ E’1
⏐
⏐
ϕ
g(ϕ)
↓
↓
E2 ⎯ f2→ E’2
On peut vérifier que l’extension en question est bijective ; que la réciproque de
cette extension est l’extension canonique de la bi-bijection réciproque ⟨f1-1,
f21⟩ aux ensembles d’applications; et que, si une seconde bi-bijection ⟨f’1, f’2⟩
applique E’1 sur E’’1, et E’2 sur E’’2, alors la composée des extensions
canoniques aux ensembles d’applications est l’extension canonique de la bibijection composée ⟨f’1 ° f1, f’2 ° f2⟩ aux ensembles d’applications.
Soient maintenant E(E1 , ..., En) et E(E’1 , ..., E’n) deux échelles
d’ensembles sur le même nombre, n, d’ensembles de base, et une multifonction
bijective, ou multibijection, ⟨f1, ..., fn⟩ appliquant chaque ensemble de base de
la première échelle sur l’ensemble de base de même indice de la seconde.
Soient F et F’ des échelons de même indice, τ, des deux échelles. On définit
par induction sur τ, et l’on note ⟨f1, ..., fn⟩τ, l’extension canonique de ⟨f1, ..., fn⟩
à F et à F’, et l’on montre par le même moyen qu’elle est bijective :
(i)
(ii)
si τ = 1, ..., n, alors ⟨f1, ..., fn⟩τ = f1, ..., fn, respectivement ; ⟨f1, ..., fn⟩τ
est alors évidemment bijective ;
si τ = ⟨τ1, ..., τk⟩, alors ⟨f1, ..., fn⟩τ est l’extension canonique de la
multibijection ⟨⟨f1, ..., fn⟩τ1, ..., ⟨f1, ..., fn⟩τk⟩ aux ensembles des parties
17
Je suis incertain ici sur cette terminologie, que j’utilise de mémoire sans avoir vérifié
qu’elle est attestée.
14
des produits cartésiens; si ⟨f1, ..., fn⟩τ1, ..., ⟨f1, ..., fn⟩τk sont bijectives,
alors ⟨f1, ..., fn⟩τ l’est aussi ;
(iii)
si τ = ⟨τ1, ..., τk ; τk+1⟩, alors ⟨f1, ..., fn⟩τ est l’extension canonique de la
bi-bijection ⟨⟨f1, ..., fn⟩⟨τ1, ..., τk⟩, ⟨f1, ..., fn⟩τk+1⟩ aux ensembles
d’applications ; si ⟨f1, ..., fn⟩⟨τ1, ..., τk⟩ et ⟨f1, ..., fn⟩τk+1 bijectives, alors
⟨f1, ..., fn⟩τ l’est aussi.
On montre facilement que la réciproque de cette extension est l’extension
canonique de la multibijection réciproque ⟨f1-1, ..., fn-1⟩ aux échelons d’indice
τ:
(⟨f1, ..., fn⟩τ)-1 = ⟨f1-1, ..., fn-1⟩τ ;
et que, si une seconde multibijection, ⟨f’1, ..., f’n⟩, applique chaque ensemble
de base de E(E’1 , ..., E’n) sur l’ensemble de base de même indice d’une
troisième échelle, E(E’’1 , ..., E’’n), sur le même nombre, n, d’ensembles, alors
la composée des extensions canoniques aux échelons d’indice τ est l’extension
canonique de la multibijection composée ⟨f’1 ° f1, ..., f’n ° fn⟩ aux échelons
d’indice τ :
⟨f’1 ° f1, ..., f’n ° fn⟩τ = ⟨f’1, ..., f’n⟩τ ° ⟨f1, ..., fn⟩τ.
II.4. Isomorphismes
II.4.1. Isomorphimes de structures au sens restreint
Considérons deux structures S = ⟨U1, ..., Un ; V1, ..., Vp⟩ et S’ = ⟨U’1, ...,
U’n ; V’1, ..., V’p⟩, avec le même nombre, n > 0, d’ensembles de base
principaux, pas d’ensembles auxiliaires, et le même nombre, p ≥ 0, de
composantes structurales. Supposons en outre que les composantes structurales
de même rang dans S et S’ soient de même type [dans les échelles E(U1, ...,
Un) et E(U’1, ..., U’n)] : V1 et V’1 de type τ1, ..., Vp et V’p de type τp. Un
isomorphisme entre S et S’ est, par définition, une multibijection ⟨f1, ..., fn⟩
appliquant chaque ensemble de base de S sur l’ensemble de base de S’ de
même indice et telle que
15
⟨f1, ..., fn⟩τ1(V1) = V’1,
.....................................
⟨f1, ..., fn⟩τp(Vp) = V’p.
S et S’ sont isomorphes si, et seulement si, il existe un isomorphisme de S
sur S’.
II.4.2. Isomorphismes de structures au sens général
Considérons à nouveau deux structures S = ⟨U1, ..., Un ; V1, ..., Vp⟩ et S’ =
⟨U’1, ..., U’n ;V’1, ..., V’p⟩, avec n > 0 et p ≥ 0, et une base auxiliaire
commune, ⟨W1, ..., Wm,⟩, avec m ≥ 0, pour S et S’. Nous supposons à
nouveau que les composantes structurales de même rang dans S et S’ sont de
même type, mais, cette fois, dans les échelles E(U1, ..., Un, W1, ..., Wm) et
E(U’1, ..., U’n, W1, ..., Wm) : V1et V’1 de type τ1, ..., Vp et V’p de type τp.
Un isomorphisme entre S et S’ relativement à la base auxiliaire commune
⟨W1, ..., Wm⟩ est, par définition, une multibijection ⟨f1, ..., fn⟩ appliquant
chaque ensemble de base principal de S sur l’ensemble de base principal de S’
de même rang et telle que
⟨f1, ..., fn, Id1, ..., Idm⟩τ1(V1) = V’1,
.............................................................
⟨f1, ..., fn, Id1, ..., Idm⟩τp(Vp) = V’p,
où Id1, ..., Idm sont les identités (ou diagonales) respectives de W1, ..., Wm. S
et S’ sont isomorphes si, et seulement si, il existe un isomorphisme de S sur
S’.
On montrerait facilement que, si S et S’ sont isomorphes relativement à
une base auxiliaire commune, elles le sont relativement à toute autre base
auxiliaire commune. La relation d’isomorphie est donc une relation intrinsèque
aux structures considérées. Il est évident que cette relation est réflexive,
symétrique et transitive : c’est une relation d’équivalence sur la classe (propre)
des structures. La classe d’équivalence d’une structure pour cette relation est la
classe d’isomorphisme de cette structure (il s’agit encore d’une classe propre).
II.4.3. Sur d’autres usages possibles du mot « structure »
J’ai défini ci-dessus le terme de « structure » de manière à faciliter, le
moment venu, la comparaison entre la théorie des modèles des mathématiciens
plus ou moins consciemment mise en œuvre dans les mathématiques modernes
16
et que j’identifie comme étant la théorie des modèles MT1, et la théorie des
modèles que les logiciens ont développée sous ce nom depuis les années 50,
ou, plus exactement, la version « inclusive » de cette théorie, que je note MT2.
Mais au moins deux autres usages attestés du terme de « structure » méritent
d’être mentionnés.
Le premier est celui de Bourbaki, qui, dans une structure au sens où je l’ai
définie, réserverait le terme de « structure » à la séquence des composantes
structurales. Cet usage est attesté non seulement chez Bourbaki, mais dans la
communauté des mathématiciens, lorsque, empruntant à la langue du maître, ils
disent, par exemple, qu’« un ensemble G est muni d’une structure de groupe
par la donnée d’une loi de composition interne sur G satisfaisant telle et telle
propriétés » : il semble bien que ladite « structure » du groupe G soit alors
identifiée à la loi en question.
Le second usage méritant d’être mentionné fait écho à un usage extramathématique du terme : une « structure » serait ce qui est commun à une
structure (au sens où je l’ai définie) et à toutes celles qui lui sont isomorphes.
Une « structure » en ce sens pourrait être identifiée à une classe
d’isomorphisme (au sens où je l’ai définie).
17
III. Genres et espèces de structure dans les termes de l’ancienne
théorie des modèles
Les théories mathématiques modernes sont essentiellement des théories
d’espèce de structure. Je décrirai la construction d’une théorie d’espèce de
structure, T(Σ), en quatre étapes. Il sera commode de présenter les trois
premières comme les étapes de la construction d’une théorie du genre de
structure, T(Γ). 18 A partir de quoi il sera facile de définir les structures d’un
genre ou d’une espèce donnée et les genres ou espèces de structure dans les
termes de l’ancienne théorie des modèles. 19
III.1. Genres de structure
III.1.1. Construction d’une théorie de genre de structure, première étape :
théorie d’arrière-plan et termes de base auxiliaires
On se donne, pour commencer la construction de T(Γ), une extension de la
théorie des ensembles et m termes, c1, ..., cm (donnés dans cet ordre), du
langage de cette extension, désignant des ensembles. Naturellement, on exige
en plus que ce fait soit attesté dans cette extension, autrement dit, que ⎡ens c1⎤ ,
..., ⎡ens cm⎤ soient des théorèmes de cette extension. Cette extension est la
théorie d’arrière-plan de T(Γ), et c1, ..., cm les termes de base auxiliaires de
T(Γ). Notant W1, ..., Wm les ensembles désignés respectivement par ces termes
(ou, si l’on préfère : abrégeant ces termes par « W1 », ..., « Wm »
respectivement), ⟨W1, ..., Wm⟩ sera choisie comme base auxiliaire commune
pour toutes les structures de genre Γ.
III.1.2. Construction d’une théorie de genre de structure, deuxième étape :
constantes de base principales et axiomes de position
On adjoint à la théorie d’arrière plan de nouvelles constantes, a1, ..., an
(distinctes entre elles et dans cet ordre) et les axiomes :
18
L’introduction de cette notion me semble naturelle, mais Bourbaki n’éprouve pas le
besoin d’y recourir.
19
Les notions de théorie d’espèce de structure, de structure d’espèce donnée, et d’espèce de
structure se trouvent pour l’essentiel chez Bourbaki, op. cit., loc cit., mais non le recours
explicite à ce que j’appelle ici « l’ancienne théorie des modèles » (dans sa version MT1).
18
(M0.1) ens a1,
............................
(M0.n) ens an .
Les constantes a1, ..., an sont les constantes de base principales de T(Γ) ; et les
axiomes (M0.1), ..., (M0.n), les axiomes de position de T(Γ). Notant U1, ..., Un
les ensembles désignés respectivement par ces constantes (ou, si l’on préfère,
supposant que ces constantes sont « U1 », ..., « Un », respectivement), ⟨U1, ...,
Un ⟩ sera la base principale de la structure générique de genre Γ (chaque
structure de genre Γ aura sa propre base principale). 20
III.1.3. Complément sur les échelles d’ensembles
Soient une échelle d’ensembles E(E1, ..., En), et t1, ..., tn des termes
désignant respectivement ses ensembles de base E1, ..., En. On définit par
induction le terme τ(t1, ..., tn) désignant de façon canonique (relativement au
choix des termes t1, ..., tn pour désigner les ensembles de base) l’échelon
d’indice τ de E(E1, ..., En). 21
(iv)
(v)
(vi)
si τ = 1, ..., n, alors τ(t1, ..., tn) = t1, ..., tn, respectivement ;
si τ = ⟨τ1, ..., τk⟩, alors τ(t1, ..., tn) =
⎡P(τ1(t1, ..., tn) × ... × τk(t1, ..., tn))⎤ ;
si τ = ⟨τ1, ..., τk ; τk+1⟩, alors τ(t1, ..., tn) =
⎡F(τ1(t1, ..., tn) × ... × τk(t1, ..., tn), τk+1(t1, ..., tn))⎤.
Exemples
⟨1, 1⟩(« E ») = « P(E × E) » ;
1(« G ») = « G » ;
⟨1, 1 ; 1⟩(« G ») = « F(G × G, G) » ;
⟨⟨1⟩⟩(« E ») = « P(P(E)) » ;
⟨2, 1 ; 1⟩(« V », « K ») = « F(K × V, V) ».
III.1.4. Construction d’une théorie de genre de structure, troisième étape :
constantes structurales et axiomes de typification
20
Rien ne correspond, chez Bourbaki, à ce que j’appelle « axiomes de position », puisque
tout objet, chez lui, est un ensemble. Je passe, ici comme ailleurs, sur les différences
notationnelles ou terminologiques.
21
Par abus de langage, je confondrai une expression avec ses abréviations.
19
On adjoint à nouveau, à la suite des précédentes (§ III.1.2), de nouvelles
constantes, b1, ..., bp (distinctes entre elles et dans cet ordre), et des
axiomes de la forme
(M1.1) b1 ∈ τ1(a1, ..., an, c1, ..., cm),
......................................................................
(M1.p) bp ∈ τp(a1, ..., an, c1, ..., cm).
Les constantes b1, ..., bp sont les constantes structurales de T(Γ) ; et les
axiomes (M1.1), ..., (M1.p), les axiomes de typification 22 de T(Γ). Notant V1,
..., Vp les objets désignés respectivement par ces constantes (ou, si l’on
préfère : supposant que ces constantes sont « V1 », ..., « Vp », respectivement),
ces axiomes expriment de façon canonique que ces objets sont de types
respectifs τ1, ..., τp dans l’échelle E(U1, ..., Un, W1, ..., Wm). Ce seront les
composantes structurales de la structure générique ⟨U1, ..., Un ; V1, ..., Vp⟩ de
genre Γ (chaque structure de genre Γ aura ses propres composantes
structurales.)
III.1.5. Structures d’un genre donné ; genres de structure
Appelons axiomes de T(Γ) propres à Γ les axiomes de position et axiomes
de typification de T(Γ). Une structure de genre Γ est un modèle des axiomes de
T(Γ) propres à Γ. Ici, « modèle » est à prendre au sens de la théorie des
modèles MT1, en traitant les seules constantes a1, ..., an, b1, ..., bp comme des
signes extra-logiques. Pour faire court, je dirai : « modèle » est à prendre au
sens MT1 propre à T(Γ). Une structure de genre Γ est évidemment une
structure au sens du paragraphe II.2.2, et ⟨W1, ..., Wm ⟩ est une base auxiliaire
commune à toutes les structures de ce genre. Les axiomes propres à Γ affirment
que ⟨U1, ..., Un ; V1, ..., Vp⟩ est une structure de genre Γ : c’est la structure
générique de genre Γ. Le genre de structure Γ est la classe (propre) des
structures de genre Γ.
III.2. Espèces de structure
III.2.1. La transportabilité
22
Terminologie ici inspirée de Bourbaki, qui, cependant, ne parlerait pas d’« axiomes »,
mais seulement de « caractérisation typique ».
20
Pour aboutir à la théorie d’espèce de structure T(Σ) que nous avions en
vue, il ne reste plus qu’à franchir une étape supplémentaire, celle qui consiste à
adjoindre à T(Γ) de nouveaux axiomes d’une certaine sorte. De quelle sorte,
exactement? Les mathématiques modernes s’intéressent aux structures, certes,
mais elles ne s’y intéressent que d’un point de vue structural, formel,
indépendamment de la nature des éléments des ensembles de base principaux
de ces structures. L’idée est bien connue et facile à saisir intuitivement, mais,
au delà de quelques considérations heuristiques, on n’explique jamais en quoi
elle consiste exactement. C’est l’un des grands mérites de Bourbaki de l’avoir
fait, en termes de transportabilité. Les nouveaux axiomes devront être
« transportables pour (ou relativement à) T(Γ) ».
Soit A un énoncé du langage de T(Γ), où figurent éventuellement les
constantes a1, ..., an, b1, ..., bp. Abrégeons cet énoncé par « A(U1, ..., Un, V1,
..., Vp) ». Grosso modo, A sera transportable pour (ou relativement) à T(Γ) si,
et seulement si, les axiomes de T(Γ) propres à Γ impliquent que la relation
entre U1, ..., Un, V1, ..., Vp exprimée par A est applicable à toute image ⟨U1, ...,
Un ; V1, ..., Vp⟩ de ⟨U1, ..., Un ; V1, ..., Vp⟩ par multibijection et extensions
canoniques appropriées, salva veritate. L’« implication » en question est la
relation de conséquence au sens MT1 propre à T(Γ). Voici maintenant la
définition précise. A est transportable pour (ou relativement) à T(Γ) si, et
seulement si, les axiomes de T(Γ) propres à Γ impliquent (au sens indiqué et
avec des notation évidentes) l’énoncé suivant :
pour tous U1, ..., Un, et toute multibijection ⟨f1, ..., fn⟩ appliquant U1, ..., Un sur
U1, ..., Un, respectivement, et tous V1, ..., Vp, {[⟨f1, ..., fn, Id1, ..., Idm ⟩τ1(V 1)
= V1 & ... & ⟨f1, ..., fn, Id1, ..., Idm⟩τp(Vp) = Vp] ⇒
[A(U1, ..., Un, V1, ..., Vp) ⇔ A(U1, ..., Un, V1, ..., Vp)]}.
A est démontrablement transportable pour T(Γ) si, et seulement si, sa
transportabilité pour T(Γ) est attestée dans la théorie d’arrière-plan, autrement
dit, si c’est un théorème de la théorie d’arrière-plan. 23
Certains énoncés sont démontrablement transportables, d’autres sont
démontrablement non transportables; pour d’autres enfin, la transportabilité est
indécidable, à moins d’inconsistance. Par exemple, t désignant un ensemble
non vide dans la théorie d’arrière-plan de T(Γ), on prouve facilement, dans la
théorie d’arrière-plan, que l’énoncé ⎡card(a1) = card(t)⎤ est transportable pour
23
Bourbaki ne distingue pas, lui, entre le transportable et le démontrablement transportable.
Pas plus que, par exemple, il ne distingue par ailleurs entre le vrai et le démontrable(ment
vrai). Je le déplore.
21
T(Γ), mais que l’énoncé ⎡a1 = t⎤ ne l’est pas. Supposons que la théorie
d’arrière-plan soit consistante, et soit G un énoncé indécidable de cette théorie.
La transportabilité de l’énoncé ⎡[G & card(a1) = card(t)] ∨ [¬G & a1 = t ]⎤
pour T(Γ) est alors indécidable dans la théorie d’arrière-plan. 24
Notons le critère de transportabilité suivant, en termes d’isomorphisme.
Etant donné deux structures ⟨U1, ..., Un ; V1, ..., Vp⟩ et ⟨U’1, ..., U’n ; V’1, ...,
V’p⟩ de genre Γ, nous savons que ces structures sont isomorphes, par
définition, si, et seulement si, il existe une multibijection ⟨f1, ..., fn⟩ appliquant
U1, ..., Un sur U’1, ..., U’n, respectivement, et telle que
⟨f1, ..., fn, Id1, ..., Idm⟩σ1(V1) = V’1 &
... & ⟨f1, ..., fn , Id1, ..., Idm⟩σp(Vp) = V’p.
Il est donc évident (avec les notations précédentes) que, grosso modo, A est
transportable pour T(Γ) si, et seulement si, sa valeur de vérité dans les
structures de genre Γ est invariante par isomorphisme. Plus précisément, A est
transportable pour T(Γ) si, et seulement si, pour toutes structures ⟨U1, ..., Un ;
V1, ..., Vp⟩ et ⟨U’1, ..., U’n ; V’1, ..., V’p⟩ de genre Γ isomorphes,
A(U1, ..., Un, V1, ..., Vp) ⇔ A(U’1, ..., U’n, V’1, ..., V’p).
Ce critère de transportabilité en termes d’isomorphisme aurait fait une
excellente définition de la notion de transportabilité. 25
24
Abrégeant a1 par « U1 », t par « E », et G par « G », la transportabilité en question se
réduit au fait que, pour toute image U1 de U1 par bijection, [(G & card(U1) = card(E)) ∨
(¬G & U1 = E)] ⇔ [(G & card(U1) = card(E)) ∨ (¬G & U1 = E)]. On démontre alors
facilement qu’elle est (matériellement) équivalente à G dans la théorie d’arrière-plan.
25
La raison pour laquelle Bourbaki ne la choisit pas tient au fait qu’au moment où il
introduit la notion de « transportabilité » (N° 3, « Relations transportables »), la notion
d’« isomorphisme » ne lui est pas encore disponible : elle ne sera introduite que deux
numéros plus loin (N° 5, « Isomorphismes et transport de structure »). Le paragraphe
intermédiaire aura été consacré la notion d’« espèce de structure » (N° 4, « Espèces de
structure »). Cet ordre d’exposition est plutôt malheureux, qui pousse Bourbaki à définir la
notion d’ d’« isomorphisme » comme relative à une « espèce de structure », ce qui
reviendrait, dans ma présentation, à relativiser indûment la notion d’isomorphisme à une
théorie d’espèce de structure, quand la théorie du genre de structure correspondant suffisait.
Cette façon de faire correspond à une façon de parler courante, où l’on parle
d’« isomorphismes d’ensembles ordonnés », d’« isomorphismes de groupes », etc. Sans
doute le fait qu’à de rares exceptions près, les espèces structures, et non les genres qui leur
correspondent, ont reçu un nom (simple ou composé) explique-t-il pour une part ce
regrettable état de choses.
22
III.2.2. Quatrième étape pour la construction d’une théorie d’espèce de
structure : axiomes de spécification ; structures d’espèce donnée ; espèces de
structure
Attribuons à T(Σ) tout ce que nous avons attribué à T(Γ)) : théorie d’arrière
plan, termes de base auxiliaires, constantes de base principales, axiomes de
position, constantes structurales, axiomes de typification, structure générique.
La théorie T(Σ) s’obtient à partir de T(Γ) par l’adjonction de nouveaux axiomes
démontrablement transportables pour T(Γ), en nombre fini ou infini. 26 Ce sont
les axiomes de spécification 27 de T(Σ) : (M2.1), (M2.2), (M2.3), ...
Une structure d’espèce Σ est une structure de genre Γ qui est modèle, au
sens MT1 propre à T(Γ), des axiomes de spécification de T(Σ). Autrement dit,
appelant axiomes de T(Σ) propres à Σ les axiomes de T(Γ) propres à Γ plus les
axiomes de spécification de T(Σ), une structure d’espèce Σ est un modèle, au
sens indiqué, des axiomes de T(Σ) propres à Σ. Ce qui vaut pour toute structure
de genre Γ vaut a fortiori de toute structure d’espèce Σ : que c’est bien un
structure au sens du paragraphe II.2.2, et que ⟨W1, ..., Wm⟩ est une base
auxiliaire commune à toutes les structures de cette espèce. Les axiomes propres
à Σ affirment que ⟨U1, ..., Un, V1, ..., Vp⟩ est une structure d’espèce Σ : c’est la
structure générique d’espèce Σ. L’espèce de structure Σ est la classe (propre)
des structures d’espèce Σ.
Le spécialiste de la théorie T(Σ) cherche à découvrir les propriétés de la
structure générique d’espèce Σ - ou, ce qui revient au même, les propriétés
communes à toutes les structures d’espèce Σ - qui sont exprimables dans le
langage de T(Σ), transportables pour T(Γ), et, si possible, intéressantes.
Autrement dit, il cherche à tirer les conséquences, au sens MT1 propre à T(Γ),
parées de ces vertus 28 , des axiomes de T(Σ) propres à Σ. Naturellement, il le
26
Naturellement, si ces axiomes sont en nombre infini, leur ensemble doit être « effectif ».
Bourbaki s’en tient au cas d’un nombre fini. Il y a à cela une raison profonde, à savoir que la
prise en considération du cas infini ne s’impose de façon naturelle que du point de vue de la
théorie des modèles MT2. On m’objectera peut-être que Bourbaki savait bien que certaines
théories mathématiques ont un nombre infini d’axiomes, par exemple la théorie des
ensembles dans le cadre de laquelle il avait choisi de travailler. A cela je réponds qu’on
confond ici la théorie des ensembles en question, qui n’a pas de constante de base principale,
et n’est donc pas une théorie d’espèce de structure, avec la théorie de l’espèce de structure
d’ensemble, qui n’a pas une infinité d’axiomes de spécification, mais, au contraire, n’en a
aucun, voir paragraphe III.2.3.
27
C’est à eux, curieusement, que Bourbaki réserverait le titre d’axiomes (« axiomes de
l’espèce de structure Σ »)
28
Les axiomes de T(Σ) propres à Σ sont tous (démontrablement) transportables pour T(Γ),
mais les conséquences (au sens déjà indiqué), dans le langage de T(Σ), de ces axiomes ne
23
fait en utilisant la machinerie déductive disponible dans la théorie d’arrièreplan. S’il ne se met pratiquement jamais en peine de prouver la transportabilité
pour T(Γ) des théorèmes qu’il a démontrés, ce n’est pas que le concept lui
fasse défaut, même s’il lui fait défaut en effet, c’est, plus profondément, que le
caractère structural, formel, indépendant de la nature des éléments de la base
principale de la structure générique de T(Σ), est la plupart du temps quelque
chose d’assez clair, qui n’appelle pas de démonstration.
III.2.3. Exemples de théories d’espèce de structure
Pour chacun de ces exemples, les axiomes de position (« ens E » pour (i),
« ens G » pour (ii), etc.) sont redondants par rapport à n’importe lequel des
axiomes de typification. Ce pourquoi je les ai à chaque fois éliminés de la liste
des axiomes propres, sauf dans l’exemple (vi), où il n’y a pas d’axiomes de
typification. On pourrait vérifier, à chaque fois, que les axiomes de
spécification sont bien des énoncés transportables pour la théorie de genre de
structure correspondante.
(i)
Théorie de l’espèce de structure d’ensemble ordonné (alias théorie des ensembles
ordonnés) : la théorie d’arrière-plan est la théorie des ensembles ; pas de termes de
base auxiliaires (m = 0) ; une seule constante de base principale (n = 1), « E »; une
seule constante structurale (p = 1), « R »; les axiomes propres sont les suivants (en
écrivant « ... R --- » pour « ⟨..., ---⟩ ∈ R ») :
(M1.1)
(M2.1)
(M2.2)
(M2.3)
(ii)
R ∈ P(E × E),
R est réflexive sur E, i.e., (∀x ∈ E)x R x ;
R est antisymétrique sur E, i.e., (∀x ∈ E)(∀y ∈ E)
[(x R y & y R x ) ⇒ x = y] ;
R est transitive sur E, i.e., (∀x ∈ E)(∀y ∈ E)(∀z ∈ E)
[(x R y & y R x ) ⇒ x R z].
Théorie de l’espèce de structure de groupe (alias théorie des groupes) : la théorie
d’arrière-plan est la théorie des ensembles ; pas de termes de base auxiliaires (m =
0) ; une seule constante de base principale (n = 1), « G »; deux constantes
structurales (p = 2), « e », « μ »; les axiomes propres sont les suivants (en écrivant
« ... μ --- » pour « μ(..., ---) ») :
sont pas toutes transportables (ni, a fortiori, démontrablement transportables – soit dit en
supposant consistante la théorie d’arrière plan) pour T(Γ). Soient, par exemple, T(Σ) la
théorie de l’espèce de structure de groupe (alias théorie des groupes) et A = ⎡B ∨ C⎤, où B
est n’importe quel théorème de cette théorie, et C, l’énoncé « ⟨G ; e, μ⟩ = ⟨N ; 0, +⟩ », où N,
0 et + sont l’ensemble des entiers naturels, zéro et l’addition des entiers naturels, définis
comme on voudra dans le langage de la théorie d’arrière-plan. A est, comme B, conséquence
(au sens indiqué) des axiomes de T(Σ) propres à Σ, mais n’est pas transportable pour T(Γ) :
A est vrai de ⟨N, 0, +⟩, à cause de C, mais fausse de toute autre structure isomorphe à ⟨N ; 0,
+⟩.
24
(M1.1)
(M1.2)
(M2.1)
(M2.2)
(M2.3)
(iii)
e ∈ G,
μ ∈ F(G × G, G),
μ est associative, i.e., (∀x ∈ G)(∀y ∈ G)(∀z ∈ G)
[(x μ y) μ z = (x μ (y μ z)] ;
e est neutre pour μ, i.e., (∀x ∈ G)(x μ e = e μ x = x) ;
tout élément de G admet un symétrique pour μ par rapport à e, i.e.,
(∀x ∈ G)(∃y ∈ G)(x μ y = y μ x = e). 29
Théorie de l’espèce de structure de corps commutatif (alias théorie des corps
commutatifs) : la théorie d’arrière-plan est la théorie des ensembles ; pas de termes
de base auxiliaires (m = 0) ; une seule constante de base principale (n = 1), « K »;
quatre constantes structurales (p = 4), « 0 », « 1 », « + », « × » ; les axiomes propres
sont les suivants (avec convention d’écriture analogue à celle de l’exemple (ii), et en
faisant l’impasse sur des simplifications possibles évidentes des axiomes) :
(M1.1)
(M1.2)
(M1.3)
(M1.4)
(M2.1)
(M2.2)
(M2.3)
(M2.4)
(M2.5)
0 ∈ K,
1 ∈ K,
+ ∈ F(K × K, K),
× ∈ F(K × K, K),
+ est associative [analogue à (M2.1) de (ii)] ;
0 est neutre pour + [analogue à (M2.2) de (ii)] ;
tout élément de G admet un symétrique pour + par rapport à 0
[analogue à (M2.3) de (ii)] ;
+ est commutative, i.e., (∀x ∈ K)(∀y ∈ K)( x + y = y + x) ;
× est associative [analogue à (M2.1) de (ii)] ;
29
C’est sur l’exemple de cette théorie (présentée sous une forme légèrement différente) que
Bourbaki introduit la notion de « modèle » dès le début des Eléments : « [D]ans la théorie
des groupes T, les axiomes [...] contiennent deux constantes G et μ [...]. Dans la théorie des
ensembles T’, on définit deux termes : la droite numérique et l’addition des nombres réels.
Si on substitue ces termes respectivement à G et μ dans les axiomes [...] de T, on obtient des
théorèmes de T’. [...] On peut donc « appliquer à l’addition des nombres réels les résultats de
la théorie des groupes ». On dit qu’on a construit pour la théorie des groupes un modèle dans
la théorie des ensembles » (livre I, chap. 1, § 2, N° 4 ; l’exemple est pris par anticipation, car
la théorie des groupes ne sera définie, dans la première édition, qu’au livre II, chap. I, § 6,
N° 1). Bourbaki parle ici de « termes », mais on peut aussi bien l’interpréter comme si,
confondant une fois de plus usage et mention (voir plus haut note 6), il parlait d’objets. La
notion ainsi introduite serait alors la notion de modèle au sens MT1 avec les constantes
« G » et « μ » pour seuls signes traités comme extra-logiques. A ma connaissance,
curieusement, le terme de « modèle » n’est plus utilisé par la suite, il s’agirait donc d’un
hapax dans le corpus des Eléments.
C’est le moment de signaler la façon dont Bourbaki définit par ailleurs le caractère
« contradictoire » des axiomes définissant une espèce de structure, à savoir par le fait qu’il
n’existe pas de structure de cette espèce, le mot « structure » pouvant être entendu ici
indifféremment au sens de Bourbaki ou en mon sens (voir Bourbaki, Livre I, Fascicule de
résultats, § 8, N° 6, et dans le présent article, § II.4.3). La notion ainsi introduite est la
notion de contradiction au sens MT1 avec les constantes de base et constantes structurales
traitées comme seuls signes extra-logiques.
25
(M2.6)
(M2.7)
(M2.8)
(M2.9)
(iv)
Théorie de l’espèce de structure d’espace topologique (alias théorie des espaces
topologiques) : la théorie d’arrière-plan est la théorie des ensembles ; pas de termes
de base auxiliaires (m = 0) ; une seule constante de base principale (n = 1), « E »; une
seule constante structurale (p = 1), « O »; les axiomes propres sont les suivants :
(M1.1)
(M2.1)
(M2.2)
(M2.3)
(v)
O ∈ P(P(O)) [les éléments de O sont appelés « ouverts » de E]
E est un ouvert, i.e., E ∈ O ;
Toute union d’ouverts est un ouvert, i.e.,
(∀x ∈ P(P(E))(x ⊆ O ⇒ ∪x ∈ O) ;
L’intersection de deux ouverts est un ouvert, i.e.,
(∀x ∈ P(E))(∀y ∈ P(E))(x ∩ y ∈ O).
Théorie de l’espèce de structure de progression (ou de système simplement infini)
[alias théorie des progressions (ou des systèmes simplement infinis)] 30 : la théorie
d’arrière-plan est la théorie des ensembles ; pas de terme de base auxiliaire (m = 0) ;
une seule constante de base principale (n = 1), « N » ; deux constantes structurales (p
= 2), « 0 » et « s » ; les axiomes propres sont les suivants :
(M1.1)
(M1.2)
(M2.1)
(M2.2)
(M2.3)
(vi)
1 est neutre pour × [analogue à (M2.2) de (ii)] ;
tout élément non nul de K admet un symétrique pour × par rapport à 1,
i.e., (∀x ∈ K)[x ≠ 0 ⇒ (∃y ∈ K)(x × y = y × x = 1)] ;
× est distributive par rapport à +, i.e., (∀x ∈ K)(∀y ∈ K)(∀z ∈ K)
[ x × (y + z) = (x × y) + (x × z) & (x + y) × z = (x × z) + (z × z)] ;
× est commutative [analogue à (M2.4) ci-dessus].
0∈N;
S ∈ F(N, N) ;
(∀x ∈ N)(∀y ∈ N)(x ≠y ⇒ S(x) ≠ S(y)) ;
(∀x ∈ N)0 ≠ S(x) ;
(∀y ∈ P(N)){[0 ∈y & (∀x ∈ N)(x ∈ y ⇒ S(x) ∈ y)] ⇒ N ⊆ y}.
Théorie de l’espèce de structure de n-ensemble (alias théorie des n-ensembles, et, si
n = 1 et par abus de langage, théorie des ensembles) 31 : la théorie d’arrière plan est la
théorie des ensembles (proprement dite) ; pas de termes de base auxiliaires (m = 0) ;
n constantes de base principales, « E1 », ..., « En » ; pas de constantes structurales (p
= 0) et donc pas d’axiomes de typification ; pas d’axiomes de spécification non plus ;
les axiomes propres se réduisent donc aux seuls axiomes de position, pour une fois
non redondants :
(M0.1)
ens E1,
...........................
(M0.n)
ens En.
30
Il se trouve que l’exemple n’est pas de Bourbaki, mais il n’y a rien de caché derrière cette
absence, voir plus bas § III.3.1.
31
La théorie de l’espèce de structure de 1-ensemble est la théorie de la structure générique
⟨E1⟩, ou, si l’on préfère, des structures de la forme ⟨E⟩, où E est un ensemble, ce n’est donc
pas, en toute rigueur, la théorie des ensembles proprement dite.
26
(vii)
Théorie de l’espèce de structure de ZF2-structure (ou théorie des ZF2-structures) 32 :
la théorie d’arrière-plan est la théorie des ensembles (proprement dite, ZF), pas de
terme de base auxiliaire (m = 0), une seule constante de base principale, « U » (n = 1)
; deux constantes structurales, « ENS » et « APP » (p = 2) ; les axiomes propres sont
donnés ci-dessous. Comme d’habitude, j’ai éliminé l’axiome de position, ici « ens
U », redondant par rapport à n’importe lequel des axiomes de typification. Dans les
axiomes de spécification, par abus de langage, j’ai partout écrit « ENS ... » pour « ...
∈ ENS », et « ... APP --- » pour « ⟨..., ---⟩ ∈ APP »). Dans (M2.6), « z INC x »
abrège « (∀t ∈ U)(t APP z ⇒ t APP x) » ; dans (M2.7), « VID » abrège « (ιz ∈
U)(∀t ∈ U)(¬t APP z) », et « SIN(x) » abrège « (ιz ∈ U)(∀t ∈ U)(t APP z ⇔ t =
x) ».
(M1.1)
(M1.2)
(M2.1)
(M2.2)
(M2.3)
(M2.4)
ENS ∈ P(U),
APP ∈ P(U × U),
(∀x ∈ U)(∀y ∈ U)(x APP y ⇒ ENS y),
(∀x ∈ U)(∀y ∈ U)
{(ENS x & ENS y) ⇒ [(∀z ∈ U)(z APP x ⇔ z APP y) ⇒ x = y]},
(∀u ∈ F(U, U))(∀x ∈ U){ENS x ⇒ (∃y ∈ U)[ENS y &
(∀t ∈ U)(t APP y ⇔ (∃z ∈ U)(z APP x &t = u(x)))]},
(∀x ∈ U){[ENS x & (∀y ∈ U)(y APP x ⇒ ENS y)] ⇒
(∃z ∈ U)[ENS z & (∀t ∈ U)(t APP z ⇔ (∃z ∈ U)(t APP u APP x))]},
32
L’exemple en question n’est pas de Bourbaki, qui y aurait vu la marque d’un logicien
tourmenté et peut-être malade, plutôt que celle d’un fier et noble mathématicien. Il s’agit
d’une théorie d’espèce de structure qui a un certain rapport à la théorie des ensembles, non
pas dans la version élémentaire (i.e., du premier ordre), ZF, que j’adopte comme cadre de
travail officiel dans cet article, mais dans une version du second ordre, ZF2, avec des
variables de fonctions appliquant la classe (propre) des objets dans elle-même, et un nombre
fini d’axiomes. ZF2 n’entre pas dans le cadre de ZF, mais la théorie d’espèce de structure
que je m’apprête à présenter, elle, y entrera comme les autres. Je retiens les axiomes de ZF2
sous la forme suivante, en réservant les variables minuscules « x », « y », « z », etc. au
premier ordre (variables d’objets)32, et les variables majuscules « F», « G », « H », etc. au
second ordre (variables de fonctions du type indiqué ci-dessus) :
(Ind)
(Ext)
(Repl)
(Union)
(Power)
(Inf)
∀x∀y (x ∈ y ⇒ ens y),
∀x∀y {(ens x & ens y) ⇒ [∀z (z ∈ x ⇔ z ∈ y) ⇒ x = y]},
∀F∀x{ens x ⇒ ∃y[ens y & ∀t(t ∈ y ⇔ ∃z (z ∈ x & t = Fz))]},
∀x{[ens x & ∀y(y ∈ x ⇒ ens y)] ⇒ ∃z[ens z & ∀t(t ∈ z ⇔ ∃u(t ∈ u ∈ x))]},
∀x{ens x ⇒ ∃y[ens y & ∀z (z ∈ y ⇔ z ⊆ x)],
∃x[ens x & ∅ ∈ x & ∀y(y ∈ x ⇒ {y} ∈ x)].
J’adopte pour mon exemple une terminologie et des notations qui valent ce qu’elles valent.
L’idée est de construire une théorie d’espèce de structure dont la structure générique, ⟨U,
ENS, APP⟩, avec ENS ∈ P(U), APP ∈ P(U × U), représente, à la façon d’une miniature,
d’un modèle réduit, la « Grande Structure », pour ainsi dire [qui n’est pas une (« petite »)
structure, voir § II.2], décrite partiellement par les axiomes de ZF2 et constituée par la classe
(propre) de objets, celle des ensembles, et celle des couples d’objets tels que le premier
appartient au second.
27
(M2.5)
(M2.6)
(∀x ∈ U){ENS x ⇒
(∃y ∈ U)[ENS y & (∀z ∈ U)(z APP y ⇔ z INC x)]},
(∃x ∈ U)[ENS x & VID APP x & (∀y ∈ U)(y APP x ⇒ SIN(x) APP
y)].
(viii) Théorie de l’espèce de structure d’espace vectoriel sur un corps commutatif K (alias
théorie des espaces vectoriels sur un corps commutatif K) : la théorie d’arrière plan
est la théorie des corps commutatifs, voir plus haut (c’est par abus de langage qu’on
parle du « corps commutatif K » au lieu du « corps commutatif ⟨K, 0, 1, +, ×⟩ ») ; un
seul terme de base auxiliaire (m = 1), « K »; une seule constante de base principale
(n = 1), « V »; trois constantes structurales (p = 3), « 0 », « + », « • »; les axiomes
propres sont les suivants :
(M1.1)
(M1.2)
(M1.3)
(M2.1)
(M2.2)
(M2.3)
(M2.4)
(M2.5)
0 ∈ V,
+ ∈ F(V × V, V),
• ∈ F(K × V, V),
+ est associative [analogue à (M2.1) de (ii)] ;
0 est neutre pour + [analogue à (M2.2) de (ii)] ;
tout élément de V admet un symétrique pour + par rapport à 0
[analogue à (M2.3) de (ii)] ;
+ est commutative [analogue à (M2.4) de (iii)] ;
(∀x ∈ K)(∀y ∈ K)(∀z ∈ V)(∀t ∈ V)
[ x • (z + t) = (x • z ) + (x • t) & (x + y) • z = (x • z) + (y • z)].
III.3 La reconstruction des mathématiques traditionnelles
III.3.1. La reconstruction axiomatique moderne des théories mathématiques
traditionnelles comme théories d’espèce de structure catégorique
La reconstruction suivante, due à Bourbaki, est d’ambition limitée : elle ne
respecte pas le caractère « matériel », « contentuel », « concret », voire
« intuitif » des théories axiomatiques traditionnelles, comme, par exemple,
l’arithmétique de Peano 33 , par opposition au caractère « abstrait », « formel »,
voire « aveugle », des théories proprement modernes, comme, par exemple, la
théorie des groupes. Plutôt, reconsidérant les théories traditionnelles d’un point
de vue moderne, et plus précisément comme théories d’espèce de structure
(l’arithmétique de Peano devenant la théorie des progressions), elle consiste
simplement à dire ce qui les distingue des théories d’espèce de structure
proprement modernes, comme la théorie des groupes.
Disons qu’une théorie d’espèce de structure Σ, ou que l’espèce de structure Σ
elle-même, est catégorique, ou univalente (c’est le terme de Bourbaki), si
toutes les structures d’espèce Σ , i.e. tous les modèles au sens MT1 approprié
33
Je pense à l’arithmétique du Peano historique (Arithmetices principia..., 1889), que
j’interprète comme une théorie axiomatique traditionnelle.
28
pour la théorie considérée, sont isomorphes ; non-catégorique, ou multivalente,
dans le cas contraire. Le trait distinctif des théories traditionnelles est leur
catégoricité. Bourbaki mérite ici d’être longuement cité 34 :
Il peut se faire que deux structures quelconques d’espèce Σ soient nécessairement
isomorphes ; on dit alors que l’espèce de structure est univalente 35 . Il en est ainsi de
la structure de groupe monogène infini (isomorphe à Z), de celle de corps premier de
caractéristique 0 (isomorphe à Q), de la structure de corps ordonné, archimédien 36 et
complet (isomorphe à R), de la structure de corps connexe, localement compact,
commutatif et algébriquement clos (isomorphe à C), enfin de la structure de corps
connexe, localement compact et non commutatif (isomorphe au corps des
quaternions K 37 ). [...] On observera que les espèces de structures précédentes sont
essentiellement celles qui sont à la base de la Mathématique classique 38 . Par contre,
l’espèce de structure de groupe, l’espèce de structure d’ensemble ordonné, l’espèce
de structure topologique, ne sont pas univalentes. (op. cit., § 5, in fine).
Voir aussi, déjà (il s’agit de la première publication de Bourbaki), le Fascicule
de résultats du livre I :
La théorie des nombres entiers, celle des nombres réels, la géométrie euclidienne
classique, sont des théories univalentes ; la théorie des ensembles ordonnés, la
théorie des groupes, la topologie, sont des théories multivalentes. L’étude des
théories multivalentes est le trait le plus frappant qui distingue la mathématique
moderne de la mathématique classique. (§ 8, N° 7).
(Au total, le seul exemple paradigmatique de théorie traditionnelle qui manque
à l’appel chez Bourbaki est le seul à être présent parmi les exemples donnés
plus haut en III.2.3, à savoir l’arithmétique de Peano, ou, plus exactement, la
théorie des progressions.)
III.3.2. Sur la méthode usuelle de reconstruction non axiomatique des théories
mathématiques traditionnelles : un (premier) théorème de coopération
En pratique, et cela vaut chez Bourbaki lui-même, ce n’est pas sur le mode
axiomatique suggéré ci-dessus que l’on reconstruit les mathématiques
traditionnelles. Par exemple, s’agissant de la théorie des nombres entiers
devenue théorie des progressions, on se contente de construire une progression
dans la théorie des ensembles, comme Zermelo et Neumann l’ont fait, chacun à
34
Qu’on prenne les mot « structure », et « espèce de structure » au sens de Bourbaki ou au
sens du présent article ne change rien au fond.
35
36
La précision, maintenue d’édition en édition, est inutile, puisque tout corps ordonné
complet est archimédien.
37
Noté H à partir de la deuxième édition.
38
Bourbaki parle de « Mathématique classique », je préfère parler de « mathématiques
traditionnelles ».
29
sa manière, et l’on étudie cette progression. De même, s’agissant de la théorie
des nombres réels, devenue théorie des corps ordonnés complets, on se
contente de construire un corps ordonné complet dans la théorie des ensembles,
comme l’ont fait Dedekind, Cantor et d’autres, chacun à sa manière, et l’on
étudie ce corps ordonné complet. Comment se fait-il qu’indépendamment de la
progression particulière ou du corps ordonné complet particulier, par exemple,
qu’ils ont choisi de construire, les uns et les autres puissent collaborer
harmonieusement au développement de la théorie considérée ? La réponse est
évidemment que chacun ne retient que les propriétés structurales, formelles,
indépendantes de la nature des éléments de l’ensemble de base de la structure
qu’il a choisie. Bourbaki ne s’arrête pas à ce petit problème méthodologique,
mais nous avons maintenant les moyens de le résoudre rigoureusement, en
démontrant le « théorème de coopération » suivant (notations habituelles).
Soient T(Σ) une théorie d’espèce de structure catégorique, S une structure
d’espèce Σ, et A un énoncé de T(Σ) transportable pour T(Γ). Les affirmations
suivantes sont (matériellement) équivalentes :
(i)
(ii)
A est vrai de S ;
A est conséquence, au sens MT1 propre à T(Γ), des axiomes de T(Σ)
propres à Σ.
Corollairement, soient T(Σ) une théorie d’espèce de structure dont la
catégoricité soit démontrable dans la théorie d’arrière-plan; A(a1, ..., an, b1, ...,
bp), un énoncé de T(Σ) démontrablement transportable pour T(Γ) ; t1, ..., tn,
tn+1, ..., tn+p des termes désignant, démontrablement et dans cet ordre, dans
la théorie d’arrière plan les composantes d’une structure d’espèce Σ. Dans ces
conditions, les affirmations suivantes sont (matériellement) équivalentes :
(i)
(ii)
A(t1, ..., tn, tn+1, ..., tn+p) est démontrable dans la théorie d’arrièreplan ;
A(a1, ..., an, b1, ..., bp) est démontrable dans T(Σ).
III.3.3. Excursus. Une autre morale pour la fable d’Ernie et de Johnny
Dans son article classique, « What the numbers could not be », paru en 1965,
Paul Benacerraf met en scène deux jeunes enfants, Ernie et Johnny, qui ont
appris l’arithmétique, non comme une discipline particulière, mais comme un
simple chapitre de théorie des ensembles. Pour Ernie, on a défini les nombres
entiers à la Neumann : 0 =df ∅, 1 =df {0}, 2 =df {0, 1}, ..., n + 1 =df {0, 1, 2,
..., n}, ... ; et, pour Johnny, on les a définis à la Zermelo : 0 =df ∅, 1 =df {0}, 2
=df {1}, ..., n + 1 =df {n}, ... Et chacun a pris la définition au pied de la lettre,
30
comme disant ce que sont les nombres entiers : ceci, ou cela, et rien d’autre.
Tout se passe pour le mieux, jusqu’au jour où, confrontant leurs vues en
matière d’arithmétique, ils s’aperçoivent avec stupeur qu’ils ne sont pas
d’accord sur tout, par exemple, sur la question de savoir si, oui ou non, 3 ∈ 17 :
pour Johnny c’est oui, pour Ernie c’est non. Ils découvrent bientôt l’origine du
désaccord : on ne leur a pas défini les nombres entiers de la même manière.
L’une au moins des deux définitions, pensent-ils, doit être erronée.
Benacerraf règle le conflit à sa façon : aucune des deux définitions, ni
aucune autre du même genre, n’a de titre à faire valoir pour l’emporter sur ses
rivales dans leur prétention commune à dire ce que sont les nombres entiers
« eux-mêmes ». En réalité, les nombres entiers ne sont pas des ensembles, ni,
plus généralement, des objets, bien définis, ils ne sont rien - rien au délà de la
place qu’ils tiennent, du rôle qu’il jouent, de l’office qu’ils remplissent, etc.,
dans la progression au sein de laquelle ils apparaissent. Les pauvres enfants,
victimes des « logicistes militants » qu’ils ont eu pour précepteurs (en fait,
chacun son propre père !), se sont disputés pour rien. Avec la philosophie
structuraliste de l’arithmétique, ils (tueront le père et) retrouveront la paix.
Je tirerai une autre leçon de cette fable, philosophiquement moins
compromettante, de caractère simplement méthodologique. Quoi qu’il en soit
du statut ontologique des nombres entiers, de ce qu’ils peuvent ou ne peuvent
pas être, il suffirait d’expliquer à nos deux innocents que, sous couvert de
« définition », on a leur a seulement donné à chacun un exemple de
progression. On a emprunté ces exemples à Zermelo et à Neumann, qui
n’avaient certainement pas d’autre ambition, au titre de « définition des
nombres entiers », que de donner, en effet, des exemples de progression.
Soyons plus précis. A Ernie, on a proposé le progression de Neumann,
notons-la ⟨NN, 0N, SN⟩, avec
NN =df le plus petit ensemble y tel que ON ∈ y & ∀x(x ∈ y ⇒ x ∪ {x} ∈ y) ;
0N =df ∅ ;
SN =df (le graphe de) la fonction x |→ {x} de NN dans NN;
et à Johnny, on a proposé la progression de Zermelo, notons-la ⟨NZ, 0Z, SZ⟩,
avec
NZ =df le plus petit ensemble y tel que 0Z ∈ y & ∀x(x ∈ y ⇒ {x} ∈ y) ;
0Z =df ∅ ;
SZ =df (le graphe de) la fonction x |→ x ∪ {x} de NZ dans NZ.
31
Ernie et Johnny se sont disputés sur la question de savoir si 3 ∈ 17. La question
était ambiguë. Pour Ernie, elle était de savoir si 3N ∈ 17N (et c’était oui) ; pour
Johnny, elle était de savoir si 3Z ∈ 17Z (et c’était non).
En bonne méthodologie - et c’est cela qu’il faut d’abord leur expliquer -, si
Ernie et Johnny veulent collaborer harmonieusement en arithmétique, au sens
moderne de la théorie des progressions, sans renoncer à leur modèle préféré, il
faut et il suffit qu’ils s’en tiennent aux énoncés A[NN, 0N, SN] et A[NZ, 0Z, SZ]
tels que A[N, 0, S] soit un énoncé de la théorie des progressions transportable
pour la théorie de genre de structure correspondante. A cette condition, et à
cette condition seulement, Ernie et Johnny pourront « identifier » l’un à l’autre
leurs modèles préférés et les « identifier » tous les deux au modèle générique.
Or aucun des énoncés en cause , « 3N ∈ 17N » et « 3Z ∈ 17Z », ne remplit cette
condition ! Il est bien vrai que 3N ∈ 17N et 3Z ∉ 17Z, mais pour leur
collaboration, Ernie et Johnny doivent tenir ces vérités pour des vérités qui ne
comptent pas.
Tout cela étant dit, libre à eux, par ailleurs, de reposer la question « Qu’estce qu’un nombre entier ? » (et, corrélativement, de se redemander si, oui ou
non, 3 ∈ 17) ; ou, au contraire, de mettre en question cette question elle-même
(et les questions corrélatives) et, en un certain sens, de les « déposer », comme
le fait Benacerraf dans son article, et d’épouser avec lui la philosophie
structuraliste de l’arithmétique.
32
IV. Genres et espèces de structure dans les termes de la nouvelle
théorie des modèles
La première chose à dire est que la nouvelle théorie des modèles en
question, celle des logiciens, qui remonte au moins aux années dix du siècle
dernier et a fait florès à partir des années cinquante, n’a pas sa place, en fait,
chez Bourbaki, qui l’« ignore » purement et simplement. Il y a pourtant une
place qui revient de droit à cette théorie dans l’architecture des mathématiques,
et je dirai laquelle.
L’analyse bourbachique des théories mathématiques modernes comme
théories d’espèce de structure est remarquable, en particulier par la mise en
valeur et l’explication du caractère formel, structural, de leurs axiomes de
spécification en termes de transportabilité. Mais cette analyse peut être poussée
plus loin, donnant ainsi naissance à l’ainsi nommée « théorie des modèles », ou
plus exactement à la version inclusive de cette théorie, notée ici MT2. Je ne
prétend pas ici raconter l’histoire de la naissance de MT2, je propose seulement
une reconstruction rationnelle de cette histoire.
IV.1. Un nouveau langage pour les axiomes de spécification
IV.1.1. Que les axiomes de spécification peuvent en général s’exprimer plus
simplement dans un certain autre langage que celui d’une extension de la
théorie des ensembles
La remarque qui donne naissance à la théorie des modèles MT2 est la
suivante. Soit T(Σ) la théorie d’une espèce de structure, et M le langage de cette
théorie. La remarque porte sur les axiomes de spécification, (M2.1), (M2.2), ...
de T(Σ), et vaut pratiquement pour toutes les espèces de structure auxquelles
s’intéressent les mathématiciens. Non seulement ces axiomes sont
transportables pour la théorie de genre de structure T(Γ) correspondant à T(Σ),
mais ils ont la propriété supplémentaire remarquable d’exprimer des
propositions qui peuvent l’être dans un certain autre langage, L. Autrement dit,
pour une certaine fonction * de traduction de L dans M, ces axiomes de
spécification sont de la forme (Λ1)*, (Λ2)*,... pour certains énoncés (Λ1),
(Λ2),... de L. Ou, s’ils ne sont pas exactement de cette forme, du moins sont-ils
manifestement équivalents (au sens MT1 propre à T(Γ)) à des énoncés qui le
sont.
Je décrirai d’abord le langage L dont il s’agit, tout en définissant la fonction
de traduction, puis je donnerai des exemples. On reconnaîtra alors dans les
langages L et M, au moins dans le cas particulier où T(Σ) est sans termes de
33
base auxiliaires, ce que, dans la théorie des modèles MT2, on appelle
respectivement « langage-objet » (ou, plus précisément, en l’occurrence,
« langage-objet interprété ») et « métalangage » (la syntaxe élémentaire de L
étant supposée codée dans M). Je décrirai le langage L comme ce que, dans
MT2, on appelle un langage d’ordre infini, mais – que ce soit dit une fois pour
toutes ! - rien n’empêche de se contenter, pour une raison ou pour une autre,
d’un langage d’ordre fini, pourvu que les axiomes de spécification, ou du
moins certaines versions manifestement équivalentes (au sens MT1 pour T(Γ))
de ces axiomes, soient rétrotraductibles dans ce langage.
Les notations pour T(Σ) sont celles du paragraphe II : a1, ..., an sont, dans
cet ordre, les termes de base principaux de T(Σ), désignant respectivement les
composantes de la base principale ⟨U1, ..., Un⟩ de la structure générique
d’espèce Σ ; b1, ..., bp sont, dans cet ordre, les termes structuraux de T(Σ),
désignant respectivement les composantes structurales V1, ..., Vp, dans l’ordre
où elles y figurent, de la structure générique d’espèce Σ ; c1, ..., cm sont, dans
cet ordre, les termes de base secondaire de T(Σ), désignant respectivement les
composantes de la base auxiliaire ⟨W1, ..., Wm⟩, choisie une fois pour toutes,
commune à toutes structures d’espèce Σ.
Le langage L contient les mêmes connecteurs, quantificateurs, signe
d’identité et opérateur de description que M. A tout indice τ d’échelon de
l’échelle E(U1, ..., Un, W1, ..., Wm) correspond une infinité de variables de type
τ. Le langage L contient en outre p ≥ 0 constantes, β1, ..., βp, données dans cet
ordre, de types respectifs σ1, ..., σp, et constituant la signature de L. Les
règles de formation sont parfaitement attendues, elles sont explicitées cidessous en même temps qu’est donnée la définition de la fonction de traduction
de L dans M.
La fonction de traduction de L dans M est la restriction aux termes clos et
formules closes (énoncés) de L de la fonction * définie par induction sur la
longueur des expressions de L :
(i)
(ii)
(iii)
(iv)
toute variable v de L de type τ est un terme de L de type τ et v* est une
variable de M qui lui correspond de façon injective et « effective » ;
β1, ..., βp sont des termes de L de types respectifs σ1, ..., σp, et β1* =
b1, ..., βp* = bp ;
si t, t1, ..., tk sont des termes de L de types respectifs ⟨τ1, ..., τk ; τk+1⟩,
τ1, ..., τk , alors ⎡tt1... tk⎤ est un terme de L de type τk+1 et ⎡tt1... tk ⎤* =
⎡t*(t1*, ..., tk*)⎤ ;
si v est une variable de L de type τ, alors ⎡ιv(A)⎤ est un terme de L de
type τ et ⎡ιv(A)⎤* = ⎡(ιv* ∈ τ(a1, ..., an, c1, ..., cm))(A*)⎤ ;
34
si t, t1, ..., tk sont des termes de L de types respectifs ⟨τ1, ..., τk⟩, τ1, ...,
τk , alors ⎡tt1... tk⎤ est une formule de L et ⎡tt1... tk ⎤* = ⎡⟨t1*, ..., tk *⟩
∈ t*⎤ ;
(vi) si t1, t2 sont des termes de L de même type τ1, alors ⎡t1 = t2⎤ est une
formule de L et ⎡t1 = t2⎤* = ⎡t1* = t2*⎤ ;
(vii) si A et B sont des formules de L, alors ⎡(¬A)⎤, ⎡(A ∨ B)⎤ sont des
formules de L et ⎡(¬A)⎤* = ⎡(¬A*)⎤, ⎡(A ∨ B)⎤* = ⎡(A* ∨ B*)⎤ ;
(viii) si v est une variable de L de type τ, alors ⎡∃v(A)⎤ est une formules de L
et ⎡∃v(A)⎤ * = ⎡(∃xτ* ∈ τ(a1, ..., an, c1, ..., cm)(A*)⎤.
(v)
Notez que tous les énoncés de M ne sont pas traduction d’un énoncé de L :
tous ne sont pas rétrotraductibles dans L. Par exemple, ⎡∀v(v = v)⎤ ne l’est
pas.
Par traduction, le langage L se trouve ainsi interprété : pour tout τ, les
variables de type τ parcourent l’échelon d’indice τ de l’échelle E(U1, ..., Un,
W1, ..., Wm) ; en particulier, les variables individuelles de types 1, ..., n, n + 1,
..., n + m parcourent respectivement les ensembles de base U1, ..., Un, W1, ...,
Wm ; β1, ..., βp ont pour extensions respectives V1, ..., Vp ; etc. [Notez qu’il
s’agit d’une interprétation toute relative, puisque, dans le langage M, a1, ..., an,
b1, ..., bp ne sont que des paramètres, dont les valeurs respectives, U1, ..., Un,
V1, ..., Vp, sont « indéterminés, mais fixés » (selon la formule sibylline
autrefois consacrée).] J’appellerai variables de base principales (resp.
auxiliaires) les variables individuelles parcourant les ensembles de base
principaux (resp. auxiliaires).
IV.1.2. Exemples
En toute rigueur, il faudrait d’abord dire une fois pour toutes quelles sont les
variables officielles de L et celles de M, et expliciter la correspondance injective
et effective supposée entre les unes et les autres ; puis reprendre les exemples
de théorie d’espèce de structure (i)-(viii) du § III.2.3, préciser à chaque fois la
signature ⟨β1, ..., βp⟩ de L et fournir les rétrotraductions (relativement à *),
(Λ1), (Λ2), ..., des axiomes de spécification de la théorie considérée. Pour ne
pas alourdir l’exposé, j’en dirai le moins possible sur la correspondance entre
les variables de L et celles de M; et je reprendrai pour la signature de L les
constantes structurales, b1, ..., bp, déjà présentes dans M. Cette homonymie ne
devra pas faire oublier que β1, ..., βp ont beau avoir pour extension dans L la
même chose que b1, ..., bp désignent dans M, à savoir V1, ..., Vp, elles n’en
35
sont pas pour autant de même type, ou catégorie syntaxique (σ1, ..., σp
ne sont pas forcément égaux à 1 ou ... ou n)!
(i)
Sur la théorie des ensembles ordonnés : les variables de L figurant dans les
rétrotraductions des axiomes de spécification (M2.1)-(M2.3) sont toutes de même
type, 1, relatives à E ; ce sont les (seules) variables de base principales et il n’y a pas
de variables de base auxiliaires ; la signature de L n’a qu’un seul terme, la constante
de prédicat binaire « R » ; les rétrotraductions en question sont respectivement les
suivantes (en utilisant la notation médiane pour « R ») :
(Λ1)
(Λ2)
(Λ3)
(ii)
Sur la théorie des groupes : les variables de L figurant dans les rétrotraductions des
axiomes de spécification (M2.1)-(M2.3) sont toutes de même type, 1, relatives à G ;
ce sont les (seules) variables de base principales et il n’y a pas de variables de base
auxiliaires ; la signature de L a deux termes, la constante d’« individu » « e » et
le foncteur binaire « μ » ; les rétrotraductions en question sont respectivement les
suivantes (en utilisant la notation médiane pour « μ ») :
(Λ1)
(Λ2)
(Λ3)
(iii)
∀x ∀y ∀z [(x μ y) μ z = (x μ (y μ z)] ;
∀x (x μ e = e μ x = x) ;
∀x ∃y (x μ y = y μ x = e).
Sur la théorie des corps commutatifs : les variables de L figurant dans les
rétrotraductions des axiomes de spécification (M2.1)-(M2.9) sont toutes de même
type, 1, relatives à K ; ce sont les (seules) variables de base principales et il n’y a pas
de variables de base auxiliaires ; la signature de L a quatre termes, les constantes
d’« individu » « 0 » et « 1 », et les foncteurs binaires « + » et « × » ; les
rétrotraductions en question sont respectivement les suivantes (en utilisant la notation
médiane pour « + » et « × ») :
(Λ1)
(Λ2)
(Λ3)
(Λ4)
(Λ5)
(Λ6)
(Λ7)
(Λ8)
(Λ9)
(iv)
∀x (x R x ) ;
∀x ∀y [(x R y & y R x ) ⇒ x = y] ;
∀x ∀y ∀z [x R y & y R x ) ⇒ x R z].
[analogue à (Λ1) de (ii)] ;
[analogue à (Λ2) de (ii)] ;
[analogue à (Λ3) de (ii)] ;
∀x ∀y (x + y = y + x) ;
[analogue à (Λ1) de (ii)] ;
[analogue à (Λ2) de (ii)] ;
∀x [x ≠ 0 ⇒ ∃y (x × y = y × x = 1)] ;
∀x∀y∀z[ x × (y + z) = (x × y) + (x × z) & (x + y) × z = (x × z) + (z × z)] ;
[analogue à (Λ4) ci-dessus].
Sur la théorie des espaces topologiques : il y a trois types de variables de L figurant
dans les rétrotraductions des axiomes de spécification (M2.1)-(M2.3) : celles de type
1 (« x », ...), relatives à E, celles de type ⟨1⟩ (« X », ...), relatives à P(E), et celles de
type ⟨⟨1⟩⟩ (« X », ...), relatives à P(P(E)) ; les variables de type 1 sont les (seules)
variables de base principales et il n’y a pas de variables de base auxiliaires ; la
36
signature de L n’a qu’un terme, le prédicat « O », de type ⟨⟨1⟩⟩. Les rétrotraductions
en question sont alors respectivement les suivantes :
(v)
[où V =df ιX (∀x Xx)] ;
(Λ1)
OV
(Λ2)
(Λ3)
∀Z(Z ⊆ O ⇒ O(∪Z)
[où ∪Z =df ιX{∀x[Xx ⇔ ∃Y(ZY & Yx)]}
∀X∀Y[(OX & OY) ⇒ X ∩ Y ∈ O] [où X ∩ Y =df ιZ[∀z[Zz ⇔ (Xz & Yz)]].
Sur la théorie des progressions (ou systèmes simplement infinis) : il y a deux types
de variables de L figurant dans les rétrotraductions des axiomes de spécification
(M2.1)-(M2.3) : celles de type 1 (« x », ...), relatives à N, et celles de type ⟨1 ; 1⟩
(« X », ...), relatives à P(N) ; les variables de type 1 sont les (seules) variables de
base principales et il n’y a pas de variables de base auxiliaires ; la signature de L a
deux termes, la constante d’« individu » « 0 », de type 1, et le foncteur « S », de type
⟨1 ; 1⟩. Les rétrotraductions en question sont alors respectivement les suivantes :
(Λ1)
(Λ2)
(Λ3)
∀x∀y(x ≠y ⇒ Sx ≠ Sy) ;
∀x(0 ≠ Sx) ;
∀X{[0 ∈X & ∀x(Xx ⇒ XSx)] ⇒ ∀xXx}.
(vi)
Sur la théorie des n-ensembles : il y a des variables de type 1, ..., n, relatives à E1, ...,
En , respectivement ; ce sont toutes de variables de base principales et il n’y a pas de
variables de base auxiliaires ; pas de signature ; rien à retrotraduire.
(vii)
Sur la théorie des ZF2-structures : il y a deux types de variables de L figurant dans
les rétrotraductions des axiomes de spécification (M2.1)-(M2.7) : celles de type 1
(« x », ...), relatives à U, et celles de type ⟨1 ; 1⟩ (« F », ...), relatives à F(U, U) ; les
variables de type 1 sont les (seules) variables de base principales et il n’y a pas de
variables de base auxiliaires ; la signature de L a deux composantes, le prédicat
unaire « ENS », de type ⟨1⟩, et le prédicat binaire, « APP », de type ⟨1, 1⟩. Les
rétrotraductions en question sont les suivantes, où « INC », « VID » et « SIN(...) »
sont supposés définis par analogie avec les définitions de « ⊆ », « ∅ » et « {...} »
dans le langage de ZF2 :
(Λ1)
(Λ2)
(Λ3)
(Λ4)
(Λ5)
(Λ6)
∀x∀y(x APP y ⇒ ENS y),
∀x∀y{(ENS x & ENS y) ⇒ [∀z(z APP x ⇔ z APP y) ⇒ x = y]},
∀F∀x{ENS x ⇒ (∃y)[ENS y & ∀t (t APP y ⇔ ∃z(z APP x & t = Fz ))]},
∀x{[ENS x & ∀y(y APP x ⇒ ENS y)] ⇒ ∃z[ENS z &
∀t(t APP z ⇔ ∃z(t APP u APP x))]},
∀x{ENS x ⇒ ∃y[ENS y & ∀z(z APP y ⇔ z INC x)]},
∃x[ENS x & VID APP x & ∀y(y APP x ⇒ SIN(x) APP y)]. 39
39
Imaginez dans ces axiomes le simple changement de notations suivant : « ens » pour
« ENS », « ∈ » pour « APP », « ⊆ » pour « INC », « ∅ » pour « VID », et « {...} » pour
« SIN(...) ». Aussi fondamentalement différente qu’elle soit de la théorie des ensembles ZF2,
la théorie des ZF2-structures, dans la version ainsi obtenue, en serait littéralement
indiscernable. Imaginez qu’on aille jusqu’à l’appeler du même nom : « théorie des
ensembles ZF2 ». La confusion serait totale. N’est-ce qu’un mauvais rêve ?
37
(viii) Sur la théorie des espaces vectoriels sur un corps commutatif K : les variables de L
figurant dans les rétrotraductions des axiomes de spécification (M2.1)-(M2.2) sont
de deux types, celles de type 1, « x », « y », ..., relatives à V, et celles de type 2,
« α », « β », ..., relatives à K ; les variables de type 1 sont les (seules) variables de
base principales, et les variables de type 2 les (seules) variable de base auxiliaires ; la
signature de L a trois termes, la constante d’« individu » « 0 », de type 1, et
les foncteurs binaires « + » et « • » de types respectifs ⟨1, 1 ; 1⟩ et ⟨2, 1 ; 1⟩ ; les
rétrotraductions en question sont respectivement les suivantes (en utilisant la
notation médiane pour « + » et « • ») :
(Λ1)
(Λ2)
(Λ3)
(Λ4)
(Λ5)
+ est associative [analogue à (Λ1) de (ii)] ;
0 est neutre pour + [analogue à (Λ2) de (ii)] ;
tout élément de V admet un symétrique pour + par rapport à 0 [analogue à
(Λ3) de (ii)] ;
+ est commutative [analogue à (Λ4) de (iii)] ;
∀α∀β∀x∀y[α • (x + y) = (α • x) + (α • y) & (α + β) • x = (α • x) + (β • x)].
IV.2. La nouvelle théorie des modèles
On envisage maintenant d’étudier la structure générique d’espèce Σ - et à
travers elles toutes les structures d’espèce Σ - en ne cherchant que ses
propriétés exprimables par des énoncés de L, et cela directement, c’est-à-dire
sans passer par l’intermédiaire d’énoncés de M et de leur rétrotraduction dans L.
Inutile, désormais, de parler de transportabilité, car il serait possible de montrer
que toutes les traductions par * d’énoncés de L, sans exception, sont
transportables pour T(Γ). Pour mener à bien l’entreprise, on définit de
nouveaux concepts, propres à la nouvelle théorie des modèles, et souvent
homonymes des concepts fondamentaux de l’ancienne.
IV.2.1. Structures d’interprétation 40 et univers du discours
Au sens MT1 et avec a1, ..., an, b1, ..., bp pour seuls signes traités comme
extra-logiques, une interprétation du langage M de T(Σ),était un objet de la
forme
⟨U1, ..., Un ; V1, ..., Vp⟩,
les composantes U1, ..., Un, V1, ..., Vp interprétant respectivement a1, ..., an,
b1, ..., bp.
40
Comme le langage L est, en un sens, déjà interprété, il faudrait en toute rigueur, parler de
réinterprétation.
38
Au sens de MT2 et avec les variables de base principales et β1, ..., βp pour
seuls signes traités comme extra-logiques, une interprétation de L est une
structure de genre Γ. Ainsi, la satisfaction des axiomes propres à T(Γ)
[axiomes de position et axiomes de typification de T(Σ)] sera intégrée à la
nouvelle notion d’interprétation. Ainsi, toute interprétation sera une structure,
d’où l’expression légitime possible de « structure d’interprétation ».
Pour toute telle interprétation, le multi-univers, ou multidomaine, du
discours (i.e., de L) sera le multi-ensemble ⟨U1, ..., Un⟩, qui n’est autre que le
multidomaine de variation des variables de base principales de L. On pourrait
parler ici aussi d’ensembles de base principaux (resp. auxiliaires) des
structures d’interprétation.
IV.2.2. Modèles
Au sens de MT1 et avec a1, ..., an, b1, ..., bp pour seuls signes traités
comme extra-logiques, un modèle d’un ensemble E d’énoncés de M était une
interprétation de M (au sens rappelé en IV.2.1.1) satisfaisant tous les énoncés de
E. En particulier les modèles des axiomes de T(Σ) propres à Σ étaient les
structures d’espèce Σ.
Au sens de MT2 et avec les variables de base principales et β1, ..., βp pour
seuls signes traités comme extra-logiques, un modèle d’un ensemble E
d’énoncés de L sera une structure d’interprétation de L (au sens indiqué en
IV.2.1.1) satisfaisant tous les énoncés de E. En particulier les modèles des
rétrotraductions dans L des axiomes de spécification de T(Σ) seront exactement
les structures d’espèce Σ.
IV.2.3. Conséquence
Au sens de MT1 et avec a1, ..., an, b1, ..., bp pour seuls signes traités
comme extra-logiques, un énoncé A de M était conséquence d’un ensemble E
d’énoncés, si, et seulement si, tout modèle (au sens rappelé en IV.2.1.2) de E
était un modèle (idem) de A.
Au sens MT2 et avec les variables de base principales et β1, ..., βp pour
seuls signes traités comme extra-logiques, un énoncé A de L est conséquence
de E si, et seulement si, tout modèle (au sens indiqué en IV.2.1.2) de E est un
modèle (idem) de A.
IV.2.4. Un (second) théorème de coopération
Notons respectivement Pos(Γ) et Typ(Γ) les ensembles des axiomes de
position et de typification de T(Γ) ; et |=MT1 (resp. |=MT2) la relation de
39
conséquence logique au sens de MT1 et avec a1, ..., an, b1, ..., bp pour seuls
signes traités comme extra-logiques (resp. au sens de MT2 et avec les variables
de base principales et β1, ..., βp pour seuls signes traités comme extralogiques). Le théorème annoncé, évident étant donné la façon dont j’ai présenté
les choses, est le suivant : pour tout ensemble E ∪ {A} d’énoncés de L,
E |=MT2 A si, et seulement si, Pos(Γ) ∪ Typ(Γ) ∪ E* |=MT1 A* ;
En particulier, pour tous les exemples considérés :
{(Λ1), (Λ2), ...} |=MT2 A si, et seulement si,
{(M0.1), ..., (M0.n), (M1.1), ..., (M1.p), (M2.1), (M2.2), ...} |=MT1 A*.
Ce sont, à une traduction près, les mêmes propriétés des structures d’espèce Σ
que sont susceptibles de découvrir celui qui développe T(Σ) dans la traduction
L* de L dans M et selon MT1, et celui qui développe la version de T(Σ) dans L
et selon MT2.
Mais bien sûr, la méthode d’origine est susceptible de conduire à des
théorèmes exprimés dans M transportables pour T(Σ) qui ne sont pas
rétrotraductibles dans L. [[Question : Peut-il exister de tels théorèmes qui ne
sont même pas rétrotraductibles dans L à une équivalence logique près (au
sens de MT2) ?]]
Exemples. - En théorie des groupes telle que présentée en III.2.3-(ii), l’énoncé qui dit
(dans M) que tout élément de G est régulier pour μ :
(∀x ∈ G)(∀y ∈ G)(∀z ∈ G)[(x μ y = x μ x ⇒ y = z) & (x μ z = y μ z ⇒ x = y)]
est conséquence au sens MT1, avec « G », « e » et « μ » traités comme seuls signes
extra-logiques, des axiomes de typification (M1.1)-(M1.2) et axiomes de
spécification (M2.1)-(M2.3) de cette théorie. L’énoncé qui dit la même chose dans le
langage L présenté en IV.1.2-(ii), à savoir :
∀x ∀y ∀z [(x μ y = x μ x ⇒ y = z) & (x μ z = y μ z ⇒ x = y)],
est conséquence au sens MT2, avec les variables et « μ » traités comme seuls signes
extra-logiques, des axiomes (Λ1)-(Λ3). ⎯ De même, en théorie des progressions
telle que présentée en III.2.3-(v), l’énoncé qui dit (dans M) que tout élément de N est
différent de son successeur :
(∀x ∈ N)x ≠ S(x),
est conséquence au sens MT1, avec « N », « 0 » et « S » traités comme seuls signes
extra-logiques, des axiomes de typification (M1.1)-(M1.2) et de spécification
40
(M2.1)-(M2.3) de cette théorie. L’énoncé qui dit la même chose dans le langage L
présenté en IV.1.2-(v), à savoir :
∀xx ≠ S(x),
est conséquence au sens MT2, avec les variables et « 0 » et « S » traités comme seuls
signes extra-logiques, des axiomes (Λ1)-(Λ3).
IV.2.5. Théories d’espèce de structure nouvelle version
Nous connaissions la théorie des ensembles ordonnés, la théorie des
groupes, la théorie des espaces topologiques, etc., dans leur ancienneversion
(version MT1), à savoir telle que décrite au § III.2.3. Nous pouvons maintenant
définir leur nouvelle,version (version MT2). La théorie d’une espèce de
structure T(Σ) dans cette nouvelle version peut être déterminée directement,
sans invoquer l’ancienne version, par la donnée 1°) d’une extension de la
théorie des ensembles, dite métathéorie d’arrière-plan ; 2°) d’un langage-objet,
L, classique, à plusieurs sortes de variables de base et d’ordre infini, et
partiellement interprété, comme expliqué ci-dessous ; 3°) d’axiomes exprimés
dans ce langage.
Outre les connecteurs, quantificateurs, signe d’identité et opérateur de
description classiques, L possède, à titre de signes primitifs, n + m (n ≥ 0, m >
0) sortes de variables de base, de types respectifs 1, ... n, n + 1, ..., n + m. Les
variables de types 1, 2, ...,n sont distinguées comme variables de base
principales et parcourent des ensembles indéterminés, U1, ..., Un (on dira, si
l’on préfère, que ces variables sont non-interprétées). Les variables de base de
types n + 1, n + 2, ..., n + m sont distinguées comme variables de base
auxiliaires et parcourent des ensembles déterminés, W1, ..., Wn (autrement dit,
ces variables sont interprétées), dans la métathéorie d’arrière plan, et celaune
fois pour toutes, comme s’il s’agissait de signes logiques. Pour tout échelon
d’indice τ de l’échelle E(U1, ..., Un, W1, ..., Wn), L possède des variables de
type τ, parcourant cet échelon (si l’on a choisi de dire que les variables
principales sont non-interprétées, la formulation sera plus lourde : « pour tout
choix de domaines de variation pour les variables de base principales, etc. »).
Enfin, L possède une signature, ⟨β1, ..., βp⟩, dont les termes, de types, ou
catégories syntaxiques, σ1, ..., σp, désignent respectivement des élément
indéterminés, V1, ..., Vp, des échelons d’indices σ1, ..., σp de l’échelle
E(U1, ..., Un, W1, ..., Wn) (on pourrait aussi bien dire que les termes en question
sont de type, ou catégorie syntaxique, déterminé, mais restent non-interprétés).
La distinction, parmi les variables de base, entre les principales et les
auxiliaires détermine une certaine notion de conséquence au sens MT2, relative
au choix des variables de base auxiliaires et à leur interprétation, mais
41
indépendante des axiomes de T(Σ). Le développement de la théorie T(Σ)
consiste à tirer les conséquences en ce sens (et si possible intéressantes) des
axiomes de T(Σ).
Nous savons donc maintenant ce qu’est la théorie des ensembles ordonnés,
version MT2 ; la théorie des groupes, version MT2 ; la théorie des espaces
topologiques, version MT2, etc. Rien n’empêche de réduire le langage L à l’un
des ses sous-langages d’ordre fini, pourvu évidemment que les axiomes
appartiennent au sous-langage choisi. Rien n’empêche non plus de se passer de
l’opérateur primitif de description comme Russell nous a appris à le faire ; et,
de même, du prédicat primitif d’identité, sauf dans le cas où le sous-langage
retenu est élémentaire.
IV.3. La nouvelle architecture des mathématiques modernes
IV.3.1. Esquisse de la nouvelle architecture
Dans le passage de MT1 à MT2, les axiomes de position et de typification
ont été intégrés à la nouvelle notion d’interprétation, et les axiomes de
spécification ont été traduits dans un langage plus simple. Ainsi s’est trouvée
mise en lumière et mieux prise en compte la structure syntaxique des axiomes
qui caractérisent une espèce de structure.
L’intérêt de l’opération est parfaitement illustré par les premiers grands
théorèmes de MT2 : théorème de Löwenheim (1915) amélioré Skolem (1920),
puis par Tarski (1931), théorème de complétude de Gödel (1929/30), etc. Ces
théorèmes, d’une généralité inédite, transversale à celle dont Bourbaki était
capable avec sa théorie des théories d’espèce de structure, expriment des
propriétés communes à toutes les théories dont les axiomatiques partagent tel
ou tel trait syntaxique, comme, par exemple, d’être du premier ordre.
D’anciens théorèmes ont ainsi pu être l’objet de nouvelles démonstrations et
bénéficier d’un éclairage nouveau, comme, par exemple, le théorème qui dit
que, pour qu’un groupe commutatif soit totalement ordonnable, il faut et il
suffit qu’il soit sans torsion 41 , ou encore, dans le même genre, le théorème
d’Artin-Schreier, qui dit que, pour qu’un corps commutatif K soit totalement
ordonnable, il faut et il suffit que, pour tous x1, ..., xn ∈ K, 1 + x12 + ...+ xn2 ≠
0. 42 Dans certains cas, les théorèmes en question en ont suscité de nouveaux ;
ainsi, par exemple, le théorème qui dit que tous les ensembles dénombrables
41
Comparer Bourbaki, livre II, chap. 6, § 1, exerc. 20, et Kreisel et Krivine, 1967, chap. 1,
exerc. 3, et Appendice 1
42
Comparer Bourbaki, livre II, chap. 6, § 2, N° 3, corollaire, et Kreisel et Krivine, 1967,
appendice 1.
42
muni d’un ordre total, dense et sans extremum sont isomorphes 43 , s’est vu
complété par celui qui dit que tous les ensembles munis d’un ordre total, dense
et sans extremum sont élémentairement équivalents 44 . D’anciennes conjectures
ont même parfois été résolues, comme, par exemple, la conjecture d’Artin sur
les corps de nombres p-qdiques, résolue positivement dans une version revue et
corrigée par J. Ax et S. Kochen par les méthodes de la théorie des modèles
(MT). De nouvelles théories ont vu le jour , comme, par exemple, les
contreparties élémentaires, i.e., du premier ordre, décrites ci-dessous, des
versions MT2 de la théorie des progressions et de la théorie des ZF2-structures.
Dans un article classique destiné au grand public et publié en 1962,
Bourbaki décrivait ce qu’il appelait « L’architecture des mathématiques » c’était le titre de l’article. A la question posée en sous-titre, « La
Mathématique, ou les Mathématiques ? », la description proposée des
mathématiques comme l’étude de structures toutes issues de certaines
« structures-mères » (structures d’ordre, structures algébriques, structures
topologiques) par enrichissements et croisements, permettait de répondre
fièrement « La Mathématique ». Le titre même du grand œuvre, Eléments de
Mathématique, conjuguait la fausse modestie du premier terme, repris des
Eléments d’Euclide, et la vraie fierté de second, écrit au singulier. La nouvelle
théorie MT2 ne vient pas détruire ce bel arrangement, mais elle en relativise la
portée, car elle l’enrichit de lignes architecturales dont rien dans la description
bourbachique ne laissait entrevoir la possibilité. Les nouvelles lignes sont
orthogonales aux anciennes, dévoilant ce qu’on pourrait bien appeler une
nouvelle architecture des mathématiques.
IV.3.2 Deux exemples de nouvelle théorie
(ix)
Arithmétique élémentaire de Peano comme théorie des progressions (ou des
systèmes simplement infinis) standards ou non-standards (et dans le style MT2) : la
métathéorie d’arrière-plan est la théorie des ensembles ; les variables de base du
langage-objet, L, sont d’une seule sorte, donc principales et de type 1 (« x », « y »,
...), et seules des variables de ce type figurent dans les axiomes ; la signature de L est
⟨« 0 », « S »⟩, avec « 0 » de type 1 et « S » de type ⟨1 ; 1⟩ ; les axiomes sont (Λ1),
(Λ2) et les clôtures universelles des formules de L la forme (Λ3), où A[x] est une
formule élémentaire de L :
(Λ1)
(Λ2)
(Λ3)
∀x∀y(x ≠y ⇒ Sx ≠ Sy) ;
∀x(0 ≠ Sx) ;
[A[0] & ∀x(A[x] ⇒ A[Sx])] ⇒ ∀x A[x].
43
Comparer Bourbaki, livre III, chap. 4, § 2, exerc. 9, et Kreisel et Krivine, 1967, chap. 4,
exerc. 3.
44
I.e., ont les mêmes propriétés élémentaires. L’exemple est emprunté à R. Fraïssé,
« Réflexions sur les axiomatiques », L’Age de la science, 3 (1969). C’est le genre de
théorème qu’on ne risque pas de trouver dans les Eléments.
43
Pour apprécier ici l’intérêt pratique du style MT2, essayez de décrire en précision la
version MT1 de cette théorie (sans passer par la rétrotraduction des axiomes cidessus dans le langage M de la version cherchée), et comparez !
(x)
Théorie des ZF-structures (dans le style MT2) : la métathéorie d’arrière-plan est la
théorie des ensembles ; les variables de base du langage-objet, L, sont d’une seule
sorte, donc principales et de type 1 (« x », « y », ...), et seules des variables de ce type
figurent dans les axiomes ; la signature de L est ⟨« ENS », « APP »⟩, avec « ENS »
de type ⟨1⟩ et « APP » de type ⟨1, 1⟩ ; les axiomes sont (Λ1)-(Λ2) et (Λ4)-(Λ6), et les
clôtures universelles des formules de L la forme (Λ3), où A[z, t] est une formule
élémentaire de L où ne figurent ni « x » ni « y » :
(Λ1)
(Λ2)
(Λ3)
(Λ4)
(Λ5)
(Λ6)
∀x∀y(x APP y ⇒ ENS y),
∀x∀y{(ENS x & ENS y) ⇒ [∀z(z APP x ⇔ z APP y) ⇒ x = y]},
∀x{(ENS x & ∀z!tA[z, t]) ⇒ (∃y)[ENS y &
∀t(t APP y ⇔ ∃z(z APP x & A[z, t]))]},
∀x{[ENS x & ∀y(y APP x ⇒ ENS y)] ⇒ ∃z[ENS z &
∀t(t APP z ⇔ ∃z(t APP u APP x))]},
∀x{ENS x ⇒ ∃y[ENS y & ∀z(z APP y ⇔ z INC x)]},
∃x[ENS x & VID APP x & ∀y(y APP x ⇒ SIN(x) APP y)]. 45
Pour apprécier ici encore l’intérêt pratique du style MT2, essayez de décrire en
précision la version MT1 de cette théorie (sans passer par la rétrotraduction des
axiomes ci-dessus dans le langage M de la version cherchée), et comparez !
45
Imaginez à nouveau (voir note 39) dans ces axiomes le simple changement de notations
suivant : « ens » pour « ENS », « ∈ » pour « APP », « ⊆ » pour « INC », « ∅ » pour
« VID », et « {...} » pour « SIN(...) ». Aussi fondamentalement différente qu’elle soit de la
théorie des ensembles ZF, la théorie des ZF-structures, dans la version ainsi obtenue, en
serait littéralement indiscernable. Imaginez qu’on aille jusqu’à l’appeler du même nom :
« théorie des ensembles ZF ». La confusion serait totale. N’est-ce, à nouveau, qu’un
mauvais rêve ?
44
V. Réfutation de quelques idées reçues concernant la nouvelle
théorie des modèles
V.I. Les deux théories des modèles existent-elles ?
« Oui, je les ai rencontrées ! » : c’est évidemment la première conclusion
que j’invite le lecteur à tirer du présent travail. Grosso modo, la première des
deux théories des modèles, BT, ou sa variante MT1, me paraît trop souvent
méconnue des logiciens-non-mathématiciens, de même que la seconde, MT, ou
sa variante MT2, des mathématiciens-non-logiciens. Il faudrait ici mener une
enquête de caractère sociologique pour savoir ce qu’il en est exactement, la
situation est peut-être moins sombre que j’incline à le croire. Quoi qu’il en soit,
je plaide pour la reconnaissance mutuelle des tenants de l’une ou de l’autre
théories, fondée non point sur une quelconque maxime de tolérance, mais sur la
connaissance, tout simplement, du dossier.
V.2. En quoi consiste la différence des deux théories ?
V.2.1.
A en croire nombre de ceux qui connaissent l’existence des théories BT et
MT, et il en irait de même avec leurs variantes MT1 et MT2, la différence entre
la première et la seconde se réduit à celle d’une sémantique à domaine fixe et
d’une sémantique à domaine variable. Dans la première, le domaine est
invariable (comme l’univers universel des universalistes), dans la seconde, au
contraire, le domaine lui-même varie (comme l’univers toujours particulier des
anti-universalistes). Je critiquerai cette thèse en référence à MT1 et MT2.
Il y a un sens, superficiel et dénué d’intérêt, dans lequel ces gens-là sont
dans le vrai : si « domaine » (ou « univers ») est compris comme domaine (ou
univers) de variation de variables, alors, pour une théorie d’espèce de structure
T(Σ) version MT1, le domaine en question est le « Grand Domaine » de
variation des variables du langage M de la théorie, en effet invariable d’une
réinterprétation à l’autre de ce langage, tandis que, pour la même théorie
version MT2, c’est le (petit) domaine, ou, plus exactement, multidomaine, de
variation des variables de base du langage L de la théorie, en effet variable
d’une réinterprétation à l’autre de ce langage.
Mais il faut comparer ce qui est comparable : la notion de multidomaine de
base, ou multi-univers, pour la théorie de genre de structure T(Γ)
correspondant à une théorie T(Σ) version MT1, et la notion homonyme pour la
même théorie T(Σ) version MT2, telles que ces notions ont été respectivement
définies aux paragraphes III.1.2 et IV.2.1. Dans le premier cas, il s’agit de la
45
base principale, ⟨U1, ..., Un⟩, de la structure générique de genre Γ, et nullement
d’un domaine de variation de variables (de M) ; dans le second, il s’agit
exactement de la même chose, qui se trouve être aussi le multidomaine de
variation des variables de base (de L), mais qu’importe ! Ce qui doit varier, à
travers les réinterprétations du langage de la théorie (en particulier pour la
définition de la notion de conséquence), c’est ce multidomaine de base, et, en
fait, il varie aussi bien et de la même manière dans la version MT1, en
parcourant la classe des multidomaines de base des structures de genre Γ, que
dans la version MT2, en parcourant la classe des multidomaines de base des
structures de réinterprétation de L. 46
V.2.2.
Toujours parmi ceux qui connaissent l’existence des théories BT et MT, et il
en irait de même avec MT1 et MT2, John Etchemendy est certainement celui
qui a pris la mesure le plus précisément et le plus dramatiquement de leur
différence : en fait, les théories étaient en toute rigueur incompatibles,
l’évaluation d’un même argument, en référence aux explications de la notion
de conséquence proposées par l’une et par l’autre, n’aboutissant pas toujours au
même verdict de validité ou d’invalidité. L’attitude de Tarski, prenant
successivement fait et cause pour l’une et pour l’autre comme si de rien n’était
devenait difficile à comprendre. Fallait-il croire qu’il avait tacitement reconnu
une erreur dans la première théorie et tenté de la corriger avec la seconde (S.
Read) ? Ou prétendre, envers et contre toute évidence, qu’il était en réalité
resté fidèle à lui-même, n’ayant jamais défendu la première théorie, mais
seulement et depuis toujours la seconde (M. Gomez-Torrente) ?
En vérité Tarski a bien défendu les deux théories, et elles sont bien
différentes et même, confrontées l’une à l’autre concept par concept,
incompatibles. Mais Tarski n’y voyait certainement aucune tension dont il eût
fallu s’inquiéter. Sous les différences superficielles, terme à terme, demeurait
l’unité profonde et globale d’inspiration. C’est cette unité que j’ai cherché à
mettre en lumière par mon (second) théorème de coopération.
46
On pourrait aussi comparer les interprétations possibles (mobilisées notamment dans la
définition du concept de conséquence), d’une part, des signes de M traités comme extralogiques, à savoir a1, ..., an, b1, ..., bp, et, d’autre part, des n sortes de variables et des
composantes de la signature ⟨β1, ..., βp⟩ de L. Il apparaîtrait alors que ces interprétations
sont beaucoup plus libres dans le premier cas que dans le second, car une interprétation ⟨x1,
..., xn ; y1, ..., yp⟩ pour M peut être tout autre chose qu’une structure de genre Γ, tandis
qu’une interprétation pour L est nécessairement une structure de genre Γ.
46
V.3. La nouvelle théorie des modèles est-elle applicable à la
théorie des ensembles et à toutes ses extensions de même ordre?
V.3.1. L’idée reçue et un diagnostic
Voici une idée reçue, généralement acceptée sans discussion, comme allant
de soi, et pourtant, pour peu qu’on y réfléchisse, extrêmement troublante. Rares
sont les logiciens qui ont pris le problème au sérieux, G. Kreisel et G. Boolos,
auxquels je ferai référence, sont des exceptions.
Thèse 1. - La théorie des modèles MT2 47 , ou plus précisément la partie de
cette théorie qui relève de la logique élémentaire, s’applique de plein droit à la
théorie (élémentaire) des ensembles ZF et à toutes extensions élémentaires de
cette théorie 48 (en particulier à toutes les théories mathématiques telles que
reconstruites comme de telles extensions 49 )
L’extension de cette thèse au second ordre serait la suivante - et je ne vois
pas ce qui pourrait retenir les tenants insouciants de la première thèse de
soutenir la seconde :
Thèse 2. - La théorie des modèles MT2, ou plus précisément la partie de cette
théorie qui relève de la logique du second ordre, s’applique de plein droit à la
théorie (du second ordre) des ensembles ZF2 et aux extensions du second
ordre de cette théorie.
47
Pour rendre plus fidèlement compte de l’opinion commune, je devrais mentionner MT
plutôt que MT2. Mais cela ne changerait rien au problème de fond. Si je mentionne MT2
plutôt que MT, c’est pour pouvoir exploiter sans précaution particulière le travail accompli
jusqu’ici. La remarque vaut pour tout ce paragraphe V.
48
Une extension élémentaire de ZF (resp. ZF2) s’obtient en adjoignant au langage de ZF
(resp. de ZF2) un nombre fini de constantes d’objet, de relation, ou de fonction, de catégorie
admissible dans ce langage, et des axiomes éventuels pour en gouverner l’usage. On devine
ce que sont ces catégories. Dans le cas du langage de ZF, ce sont les suivantes :
(i)
(ii)
(iii)
catégorie des termes singuliers (constantes d’objet),
catégorie des prédicats attachables à n termes singuliers quelconques, pour n fixé, et
permettant ainsi la formation d’une formule (constantes de relations n-aires entre
objets),
catégorie des foncteurs attachables à n termes singuliers quelconques, pour n fixé, et
permettant ainsi la formation d’un terme singulier (constantes de fonction à n –aires
dont les arguments et les valeurs sont des objets).
Dans le cas du langage de ZF2, l’inventaire serait plus long...
49
Remarquez que les théories mathématiques envisagées dans les paragraphes I-III de cet
articles étaient des extensions élémentaires très particulières de ZF, dans la mesure où les
constantes adjointes au langage de ZF étaient toutes des constantes d’objet.
47
Ces deux thèses ne relèvent pas d’une science, la théorie des modèles, contre
laquelle je n’ai rien à dire, elles relèvent d’une idéologie, que j’appelle, faute
de mieux, le modèle-théorétisme 50 (au sens de MT2-, bien sûr, et non de MT1isme). La longue marche d’approche qui nous a conduits à pied d’œuvre pour
lui tordre le cou me permet de formuler immédiatement un diagnostic : les
adeptes de cette idéologie confondent la théorie des ensembles ZF (resp. ZF2)
et ses extensions de même ordre avec la version modèle-théorétique 51 de la
théorie des ZF- (resp. ZF2-) structures et ses extensions correspondantes. 52 :
V.3.2. Le test de Kreisel et son résultat
Pour mettre à l’épreuve les thèses 1 et 2, empruntons à Kreisel l’idée, on ne
peut plus simple, du test suivant. Considérons une extension élémentaire (resp.
du second ordre) de ZF (resp. ZF2), notons-la T, et l’extension correspondante
de la version MT2 de la théorie des ZF- (resp. ZF2-) structures, notons-la T’.
Pour simplifier la formulation du test, imaginons 53 que les notations utilisées
pour T et T’ soient exactement les mêmes, i.e., qu’en dépit de leur différence
fondamentale, T et T’ soient notationnellement indiscernables.
Soit A un énoncé du langage de T. C’est donc aussi un énoncé du langage de
T’. Supposons que A soit analytique au sens MT2 dans le langage de T’.
Nous savons, dans ces conditions, que A est vrai dans ce même langage. Si
MT2 était applicable à T, A devrait être aussi analytique dans le langage de T,
et donc aussi vrai dans ce même langage. La question est : est-ce que c’est bien
le cas ? Est-ce que tout énoncé analytique au sens de MT2 dans le langage de
T’ est vrai dans le langage de T ? La réponse dépend de l’ordre choisi.
Si c’est le premier ordre, alors la réponse est positive 54 . Le modèlethéorétiste pourrait s’écrier : « Je l’avais bien dit, il n’y a pas de problème ! ».
Mais la justification de la réponse (fondée, chez Kreisel, sur le théorème de
complétude de Gödel, et chez Boolos, sur le principe de réflexion de ZF) n’a
rien de trivial, et le modèle-théorétiste devrait en être troublé.
Si c’est le second ordre qui est choisi, c’est pire. Sauf inconsistance de ZF2,
la question y est indécidable ! Le modèle-théorétiste devrait rester coi, ou
mieux, abjurer sa foi.
50
En référence à MT2, bien sûr, et non à MT1.
Je veux dire la version MT2, bien sûr.
52
Sur la confusion de ZF (resp. ZF2) avec la version MT2 de la théorie des ZF- (resp. ZF2-)
structures, voir les notes 39 et 45.
53
Dans la ligne des notes 39 et 45.
54
Le résultat est même facilement généralisable. Soient E ∪ {A} un ensemble (fini ou
infini) d’énoncés du langage de T. Supposons que A soit une conséquence de E au sens
MT2 dans le langage de T’. Dans ces conditions, si les énoncés de E sont vrais dans le
langage de T, il en est de même de A.
51
48
V.3.3. Un faux théorème de coopération et sa réfutation
Voici une variante de la thèse 1, que personne ne devrait avoir jamais
défendue, tant elle est indéfendable, et qui pourtant réveillera chez les logiciens
le souvenir vague, mais irrésistible d’une vieille rengaine.
Thèse 3. – Toutes les théories mathématiques, dans la mesure où elles peuvent
être réduites au premier ordre par reconstruction dans le cadre de la théorie
élémentaire des ensembles, peuvent être développées par les méthodes de la
théorie des modèles MT2 qui relèvent de la logique élémentaire.
Le plus difficile sera d’expliciter le sens de cette thèse. Je le ferai sur un
(contre-)exemple. Après quoi, la réfutation se fera en un coup.
Partons de T1, l’arithmétique du second ordre comme théorie des
progressions dans sa version MT2 [voir § IV.1.2, (v), et § IV.2.5], en limitant,
comme il est habituel, son langage au second ordre. Par reconstruction dans le
cadre de ZF, T1 donne lieu à T2, théorie des progressions dans sa version MT1
[voir § III.2.3, (v)], dont le langage, cela va sans dire, est du premier ordre. Soit
maintenant T3 l’extension de la théorie des ZF-structures correspondant à T2,
notationnellement indiscernable de T2, comme précédemment (§ V.3.2), et
dont nous limitons le langage au premier ordre (si bien que les langages de T2
et de T3 sont eux-mêmes notationnellement indiscernables).
Je ne vois pas ce que la thèse 3, pour cet exemple, si elle veut vraiment dire
quelque chose, pourrait vouloir dire d’autre que ceci : les conséquences (au
sens MT2 et dans le langage de T1) des axiomes de T1 ne sont autres que les
rétrotraductions dans le langage de T1 des (énoncés du langage de T2 qui sont
notationnellement indiscernables des) conséquences (au sens MT2 et dans le
langage de T3) des axiomes de T3. En somme, en notant, pour l’occasion, ZF
l’ensemble des axiomes de la version MT2 de la théorie des ZF-structures [voir
§ IV.3.2, (x) et note 45] :
{(Λ1), (Λ2), (Λ3)} |=MT2 A ssi ZF ∪ {(M1.1), ..., (M2.3)} |=MT2 A*
(dans le langage de T1)
(dans le langage de T3)
Si l’explicitation de la thèse, même sur cet exemple simple, est un peu
laborieuse, la réfutation, elle, tient en une phrase: le second ensemble de
conséquences est récursivement énumérable, tandis que le premier ne l’est pas
(en fait le second est inclus dans le premier, mais, donc, il n’en constitue
qu’une partie propre).
49
On comparera la fausse équivalence ci-dessus avec l’instance pertinente du
second (et vrai) théorème de coopération :
{(Λ1), (Λ2), (Λ3)} |=MT2 A ssi {(M1.1), ..., (M2.3)} |=MT1 A*
(dans le langage de T1)
(dans le langage de T2)
50
Téléchargement