"Logique et théorie axiomatiques". JL Krivine

publicité
Logique et Théorie Axiomatiques
J.L. Krivine
2
Ce document est issu d’un polycopié de licence (actuelle L3) de l’université Paris 7 écrit dans les
années 1970, et distribué sous sa forme originale jusqu’à très récemment.
Il a été mis au format LATEX en août 2004 par Raphaël Giromini.
Compléments et corrections (de la copie) des chapitres 1 à 5, par Jean-Louis Krivine, Yves Legrandgérard, Paul Rozière.
Ne pas diffuser les chapitres 6 à 8, qui ne sont corrigés que partiellement.
État :
chap 6 : première relecture (superficielle sur les algèbres de Boole)
chap 7 : passage au correcteur orthographique (uniquement lexical)
chap 8 : passage du correcteur orthographique (uniquement lexical)
Envoyer les corrections à [email protected] (ou à l’auteur [email protected]).
Table des matières
I Éléments de Théorie des Ensembles.
1 Théorie intuitive des ensembles
1.1 Axiomes de Zermelo . . . . . . .
1.2 Quelques notions élémentaires.
1.2.1 Couple ordonné. . . . . .
1.2.2 Ensemble produit. . . . .
1.2.3 Relations binaires. . . . .
1.2.4 Fonctions. . . . . . . . . .
1.2.5 Applications composées.
1.2.6 Familles d’ensembles. . .
5
.
.
.
.
.
.
.
.
7
7
9
9
9
10
10
11
11
.
.
.
.
.
.
13
13
14
16
16
17
18
3 Ensembles finis et dénombrables.
3.1 Ensembles finis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Équipotence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Ensembles dénombrables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
19
20
20
.
.
.
.
.
.
.
.
2 Entiers Naturels.
2.1 Définition des entiers naturels. . .
2.2 Relation d’ordre sur les entiers. . .
2.3 Fonction sur les entiers. . . . . . .
2.3.1 L’addition des entiers. . . .
2.3.2 Le produit de deux entiers.
2.3.3 Exponentiation. . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Comparaison des ensembles infinis
23
4.1 Axiome du choix. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Ensembles non dénombrables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
5 Le théorème de Zorn.
29
5.1 Théorème de Zorn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.1.1 Démonstration du théorème de Zorn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2 Applications du Théorème de Zorn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
II Éléments du calcul des prédicats.
33
6 Calcul propositionnel et algèbres de Boole.
6.1 Syntaxe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Valeur d’une formule pour une distribution de valeurs de vérité.
6.3 Formes normales. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4 Algèbre de Boole. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.5 Algèbre de Boole du calcul propositionnel. . . . . . . . . . . . . .
6.5.1 Isomorphismes d’anneaux de Boole. . . . . . . . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
37
39
41
42
45
45
TABLE DES MATIÈRES
4
6.6 Théorème de compacité du calcul propositionnel. . . . . . . . . . . . . . . . . . . . . . . . . 45
6.7 Règles de déduction pour le calcul propositionnel. . . . . . . . . . . . . . . . . . . . . . . . . 47
7 Usage des connecteurs propositionnels et des quantificateurs.
7.1 Énonces sans quantificateurs. . . . . . . . . . . . . . . . . . .
7.2 Énoncés avec quantificateurs. . . . . . . . . . . . . . . . . .
7.3 Règle d’emploi des quantificateurs. . . . . . . . . . . . . . .
7.4 Forme prénexe. . . . . . . . . . . . . . . . . . . . . . . . . . .
7.5 Formes de Skolem et de Herbrand. . . . . . . . . . . . . . . .
7.5.1 Formes de Skolem. . . . . . . . . . . . . . . . . . . . .
7.5.2 Formes de Herbrand. . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
49
51
52
54
55
55
56
8 Calcul des prédicats.
8.1 Formules et modèles. . . . . . . . . . . . . . . . . . .
8.2 Formules universellement valides. . . . . . . . . . .
8.3 Introduction de symboles de fonction. . . . . . . .
8.4 Notion de formule avec paramètres. . . . . . . . . .
8.5 La théorie des ensembles de Zermelo. . . . . . . . .
8.6 Le théorème de Lowenhein-Skolem. . . . . . . . . .
8.6.1 Le paradoxe de Skolem. . . . . . . . . . . . .
8.7 Théorèmes de compacité des prédicats. . . . . . . .
8.8 Théorème de complétude du calcul des prédicats.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
57
59
61
62
62
63
65
65
66
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Première partie
Éléments de Théorie des Ensembles.
5
Chapitre 1
Théorie intuitive des ensembles
1.1 Axiomes de Zermelo
En mathématique, toutes les notions, ou presque, sont définies à partir de la notion d’ensemble. On
ne peut donc pas espérer définir ce qu’est un ensemble. Néanmoins, on voudrait pouvoir utiliser les
ensembles et faire des démonstrations avec eux sans avoir de doute sur la rigueur. Pour cela, on va se
baser sur l’idée intuitive que chacun possède plus ou moins, sur les ensembles, en la précisant quelque
peu.
On peut admettre sans difficulté que certaines choses méritent d’être appelées « ensemble » et certaines non : si la notion d’ensemble recouvrait n’importe quoi, ce n’aurait pas été la peine de lui donner
un nom. Les ensembles décrivent donc un certain domaine que nous nous proposons d’étudier.
Il y a deux relations fondamentales entre les ensembles : l’égalité et l’appartenance. Nous ne les
définissons pas : on considère que chacun sait ce que veut dire « les ensembles a, b sont égaux (ou
identiques) » (ce qu’on écrit a = b bien entendu) et « l’ensemble a appartient à l’ensemble b », (ce
qu’on écrit a ∈ b, on dit aussi « a est un élément de b »). Toutes les autres relations seront, elles, définies
à partir de ces deux-là.
Par exemple, on dira que « l’ensemble a est une partie (ou un sous-ensemble) de l’ensemble b » ou
encore que « a est contenu dans b » si chaque élément de a est aussi élément de b. La notation est a ⊂ b.
Nous allons, dans ce qui suit, énoncer certaines propriétés des ensembles, sous forme de règles :
comme on ne peut pas définir les ensembles, on se contente de dire ce qu’on peut faire et ce qu’on ne
peut pas faire avec eux. Ces règles constituent donc le « mode d’emploi » de la notion d’ensemble. On
les appelle « axiomes de la théorie des ensembles » ou « axiomes de Zermelo ». A part le premier, tous ces
axiomes ont l’allure générale suivante : certains ensembles étant donnés, il existe un ensemble ayant
telle et telle propriété vis-à-vis des ensembles donnés. Traditionnellement, ils portent les noms suivants : axiome d’extensionnalité, axiome de compréhension (ou séparation), axiome de la paire, axiome
de la réunion, axiome de l’ensemble des parties, axiome de l’infini, axiome du choix.
Ils expriment des propriétés plus ou moins évidentes de la notion d’ensemble, ce qui fait qu’à première vue on ne voit pas, au moins pour plusieurs d’entre eux, l’intérêt qu’il y a à les énoncer. L’intérêt
existe néanmoins, pour la raison suivante : les axiomes de Zermelo expriment, de façon exhaustive,
les propriétés des ensembles. Ce qui fait que chaque fois que l’on aura un doute sur la validité de la
construction de tel ou tel ensemble, c’est aux axiomes qu’il faudra se référer pour voir s’ils permettent
de faire cette construction. Or, en mathématiques, en toute rigueur, il faudrait avoir un doute à chaque
pas en avant qu’on se propose de faire . . .
A XIOME 1 (A XIOME D ’ EXTENSIONNALITÉ )
Pour que l’ensemble a soit égal à l’ensemble b, il faut et il suffit que tout élément de a soit élément de b et
inversement. Autrement dit,
a = b ⇔ (a ⊂ b et b ⊂ a)
7
CHAPITRE 1. THÉORIE INTUITIVE DES ENSEMBLES
8
A XIOME 2 (A XIOME DE SÉPARATION ( OU DE COMPRÉHENSION ))
Étant donné un ensemble a et une propriété P (x) (portant sur un ensemble variable x) il existe un ensemble b dont les éléments sont ceux, parmi les éléments de a, qui ont la propriété P (x).
Notons que d’après l’axiome d’extensionnalité, un tel ensemble b est déterminé de façon unique.
Remarque. On a pensé à énoncer l’axiome suivant : étant donné une propriété P (x), il existe un ensemble b dont les éléments sont les ensembles qui ont la propriété P (x).
Mais cela mène à une contradiction quand on prend comme propriété P (x) : x 6∈ x (autrement dit la
propriété pour un ensemble de ne pas s’appartenir à lui-même). En effet, l’énoncer précédent donne
alors un ensemble b tel que pour tout ensemble x on ait x ∈ b ⇔ x 6∈ x. En particulier, pour x = b on
obtient b ∈ b ⇔ b 6∈ b ce qui est évidemment faux.
Cette remarque a été faite par B. Russell (d’où son nom : le paradoxe de Russell) et a imposé l’axiome de
compréhension tel que nous l’avons énoncé.
Ensembles et propriétés. L’ensemble des éléments de l’ensemble a qui ont la propriété P (x) est noté :
{x ∈ a ; P (x)}
Il existe un ensemble et un seul qui n’a aucun élément, on le note ; et on l’appelle « ensemble
vide ». Pour montrer son existence, on prend n’importe quel ensemble a et on considère {x ∈ a ; x 6= x} ;
cet ensemble n’a aucun élément. L’unicité est due à l’axiome d’extensionnalité.
Il n’existe aucun ensemble qui ait tous les ensembles comme éléments : en effet, si a est un tel
ensemble, on pose b = {x ∈ a ; x 6∈ x}. Alors pour tout ensemble x, on a x ∈ b ⇔ x 6∈ x, d’où une contradiction comme pour le paradoxe de Russell.
A XIOME 3 (A XIOME DE LA PAIRE )
a, b étant des ensembles, il existe un ensemble qui a comme éléments a, b et eux seulement.
D’après l’axiome d’extensionnalité, il existe un seul ensemble ayant cette propriété, on le note {a, b}.
En particulier, lorsque a = b, on voit qu’il existe un ensemble dont a est le seul élément. On le note {a}.
A XIOME 4 (A XIOME DE LA RÉUNION )
Étant donné un ensemble a, il existe un ensemble b dont les éléments sont les ensembles qui appartiennent à un élément de a.
Cet ensemble
b (unique d’après l’axiome d’extensionnalité) est appelé « réunion des éléments de a » et
[
noté
x.
x∈a
Étant donné deux ensembles a, b, on appelle réunion de a et b (et on note a ∪ b) la réunion des
éléments de l’ensemble {a, b}. Pour tout ensemble x, on a donc
x ∈ a ∪ b ⇔ (x ∈ a ou x ∈ b) .
A l’aide de l’axiome d’extensionnalité, on voit aisément que
a ∪ b = b ∪ a ; a ∪ (b ∪ c) = (a ∪ b) ∪ c .
Ce dernier ensemble est noté a ∪ b ∪ c et est appelé réunion des ensemble a, b, c. On définit de même
la réunion de quatre ensemble a, b, c, d , etc.
Étant donné trois ensemble a, b, c, il existe un ensemble qui a comme éléments a, b, c et eux seulement : c’est {a} ∪ {b} ∪ {c}. On le note {a, b, c}. On définit de même l’ensemble {a, b, c, d }, etc.
Étant donné deux ensembles a, b, on appelle intersection de a et b (et on note a ∩ b) l’ensemble
{x ∈ a ; x ∈ b} (défini grâce à l’axiome de compréhension). On a donc pour tout ensemble x,
x ∈ a ∩ b ⇔ x ∈ a et x ∈ b .
On voit immédiatement, à l’aide de l’axiome d’extensionnalité que
a ∩ b = b ∩ a ; a ∩ (b ∩ c) = (a ∩ b) ∩ c .
1.2. QUELQUES NOTIONS ÉLÉMENTAIRES.
9
Ce dernier ensemble est noté a ∩ b ∩ c et appelé intersection des ensemble a, b, c. On défini de même
l’intersection de quatre ensemble a, b, c, d , etc. Toujours à l’aide de l’axiome d’extensionnalité, on voit
que
a ∪ (b ∩ c) = (a ∪ b) ∩ (a ∪ c) et a ∩ (b ∪ c) = (a ∩ b) ∪ (a ∩ c) .
Étant donné un ensemble A et une partie X de A, l’ensemble {x ∈ A ; x 6∈ X } (défini grâce à l’axiome de
compréhension) est appelé complémentaire de X par rapport à A et noté ∁ A X (ou encore A − X ). On
voit aisément, à l’aide de l’axiome d’extensionnalité que si X , Y ⊂ A, on a
∁ A (X ∪ Y ) = ∁ A X ∩ ∁ A Y et ∁ A (X ∩ Y ) = ∁ A X ∪ ∁ A Y .
A XIOME 5 (A XIOME DE L’ ENSEMBLE DES PARTIES )
Pour tout ensemble a, il existe un ensemble b dont les éléments sont les sous-ensembles de a.
Cet ensemble b (unique d’après l’axiome d’extensionnalité) est appelé ensemble des parties de a et
noté P (A).
Nous énoncerons plus tard les deux derniers axiomes de la théorie des ensembles : l’axiome de
l’infini et l’axiome du choix.
1.2 Quelques notions élémentaires.
1.2.1 Couple ordonné.
Étant donné deux ensembles a, b, on appelle « couple ordonné dont le premier élément est a et le
second b », l’ensemble {{a}, {a, b}}. On le note (a, b).
T HÉORÈME 1.2.1
Si (a, b) = (a ′ , b ′ ), alors a = a ′ et b = b ′ .
On a en effet {{a}, {a, b}} = {{a ′ }, {a ′ , b ′ }} et il y a donc deux possibilités :
1. {a} = {a ′ } et {a, b} = {a ′ , b ′ } ; d’où a = a ′ et b = b ′ .
2. {a} = {a ′ , b ′ } et a ′ = {a, b} ; d’où a ′ = b ′ = a et a = b = b ′ , donc a = a ′ = b = b ′ .
C . Q . F. D.
Étant donné trois ensembles a, b, c, on appelle « triplet ordonné dont le premier élément est a, le second
b et le troisième c » l’ensemble (a, (b, c)). On le note (a, b, c).
T HÉORÈME 1.2.2
Si (a, b, c) = (a ′ , b ′ , c ′ ) alors a = a ′ , b = b ′ et c = c ′ .
En effet on a (a, (b, c)) = (a ′ , (b ′ , c)) donc a = a ′ et (b, c) = (b ′ , c ′ ) d’après le théorème précédent. D’où
b = b ′ et c = c ′ .
C . Q . F. D.
On définit de même le quadruplet ordonné (a, b, c, d ) en posant (a, b, c, d ) = (a, (b, c, d )). Donc si (a, b, c, d ) =
(a ′ , b ′ , c ′ , d ′ ) alors a = a ′ , b = b ′ , c = c ′ et d = d ′ . Et ainsi de suite.
1.2.2 Ensemble produit.
Étant donné deux ensembles A, B , il existe un ensemble P donc les éléments sont les couples ordonnés
(x, y) avec x ∈ A et y ∈ B .
En effet, si x ∈ A, y ∈ B , alors {x}, {x, y} appartiennent à P (A ∪ B ). Donc {{x}, {x, y}} ⊂ P (A ∪ B ) et
donc {{x}, {x, y}} ∈ P (P (A ∪ B )). On définit alors P à l’aide de l’axiome de compréhension, en posant
P = {z ∈ P (P (A ∪ B ))} ; z est un couple (x, y) avec x ∈ A, y ∈ B }
et il est clair que P est l’ensemble cherché. Cet ensemble P est appelé produit de A et B , et noté A × B .
Étant donné trois ensemble A, B , C , l’ensemble des triplets (x, y, z) avec x ∈ A, y ∈ B et z ∈ C est
l’ensemble A × (B ×C ). On le note A × B ×C et on l’appelle produit des ensembles A, B , C .
CHAPITRE 1. THÉORIE INTUITIVE DES ENSEMBLES
10
1.2.3 Relations binaires.
Une relation binaire R sur un ensemble E est, par définition, un sous-ensemble de E 2 , c’est-à-dire
un ensemble de couples (x, y) avec x, y ∈ E .
– R est dite réflexive si (x, x) ∈ R pour tout x ∈ R.
– R est dite symétrique si (x, y)
£ ∈ R ⇒ (y, x) ∈ R
¤
– R est dite antisymétrique
si
(x, y) ∈ R et (y, ¤x) ∈ R ⇒ x = y.
£
– R est dite transitive si (x, y) ∈
£ R et (y, z) ∈ R ⇒ (x, z)
¤ ∈ R.
– R est dite totale si x, y ∈ E ⇒ (x, y) ∈ R ou (y, x) ∈ R .
Si R est une relation binaire sur E , réflexive, antisymétrique et transitive, on dit que R est une relation
d’ordre sur E . Si, de plus, R est totale, on dit que R est une relation d’ordre total sur E .
Si R est une relation binaire sur E, réflexive, symétrique et transitive, on dit que R est une relation d’équivalence sur E .
Si a ∈ E , l’ensemble {x ∈ E ; (x, a) ∈ R} est appelé classe d’équivalence de a (mod R).
Notons ā la classe d’équivalence de a. Il existe un ensemble E ′ qui a comme éléments les classes d’équivalence des éléments de E .
En effet, si a ∈ E , alors ā ⊂ E , donc ā ∈ P (E ). Donc, si on pose
E ′ = {X ∈ P (E ) ; il existe a ∈ E tel que X = ā}
(E ′ est défini grâce à l’axiome de compréhension) E ′ est l’ensemble cherché. On l’appelle ensemble
quotient de E par la relation d’équivalence R, et on le note E /R.
On appelle « partition de E » un sous-ensemble P de P (E ) tel que :
– X ∈ P ⇒ X 6= ;
– X , Y ∈ P et X 6= Y ⇒ X ∩ Y = ;
S
– X ∈P X = E
Alors, E /R est une partition de E , comme on le voit immédiatement. Inversement, si P est une partition
de E , on lui associe une relation d’équivalence R sur E définie par :
(x, y) ∈ R ⇔ il existe un élément X de P tel que x, y ∈ X
Les relations d’équivalence sur l’ensemble E correspondent donc canoniquement aux partitions de E .
1.2.4 Fonctions.
Une application de l’ensemble A dans l’ensemble B (ou encore une fonction définie sur l’ensemble
A à valeurs dans B ), est par définition, un sous ensemble f de A × B qui a la propriété suivante : pour
tout élément x ∈ A, il existe un élément y ∈ B et un seul tel que (x, y) ∈ f . On écrit alors y = f (x) au lieu
de (x, y) ∈ f . On écrit f : A → B pour « f est une application de A dans B ».
Il existe un ensemble C dont les éléments sont les applications de A dans B . En effet, si f est une
application de A dans B , alors f ⊂ A × B , donc f ∈ P (A × B ). On peut donc (au moyen de l’axiome de
compréhension) définir l’ensemble
C = { f ∈ P (A × B ) ; f est une application de A dans B }
qui est l’ensemble cherché. L’ensemble des applications de A dans B est noté B A .
Par exemple, si A = ;, B A = {;} (; est une fonction de domaine ; et c’est la seule). Si B = ; et A 6= ;
on a B A = ; (il n’y a aucune fonction de domaine A 6= ; à valeur dans ;).
Une application f : A → B est dite :
– injective si x, x ′ ∈ A, x 6= x ′ ⇒ f (x) 6= f (x ′ )
– surjective si pour tout y ∈ B , il existe x ∈ A tel que y = f (x)
– bijective (ou biunivoque de A sur B ) si elle est à la fois injective et surjective.
Si f est une application biunivoque de A sur B , l’ensemble des couples (y, x) avec x ∈ A, y ∈ B et
(x, y) ∈ f est alors une application de B sur A qu’on note f −1 et qu’on appelle application inverse (ou
réciproque) de f .
1.2. QUELQUES NOTIONS ÉLÉMENTAIRES.
11
1.2.5 Applications composées.
Soit f : A → B et g : B → C . Désignons par ϕ l’ensemble des couples (x, z) avec x ∈ A, z ∈ C , tels qu’il
existe y ∈ B avec (x, y) ∈ f et (y, z) ∈ g . Il est facile de montrer que ϕ est alors une application de A dans
C . On l’appelle « application composée de f et de g » et on la note g ◦ f . Pour tout x ∈ A, on a donc
g ◦ f (x) = g ( f (x)).
Soient f : A → B , g : B → C , h : C → D on a alors
h ◦ (g ◦ f ) = (h ◦ g ) ◦ f .
En effet, on a :
(x, t ) ∈ h ◦ (g ◦ f ) ⇔ il existe z ∈ C tel que (x, z) ∈ g ◦ f et (z, t ) ∈ h.
⇔ il existe z ∈ C et y ∈ B tels que (x, y) ∈ f , (y, z) ∈ g et (z, t ) ∈ h.
⇔ il existe y ∈ B tel que (x, y) ∈ f et (y, t ) ∈ h ◦ g .
⇔ (x, t ) ∈ (h ◦ g ) ◦ f .
C . Q . F. D.
Soit f une application de A dans B ; on lui associe deux applications : f˙ : P (A) → P (B ) et f −1 :
P (B ) → P (A) (à ne pas confondre, malgré la notation identique, avec l’application réciproque de f ,
qui n’est définie que lorsque f est biunivoque). Elles sont définies de la façon suivante :
– si X ∈ P (A), f˙(X ) = {y ∈ B il existe x ∈ X tel que y = f (x)}
– si Y ∈ P (B ), f −1 (Y ) = {x ∈ A ; f (x) ∈ Y }
˙
f (X ) est appelé l’image de X par la fonction f et f −1 (Y ) l’image réciproque de Y par la fonction f . En
particulier, f˙(A) est appelé l’image de la fonction f .
Soient X , X ′ ⊂ A et Y , Y ′ ⊂ B , on a les propriétés suivantes :
f˙(X ∪ X ′ )
f˙(X ∩ X ′ )
=
⊂
f˙(X ) ∪ f˙(X ′ )
f˙(X ) ∩ f˙(X ′ )
f −1 (Y ∪ Y ′ )
f −1 (Y ∩ Y ′ )
f −1 (∁B Y )
=
=
=
f −1 (Y ) ∪ f −1 (Y ′ )
f −1 (Y ) ∩ f −1 (Y ′ )
∁ A f −1 (Y )
1.2.6 Familles d’ensembles.
Étant donné un ensemble I , une fonction de domaine I (à valeur dans un ensemble quelconque
A) est aussi appelée famille d’ensembles indexée par I . On la note alors (a i )i ∈I ; I est appelé l’ensemble
d’indices de la famille I .
S
On appelle réunion de la famille (a i )i ∈I (et on la note i ∈I a i ) la réunion d’éléments de l’image de la
fonction f (on utilise ici l’axiome de la réunion).
En particulier, si I = ;, on a f = ;. L’image de f est donc ; et donc aussi la réunion des éléments de
l’image de f . Donc il n’y a qu’une seule famille dont l’ensemble d’indices est vide (on l’appelle la famille
vide). Sa réunion est ;.
Supposons maintenant I 6= ;. Alors il existe un ensemble C dont les éléments sont les ensembles qui
appartiennent à tous les éléments de l’image de f . En effet, puisque I 6= ;, on prend i 0 ∈ I . Un ensemble
qui appartient à tous les a i appartient en particulier à a i 0 .
On peut donc définir C en posant
C = {x ∈ a i 0 ; x appartient à tous les éléménts de l’image de f }
(on utilise ici l’axiome de compréhension).
\
Cet ensemble C est appelé « intersection de la famille (a i )i ∈I » et noté
a i . Notons que cette interseci ∈I
tion n’est définie que pour une famille non vide.
Étant donné une famille d’ensemble (a i )i ∈I , il existe un ensemble C dont les éléments sont les fonctions
ϕ de domaine I telle que ϕ(i ) ∈ a i pour tout i ∈ I .
[
[
En effet, une telle fonction ϕ est une application de I dans
a i donc un éléments de ( a i )I . On peut
i ∈I
donc poser, en utilisant l’axiome de compréhension :
[
C = {ϕ ∈ ( a i )I ; ϕ(i ) ∈ a i pour tout i ∈ I } .
i ∈I
i ∈I
12
CHAPITRE 1. THÉORIE INTUITIVE DES ENSEMBLES
Cet ensemble est appelé « produit de la famille (a i )i ∈I » et noté
Y
i ∈I
ai .
Chapitre 2
Entiers Naturels.
2.1 Définition des entiers naturels.
On commence par définir chacun des entiers naturels 0, 1, 2, . . . L’idée de la définition est la suivante : l’entier 5, par exemple, doit être un ensemble qui a cinq éléments. Si on a déjà défini 0, 1, 2, 3, 4,
il est alors naturel de poser 5 = {0, 1, 2, 3, 4}.
On définit donc successivement :
0 = ; ; 1 = {0} ; 2 = {0, 1} ; 3 = {0, 1, 2} ; . . .
On a donc :
1 = {;} ; 2 = {;, {;}} ; 3 = {{;, {;}, {;, {;}}} ; . . .
L’opération qui permet de passer d’un entier au suivant est une opération très simple sur les ensembles : celle qui, à l’ensemble x, associe l’ensemble x ∪ {x} (c’est-à-dire l’ensemble dont les éléments
sont x et les éléments de x). En effet on a, par exemple, 12 = {0, 1, 2, . . . , 11} et 13 = {0, 1, 2, . . . , 11, 12} donc
13 = 12 ∪ {12}.
Dans la suite de ce chapitre on utilisera la notation x + pour désigner l’ensemble x ∪ {x}.
On se propose de définir l’ensemble des entiers. Cet ensemble A doit avoir les propriétés suivantes :
½
;∈ A
(∗)
si x ∈ A alors x + ∈ A .
On ne peut pas déduire des axiomes déjà énoncés l’existence d’un ensemble A ayant les propriétés
(∗). On énonce donc un nouvel axiome :
A XIOME 6 (A XIOME DE L’ INFINI )
Il existe un ensemble A tel que ; ∈ A et si x ∈ A alors x ∪ {x} ∈ A.
On montre alors le théorème suivant :
T HÉORÈME 2.1.1
Il existe un ensemble et un seul qui a les propriétés (∗) et qui est contenu dans tout ensemble A qui a les
propriétés (∗).
On considère un ensemble A qui a les propriétés (∗), il en existe un d’après l’axiome de l’infini.
Soit B l’intersection de tous les sous-ensembles de A qui ont les propriétés (∗). Il est immédiat que B a
encore les propriétés (∗).
Soit C un ensemble quelconque ayant les propriétés (∗) ; alors C ∩ A a encore cette propriété et c’est
un sous-ensemble de A ; donc B ⊂ C ∩ A, par définition de B . Par suite B ⊂ C , ce qui montre que B est
l’ensemble cherché.
Si B ′ a la propriété (∗) et est inclus dans tout ensemble ayant la propriété (∗), alors B ′ ⊂ B et B ⊂ B ′
donc B = B ′ .
C . Q . F. D.
13
CHAPITRE 2. ENTIERS NATURELS.
14
L’ensemble défini par le théorème précédent est appelé ensemble des entiers naturels et désigné par
N. Par définition un entier naturel est donc un élément de N, autrement dit un ensemble qui appartient
à tout ensemble ayant la propriété (∗).
2.2 Relation d’ordre sur les entiers.
Il s’agit maintenant de démontrer pour l’ensemble N ainsi défini, les propriétés que l’on sait intuitivement être vraies pour l’ensemble des entiers naturels. Pour cela on va définir sur N une relation
d’ordre et montrer qu’elle a les propriétés suivantes :
1. N est totalement ordonné et a pour plus petit élément 0.
2. Tout élément n de N a un successeur n + = n ∪ {n} (autrement dit l’ensemble des majorants stricts
de n a un plus petit élément qui est n + ).
3. Tout élément n 6= 0 de N a un prédécesseur (c’est-à-dire un entier m tel que m + = n).
4. Si une propriété P (x) est vraie pour 0, et si P (n) ⇒ P (n + ) pour tout n ∈ N, alors P (n) est vraie pour
tout n ∈ N.
On montre d’abord la propriété (4) : Soit A l’ensemble des entiers qui ont la propriété P (x) (A = {x ∈
N : P (x)} est défini à l’aide de l’axiome de compréhension). Alors 0 ∈ A et si x ∈ A alors x + ∈ A. Donc A a
les propriétés (∗) et (par définition de N) on a N ⊂ A. Tout entier a donc la propriété P (x). La propriété
(4) s’appelle le principe d’induction ; on va l’utiliser constamment dans toutes les démonstrations sur
N.
Montrons maintenant la propriété (3). Soient B = {n ∈ N ; il existe m ∈ N tel que m + = n} et A =
B ∪ {0}. Alors 0 ∈ A, si x ∈ A on a évidement x + ∈ B , donc x + ∈ A. Donc A a les propriétés (∗) et par suite
N ⊂ A ; cela veut dire que tout entier non nul a un prédécesseur.
L EMME 2.2.1
Si n ∈ N et m ∈ n alors m ∈ N (tous les éléments d’un entier sont des entiers).
On le montre par induction sur n. La propriété est vraie si n = 0 (n n’a pas d’élément). Supposons-la
vraie pour n. Si m ∈ n + comme n + = n ∪ {n} on a ou bien m ∈ n donc m est entier (hypothèse d’induction), ou bien m = n et m est encore entier.
C . Q . F. D.
L EMME 2.2.2
Si n est entier et si m ∈ n, alors m ⊂ n.
Par induction sur n. C’est évident si n = 0. On suppose que c’est vraie pour n et soit m ∈ n ∪{n}. Alors
ou bien m ∈ n donc m ⊂ n (hypothèse d’induction) donc m ⊂ n ∪ {n} ; ou bien m = n, donc m ⊂ n ∪ {n}.
C . Q . F. D.
L EMME 2.2.3
Si n est entier, n 6∈ n.
C’est évident si n = 0 (n n’a pas d’élément). Supposons que n 6∈ n et que n ∪ {n} ∈ n ∪ {n}. On a alors
ou bien n ∪ {n} = n ou bien n ∪ {n} ∈ n. Dans le premier cas on a n ∈ n (car n ∈ n ∪ {n}) ce qui contredit
l’hypothèse. Dans le second, on a n ∪ {n} ⊂ n (lemme 2.2.2). Or n ∈ n ∪ {n}, donc n ∈ n contrairement à
l’hypothèse.
C . Q . F. D.
L EMME 2.2.4
Si m, n sont entiers et m ⊂ n alors m = n ou bien m ∈ n.
On le montre par induction sur n : la propriété P (n) est alors « pour tout entier m, si m ⊂ n alors
m = n ou m ∈ n ».
C’est évident si n = 0 (car m ⊂ n ⇒ m = 0). Supposons que l’on ait P (n) et soit m ⊂ n ∪ {n} ; si n 6∈ m
alors m ⊂ n et donc (hypothèse d’induction) m = n ou m ∈ n ; dans ce cas m ∈ n ∪ {n}. Si n ∈ m on a
2.2. RELATION D’ORDRE SUR LES ENTIERS.
15
n ⊂ m (lemme 2.2.2) et {n} ⊂ m (car cela équivaut à n ∈ m). Donc n ∪ {n} ⊂ m et comme par hypothèse
on a l’inclusion inverse, m = n ∪ {n}.
C . Q . F. D.
L EMME 2.2.5
Si m est un entier non nul, alors 0 ∈ m.
On montre par induction sur m que m = 0 ou 0 ∈ m. C’est évident si m = 0, si c’est vrai pour m on
a nécessairement 0 ∈ m ∪ {m} : car ou bien m = 0 et on sait que m ∈ m ∪ {m} ou bien m 6= 0 donc 0 ∈ m
(hypothèse d’induction) et 0 ∈ m ∪ {m}.
C . Q . F. D.
L EMME 2.2.6
Si m, n sont entiers, alors un et un seul de trois cas suivants est réalisé : n ∈ m, n = m ou m ∈ n.
Montrons d’abord l’unicité : si n ∈ m et n = m on a m ∈ m ce qui est impossible (lemme 2.2.3) ; si
n ∈ m et m ∈ n on a n ⊂ m (lemme 2.2.2) et comme m ∈ n, on a m ∈ m ce qui est impossible.
On montre alors, par induction sur n, la propriété P (n) : « pour tout entier m, m ∈ n, m = n ou
n ∈ m. »
Si n = 0 c’est vrai d’après le lemme 2.2.4.
Supposons P (n) et considérons n ∪ {n} et un entier quelconque m. Par hypothèse on a donc m ∈ n,
m = n ou n ∈ m.
– Si m ∈ n ou m = n alors m ∈ n ∪ {n}.
– Si n ∈ m on a n ⊂ m (lemme 2.2.2) et {n} ⊂ m donc n ∪{n} ⊂ m. Par suite (lemme 2.2.4) n ∪{n} = m
ou n ∪ {n} ∈ m.
C . Q . F. D.
On définit alors une relation d’ordre sur N en posant m ≤ n si et seulement si m ⊂ n. D’après le
lemme 2.2.4, on a m < n si et seulement si m ∈ n. D’après le lemme 2.2.6 cette relation d’ordre est
totale. D’après le lemme 2.2.5, elle a 0 pour plus petit élément (propriété (1)).
Si m, n sont entiers on a m < n ⇔ m ∈ n et m ≤ n ⇔ m ⊂ n, donc m < n ⇔ (m ∈ n et m ⊂ n), c’est-àdire m < n ⇔ m ∪ {m} ⊂ n, et donc m < n ⇔ m ∪ {m} ≤ n. L’ensemble des majorants stricts de m a donc
un plus petit élément qui est m ∪ {m}. On a ainsi terminé la démonstration des propriétés (1), (2), (3) et
(4).
C . Q . F. D.
Dans toute la suite, nous ne nous servirons plus explicitement de la définition de N, mais seulement
du fait que N satisfait les propriétés (1), (2), (3) et (4).
T HÉORÈME 2.2.7
Si m, n ∈ N et m + = n + , alors m = n.
En effet, si m 6= n, on a par exemple m < n. Donc m + ≤ n (par définition du successeur). Comme
n < n + , on a m + < n + ce qui contredit l’hypothèse.
C . Q . F. D.
T HÉORÈME 2.2.8
Tout ensemble d’entier qui est non vide a un plus petit élément.
Soit X un sous-ensemble de N qui n’a pas de plus petit élément. On considère la propriété P (n) : « n
est un entier et aucun entier m ≤ n n’est élément de X ».
Comme X n’a pas de plus petit élément, en particulier 0 6∈ X et donc P (0). De plus P (n) ⇒ P (n + )
pour tout entier n : car n + n’étant pas le plus petit élément de X , si aucun entier inférieur ou égal à n
n’est élément de X , aucun entier inférieur ou égal à n + ne peut être élément de X .
D’après le principe d’induction, P (n) est donc vrai pour tout entier n mais cela implique que X est
vide. On en déduit le résultat par contraposée.
C . Q . F. D.
CHAPITRE 2. ENTIERS NATURELS.
16
2.3 Fonction sur les entiers.
On considère un ensemble quelconque E 6= ;, un élément a de E et une application H : N × E → E .
T HÉORÈME 2.3.1
Il existe une application f de N dans E , et une seule, telle que f (0) = a et f (n + ) = H (n, f (n)) pour tout
entier n.
Unicité. Considérons deux fonctions f , g ayant cette propriété. Si f 6= g , l’ensemble {n ∈ N ; f (n) 6=
g (n)} est non vide, donc a un plus petit élément m ; m 6= 0 car f (0) = g (0) = a. Donc m a un
prédécesseur p ; on a f (p) = g (p), donc H (p, f (p)) = H (p, g (p)) soit f (p + ) = g (p + ) c’est-à-dire
f (m) = g (m), ce qui contredit la définition de m.
Existence. On considère les sous-ensembles M de N × E qui ont les propriétés suivantes :
½
(0, a) ∈ M
si (n, y) ∈ M alors (n + , H (n, y)) ∈ M
Il est clair que l’intersection M 0 de tous ces ensembles M de N × E a encore ces propriétés. C’est
donc le plus petit sous-ensemble de N × E qui a ces propriétés. On va en déduire que c’est le
graphe d’une application de N dans E .
Pour tout entier n, il existe y ∈ E tel que (n, y) ∈ M 0 : c’est vrai pour n = 0, puisque (0, a) ∈ M 0 ; si
c’est vrai pour n, c’est vrai pour n + d’après la deuxième propriété satisfaite par M 0 .
Pour tout entier n, si (n, y) ∈ M 0 et (n, z) ∈ M 0 alors y = z. On raisonne par l’absurde et on considère le premier entier m tel qu’il existe y, z ∈ E , y 6= z, (m, y) ∈ M 0 , (m, z) ∈ M 0 .
Si m = 0, on a par exemple y 6= a ; soit M 0′ l’ensemble obtenu en ôtant (0, y) de M 0 (M 0′ = M 0′ −
{(0, y)}) ; Alors M 0′ a les deux propriétés ci-dessus. et est strictement inclus dans M 0 , ce qui contredit la définition de M 0 .
On a donc m 6= 0 et par suite m = p + . D’après la définition de m, il existe un élément t et un
seul de E tel que (p, t ) ∈ M 0 ; alors (p + , H (p, t )) ∈ M 0 et on a, par exemple y 6= H (p, t ). On pose
M 0′ = M 0 − {(m, y)} = M 0 − {(p + , y)}. Alors M 0′ a les deux propriétés ci-dessus : car (0, a) ∈ M 0 et
(0, a) 6= (m, y), donc (0, a) ∈ M 0′ . Si (n, u ∈ M 0′ alors (n + , H (n, u)) ∈ M 0 et (n + , H (n, u)) 6= (m, y) :
c’est évident si n + 6= m et si n + = m alors n = p, donc u = t et y 6= H (p, t ). Donc (n + , H (n, u)) ∈ M 0′ .
Comme M 0′ est strictement inclus dans M 0 , on a encore contredit la définition de M 0 .
M 0 est donc le graphe d’une application f de N dans E et on a bien f (0) = a, f (n + ) = H (n, f (n))
pour chaque entier n.
C . Q . F. D.
Quand on utilise ce théorème pour définir une fonction f , on dit que f est définie par induction sur
les entiers.
2.3.1 L’addition des entiers.
Elle est définie par induction. Étant donné un entier k, on défini k + n par induction sur n par les
conditions :
½
k +0
= k
k + n + = (k + n)+
D’après cette définition on a k +1 = k + , et nous utiliserons la notation k +1 pour le successeur de l’entier
k.
Associativité de l’addition. k +(n +p) = (k +n)+p, ce qu’on montre par induction sur p. C’est évident
si p = 0, et on a
k + (n + p + ) = k + (n + p)+ = [k + (n + p)]+
D’après l’hypothèse d’induction, k + (n + p) = (k + n) + p et donc
k + (n + p + ) = [(k + n) + p]+ = (k + n) + p + .
2.3. FONCTION SUR LES ENTIERS.
17
Commutativité de l’addition. On montre d’abord, par induction sur k, que 0 + k = k + 0 = k. C’est
évident si k = 0, et on a
0 + k + = (0 + k)+ = k + = k + + 0 .
On montre ensuite 1 + k = k + 1 ; c’est évident si k = 0, et on a
1 + k + = (1 + k)+ = (k + 1)+ = k ++ = k + + 1 .
On montre alors, par induction sur k que k + n = n + k : c’est déjà fait si k = 0 ; et on a
k + + n = (k + 1) + n = (1 + k) + n = 1 + (k + n) = 1 + (n + k)
= (1 + n) + k = (n + 1) + k = n + (1 + k) = n + k + .
2.3.2 Le produit de deux entiers.
Il est aussi défini par induction. Étant donné un entier k, on définit n.k par induction sur k, par les
conditions suivantes :
½
n ·0
= 0
n(k + 1) = n · k + n
Distributivité du produit par rapport à l’addition. On montre par induction sur k que n(m + k) =
n · m + n · k. C’est évident si k = 0, et on a :
n(m + k + ) = n[(m + k) + 1]
= n(m + k) + n
= nm + nk + n
= nm + nk + .
(hypothèse d’induction)
associativité du produit. On montre par induction sur k que n(mk) = (nm)k. C’est évident si k = 0, et
on a
(nm)k + = (nm)k + nm
= n(mk) + nm
= n(mk + m)
= n(mk + ) .
(hypothèse d’induction)
(distributivité)
Commutativité du produit. On montre d’abord par induction sur k que 0 · k = k · 0 = 0. C’est évident
si k = 0, et :
0 · k+ = 0 · k + 0 · 1
=0.
(distributivité)
On montre ensuite, par induction sur k, que (n + 1)k = nk + k. C’est évident si k = 0 ; et on a :
(n + 1)k +
= (n + 1)k + (n + 1)
= nk + k + n + 1
= (nk + n) + (k + 1)
= n(k + 1) + (k + 1) .
(distributivité)
(hypothèse d’induction)
On montre enfin que kn = nk par induction sur k. C’est évident si k = 0 et on a :
nk + = nk + n
= kn + n
= (k + 1)n
(hypothèse d’induction)
(d’après ce qu’on vient de montrer).
CHAPITRE 2. ENTIERS NATURELS.
18
2.3.3 Exponentiation.
Étant donné un entier k, on définit k n par induction sur n par les conditions :
½
k0
k n+1
=
=
1
kn · k .
On montre aisément par induction sur p les propriétés :
k n+p = k n · k p ; (k n )p = k n·p .
Chapitre 3
Ensembles finis et dénombrables.
3.1 Ensembles finis.
Un ensemble a est dit fini s’il existe une bijection de a sur un entier.
T HÉORÈME 3.1.1
Si a est un ensemble fini, il existe un et un seul entier qui puisse être mis en bijection avec a. Cet entier est
appelé le cardinal de a ou encore le nombre d’éléments de a. Il est noté a
On montre d’abord le lemme suivant :
L EMME 3.1.2
Soient a un ensemble non vide, x 0 ∈ a, f une bijection de a sur un entier n. Alors n 6= 0 et il existe une
bijection de a − {x 0 } sur n − 1.
Il est clair que n 6= 0, donc n = p + 1 = p ∪ {p}. Si f (x 0 ) = p, la restriction de f à a − {x 0 } est une
bijection de cet ensemble sur p = n − 1. Si f (x 0 ) = m < p, soit y 0 l’élément tel que f (y 0 ) = p ; on définit
g : a → n en posant g (x 0 ) = p, g (y 0 ) = m et g (x) = f (x) pour tout élément x ∈ a, x 6= x 0 , y 0 . Alors g est
une bijection de a sur n et g (x 0 ) = p, on est ramené au cas précédent.
C . Q . F. D.
On montre alors le théorème par l’absurde.
Pour cela, on choisit le plus petit entier n tel qu’il existe un ensemble a, en bijection avec n et avec
un entier n ′ 6= n. On a alors n < n ′ donc n ′ 6= 0 et donc a 6= ; (car a est en bijection avec n ′ ) ; donc n 6= 0.
On pose n = p + 1, n ′ = p ′ + 1, donc p < p ′ . On prend x 0 ∈ a, d’après le lemme précédent a − {x 0 } est en
bijection avec p et avec p ′ . Comme p < n, on a une contradiction avec la définition de n.
C . Q . F. D.
T HÉORÈME 3.1.3
Si a est un ensemble fini et b une partie de a, alors b est fini et b ≤ a. De plus, si b 6= a, alors b < a.
On le montre par induction sur sur le cardinal n de a. Si n = 0, a = ; et le théorème est évident.
Supposons-le vrai pour un entier n et soient a un ensemble fini de cardinal n + 1, b ⊂ a. Si b = a, le
résultat est évident. Si b 6= a, on choisit x 0 ∈ b − a. Alors b ⊂ a − {x 0 } et a − {x 0 } a pour cardinal n, d’après
le lemme précédent. Donc b ≤ n (hypothèse d’induction) et par suite b < a.
C . Q . F. D.
T HÉORÈME 3.1.4
si a, b sont deux ensembles finis disjoints, A ∪ B = A + B . Si a, b sont deux ensembles finis quelconques,
a × b = a.b et P (a) = 2a .
Démonstration par induction sur n = a.
19
CHAPITRE 3. ENSEMBLES FINIS ET DÉNOMBRABLES.
20
3.2 Équipotence
Deux ensembles quelconques a, b seront dit équipotents s’il existe une bijection de a sur b. On dit
aussi que a et b ont le même cardinal ou encore la même puissance. Mais on ne définira pas, comme
dans le cas des ensembles finis, le cardinal d’un ensemble quelconque a. On utilisera provisoirement la
notation a ∼ b pour « a est équipotent à b ». On a évidemment les propriétés suivantes :
a∼a
a ∼b⇔b∼a
(a ∼ b et b ∼ c) ⇒ a ∼ c
Un ensemble est donc fini si et seulement s’il est équipotent à un entier. Dans le cas contraire, il est
dit infini.
3.3 Ensembles dénombrables.
Un ensemble est dit dénombrable s’il est équipotent à N. Notons qu’un ensemble dénombrable est
nécessairement infini (sinon N lui-même serait un ensemble fini, donc équipotent à un entier n. Or
n + 1 ⊂ N, donc le cardinal de N est supérieur ou égal à n + 1 d’où n ≥ n + 1 ; contradiction.
T HÉORÈME 3.3.1
Tout sous ensemble d’un ensemble dénombrable est fini ou dénombrable
On peut supposer que l’ensemble dénombrable considéré est N lui-même. On a donc un ensemble
A ⊂ N : supposons A infini. On définit par induction une bijection f : N → A. Pour cela on pose :
f (0)
f (n + 1)
= le plus petit élément de A
= le plus petit élément de A qui est strictement supérieur à f (n)
(il existe un tel élément dans A sinon A ⊂ {x ∈ N ; x ≤ f (n)} donc A est fini).
On a donc f (n + 1) > f (n) pour tout n ∈ N, donc f est une injection de N dans A.
La fonction f est surjective. En effet soit x 0 le plus petit élément de A non atteint par f , s’il en existe ;
l’ensemble {x ∈ A ; x < x 0 } a un plus grand élément x 1 = f (n) (il est atteint par f ). Mais x 0 est le plus
petit élément de A qui est strictement supérieur à f (n) donc x 0 = f (n + 1).
C . Q . F. D.
T HÉORÈME 3.3.2
S’il existe une injection de A dans N ou bien une surjection de N dans A alors A est fini ou dénombrable.
Si f est une injection de A dans N, l’image de f est un sous ensemble de N qui est équipotent à A.
Donc A est fini ou dénombrable d’après le théorème précédent.
Soit g une surjection de N sur A. On définit une injection h : A → N en posant
£
¤
h(x) = le premier entier n tel que g (n) = x .
C . Q . F. D.
T HÉORÈME 3.3.3
N × N est dénombrable.
Comme N × N n’est pas fini, il suffit, d’après le théorème précédent de trouver une injection f :
N × N → N. On peut poser, par exemple f (x, y) = 2x .3 y (unicité de la décomposition d’un nombre en
facteurs premiers).
C . Q . F. D.
C OROLLAIRE 3.3.4
Le produit de deux ensembles dénombrables est dénombrable.
3.3. ENSEMBLES DÉNOMBRABLES.
21
C OROLLAIRE 3.3.5
Np est dénombrable, pour tout entier p ≥ 1.
Démonstration par induction sur p.
C OROLLAIRE 3.3.6
Z et Q sont des ensembles dénombrables.
On définit une surjection f : N3 → Q en posant
f (x, y, z) = ǫ ·
y
si z 6= 0 avec ǫ = 1 si x est pair ǫ = −1 sinon ; f (x, y, 0) = 0 .
z
Donc Q est dénombrable, ainsi que Z puisque Z ⊂ Q.
C . Q . F. D.
Définition. Une famille d’ensembles (a n )n∈N indexée par N (autrement dit une fonction de domaine
N) est aussi appelée une « suite d’ensembles ». Au lieu d’écrire « la suite d’ensembles (a n )n∈N » on écrit
souvent « la suite d’ensembles a 0 , a 1 , . . . , a n , . . . ». On a donc trois noms (et trois notations) différents
pour la même notion :
– une fonction de domaine N, notée f : N → E
– une famille d’ensembles indexée par N, notée (a n )n∈N
– une suite d’ensembles, notée a 0 , a 1 , . . . , a n , . . .
Lorsqu’on a un ensemble dénombrable E , on choisit souvent une bijection f = N → E qui est donc aussi
une suite a 0 , a 1 , . . . , a n , . . . . On dit que cette suite énumère E et on écrit :
E = {a 0 , a 1 , . . . , a n , . . .} .
22
CHAPITRE 3. ENSEMBLES FINIS ET DÉNOMBRABLES.
Chapitre 4
Comparaison des ensembles infinis
4.1 Axiome du choix.
À l’aide des axiomes de la théorie des ensembles énoncés jusqu’ici, on ne parvient pas à rendre
compte correctement des propriétés intuitives des ensembles infinis. Par exemple, on n’arrive pas à
prouver que tout ensemble infini contient un sous-ensemble dénombrable. Nous énonçons donc maintenant le dernier axiome de la théorie des ensembles.
A XIOME 7 (A XIOME DU CHOIX )
Pour toute famille (A i )i ∈I d’ensembles non vides, il existe une fonction f de domaine I telle que f (i ) ∈ A i
pour tout i ∈ I .
Autrement dit : le produit d’une famille d’ensemble non vides est non vide.
Étant donné un ensemble E , on appelle fonction de choix sur E une application f dont le domaine
est l’ensemble des parties non vides de E (c’est à dire P (E ) − {;}) à valeur dans E , telle que f (X ) ∈ X
pour toute partie non vide X de E
C OROLLAIRE 4.1.1
Sur tout ensemble E , il existe une fonction de choix.
En effet, il suffit d’appliquer l’axiome du choix à la famille des parties non vide de E (c’est à dire
l’application identique dont le domaine est l’ensemble des parties non vides de E ).
C . Q . F. D.
T HÉORÈME 4.1.2
Tout ensemble infini possède un sous-ensemble dénombrable.
Soit E un ensemble infini. Il s’agit de trouver une application injective ϕ : N → E . soit f : P (E ) → E
une fonction telle que f (X ) ∈ X pour toute partie X non vide E (il en existe d’après ce qui précède).
On défini Φ : N → P (E ) par induction :
Φ(0)
Φ(n + 1)
=
=
{ f (E )}
Φ(n) ∪ { f (E − Φ(n))}
Φ(n +1) est donc une partie de E , obtenue en ajoutant à Φ(n) un élément de E . Il en résulte que Φ(n) est
fini pour tout n ∈ N. Comme E n’est pas fini, E − Φ(n) 6= ;, donc (par définition de f ) f (E − Φ(n)) 6∈ Φ(n)
et, par suite, Φ(n + 1) − Φ(n) possède un élément et un seul. On peut alors définir ϕ : N → E en posant
ϕ(0)
ϕ(n + 1)
=
=
f (E )
le seul élément de Φ(n + 1) − Φ(n)
Il est clair que ϕ est injective.
C . Q . F. D.
Le corollaire suivant donne une caractérisation des ensembles infinis.
23
CHAPITRE 4. COMPARAISON DES ENSEMBLES INFINIS
24
C OROLLAIRE 4.1.3
Un ensemble est infini si et seulement s’il est équipotent à une partie propre.
On a vu que : si E est un ensemble fini et F une partie propre de E (F ⊂ E , F 6= E ) alors le cardinal de
F est strictement inférieur à celui de E , donc E n’est pas équipotent à F .
Soit maintenant E un ensemble infini ; on prend une partie D dénombrable de E , D = {a 0 , a 1 , . . . , a n , . . .}.
On définit f : E → E en posant :
f (x)
f (a i )
=
=
x si x ∈ E − D
a i +1 pour i ∈ N
Il est clair que f est une bijection de E sur E − {a 0 } ; donc une bijection de E sur une partie propre de E .
C . Q . F. D.
T HÉORÈME 4.1.4
La réunion d’une suite d’ensemble dénombrables ou finis est un ensemble dénombrable ou fini.
Soit (A n )n∈N une suite d’ensemble dénombrables ou finis. Il suffit de trouver une application surS
jective de N sur n∈N A n .
Pour chaque n ∈ N, soit S n l’ensemble des applications surjectives de N sur A n . Par hypothèse, S n 6=
; pour chaque n ∈ N. D’après l’axiome du choix, il existe une fonction ϕ, de domaine N, telle que ϕ(n) ∈
S n pour tout n ∈ N. Autrement dit, ϕ(n) est, pour chaque entier n, une surjection de N sur A n .
S
S
On définit Φ : N×N → n∈N A n en posant Φ(n, p) = ϕ(n)(p). Alors Φ est surjective. car si x ∈ n∈N A n ,
on a x ∈ A m donc x = ϕ(m)(a) pour un certain entier q, puisque ϕ(m) est surjective.
Comme N × N est dénombrable, on a le résultat cherché.
C . Q . F. D.
en déduit immédiatement que l’ensemble des suites finies d’entiers — autrement dit l’ensemble
[ On
Np ) — est dénombrable.
p∈N
L’ensemble P des polynômes à une variable, à coefficient dans Z est dénombrable : si Pk est l’ensemble des polynômes de degré ≤ k, Pk est équipotent à Zk+1 (un polynôme de degré ≤ k est une suite
S
de k + 1 entiers relatifs) donc est dénombrable. L’ensemble considéré est P = k∈N Pk donc est dénombrable.
L’ensemble des nombres algébriques réels (nombres réels qui est racine d’un polynôme à une variable à coefficient dans Z) est dénombrable. En effet, à chaque polynôme u ∈ P, associons l’ensemble
S
fini R u de ses racines réelles. L’ensemble étudié est u∈P R u . Comme P est dénombrable c’est la réunion
d’une suite d’ensemble finis, donc un ensemble dénombrable d’après le théorème précédent (ce n’est
évidemment pas un ensemble fini).
4.2 Ensembles non dénombrables.
Tous les ensembles infinis rencontrés jusqu’ici se sont révélés dénombrables. Les deux théorèmes
suivants, dus à Cantor, montrent qu’il existe des ensembles infinis non dénombrables.
T HÉORÈME 4.2.1
P (N) n’est pas dénombrable.
Supposons qu’il existe une application surjective f : N → P (N). On définit x ∈ P (N) en posant X =
{n ∈ N ; n 6∈ f (n)}. Puisque f est surjective, il existe n 0 ∈ N tel que f (n 0 ) = X . Par définition de X , on a
n 0 ∈ X ⇔ n 0 6∈ f (n 0 ). Autrement dit n 0 ∈ X ⇔ n 0 6∈ X , ce qui est une contradiction.
C . Q . F. D.
T HÉORÈME 4.2.2
L’intervalle [0, 1[ de R n’est pas dénombrable.
4.2. ENSEMBLES NON DÉNOMBRABLES.
25
Soit f une application surjective de N sur [0, 1[. Le réel f (n) possède une représentation décimale
0, a n0 a n1 · · · a nk · · · et une seule (où a nk ∈ {0, 1, . . . , 9}).
La suite (a nk )k∈N n’étant pas formée de 9 à partir d’un certain rang, on définit alors une suite (b k )k∈N
d’entiers (0 ≤ b k ≤ 9), en posant b k = 0 si a kk 6= 0 et b k = 1 si a kk = 0.
La suite b k n’étant pas formée de 9 à partir d’un certain rang (elle n’en c ontient pas), le réel 0, b 1 b 2 · · · b k · · ·
est donc un élément de [0, 1[ et comme f est surjective, il existe un entier n 0 tel que f (n 0 ) = 0, b 1 b 2 · · · b k · · · .
On a donc :
0, a n1 0 a n2 0 · · · a nk 0 · · · = 0, b 1 b 2 · · · b k · · ·
n
En particulier b n0 = a n00 , ce qui contredit la définition de b n0 .
C . Q . F. D.
Bien entendu, il en résulte que R lui-même n’est pas dénombrable puisque R ⊃ [0, 1[.
Comme on a démontré plus haut que l’ensemble des nombres algébriques réels est dénombrables
on a ainsi prouvé : il existe un nombre réel transcendant (c’est-à-dire non algébrique). Et même l’ensemble des nombres réels transcendants est non dénombrable (car la réunion de deux ensembles dénombrables est dénombrable).
T HÉORÈME 4.2.3
Si E est infini et F est dénombrable ou fini, alors E ∪ F est équipotent à E .
En effet on a un ensemble dénombrable D ⊂ E . Donc E ∪ F = (E − D) ∪ (D ∪ F ). Mais D ∪ F est
équipotent à D (tous deux sont dénombrables) donc E ∪ F ∼ (E − D) ∪ E = E .
C . Q . F. D.
T HÉORÈME 4.2.4
Si E est infini non dénombrable, on obtient un ensemble équipotent en lui retranchant une partie dénombrable ou finie.
En effet, si A ⊂ E est dénombrable ou fini, E ′ = E − A est infini donc d’après le théorème précédent,
E ∼ E′ ∪ A = E.
C . Q . F. D.
′
On en déduit que les divers ensembles non dénombrables rencontrés jusqu’à présent sont tous
équipotents :
T HÉORÈME 4.2.5
R, P (N), les intervalles [a, b], [a, b[, ]a, b[ de R (a < b) sont des ensembles équipotents.
Il est clair que [a, b], [a, b[, ]a, b[ sont équipotents (d’après le théorème 4.2.4). Or ] − 1, 1[ est équipotent à ]a, b[ (considérer la fonction y = a + 21 (b − a)(x + 1) et ] − 1, 1[ est équipotent à R (considérer la
x
fonction y = 1−x
2 ).
Il suffit donc de montrer que P (N) est équipotent à un intervalle [a, b[, par exemple à [0, 1[. On
définit une application ϕ : [0, 1[→ P (N) de la façon suivante : si r ∈ [0, 1[, r possède une développement
binaire et un seul, soit 0, ε0 ε1 · · · εn · · · qui ne doit pas formé exclusivement de 1 à partir d’un certain
rang.
On pose ϕ(r ) = {n ∈ N ; εn = 0}. On montre aisément que ϕ est injective et que l’image de ϕ est
l’ensemble P ∞ (N) des parties infinies de N. Il en résulte que [0, 1[ est équipotent à P ∞ (N).
Or P ∞ (N) est obtenu en retranchant de P (N) un ensemble dénombrable (l’ensemble des parties
finies de N) donc (théorème 4.2.4) P ∞ (N) est équipotent à P (N).
C . Q . F. D.
T HÉORÈME 4.2.6
Rn , P (N)n sont équipotents à R pour tout n ∈ N.
On montre d’abord que P (N)2 est équipotent à P (N) : soient A, B deux ensembles dénombrables
disjoints. Il est clair que P (N) est équipotent à P (A), P (B ), P (A ∪B ) (car A ∪B est aussi dénombrable).
Or, se donner une partie de A ∪ B revient à se donner une partie de A et une partie de B , donc P (A) ×
P (B ) ∼ P (A ∪ B ). Il en résulte que P (N)2 ∼ P (N).
Il en résulte que R2 est équipotent à R. On montre alors immédiatement par induction sur n, que
n
R ∼ R pour tout n ∈ N
C . Q . F. D.
CHAPITRE 4. COMPARAISON DES ENSEMBLES INFINIS
26
Définition. On dit qu’un ensemble a la puissance du continu s’il est équipotent à R.
Les ensembles infinis rencontrés jusqu’ici se rangent en deux classes : ceux qui sont dénombrables,
ceux qui ont la puissance du continu. Nous allons voir qu’il existe des ensembles infinis qui ne se
rangent dans aucune de ces classes. Pour pouvoir comparer entre-eux les divers ensembles infinis on
introduit la définition suivante :
Définition. On dit que le cardinal (ou la puissance) de l’ensemble E est inférieur ou égal à celui de F
s’il existe une injection de E dans F . On écrit alors E ≤ F .
On a immédiatement les propriétés suivantes :
– Si E ≤ F et F ≤ G, alors E ≤ G.
– Si E ∼ F alors E ≤ F et F ≤ E . La réciproque est vraie (mais non évidente) et sera démontrée un
peu plus loin (théorème 4.2.8 de Cantor-Bernstein).
– Si E ≤ E ′ et F ≤ F ′ , alors E × E ′ ≤ F × F ′
– Si E et E ′ sont des ensembles disjoints, ainsi que F et F ′ , et si E ≤ F et E ′ ≤ F ′ , alors E ∪ E ′ ≤ F ∪ F ′ .
T HÉORÈME 4.2.7
Soient E et F deux ensembles tel que E 6= ;. Alors E ≤ F si et seulement s’il existe une surjection de F sur
E.
Si E ≤ F , on a une injection f : E → F . Comme E 6= ;, on prend a ∈ E , on définit g : F → E en posant
g (y) = le seul élément x de E tel que y = f (x) s’il existe ; g (y) = a sinon. Alors g est une surjection de F
sur E .
Inversement, soit g : F → E , surjective. D’après l’axiome du choix, il existe une application ϕ :
P (E ) → E telle que ϕ(X ) ∈ X pour toute partie X non vide de E . On définit alors f : E → F en posant f (x) = ϕ(g −1 ({x})) (g −1 ({x}) = {y ∈ F ; g (y) = x} est non vide puisque g est surjective). Alors f est
une injection de E dans F .
C . Q . F. D.
T HÉORÈME 4.2.8 (C ANTOR-B ERNSTEIN )
Si E ≤ F et F ≤ E , alors E est équipotent à F .
Ce théorème justifie qu’on emploie à partir de maintenant la notation E = F au lieu de E ∼ F . Le
symbole ≤ se comporte alors comme une relation d’ordre.
Pour montrer le théorème, il suffit de montrer le lemme suivant :
L EMME 4.2.9
Si A ⊂ E , et s’il existe ϕ : E → A injective, alors A ∼ E .
(Théorème 4.2.8.) En effet, en admettant le lemme, considérons deux ensembles E , F tels que E ≤ F
et F ≤ E . On a donc deux injections f : E → F et g : F → E . Si A ⊂ E est l’image de g , F est équipotent à
A. Or g ◦ f est une injection de E dans A. D’après le lemme 4.2.9, E est équipotent à A, donc à F C . Q . F. D.
(Lemme 4.2.9.) Pour chaque x ∈ E , on définit par induction ϕn (x) pour tout n ∈ N :
ϕ0 (x)
ϕn+1 (x)
=
=
0
ϕ(ϕn (x))
On désigne par B l’ensemble des éléments de E de la forme ϕn (x), n décrivant N et x décrivant E − A
(on obtient cet ensemble à l’aide de l’axiome de compréhension : B = {y ∈ E ; il existe x ∈ E − A et n ∈
N tels que y = ϕn (x)}).
Évidemment, B ⊃ E − A (puisque ϕ0 (x) = x. De plus ϕ envoie B dans B et comme ϕ est une injection
de E dans A, on voit que la restriction ϕB de ϕ à B est une injection de B dans B ∩ A.
En fait, tout élément de B ∩ A est atteint par ϕB : si u ∈ B ∩ A, on a u = ϕn (x), x ∈ E − A ; donc n 6= 0
(sinon u 6∈ A) soit n = p +1 et u = ϕ(v), v = ϕp (x) donc v ∈ B . On a ainsi montré que ϕB est une bijection
de B sur B ∩ A.
4.2. ENSEMBLES NON DÉNOMBRABLES.
27
Donc B est équipotent à B ∩ A. Il en résulte que (E − B ) ∪ B est équipotent à (E − B ) ∪ (B ∩ A) (car
E − B et B sont disjoints ainsi que E − B et B ∩ A).
Comme (E −B )∪B = E on aura le résultat cherché si on montre que (E −B )∪(B ∩ A) = A. Or B ⊃ E − A,
donc E − B ⊂ A et comme B ∩ A ⊂ A, on a (E − B ) ∪ (B ∩ A) ⊂ A. Inversement, si x ∈ A, ou bien x ∈ B d’où
x ∈ A ∩ B , ou bien x 6∈ B et x ∈ E − B . Donc (E − B ) ∪ (B ∩ A) ⊃ A.
C . Q . F. D.
A titre d’application du théorème de Cantor-Bernstein, notons le théorème suivant :
T HÉORÈME 4.2.10
L’ensemble NN des fonctions définies sur les entiers à valeur entières a la puissance du continu.
Si, à chaque partie de N, on associe sa fonction caractéristique, on obtient une injection de P (N)
dans NN .
D’autre part, une fonction f : N → N est un ensemble de couples d’entiers donc NN ⊂ P (N2 ). Comme
P (N2 ) est équipotent à P (N) (puisque N2 est dénombrable) on en déduit une injection de NN dans
P (N).
D’après le théorème de Cantor-Bernstein, NN est équipotent à P (N).
C . Q . F. D.
On dira que l’ensemble E a une puissance strictement inférieure à celle de F (ce qu’on écrit E < F )
si E ≤ F et E 6= F . Autrement dit, s’il existe une injection de E dans F mais pas d’injection de F dans E .
Par exemple, R a une puissance strictement supérieure à celle de N.
Le théorème suivant montre que , pour tout ensemble, il en existe un de puissance strictement
supérieure.
T HÉORÈME 4.2.11 (C ANTOR )
Pour tout ensemble E , P (E ) > E .
L’application x 7→ {x} de E dans P E est injective. Donc E ≤ P E .
Si f est une bijection de E sur P (E ), on définit X ∈ P (E ) en posant X = {x ∈ E ; x 6∈ f (x)}. Alors il
existe x 0 ∈ E tel que f (x 0 ) = X . Par définition de X on a x 0 ∈ X ⇔ x 0 6∈ f (x 0 ) soit x 0 ∈ X ⇔ x 0 6∈ X ce qui
est une contradiction.
C . Q . F. D.
28
CHAPITRE 4. COMPARAISON DES ENSEMBLES INFINIS
Chapitre 5
Le théorème de Zorn.
Grâce au théorème de Cantor-Bernstein, on a montré que les notations E ≤ F et E = F (qui, rappelonsle, signifient respectivement « il existe une injection de E dans F » et « il existe une bijection de E sur
F ») se comportent comme une relation d’ordre, c’est-à-dire :
E ≤E ;
³
´
E ≤ F et F ≤ E ⇔ E = F ;
³
´
E ≤ F et F ≤ G ⇒ E ≤ G .
Il serait maintenant intéressant de montrer qu’on peut comparer les puissances de deux ensembles
quelconques. Autrement dit : étant donné deux ensembles E et F , ou bien E ≤ F ou bien F ≤ E . Ce résultat sera obtenu comme application d’un théorème très important de théorie des ensembles attribué
à Zorn.
5.1 Théorème de Zorn.
T HÉORÈME 5.1.1 (Z ORN )
Soit E un ensemble ordonné qui a la propriété suivante : tout sous-ensemble de E qui est totalement
ordonné a un majorant. Alors E a un élément maximal.
Rappelons que, si E est un ensemble ordonné et X une partie de E , un majorant de X est un élément
m de E tel que m ≥ x pour tout x ∈ X . Si, de plus, m 6∈ X , on dit que m est un majorant strict de X .
Un élément maximal de E est un élément a de E qui n’a pas de majorant strict (pour aucun x de E ,
on n’a x > a).
Avant de prouver le théorème de Zorn, donnons l’application indiquée à la comparaison des puissances de deux ensembles.
T HÉORÈME 5.1.2
Quels que soient les ensembles E , F , il existe ou bien une injection de E dans F , ou bien une injection de
F dans E .
(Théorème 5.1.2.) Soit E l’ensemble des applications f injectives donc le domaine est une partie A f
de E et l’image une partie B f de F . On met sur E une relation d’ordre en posant :
¡
¢
f ≤ g ⇔ A f ⊂ A g et f est la restriction de g à A f
autrement dit, f ≤ g si et seulement si g est un prolongement de f .
L’hypothèse du théorème de Zorn est alors satisfaite : en effet, soit X une partie de E totalement
S
ordonnée. On pose A = f ∈X A f et on définit une fonction ϕ de domaine A en posant pour chaque
x∈A:
ϕ(x) = f (x) pour n’importe quel f ∈ X tel que x ∈ A f .
29
CHAPITRE 5. LE THÉORÈME DE ZORN.
30
T
En effet, si x ∈ A f A f ′ , avec f , f ′ ∈ X , comme X est totalement ordonné on a par exemple f ≤ f ′ ,
donc f (x) = f ′ (x)) ; ϕ est le prolongement commun de tous les éléments de X , donc est un majorant
de X .
Soit f 0 : A 0 → B 0 un élément maximal de E ; il en existe d’après le théorème de Zorn. Si A 0 = E , f 0 est
une injection de E dans F . Si B 0 = F , f 0−1 est une injection de F dans E .
Supposons alors que A 0 6= E , B 0 6= F . On prend x 0 ∈ E − A 0 , y ∈ F − B 0 et on définir g 0 : A 0 ∪ {x 0 } →
B 0 ∪ {y 0 } comme le prolongement de f qui donne à x 0 la valeur y 0 . On a alors g 0 ∈ E et g 0 > f 0 ce qui
contredit la maximalité de f 0 .
C . Q . F. D.
5.1.1 Démonstration du théorème de Zorn.
Soient E un ensemble ordonné, X une partie de E . Si l’ensemble des majorants de X a un plus petit
élément, on l’appelle borne supérieure de X et on le désigne par sup(X ). De même, si l’ensemble des
minorants de X a un plus grand élément, on l’appelle borne inférieure de X et on le désigne par inf(X ).
Un élément minimal de X est par définition, un élément de X qui n’a pas de minorant strict dans X .
Une partie de E qui est totalement ordonnée est appelée une chaîne de E . Deux éléments x, y de E
sont dits comparables si on a x ≤ y ou y ≤ x. Une chaîne de E est donc une partie de E dont les éléments
sont deux à deux comparables.
On montre d’abord ce théorème.
T HÉORÈME 5.1.3
Soit E un ensemble ordonné ayant les propriétés suivantes :
– toute chaîne de E a une borne supérieure ;
– si x ∈ E a un majorant strict, l’ensemble des majorants stricts de x a un élément minimal.
Alors E a un élément maximal.
On raisonne par l’absurde, en supposant que tout élément de E a un majorant strict. En utilisant
l’axiome du choix, on considère une fonction f : P (E ) → E telle que f (X ) ∈ X pour toute partie non
vide X de E .
Pour chaque x ∈ E , soit M x l’ensemble des majorants stricts minimaux de x. Par hypothèse M x 6= ;
pour tout x ∈ E .
On définit l’application µ : E → E en posant µ(x) = f (M x ). il en résulte que µ(x) est un majorant
strict minimal de x ; autrement dit, x < µ(x) et, si y ∈ E est tel que x ≤ y ≤ µ(x), on a x = y ou y = µ(x).
Soit X l’ensemble de toutes les parties X de E ayant les propriétés suivantes :
– si Y ⊂ X est une chaîne, alors sup(Y ) ∈ E ;
– si x ∈ X , µ(x) ∈ X .
On désigne par X 0 l’intersection de tous les X ∈ X . On vérifie immédiatement que X 0 ∈ X ; X 0 est donc
le plus petit élément de X (c’est-à-dire inclus dans tous éléments de X ).
Si on montre que X 0 est une chaîne, on aura la contradiction cherchée : en effet, d’après les propriétés définissant les éléments de X , on aura alors sup(X 0 ) = a ∈ X 0 d’où µ(a) ∈ X 0 Or µ(a) est un majorant
strict de sup(X 0 ), donc de X 0 et ne peut être élément de X 0 .
Soit x ∈ X 0 , x étant comparable à tout élément de X 0 ; alors pour tout y ∈ X 0 on a y ≤ x ou y ≥ µ(x).
Soit X = {y ∈ X 0 ; y ≤ x ou y ≥ µ(x)}. On montre que X ∈ X et donc X ⊃ X 0 , ce qui est le résultat
cherché.
En effet, soit Y ⊂ X , Y étant une chaîne. Si tout élément de Y est inférieur ou égal à x on a sup(Y ) ≤ x,
donc sup(Y ) ∈ X ; si l’un des éléments de Y est supérieur ou égal à µ(x), on a sup(Y ) ≥ µ(x), donc
sup(Y ) ∈ X .
Soit y ∈ X .
– Si y ≥ µ(x), on a µ(y) > y ≥ µ(x), donc µ(y) ∈ X .
– Si y ≤ x, on remarque que µ(y) ∈ X 0 (car y ∈ X 0 ) donc µ(y) est comparable à x ; si µ(y) ≤ x on a
µ(y) ∈ X ; si µ(y) ≥ x, on a y ≤ x ≤ µ(y) et donc y = x ou x = µ(y). Donc µ(y) = µ(x) ou µ(y) = x.
Dans les deux cas µ(y) ∈ X .
5.2. APPLICATIONS DU THÉORÈME DE ZORN.
31
On a ainsi montré le résultat suivant.
Si x ∈ X 0 est comparable à tout élément de X 0 , il en est de même de µ(x).
Soit alors Z = {x ∈ X 0 ; x est comparable à tout élément de X 0 }. On a donc x ∈ Z ⇒ µ(x) ∈ Z . D’autre
part, soit Y une chaîne incluse dans Z et u ∈ X 0 . Tout élément de Y est comparable à u. Si y ≤ u pour
tout y ∈ Y on a sup(Y ) ≤ u. Si l’un des y ∈ Y vérifie y ≥ u on a sup(Y ) ≥ u. Dans les deux cas, sup(Y ) est
comparable à u. Comme u est un élément quelconque de X 0 , on a sup(Y ) ∈ Z .
Finalement, on a montré que Z ∈ X donc Z ⊃ X 0 . Cela prouve que tous les éléments de X 0 sont
comparables, autrement dit que X 0 est une chaîne.
C . Q . F. D.
T HÉORÈME 5.1.4 (H AUSDORFF )
Soit C un ensemble ordonné. Alors l’ensemble des chaînes de C (ordonnée par inclusion) a un élément
maximal.
Soit E l’ensemble des chaînes de C . Il suffit de prouver que E satisfait aux hypothèses du théorème
précédent.
Soit X ⊂ E une chaîne de E , donc si A, B ∈ X A et B sont des chaînes de C et on a A ⊂ B ou B ⊂ A. il
S
est alors immédiat de voir que A∈X A est une chaîne de C qui est la borne supérieure de X .
Soit A ∈ E , A ayant un majorant strict B . On a donc A ⊂ B , A 6= B , A,B étant des chaînes de C . On
choisit a ∈ B − A ; alors A ∪ {a} est un majorant strict minimal de A.
C . Q . F. D.
On peut alors montrer le théorème de Zorn (théorème 5.1.1) :
Soit E un ensemble ordonné, dont toute chaîne est majorée. Soit A ⊂ E une chaîne maximale de
E (obtenue à l’aide du théorème précédent). A a un majorant a ∈ E . Si a n’est pas maximal, on prend
b ∈ E , b > a. Alors b 6∈ A et A ∪{b} est une chaîne qui contient strictement A, ce qui est impossible. Donc
a est maximal.
C . Q . F. D.
5.2 Applications du Théorème de Zorn.
Les théorèmes suivants, qui sont des applications du théorème de Zorn, permettent d’évaluer la
puissance de la réunion et du produit de deux ensembles infinis.
T HÉORÈME 5.2.1
Soient E 1 , E 2 deux ensembles équipotents à un ensemble infini E . Alors
E1 ∪ E2 = E
Supposons d’abord E 1 , E 2 disjoints. On prend des bijections f 1 : E → E 1 , f 2 : E → E 2 . Pour chaque
partie X de E , on désignera par X 1 (resp. X 2 ) l’image de X par f 1 (resp. f 2 ).
Soit E l’ensemble des bijections ϕ : X → X 1 ∪ X 2 , X décrivant P (E ). Si ϕ, ψ ∈ E on pose ϕ ≤ ψ si ψ
est un prolongement de ϕ.
L’ ensemble E est alors ordonné, non vide ; car E est infini, donc il y a une partie dénombrable X ,
alors X 1 et X 2 sont dénombrables aussi, donc aussi X 1 ∪ X 2 et il existe une bijection de X sur X 1 ∪ X 2 .
L’ensemble E satisfait l’hypothèse du théorème de Zorn : en effet si X est une partie totalement
ordonnée de E , on voit aisément que les ϕ ∈ X ont un prolongement commun qui est un majorant (et
même la borne supérieure) de X .
Soit alors µ : A → A 1 ∪ A 2 un élément maximal de X . Comme µ est bijective, on a A = A 1 ∪ A 2 .
On va montrer que E − A est un ensemble fini, donc aussi E 1 − A 1 , E 2 − A 2 . Il en résulte, d’après le
théorème 4.2.4, que E = A, E 1 ∪ E 2 = A 1 ∪ A 2 d’où le résultat cherché.
Supposons que E − A soit infini et soit D une partie dénombrable de E − A. On pose B = A ∪ D ; on
a B 1 = A 1 ∪ D 1 , B 2 = A 2 ∪ D 2 . Comme D, D 1 et D 2 sont dénombrables, il existe une bijection ν : D →
D 1 ∪ D 2 . La fonction µ′ : B → B 1 ∪ B 2 , égale à µ sur A et à ν sur D est bijective, donc µ ∈ E et µ′ est un
majorant strict de µ ce qui est une contradiction.
Le cas où E 1 et E 2 ne sont pas disjoints est conséquence du corollaire suivant.
C . Q . F. D.
CHAPITRE 5. LE THÉORÈME DE ZORN.
32
C OROLLAIRE 5.2.2
Soient E 1 , . . . , E n des ensembles tels que E 1 ≥ E 2 , E 1 ≥ E 3 , . . ., E 1 ≥ E n , E 1 étant infini. Alors :
E1 ∪ E2 ∪ · · · ∪ En = E1 .
On le montre d’abord lorsque n = 2. On choisit un ensemble E 2′ équipotent à E 1 et disjoint de E 1 .
D’après le théorème précédent E 1 ∪ E 2′ est équipotent à E 1 .
Comme E 2 ≤ E 2′ = E 1 , il existe une surjection de E 2′ sur E 2 , donc une surjection de E 1 ∪E 2′ sur E 1 ∪E 2 .
Donc E 1 ∪ E 2 ≤ E 1 ∪ E 2′ = E 1 .
Comme E 1 ≤ E 1 ∪ E 2 de façon évidente, on a bien E 1 ∪ E 2 = E 1 .
On montre alors aisément le résultat par induction sur n.
C . Q . F. D.
T HÉORÈME 5.2.3
Soient E un ensemble infini, E 1 , E 2 deux ensembles équipotents à E . Alors E = E 1 × E 2 .
On choisit deux bijections f 1 : E → E 1 , f 2 : f 2 → E 2 ; pour chaque partieX de E , on désignera par X 1
(resp. X 2 ) l’image de X par f 1 (resp. f 2 ).
Soit E l’ensemble des bijections ϕ : X → X 1 × X 2 (X décrit l’ensemble des parties de E ). Si ϕ, ψ ∈ E
on pose ϕ ≤ ψ si ψ est un prolongement de ϕ.
L’ensemble E est alors ordonné non vide, car E étant infini, il a une partie dénombrable X , alors X 1 ,
X 2 sont dénombrables aussi, donc aussi X 1 × X 2 et il existe une bijection de X sur X 1 × X 2 .
L’ensemble E satisfait l’hypothèse du théorème de Zorn : en effet si X est une partie totalement
ordonnée de E , on voit aisément que les ϕ ∈ X ont un prolongement commun qui est un majorant de
X.
Soit alors µ : A → A 1 × A 2 un élément maximal de X . Comme µ est bijective, on a A = A 1 × A 2 . On
va montrer que E − A < A. Il en résultera que E = (E − A) ∪ A = A (théorème précédent). Donc A = A 1 =
A 2 = E 1 = E 2 = E . Comme A = A 1 × A 2 , on aura bien montré que E = E 1 × E 2 .
Supposons alors que E − A ≥ A. Il en résulte qu’il existe B ⊂ E − A, B = A. On a alors :
B1 ⊂ E1 − A1 , B2 ⊂ E2 − A2 ;
donc si on pose C = A ∪ B , on a :
C 1 ×C 2 = (A 1 × A 2 ) ∪ (A 1 × B 2 ) ∪ (A 2 × B 1 ) ∪ (B 1 × B 2 ) .
Les ensembles A, A 1 , A 2 , A 1 × A 2 , B 1 , B 2 sont équipotents. Donc ils sont aussi équipotents à A 1 × B 2 ,
A2 × B1, B1 × B2.
D’après le théorème précédent, ils sont aussi équipotents à (A 1 ×B 2 )∪(A 2 ×B 1 )∪(B 1 ×B 2 ). Soit alors
ν une bijection de B sur ce dernier ensemble. La fonction µ′ de domaine C qui est égale à µ sur A, et à
ν sur B est donc une bijection de C sur C 1 × C 2 . Donc µ′ ∈ E et µ′ est un majorant strict de µ ce qui est
une contradiction.
C . Q . F. D.
C OROLLAIRE 5.2.4
Soient E 1 , . . . , E n des ensembles non vides tels que E 1 ≥ E 2 , E 1 ≥ E 3 , ... , E 1 ≥ E n , E 1 étant infini. Alors
E1 × E2 × · · · × En = E1 .
On le montre par induction sur n : en admettant le résultat pour n − 1, on a E 1 × E 2 × · · · × E n−1 = E 1 .
Donc
E1 × · · · × En = E1 × En ≤ E1 × E1
(puisque E n ≤ E 1 ) .
Donc E 1 × · · · × E n ≤ E 1 . L’inégalité inverse est évidente (parce que E 2 , . . . , E n sont non vides).
C . Q . F. D.
Deuxième partie
Éléments du calcul des prédicats.
33
35
L’objet de la logique est d’étudier et d’analyser le raisonnement mathématique. Pour cela, on examine les textes mathématiques effectivement écrits et on essaye de fabriquer des structures qui rendent
compte, avec plus ou moins de fidélité, des propriétés du langage mathématique. Les plus connues
parmi ces structures s’appelle le « calcul des propositions » (ou « calcul propositionnel ») et le « calcul
des prédicats ». Ce sont celles que nous examinerons dans ce cours.
Cette étude s’est révélée extrêmement intéressante, et a donné lieu à de nombreux résultats. Surtout,
elle a permis de se rendre compte clairement de ce qu’est la méthode axiomatique et des limites de cette
méthode ; par exemple, pour certains problèmes mathématiques qui n’avaient pas été résolus (le cas le
plus célèbre est ce qu’on appelle « l’hypothèse du continu »), on a pu ainsi prouver qu’ils étaient, en fait,
insolubles.
36
Chapitre 6
Calcul propositionnel et algèbres de
Boole.
6.1 Syntaxe.
Dans le langage mathématique, on considère tout d’abord les « connecteurs propositionnels » ;
A, B,C , . . . étant certains énoncés (vrais ou faux, cela importe peu), il est habituel d’en former d’autres
du genre suivant :
– « A si et seulement si B » ; « Pour que A il faut et il suffit que B » ; « une condition nécessaire et
suffisante pour que A et B » ; ces trois nouveaux énoncés (et toutes les locutions synonymes) sont
écrits en abrégé : A ⇔ B .
– Les énoncés « A implique B » ; « Si A alors B » ; « A est une condition suffisante pour que B » ;
« B est une condition nécessaire pour que A » ; et toutes les expressions synonymes sont écrits en
abrégé : A ⇒ B .
– L’énoncé « il est faux que A » et toutes les expressions synonymes est écrit en abrégé : non A.
– On peut aussi former l’énoncé « A et B » (ce qui signifie que A et B sont vrais tous les deux) et
l’énoncé « A ou B » (qui signifie qu’au moins l’un des deux énoncé A, B est vrai).
Les symboles ⇔, ⇒, non, et, ou du langage mathématique sont appelés connecteurs propositionnels.
Pour étudier systématiquement ces connecteurs, on définit une structure mathématique adéquate :
c’est le calcul propositionnel.
On considère des lettres p, q, r, . . . appelées variables propositionnelles et des symboles :
↔, →, ¬, ∧, ∨, (, )
qui sont appelés respectivement symboles d’équivalence, d’implication, de négation, de conjonction,
de disjonction, parenthèse ouvrante et parenthèse fermante.
Les formules du calcul propositionnel sont, par définition, les suites finies formées de variables
propositionnelles et des symboles ci-dessus, qu’on obtient en appliquant un nombre fini de fois les
règles suivantes :
1. Chaque variable propositionnelle p, q, r . . . est une formule.
2. Si F est une formule ¬(F ) en est une (c’est la suite finie obtenue en mettant à la suite les symboles
¬, ( la suite finie constituée par F , et le symbole ) ; on l’appelle négation de F ).
3. Si F et G sont des formules alors (F )∧(G), (F )∨(G), (F ) → (G), (F ) ↔ (G) sont des formules (∧, ∨, →
, ↔ se lisent respectivement : et, ou, implique, équivaut à).
Par exemple ((¬(p)) → (q)) → ((r ) ∨ (s)) est une formule. Le nombre total de symboles et de variables
propositionnelles qui apparaissent dans une formule est appelée longueur de cette formule. Par exemple,
la longueur de la formule ci-dessus est 22.
T HÉORÈME 6.1.1
Pour chaque formule F , un et un seul des cas suivant se présente :
37
38
CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
1. F est une variable propositionnelle.
2. F = ¬(G) où G est une formule.
3. F = (G) ∨ (H ) où G et H sont des formules.
4. F = (G) ∧ (H ) où G et H sont des formules.
5. F = (G) → (H ) où G et H sont des formules.
6. F = (G) ↔ (H ) où G et H sont des formules.
De plus, dans les cas 3, 4, 5, 6, G et H sont déterminées de façon unique.
D’après la définition des formules, il est clair qu’au moins l’un de ces cas se présente : F a été
construite en appliquant un nombre fini de fois les règles (1), (2), (3) et il suffit de considérer la dernière application de ces règles dans la construction de F .
Si F est une variable propositionnelle, seul le cas (1) peut se présenter.
Si le premier symbole de F est ¬, seul le cas (2) peut se présenter : car dans les autres cas, le premier
symbole est (.
La formule F étant donnée, on cherche à établir les couples de parenthèses (une ouvrante, une
fermante) qui entourent les formules partielles qui apparaissent dans la construction de F . Il est clair
z }| {
que deux tels couples on l’une des dispositions suivantes : ( ) ( ) ou bien ( ( ) ), mais qu’on ne peut
|{z}
|{z} |{z}
avoir la disposition
z }| {
( ( ) )
(∗)
| {z }
L EMME 6.1.2
Pour toute suite finie de parenthèses, il y a au plus une façon de former des couples de parenthèses (une
ouvrante et une fermante) de façon à éviter la disposition (∗) et de façon que chaque parenthèse soit
couplée avec une autre.
On démontre ce lemme par induction sur le nombre de parenthèses. On considère la première parenthèse fermante de la suite donnée. Elle est alors précédée d’une parenthèse ouvrante et on doit
nécessairement coupler ces deux parenthèses, sinon on obtient la disposition (∗) à éviter. En ôtant ce
couple on obtient une suite de parenthèses plus courte, d’où le résultat par récurrence.
C . Q . F. D.
D’après le lemme, il n’y a donc qu’une façon de rétablir les couples de parenthèses dans F . Comme
F commence par (, on cherche la parenthèse ) qui lui est associée. Ces deux parenthèses entourent une
formule G qui est donc déterminée de façon unique. De même le symbole qui suit cette parenthèse
fermante est déterminé de façon unique ; c’est ∧, ∨, → ou ↔ et on est dans un seul de ces cas 3, 4, 5 ou
6. Ce symbole est suivi par (H ) et donc H est déterminé de façon unique.
C . Q . F. D.
Pour alléger l’écriture des formules, on supprime les parenthèses autour des variables propositionnelles et des négations de variables propositionnelles. De plus on convient d’écrire les formules
(A ∧ B ) → (C ∨ D) et (A ∧ B ) ↔ (C ∨ D) sous la forme A ∧ B → C ∨ D et A ∧ B ↔ C ∨ D. Avec ces conventions la formule ((¬(p)) → (q)) → ((r ) ∨ (s)) est écrite (¬p → q) → r ∨ v.
Dans la suite on notera F (p 1 , . . . , p n ) une formule dans laquelle les variables propositionnelles qui
apparaissent sont p 1 , . . . , p n . Si G est une formule quelconque, on note F (G, p 2 , . . . , p n ) la suite de symboles obtenue en substituant G à p 1 partout où p 1 apparaît dans F .
T HÉORÈME 6.1.3
Si F (p 1 , . . . , p n ) et G sont des formules, alors F (G, p 2 , . . . , p n ) en est une.
Par induction sur la longueur de F : c’est évident si F est de longueur 1, car alors c’est une variable
propositionnelle.
Si F = ¬F ′ (p 1 , . . . , p n ) alors F ′ est plus courte que F , donc F ′ (G, p 2 , . . . , p n ) est une formule (hypothèse de récurrence) donc aussi ¬F ′ (G, p 2 , . . . , p n ), c’est-à-dire F (G, p 2 , . . . , p n ).
Même raisonnement si F = F ′ ∨ F ′′ , F = F ′ ∧ F ′′ , F = F ′ → F ′′ et F = F ′ ↔ F ′′ .
C . Q . F. D.
6.2. VALEUR D’UNE FORMULE POUR UNE DISTRIBUTION DE VALEURS DE VÉRITÉ.
39
6.2 Valeur d’une formule pour une distribution de valeurs de vérité.
Soit F (p 1 , . . . , p n ) une formule dont les variables propositionnelles sont prises parmi p 1 , . . . , p n . Une
distribution de valeurs de vérité sur les variables propositionnelles de F est par définition une suite
ε1 , . . . εn formée de 0 et de 1. On associe à une telle suite la valeur ε pour F qui est soit 0, soit 1 et que
l’on notera ε = F (ε1 , . . . , e n ). La définition est faite par induction sur la longueur de F .
1. F est de longueur 1 ; c’est alors une variable propositionnelle p i . On pose ε = εi .
2. F = ¬G. Alors G est plus courte que F , donc G(ε1 , . . . , εn ) est déjà défini ; on pose F (ε1 , . . . , εn ) = 0
si G(ε1 , . . . , εn ) = 1 et F (ε1 , . . . , εn ) = 1 si G(ε1 , . . . , εn ) = 0.
3. F = G∨H ; alors G(ε1 , . . . , εn ) et H (ε1 , . . . , εn ) sont déjà définis. On pose F (ε1 , . . . , εn ) = 0 si G(ε1 , . . . , εn ) =
H (ε1 , . . . , εn ) = 0 et F (ε1 , . . . , εn ) = 1 sinon.
4. F = G ∧ H ; on pose F (ε1 , . . . , εn ) = 1 si G(ε1 , . . . , εn ) = H (ε1 , . . . , εn ) = 1 et F (ε1 , . . . , εn ) = 0 sinon.
5. F = G → H ; F (ε1 , . . . , εn ) = 0 si G(ε1 , . . . , εn ) = 1 et H (ε1 , . . . , εn ) = 0 ; on pose F (ε1 , . . . , εn ) = 1 sinon.
6. F = G ↔ H ; on pose F (ε1 , . . . , εn ) = 1 si G(ε1 , . . . , εn ) = H (ε1 , . . . , εn ) et F (ε1 , . . . , εn ) = 0 si G(ε1 , . . . , εn ) 6=
H (ε1 , . . . , εn )
Un moyen de se rappeler cette définition est d’écrire les « tables de vérité » suivantes :
G
0
1
¬G
1
0
G
0
0
1
1
H
0
1
0
1
G ∨H
0
1
1
1
G
0
0
1
1
H
0
1
0
1
G ∧H
0
0
0
1
G
0
0
1
1
H
0
1
0
1
G→H
1
1
0
1
G
0
0
1
1
H
0
1
0
1
G↔H
1
0
0
1
Noter que, dans cette définition, on s’est servi du fait que chaque formule F s’écrit d’une seule façon
sous l’une des forme G ∨ H ,G ∧ H ,G → H ,G ↔ H .
Définition. Une formule F (p 1 , . . . , p n ) qui prend la valeur 1 pour chaque distribution de valeur de vérité sur ses variables propositionnelles est appelée une tautologie. On utilise la notation ⊢ F pour exprimer que F est une tautologie.
Deux formules F (p 1 , . . . , p n ),G(p 1 , . . . , p n ) sont dites tautologiquement équivalentes (ou, en abrégé,
équivalentes) si elles prennent la même valeur pour chaque distribution de valeur de vérité. On voir
aisément que cela revient à dire que la formule F ↔ G est une tautologie ; on écrit donc ⊢ F ↔ G pour
exprimer que F et G sont équivalentes.
Le théorème suivant (qui est intuitivement évident) exprime la propriété fondamentale de la notion
de valeur d’une formule qu’on vient de définir.
T HÉORÈME 6.2.1
Soient F (p 1 , . . . , p n ),G(p 1 , . . . , p n ) deux formules dont les variables propositionnelles sont prises parmi
p 1 , . . . , p n et soit ε1 , . . . , εn une distribution de valeurs de vérités sur ces variables, la formule G prenant
alors la valeur ε. Alors la valeur prise par la formule F (G, p 2 , . . . , p n ) pour cette distribution de valeurs de
vérité est F (ε, ε2 , . . . , εn ).
CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
40
La démonstration se fait par induction sur la longueur de F . Le théorème est immédiat si cette longueur est 1 : F est alors une variable propositionnelle.
Si F = ¬F ′ , la valeur prise par F ′ (G, p 2 , . . . , p n ) est F ′ (ε, ε2 , . . . , εn ) (d’après l’hypothèse de récurrence,
puisque F ′ est plus courte que F ). La valeur prise par F (G, p 2 , . . . , p n ) est donc 0 si F ′ (ε, ε2 , . . . , εn ) = 1 et
1 si F ′ (ε, ε2 , . . . , εn ) = 0. C’est exactement F (ε, ε2 , . . . , εn ).
Si F = F ′ ∨F ′′ , on a F (G, p 2 , . . . , p n ) = F ′ (G, p 2 , . . . , p n )∨F ′′ (G, p 2 , . . . , p n ). La valeur prise par F ′ (G, p 2 , . . . , p n )
est F ′ (ε, ε2 , . . . , εn ), celle prise par F ′′ (G, p 2 , . . . , p n ) est F ′′ (ε, ε2 , . . . , εn ), puisque F ′ et F ′′ sont plus courtes
que F . La valeur prise par F (G, p 2 , . . . , p n ) est donc 0 si ces deux valeurs sont 0, et 1 si l’une d’elles est 1.
Même démonstration lorsque F est l’une des formes F ′ ∧ F ′′ , F ′ → F ′′ , F ′ ↔ F ′′ .
C . Q . F. D.
En appliquant plusieurs fois de suite le théorème précédent, on voit que :
C OROLLAIRE 6.2.2
Si G i (q 1 , . . . , q n ) (1 ≤ i ≤ m) sont des formules dont les variables propositionnelles sont prises parmi
q 1 , . . . , q n et si ε1 , . . . , εn est une distribution de valeur de vérité sur ces variables, pour toute formule
F (p 1 , . . . , p m ) la valeur de F (G 1 , . . . ,G m ) pour cette distribution de valeur de vérité est F (η 1 , . . . , η m ) où
η i = G i (ε1 , . . . , εn ).
– En particulier, si F (p 1 , . . . , p m ) est une tautologie, alors F (G 1 , . . . ,G m ) est une tautologie, quelles
que soient les formules G 1 , . . . ,G m .
– Si F (p 1 , . . . , p m ) et F ′ (p 1 , . . . , p m ) sont tautologiquement équivalentes alors F (G 1 , . . . ,G m ) et F ′ (G 1 , . . . ,G m )
sont tautologiquement équivalentes quelles que soient les formules G 1 , . . . ,G m .
′
) sont équivalentes, quelle
– Si ⊢ G i ↔ G i′ (1 ≤ i ≤ m) alors les formules F (G 1 , . . . ,G m ), F (G 1′ , . . . ,G m
que soit la formule F (p 1 , . . . , p m ).
– Nous donnons ci-dessous une liste d’équivalences tautologiques couramment utilisées. Elles sont
écrites avec les variables propositionnelles p, q, r, . . . mais, d’après ce qu’on vient de voir, on peut
remplacer ces variables par n’importe quelles formules F,G, H , . . . .
¾
p → q ≡ ¬p ∨ q
¬(p ∧ q) ≡ ¬p ∨ ¬q
lois de de Morgan
p ↔ q ≡ (p → q) ∧ (q → p)
¬(p ∨ q) ≡ ¬p ∧ ¬q
p ↔ q ≡ (p ∧ q) ∨ (¬p ∧ ¬q)
p ∨q ≡ q ∨p
p ∧q ≡ q ∧p
¾
¬(p → q) ; p ∧ ¬q
¬(q ↔ q) ; p ↔ ¬q
commutativité de ∧ et de ∨
p ∨ (q ∨ r ) ≡ (p ∨ q) ∨ r
p ∧ (q ∧ r ) ≡ (p ∧ q) ∧ r
¾
associativité de ∧ et de ∨
p ∧ (q ∨ r ) ≡ (p ∧ q) ∨ (p ∧ r )
p ∨ (q ∧ r ) ≡ (p ∨ q) ∧ (p ∨ r )
¾
Distributivité de ∧ par rapport à ∨ et de ∨ par rapport à ∧.
– L’associativité de ∧ et de ∨ permet d’écrire des formules comme F 1 ∧ · · · ∧ F n et F 1 ∨ · · · ∨ F n sans
écrire de parenthèses. Toutes les formules qu’on obtient en rétablissant les parenthèses sont équivalentes.
– D’après la distributivité, on a les équivalences :
p ∨ (q 1 ∧ · · · ∧ q n ) ≡ (p ∨ q 1 ) ∧ · · · ∧ (p ∨ q n )
p ∧ (q 1 ∨ · · · ∨ q n ) ≡ (p ∧ q 1 ) ∨ · · · ∨ (p ∧ q n )
Cela permet de « développer » des formules comme (p ∧ q ∧ r ) ∨ (s ∧ t ) c’est-à-dire d’obtenir la
formule équivalente :
(p ∨ s) ∧ (p ∨ t ) ∧ (q ∨ s) ∧ (q ∨ t ) ∧ (r ∨ s) ∧ (r ∨ t )
Chaque formule F (p 1 , . . . , p n ) définit une application de {0, 1}n dans {0, 1} : celle qui au n-uplet
(ε1 , . . . , εn ) (εi = 0 ou 1) associe la valeur F (ε1 , . . . , εn ). Réciproquement, on a :
6.3. FORMES NORMALES.
41
T HÉORÈME 6.2.3
Toute fonction à variables et valeurs dans {0, 1} est représentée par une formule.
Soit Φ(p 1 , . . . , p n ) une application de {0, 1}n dans {0, 1}. On montre le théorème par récurrence sur n.
Si n = 1, il y a quatre applications de {0, 1} dans {0, 1} et elles sont représentées par les formules
p, ¬p, p ∧ ¬p, p ∨ ¬p.
On suppose le théorème vrai pour n − 1.
Alors les fonctions Φ(p 1 , . . . , p n−1 , 0) et Φ(p 1 , . . . , p n−1 , 1) sont représentées respectivement par les
formules F (p 1 , . . . , p n−1 ) et G(p 1 , . . . , p n−1 ). On voit immédiatement que Φ(p 1 , . . . , p n ) est alors représenté par la formule
¡
¢ ¡
¢
¬p n ∧ F (p 1 , . . . , p n−1 ) ∧ p n ∧G(p 1 , . . . , p n−1 )
ou bien par la formule
¡
¢ ¡
¢
¬p n → F (p 1 , . . . , p n−1 ) ∧ p n → G(p 1 , . . . , p n−1 )
C . Q . F. D.
′
Deux formules F (p 1 , . . . , p n ), F (p 1 , . . . , p n ) sont tautologiquement équivalentes, si et seulement si
n
elles définissent la même fonction, à variable et à valeur dans {0, 1}. Or il y a 22 applications de {0, 1}n
dans {0, 1}. Il en résulte :
C OROLLAIRE 6.2.4
n
Avec n variables propositionnelles on peut écrire 22 formules deux à deux non équivalentes.
T HÉORÈME 6.2.5
Toute formule est tautologiquement équivalente à une formule qui ne contient que les connecteurs ¬ et
∨.
On le montre par induction sur la longueur de la formule F considérée.
Si F = ¬G, par hypothèse de récurrence, G équivaut à une formule G ′ qui ne contient que les connecteurs ¬, ∨. Alors F équivaut à ¬G ′ .
Si F est l’une des formes G ∨ H ,G ∧ H ,G → H ,G ↔ H , par hypothèse de récurrence, G et H sont
respectivement équivalentes à des formules G ′ et H ′ qui ne contiennent que les connecteurs ¬, ∨.
Alors F équivaut respectivement à G ′ ∨ H ′ , ¬(¬G ′ ∨ H ′ ), (¬G ′ ) ∨ H ′ , (¬(G ′ ∨ H ′ )) ∨ (¬(¬G ′ ∨ ¬H ′ )) qui
ne contiennent que les connecteurs ¬ et ∨.
C . Q . F. D.
Les connecteurs ¬, ∨ qui permettent d’écrire toutes les formules (à une équivalence près) forment
ce qu’on appelle un système complet de connecteurs. On voit de la même façon que {¬, ∧} est aussi un
système complet de connecteurs ; voir d’autres exemples en exercice.
6.3 Formes normales.
Une formule F est dite sous forme normale disjonctive si elle s’écrit G 1 ∨G 2 ∨· · ·∨G k , chaque G i étant
de la forme p 1 ∧· · ·∧ p l ∧¬q 1 ∧· · ·∧¬q m (conjonction de variables propositionnelles et de négations de
variables propositionnelles).
Une formule F est dite sous forme normale conjonctive si elle s’écrit G 1 ∧ · · · ∧ G k , chaque G i étant
de la forme p 1 ∨ · · · ∨ p l ∨ ¬q 1 ∨ · · · ∨ ¬q m (disjonction de variables propositionnelles et de négations de
variables propositionnelles).
T HÉORÈME 6.3.1
Toute formule F (p 1 , . . . , p n ) équivaut à une formule sous forme normale disjonctive.
On le montre par récurrence sur le nombre de variables propositionnelles qui apparaissent dans la
formule. S’il n’y en a qu’une, la formule équivaut à l’une des formules p, ¬p, p ∧ ¬p, p ∨ ¬p, qui sont
sous forme normale disjonctive.
CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
42
Supposons le théorème démontré pour les formules qui ont au plus n − 1 variables. La formule
donnée F (p 1 , . . . , p n ) équivaut, comme on le voit immédiatement à
©
ª ©
ª
p n ∧ F (p 1 , . . . , p n−1 , 1)) ∨ ¬p n ∧ F (p 1 , . . . , p n−1 , 0))
(N.B. l’écriture F (p 1 , . . . , p n−1 , 1) désigne n’importe laquelle des formules obtenues en remplaçant p n
par une tautologie dans F (p 1 , . . . , p n−1 , p n ). Par exemple F (p 1 , . . . , p n−1 , p 1 ∨ ¬p 1 ) ; toutes ces formules
sont équivalentes.
De même F (p 1 , . . . , p n−1 , 0) désigne par exemple la formule F (p 1 , . . . , p n−1 , p 1 ∧ ¬p 1 ).)
D’après l’hypothèse de récurrence, la formule F (p 1 , . . . , p n−1 , 1) équivaut à une formule H1 ∨· · ·∨ Hk
sous forme disjonctive ; la formule F (p 1 , . . . , p n−1 , 0) équivaut à H1′ ∨ · · · ∨ Hk′ sous forme disjonctive.
Donc F (p 1 , . . . , p n ) équivaut à
soit, par distributivité :
©
ª ©
ª
p n ∧ (H1 ∨ · · · ∨ Hk ) ∨ ¬p n ∧ (H1′ ∨ · · · ∨ Hk′ )
(p n ∧ H1 ) ∨ · · · ∨ (p n ∧ Hk ) ∨ (¬p n ∧ H1′ ) ∨ · · · ∨ (¬p n ∧ Hk′ )
qui est sous forme normale disjonctive.
C . Q . F. D.
Noter qu’il n’y a pas unicité pour cette forme normale disjonctive. Par exemple p ∨ q et (p ∧ ¬q) ∨ q
sont équivalentes et toutes deux sous forme normale disjonctive.
On montre de la même façon que
T HÉORÈME 6.3.2
Toute formule équivaut à une formule sous forme normale conjonctive.
On peut d’ailleurs le déduire du théorème précédent : étant donné une formule F , la formule ¬F se
met sous forme disjonctive G 1 ∨ · · · ∨G k ; alors F équivaut à ¬G 1 ∧ · · · ∧ ¬G k , qui est mise aisément sous
forme conjonctive : comme G i est de la forme p 1 ∧ · · · ∧ p l ∧ ¬q 1 ∧ · · · ∧ ¬q m , ¬G i équivaut à ¬p 1 ∨ · · · ∨
¬p l ∨ q 1 ∨ . . . q m .
Notons que la donnée de la table de vérité d’une formule permet de la mettre immédiatement sous
forme normale disjonctive. Par exemple la formule F (p, q, r ) qui a la table de vérité suivante :
p
0
0
0
0
1
1
1
1
q
0
0
1
1
0
0
1
1
r
0
1
0
1
0
1
0
1
F (p, q, r )
0
1
0
1
0
1
0
0
se met sous la forme (¬p ∧ ¬q ∧ r ) ∨ (¬q ∧ q ∧ r ) ∨ (p ∧ ¬q ∧ r ) : chaque parenthèse correspond à une
ligne de la table pour laquelle la valeur de F (p, q, r ) est 1. Dans chaque parenthèse chaque variable est
affectée ou non du symbole ¬ suivant qu’elle a la valeur 0 ou 1.
Pour justifier cette méthode, il suffit de vérifier que la formule écrite a même table de vérité que F ,
ce qui est immédiat.
6.4 Algèbre de Boole.
On appelle algèbre de Boole (ou anneau de Boole) un anneau A, qui a également unité pour la
multiplication, tel que x 2 = x pour tout x ∈ A.
6.4. ALGÈBRE DE BOOLE.
43
Par exemple, l’ensemble {0, 1} où l’addition et la multiplication sont définies par
0 + 0 = 0 ; 0 + 1 = 1 + 0 = 1 ; 1 + 1 = 0 ; 0.0 = 0 ; 0.1 = 1.0 = 0 ; 1.1 = 1
est un anneau de Boole. C’est aussi un anneau d’intégrité (c’est-à-dire x y = 0 ⇒ x = 0 ou y = 0) ; c’est
le seul anneau de Boole A qui soit un anneau d’intégrité, car si x ∈ A, on a x 2 = x soit x(x − 1) = 0 d’où
x = 0 ou x = 1.
T HÉORÈME 6.4.1
Si A est une algèbre de Boole, A est un anneau commutatif et x + x = 0 pour tout x ∈ A.
En effet si x, y ∈ A on a (x + y)2 = x + y soit x 2 + x y + y x + y 2 = x + y. Comme x 2 = x, y 2 = y, on a
x y + y x = 0. En faisant y = 1, on obtient x + x = 0 pour tout x ∈ A. Donc x y + x y = 0 = x y + y x d’où
x y = y x.
C . Q . F. D.
Sur une algèbre de Boole A, on définit une relation d’ordre en posant x ≤ y si et seulement si x y = x.
On vérifie les propriétés de définition d’une relation d’ordre :
– On a x ≤ x puisque x 2 = x.
– Si x ≤ y et y ≤ x alors x y = x = y donc x = y.
– Si x ≤ y et y ≤ z alors x y = x donc x y z = xz or x(y z) = x y = x donc x = xz et x ≤ z.
Il est clair que pour cet ordre 0 est le plus petit élément et 1 le plus grand.
Deux éléments quelconques x, y de A ont une borne inférieure qui est x y. En effet x y ≤ x (car x y x =
x 2 y = x y) et x y ≤ y si z ≤ x et z ≤ y on a zx = z donc zx y = z y = z et z ≤ x y.
L’application ϕ : A → A définie par ϕ(x) = 1 + x est une bijection de A sur lui-même, qui renverse
l’ordre x ≤ y ⇔ ϕ(x) ≥ ϕ(y) comme on le vérifie immédiatement.
Il en résulte que deux élément quelconque x, y de A ont une borne supérieure qui est 1 + (1 + x) +
(1 + y) c’est à dire x + y + x y.
Pour x, y ∈ A, on note respectivement x ∩ y et x ∪ y les bornes inférieures et supérieure de {x, y}.
Donc x ∩ y = x y, x ∪ y = x + y + x y.
On a les propriétés de distributivité :
x ∪ (y ∩ z) = (x ∪ y) ∩ (x ∪ z)
x ∩ (y ∪ z) = (x ∩ y) ∪ (x ∩ z)
1 + x est appelé le complémentaire de x, on a x ∪ (1 + x) = 1 et x ∩ (1 + x) = 0.
Ces propriétés sont celles des opérations de réunion, intersection, complémentation dans l’ensemble des parties d’un ensemble E . On va donner une deuxième définition des anneaux de Boole,
qui n’utilise que la relation d’ordre et mettra en évidence le fait que P (E ) est un anneau de Boole.
On considère un ensemble ordonné A ayant les propriétés 6.4 suivantes :
1. A a un plus petit élément, noté 0 et un plus grand élément, noté 1.
2. Deux élément quelconque x, y ont une borne supérieure, noté x ∪ y et une borne inférieure, noté
x ∩ y. Et on a :
x ∪ (y ∩ z) = (x ∪ y) ∩ (x ∪ z)
x ∩ (y ∪ z) = (x ∩ y) ∪ (c ∩ z)
3. pour chaque x ∈ A, il existe x ′ ∈ A tel que x ∩ x ′ = 0 et x ∪ x ′ = 1.
L EMME 6.4.2
Si x 1′ est tel que x ∩ x 1′ = 0 et x ∪ x 1′ = 1 alors x 1′ = x ′ .
En effet, x 1′ = x 1′ ∩ (x ∪ x ′ ) = (x 1′ ∩ x) ∪ (x 1′ ∩ x ′ ) donc x 1′ = x 1′ ∩ x ′ (car x 1′ ∩ x = 0).
De même x 1′ = x 1′ ∪ (x ∩ x ′ ) = (x 1′ ∪ x) ∩ (x 1′ ∪ x ′ ) donc x 1′ = x 1′ ∪ x ′ (car (x 1′ ∪ x) = 1).
Donc x 1′ ∩ x ′ = x 1′ ∪ x ′ , c’est-à-dire x 1′ = x ′ .
C . Q . F. D.
L’unique élément x ′ tel que x ∩ x ′ = 0 et x ∪ x ′ = 1 est appelé le complémentaire de x. On a (x ′ )′ = x
puisque x satisfait les conditions qui définissent le complémentaire de x ′ .
CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
44
Enfin (x ∪ y)′ = x ′ ∩ y ′ , en effet : x ′ ∩ y ′ ∩ (x ∪ y) = 0 et (x ′ ∩ y ′ ) ∪ (x ∪ y) = 1, comme on le voit en
utilisant la distributivité. De même (x ∩ y)′ = x ′ ∪ y ′ .
On se propose de définir sur A une structure d’anneau de Boole. L’addition et la multiplication sont
définies par :
x + y = (x ∩ y ′ ) ∪ (x ′ ∩ y)
xy
= x∩y
On a x +y = (x ∪y)∩(x ′ ∪y ′ ) en effet (x ∩y ′ )∪(x ′ ∩y) = (x ∪x ′ )∩(x ∪y)∩(x ′ ∪y ′ )∩(y ′ ∪y) par distributivité.
On vérifie immédiatement les propriétés suivantes :
(x y)z = x(y z) ; x y = y x ; x.1 = x ; x 2 = x ; x + y = y + x ; x + x = x ; x + 0 = x
Pour montrer que A muni de ces deux opérations est un anneau de Boole, il reste donc à vérifier l’associativité de l’addition et la distributivité de la multiplication par rapport à l’addition.
On a
et
Donc
(x + y) + z = [(x + y) ∪ z] ∩ [(x + y)′ ∪ z]
(x + y)′
= (x ′ ∪ y) ∩ (x ∪ y ′ ).
(x + y)′ ∪ z ′ = (x ′ ∪ y ∪ z ′ ) ∩ (x ∪ y ′ ∪ z)
(x + y) ∪ z = [(x ∪ y) ∩ (x ′ ∪ y ′ )] ∪ z
= (x ∪ y ∪ z) ∩ (x ′ ∪ y ′ ∪ z).
Donc
(x + y) + z = (x ∪ y ∪ z) ∩ (x ′ ∪ y ′ ∪ z) ∩ (x ′ ∪ y ∪ z ′ ) ∩ (x ∪ y ′ ∪ z ′ ).
Cela montre que (x + y) + z ne change pas quand on permute x, y, z de façon quelconque. Donc
(x + y) + z = (y + z) + x
et comme l’addition est commutative (x + y) + z = x + (y + z). L’addition est donc associative.
On a
or
et
Donc
Soit
x y + xz
= [(x y) ∩ (xz)′ ] ∪ [(xz) ∩ (x y)′ ]
x y ∩ (xz)′ = x ∩ y ∩ (x ′ ∩ z ′ ) = x ∩ y ∩ z ′
(xz) ∩ (x y)′ = x ∩ z ∩ (x ′ ∩ y ′ ) = x ∩ y ′ ∩ z.
x y + xz
x y + xz
= (x ∩ y ∩ z ′ ) ∪ (x ∩ y ′ ∩ z) = x ∩ [(y ′ ∩ z) ∪ (y ∩ z ′ )]
= x(y + z).
On a donc bien défini sur A une structure d’anneau de Boole. L’ordre donné sur A est bien l’ordre donné
sur A est bien l’ordre associé à cette structure d’anneau de Boole, puisque x ≤ y ⇔ x ∩ y = x ⇔ x y = x.
Exemple. On prend A = P (E ) (ensemble des parties d’un ensemble E ). C’est un ensemble ordonné
par la relation d’inclusion (X ≤ Y ⇔ X ⊂ Y ) et cet ensemble ordonné satisfait les conditions 6.4 cidessus.
C’est donc un anneau de Boole dans lequel l’addition et la multiplication sont :
X + Y = (X ∩ ∁Y ) ∪ (Y ∩ ∁X )
XY = X ∩Y .
différence symétrique de X et Y
Plus généralement, un sous-ensemble A de P (E ) est appelé anneau de parties de E si
X ∈A
X ,Y ∈ A
; ∈ A.
⇒
⇒
∁X ∈ A
X ∪Y ∈ A
Si A est un anneau de parties de E , on a E ∈ A (puisque E = ∁;). Si X , y ∈ A alors X ∩ Y ∈ A (car ∁X ∈ A,
∁Y ∈ A, donc ∁X ∪ ∁Y ∈ A et donc ∁(∁X ∪ ∁Y ) ∈ A).
6.5. ALGÈBRE DE BOOLE DU CALCUL PROPOSITIONNEL.
45
Il en résulte que A, ordonné par la relation d’inclusion, satisfait les conditions 6.4 ci-dessus et donc
est un anneau de Boole. Un anneau des parties de E est donc un sous-anneau de Boole de l’anneau
P (E ).
Le théorème suivant (qui sera démontré dans le cours de théorie des ensembles) montre que cet
exemple est le plus général possible :
T HÉORÈME 6.4.3 ( T HÉORÈME DE S TONE .)
Tout anneau de Boole est isomorphe à un anneau de parties d’un certain ensemble E .
6.5 Algèbre de Boole du calcul propositionnel.
On désigne par F l’ensemble des formules construites avec une suite infinie p 1 , . . . , p n , . . . de variables propositionnelles. Sur F on définit une relation d’équivalence F ∼G
ˆ si et seulement si F est tautologiquement équivalente à G. La classe d’équivalence de F (l’ensemble des formules équivalentes à
F ) sera noté F̂ . L’ensemble des classes d’équivalence, c’est-à-dire l’ensemble quotient de F par cette
relation d’équivalence sera désigné par F̂ .
Sur F̂ on définit une relation d’ordre en posant F̂ ≤ Ĝ si et seulement si ⊢ F → G. On vérifie aisément
qu’on a bien affaire à une relation d’ordre.
Il y a un plus grand élément noté 1, qui est la classe d’équivalence des tautologies ; un plus petit
élément, noté 0, qui est la classe d’équivalence des négations de tautologies.
ƒ
Deux éléments quelconques F̂ , Ĝ de F̂ ont une borne inférieure qui est F
∧G.
ƒ
En effet F ∧G est ≤ F̂ et Ĝ et si Ĥ ≤ F̂ , Ĥ ≤ Ĝ on a ⊢ H → F et ⊢ H → G donc ⊢ H → F ∧G.
ƒ
c = 0, F̂ ∩ ¬F
c = 1.
De même, F̂ et Ĝ ont une borne supérieure qui est F
∨G. On a F̂ ∪ ¬F
Par suite, l’ensemble F̂ est un anneau de Boole, suivant la deuxième définition des anneaux de
Boole. On vérifie aisément que l’addition est donné par F̂ + Ĝ = Fá
↔ ¬G.
6.5.1 Isomorphismes d’anneaux de Boole.
L’anneau de Boole F̂ n’est pas isomorphe à l’anneau de Boole P (E ) quel que soit l’ensemble E . En
effet, si a ∈ E , {a} est un élément de P (E ) qui ne contient aucun autre élément non vide de P (E ) (on dit
que {a} est un atome de P (E )).
Si F̂ était isomorphe à P (E ), il y aurait dans F̂ un atome F̂ . Or si p 1 , . . . , p n sont les variables qui
apparaissent dans F et si G = F (p 1 , . . . , p n ) ∧ p n+1 , on a ⊢ G → F donc Ĝ ≤ F̂ .
Or F̂ 6= 0 donc F prend la valeur 1 pour au moins une distribution de valeurs de vérité sur p 1 , . . . , p n
et donc G aussi ; donc Ĝ 6= 0 ce qui montre que F̂ n’est pas un atome de F̂ .
Comme l’indique le théorème de Stone, F̂ est isomorphe à un anneau de partie d’un certain ensemble E . On peut prendre pour E l’ensemble des suites (ε1 , . . . , εn , . . . ) de 0 et de 1, c’est à dire l’ensemble des distributions de valeurs de vérité sur p 1 , . . . , p n , . . . . On définit une application ϕ de F dans
P (E ) en posant ϕ(F ) = l’ensemble des distributions de valeur de vérité qui donnent à F la valeur 1.
Le lecteur vérifiera que ϕ(F ) ne dépend que de la classe d’équivalence F̂ de F et que l’application
ψ : F̂ → P (E ) définie par ψ(F̂ ) = ϕ(F ) est un isomorphisme d’anneau de Boole de F̂ dans P (E ).
6.6 Théorème de compacité du calcul propositionnel.
Soient P un ensemble de variable propositionnelles et δ une distribution de valeurs de vérité (c’està-dire une application de P dans {0, 1}). Pour chaque formule F écrite avec ces variables, on désignera
par δF la valeur de F (0 ou 1) pour la distribution δ. Étant donné un ensemble E de formules écrite avec
ces variables, on dit que la distribution δ satisfait E si elle donne la valeur 1 à chaque formule de E . On
dit que E est satisfaisable, s’il existe une distribution de valeurs de vérité qui satisfait E .
T HÉORÈME 6.6.1
Soit E un ensemble de formule tel que tout sous-ensemble fini de E soit satisfaisable. Alors E est satisfaisable.
46
CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
Supposons pour commencer que E a la propriété supplémentaire suivante :
Pour toute formule F , ou bien F ∈ E ou bien ¬F ∈ E
(1)
On ne peut avoir à la fois F ∈ E et ¬F ∈ E car alors {F, ¬F } serait un sous-ensemble fini de E non satisfaisable.
On définit alors la distribution δ en posant δp = 1 si p ∈ E , δp = 0 si p 6∈ E (p étant une variable
propositionnelle).
On montre, par induction sur la longueur de F que δF = 1 si et seulement si F ∈ E . C’est évident si
F est de longueur 1 (F est une variable propositionnelle).
– Si F = G ∨ H : supposons δF = 1, on a alors, par exemple, δG = 1, donc (hypothèse d’induction)
G ∈ E . Comme {¬F,G} n’est pas satisfaisable, on ne peut avoir ¬F ∈ E donc F ∈ E .
Inversement supposons F ∈ E comme {F, ¬G, ¬H } n’est pas satisfaisable, on ne peut avoir ¬G ∈
E , ¬H ∈ E . Donc, par exemple, G ∈ E . Par suite (hypothèse d’induction)à δG = 1, donc δF = 1.
– Si F = ¬G, supposons δF = 1 donc δG = 0 et par suite (hypothèse d’induction) G 6∈ E . Donc ¬G ∈
E , soit F ∈ E .
Inversement, si F ∈ E on ne peut avoir G ∈ E (car {F,G} n’est pas satisfaisable). Donc δG = 0 (hypothèse d’induction) et par suite δF = 1.
On a donc bien trouvé une distribution δ qui satisfait toutes les formules de E (et celles-là seulement).
Revenons maintenant au cas général, où on ne suppose plus que E a la propriété 1, le problème
serait résolu si on trouve un ensemble E ′ de formules, E ′ ⊃ E ayant la propriété 1, tel que tout sousensemble fini de E ′ soit satisfaisable.
Nous supposerons maintenant que l’ensemble P des variables propositionnelles est dénombrable.
Dans le cas général on utiliserait le théorème de Zorn (voir le cours de théorie des ensembles).
L’ensemble F de toutes les formules qu’on peut écrire avec les variables propositionnelles de P est
alors dénombrable. On a donc F = {F 1 , F 2 , . . . , F n , . . .}. On définit une suite E = E 1 ⊂ E 2 ⊂ · · · ⊂ E n ⊂ . . . de
sous-ensemble de F de façon que tout sous ensemble fini de E n soit satisfaisable.
Par hypothèse, c’est le cas pour E 1 . On procède par induction sur n : ayant défini E n , on considère
l’ensemble E n ∪ {F n }.
– Si tous les sous-ensembles finis de E n ∪ {F n } sont satisfaisables, on pose E n+1 = E n ∪ {F n }.
– Sinon, il existe un sous-ensemble fini de E n ∪ {F n } qui n’est pas satisfaisable, notons le X ∪ {F n }
(X est un sous-ensemble fini de E n ).
On pose alors E n+1 = E n ∪ {¬F n } et tous ses sous-ensembles finis sont satisfaisables : car s’il existe
un sous-ensemble fini Y ∪ {¬F n } qui ne l’est pas (Y étant un sous-ensemble fini de E n ), alors
X ∪Y est un sous-ensemble fini de E n qui n’est pas satisfaisable ; cela contredit l’hypothèse d’induction sur E n .
S
On pose alors E ′ = n∈N E n . Alors tous sous-ensemble fini de E ′ est satisfaisable (car il est inclus
dans un E n ). De plus, pour toute formule F , on a F ∈ E ′ ou ¬F ∈ E ′ (car F = F n pour un certain entier n
et par construction de E n+1 on a F ∈ E n+1 ou bien ¬F ∈ E n+1 .
C . Q . F. D.
Exemple d’application. Soit S une relation binaire sur un ensemble E (c’est-à-dire S ⊂ E × E ). On dira
que S est ordonnable s’il existe une relation d’ordre R sur E telle que S ⊂ R. On a alors :
C OROLLAIRE 6.6.2
Pour que S soit ordonnable, il faut et il suffit que, pour chaque sous-ensemble fini F de E , la restriction de
S à F le soit.
La condition est évidemment nécessaire. Pour montrer qu’elle est suffisante, à chaque couple (a, b) ∈
E × E associons une variable propositionnelle p (a,b) . Considérons l’ensemble de formules E suivant :
p (a,a)
¬[p (a,b) ∧ p (b,a) ]
p (a,b) ∧ p (b,c) → p (a,c)
p (a,b)
a décrivant E
a, b décrivant E , a 6= b
a, b, c décrivant E
le couple (a, b) décrivant S
6.7. RÈGLES DE DÉDUCTION POUR LE CALCUL PROPOSITIONNEL.
47
Soit δ une distribution de valeur de vérité satisfaisant cet ensemble E de formules. Si on définit la relation binaire R sur E en posant (a, b) ∈ R ⇔ δp (a,b) = 1 on voit aisément que R est une relation d’ordre
sur E et que S ⊂ R. Le problème est donc ramené à montrer qu’il existe une telle distribution δ.
D’après le théorème de compacité, il suffit de montrer que tout sous-ensemble fini de E est satisfaisable.
Soient U un sous-ensemble fini de E et a 1 , . . . , a n les éléments qui apparaissent en indice dans les
variables propositionnelles des formules de U . On pose F = {a 1 , . . . , a n }. C’est un sous-ensemble fini de
E , donc, par hypothèse il existe une relation d’ordre T sur F telle que T ⊃ S ∩ (F × F ) (où S ∩ (F × F ) est
la restriction de S à F ).
Les variables propositionnelles qui apparaissent dans les formules de U sont les p (ai ,a j ) (1 ≤ i , j ≤
n). On définit une distribution γ de valeurs de vérité sur ces variables en posant :
γp (ai ,a j ) = 1
γp (ai ,a j ) = 0
si (a i , a j ) ∈ T
si (a i , a j ) 6∈ T
Comme T est une relation d’ordre qui prolonge S ∩ (F × F ), on voit que γ satisfait U .
C . Q . F. D.
6.7 Règles de déduction pour le calcul propositionnel.
En mathématiques, on obtient les théorèmes (propositions vraies) au moyen du raisonnement, de
la déduction. En logique, on a tenté d’imiter ce processus de déduction de façon à le codifier complètement, avec des règles précises, au point qu’une machine à calculer (suffisamment perfectionnée) soit
capable d’effectuer ces raisonnements.
Au point où nous en sommes de l’analyse du langage mathématique (le calcul propositionnel), on
peut considérer que les « théorèmes » qu’il nous faut obtenir au moyen de ces règles de déduction, ce
sont les tautologies.
Il est théoriquement très simple de voir si une formule donnée est, ou non, une tautologie : il suffit de
calculer sa valeur pour toutes les distributions de valeur de vérité sur ces variables. Mais cette méthode
ne ressemble en rien au raisonnement mathématique.
Le théorème suivant a l’intérêt de donner une autre méthode, d’ailleurs beaucoup moins pratique,
mais qui a beaucoup plus l’allure d’une déduction.
Dans ce théorème on ne considère que les formules écrites avec les seuls connecteurs propositionnels ¬, ∨.
T HÉORÈME 6.7.1 ( T HÉORÈME DE COMPLÉTUDE .)
Pour qu’une formule soit une tautologie, il faut et il suffit qu’on puisse l’obtenir en appliquant (un nombre
fini de fois) les déductions suivantes :
1. Toutes les formules de la forme A ∨ ¬A, (B ∨ A) ∨ ¬A, (B ∨ ¬A) ∨ A sont déduite.
2. Si on a déduit les formules A ∨ B , A ∨ ¬B , alors on déduit A.
3. Si on déduit les formules A ∨ (B ∨C ), A ∨ ¬B , A ∨ ¬C alors on déduit A.
4. Si on a déduit les formules A∨B alors quel que soit C on a déduit les formules (A∨C )∨B , A∨(B ∨C ),
A ∨ (C ∨ B ).
Les conditions sont suffisantes : il est clair que la règle (1) ne fournit que des tautologies et que les
règles (2), (3) et (4) appliquées à partir des formules qui sont des tautologies, ne fournissent également
que des tautologies. Il en résulte que si une formule F est obtenue à l’aide des règles (1), (2), (3) et (4)
alors F est nécessairement une tautologie.
La condition est nécessaire : soit F une formule qui n’est pas déduite au moyen des règles (1), (2),
(3) ou (4). On a à montrer que F n’est pas une tautologie, donc à trouver une distribution de valeurs de
vérité qui satisfait ¬F .
Soient p 1 , . . . , p k les variables propositionnelles de F . Dans la suite, on ne considère plus que les
formules qu’on peut écrire avec ces variables propositionnelles, qui forment un ensemble dénombrable
48
CHAPITRE 6. CALCUL PROPOSITIONNEL ET ALGÈBRES DE BOOLE.
G = {G 1 ,G 2 , . . . ,G n , . . .}. On définit alors par récurrence sur n une suite de formules F = F 1 , F 2 , . . . , F n , . . . .
Ayant défini F n , on pose :
F n+1 = F n ∨G n
F n+1 = F n ∨ ¬G n
si la formule F n ∨G n n’est pas déduite
si la formule F n ∨G n est déduite
L EMME 6.7.2
Pour tout entier n, la formule F n n’est pas déduite.
Par hypothèse, c’est vrai pour n = 1.
Supposons le vrai pour n. On a alors un problème pour n + 1 dans le cas où les deux formules
F n ∨G n , F n ∨ ¬G n seraient déduites. Mais alors F n elle-même est déduite (règle 2) ce qui contredit l’hypothèse.
C . Q . F. D.
L EMME 6.7.3
Pour toute formule G, il existe un entier m tel que F m ∨G ou bien F m ∨ ¬G soit déduite.
En effet on a G = G n pour un certain entier n. Alors F n+1 est soit F n ∨G soit F n ∨¬G. Dans le premier
cas F n+1 ∨ ¬G (soit (F n ∨ G) ∨ ¬G) est déduite, dans le second cas c’est F n+1 ∨ G (soit (F n ∨ ¬G) ∨ G) est
déduite (règle 1).
C . Q . F. D.
On définit une distribution de valeurs de vérité sur les variables propositionnelles p 1 , . . . , p k en posant :
δp i = 1 si et seulement s’il existe m tel que F m ∨ p i soit déduite
L EMME 6.7.4
Pour toute formule G, on a δG = 1 si et seulement s’il existe m tel que F m ∨G soit déduite.
On le montre par induction sur la longueur de G.
Si G est de longueur 1, c’est une variable propositionnelle, d’où le résultat par définition de δ.
– Supposons G = ¬H . Si δG = 1, on a δH = 0, il existe un entier m tel que F m ∨ H ou F m ∨ ¬H soit
déduite. Le premier cas est exclu, car on aurait δH = 1 (hypothèse d’induction). Donc F m ∨ G est
déduite.
Inversement, supposons qu’il existe m tel que F m ∨ G soit déduite. Si on avait δG = 0, donc δH =
1, il existerait un entier q tel que F q ∨ H soit déduite (hypothèse d’induction). Supposons par
exemple q ≥ m. On a alors F q = (. . . ((F m ∨ Φ1 ) ∨ Φ2 ) ∨ . . . ) ∨ Φl .
Comme F m ∨G est déduite, on voit, en appliquant plusieurs fois la règle (4), que la formule F q ∨G
est déduite. Donc les deux formules F q ∨H et F q ∨¬H sont déduite. Par suite, F q est déduite (règle
2). C’est impossible, comme on l’a vu au lemme 6.7.2. Finalement on a bien δG = 1.
– Supposons que G = H ∨ H ′ . Si δG = 1 on a, par exemple, δH = 1. Donc (hypothèse d’induction)
F m ∨ H est déduite, pour un certain entier m. D’après la règle (4) on voit que F m ∨ (H ∨ H ′ ) c’est à
dire F m ∨G est déduite.
Inversement, supposons que F m ∨ G soit déduite pour un certain entier m. Si δG = 0, on a δH =
δH ′ = 0. Il existe deux entiers q, r tels que l’une des deux formules F q ∨ H , F q ∨¬H ainsi que l’une
des deux formules F r ∨H ′ , F r ∨¬H ′ . Or, si F q ∨H est déduite, on a δH = 1 (hypothèse d’induction).
Donc F q ∨ ¬H et F r ∨ ¬H ′ sont toutes deux déduites.
Supposons alors, par exemple m ≤ q ≤ r . On a alors F r = (. . . ((F q ∨ Φ1 ) ∨ Φ2 ) ∨ . . . ) ∨ Φl .
Comme F q ∨ ¬H est déduite, on voit, en appliquant plusieurs fois la règle (4) F r ∨ ¬H . De même
comme F m ∨G est déduite, on voit que F r ∨G est déduite.
Finalement les trois formules F r ∨(H ∨ H ′ ), F ∨¬H , F ∨¬H ′ sont déduites. D’après la règle (3), on
voit que F r est elle-même déduite. c’est impossible, comme on l’a montré au lemme 6.7.2.
C . Q . F. D.
Il est alors immédiat de montrer que la distribution δ satisfait ¬F : en effet, il existe bien un entier
m, à savoir m = 1 tel que F m ∨ ¬F soit déduite (règle 1).
C . Q . F. D.
Chapitre 7
Usage des connecteurs propositionnels
et des quantificateurs.
Dans ce chapitre, on revient à l’étude directe du langage mathématique, il n’y aura donc pas de démonstrations, mais des « constatations expérimentales. » À partir de ces constatations, on pourra définir
une nouvelle structure mathématique, plus compliquée que le calcul propositionnel, mais qui donne
une meilleure approximation de la réalité constituée par le langage mathématique : c’est le « calcul des
prédicats », dont nous parlerons dans le chapitre suivant.
7.1 Énonces sans quantificateurs.
On va étudier un certain type d’énoncé mathématique, décrit ci-dessous. On a donc tout d’abord les
lettres x 1 , . . . , x n appelées variables ; à chaque variable x i est associé un ensemble E i non vide, appelé
domaine de variation de x i . On considère alors des sous-ensembles P 1 , . . . , P k de E 1 × · · · × E n .
On appellera énoncé élémentaire chacun des énoncés (x 1 , . . . , x n ) ∈ P j ( j = 1, 2, . . . , k).
Les énoncés du type considéré sont ceux que l’on obtient en combinant les énoncés élémentaires à
l’aide des connecteurs propositionnels :
non, ou, et, ⇒, ⇔
Par exemple :
[(x 1 , . . . , x n ) ∈ P 1 et (x 1 , . . . , x n ) 6∈ P 2 ] ⇔ (x 1 , . . . , x n ) 6∈ P 3
Un tel énoncé est noté E (x 1 , . . . , x n ) ; il exprime une propriété que peut avoir (ou ne pas avoir) un n-uplet
(a 1 , . . . , a n ) ∈ E 1 × · · · × E n . Il définit donc une partie de E 1 × · · · × E n qui ont cette propriété (autrement
dit l’ensemble {(a 1 , . . . , a n ) ∈ E 1 × · · · × E n ; E (a 1 , . . . , a n )}.
Étant donné un n-uplet (a 1 , . . . , a n ) ∈ E 1 ×· · ·×E n , comment vérifie-t-on qu’il a la propriété E (x 1 , . . . , x n ) ?
Autrement dit, que l’on a E (a 1 , . . . , a n ) ?
Pour ce faire, on examine tout d’abord les valeurs de vérité des énoncés élémentaires (a 1 , . . . , a n ) ∈ P i
(i = 1, 2, 3 dans le cas particulier ci dessus). Si par exemple, on a (a 1 , . . . , a n ) ∈ P 1 , (a 1 , . . . , a n ) ∈ P 2 et
(a 1 , . . . , a n ) 6∈ P 3 , ces valeurs de vérité sont 1, 1, 0.
On calcule alors les valeurs de vérité prise par la formule (p 1 ∧ ¬p 2 ) ↔ ¬p 3 , lorsque p 1 , p 2 , p 3 ont
respectivement les valeurs 1, 1, 0. On trouve 0, ce qui veut dire que dans ce cas, l’énoncé E (a 1 , . . . , a n ) est
faux.
Bien entendu, dans ce calcul, on peut remplacer la formule (p 1 ∧¬p 2 ) ↔ ¬p 3 par une formule équivalente. On la prend en général sous la forme normale disjonctive, ce qui donne (p 1 ∧ ¬p 2 ∧ ¬p 3 ) ∨
(¬p 1 ∧ p 3 ) ∨ (p 2 ∧ p 3 ). Cela revient à remplacer l’énoncé considéré par le suivant :
ou
ou
[(x 1 , . . . , x n ) ∈ P 1 et (x 1 , . . . , x n ) ∈ P 2 et (x 1 , . . . , x n ) 6∈ P 3 ]
[(x 1 , . . . , x n ) 6∈ P 1 et (x 1 , . . . , x n ) ∈ P 3 ]
[(x 1 , . . . , x n ) ∈ P 2 et (x 1 , . . . , x n ) ∈ P 3 ]
49
50
CHAPITRE 7. USAGE DES CONNECTEURS PROPOSITIONNELS ET DES QUANTIFICATEURS.
Il en résulte que le sous-ensemble de E 1 × · · · × E n défini par l’énoncé considéré est (P 1 ∩ ∁P 2 ∩ ∁P 3 ) ∪
(∁P 1 ∩ P 3 ) ∪ (P 2 ∩ P 3 )
Les énoncés élémentaires (x 1 , . . . , x n ) ∈ P j sont le plus souvent écrit non pas sous cette forme, mais
en énonçant la propriété qui définit l’ensemble P j .
Exemple. Les variables x, y décrivent R. Les énoncés élémentaires considérés sont écrits : |x − y| ≤ 1 ;
|x + y| ≥ 1 ; x = 1 au lieu que (x, y) ∈ P 1 , (x, y) ∈ P 2 , (x, y) ∈ P 3 avec P 1 = {(x, y) ∈ R2 ; |x − y| ≤ 1}, P 2 =
{(x, y) ∈ R2 ; |x + y| ≥ 1} et P 3 = {(x, y) ∈ R2 ; x = 1}.
L’énoncé (|x − y| ≤ 1 ⇔ |x + y| ≥ 1) ⇒ x = 1 définit donc un sous-ensemble de R2 qui sera plus facilement mis en évidence si on met l’énoncé sous forme disjonctive. La formule du calcul propositionnel
correspondant ) cet énoncé est (p 1 ↔ p 2 ) → p 3 ; sous forme disjonctive : (p 1 ∧ ¬p 2 ) ∨ (¬p 1 ∧ p 2 ) ∨ p 3 .
L’énoncé sous forme disjonctive est donc :
(|x − y| ≤ 1 et |x + y] < 1) ou (|x − y| > 1 et |x + y| ≥ 1) ou x = 1
et il est facile de voit le sous-ensemble de R2 défini par cet énoncé.
Remarque. Les « discussions » de systèmes d’équations ou d’inéquations que l’on fait dans les classes
secondaires, reviennent aussi, la plupart du temps, à écrire un énoncé sous forme disjonctive.
Considérons, par exemple, le système d’inéquation :
(
x−m
1+mx
1−mx 2 x
x+m 2
<
0
>
0
à résoudre et à discuter en x, suivant les valeurs du paramètre réel m.
La première inéquation équivaut à l’énoncé E 1 :
(m = 0 et x < 0) ou (m > 0 et −
1
1
< x < m) ou (m > 0 et m < x < − )
m
m
La seconde équivaut à l’énoncé E 2 :
(m = 0 et x > 0) ou (m 6= 0 et −m 2 < x <
1
m2
La « discussion » consiste à mettre l’énoncé « E 1 et E 2 » sous forme disjonctive (utiliser la distributivité
du ou par rapport à et).
En supprimant les énoncés visiblement toujours faux (comme « m = 0 et x < 0 et m = 0 et x > 0 », ou
bien « m = 0 et x < 0 et m 6= 0 et . . . » on obtient :
ou
1
< x < m et −m 2 < x < − m12 )
(m > 0 et − m
1
et −m 2 < x < m12
(m < 0 et m < x < m
Pour chaque valeur du paramètre m, les solutions du système forment donc un intervalle ouvert (éventuellement vide). Pour préciser les bornes de cet intervalle, on remplace dans l’énoncé ci dessus « m =
0 » par « 0 < m < 1 ou m ≥ 1 » et « m < 0 par −1 < m < 0 ou m ≤ −1 ». L’énoncé obtenu étant remis sous
1
< x < m et
forme disjonctive, on obtient la disjonction de 4 énoncés, dont le premier est : « m ≥ 1 et − m
1
2
−m < x < m 2 . » Autrement dit :
m≥1
et
1
−m
<x<
1
m2
On trouve de même pour les 3 autres :
0<m<1
−1 < m < 0
m ≤ −1
et
et
et
−m 2 < x < m
1
−m 2 < x < − m
1
m<x< m
7.2. ÉNONCÉS AVEC QUANTIFICATEURS.
51
7.2 Énoncés avec quantificateurs.
Les énoncés mathématiques que nous considérons maintenant sont d’un type plus général, décrit
ci-dessous.
On considère encore des variables x 1 , . . . , x n ; à chaque variable x i est toujours associé un ensemble
E i non vide, qui est son domaine de variation. On se donne encore des sous-ensembles P 1 , . . . , P k de
E1 × · · · × En .
Les énoncés considérés sont ceux qu’on obtient en appliquant les règles suivantes à partir des énoncés élémentaires (x 1 , . . . , x n ) ∈ P i :
1. Si E , F sont des énoncés déjà construits, on construits les énoncés
non(E ), (E ) ou (F ), (E ) et (F ), (E ) ⇒ (F ), (E ) ⇔ (F )
2. Si E est un énoncé déjà construit, on construit les énoncés ∃x i (E ), ∀x i (E ) (où x i est l’une des
variables). Ces énoncés se lisent « il existe x i tel que E », « pour tout x i on a E » ; ∃ est appelé
quantificateur existentiel, ∀ quantificateur universel.
Ces deux derniers énoncés sont parfois écrit : ∃x i ∈ E i (E ), ∀x i ∈ E i (E ) lorsqu’on veut rappeler que le
domaine de variation de x i est l’ensemble E i .
Exemple. x, y ayant pour domaine de variation R, les énoncés élémentaires étant |x−y| ≤ 1 ; |x+y| ≥ 1,
on construit par exemple l’énoncé :
∀x [∃y (|x − y] ≤ 1 et |x + y| < 1) ⇒ |x − y| ≤ 1]
(1)
On appelle occurrence de la variable x dans l’énoncé E , chaque endroit où apparait cette variable
non précédé immédiatement d’un quantificateur (dans l’énoncé précédent, x a donc 3 occurrences).
On définit les occurrences libres d’une variable x dans l’énoncé E en suivant la construction de E à
partir des énoncés élémentaires :
– Toutes les occurrences de x dans un énoncé élémentaire sont libres.
– Les occurrences libres de x dans non E sont celles de x dans E .
– Les occurrences libres de x dans E et F , E ou F , E ⇒ F , E ⇔ F sont celles de x dans E et dans
F.
– Les occurrences libres de x dans ∃y E , ∀yE (y variable distincte de x) sont celles de x dans E .
– Aucune occurrence de x dans ∃x ∈ E , ∀x ∈ E n’est libre.
Les occurrences de x dans l’énoncé qui ne sont pas libres sont dites liées.
Une variable x est dite libre dans E si elle a une occurrence libre, elle est dite liée si toutes ses occurrences sont liées.
Par exemple dans l’énoncé 1, les trois occurrences de x sont liées, donc x est liée ; les deux premières
occurrences de y sont liées, la troisième est libre, donc y est libre.
Les énoncés considérés sont souvent écrit E (x 1 , . . . , x p ), en mettant en évidence les variables libres
x 1 , . . . , x p de E . Un tel énoncé exprime une propriété que peuvent avoir les p-uplets (a 1 , . . . , a p ) ∈ E 1 ×
· · · × E p . Il définit donc un sous)-ensemble de E 1 × · · · × E p : l’ensemble des p-uplets (a 1 , . . . , a p ) ∈ E 1 ×
· · · × E p qui ont cette propriété.
Par exemple, dans l’énoncé 1, il y a une seule variable libre. Il définit donc un sous ensemble de R.
On vérifie que c’est l’ensemble qui a pour seul élément 0.
Autre Exemple. La variable f a pour domaine de variation l’ensemble R[0,1] (ensemble des applications de [0, 1] dans R) ; x, y varient dans [0, 1], ε, η sont des variables qui décrivent l’ensemble des réels
> 0. L’énoncé :
∀ε∃η∀y [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε]
a pour seule variable libre f , x. Il définit donc un sous-ensemble de R[0,1] ×[0, 1] : l’ensemble des couples
( f , x) tel que f soit continue au point x.
52
CHAPITRE 7. USAGE DES CONNECTEURS PROPOSITIONNELS ET DES QUANTIFICATEURS.
L’énoncé ∀x∀ε∃η∀y [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε] a pour seule variable libre f . Il définit un sousensemble de R[0,1] : c’est l’ensemble des fonctions continues.
Un énoncé E est dit clos s’il n’a aucune variable libre. Il est alors soit vrai, soit faux.
Par exemple l’énoncé ∀ f ∀x∀ε∃η∀y [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε] est clos. Il est faux.
Étant donné un énoncé E (x 1 , . . . , x p ) qui a x 1 , . . . , x p comme variables libres, l’énoncé clos ∀x 1 , . . . , x p E (x 1 , . . . , x p )
est appelé clôture de l’énoncé E .
Deux énoncés E (x 1 , . . . , x p ), E ′ (x 1 , . . . , x p ) sont dits équivalents s’ils définissent le même sous ensemble de E 1 × · · · E p . Cela revient à dire que la clôture de l’énoncé E (x 1 , . . . , x p ) ⇔ E ′ (x 1 , . . . , x p ) est
vraie.
En particulier deux énoncés clos sont équivalents s’ils sont tous deux faux ou tous deux vrais.
Dans la suite, pour écrire que deux énoncés E , E ′ sont équivalents, on écrira souvent E ⇔ E ′ même
si E et E ′ ne sont pas clos (alors qu’on devrait écrire ∀x 1 , . . . , x p (E (x 1 , . . . , x p ) ⇔ E ′ (x 1 , . . . , x p ).
7.3 Règle d’emploi des quantificateurs.
1. On peut changer le nom d’une variable liée ; c’est-à-dire
∃x E (x, . . . )
∀x E (x, . . . )
⇔
⇔
∃yE (y, . . . )
∀yE (y, . . . )
à condition que y n’apparaissent pas dans l’énoncé E (x, . . . ).
2. Commutativité :
∃x∃y E (x, y, . . . )
∀x∀y E (x, y, . . . )
⇔
⇔
∃y∃x E (x, y, . . . )
∀y∀x E (x, y, . . . )
3. distributivité :
∃x [E (x, . . . ) ou E ′ (x, . . . )]
∀x [E (x, . . . ) et E ′ (x, . . . )]
⇔
⇔
∃x E (x, . . . ) ou ∃x E ′ (x, . . . )
∀x E (x, . . . ) et ∀x E ′ (x, . . . )
4. Les quatre énoncés ci-dessous (ou plutôt leur clôture) sont vrais, quelque soient les énoncés E , E ′
pourvu que la variable x ne soit pas libre dans E ′ :
∃x (E (x, . . . ) ou E ′ )
∃x (E (x, . . . ) et E ′ )
∀x (E (x, . . . ) ou E ′ )
∀x (E (x, . . . ) et E ′ )
⇔
⇔
⇔
⇔
∃x E (x, . . . ) ou E ′
∃x E (x, . . . ) et E ′
∀x E (x, . . . ) ou E ′
∀x E (x, . . . ) et E ′
5. Négation des quantificateurs :
non ∃xE (x, . . . )
non ∀xE (x, . . . )
⇔
⇔
∀x non E (x, . . . )
∃x non E (x, . . . )
Chaque quantificateur peut donc être défini à l’aide de l’autre et de la négation : ∀x peut être remplacé
par : non ∃x non. De même ∃x peut être remplacé par non ∀x non.
D’où la négation d’une chaîne de quantificateurs :
nonQ 1 x 1 . . .Q n x n E (x 1 , . . . , x n , . . . )
⇔
Q 1′ x 1 . . .Q n′ x n non E (x 1 , . . . , x n , . . . )
où chaque Q i est ∀ ou ∃ et Q i′ le quantificateur différent de Q i .
7.3. RÈGLE D’EMPLOI DES QUANTIFICATEURS.
53
Exemple. Quel est l’ensemble défini par l’énoncé
∀x∀y∀ε∃η [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε]
où les variables f , x, y, ε, η ont les domaines de variation donnés précédemment ?
L’énoncé ∃η [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε] équivaut à ∃η [|x − y| > η ou | f (x) − f (y)| ≤ ε] donc à
∃η |x − y] ≤ η ou | f (x) − f (y)| ≤ ε (règle 4).
L’énoncé ∀ε∃η [|x−y| ≤ η ⇒ | f (x)− f (y)| ≤ ε] équivaut donc à ∃η (|x−y| > η) ou ∀ε (| f (x)− f (y)| ≤ ε).
c’est-à-dire x 6= y ou f (x) = f (y).
Il est vrai quels que soient x, y, f : l’énoncé donné qui a f pour variable libre définit donc le domaine
de variation de f tout entier c’est à dire R[0,1] .
Autre exemple. x, y, z varient dans un ensemble quelconque E 6= ;. Montrer que l’énoncé
∀x∃y∀z [E (x, z) ⇒ E (x, y)]
(2)
est vrai.
Cet énoncé équivaut à ∀x∃y∀z [non E (x, z) ou E (x, y)].
Comme z n’est pas libre dans dans E (x, y), ∀z [non E (x, z) ou E (x, y)] équivaut à ∀z non E (x, z) ou
E (x, y).
Donc ∃y [(∀z non E (x, z)) ou E (x, z)] équivaut à
[∀z non E (x, z)] ou [∃y E (x, y)]
puisque y n’est pas une variable libre de ∀z E (x, z).
Or ∀z non E (x, z) équivaut à non ∃z E (x, z) d’où le résultat : l’énoncé 2 équivaut à
∀x [(non ∃z E (x, z)) ou (∃y E (x, y))]
L’énoncé 2 qui est vrai quel que doit le domaine de variation x, y, z et quelque soit l’énoncé E est dit
« universellement valide. »
Les règles 1, 2, 3, 4 et 5 donnent des exemples d’énoncés universellement valides. Voici d’autres
exemples d’énoncés universellement valide :
∃x [E (x) et E ′ (x)]
∀x E (x) ou ∀x E ′ (x)
∀x∀y E (x, y)
⇒
⇒
⇒
∃x E (x) et ∃x E ′ (x)
∀x [E (x) ou E ′ (x)]
∀y∃x E (x, y)
mais les implications inverses ne sont pas universellement valides.
Autre exemple. Les variables x, y décrivent R ; ε, η décrivent des réels strictement positifs ; f décrit
l’ensemble RR des applications de R dans lui-même.
L’énoncé C ( f ) : ∀ε∀x∃η∀y [|x − y| ≤ η ⇒ | f (x) − f (y)| ≤ ε] définit un sous ensemble de RR : l’ensemble des fonctions continues.
L’énoncé U ( f ) : ∀ε∃η∀x∀y [|x − y| ≤ η ⇒ | f (x) − f (y) ≤ ε] définit l’ensemble des fonctions uniformément continues.
L’énoncé ∀ f (U ( f ) ⇒ C ( f )) est universellement valide. Par contre l’énoncé ∀ f (C ( f ) ⇒ U ( f )) est
faux ; il serait vrai si on avait pris [0, 1] pour domaine de variation de x, y et R[0,1] (ensemble des applications de [0, 1] dans R) pour domaine de variation de f .
Notation. On utilise parfois, à titre d’abréviation ∃!x qui se lit « il existe un x et un seul ». Donc l’expression ∃!xE (x, x 1 , . . . , x n ) est une abréviation pour l’énoncé ∃x E (x, x 1 , . . . , x n ) et ∀x∀x ′ [E (x, x 1 , . . . , x n ) et
E (x ′ , x 1 , . . . , x n ) ⇒ x = x ′ ].
54
CHAPITRE 7. USAGE DES CONNECTEURS PROPOSITIONNELS ET DES QUANTIFICATEURS.
7.4 Forme prénexe.
Un énoncé est dit sous forme prénexe s’il s’écrit
Q 1 x 1 , . . .Q n x n E (x 1 , . . . , x n , y 1 , . . . y p )
où chaque Q i est un quantificateur (∃ ou ∀) et où l’énoncé E est sans quantificateurs.
On montre au moyen des règles d’emplois des quantificateurs énoncés précédemment la proposition suivante :
L EMME 7.4.1
Tout énoncé équivaut à un énoncé sous forme prénexe.
On raisonne par récurrence sur la longueur de l’énoncé E considéré.
C’est évident si E est sans quantificateur.
– Si E est d non E ′ , on met E ′ sous forme prénexe, soit Q 1 x 1 . . .Q n x n G , où G est sans quantificateur.
Alors E équivaut à non(Q 1 x 1 . . .Q n x n G ), c’est-à-dire à Q 1′ x 1 . . .Q n′ x n (nonG) (où Q i′ est ∀ si Q i est
∃ et réciproquement) qui est prénexe.
– Si E est ∃x E ′ , on met E ′ sous forme prénexe, soit Q 1 x 1 . . .Q n x n G ; alors E équivaut à ∃x Q 1 x 1 . . .Q n x n G
qui est prénexe.
– Même raisonnement si E est de la forme ∀x E ′ .
– Si E est E ′ ou E ′′ , on met E ′ et E ′′ sous formes prénexes soit Q 1 x 1 . . .Q n x n G et Q 1′ y 1 . . .Q p′ y p H
(G et H sont des énoncés sans quantificateurs). Par changement de nom des variables liées
x 1 , . . . , x n , y 1 , . . . , y p on peut supposer que x 1 , . . . , x n n’apparaissent pas dans H et y 1 , . . . , y n n’apparaissent pas dans G .
De plus E équivaut à l’énoncé Q 1 x 1 . . .Q n x n G ou Q 1′ y 1 . . .Q p′ y p H donc à Q 1 x 1 [Q 2 x 2 . . .Q n x n G ou
Q 1′ y 1 . . .Q p′ y p H ] puisque x 1 n’apparait pas dans H . Pour la même raison l’énoncé entre crochets
([ ]) équivaut à Q 2 x 2 [Q 3 x 3 . . .Q n x n G ou Q 1′ y 1 . . .Q p′ y p H ] et ainsi de suite.
L’énoncé E équivaut donc à Q 1 x 1 . . .Q n x n [G ou Q 1′ y 1 . . .Q p′ y p H ].
De la même façon, l’énoncé [G ou Q 1′ y 1 . . .Q p′ y p H ] équivaut à
Q 1′ y 1 [G ou Q 2′ y 2 . . .Q p′ y p H ]
puisque y 1 n’apparait pas dans G . Finalement on voit que E équivaut à l’énoncé
Q 1 x 1 . . .Q n x n Q 1′ y 1 . . .Q p′ y p [G ou H ]
qui est prénexe.
– La démonstration est identique si E est E ′ et E ′′ .
– Si E est E ′ ⇒ E ′′ , E équivaut à (non E ′ ) ou E ′′ . E ′ , E ′′ se mettent sous forme prénexe. D’après ce
qui précède, non E ′ se met sous forme prénexe et donc (non E ′ ) ou E ′′ aussi.
– Si E est E ′ ⇔ E ′′ , E équivaut à (E ′ ⇒ E ′′ ) et (E ′′ ⇒ E ′ ). E ′ , E ′′ se mettent sous forme prénexe.
D’après ce qui précède, il en est de même pour (E ′ ⇒ E ′′ ) et (E ′′ ⇒ E ′ ) et donc pour leur conjonction aussi.
C . Q . F. D.
Exemple.
s’écrit
f est une variable qui décrit R[0,1] . L’énoncé « f a une limite quand x → 0 et quand x → 1 »
∃l ∀ε∃η∀x [|x| ≤ η ⇒ | f (x) − l | ≤ ε] et ∃l ∀ε∃η∀x [|x − 1| ≤ η ⇒ | f (x) − l | ≤ ε]
(x décrit [0, 1] ; l décrit R ; ε, η décrivent l’ensemble des réels > 0). Sous forme prénexe, on trouve :
∃l ∀ε∃η∀x∃l ′ ∀ε′ ∃η′ ∀x ′ [(|x| ≤ η ⇒ | f (x) − l | ≤ ε)
et (|x ′ − 1| ≤ η′ ⇒ | f (x) − l ′ | ≤ ε′ )]
7.5. FORMES DE SKOLEM ET DE HERBRAND.
55
7.5 Formes de Skolem et de Herbrand.
7.5.1 Formes de Skolem.
Un énoncé prénexe est dit « sous forme de Skolem » si les quantificateurs existentiels précèdent les
quantificateurs universels, c’est-à-dire s’il est de la forme :
∃x 1 , . . . ∃x k ∀y 1 . . . ∀y l E (x 1 , . . . , x k , y 1 , . . . , y l , z 1 , . . . , z m )
où E est un énoncé sans quantificateurs.
On se propose de ramener tout énoncé prénexe à un énoncé équivalent qui soit sous forme de Skolem. Pour cela, il faudra en général introduite de nouvelles variables liées (comme c’est le cas pour
ramener un énoncé à une forme prénexe) mais aussi de nouveaux domaines de variation (ce qui n’était
pas le cas).
L EMME 7.5.1
Considérons un énoncé A(x 1 , . . . , x k , y, z 1 , . . . , z l ), x 1 , . . . , x n variant respectivement dans E 1 , . . . , E k , y variant dans F , z 1 , . . . , z l variant respectivement dans des ensembles G 1 , . . . ,G l . Alors les énoncés suivants
sont équivalents :
∀x 1 , . . . , ∀x k ∃y A(x 1 , . . . , x k , y, z 1 , . . . , z l )
(3)
∃ f ∀x 1 , . . . , ∀x k A(x 1 , . . . , x k , f (x 1 , . . . , x k ), z 1 , . . . , z l )
(4)
où f est une variable qui décrit l’ensemble des applications de E 1 × · · · × E k dans F .
En effet, soient U1 ,U2 les deux sous-ensembles de G 1 ×· · ·×G l définies respectivement par (3) et (4).
Si (z 1 , . . . , z l ) ∈ U2 et si x 1 , . . . , x k appartiennent à E 1 , . . . , E k , alors il existe y ∈ F tel que A(x 1 , . . . , x k , y, z 1 , . . . , z l ) ;
donc U2 ⊂ U1 .
Inversement, si Si (z 1 , . . . , z l ) ∈ U1 , on définit f : E 1 ×· · ·×E k → F en choisissant pour chaque (x 1 , . . . , x k ) ∈
E 1 × · · · × E k un élément y de F tel que A(x 1 , . . . , x k , y, z 1 , . . . , z l ). Donc U1 ⊂ U2 .
C . Q . F. D.
Si l’énoncé A est sans quantificateur (4) est donc une forme de Skolem de l’énoncé (3). En appliquant systématiquement cette transformation, on ramène chaque énoncé prénexe à une forme de Skolem. Faisons-le sur un exemple :
∀x∀y∃z∀t ∃u A(x, y, z, t , u, v)
où A est un énoncé sans quantificateur ; x, y, z, t , u, v sont des variables qui décrivent respectivement
des ensembles X , Y , Z , T,U ,V .
Cet énoncé s’écrit ∀x∀y∃z B (x, y, z), il équivaut donc à
∃ f ∀x∀y B (x, y, f (x, y))
où f est une variable qui décrit l’ensemble des applications de X × Y dans Z .
L’énoncé ∀x∀y B (x, y, f (x, y)) est ∀x∀y∀t ∃u A(x, y, f (x, y), t , u, v), il équivaut donc à ∃g ∀x∀y∀t A(x, y, f (x, y), t , g (x, y, t
où g est une variable qui décrit l’ensemble des applications de X × Y × T dans U . Finalement l’énoncé
considéré équivaut à
∃ f ∃g ∀x∀y∀t A(x, y, f (x, y), t , g (x, y, t ), v)
qui est sous forme de Skolem.
Cette méthode est valable pour un énoncé prénexe quelconque
Q 1 x 1 . . .Q n x n A(x 1 , . . . , x n , y 1 , . . . , x p )
La règle générale pour mettre sous forme de Skolem est la suivante : on introduit pour chaque variable
x i quantifiée existentiellement une variable de fonction qui dépend des variables x j quantifiées universellement qui précèdent x i .
Par exemple pour l’énoncé ∃x∀y∃z∀t ∃u A(x, y, z, t , u, v) on obtient l’énoncé équivalent sous forme
de Skolem : ∃x∃ f ∃g ∀y∀t A[x, y, f (y), t , u, g (y, t )] ( f décrit l’ensemble des applications de Y dans Z , g
l’ensemble des applications de Y × T dans V ).
Noter que l’on ne touche pas aux quantificateurs existentiels qui se trouveraient en début d’énoncé.
Les fonctions f , g , . . . dont la forme de Skolem affirme l’existence s’appellent des fonctions de Skolem pour l’énoncé considéré.
56
CHAPITRE 7. USAGE DES CONNECTEURS PROPOSITIONNELS ET DES QUANTIFICATEURS.
Exemple. n, N sont des variables d’entiers ; ε décrit l’ensemble P des réels > 0, u est une variable qui
décrit l’ensemble des applications de N dans R (ensemble des suites de réels, u(n), noté u n ) ; l décrit R.
L’énoncé
∃l ∀ε∃N ∀n (n ≥ N ⇒ |u n − l | ≤ ε)
(5)
exprime que la suite u a une limite (c’est-à-dire définit l’ensemble des suites convergentes). Sous forme
de Skolem il s’écrit :
∃l ∃K ∀ε∀n (n ≥ K (ε) ⇒ |u n − l | ≤ ε)
où K décrit l’ensemble des applications de P dans N.
Si x décrit R, et f l’ensemble des applications de N × R dans R c’est à dire l’ensemble des suites de
fonctions à variable réelle ( f (n, x) est noté f n (x), l’énoncé
∀x∃l ∀ε∃N ∀n (n ≥ N ⇒ | f n (x) − l | ≤ ε)
définit l’ensemble des suites de fonctions qui convergent en tout point de R. Sous forme de Skolem on
trouve l’énoncé
∃g ∃K ∀x∀ε∀n (n ≥ K (ε, x) ⇒ | f n (x) − g (x)| ≤ ε
où g décrit l’ensemble des applications de R dans R et K l’ensemble des applications de P × R dans N.
La fonction de Skolem g est donc la limite (simple) de la suite de fonction f .
7.5.2 Formes de Herbrand.
Un énoncé prénexe est dit « sous forme de Herbrand » si tous les quantificateurs universels précèdent les quantificateurs existentiels, c’est-à-dire s’il est de la forme :
∀x 1 . . . ∀x k ∃y 1 . . . ∃y l E (x 1 , . . . , x k , y 1 , . . . , y l , z 1 , . . . , z m )
où E est un énoncé sans quantificateurs.
Étant donné un énoncé prénexe A, on obtient un énoncé équivalent sous forme de Herbrand de la
façon suivante : on écrit un énoncé S sous forme de Skolem équivalent à non A, alors l’énoncé non S est
sous forme de Herbrand et qui équivaut à A.
La règle générale pour mettre un énoncé prénexe
Q 1 x 1 . . .Q n x n A(x 1 , . . . , x n , y 1 , . . . , y p )
sous forme de Herbrand est donc : on introduit pour chaque variablex i quantifié universellement une
variable de fonction qui dépend des variables x j quantifiées existentiellement qui précèdent x i . Par
exemple pour l’énoncé
∃x∀y∃z∀t ∃v A(x, y, z, t , u, v)
(où x, y, z, t , u, v varient respectivement dans X , Y , Z , T,U ,V )
On obtient l’énoncé équivalent sous forme de Herbrand :
∀ f ∀g ∃x∃z∃v A(x, f (x), z, g (x, z), u, v)
( f décrit l’ensemble des applications de X dans Y et g l’ensemble des applications de X × Z dans T ).
Exemple. L’énoncé 5 déjà considéré :
∃l ∀ε∃N ∀n (n ≥ N ⇒ |u n − l | ≤ ε)
(qui exprime que la suite u de nombre réels à une limite) a pour forme de Herbrand :
∀ϕ∀K ∃l ∃N [K (N , l ) ≥ N ⇒ |u K (N ,l ) − l | ≤ ϕ(l )]
où K décrit l’ensemble des applications de N × R dans N et ϕ l’ensemble des applications de R dans P
(ensemble des réels > 0).
Chapitre 8
Calcul des prédicats.
8.1 Formules et modèles.
Considérons un ensemble E 6= ; et, par exemple, deux ensembles P ⊂ E × E , S ⊂ E × E × E ; les variables x, y, z, t . . . décrivent E , les énoncés élémentaires (x, y) ∈ P, (x, y, z) ∈ S seront écrits en abrégé
P (x, y), S(x, y, z). Pour fixer les idées, on peut prendre, par exemple :
E =R
P = {(x, y) ∈ R2 ; x < y}
S = {(x, y, z) ∈ R3 ; z = x + y}
Considérons l’énoncé clos E :
£
¡
¢
∀x∀y
x 6= y ⇒ ∃z [ (P (x, z) ∧ P (z,
¤ y)) ou (P (y, z) et P (z, x))
et ∃t (S(z, z, t ) et S(x, y, t ))
Avec le choix qu’on a fait pour E , P, S l’énoncé E est vrai : car il signifie que quels que soient les réels
x, y, x 6= y, il existe un réel z tel que x < z < y ou y < z < x et 2z = x + y.
Si par contre, on prend E = Z , P = {(x, y) ∈ Z 2 ; x < y}, S = {(x, y, z) ∈ Z 3 ; z = x + y}, le même énoncé
E est alors faux. Il serait vrai si on prenait E = Z , P = {(x, y) ∈ Z 2 ; x < y}, S = {(x, y, z) ∈ Z 3 ; z 6= x; z 6= y}.
On voit donc qu’un tel énoncé peut être interprété dans beaucoup de structures différentes ; dans
chacun de ces structures, il prend une valeur de vérité (1 ou 0, c’est à dire vrai ou faux).
Les énoncés de ce type seront appelées des « formules » et les structures dans lesquelles on peut les
interpréter des « modèles. »
Nous donnons maintenant de façon précise les définitions des formules et des modèles.
Définition. Pour construire des formules, on utilise un alphabet comportant :
– Des symboles de relation P 1 , P 2 , . . . , P k ; à chacun de ces symboles est attaché un entier > 0 : le
nombre d’arguments (dans l’exemple précédent, les symboles de relation étaient P, S respectivement à 2 et à 3 arguments).
– Le signe =.
– Les variables x, y, z, . . . , x 1 , . . . , x n , etc.
– Les parenthèses.
– Les connecteurs propositionnels : non, ou, et, ⇒, ⇔.
– Les quantificateurs ∀, ∃.
Les formules sont des suites finies formées avec ces symboles. Les formules élémentaires (appelées
aussi formules atomiques) sont l’une des forme suivantes :
x=y
P i (x 1 , . . . , x n )
x, y étant des variables ainsi que x 1 , . . . , x n et P i un symbole de relation à n arguments.
On obtient toutes les formules à partir des formules élémentaires en appliquant les règles déjà indiquées précédemment, et que nous répétons ici :
57
58
CHAPITRE 8. CALCUL DES PRÉDICATS.
1. Si A, B sont des formules déjà construites, alors non(A), (A) ou (B ), (A) et (B ), (A) ⇒ (B ), (A) ⇔ (B )
sont des formules.
2. Si A est une formule, alors ∀x (A), ∃x (A) sont des formules.
Nous avons déjà défini précédemment ce qu’on appelle les variables libres d’un énoncé. On sait donc
déjà ce que sont les variables libre d’une formule A. On écrit une formule sous la forme A(x 1 , . . . , x p )
pour mettre en évidence les variables libres de la formule. Une formule close est une formule sans variable libre.
Définition. On appelle « modèle » la donnée d’un ensemble E 6= ; et pour chaque symbole de relation P i (à n i arguments) la donnée d’un sous-ensemble P i de E ni . E est appelé l’ensemble de base du
modèle.
Par exemple, si on a deux symboles de relation P, S à 2 et 3 arguments respectivement, un modèle et
un triplet M = {E , P , S} avec E 6= ;, P ⊂ E 2 , S ⊂ E 3 .
Plaçons-nous dans ce cas particulier, pour fixer les idées, et considérons une formule A(x 1 , . . . , x p )
(ayant x 1 , . . . , x p comme variables libres) et un p-uplet (a 1 , . . . , a p ) d’éléments de E .
On va définir ce que l’on entend par « le p-uplet (a 1 , . . . , a p ) satisfait la formule A(x 1 , . . . , x p ) dans le
modèle M » ou de façon synonyme « Le modèle M satisfait la formule A(a 1 , . . . , a n ) » ou encore « La
formule A(a 1 , . . . , a p ) est vraie dans le modèle M . »
Lorsque A(x 1 , . . . , x p ) est une formule élémentaire, la définition est immédiate :
– on dit que le couple (a 1 , a 2 ) satisfait la formule P (x 1 , x 2 ) dans le modèle M si et seulement si
a1 = a2
– on dit que le couple (a 1 , a 2 ) satisfait la formule P (x 1 , x 2 ) dans le modèle M si et seulement si
(a 1 , a 2 ) ∈ P . De même pour un triplet (a 1 , a 2 , a 3 ) et la formule S(x 1 , x 2 , x 3 ).
Pour une formule quelconque A(x 1 , . . . , x p ) on donne la définition en la supposant déjà connue pour
les formules (plus courte) qui ont servi à construire la formule A(x 1 , . . . , x p ). D’après la définition des
formules, la formule A(x 1 , . . . , x p ) à l’une des formes suivante :
– non B (x 1 , . . . , x p ) : alors par définition, A(x 1 , . . . , x p ) est vrai dans le modèle M si et seulement si
B (a 1 , . . . , a p ) ne l’est pas.
– B (x 1 , . . . , x p ) ou C (x 1 . . . , x p ) : alors par définition A(x 1 , . . . , x p ) est vraie dans M si et seulement si
au moins l’une des formules B (x 1 , . . . , x p ), C (x 1 , . . . , x p ) est vraie dans ce modèle.
– Dans les trois cas suivant :
B (x 1 , . . . , x p ) et C (x 1 . . . , x p )
B (x 1 , . . . , x p ) ⇒ C (x 1 . . . , x p )
B (x 1 , . . . , x p ) ⇔ C (x 1 . . . , x p )
la définition analogue au cas précédent (on applique la table de vérité des connecteurs et, ⇒, ⇔.
– ∃x B (x, x 1 , . . . , x p ) : par définition A(x 1 , . . . , x p ) est vraie dans le modèle M si et seulement s’il existe
a ∈ E tel que B (a, a 1 , . . . , a p ) soit vrai dans M .
– ∀x B (x, x 1 , . . . , x p ) : par définition A(x 1 , . . . , x p ) est vraie dans le modèle M si et seulement si pour
tout a ∈ E la formule B (a, a 1 , . . . , a p ) est vraie dans le modèle M .
La notation pour « le p-uplet (a 1 , . . . , a p ) satisfait la formule A(x 1 , . . . , x p ) dans le modèle M » est :
M |= A(a 1 , . . . , a p ) (lire « M satisfait A(a 1 , . . . , a p ) »).
Chaque formule close a donc une valeur de vérité dans chaque modèle. Une formule quelconque
A(x 1 , . . . , x p ) ayant p variables libre définit dans chaque modèle M d’ensemble de base E une partie
E p : l’ensemble des p-uplets qui la satisfont dans ce modèle.
Si le modèle M satisfait la formule close F (ou l’ensemble des formules closes C ) on dira que M
est un modèle de F (ou un modèle de C . Un ensemble de formules closes est aussi appelé un système
d’axiomes. On parlera donc de modèle de système d’axiomes.
Exemple 1. Soit R un symbole de relation à 2 arguments. les formules suivantes :
∀x R(x, x)
∀x∀y [R(x, y) et R(y, x) ⇒ x = y]
∀x∀y∀z [R(x, y) et R(y, z) ⇒ R(x, z)
8.2. FORMULES UNIVERSELLEMENT VALIDES.
59
forment un système d’axiomes dont les modèles sont les ensembles munis d’une relation d’ordre. On
dit qu’on a écrit les axiomes des ensembles ordonnées. Si on ajoute la formule ∀x∀y [R(x, y) ou R(y, x)]
on obtient les axiomes d’ensembles totalement ordonné.
Exemple 2. Système d’axiomes pour la structure de groupe : Soit S un symbole de relation à 3 arguments, on considère les formules suivantes :
1. ∀x∀y∃z S(x, y, z); ∀x∀y∀z∀z ′ [S(x, y, z) et S(x, y, z ′ ) ⇒ z = z ′ ]
2. ∀x∀y∀z∀u∀v∀t [S(x, y, u) et S(u, z, t ) et S(y, z, v) ⇒ S(x, v, t )]
3. ∃x∀y [S(x, y, y) et S(y, x, y)]
4. ∀x∃y∀z∀t [S(x, y, z) ⇒ S(t , z, t )]
Les modèles de (1) sont les ensembles munis d’une relation (à 3 arguments) qui est le graphe d’une
fonction (à 2 arguments) ; autrement dit les ensembles munis d’une loi de composition interne binaire ;
(2) exprime que cette loi de composition est associative ; (3) qu’elle possède un élément neutre à droite
et à gauche ; (4) que tout élément à un inverse à droite.
Il en résulte que les modèles de ce système d’axiomes sont exactement les groupes. Pour avoir les
groupes commutatifs, il suffit d’ajouter l’axiome
1. ∀x∀y∀z [S(x, y, z) ⇒ S(y, x, z)]
8.2 Formules universellement valides.
Définition. Étant donné un système d’axiome C et une formule clos F , on dit que « F est conséquence
de C » (ce qu’on note C ⊢ F ) si tous les modèles de C satisfont F .
Par exemple, la formule ∀x∀y∀z[S(x, y, x) et S(x, z, x) ⇒ z = x] (qui exprime intuitivement l’unicité
de l’élément neutre) est vraie dans tous les groupes, c’est-à-dire est conséquence du système d’axiome
(1), (2), (3), (4).
Une formule close F est dite « universellement valide » (ce qu’on note ⊢ F ) si elle est vraie dans tout
les modèles. Par exemple les formules (∀x (x = x), ∀x∀y [R(x, y) ou non R(x, y)] sont universellement
valide.
Plus généralement, une formule F (x 1 , . . . , x n ) dont les variables libres sont x 1 , . . . , x n sera dite universellement valide si sa clôture
∀x 1 , . . . , ∀x n F (x 1 , . . . , x n )
est universellement valide.
Notons que si C est un système fini d’axiomes : A 1 , . . . , A n , une formule close F est conséquence de
C si et seulement si la formule A 1 et . . . et A n ) |= F est universellement valide.
Définition. Deux formules F (x 1 , . . . , x n ), G(x 1 , . . . , x n ) sont dites équivalentes si, dans tous les modèles
elles définissent le même sous-ensemble de E n (E étant l’ensemble de base du modèle).
Cela revient à dire que la formule
∀x 1 . . . ∀x n [F (x 1 , . . . , x n ) ⇔ G(x 1 , . . . , x n )]
est vraie dans tous les modèles ; autrement dit que l’on a ⊢ F (x 1 , . . . , x n ) ⇔ G(x 1 , . . . , x n ). Beaucoup
d’exemples de formules équivalentes ont été donné au chapitre précédent.
Un système d’axiome C est dit « contradictoire » s’il n’a pas de modèle. Notons que si C est un
système d’axiomes contradictoire, alors C ⊢ F quelque soit la formule close F .
L’un des problèmes fondamentaux de la logique mathématique consiste à trouver une méthode qui,
étant donné une formule close F , permette de savoir si elle est universellement valide.
L’exemple suivant montre tout de suite pourquoi la solution de ce problème serait très intéressante
pour le mathématicien : considérons une formule close F , écrite à l’aide du symbole de relation S à 3
arguments ; le problème est de savoir si F est vraie dans tous les groupes se ramène à déterminer si la
CHAPITRE 8. CALCUL DES PRÉDICATS.
60
formule G ⇒ F est universellement valide (G étant la conjonctions des axiomes (1), (2), (3), (4) écrits
précédemment).
Herbrand a découvert une méthode pour déterminer si une formule close F est universellement
valide, on l’exposera sur deux exemples.
Exemple 1. On considère la formule ∀x∃y∀z [R(x, z) ⇒ R(x, y)] où R est un symbole de relation à
deux arguments. On veut montrer que cette formule est universellement valide. Si ce n’est pas le cas, sa
négation
∃x∀y∃z [R(x, z) et non R(x, y)]
est vraie dans un certain modèle (E , R) où E est un ensemble non vide et R une partie de E 2 . Donc la
forme de Skolem qui est :
∃x∃ f ∀y [R(x, f (y)) et non R(x, y)]
est vraie aussi ( f varie dans E E ; noter que la forme de Skolem n’est pas une formule). Il existe donc
a ∈ E et f : E → E tels que l’on ait :
∀y R(a, f (y))
;
∀y non R(a, y)
On substitue à y les éléments de E obtenus à l’aide de f et de a, c’est-à-dire les éléments a, f (a), f 2 (a), . . . , f n (a), . . .
où f n (a) désigne f ( f (· · · ( f ( a)) · · · )). On obtient ainsi
| {z }
n fois
R(a, f (a))
R(a, f 2 (a))
;
;
non R(a, a)
non R(a, f (a))
Et on a la contradiction cherchée dès le deuxième essai. Donc la formule considérée au départ est universellement valide.
Exemple 2. On considère la formule
∃x∀y [((U (x) ⇒ U (y)) ⇒ T (x)) ⇒ T (y)]
où T,U sont des symboles de relation à un argument.
Si cette formule n’est pas universellement valide, sa négation qui est :
∀x∃y [((U (x) ⇒ U (y)) ⇒ T (x)) et non T (y)]
est donc vraie dans un modèle (E , T ,U ), E étant un ensemble non vide et T ,U des parties de E .
La forme de Skolem de cette dernière formule, à savoir ;
∃ f ∀x [((U (x) ⇒ U ( f (x)) ⇒ T (x)) et non T ( f (x))]
est donc aussi vraie ( f variant dans E E ).
Il existe une fonction f : E → E telle que, pour tout x ∈ E , on ait : ((U (x) ⇒ U ( f (x)) ⇒ T (x)) et
non T ( f (x)). On met cette formule sous forme conjonctive : [non T ( f (x))] et [U (x) ou T (x)] et [nonU ( f (x)) ou
T (x)].
Comme E 6= ;, on choisit a ∈ E et on substitue à x les éléments a, f (a), f 2 (a),..., f n (a),... On obtient :
non T ( f (a))
non T ( f 2 (a))
non T ( f 3 (a))
..
.
;
;
;
U (a) ou T (a)
U ( f (a)) ou T ( f (a))
U ( f 2 (a)) ou T ( f 2 (a))
..
.
;
;
;
nonU ( f (a)) ou T (a)
nonU ( f 2 (a)) ou T ( f (a))
nonU ( f 3 (a)) ou T ( f 2 (a))
..
.
On a ici une contradiction : la première ligne donne : non T ( f (a) ; la deuxième donne : nonU ( f 2 (a)) ou
T ( f (a)) ; et par suite on a nonU ( f 2 (a)) ; la troisième ligne donne : U ( f 2 (a)) ou T ( f 2 (a)), et par suite on a
8.3. INTRODUCTION DE SYMBOLES DE FONCTION.
61
T ( f 2 (a)) ; mais cela contredit la formule non T ( f 2 (a)) de la deuxième ligne. Donc la formule considérée
initialement est donc universellement valide.
On montre que cette méthode est toujours valable, tout au moins pour des formules ne comportant pas le symbole =. Cela veut dire que si une formule close (ne comportant pas le symbole =) est
universellement valide, alors on s’en apercevra nécessairement à l’aide de cette méthode, au bout d’un
nombre fini d’essais.
Mais si la formule dont on part n’est pas universellement valide, la méthode ne permet pas de s’en
apercevoir et les calculs continuent indéfiniment.
8.3 Introduction de symboles de fonction.
Considérons un système d’axiomes C et une formule F (x) à une variable libre. Supposons que, dans
tout modèle de C , on ait ∃!x F (x) ; autrement dit C ⊢ ∃x F (x) et ∀x∀y [F (x) et F (y) ⇒ x = y].
On introduit alors un symbole c (appelé symbole de constante) qu’on utilise pour abréger l’écriture de certaines formules : A(x) étant une formule quelconque, les deux formules suivantes (qui sont
équivalentes dans tous les modèles de C ) : ∃x [F (x) et A(x)]; ∀x [F (x) ⇒ A(x)] sont écrites en abrégé
A(c)
Par exemple, C est le système d’axiome de groupe écrit précédemment, on a C ⊢ ∃!x∀y S(x, y, y).
On introduit alors un symbole de constante e (« l’élément neutre du groupe ») associé à la formule
∀y S(x, y, y). S(e, e, e) est alors une notation abrégée pour la formule ∃x [∀y S(x, y, y) et S(x, x, x)].
Considérons maintenant une formule F (x, y, z), à trois variables libres, par exemple, et supposons
que dans tout modèle de C , on ait ∀x∀y∃!x F (x, y, z). Autrement dit C ⊢ ∀x∀y∃z F (x, y, z) et ∀x∀y∀z∀z ′ [F (x, y, z) et
F (x, y, z ′ ) ⇒ z = z ′ ].
On introduit alors un symbole Φ (par exemple) appelé symbole de fonction à deux arguments et on
décide de noter z = Φ(x, y) la formule F (x, y, z).
L’introduction de ce symbole permet d’abréger considérablement l’écriture de certaines formules :
Si A(x, x 1 , . . . , x n ) est une formule quelconque, les deux formules suivantes (équivalentes dans tous les
modèles de C ) :
∃z [F (x, y, z) et A(z, x 1 , . . . , x n )]
∀z [F (x, y, z) ⇒ A(z, x 1 , . . . , x n )]
sont écrite en abrégés A[Φ(x, y), x 1 , . . . , x n ].
On peut ainsi écrire des formules telles que A[Φ(Φ(x, y), y), x 1 , . . . , x n ] (qui représente la formule
∃z∃t [F (x, y, z) et F (z, y, t ) et A(t , x 1 , . . . , x n ).
Par exemple, si C est le système d’axiome de groupe écrit précédemment on a C ⊢ ∀x∀y∃!z S(x, y, z).
On introduit alors un symbole de fonction à deux arguments et on écrit z = x.y au lieu de S(x, y, z). On
peut alors écrire les formules (une pour chaque entier n) :
∀x (x 2 = e ⇒ x = e)
∀x (x 3 = e ⇒ x = e)
..
.
∀x (x n = e ⇒ x = e)
..
.
qui, ajoutées à C constituent les axiomes de la structure de groupe sans torsion.
Autre exemple : pour écrire les axiomes de la structure d’anneau on utilise deux symboles de relation
A (pour addition) et P (pour produit) à trois arguments. On écrit tout d’abord les formules
(i)
∀x∀y∃!z A(x, y, z)
∀x∀y∃!z P (x, y, z)
Ce qui permet d’introduire deux symboles de fonction à deux arguments et d’écrire z = x + y pour
A(x, y, z) et z = x y pour P (x, y, z).
CHAPITRE 8. CALCUL DES PRÉDICATS.
62
On écrit ensuite les axiomes de groupe commutatif pour + :
(ii)
∀x∀y∀z [x + (y + z) = (x + y) + z]
∃!x∀y [x + y = y et y + x = x]
∀x∃y [x + y = 0]
∀x∀t [x + y = y + x]
Le symbole 0 a été introduit grâce à la formule ∃!x∀y [x + y = y et y + x = y].
On écrit ensuite les axiomes du produit :
(iii)
∀x∀y∀z [x(y z) = (x y)z]
∀x∀y∀z [x(y + z) = x y + xz]
∀x∀y∀z [(y + z)x = y x + zx]
La dernière formule par exemple est une abréviation pour :
∀x∀y∀z∀t ∀u∀v∀w
[A(y, z, t ) et P (t , x, u) et P (y, x, v) et P (z, x, w) ⇒ A(v, w, u)]
8.4 Notion de formule avec paramètres.
Considérons le modèle M et une formule F (x 1 , . . . , x n , y 1 , . . . , y p ), dont les variables libres sont x 1 , . . . , x n , y 1 , . . . , y p ;
si b 1 , . . . , b p sont des éléments de M (l’ensemble de base du modèle M , on désigne par F (x 1 , . . . , x n , b 1 , . . . , b p )
l’expression obtenue en remplaçant chaque occurrence libre de y 1 par b 1 , ..., chaque occurrence de y p
par b p .
On dit que F (x 1 , . . . , x n , b 1 , . . . , b p ) est une « formule à paramètres dans M », dont les paramètres sont
b 1 , . . . , b p et les variables libres x 1 , . . . , x n .
Une telle formule définit une partie de M n : l’ensemble des (a 1 , . . . , a n ) ∈ M n tels que M |= F (a 1 , . . . , a n , b 1 , . . . , b p ).
L’expression F (a 1 , . . . , a n , b 1 , . . . , b p ) est « une formule close à paramètres dans M » (c’est-à-dire une
formule sans variable libre, à paramètres dans M .
8.5 La théorie des ensembles de Zermelo.
Nous pouvons maintenant écrire le système d’axiomes dit de Zermelo, à l’aide du symbole de relation ∈ à deux arguments. Un modèle sera donc un ensemble non vide M muni d’une relation binaire
E ⊂ M × M ; E est la relation d’appartenance du modèle.
Axiome d’extensionnalité :
∀x∀y [∀z (z ∈ x ⇔ z ∈ y) ⇒ x = y]
(1)
Si, par exemple M = N, E = {(m, n); m ≤ n} cet axiome est satisfait ; si E = {(m, n); m est un diviseur premier de n},
cet axiome n’est pas satisfait.
Axiome de la paire :
∀x∀y∃z∀t [t ∈ z ⇔ t = x ou t = y]
(2)
Soit F 1 (x, y, z) la formule ∀t [t ∈ z ⇔ t = x ou t = y]. Dans tout modèle de (1), (2) on a ∀x∀y∃!zF 1 (x, y, z).
On introduit donc un symbole de fonction à deux arguments et F 1 (x, y, z) est noté z = {x, y} ; F 1 (x, x, z)
est noté z = {x}.
Axiome de la réunion :
∀x∃y∀z [z ∈ y ⇔ ∃t (t ∈ x et z ∈ t )]
(3)
Soit F 2 (x, y) la formule ∀z [z ∈ y ⇔ ∃t (t ∈ x et z ∈ t )].
S
Dans tout modèle de (1), (3) on a ∀x∃!y F 2 (x, y). On écrit alors y = x (lire « y est la réunion des
S
éléments de x ») pour F 2 (x, y). On écrit z = x ∪ y pour z = {x, y}.
8.6. LE THÉORÈME DE LOWENHEIN-SKOLEM.
63
Axiome de l’ensemble des parties :
∀x∃y∀z [z ∈ y ⇔ ∀t (t ∈ z ⇒ t ∈ x)]
(4)
Soit F 3 (x, y) la formule ∀z [z ∈ y ⇔ ∀t (t ∈ z ⇒ t ∈ x)].
Dans tout modèle de (1), (4), on a ∀x∃!y F 3 (x, y). On écrit alors y = P (x) pour F 3 (x, y).
Axiome de compréhension. Pour écrire cet axiome, on considère qu’une propriété P (x) est décrite
par la formule F (x, a 1 , . . . , a k ) à une variable libre à paramètres dans le modèle ? On veut donc que le
modèle satisfasse toutes les formules : ∀y∃z∀x [x ∈ z ⇔ x ∈ y et F (x, a 1 , . . . , a k )] quelque soit la formule
F (x, a 1 , . . . , a k ) à paramètres dans le modèle. On écrit donc la suite infinie d’axiome suivante appelée le
schéma d’axiomes de compréhension :
∀x 1 . . . ∀x k ∀y∃z∀x [x ∈ y et F (x, x 1 , . . . , x k )]
(5)
où F (x, x 1 , . . . , x k ) est une formule quelconque (sans paramètre) ayant au moins x comme variable libre.
Dans tout modèle de (1), (5) on a ∃!z∀x (x 6∈ z) (utiliser (5) en prenant pour F la formule x 6= x). On
introduit le symbole de constante ; et on écrit z = ; pour ∀x (x 6∈ z).
Axiome de L’infini :
∃x [; ∈ x et ∀y (y ∈ x ⇒ y ∪ {y} ∈ x)]
(6)
Cette écriture de l’axiome de l’infini comporte un certain nombre de symboles abréviateurs (symboles de constantes et de fonctions) déjà introduit :;, ∪, { }. Il est facile de revenir à une formule qui
n’utiliserait pas ces symboles.
Axiome du choix. On peut énoncer l’axiome du choix sous la forme suivante : pour tout ensemble x
dont les éléments sont non vide et deux à deux disjoints, il existe un ensemble y dont l’intersection avec
chaque élément de x a un élément et un seul. Cela donne la formule suivante :
∀x [(∀u (u ∈ x ⇒ u 6= ;)
et ∀u∀v (u ∈ x et v ∈ x et u 6= v ⇒ u ∩ v = ;))
⇒ ∃y∀u (u ∈ x ⇒ ∃z (u ∩ y = {z}))]
(7)
Dans l’écriture de cette formule, on a utilisé le symbole de fonction ∩ ; z = x ∩ y est la formule
∀t (t ∈ z ⇔ t ∈ x et t ∈ y). L’introduction de ce symbole est justifiée parce que dans tout modèle de
(1), (5) on a ∀x∀y∃!z∀t (t ∈ z ⇔ t ∈ x et t ∈ y).
Les axiomes (1), (2), (3), (4), (5), (6), (7) forment le système d’axiomes Z de Zermelo. Si on appelle
Z 0 le système d’axiomes obtenu en supprimant (6) (l’axiome de l’infini), on peut obtenir un modèle de
Z 0 de la façon suivante : son ensemble de base est N. Désignons par P f (N) l’ensemble des parties finies
de N ; alors P f (N) est dénombrable et on choisit une bijection ϕ : N → P f (N). On prend pour relation
d’appartenance, le sous ensemble E de N × Ndéfini par E = {(m, n); m ∈ ϕ(n)}. On pourra vérifier que
tous les axiomes de Z 0 sont vrais dans ce modèle ; mais l’axiome de l’infini y est faux.
Par contre, on n’a pas pu démonter l’existence d’un modèle de Z , et on ne sait donc pas si la théorie Z est, ou non, contradictoire. Bien plus, un théorème célèbre de logique, du à K. Gödel, montre
qu’il est impossible de prouver l’existence d’un modèle de Z , c’est-à-dire de prouver que Z n’est pas
contradictoire. On se contente donc d’admettre que le système d’axiome Z possède un modèle.
8.6 Le théorème de Lowenhein-Skolem.
On considère les symboles de relation P 1 , . . . , P k (respectivement à n 1 , . . . , n k variables) et un modèle
M = (M , P 1 , . . . , P k ) (où P 1 ⊂ M n1 ,..., P k ⊂ M nk ).
Pour fixer les idées, prenons par exemple les symboles P, S respectivement à 2 et 3 variables et M =
(M , P , S (P ⊂ M 2 , S ⊂ M 3 ). Si N est une partie non vide de M on peut définir le modèle N = (N , P ∩
64
CHAPITRE 8. CALCUL DES PRÉDICATS.
N 2 , S∩N 3 ) : il a pour ensemble de base N et si a, b, c ∈ N , on a N |= P (a, b) si et seulement si M |= P (a, b)
et N |= S(a, b, c) si et seulement si M |= S(a, b, c).
N est appelé un « sous-modèle » du modèle M . Il y a donc autant de sous-modèle de M que de
parties non vide de M , l’ensemble de base de M .
T HÉORÈME 8.6.1 (L OWENHEIN -S KOLEM )
Soit C un système d’axiome qui a un modèle M . Il existe un sous-modèle dénombrable, ou fini de M qui
satisfait C .
Remarquons tout d’abord que l’ensemble des formules (écrites avec les symboles de relation P 1 , . . . , P k )
est dénombrable : car une formule est une suite finie formée de l’alphabet A suivant : P 1 , . . . , P k , =,
x 1 , . . . , x n , . . . (les variables), (, ), ∃, ∀, non, ou, et, ⇒, ⇔.
Cet alphabet étant dénombrable, l’ensemble de suites finies d’éléments de A l’est aussi ; donc aussi
l’ensemble des formules, comme partie d’un ensemble dénombrable.
Plus généralement, si A est un ensemble dénombrable, l’ensemble des formules à paramètres dans
A est aussi dénombrable : car une formule à paramètres dans A est une suite finie formée d’éléments
de A ∪ A, qui est encore un alphabet dénombrable.
Considérons alors un modèle M de C , d’ensemble de base M . On définit une suite croissante N1 ⊂
N2 ⊂ · · · ⊂ Nk ⊂ · · · de parties dénombrables ou finies de M , par induction sur k.
– Pour cela, on considère toutes les formules F (x) à une variable libre telle que M |= ∃x F (x). Pour
chacune de ces formules on choisit un élément a F de M tel que M |= F (a F ). Ces éléments a F
forment une partie dénombrable ou finie N1 de M (il n’y en a pas plus que de formules).
– Définissons maintenant Nk+1 , en supposant défini Nk , partie dénombrable ou finie de M : on
considère maintenant toutes les formules F (x) à une variable libre et à paramètres dans Nk (F (x)
s’écrit donc F (x, a 1 , . . . , a n ) avec a 1 , . . . , a n ∈ Nk telle que M |= ∃x F (x). Pour chacune de ces formules, on choisit un élément a F de M tel que M |= F (a F ). Ces éléments forment une partie dénombrable ou finie Nk′ de M (il n’y en a pas plus que de formules à paramètres dans Nk ). On pose
alors Nk+1 = Nk ∪ Nk′ . Donc Nk ⊂ Nk+1 ⊂ M et Nk+1 est dénombrable ou fini.
S
On pose alors N = k∈N Nk et on désigne par N le sous-modèle de M dont l’ensemble de base est
N . C’est un sous-modèle dénombrable ou fini de M .
On montre de N est un modèle de C et plus généralement on montre que
L EMME 8.6.2
Toute formule close F (a 1 , . . . , a k ) à paramètres dans N a la même valeur de vérité dans M et dans N
Cela donne bien le résultat cherché, puisque les formules de C sont des formules closes sans paramètres ; étant vraies dans M par hypothèse, elles le seront dans N .
C . Q . F. D.
(Lemme 8.6.2) Si la formule F (a 1 , . . . , a k ) est atomique on a déjà vu qu’elle a la même valeur de vérité
dans M et dans N (par définition du sous-modèle). On peut alors faire la démonstration par induction
sur la longueur de la formule F (x 1 , . . . , x k ).
On suppose le résultat vrai pour toutes les formules plus courtes que F et on montre alors le résultat
pour la formule F . Il y a trois cas possible : F (x 1 , . . . , x k ) peut être soit de la forme nonG(x 1 , . . . , x k ) ; soit
de la forme G(x 1 , . . . , x k ) ou G ′ (x 1 , . . . , x k ) ; soit de la forme ∃x G(x, x 1 , . . . , x k )
– Premier cas : par hypothèse d’induction, G(a 1 , . . . , a k ) a la même valeur de vérité dans M et N . Il
en est donc de même pour nonG(a 1 , . . . , a k ), c’est-à-dire F (a 1 , . . . , a k ).
– Deuxième cas : Par hypothèse d’induction, G(a 1 , . . . , a k ) a la même valeur de vérité dans M et N ;
G ′ (a 1 , . . . , a k ) aussi. Il en est donc de même pour G(a 1 , . . . , a k ) ou G ′ (a 1 , . . . , a k ), c’est à dire pour
F (a 1 , . . . , a k ).
– Supposons F (a 1 , . . . , a k ) est vraie dans N .
Donc ∃x G(x, a 1 , . . . , a k ) est vraie dans N et il existe a ∈ N tel que la formule G(a, a 1 , . . . , a k )
soit vraie dans N . D’après l’hypothèse d’induction, cette formule est vraie dans M ; donc aussi
∃x G(x, a 1 , . . . , a k ), c’est-à-dire F (a 1 , . . . , a k ).
Supposons maintenant la formule F (a 1 , . . . , a k ) vraie dans M .
Donc ∃x G(x, a 1 , . . . , a k ) est vraie dans M . on montre qu’il existe a ∈ N tel que G(a, a 1 , . . . , a k )
8.7. THÉORÈMES DE COMPACITÉ DES PRÉDICATS.
65
S
soit vraie dans M : en effet, comme N = p∈N N p il existe un entier p tel que a 1 , . . . , a k ∈ N p . Par
définition de N p+1 il existe donc a ∈ N p+1 tel que la formule G(a, a 1 , . . . , a k ) soit vraie dans M .
D’après l’hypothèse d’induction G(a, a 1 , . . . , a k ) est vraie dans N , donc aussi ∃x G(x, a 1 , . . . , a k )
c’est-à-dire F (a 1 , . . . , a k ).
C . Q . F. D.
Exemple. Considérons le système d’axiome C écrit avec un symbole R de relation à deux variables :
∀x R(x, x)
∀x∀y [R(x, y) et R(y, x) ⇒ x = y]
∀x∀y∀z [R(x, x) et R(y, z) ⇒ R(x, z)]
∀x∀y [R(x, y) ou R(y, x)]
∀x∃y non R(x, y)
∀x∃y non R(y, x)
∀x∀y [non R(y, x) ⇒ ∃z (non R(z, x) et non R(y, z))]
Les modèles de C sont les ensembles M totalement ordonnés, qui n’ont ni plus petit élément ni plus
grand élément et qui sont denses (c’est à dire qu’entre deux élément distincts il en existe toujours un
troisième).
L’ensemble ordonné R est donc un modèle de ce système d’axiomes. Le théorème 8.6, de LowenheimSkolem affirme l’existence d’un sous-modèle dénombrable de ce système d’axiomes ; ce que nous savions déjà puisque Q, par exemple est un tel sous-modèle.
8.6.1 Le paradoxe de Skolem.
Si on applique le théorème 8.6 au système d’axiomes Z de Zermelo, on obtient le résultat que si Z
a un modèle (ce qu’on a supposé), il a aussi un modèle dénombrable.
Or si M est un modèle de Z , d’ensemble de base M et donc la relation d’appartenance est E (E ⊂
M × M ), on peut définir dans M toutes les notions qui ont été étudiées dans le cours de théorie des
ensembles.
Par exemple, il existe un point et un seul de M (noté ;) qui n’a « aucun élément dans M » ; si a, b ∈
M , b est élément de a dans M si (b, a) ∈ E ; b est alors une partie de a dans M ; il existe un point de
M (noté P (a)) dont les éléments de a dans M sont les parties de a dans M ; etc. On peut ainsi définir
dans M l’ensemble des entiers du modèle M , ainsi que l’ensemble de ses parties P (N).
On a ici un fait qui semble paradoxal (et qu’on a appelé le paradoxe de Skolem) : comment un modèle dénombrable M peut-il contenir un ensemble non dénombrable comme P (N) ?
En fait ceci s’explique de la façon suivante : la démonstration du fait que P (N) n’est pas équipotent à N est évidement valable dans n’importe quel modèle M de Z (c’est également vrai de toutes les
démonstrations du cours de théorie des ensembles, puisque nous avons utilisé que les axiomes de Zermelo). Elle montre alors que N et P (N) ne sont pas équipotents dans M : ce qui veut dire qu’il n’existe
aucun élément f de M qui, au sens du modèle M , soit une bijection de l’ensemble des entiers de M
sur l’ensemble P (N) de M . Cela n’empêche nullement l’ensemble P (N) du modèle M d’être, en fait,
dénombrable.
8.7 Théorèmes de compacité des prédicats.
Dans ce paragraphe et le suivant nous énonçons deux théorèmes fondamentaux en logique mathématique. Nous n’en donnerons pas la démonstration ici.
T HÉORÈME 8.7.1 ( T HÉORÈME DE COMPACITÉ )
Soit C un système d’axiomes donc tout sous-ensemble fini a un modèle. Alors C a un modèle.
On en donne également l’énoncé suivant :
CHAPITRE 8. CALCUL DES PRÉDICATS.
66
C OROLLAIRE 8.7.2
Soient C un système d’axiomes et F une formule close qui est conséquence de C , alors F est conséquence
d’un sous-ensemble fini de C .
On ramène facilement cet énoncé au théorème précédent en remarquant que C ⊢ F si et seulement
si le système d’axiomes C ∪ {¬F } n’a pas de modèle.
C . Q . F. D.
Exemple d’application. Nous avons écrit un système d’axiomes pour la structure d’anneau à l’aide de
deux symboles de relation A, P à trois arguments (en introduisant d’ailleurs successivement les symboles de fonction 0, +, .). On ajoute les axiomes suivants :
∀x∀y (x.y = y.x)
∃x∀y (x.y = y)
On obtient les axiomes d’anneau commutatif avec unité. Comme dans un tel anneau l’élément unité
est unique, on introduit le symbole de constante 1, défini par la formule F (x) : ∀y (x.y = y). Si on ajoute
l’axiome
∀x [x 6= 0 ⇒ ∃y (x.y = 1)]
on obtient un système d’axiome K pour la structure de corps commutatif. Pour chaque nombre premier p, désignons par Fp la formule
∀x |x + x +
{z· · · + x} = 0
p fois
Le système d’axiomes K ∪ {F p } est celui de la structure de corps commutatif de caractéristique p. Le
système d’axiome K ∪ {non F 2 , non F 3 , . . . , non F n , . . .} est celui de la structure de corps commutatif de
caractéristique 0 (noté K 0 ).
Soit alors ϕ(x 1 , . . . , x n ) un polynôme à plusieurs variables à coefficients dans Z, qui possède un zéro
dans tout corps commutatif de caractéristique 0. La formule ∃x 1 . . . ∃x n [ϕ(x 1 , . . . , x n ) = 0] est dont vraie
dans tout corps commutatif de caractéristique 0. Elle est donc conséquence du système d’axiome K 0 ,
donc d’un sous-ensemble fini d’après le théorème de compacité. Il existe donc un entier p 0 premier tel
que cette formule soit vraie dans tout modèle de K 0 . On a ainsi démontré :
L EMME 8.7.3
Si le polynôme ϕ(x 1 , . . . , x n ) à coefficients dans Z a un zéro dans tout corps commutatif de caractéristique
0, il existe un entier p 0 tel qu’il ait un zéro dans tout corps commutatif de caractéristique p > p 0 .
8.8 Théorème de complétude du calcul des prédicats.
Nous avons défini la notion de conséquence d’un système d’axiomes C : formule vraie dans tout
modèle de C . Or, intuitivement, une conséquence d’un système d’axiome devrait s’obtenir par un raisonnement déductif à partir des axiomes. Le théorème suivant montre que c’est bien le cas : on donne
les règles tout à fait précises pour déduire des formules à partir du système d’axiomes C et alors les
conséquences de C sont toutes les formules que l’on peut obtenir en appliquant ces règles.
Notons qu’en déduisant une formule à partir des axiomes C en appliquant les règles de déduction,
on n’utilisera évidemment qu’un nombre fini d’axiome de C ; cela explique le théorème de compacité
précédemment énoncé et montre qu’il n’est, en fait, qu’un corollaire du théorème de complétude.
N.B. Étant donné une formule F (x 1 , . . . , x n ) avec des variables libres, nous dirons qu’elle est conséquence de C si la formule ∀x 1 . . . ∀x n F (x 1 , . . . , x n ) est conséquence de C (c’est-à-dire vraie dans tout
modèle de C ).
T HÉORÈME 8.8.1 ( T HÉORÈME DE C OMPLÉTUDE )
Soit C un système d’axiomes ; alors les conséquences de C sont les formules que l’on peut obtenir en
appliquant (un nombre fini de fois) les règles de déduction suivantes :
1. Toutes les formules de la forme A ou (non A) ; (B ou A) ou (non A) sont déduite.
8.8. THÉORÈME DE COMPLÉTUDE DU CALCUL DES PRÉDICATS.
67
2. Toutes les formules de C sont déduite.
3. Toutes les formules de la forme
∀x 1 . . . ∀x n ∀y 1 . . . ∀y n
[(x 1 = y 1 et . . . et x n = y n et P (x 1 , . . . , x n )) ⇒ P (y 1 , . . . , y n )]
(pour chaque symbole de relation P ) sont déduite.
4. Si on a déduit les formules A ou B , A ou (non B ), alors on déduit A.
5. Si on a déduit les formules (A ou (B ou C ), A ou (non B ), A ou (nonC ) alors on déduit A.
6. Si on a déduit la formule A ou B alors quelque soit la formule C , on déduit les formules (A ou C ) ou
B , A ou (B ou C ), A ou (C ou B ).
7. Si on a déduit la formule A(x, x 1 , . . . , x n ) ou B (x, x 1 , . . . , x n ) alors on déduit la formule A(x, x 1 , . . . , x n )
ou ∃y B (y, x 1 , . . . , x n ), y étant une variable qui n’a pas d’occurrence liée dans A, B .
8. Si on déduit la formule A(x, x 1 , . . . , x n ) ou B (x, x 1 , . . . , x n ) alors on déduit la formule A(x, x 1 , . . . , x n )
ou ∀x B (y, x 1 , . . . , x n ).
On peut alors définir la notion de « démonstration à l’aide d’un système d’axiomes C . » C’est, par
définition, une suite de formule Φ, Φ1 , . . . , Φn ayant les propriétés suivantes : Φ1 est obtenu en appliquant l’une des règles 1, 2 ou 3 ; pour chaque i (1 ≤ i ≤ n), Phi i est obtenue à partir des formules
précédentes en appliquant l’une des règles 1, 2, ..., 8. Par définition, Φn est la formule démontré par
cette démonstration.
D’après le théorème de complétude, une formule Φ est conséquence de C si et seulement s’il existe
une démonstration de Φ à l’aide des axiomes de C .
On peut ainsi développer de façon complètement formelle la théorie des ensembles de Zermelo (et,
en fait, n’importe quelle théorie) : on écrit le système d’axiomes Z , comme on l’a fait précédemment, et
on définit comme ci-dessus la notion de démonstration à partir du système d’axiome Z . Les théorèmes
de théorie des ensembles sont alors les formules dont on peut trouver une démonstration.
Téléchargement