Cours n°4
LOGIQUE ET MATHEMATIQUES - 2
1- La théorie des types logiques de Russell
Plus que rejeter ce genre de proposition parce que menant à des paradoxes, Russell va introduire toute
une prophylaxie pour éviter les paradoxes et c’est ce qu’on appelle sa théorie des types. Reportons-
nous au texte que Russell écrivit en 1910, dans la Revue de Métaphysique et de Morale, et qui porte
justement le titre « la théorie des types logiques », parce que ce texte contient en germe un certain
nombre d’innovations qui vont être développées par la suite.
« Il est admis que les paradoxes à éviter résultent tous, dit Russell, d’un certain genre de cercle
vicieux. Les cercles vicieux en question proviennent de ce que l’on suppose qu’une collection
d’objets peut contenir des membres qui ne peuvent justement être définis qu’au moyen de la
collection, prise dans sa totalité ».
Ainsi lorsque j’affirme « toutes les propositions sont vraies ou fausses », je fais comme si l’ensemble
de toutes les propositions m’étaient connues, mais au moment où j’affirme cela, j’énonce justement
une proposition. Cette proposition peut très bien déjà appartenir à cet ensemble et en ce cas je dis
quelque chose d’elle-même, à savoir qu’elle est vraie ou fausse. Ce faisant, j’ouvre une alternative : ou
bien elle est vraie et nous obtenons bien ce que nous avons l’intention d’exprimer, ou bien elle est
fausse, ce qui signifie qu’il existe des propositions ni vraies ni fausses, et peut-être justement celle-là,
mais nous n’avons aucun moyen de choisir, et finalement notre souhait de poser un jugement échoue.
C’est la raison pour laquelle il est si difficile de formuler une logique du second ordre (c’est-à-dire une
logique où on pourrait quantifier sur des variables propositionnelles, de manière à obtenir des énoncés
tels que : « ppp »). Russell conclut : « nous devrons donc dire que les affirmations concernant
« toutes les propositions » sont sans signification ».
« Plus généralement, donnons-nous un groupe d’objets tels que ce groupe, étant capable par
hypothèse d’être totalisé, doive d’autre part contenir des membres qui présupposent cette
totalité, alors, ce groupe ne peut pas être totalisé. En disant qu’un groupe ne peut être totalisé,
nous voulons dire surtout qu’aucune affirmation ayant un sens ne peut être faite concernant
« tous ses membres ». […] Dans de tels cas, il est nécessaire de décomposer notre groupe en
groupes plus petits dont chacun soit capable d’être totalisé. C’est ce que la théorie des types
s’efforce d’effectuer ».
Comme nous venons de le suggérer au paragraphe précédent avec l’exemple « ensembliste », Russell
montre que ce ne sont pas seulement les propositions qui se comportent de cette manière, mais aussi
les fonctions propositionnelles, c’est-à-dire les fonctions qui contiennent une variable x et qui
expriment une proposition chaque fois qu’une valeur est assignée à x. Pour cela, il doit analyser le
concept de fonction. Lorsque nous écrivons « ϕx », cette forme est ambiguë, ou dit autrement, elle
dénote de façon ambiguë ϕa, ϕb, ϕc etc. où ϕa, ϕb, ϕc, etc sont les diverses valeurs de « ϕx ». Il ne
s’agit pas de « la fonction en elle-même ». Nous pouvons regarder, dit Russell, « la fonction en elle-
même comme ce qui dénote de façon ambiguë, tandis qu’une valeur indéterminée de la fonction est ce
qui est dénoté de façon ambiguë. Si la valeur indéterminée de la fonction s’écrit « ϕx », nous écrirons
la fonction en elle-même « ϕx
ˆ ». C’est ainsi que nous dirions « ϕx est une proposition » et d’autre
part « ϕx
ˆ est une fonction propositionnelle » ».
On doit noter ici que cette distinction est justement celle qu’exploitera plus tard A. Church, dans les
années 1936, pour inventer son calcul fonctionnel : le
λ
-calcul, dont nous reparlerons plus loin. Avec
les notations introduites par Church, la différence réside entre ϕ(x) et λx. ϕ(x). Nous écrirons donc
désormais « λx. ϕ(x) » à la place de « ϕ x
ˆ ».
Supposons maintenant que « f(λx. ϕ(x)) signifie « la fonction λx. ϕ(x) n’est pas satisfaite si on la
prend elle-même comme argument », autrement dit signifie :
« ϕ(λx. ϕ(x)) est faux »
et étudions ce qu’il en est de λϕ. f(ϕ), lorsqu’on la donne comme argument à f, autrement dit
cherchons si f(λϕ. f(ϕ)) est vrai ou faux. Si f(λϕ. f(ϕ)) est vrai, cela signifie, de par la définition de f,
que « la fonction λϕ. f(ϕ) n’est pas satisfaite si on la prend elle-même comme argument », autrement
dit que ϕ(λx. ϕ(x)) est faux, et de même si f(λϕ. f(ϕ)) est faux, cela signifie que « il est faux que f(λϕ.
f(ϕ)) soit faux », d’où il suit que f(λϕ. f(ϕ)) est vrai. Là encore, le problème sera « résolu » si on admet
que ϕ(λx. ϕ(x)) n’a tout simplement pas de sens, autrement dit si on admet qu’une fonction ne peut en
aucun cas avoir pour argument elle-même, ou plus généralement quelque chose qui présuppose qu’on
a déjà construit l’ensemble de ses valeurs (de manière à ce qu’elle soit totalement définie).
« Aucune fonction ne peut compter parmi ses valeurs quelque chose qui présuppose la fonction » dit
Russell, et on appelle « imprédicativité » le cas où ce principe n’est pas respecté1.
Si nous conservons encore l’idée « naïve » selon laquelle une fonction peut s’appliquer à n’importe
quel genre d’argument (y compris elle-même donc), nous sommes confrontés à de nombreux
problèmes. Par exemple, Russell introduit les quantificateurs. « Nous dénoterons, dit-il, par le symbole
« (x) . ϕ(x) » la proposition « ϕ(x) toujours » », autrement dit : « ϕ(x) pour toute valeur de x ». Alors,
sans restriction, cette proposition englobe la fonction λx. ϕ(x) elle-même. Comme (x) . ϕ(x) englobe la
fonction ϕ(x), on ne peut pas non plus la donner comme argument de ϕ, de sorte que ϕ((x) . ϕ(x)) est
dépourvu de sens. Ce principe semble à première vue admettre quelques exceptions. Ainsi, supposons
que ϕ s’interprète comme « _ est faux », alors on pourrait bien avoir : « {(x) . x est faux} est faux ».
On est donc tenté de dire que lorsque nous écrivons λx. ϕ(x), il y a deux types de valeurs assignables à
x : celles pour lesquelles le résultat possède un sens et celles pour lesquelles il n’en possède pas.
Admettons donc désormais que ce qui est affirmé par « (x) . ϕ(x) » ce soient toutes les propositions
qui constituent toutes les valeurs à comprendre sous λx. ϕ(x), autrement dit celles pour lesquelles
l’application donne un sens, alors la proposition « (x) . x est faux » ne concernera que les propositions
qui sont des valeurs à comprendre sous « λx. x est faux », donc seulement certaines propositions,
celles qui appartiennent à un « premier genre ». Mais s’il en est ainsi, et puisque, de manière évidente
la proposition « (x) . x est faux » ne fait pas partie de ces propositions de premier genre, mais est
néanmoins une proposition, il faudra avoir un autre prédicat « être faux » qui convienne à son genre
spécifique, et ainsi de suite. Cela n’est possible dit Russell « que si le mot « faux » a en réalité
plusieurs sens différents, appropriés aux propositions de genres différents » !
Nous voilà donc amenés avec Russell, à la construction d’une hiérarchie des entités logico-
mathématiques, possèdant comme contre-partie l’idée que les concepts usuels de la logique eux-
mêmes se fragmentent : on aura ainsi des mots « vrai » et « faux » ayant des sens différents selon le
genre des objets auxquels ils s’appliquent, mais aussi des connecteurs (« et », « ou », « pour tout », « il
existe ») qui se différencient selon les genres d’objets auxquels ils s’appliquent !
La hiérarchie démarre avec des lettres qui dénoteront des objets qui ne sont ni des fonctions ni des
propositions : a, b, c, x, y, z, w… Ces objets seront appelés individus ; « ils seront les constituants des
propositions et fonctions, vrais constituants, en ce sens que l’analyse ne les résout pas comme, par
exemple, les classes ou les phrases telles que « le tel-ou-tel » ». A partir de là, nous aurons des
fonctions qui s’appliquent à de tels objets et à eux seulement : on les appelle fonctions du premier
ordre. Ayant obtenu ces objets, on peut maintenant eux-mêmes les noter par une désignation
particulière. Une fonction du premier ordre quelconque sera notée « ϕ ! x^ » ou, avec notre notation
lambda : « λx. ϕ ! x ». Une valeur quelconque d’une telle fonction : ϕ ! x, est en réalité une fonction
de deux variables : λz. ϕ ! z, et x, donc λx. ϕ ! x contient une variable qui n’est pas un individu, à
savoir λz. ϕ ! z. Ainsi, si nous considérons l’expression :
« ϕ ! x implique ϕ ! a pour toutes valeurs possibles de ϕ »
1 De fait, l’évolution des mathématiques montrera qu’il est particulièrement difficile, voire impossible, d’éviter
tout recours à des notions imprédicatives. Le raisonnement par récurrence (ou « principe d’induction complète »)
par exemple suppose en préalable l’existence de l’ensemble des nombres entiers qu’il contribue à définir.
on a une fonction, qui n’est pas de la forme ϕ ! x (c’est-à-dire une fonction du premier ordre) car elle
contient une variable apparente ϕ qui n’est pas un individu. Néanmoins elle exprime quelque chose à
propos de x : à savoir que toutes les propriétés (du premier ordre) de x sont des propriétés de a. Nous
parlerons alors de fonctions (ou propriétés) du second ordre, et ainsi de suite.
Il devient dans ces conditions difficile d’exprimer le fameux postulat des indiscernables, dû à Leibniz.
Pouvons-nous continuer à dire que « si toutes les propriétés possédées par x sont également possédées
par y et réciproquement, alors x et y sont identiques » ? Certainement pas, puisque désormais la notion
même de « toutes les propriétés de x » n’a plus de sens et que nous ne pouvons que faire référence aux
propriétés correspondant à des prédicats d’un même niveau dans la hiérarchie. Ainsi cela a un sens de
dire que « tous les prédicats du premier ordre possédés par a sont aussi des prédicats du premier ordre
possédés par b et réciproquement », mais est-ce suffisant ? Non, puisqu’il y a des propriétés de
différents ordres (par exemple la propriété pour x « d’avoir toutes les propriétés d’un grand général »
est une propriété de x, ce n’est pas une propriété du premier ordre), d’où la nécessité de stratifier le
concept d’identité lui-même, d’évoquer une identité de x et de y au premier ordre, une autre au second
ordre et ainsi de suite… ce qui n’est guère satisfaisant ! Or, le raisonnement nous conduit à cela.
D’ailleurs Leibniz lui-même rencontrait, peut-être sans le voir, le problème de l’imprédicativité dans
sa formulation même du principe d’identité, car a priori, le fait d’être identique à x, pour x, est
nécessairement une propriété de x. Donc en définissant l’identité de x et de y comme la possession des
mêmes propriétés, il enveloppait déjà parmi ces propriétés ladite identité, autrement dit la fonction
« identité » se suppose déjà elle-même comme totalité construite. Il faut donc nécessairement entendre
en un sens restreint les propriétés communes qui rendent les choses indiscernables.
L’échappatoire, car il en existe encore un ( !), réside dans ce que Russell nomme l’axiome de
réductibilité.
Si nous prenons un exemple2 comme :
« Napoléon a eu toutes les qualités qui font un grand général »
comme dit précédemment, cette propriété n’est pas de premier ordre. Pourtant, cela ne veut pas dire
qu’il n’y ait aucun prédicat (du premier ordre) commun à tous les grands généraux et à eux seuls.
Chaque grand général a nécessairement une propriété du premier ordre que ne possède aucun autre
homme (par exemple être né à tel instant précis). Prenons ces propriétés et faisons-en la disjonction,
nous obtenons un prédicat du premier ordre λz.ψ !z, et la phrase précédente exprime simplement le
fait que Napoléon possède cette propriété du premier ordre. L’axiome de réductibilité exprime
simplement l’idée qu’un tel prédicat existe toujours. Ainsi nous avons toujours un moyen de rabattre
une collection arbitraire de propriétés sur un prédicat du premier ordre, parvenant ainsi à faire
s’anéantir les distinctions de niveaux dans la hiérarchie des notions. On peut alors se contenter d’une
interprétation « simple » du principe d’identité et admettre simplement que si deux individus satisfont
aux mêmes prédicats du premier ordre alors ils sont identiques. L’identité à soi-même s’écrit dans ce
cas :
λx. λy. (ϕ) {ϕ ! x ϕ ! y}
Il faut supposer que c’est une propriété du second ordre non réductible, empêchant par là-même
qu’elle soit incluse dans l’ensemble des propriétés ϕ dont il est question.
En procédant de la sorte, Russell sauve la logique et du même coup, pense-t-il, les mathématiques, du
paradoxe. Cela permet selon lui, d’assurer le fondement des mathématiques sur la logique.
Malheureusement pour lui, les mathématiques (et surtout les mathématiciens !) ne vont pas tellement
lui en savoir gré : la lourdeur du système, la fragmentation des concepts logiques en autant d’instances
que d’ordres dans la hiérarchie, même si en dernier ressort, on peut « rabattre » l’interprétation sur un
seul niveau au moyen de l’axiome de réductibilité, tout cela va rebuter les mathématiciens, qui vont
souvent chercher ailleurs une solution au problème des paradoxes ou tout simplement…. s’en
moquer ! Si en effet, les paradoxes perturbent quelques mathématiciens préoccupés de fondements, ils
ne vont cependant pas préoccuper tous les mathématiciens. Il semble même qu’en réalité bien peu
aient été ou soient préoccupés par une telle question. Le mathématicien Jean Dieudonné (« Pour
2 L’exemple est de Russell, bien entendu !
l’honneur de l’esprit humain ») écrit en 1987 que « l’immense majorité des mathématiciens
considèrent les problèmes liés aux paradoxes comme de pseudo-problèmes ».
Il reste cependant pour nous, dans notre perspective épistémologique, que cette notion de hiérarchie
des types reste profondément liée à une manière de penser philosophique et possède une influence sur
nos conceptions particulièrement en sciences humaines, (en sciences cognitives par exemple). La
philosophie analytique (et particulièrement un de ses grands représentants dans la première moitié du
XXème siècle, Gilbert Ryle) en a fait un grand usage implicite dans le concept abondamment employé
« d’erreur de catégorie ». Pour les philosophes analytiques, beaucoup de soi-disant « problèmes
philosophiques » ne sont en aucun cas de vrais problèmes. Ils n’apparaissent comme tels qu’à cause de
confusions dans le langage, lesquelles résultent la plupart du temps d’un mauvais usage des termes
vis-à-vis d’une hiérarchie de catégories. Au lieu de « résoudre » les problèmes en question, la tâche de
la philosophie est alors de les dissoudre en opérant une critique du langage servant à les exprimer. On
présuppose alors une véritable « grammaire des catégories ». Dans son fameux livre de 1949, The
Concept of Mind, Gilbert Ryle s’attaque ainsi au problème fameux des rapports du corps et de l’esprit
(ce qu’on appelle dans le monde anglo-saxon, The Mind-Body Problem). Pour lui, les problèmes
viennent de ce que l’on s’évertue à considérer que corps et esprit appartiennent à la même catégorie de
langage, or il est manifeste qu’on n’applique pas les mêmes prédicats aux deux termes : peut-on poser
par exemple la question « combien pèse mon esprit ? ». De telles confusions découlent les tentatives
soit de réduire l’un à l’autre (faire des phénomènes mentaux des phénomènes physiques par exemple,
comme dans les tentatives courantes de « naturalisation de l’intentionnalité ») soit comme dans le
dualisme cartésien, d’établir un pont entre l’un et lautre, quitte à admettre l’existence « d’un fantôme
dans la machine », selon l’expression de Ryle.
Wittgenstein doit bien sûr être rattaché à cette manière critique (et démystificatrice) de voir les choses.
Sa manière de dissoudre ces soi-disant problèmes peut être assez provocatrice lorsqu’il montre
comment des erreurs dans la grammaire des significations peuvent engendrer à elles seules des
questions. Certaines sont tout simplement risibles, mais d’autres sont parfois prises au sérieux.
(cité par J. Bouveresse, « La parole malheureuse », p. 39)
- pourquoi un chien ne peut-il simuler la douleur ? est-il trop honnête ?
- pourquoi ma main droite ne peut-elle donner de l’argent à ma main gauche ? est-elle trop
avare ? (Recherches philosophiques, §268)
- puis-je avoir le mal de dent d’autrui ? puis-je avoir mal à la dent d’autrui ? (Puis-je avoir mal à
ma dent en or ?)
- puis-je observer ce qui se passe dans l’esprit d’autrui ? puis-je observer ce qui se passe dans
l’estomac d’autrui ?
- pourquoi une machine ne peut-elle calculer de tête ? Est-ce parce qu’elle n’a pas de tête ?
Je donne ici le commentaire de Jacques Bouveresse :
« l’humour inconscient de la première question réside à chaque fois dans le fait, brutalement mis
en évidence dans la seconde, qu’elle a revêtu l’apparence trompeuse d’une question factuelle
ordinaire. Il en est ainsi, pour Wittgenstein, d’un grand nombre de questions métaphysiques : elles
donnent l’impression d’avoir un sens et une importance parce qu’elles sont formulées comme des
questions d’expérience ; de sorte que nous nous imaginons que nous aurions appris quelque chose
de nouveau si nous savions y répondre, alors qu’elles peuvent seulement dans le meilleur des cas
nous faire prendre conscience de l’existence d’une règle grammaticale implicite ».
Et dans le Tractatus :
4.003 – […] La plupart des propositions et questions de la philosophie reposent sur ceci que nous
ne comprenons pas la logique de notre langage. (Ce sont des questions du type : est-ce que le Bien
est plus ou moins identique que le Beau ?). Rien d’étonnant à ce que les plus profonds problèmes
ne soient pas à proprement parler des problèmes.
La dernière des questions listées ci-dessus fait évidemment penser à cette autre : « les machines
peuvent-elles penser ? » qui, provenant assez nettement à la base du même type d’erreur de catégorie,
n’en continue pas moins depuis plus de cinquante ans d’alimenter la réflexion des philosophes et des
informaticiens de l’intelligence artificielle3 !
Tout ceci fait comprendre l’importance de ce qu’on a appelé dans la première moitié du XXème siècle
le « tournant linguistique », c’est-à-dire le déplacement des problèmes qui se trouvaient jusqu’alors
posés en termes métaphysiques (à propos de « la réalité ») vers des problèmes d’analyse du langage. Si
cette étape a été cruciale dans l’histoire contemporaine de la philosophie pour les raisons qu’on vient
de voir, elle est quelque peu remise en cause aujourd’hui : toutes les questions ne sont pas des
questions de langage, il y a aussi des questions scientifiques ainsi que des questions qui surgissent de
l’activité scientifique et sont posés au philosophe et au logicien.
2- Le programme de Hilbert
Hilbert attaque les problèmes de paradoxes plus à partir d’une position de mathématicien qu’il est (et
même sûrement le plus grand de son siècle) que d’une position de philosophe. Pour lui, comme
d’ailleurs pour son collègue Brouwer, à qui on l’oppose souvent, les problèmes viennent de l’infini.
Nous avons vu plus haut le paradoxe de Burali-Forti : il découlait du transfini. De la même manière,
on peut penser que le paradoxe de Russell vient de ce qu’on ne sait pas maîtriser un ensemble aussi
grand (nécessairement infini !) que « l’ensemble de tous les ensembles ». En somme, on pourrait dire
que ces mathématiciens prônent un « retour » à Aristote, dont on sait qu’il n’acceptait l’infini qu’en
tant que potentiel, et non comme infini actuel. Or, toute la construction de Cantor en théorie des
ensembles repose sur l’admission définitive de l’infini actuel. On peut évidemment comparer cette
audace avec la frilosité des philosophes nominalistes qui répugnent à accepter l’existence d’autres
choses que des entités individuelles. Cantor, non seulement accepte l’existence d’ensembles,
d’ensembles d’ensembles, d’ensembles d’ensembles d’ensembles etc. mais aussi d’ensembles infinis.
Où, dans quel ciel se logent-ils ? bien sûr, on n’a eu de cesse d’attribuer à Cantor une position
platonicienne : on a parlé du « paradis de Cantor » pour désigner ce lieu d’abstractions. Or, Hilbert,
tout en reconnaissant l’importance de l’œuvre de Cantor (« on ne doit pas être chassé du paradis
cantorien » dit-il) refuse un recours direct à l’infini. Il aimerait que ces recours ne soient que des
façons de parler dont on puisse éventuellement se passer, autrement dit qu’on puisse réduire les
raisonnements portant sur l’infini à des raisonnements « finitistes ».
Se basant sur les travaux de Weierstrass que nous avons mentionnés plus haut, il dit ceci :
« Certes Weierstrass a éliminé de l’Analyse l’infiniment petit et l’infiniment grand puisque les
propositions portant sur ces objets ont été réduites par lui à l’énoncé de rapports entre des
grandeurs finies. Mais l’infini continue d’être présent : il prend la forme de suites infinies de
nombres qui définissent les nombres réels, ou bien il est sous-jacent à la notion de système des
nombres réels conçue comme une totalité achevée et fermée.
Or dans la reconstruction même de l’analyse de Weierstrass, on se donne le droit d’utiliser à
fond et d’itérer à volonté les formes d’inférence logique dans lesquelles s’exprime cette
conception des totalités : c’est le cas, par exemple, lorsqu’on parle de tous les nombres réels qui
ont une certaine propriété, ou bien encore lorsqu’on dit qu’il existe des nombres réels ayant une
certaine propriété.
Ainsi l’infini pouvait-il intervenir d’une manière déguisée dans la théorie de Weierstrass et
rester hors des atteintes de sa critique. Il s’ensuit que c’est le problème de l’infini qu’il nous faut
résoudre. Dans les processus de passage à la limité du calcul infinitésimal, l’infini au sens de
l’infiniment grand ou de l’infiniment petit s’est révélé constituer une simple manière de parler :
de même nous devrons reconnaître dans l’infini au sens de totalité infinie, partout où il joue
encore un rôle dans les inférences, quelque chose de purement fictif. De même que les
opérations portant sur l’infiniment petit ont été remplacées par des processus qui accomplissent
la même fin et conduisent à des rapports formels aussi élégants tout en se situant à l’intérieur de
la sphère du fini, les inférences qui utilisent l’infini sont à remplacer par des processus finis qui
accompliront exactement la même fin c’est-à-dire permettront les mêmes démarches dans les
démonstrations et les mêmes méthodes d’obtention des formules et des théorèmes.
3 Penserait-on à poser la question : « les machines peuvent-elles digérer ? »
1 / 22 100%