Cours n°4 p pp ⇔ ∀

Cours n°4

LOGIQUE ET MATHEMATIQUES - 2

1- La théorie des types logiques de Russell

Plus que rejeter ce genre de proposition parce que menant à des paradoxes, Russell va introduire toute

une prophylaxie pour éviter les paradoxes et c’est ce qu’on appelle sa théorie des types. Reportons-

nous au texte que Russell écrivit en 1910, dans la Revue de Métaphysique et de Morale, et qui porte

justement le titre « la théorie des types logiques », parce que ce texte contient en germe un certain

nombre d’innovations qui vont être développées par la suite.

« Il est admis que les paradoxes à éviter résultent tous, dit Russell, d’un certain genre de cercle

vicieux. Les cercles vicieux en question proviennent de ce que l’on suppose qu’une collection

d’objets peut contenir des membres qui ne peuvent justement être définis qu’au moyen de la

collection, prise dans sa totalité ».

Ainsi lorsque j’affirme « toutes les propositions sont vraies ou fausses », je fais comme si l’ensemble

de toutes les propositions m’étaient connues, mais au moment où j’affirme cela, j’énonce justement

une proposition. Cette proposition peut très bien déjà appartenir à cet ensemble et en ce cas je dis

quelque chose d’elle-même, à savoir qu’elle est vraie ou fausse. Ce faisant, j’ouvre une alternative : ou

bien elle est vraie et nous obtenons bien ce que nous avons l’intention d’exprimer, ou bien elle est

fausse, ce qui signifie qu’il existe des propositions ni vraies ni fausses, et peut-être justement celle-là,

mais nous n’avons aucun moyen de choisir, et finalement notre souhait de poser un jugement échoue.

C’est la raison pour laquelle il est si difficile de formuler une logique du second ordre (c’est-à-dire une

logique où on pourrait quantifier sur des variables propositionnelles, de manière à obtenir des énoncés

tels que : « ppp ⇔∀ »). Russell conclut : « nous devrons donc dire que les affirmations concernant

« toutes les propositions » sont sans signification ».

« Plus généralement, donnons-nous un groupe d’objets tels que ce groupe, étant capable par

hypothèse d’être totalisé, doive d’autre part contenir des membres qui présupposent cette

totalité, alors, ce groupe ne peut pas être totalisé. En disant qu’un groupe ne peut être totalisé,

nous voulons dire surtout qu’aucune affirmation ayant un sens ne peut être faite concernant

« tous ses membres ». […] Dans de tels cas, il est nécessaire de décomposer notre groupe en

groupes plus petits dont chacun soit capable d’être totalisé. C’est ce que la théorie des types

s’efforce d’effectuer ».

Comme nous venons de le suggérer au paragraphe précédent avec l’exemple « ensembliste », Russell

montre que ce ne sont pas seulement les propositions qui se comportent de cette manière, mais aussi

les fonctions propositionnelles, c’est-à-dire les fonctions qui contiennent une variable x et qui

expriment une proposition chaque fois qu’une valeur est assignée à x. Pour cela, il doit analyser le

concept de fonction. Lorsque nous écrivons « ϕx », cette forme est ambiguë, ou dit autrement, elle

dénote de façon ambiguë ϕa, ϕb, ϕc etc. où ϕa, ϕb, ϕc, etc sont les diverses valeurs de « ϕx ». Il ne

s’agit pas de « la fonction en elle-même ». Nous pouvons regarder, dit Russell, « la fonction en elle-

même comme ce qui dénote de façon ambiguë, tandis qu’une valeur indéterminée de la fonction est ce

qui est dénoté de façon ambiguë. Si la valeur indéterminée de la fonction s’écrit « ϕx », nous écrirons

la fonction en elle-même « ϕx

ˆ ». C’est ainsi que nous dirions « ϕx est une proposition » et d’autre

part « ϕx

ˆ est une fonction propositionnelle » ».

On doit noter ici que cette distinction est justement celle qu’exploitera plus tard A. Church, dans les

années 1936, pour inventer son calcul fonctionnel : le

λ

-calcul, dont nous reparlerons plus loin. Avec

les notations introduites par Church, la différence réside entre ϕ(x) et λx. ϕ(x). Nous écrirons donc

désormais « λx. ϕ(x) » à la place de « ϕ x

ˆ ».

Supposons maintenant que « f(λx. ϕ(x)) signifie « la fonction λx. ϕ(x) n’est pas satisfaite si on la

prend elle-même comme argument », autrement dit signifie :

« ϕ(λx. ϕ(x)) est faux »

et étudions ce qu’il en est de λϕ. f(ϕ), lorsqu’on la donne comme argument à f, autrement dit

cherchons si f(λϕ. f(ϕ)) est vrai ou faux. Si f(λϕ. f(ϕ)) est vrai, cela signifie, de par la définition de f,

que « la fonction λϕ. f(ϕ) n’est pas satisfaite si on la prend elle-même comme argument », autrement

dit que ϕ(λx. ϕ(x)) est faux, et de même si f(λϕ. f(ϕ)) est faux, cela signifie que « il est faux que f(λϕ.

f(ϕ)) soit faux », d’où il suit que f(λϕ. f(ϕ)) est vrai. Là encore, le problème sera « résolu » si on admet

que ϕ(λx. ϕ(x)) n’a tout simplement pas de sens, autrement dit si on admet qu’une fonction ne peut en

aucun cas avoir pour argument elle-même, ou plus généralement quelque chose qui présuppose qu’on

a déjà construit l’ensemble de ses valeurs (de manière à ce qu’elle soit totalement définie).

« Aucune fonction ne peut compter parmi ses valeurs quelque chose qui présuppose la fonction » dit

Russell, et on appelle « imprédicativité » le cas où ce principe n’est pas respecté1.

Si nous conservons encore l’idée « naïve » selon laquelle une fonction peut s’appliquer à n’importe

quel genre d’argument (y compris elle-même donc), nous sommes confrontés à de nombreux

problèmes. Par exemple, Russell introduit les quantificateurs. « Nous dénoterons, dit-il, par le symbole

« (x) . ϕ(x) » la proposition « ϕ(x) toujours » », autrement dit : « ϕ(x) pour toute valeur de x ». Alors,

sans restriction, cette proposition englobe la fonction λx. ϕ(x) elle-même. Comme (x) . ϕ(x) englobe la

fonction ϕ(x), on ne peut pas non plus la donner comme argument de ϕ, de sorte que ϕ((x) . ϕ(x)) est

dépourvu de sens. Ce principe semble à première vue admettre quelques exceptions. Ainsi, supposons

que ϕ s’interprète comme « _ est faux », alors on pourrait bien avoir : « {(x) . x est faux} est faux ».

On est donc tenté de dire que lorsque nous écrivons λx. ϕ(x), il y a deux types de valeurs assignables à

x : celles pour lesquelles le résultat possède un sens et celles pour lesquelles il n’en possède pas.

Admettons donc désormais que ce qui est affirmé par « (x) . ϕ(x) » ce soient toutes les propositions

qui constituent toutes les valeurs à comprendre sous λx. ϕ(x), autrement dit celles pour lesquelles

l’application donne un sens, alors la proposition « (x) . x est faux » ne concernera que les propositions

qui sont des valeurs à comprendre sous « λx. x est faux », donc seulement certaines propositions,

celles qui appartiennent à un « premier genre ». Mais s’il en est ainsi, et puisque, de manière évidente

la proposition « (x) . x est faux » ne fait pas partie de ces propositions de premier genre, mais est

néanmoins une proposition, il faudra avoir un autre prédicat « être faux » qui convienne à son genre

spécifique, et ainsi de suite. Cela n’est possible dit Russell « que si le mot « faux » a en réalité

plusieurs sens différents, appropriés aux propositions de genres différents » !

Nous voilà donc amenés avec Russell, à la construction d’une hiérarchie des entités logico-

mathématiques, possèdant comme contre-partie l’idée que les concepts usuels de la logique eux-

mêmes se fragmentent : on aura ainsi des mots « vrai » et « faux » ayant des sens différents selon le

genre des objets auxquels ils s’appliquent, mais aussi des connecteurs (« et », « ou », « pour tout », « il

existe ») qui se différencient selon les genres d’objets auxquels ils s’appliquent !

La hiérarchie démarre avec des lettres qui dénoteront des objets qui ne sont ni des fonctions ni des

propositions : a, b, c, x, y, z, w… Ces objets seront appelés individus ; « ils seront les constituants des

propositions et fonctions, vrais constituants, en ce sens que l’analyse ne les résout pas comme, par

exemple, les classes ou les phrases telles que « le tel-ou-tel » ». A partir de là, nous aurons des

fonctions qui s’appliquent à de tels objets et à eux seulement : on les appelle fonctions du premier

ordre. Ayant obtenu ces objets, on peut maintenant eux-mêmes les noter par une désignation

particulière. Une fonction du premier ordre quelconque sera notée « ϕ ! x^ » ou, avec notre notation

lambda : « λx. ϕ ! x ». Une valeur quelconque d’une telle fonction : ϕ ! x, est en réalité une fonction

de deux variables : λz. ϕ ! z, et x, donc λx. ϕ ! x contient une variable qui n’est pas un individu, à

savoir λz. ϕ ! z. Ainsi, si nous considérons l’expression :

« ϕ ! x implique ϕ ! a pour toutes valeurs possibles de ϕ »

1 De fait, l’évolution des mathématiques montrera qu’il est particulièrement difficile, voire impossible, d’éviter

tout recours à des notions imprédicatives. Le raisonnement par récurrence (ou « principe d’induction complète »)

par exemple suppose en préalable l’existence de l’ensemble des nombres entiers qu’il contribue à définir.

on a une fonction, qui n’est pas de la forme ϕ ! x (c’est-à-dire une fonction du premier ordre) car elle

contient une variable apparente ϕ qui n’est pas un individu. Néanmoins elle exprime quelque chose à

propos de x : à savoir que toutes les propriétés (du premier ordre) de x sont des propriétés de a. Nous

parlerons alors de fonctions (ou propriétés) du second ordre, et ainsi de suite.

Il devient dans ces conditions difficile d’exprimer le fameux postulat des indiscernables, dû à Leibniz.

Pouvons-nous continuer à dire que « si toutes les propriétés possédées par x sont également possédées

par y et réciproquement, alors x et y sont identiques » ? Certainement pas, puisque désormais la notion

même de « toutes les propriétés de x » n’a plus de sens et que nous ne pouvons que faire référence aux

propriétés correspondant à des prédicats d’un même niveau dans la hiérarchie. Ainsi cela a un sens de

dire que « tous les prédicats du premier ordre possédés par a sont aussi des prédicats du premier ordre

possédés par b et réciproquement », mais est-ce suffisant ? Non, puisqu’il y a des propriétés de

différents ordres (par exemple la propriété pour x « d’avoir toutes les propriétés d’un grand général »

est une propriété de x, ce n’est pas une propriété du premier ordre), d’où la nécessité de stratifier le

concept d’identité lui-même, d’évoquer une identité de x et de y au premier ordre, une autre au second

ordre et ainsi de suite… ce qui n’est guère satisfaisant ! Or, le raisonnement nous conduit à cela.

D’ailleurs Leibniz lui-même rencontrait, peut-être sans le voir, le problème de l’imprédicativité dans

sa formulation même du principe d’identité, car a priori, le fait d’être identique à x, pour x, est

nécessairement une propriété de x. Donc en définissant l’identité de x et de y comme la possession des

mêmes propriétés, il enveloppait déjà parmi ces propriétés ladite identité, autrement dit la fonction

« identité » se suppose déjà elle-même comme totalité construite. Il faut donc nécessairement entendre

en un sens restreint les propriétés communes qui rendent les choses indiscernables.

L’échappatoire, car il en existe encore un ( !), réside dans ce que Russell nomme l’axiome de

réductibilité.

Si nous prenons un exemple2 comme :

« Napoléon a eu toutes les qualités qui font un grand général »

comme dit précédemment, cette propriété n’est pas de premier ordre. Pourtant, cela ne veut pas dire

qu’il n’y ait aucun prédicat (du premier ordre) commun à tous les grands généraux et à eux seuls.

Chaque grand général a nécessairement une propriété du premier ordre que ne possède aucun autre

homme (par exemple être né à tel instant précis). Prenons ces propriétés et faisons-en la disjonction,

nous obtenons un prédicat du premier ordre λz.ψ !z, et la phrase précédente exprime simplement le

fait que Napoléon possède cette propriété du premier ordre. L’axiome de réductibilité exprime

simplement l’idée qu’un tel prédicat existe toujours. Ainsi nous avons toujours un moyen de rabattre

une collection arbitraire de propriétés sur un prédicat du premier ordre, parvenant ainsi à faire

s’anéantir les distinctions de niveaux dans la hiérarchie des notions. On peut alors se contenter d’une

interprétation « simple » du principe d’identité et admettre simplement que si deux individus satisfont

aux mêmes prédicats du premier ordre alors ils sont identiques. L’identité à soi-même s’écrit dans ce

cas :

λx. λy. (ϕ) {ϕ ! x ⇔ ϕ ! y}

Il faut supposer que c’est une propriété du second ordre non réductible, empêchant par là-même

qu’elle soit incluse dans l’ensemble des propriétés ϕ dont il est question.

En procédant de la sorte, Russell sauve la logique et du même coup, pense-t-il, les mathématiques, du

paradoxe. Cela permet selon lui, d’assurer le fondement des mathématiques sur la logique.

Malheureusement pour lui, les mathématiques (et surtout les mathématiciens !) ne vont pas tellement

lui en savoir gré : la lourdeur du système, la fragmentation des concepts logiques en autant d’instances

que d’ordres dans la hiérarchie, même si en dernier ressort, on peut « rabattre » l’interprétation sur un

seul niveau au moyen de l’axiome de réductibilité, tout cela va rebuter les mathématiciens, qui vont

souvent chercher ailleurs une solution au problème des paradoxes ou tout simplement…. s’en

moquer ! Si en effet, les paradoxes perturbent quelques mathématiciens préoccupés de fondements, ils

ne vont cependant pas préoccuper tous les mathématiciens. Il semble même qu’en réalité bien peu

aient été ou soient préoccupés par une telle question. Le mathématicien Jean Dieudonné (« Pour

2 L’exemple est de Russell, bien entendu !

l’honneur de l’esprit humain ») écrit en 1987 que « l’immense majorité des mathématiciens

considèrent les problèmes liés aux paradoxes comme de pseudo-problèmes ».

Il reste cependant pour nous, dans notre perspective épistémologique, que cette notion de hiérarchie

des types reste profondément liée à une manière de penser philosophique et possède une influence sur

nos conceptions particulièrement en sciences humaines, (en sciences cognitives par exemple). La

philosophie analytique (et particulièrement un de ses grands représentants dans la première moitié du

XXème siècle, Gilbert Ryle) en a fait un grand usage implicite dans le concept abondamment employé

« d’erreur de catégorie ». Pour les philosophes analytiques, beaucoup de soi-disant « problèmes

philosophiques » ne sont en aucun cas de vrais problèmes. Ils n’apparaissent comme tels qu’à cause de

confusions dans le langage, lesquelles résultent la plupart du temps d’un mauvais usage des termes

vis-à-vis d’une hiérarchie de catégories. Au lieu de « résoudre » les problèmes en question, la tâche de

la philosophie est alors de les dissoudre en opérant une critique du langage servant à les exprimer. On

présuppose alors une véritable « grammaire des catégories ». Dans son fameux livre de 1949, The

Concept of Mind, Gilbert Ryle s’attaque ainsi au problème fameux des rapports du corps et de l’esprit

(ce qu’on appelle dans le monde anglo-saxon, The Mind-Body Problem). Pour lui, les problèmes

viennent de ce que l’on s’évertue à considérer que corps et esprit appartiennent à la même catégorie de

langage, or il est manifeste qu’on n’applique pas les mêmes prédicats aux deux termes : peut-on poser

par exemple la question « combien pèse mon esprit ? ». De telles confusions découlent les tentatives

soit de réduire l’un à l’autre (faire des phénomènes mentaux des phénomènes physiques par exemple,

comme dans les tentatives courantes de « naturalisation de l’intentionnalité ») soit comme dans le

dualisme cartésien, d’établir un pont entre l’un et l’autre, quitte à admettre l’existence « d’un fantôme

dans la machine », selon l’expression de Ryle.

Wittgenstein doit bien sûr être rattaché à cette manière critique (et démystificatrice) de voir les choses.

Sa manière de dissoudre ces soi-disant problèmes peut être assez provocatrice lorsqu’il montre

comment des erreurs dans la grammaire des significations peuvent engendrer à elles seules des

questions. Certaines sont tout simplement risibles, mais d’autres sont parfois prises au sérieux.

(cité par J. Bouveresse, « La parole malheureuse », p. 39)

- pourquoi un chien ne peut-il simuler la douleur ? est-il trop honnête ?

- pourquoi ma main droite ne peut-elle donner de l’argent à ma main gauche ? est-elle trop

avare ? (Recherches philosophiques, §268)

- puis-je avoir le mal de dent d’autrui ? puis-je avoir mal à la dent d’autrui ? (Puis-je avoir mal à

ma dent en or ?)

- puis-je observer ce qui se passe dans l’esprit d’autrui ? puis-je observer ce qui se passe dans

l’estomac d’autrui ?

- pourquoi une machine ne peut-elle calculer de tête ? Est-ce parce qu’elle n’a pas de tête ?

Je donne ici le commentaire de Jacques Bouveresse :

« l’humour inconscient de la première question réside à chaque fois dans le fait, brutalement mis

en évidence dans la seconde, qu’elle a revêtu l’apparence trompeuse d’une question factuelle

ordinaire. Il en est ainsi, pour Wittgenstein, d’un grand nombre de questions métaphysiques : elles

donnent l’impression d’avoir un sens et une importance parce qu’elles sont formulées comme des

questions d’expérience ; de sorte que nous nous imaginons que nous aurions appris quelque chose

de nouveau si nous savions y répondre, alors qu’elles peuvent seulement dans le meilleur des cas

nous faire prendre conscience de l’existence d’une règle grammaticale implicite ».

Et dans le Tractatus :

4.003 – […] La plupart des propositions et questions de la philosophie reposent sur ceci que nous

ne comprenons pas la logique de notre langage. (Ce sont des questions du type : est-ce que le Bien

est plus ou moins identique que le Beau ?). Rien d’étonnant à ce que les plus profonds problèmes

ne soient pas à proprement parler des problèmes.

La dernière des questions listées ci-dessus fait évidemment penser à cette autre : « les machines

peuvent-elles penser ? » qui, provenant assez nettement à la base du même type d’erreur de catégorie,

n’en continue pas moins depuis plus de cinquante ans d’alimenter la réflexion des philosophes et des

informaticiens de l’intelligence artificielle3 !

Tout ceci fait comprendre l’importance de ce qu’on a appelé dans la première moitié du XXème siècle

le « tournant linguistique », c’est-à-dire le déplacement des problèmes qui se trouvaient jusqu’alors

posés en termes métaphysiques (à propos de « la réalité ») vers des problèmes d’analyse du langage. Si

cette étape a été cruciale dans l’histoire contemporaine de la philosophie pour les raisons qu’on vient

de voir, elle est quelque peu remise en cause aujourd’hui : toutes les questions ne sont pas des

questions de langage, il y a aussi des questions scientifiques ainsi que des questions qui surgissent de

l’activité scientifique et sont posés au philosophe et au logicien.

2- Le programme de Hilbert

Hilbert attaque les problèmes de paradoxes plus à partir d’une position de mathématicien qu’il est (et

même sûrement le plus grand de son siècle) que d’une position de philosophe. Pour lui, comme

d’ailleurs pour son collègue Brouwer, à qui on l’oppose souvent, les problèmes viennent de l’infini.

Nous avons vu plus haut le paradoxe de Burali-Forti : il découlait du transfini. De la même manière,

on peut penser que le paradoxe de Russell vient de ce qu’on ne sait pas maîtriser un ensemble aussi

grand (nécessairement infini !) que « l’ensemble de tous les ensembles ». En somme, on pourrait dire

que ces mathématiciens prônent un « retour » à Aristote, dont on sait qu’il n’acceptait l’infini qu’en

tant que potentiel, et non comme infini actuel. Or, toute la construction de Cantor en théorie des

ensembles repose sur l’admission définitive de l’infini actuel. On peut évidemment comparer cette

audace avec la frilosité des philosophes nominalistes qui répugnent à accepter l’existence d’autres

choses que des entités individuelles. Cantor, non seulement accepte l’existence d’ensembles,

d’ensembles d’ensembles, d’ensembles d’ensembles d’ensembles etc. mais aussi d’ensembles infinis.

Où, dans quel ciel se logent-ils ? bien sûr, on n’a eu de cesse d’attribuer à Cantor une position

platonicienne : on a parlé du « paradis de Cantor » pour désigner ce lieu d’abstractions. Or, Hilbert,

tout en reconnaissant l’importance de l’œuvre de Cantor (« on ne doit pas être chassé du paradis

cantorien » dit-il) refuse un recours direct à l’infini. Il aimerait que ces recours ne soient que des

façons de parler dont on puisse éventuellement se passer, autrement dit qu’on puisse réduire les

raisonnements portant sur l’infini à des raisonnements « finitistes ».

Se basant sur les travaux de Weierstrass que nous avons mentionnés plus haut, il dit ceci :

« Certes Weierstrass a éliminé de l’Analyse l’infiniment petit et l’infiniment grand puisque les

propositions portant sur ces objets ont été réduites par lui à l’énoncé de rapports entre des

grandeurs finies. Mais l’infini continue d’être présent : il prend la forme de suites infinies de

nombres qui définissent les nombres réels, ou bien il est sous-jacent à la notion de système des

nombres réels conçue comme une totalité achevée et fermée.

Or dans la reconstruction même de l’analyse de Weierstrass, on se donne le droit d’utiliser à

fond et d’itérer à volonté les formes d’inférence logique dans lesquelles s’exprime cette

conception des totalités : c’est le cas, par exemple, lorsqu’on parle de tous les nombres réels qui

ont une certaine propriété, ou bien encore lorsqu’on dit qu’il existe des nombres réels ayant une

certaine propriété.

Ainsi l’infini pouvait-il intervenir d’une manière déguisée dans la théorie de Weierstrass et

rester hors des atteintes de sa critique. Il s’ensuit que c’est le problème de l’infini qu’il nous faut

résoudre. Dans les processus de passage à la limité du calcul infinitésimal, l’infini au sens de

l’infiniment grand ou de l’infiniment petit s’est révélé constituer une simple manière de parler :

de même nous devrons reconnaître dans l’infini au sens de totalité infinie, partout où il joue

encore un rôle dans les inférences, quelque chose de purement fictif. De même que les

opérations portant sur l’infiniment petit ont été remplacées par des processus qui accomplissent

la même fin et conduisent à des rapports formels aussi élégants tout en se situant à l’intérieur de

la sphère du fini, les inférences qui utilisent l’infini sont à remplacer par des processus finis qui

accompliront exactement la même fin c’est-à-dire permettront les mêmes démarches dans les

démonstrations et les mêmes méthodes d’obtention des formules et des théorèmes.

3 Penserait-on à poser la question : « les machines peuvent-elles digérer ? »

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

Cours n°4 p pp ⇔ ∀

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Cours n°4 p pp ⇔ ∀

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib