Chapitre 5 Explication et causalité Dans la philosophie contemporaine des sciences, il existe un large consensus pour penser que l'explication des phénomènes qui nous entourent constitue l'un des buts légitimes de la science, avec leur description, leur prédiction et leur contrôle. C'est même peut-être son but primordial. Pourtant, dans la première moitié du siècle, de nombreux philosophes voyaient dans la recherche d'explications une entreprise outrepassant la compétence de la science. Lorsqu'on examine les raisons qui ont pu amener par exemple Pierre Duhem (1906) à opposer la tâche consistant à "sauver les phénomènes" à la recherche d'une explication "profonde" de ces phénomènes, on peut constater que ce n'est pas l'explication elle-même qui est mise en cause, mais plutôt une certaine conception "métaphysique" de l'explication scientifique, selon laquelle celle-ci viserait à dévoiler l'essence cachée qui est présente derrière les phénomènes. La recherche d'une explication en ce sens menacerait, selon Duhem, l'autonomie de la science, car la notion même d'"essence cachée" veut qu'elle soit inaccessible aux instruments de la recherche scientifique, qui ne peuvent avoir affaire qu'aux phénomènes. Par conséquent, les tentatives d'explication en ce sens sont nécessairement tributaires d'une idéologie métaphysique ou religieuse. Ces idéologies sont prisonnières d'un affrontement perpétuel et stérile, car soustrait à la portée des méthodes d'arbitrage impartial de la science. Duhem dénonce la satisfaction trompeuse que peut procurer une explication qui puise dans les ressources d'une doctrine métaphysique : il est impossible en principe de soumettre les affirmations des doctrines métaphysiques au contrôle de l'expérience. En attaquant l'explication en tant que telle, Duhem dénonce en fait le caractère gratuit et arbitraire des explications qui sont fondées sur l'adhésion à une doctrine métaphysique. L'histoire n'a pas consacré l'usage duhémien qui n'admet d'explication que métaphysique. On peut accepter le postulat de l'autonomie de la science par rapport à la métaphysique, sous une certaine conception, et néanmoins continuer de penser que la science propose des explications. Lorsque nous savons qu'un certain phénomène s'est produit, la science nous permet de savoir pourquoi ce phénomène s'est produit. Cela revient à remplacer une connaissance purement descriptive par une explication. Depuis Aristote, une connaissance scientifique doit pouvoir être exprimée comme la conclusion d'un raisonnement - plus particulièrement déductif - qui nous permet de dépasser la connaissance purement descriptive pour parvenir à la connaissance du pourquoi d'un phénomène. Ce sont les raisonnements qui accomplissent cela que nous considérons comme des "explications". La conception contemporaine dite "déductive-nomologique" (expression désormais abrégée par “ DN ”) de l'explication reprend cette idée en exigeant que ce qu'il s'agit d'expliquer - l'explanandum1 1 Ces termes latins - "explanans" et "explanandum" du verbe "explanare" - sont d'un usage courant dans la littérature. Parfois on trouve aussi, avec la même signification, les formes équivalentes du verbe latin synonyme "explicare", ce qui donne "explicans" et "explicandum". Mais certains auteurs préfèrent réserver les dérivés d'"explanare" pour l'explication scientifique tandis qu'ils utilisent les dérivés d'"explicare" pour l'analyse de la signification des mots, ou explicitation. doit apparaître comme la conclusion d'un argument déductif. L'ensemble des prémisses d'un argument explicatif constitue l'explanans : ce qui explique. La conception argumentative de l'explication, que nous retrouvons dans la tradition épistémologique du XXe siècle, est l'héritière de celle d'Aristote à au moins deux autres égards. Premièrement, selon Aristote, la science ne peut pas connaître les objets singuliers en tant que tels, mais seulement en tant qu'instances d'une espèce. Dans le vocabulaire contemporain, la science ne peut expliquer les propriétés d'un individu qu'en les déduisant de prémisses universelles portant sur son espèce. La doctrine aristotélicienne de la nécessaire généralité de toute explication scientifique se retrouve dans l'exigence de la conception D-N selon laquelle l'une au moins des prémisses d'un argument explicatif doit désigner une loi de la nature (d'où le qualificatif "nomologique"). Deuxièmement, Aristote identifie la connaissance scientifique à la connaissance des causes. De manière analogue, les défenseurs contemporains du modèle D-N de l'explication sont souvent partisans de l'identification de l'explication scientifique à l'explication causale. Cependant, il existe bien entendu des différences importantes entre ces deux conceptions, les principales concernant la possibilité contestée par Aristote mais admise aujourd'hui d'expliquer des faits singuliers, et le rapport entre causalité et explication. Aristote fonde sa théorie de la connaissance scientifique sur une théorie plus fondamentale de la causalité, tandis que l'empirisme logique considère que la théorie de l'explication scientifique doit rendre compte de la causalité : la cause d'un phénomène est selon cette tradition l'ensemble des conditions initiales mentionnées dans une explication. L'explication déductive-nomologique L'article de 1948 dans lequel Carl Hempel et Paul Oppenheim proposent le modèle D-N de l'explication a exercé une influence immense. Leurs propositions constituent désormais la théorie classique de l'explication scientifique. Toute réflexion ultérieure peut être comprise soit comme une tentative pour amender la formulation originale dans le détail, soit comme une remise en cause de l'une ou l'autre de ses thèses. Selon Hempel et Oppenheim (1948), la science peut et doit chercher à expliquer aussi bien des faits et événements singuliers que des lois ; le but primordial de leur article est cependant l'analyse de la forme logique des explications singulières. Pour être singulière, une explication doit avoir comme explanandum un énoncé singulier (atomique* ou moléculaire*), c'est-à-dire un énoncé dont la forme logique ne contient ni quanteurs* ni variables* mais qui peut contenir des connecteurs propositionnels* (comme "ou" et "et"). Les conditions imposées sur l'explanans sont les suivantes. (1) L'explanans contient deux parties T (comme "théorie") et C, T étant la partie nomologique et C exprimant les conditions initiales. Plus précisément, T doit contenir au moins un énoncé qui soit intrinsèquement général : cet énoncé doit avoir la forme d'une généralisation universelle ou existentielle dans laquelle la portée du quanteur n'est limitée d'aucune manière, et il ne doit être équivalent à aucun énoncé singulier. C doit être un énoncé singulier (ou un ensemble de tels énoncés). (2) L'explanandum E peut être déduit de la conjonction de T et de C, mais non de C seul2. L'idée qui consiste à concevoir l'explication scientifique comme un argument déductif contenant nécessairement au moins une loi a rencontré des difficultés de deux types. D'une part, il existe des pseudo-explications qui sont intuitivement circulaires et donc non explicatives, mais qui satisfont formellement les conditions (1) et (2). D'autre part, plusieurs objections ont remis en cause l'adéquation philosophique de l'analyse proposée vis-à-vis du concept intuitif d'explication. Il s'est avéré que les difficultés de la première sorte sont surtout de nature technique et peuvent être surmontées en ajoutant des clauses restrictives supplémentaires à (1) et (2). Précédence temporelle de l'explanans sur l'explanandum ? Parmi les objections de fond à la conception D-N, un premier groupe concerne le fait que le modèle D-N n'impose aucune restriction sur la situation temporelle des faits singuliers qui font partie de l'explanans et l'explanandum. L'explication astronomique de la dernière éclipse totale de Soleil mentionnera par exemple la position et la vitesse du Soleil, de la Terre et de la Lune à un certain instant précédant l'éclipse (conditions initiales exprimées dans C), et les lois du mouvement de Newton qui permettent de déduire l'alignement de ces trois corps célestes au moment où s'est produite l'éclipse. On achève l'explication en disant qu'une éclipse totale de Soleil n'est rien d'autre que l'apparence particulière que prennent le Soleil et la Lune, observés de la Terre, lorsque ces trois corps sont parfaitement alignés et qu'aucun rayon solaire n'atteint l'observateur3. Or rien dans le modèle D-N ne prescrit la précédence temporelle des conditions initiales sur l'explanandum. Une explication de l'éclipse qui la déduirait des positions du Soleil, de la Terre et de la Lune à un moment ultérieur à l'éclipse correspond donc parfaitement au modèle. Mais il semble intuitivement problématique d'accepter que l'information sur ce qui se passera demain explique ce qui se passe aujourd'hui. Deux considérations montrent que la question de savoir si l'explanans doit précéder ou non l'explanandum est plus profonde qu'il n'y paraît à première vue. Premièrement, l'insatisfaction intuitive dans laquelle nous laisse l'explication du passé par l'avenir est un indice du lien intuitif entre l'explication et la causalité. Dans le cas de l'éclipse, on peut supposer que seule une explication qui mentionne une cause de l'éclipse est intuitivement satisfaisante, et comme la précédence temporelle de la cause sur l'effet est une composante fondamentale du concept moderne de causalité4, exiger d'une explication satisfaisante qu'elle soit causale au sens indiqué implique que les conditions initiales de l'explanans doivent précéder l'explanandum. Or il existe des explications 2 Dans l'explication D-N d'une loi, E peut être déduit de prémisses qui sont toutes nomologiques. Nous reviendrons sur le fait que la dernière partie de l'explication ne se plie pas au modèle D-N : c'est l'explication "analytique" de l'identité d'une propriété qui répond à la question "Qu'est-ce qu'une éclipse ? ", plutôt qu'à la question : "Pourquoi y a-t-il eu une éclipse ?", qui est susceptible d'une réponse D-N. 4 Hume l'inclut dans sa fameuse définition de la cause comme "un objet antérieur et contigu à un autre, tel que tous les objets semblables au premier soient placés dans une relation semblable de priorité et de contiguïté par rapport à des objets semblables au second." (Hume 1739, p. 171, tr. p. 259; cf. aussi Hume 1748, p. 76, tr. p. 124/5). Ce n'est pas le cas d'Aristote, qui compte parmi les causes - et les explications - les causes matérielle et formelle qui sont contemporaines à leurs effets, et la cause finale qui lui est ultérieure. 3 qui ne satisfont pas cette contrainte. L'exemple par lequel Hempel (1965a, p. 353) justifie son refus d'introduire la précédence temporelle des conditions initiales sur l'explanandum dans le modèle D-N est celui du principe du moindre temps de Fermat qui permet d'expliquer le fait que les rayons de la lumière sont réfractés lors du passage d'un médium à un autre, par exemple de l'air à l'eau. Une telle explication prend la forme suivante : - prémisses : 1) le rayon R part d'un point A dans l'aire et arrive au point C dans l'eau. 2) les rayons de lumière ont des vitesses différentes selon le milieu. 3) principe de Fermat : R minimise le temps de parcours total entre A et C. - conclusion : R passe par un point B de la surface sépaant les deux média tel que les trois points A, B et C ne sont pas alignés, ce en quoi consiste le phénomène de réfraction. A R air B eau C Le passage de R par le point intermédiaire B, qui constitue ici l'explanandum, correspond à un événement antérieur à l'événement de l'arrivée du rayon en C qui est mentionné dans les prémisses de l'explication. On peut entrevoir la complexité du problème lorsqu'on sait qu'il existe aujourd'hui un débat analogue sur la question de savoir s'il existe des formes de causalité rétroactive où l'effet précède la cause, notamment en physique quantique5. Explication et prédiction Deux autres exemples célèbres d'explication permettent d'éclairer davantage le rapport entre explication et causalité. Comme nous allons le voir, ils montrent premièrement que l'exigence selon laquelle les conditions initiales doivent être une cause de l'explanandum est associée de façon étroite, dans nos intuitions, à un type important d'explication scientifique : une explication qui ne la respecte pas nous laisse insatisfaits. Sous cet aspect, le modèle D-N est incomplet, puisqu'il a la prétention de fournir une analyse de notre concept préphilosophique d'explication. Deuxièmement, ces exemples réfutent la thèse soutenue par de nombreux philosophes des sciences selon laquelle le concept de causalité se réduit à celui d'explicabilité selon le modèle D-N6. 5 Cf. Phil Dowe, "Backwards Causation and the Direction of Causal Processes", Mind 105 (1996), p. 1-22. Cette thèse est clairement exprimée par Carnap : "Que signifie alors l'énoncé : l'événement B est causé par l'événement A ? Qu'il existe dans la nature certaines lois dont on peut déduire logiquement l'événement B, à condition de les conjuguer avec la description exhaustive de l'événement A." (Carnap 1966, trad. p. 189). Des formulations semblables peuvent être trouvées chez Popper (1934, tr. p. 57); Hans Reichenbach, The Rise of Scientific Philosophy (1951), 6 (1) Bromberger (1966, p. 83) a proposé l'exemple suivant. Considérons l'ombre d'une tour produite par la lumière du soleil. On peut donner une explication parfaitement satisfaisante de la taille de l'ombre à partir de la hauteur de la tour, de la position du Soleil relativement à la tour et de la loi de propagation rectiligne des rayons de lumière. Mais si cette explication satisfait les conditions imposées par le modèle D-N, c'est tout aussi bien le cas de l'explication réciproque déduit la hauteur de la tour de la taille de l'ombre. Or la question de savoir si cette dernière explication est acceptable est sujette à controverse7. (2) Supposons que la régularité nomique suivante soit réelle : chaque fois qu'un baromètre fonctionnant correctement indique que la pression chute de façon abrupte, des vents violents se produisent quelques heures plus tard. Une telle loi permettrait d'expliquer telle tempête particulière par ce qu'indique le baromètre quelques heures auparavant. Cette possibilité constitue un contreexemple au modèle D-N de l'explication dans la mesure où l'explication proposée est conforme à ses conditions, mais semble intuitivement inacceptable : ce qui explique vraiment une tempête, c'est la chute de la pression de l'air qui constitue une cause commune de ce qu'indique le baromètre et de la tempête. Ces exemples permettent de remettre en cause l'équivalence entre explication selon le modèle D-N et causalité : (1) est une "explication" non satisfaisante d'une cause par son effet ; et (2) prétend expliquer un événement par un autre qui n'est ni sa cause ni son effet, puisque les deux événements en question sont des effets d'une cause commune. Au lieu de confirmer l'équivalence entre l'explication D-N et la causalité, les exemples ci-dessus semblent plutôt indiquer que la causalité est une condition indépendante qu'il faudrait ajouter à celles du modèle D-N. Les exemples (1) et (2) suggèrent que le concept d'explication qui est important intuitivement est plutôt celui d'explication causale, et que l'exigence de causalité rend le concept d'explication réellement plus riche que le concept explicité par le modèle D-N. Ces mêmes exemples peuvent également servir à mettre en question une autre équivalence revendiquée par Hempel et Oppenheim (1948). Ces auteurs entendent en effet identifier dans le modèle D-N la structure logique commune à l'explication et à la prédiction, qui selon eux ne diffèrent que de manière pragmatique. Cette différence concerne l'usage qui est fait de la déduction de E à partir de C et T : si E désigne un événement qui a déjà eu lieu et si nous en avons déjà pris connaissance, alors nous pouvons en rechercher et en fournir une explication D-N où soit C, soit T, soit la déductibilité même de E par rapport à C et T était auparavant inconnu du destinataire de l'explication. En revanche, si nous ne savons pas encore que l'événement E s'est produit, en particulier s'il a lieu dans l'avenir, il est possible de le prédire en montrant qu'il est une conséquence déductive de C et T. Le cas où E a lieu dans l'avenir n'est pourtant pas le seul où il peut être approprié de parler de prédiction : imaginons une expérience scientifique dont les résultats ont été Berkeley, University of California Press, 1959, p. 158; Wolfgang Stegmüller, Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Vol. I.: Erklärung, Begündung, Kausalität (1969), Berlin, Springer, 1983, p. 512/3. 7 Bromberger et Salmon (1990, p. 47) expriment l'intuition qu'elle ne l'est pas, mais van Fraassen (1980, pp. 132-134) construit un contexte dans lequel la longueur de l'ombre peut effectivement expliquer la hauteur de la tour. enregistrés par une machine mais dont je n'ai pas encore pris connaissance. Si je veux me servir de ces résultats pour tester une hypothèse, je peux prédire le résultat auquel il faut s'attendre si l'hypothèse est juste. Ce qui compte n'est pas la situation dans le temps du résultat de la prédiction mais son statut épistémique : je n'en ai pas encore connaissance. Le concept de prédiction semble plus épistémique que celui d'explication, au sens où il est libre des connotations métaphysiques liées à ce dernier, et qui sont à l'origine de l'exigence d'ancrage de l'explication dans la causalité. En fonction de mon état de connaissance ou d'ignorance, je peux aussi bien accepter une prédiction de la hauteur de la tour à partir de la taille de l'ombre, qu'une prédiction de la taille de l'ombre à partir de la hauteur de la tour. De même, si le baromètre ne permet pas d'expliquer la tempête, son rôle est précisément de la prédire. Explications non causales Nous sommes parvenus à la conclusion provisoire selon laquelle une explication n'apparaît intuitivement satisfaisante que dans la mesure où elle satisfait à la contrainte supplémentaire selon laquelle l'explanans mentionne un événement-cause dont l'explanandum constitue l'effet. Pourtant cela n'est vrai que d'un certain type d'explications, celles qui visent une évolution dans le temps, et plus particulièrement un changement. Les explications suivantes ne sont pas causales : elles sont satisfaisantes, au moins dans certains contextes, bien que l'explanans ne soit pas une cause de l'explanandum8. (1) En mathématiques et en logique, l'on peut expliquer un fait portant sur un objet abstrait en faisant appel à des axiomes* et théorèmes* qui valent dans le domaine de l'objet en question. De telles explications se situent sur un terrain totalement étranger à la causalité. (2) La loi de Boyle-Mariotte permet d'expliquer (approximativement) la température d'un échantillon de gaz à un instant donné t en faisant appel à sa pression (étant donné le volume occupé) au même instant t, mais également d'expliquer sa pression en faisant appel à sa température. Or si l'explanans désignait à chaque fois la cause, et l'explanandum l'effet, et si l'on admet que la causalité est une relation transitive, on obtiendrait le résultat absurde selon lequel la pression d'un gaz est une cause de soi : la pression causerait la température et la température la pression ; par transitivité la pression du gaz à l'instant t se causerait donc indirectement elle-même. (3) Un épiphénomène (c'est-à-dire un phénomène qui est causé sans être à son tour une cause) d'un processus causal sous-jacent peut en expliquer un autre. En biologie, on peut par exemple expliquer le fait que les enfants d'un couple donné ont les yeux bleus à partir de l'héritabilité de la couleur des yeux et du fait que les parents et leurs ancêtres ont tous les yeux bleus. Dans la mesure où les phénotypes (c'est-à-dire les caractères apparents) sont des épiphénomènes d'un processus causal sous-jacent qui n'implique que le génotype (l'ensemble des gènes), une explication qui 8 La liste suivante n'est pas exhaustive. L'explication à l'aide d'un pseudo-processus est une autre forme d'explication noncausale (Cf. Elliott Sober, "A Plea for Pseudo-Processes", Pacific Philosophical Quarterly 66 (1985), p. 303-309). Le cas de l'explication téléologique est plus controversé ; cf. chap. 10. comme la précédente ne fait intervenir que les phénotypes ne peut être causale, puisque le concept même d'épiphénomène exclut que le phénotype, c'est-à-dire l'explanans, soit une cause. (4) Un type important d'explication scientifique vise la compréhension de la possession d'une propriété par un objet, sans faire référence à son acquisition au sens causal, selon des lois évolutives9. Ces explications, que l'on peut appeler "analytiques" ne répondent pas à la question : "Pourquoi, ou en vertu de quelle cause, l'objet o a-t-il acquis la propriété P ?", mais plutôt : "En vertu de quoi o possède-t-il la propriété P ?" ou : "Qu'est-ce que c'est pour un objet d'avoir P ?" Il semble par exemple légitime de demander, à propos d'un échantillon de gaz, non seulement en vertu de quelle cause il a acquis une certaine température T, mais aussi ce que c'est pour un tel échantillon d'être à la température T. La théorie cinétique des gaz fournit une réponse à la question de ce qu'est la propriété même d'être à telle température. Suivant la terminologie de Cummins (1983), nous pouvons appeler l'explication de la température du gaz une "analyse compositionnelle". Elle consiste à montrer qu'un objet (ou système) complexe possède la propriété P en vertu du fait qu'il est constitué de composantes C1,..., Cn (à leur tour caractérisées par la possession de certaines propriétés) qui sont organisées d'une certaine façon. Toute la tradition de l'explication atomiste tombe dans cette catégorie. Dans le cas du gaz, les composantes sont des molécules qui interagissent par chocs élastiques, et l'analyse compositionnelle réduit le fait d'avoir T au fait que les molécules ont une certaine énergie cinétique moyenne. Un cas particulièrement important d'"analyse de propriété" qui cherche à expliquer en vertu de quoi un objet possède une certaine propriété P est celui de l'"analyse fonctionnelle"10, qui vise les propriétés dispositionnelles, qui sont des propriétés dont l'identité est déterminée par un énoncé conditionnel contrefactuel11. Dire par exemple d'un morceau de sucre qu'il est soluble dans l'eau, ce n'est pas dire qu'il se dissoudra un jour, mais seulement que s'il était plongé dans l'eau, il se dissoudrait. L'analyse fonctionnelle de la solubilité du sucre explique cette propriété par les interactions qui ont lieu entre les composantes moléculaires du sucre et de l'eau en vertu des propriétés de ces composantes et des lois auxquelles elles sont soumises12. Pourtant, il semble clair que l'explanans d'une explication compositionnelle n'est pas une cause de la possession de la propriété en question, ne serait-ce que parce que les composantes microscopiques, leurs propriétés et leur organisation sont strictement contemporaines de la solubilité, qui est la propriété macroscopique à expliquer. Bromberger (1962) a considéré la notion d'explication sous un tout autre angle. Contrairement à l'approche de Hempel et Oppenheim pour lesquels le lien entre explanans et explanandum est un lien logique, Bromberger considère les explications comme des épisodes situés dans l'espace et le 9 Ce type d'explications a notamment été analysé par Cummins (1983). Le concept de fonction est analysé plus en détail au chap. 10. 11 Cette notion est introduite au chap. 4. 12 La question de savoir s'il existe des propriétés fondamentales qui sont dispositionnelles est controversée. Le dispositionnalisme selon lequel cela est le cas s'oppose au catégoricalisme selon lequel toutes les propriétés fondamentales sont catégorielles - c'est-à-dire non dispositionnelles - et toutes les propriétés dispositionnelles sont susceptibles d'une analyse fonctionnelle qui explique une disposition D par les propriétés catégorielles des composantes des objets qui possèdent D. Cf. David M. Armstrong, A World of States of Affairs, Cambridge, Cambridge University Press, 1997. 10 temps, qui consistent en une interaction communicative entre deux personnes dont l'une - le "tuteur" (tutor) - met à disposition de l'autre - "l'auditeur" (tutee) - les moyens de répondre à une question qui forme la cible de l'explication. À la fin de l'examen minutieux des différentes situations dans lesquelles il est légitime de dire que le tuteur répond par une explication à une question que pose l'auditeur, Bromberger parvient à une analyse selon laquelle les trois conditions suivantes sont nécessaires et suffisantes pour qu'un épisode donné soit une explication : 1. "Le tuteur est rationnel et connaît la réponse correcte à la question au moment de l'épisode." 2. "Au cours de l'épisode, le tuteur présente les faits dont, dans son opinion, l'auditeur doit prendre connaissance pour connaître la réponse correcte à la question." 3. "Au cours de l'épisode, le tuteur instruit l'auditeur de la manière qu'il (le tuteur) considère comme nécessaire pour le tirer [...] [de l'ornière (predicament)] dans laquelle il estime qu'il se trouve"13. Pour simplifier, ne mentionnons ici, parmi les "ornières" introduites par Bromberger, que "l'ornière p" (p-predicament).14 Elle correspond au cas où je me trouve par rapport à la question que je me pose dans une situation où je ne peux envisager aucune réponse à laquelle ne s'opposeraient pas, selon mes croyances, des objections décisives. Lorsqu'on répond "5895 m" à une question concernant l'altitude du Kilimandjaro, on n'explique pas par cette réponse l'altitude du Kilimandjaro. Selon Bromberger, la raison en est que celui qui pose la question ne se trouve pas dans une ornière p par rapport à elle, car il pouvait très bien imaginer des réponses comme "4000 m", qui lui semblaient plausibles au sens où rien parmi ses connaissances générales ne le contraignait à les rejeter. En revanche, Bromberger lui-même se trouve dans une ornière p par rapport à la question : pourquoi les théières émettent-elles un sifflement avant que l'eau commence à bouillir ? Par conséquent, si on lui donne la réponse à cette question, il est légitime de dire qu'il s'agit d'une explication. Plutôt que de concurrencer l'approche logique de l'explication par Hempel et Oppenheim, celle de Bromberger en constitue un complément. Elle présuppose en effet la solution de ce qui fait l'objet de la première, à savoir une analyse de ce qui consitue une réponse adéquate à une question "pourquoi ?". Inversement, une explication au sens logique de Hempel et Oppenheim peut être conçue comme donnant lieu à un certain nombre d'épisodes explicatifs qui font l'objet de l'analyse de Bromberger. Approches nouvelles de la causalité Nous avons contesté l'équivalence défendue par les empiristes logiques entre explication et causalité, en faisant de l'explication causale un cas à part. Nous avons vu que d'une part, l'exigence de causalité est une condition indépendante des conditions imposées à l'explication dans le modèle D-N, et que d'autre part, l'explication causale n'est qu'une forme d'explication parmi d'autres. On 13 14 Bromberger (1962, p. 41). Bromberger (1962, p. 29). peut tirer différentes conclusions à partir du constat selon lequel les concepts de causalité et d'explication ne sont pas équivalents. 1. Ce constat remet en cause la théorie dite nomologique de la causalité des empiristes logiques. En suivant Hume, selon lequel la relation entre cause et effet n'est objectivement rien d'autre que l'instance d'une régularité, la conception nomologique réduit la relation causale à la relation entre deux événements qui "tombent sous", sont "couverts par" ou "forment une instance" d'une loi de la nature. La théorie nomologique de la causalité réduit la relation entre une cause Fa et un effet Ga au fait que Fa est l'antécédent et Ga le conséquent de l'instance FaGa d'une loi (x)(FxGx) qui lie la propriété F à la propriété G. Dans la mesure où la loi est connue, cette théorie est équivalente à celle qui réduit la relation causale à la relation entre les conditions initiales et l'explanandum dans une explication D-N15. 2. La conception nomologique de la causalité s'oppose à une position qui renoue plus directement avec Hume et qui a été, au XXe siècle, défendue par Russell (1912). Elle trouve toujours un écho important aujourd'hui tant elle séduit par sa simplicité. Elle consiste à concevoir la causalité comme un concept du sens commun auquel il est impossible de substituer un concept scientifique : au lieu d'être réductible à un concept scientifique, le concept de causalité ne posséderait aucun pendant dans la conception scientifique du monde. Il convient donc de l'en éliminer16. L'explication scientifique n'aurait recours qu'à des descriptions quantitatives des phénomènes ainsi qu'à des équations fonctionnelles (dans le cas des théories quantitatives, comme la physique mathématique). Nous avons déjà présenté des arguments contre cette position lorsque nous avons attribué le décalage entre le concept intuitif d'explication et le modèle D-N à l'absence d'un élément indépendant de causalité dans ce modèle. La notion de causalité semble essentielle au discours des sciences de la nature dans la mesure où elles ne sont pas purement mathématiques : sans le concept de causalité, il est impossible de rendre compte des interactions qui sont au fondement de l'expérimentation. Cependant, la seule manière directe de relever le défi lancé par Russell est de produire effectivement une analyse explicite de la notion de causalité. Il existe plusieurs tentatives pour rendre légitime le recours à la notion de causalité à l'intérieur même du discours scientifique, tout en évitant sa réduction à l'explication ou à l'instanciation de lois. Aucune n'a encore réussi à s'imposer. (1) Pour certains auteurs, la causalité est une relation réelle, mais primitive et irréductible. Dans la version "singulariste" de cette conception17, les relations causales sont fondamentalement singulières, c'est-à-dire que leur existence ne dépend d'aucune loi. C'est en revanche l'existence des lois causales qui dépend de la répétition régulière de relations causales d'un même type. Selon 15 Cf. note 7 plus haut. Il est intéressant de noter le parallèle avec la position éliminativiste ou anti-réaliste vis-à-vis des lois, évoquée au chap. 4. On peut supposer que l'anti-réalisme vis-à-vis des lois est projeté sur la théorie de la causalité par l'intermédiaire de la théorie nomologique de la causalité qui réduit la causalité à l'instanciation d'une loi. La position éliminativiste a été anticipée sous une forme encore plus radicale par Hume : selon Hume, même le sens commun n'est pas justifié lorsqu'il effectue des jugements de causalité, pour la raison que le seul fondement de ces jugements réside dans la subjectivité de l'observateur. 17 Cf. C.J. Ducasse, "On the Nature and Observability of the Causal Relation" (1926), in Sosa (1975), Anscombe (1971). 16 certains auteurs, ces relations peuvent être perçues directement, de manière à rendre possible une connaissance immédiate de leur existence18. Cela semble plausible lorsqu'on perçoit par exemple qu'un objet en pousse un autre. Dans la version "universaliste" de cette conception, la causalité est une relation théorique irréductible : elle constitue un certain type de dépendance nomique dont la nature doit être déterminée par "définition implicite", dans le cadre d'une théorie axiomatique19. (2) Parmi les propositions réductionnistes, il existe plusieurs variantes de la théorie dite "de transfert". Selon cette théorie, la relation causale repose sur l'existence d'une transmission de quelque chose entre la cause et l'effet. En suivant Reichenbach, Salmon (1984) suggère qu'un processus est causal si et seulement s'il est capable de transmettre un "caractère" qui serve de signal. Cette proposition s'inspire de ce que la physique relativiste impose des contraintes très précises sur la possibilité de transmission de signaux. Il est plausible de considérer les zones de l'espace-temps entre lesquelles cette transmission est impossible comme causalement isolées. D'autres auteurs ont essayé de réduire la causalité à la transmission d'une quantité physique, notamment l'énergie20, ou plus généralement une quantité d'une grandeur conservée21. Une approche similaire conteste la possibilité conceptuelle de parler de transmission à propos de quantités particulières de grandeurs conservées, pour proposer de substituer au concept de transmission le concept plus faible de manifestation régulière d'une grandeur conservée22. (3) D'autres propositions visent à faire de la causalité une réalité avant tout humaine. Il semble légitime de faire valoir que notre connaissance de l'existence et de la nature des relations causales dépend de notre capacité à intervenir expérimentalement dans la nature23. Certains auteurs vont plus loin et affirment que l'agir humain constitue l'essence de la causalité24. D'après cette conception anthropocentrique, seuls nos actes sont des causes au sens strict, tandis que les processus qui se déroulent hors de portée de notre influence ne sont causaux que par analogie, mais non littéralement. En s'inspirant d'un concept forgé par l'empirisme classique25, d'autres auteurs ont proposé de voir dans la causalité une qualité seconde26. Selon la distinction classique entre qualités premières et secondes, seules les qualités premières sont possédées par les corps de manière intrinsèque, c'est-à-dire indépendamment du fait qu'ils soient perçus. La forme et l'état de mouvement sont des qualités premières. En revanche, les qualités secondes, telles que les couleurs, les sons et les goûts ne sont que perçues. Les objets ne sont pas colorés de manière intrinsèque ; 18 Cf. Anscombe (1971), David M. Armstrong , A Materialist Theory of the Mind (1968), revised edition, London, Routledge, 1993. 19 Cf. Tooley (1987). 20 David Fair (1979), "Causation and the Flow of Energy", Erkenntnis 14, p. 219-250. 21 Cf. Max Kistler, "Reducing Causality to Transmission", Erkenntnis 48 (1998), p. 1-24; Kistler (1999a). 22 Cf. Phil Dowe, "Wesley Salmon's Process Theory of Causality and the Conserved Quantity Theory", Philosophy of Science 59 (1992), p. 195-216. 23 Cf. Georg Henrik von Wright, Explanation and Understanding, Ithaca (N.Y.), Cornell University Press, 1971; Georg Henrik von Wright, "On the Logic and Epistemology of the Causal Relation" (1973), in Sosa (1975). 24 Cf. Douglas Gasking, "Causation and Recipes", Mind 64 (1955), p. 479-487; Nancy Cartwright, How the Laws of Physics Lie, Oxford, Clarendon Press, 1983. 25 En particulier par John Locke. 26 Cf. Peter Menzies et Huw Price, "Causation as a Secondary Quality", British Journal for the Philosophy of Science 44 (1993), p. 187-203. attribuer la qualité seconde d'être rouge à une rose, c'est affirmer qu'elle a un certain nombre de propriétés premières qui lui donnent le pouvoir (une propriété dispositionnelle) de provoquer en nous la perception de rouge. Faire l'hypothèse selon laquelle la relation causale est une qualité seconde revient à penser que du côté de la réalité objective, il n'existe que des successions régulières, mais que celles-ci ont la capacité de provoquer systématiquement en nous l'apparence caractéristique de la causalité. (4) Les analyses les plus influentes sont l'analyse contrefactuelle et l'approche probabiliste. Nous abordons la première à présent et la seconde dans la section suivante. Si la théorie nomologique reprend l'idée centrale de la première définition humienne de la causalité (citée dans la note 5 plus haut), David Lewis (1986b) a proposé de retourner à sa deuxième définition selon laquelle "un objet est la cause d'un autre" signifie que "si le premier objet n'avait pas existé, le second n'aurait jamais existé"27. Fort de sa théorie détaillée28 de la logique des conditionnels contrefactuels, Lewis réduit la causalité entre deux événements à l'existence d'une chaîne causale intermédiaire qui est une séquence finie d'événements dont chaque membre dépend causalement du précédent29. La dépendance causale entre événements est analysée par l'intermédiaire de la dépendance contrefactuelle entre les propositions qui expriment que ces événements ont lieu. Pour simplifier un peu, l'événement e dépend causalement de l'événement c si les deux contrefactuels suivants sont vrais : si c avait eu lieu, e aurait eu lieu ; si c n'avait pas eu lieu, e n'aurait pas eu lieu30. Nous ne pouvons pas ici entrer dans les détails de la discussion suscitée par l'analyse contrefactuelle de la causalité proposée par Lewis. Sa viabilité dépend de sa résistance aux objections suivantes. Premièrement, la question de savoir s'il est possible de fonder l'évaluation des conditionnels contrefactuels, qui repose elle-même sur des jugements de similitude comparative entre différents mondes possibles (non actuels), sur un fondement indépendant de la causalité est controversée. Certains auteurs estiment que des jugements de causalité interviennent de façon essentielle dans la détermination des valeurs de vérité des contrefactuels31. Deuxièmement, la question de savoir si l'analyse contrefactuelle a une réponse satisfaisante aux difficultés suivantes est également controversée. Il semble exister des énoncés contrefactuels qui affirment la dépendance de la cause par rapport à l'effet. Selon un tel contrefactuel "à rebours" ("backtracking"), s'il n'y avait pas eu d'éclipse solaire le 11 Août 1999, le Soleil, la Lune et la Terre auraient eu des positions ou des vitesses différentes le 10 Août 1999. De manière semblable, deux effets d'une cause commune semblent dépendre contrefactuellement l'un de l'autre : étant donné que M. Dupont et M. Dupond regardent tous les matches de football transmis par la chaîne de télévision XY (et seulement ceuxlà), il semble vrai de dire que si M. Dupont avait vu le match le jour J, M. Dupond l'aurait vu (parce 27 Hume (1748, p. 76, tr. p. 124/5). Cf. Lewis (1973). 29 La précédence est ici entendue au sens logique et est déterminée par l'ordre des membres de la chaîne, sans préjuger de la question de la précédence temporelle de la cause par rapport à l'effet. Lewis donne en effet un argument indépendant contre la possibilité de relations causales "rétroactives" où l'effet précède la cause dans le temps. 30 Le premier contrefactuel porte le poids de l'affirmation de causalité dans le cas où les événements c et e n'ont pas eu lieu, tandis que le second est décisif dans le cas où il s'agit d'événements qui ont réellement eu lieu. 31 Cf. Frank Jackson, "A Causal Theory of Conterfactuals", Australasian Journal of Philosophy, 55 (1977), p. 3-21. 28 qu'il a été transmis par XY), et si M. Dupont ne l'avait pas vu, M. Dupond ne l'aurait pas vu non plus (parce qu'il n'a pas été transmis par XY). Enfin, cette analyse semble fournir un résultat incorrect dans les cas de surdétermination causale : si un prisonnier est exécuté par deux balles A et B tirées par deux bourreaux en même temps, dans un cas où chacune aurait été suffisante pour sa mort, chaque balle semble intuitivement être une cause de la mort, mais il n'est pas vrai que si par exemple la balle B n'avait pas été tirée, le prisonnier ne serait pas mort. Explications statistiques et causalité probabiliste Selon les défenseurs de l'approche probabiliste à la causalité32, ce qui fait que c compte comme une cause de e, c'est que l'occurrence de c augmente la probabilité objective de l'occurrence de e. Cette proposition, qui a donné lieu à une riche littérature, a des affinités avec la thèse classique de l'empirisme logique selon laquelle un jugement de causalité est équivalent à l'affirmation de l'existence d'une explication de l'effet par la cause. Vue sous cet angle, l'approche probabiliste témoigne de la répercussion sur la théorie de la causalité d'une évolution importante de la théorie de l'explication. De nombreuses explications dans les sciences empiriques font en effet appel non seulement à des lois strictement universelles, mais aussi à des généralisations probabilistes33. Si l'on cherche par exemple à comprendre pourquoi un morceau donné de charbon contient un certain pourcentage de carbone 14 (qui est un isotope plus rare, mais omniprésent dans la nature, du carbone 12, majoritaire) pour moitié moins élevée que le pourcentage moyen dans une plante vivante, on peut donner comme explication celle selon laquelle d'une part ce morceau de charbon provient d'un arbre mort il y a à peu près 5730 années, et d'autre part la demi-vie du carbone 14 est de 5730 années. Or la loi stipulant le rythme de décomposition radioactive d'un type donné de substance est une loi statistique. Elle permet de prédire avec une très haute probabilité, mais non avec certitude, que la moitié des noyaux radioactifs d'un échantillon donné seront décomposés après le temps de demi-vie caractéristique de cette substance. Hempel (1962) a proposé de concevoir les explications probabilistes selon un modèle analogue au modèle D-N, qu'il appelle le modèle inductif-statistique (I-S) de l'explication. Dans un argument explicatif de type I-S, la conclusion n'est pas déductible des prémisses, mais la vérité des prémisses rend la vérité de la conclusion probable à un degré r, qui peut ainsi servir à mesurer la force de la justification inductive de la croyance en la conclusion, étant donné que l'on croit les prémisses. L'exemple de la radioactivité est d'une simplicité trompeuse. En réalité, l'explication probabiliste - et avec elle, la causalité probabiliste - est confrontée à des difficultés de taille. L'exemple suivant montre qu'il peut arriver que dans une situation parfaitement banale, il existe des explications I-S correctes qui mènent à la fois à une conclusion et sa contradictoire, à partir d'un 32 Cf. Patrick Suppes, A Probabilistic Theory of Causality, Amsterdam, North Holland, 1970; Tooley (1987), Mellor (1995). 33 Cf. chap. 3. même ensemble de prémisses. Hempel (1962) considère le cas de Jean (j) qui a une infection de streptocoques (S) et est traité avec de la pénicilline (P). La probabilité d'une guérison rapide (G) d'une infection de streptocoques (S), suite à l'administration de pénicilline (P) est de r [P(G|SP) = r]34, où r est un nombre proche de 1. On peut donc faire l'inférence I-S qui explique - et qui, selon l'approche probabiliste de la causalité, indique la cause de - la guérison de Jean (Gj) : P(G|SP) = r Sj Pj -------------------- (r) Gj Mais si les streptocoques qui rendent Jean malade sont résistants à la pénicilline, alors la probabilité de sa guérison est faible : P(G|SPR) = r1, où r1 est un nombre proche de zéro. En l'absence d'une troisième possibilité, la probabilité qu'il ne guérisse pas (G) est alors 1-r1 qui est un nombre proche de 1. Cela nous autorise à construire l'argument I-S suivant : P(G|SPR) = 1 - r1 Sj Pj Rj -------------------- (1 - r1) Gj. Nous arrivons au résultat selon lequel à partir d'un ensemble de prémisses : P(G|SP) = r, P(G|SPR) = 1 - r1, Sj, Pj, Rj. qui décrit une situation assez banale, le mode de raisonnement inductif qui caractérise l'explication I-S nous mène à deux conclusions contradictoires : Gj et Gj. Sans que nous puissions entrer ici dans les détails de l'histoire des tentatives pour surmonter ce problème, mentionnons seulement le fait que Hempel (1965a) en a conclu que les explications statistiques ne peuvent pas être évaluées de façon isolée, mais seulement relativement à un arrièreplan constitué par tout un ensemble de connaissances. Dans la mesure où j'ignore que Jean est infecté par un germe résistant à la pénicilline (Rj), ou que la probabilité de guérison est faible dans ces circonstances (P(G|SPR) = r1), il est rationnel pour moi d'accepter la première explication. Mais dès que j'ai connaissance de ces faits, qui ont un impact sur la probabilité de guérison de Jean (Gj), il serait irrationnel de l'accepter : dans l'explication statistique, contrairement à l'explication déductive, il est illicite d'ignorer des informations pertinentes. Dans le vocabulaire de Hempel, les prémisses de l'explication doivent répondre à "l'exigence de spécificité maximale" par rapport à l'explanandum en question. En l'absence d'une information complète sur tous les faits de l'univers dans un sens absolu, on est contraint d'admettre que l'explication statistique est empreinte d'une "relativité épistémique" par rapport à un système particulier de connaissances. 34 La formule "P(G|SP) = r" signifie : La probabilité (P) que l'événement G se produit, étant donné que (|) les événements S et P se sont produits, est égale à r, où r est un nombre compris entre 0 et 1. Voir chap. 3. Un autre problème important pour la théorie de l'explication statistique est que l'exigence de probabilité élevée semble inadéquate dans des cas comme celui du tabès (ou paralysie générale)35. Le tabès est une forme du stade tertiaire de la syphilis dont sont victimes 25% des malades qui ont parcouru les stades primaire, secondaire et latent de cette maladie sans recevoir de thérapie antibiotique. Tant qu'on maintient l'exigence de probabilité élevée, la seule explication statistique légitime est celle du fait qu'un individu donné b atteint de syphilis ne développe pas de tabès. Or il semble qu'il n'y ait pas non plus de meilleure explication du fait qu'un autre individu c développe au contraire un tabès que de mentionner le fait qu'il a parcouru les stades précoces de la maladie sans traitement antibiotique, et qu'il existe une certaine probabilité - quoique faible - de développer un tabès dans ces circonstances. Selon la formulation de la théorie probabiliste de la causalité par Mellor (1995), pour que "E parce que C" soit vrai - où il faut entendre le "parce que" en un sens causal - il est nécessaire et suffisant que : (1) C et E soient des faits, et (2) la probabilité objective de E étant donné C soit plus grande que la probabilité de E étant donné C. Mellor soutient que l'analyse de la causalité par l'augmentation de probabilité est la seule qui puisse rendre compte des "principales connotations de la causalité"36, à savoir que les causes sont des indicateurs de leurs effets ("a cause is evidence for its effects"37), permettent d'expliquer leurs effets, et peuvent servir de moyens pour atteindre leurs effets. Il paraît en effet très plausible que tous ces liens existent souvent, et en particulier dans tous les cas typiques ou paradigmatiques de causalité. Mais il existe aussi des contre-exemples à chacune de ces relations, c'est-à-dire qu'il existe des relations causales où la cause n'indique pas son effet, d'autres où la cause ne permet pas d'expliquer son effet, et d'autres encore qui ne pourraient pas servir de moyens pour atteindre un but. À chaque fois, il s'agit d'indices de l'existence d'une relation causale, mais d'indices faillibles qui ne sont ni nécessaires ni suffisants pour l'existence d'une relation causale. Sans développer ici des contre-exemples pour les trois indicateurs de causalité évoqués par Mellor, nous pouvons rappeler qu'il existe des explications où l'explanans ne désigne pas la cause et l'explanandum ne désigne pas l'effet, comme nous l'avons vu. La présence de la relation d'explication n'est donc pas une condition suffisante pour l'existence d'une relation causale entre l'explanans et l'explanandum. Il n'est pas exclu qu'il existe une théorie de l'explication dans le cadre de laquelle l'existence d'une relation causale suffise pour qu'on puisse expliquer l'effet par la cause. Mais l'exemple de la syphilis et du tabès montre que cela n'est pas le cas dans le cadre de la théorie de l'explication I-S : à partir de celle-ci, nous avons découvert qu'il existait des relations causales dans lesquelles la cause ne permettait pas d'expliquer l'effet. Pour servir d'analyse conceptuelle de la relation causale, la relation (2) d'augmentation de probabilité devrait d'une part être exempte de contre-exemples, c'est-à-dire qu'il ne devrait pas y avoir de cas où la cause n'augmente pas la probabilité de l'effet, ni de cas où un fait augmente la probabilité d'un autre fait mais où ces faits ne sont pas liés comme la cause à l'effet. D'autre part, 35 Michael Scriven, "Explanation and Prediction in Evolutionary Theory" (1959), Science 30, p. 477-482. Mellor (1995, p. 68). 37 Mellor (1995, p. 68). 36 elle devrait permettre d'expliquer les exceptions aux "indicateurs" de causalité que sont la relation d'indication, celle d'explication et celle entre un moyen et le but qu'il permet d'atteindre. Or la relation (2) d'augmentation de probabilité ne semble même pas satisfaire à la première condition, comme le montrent les contre-exemples suivants. La situation suivante de surdétermination causale montre que la relation (2) n'est pas suffisante pour qu'il y ait relation causale. "J'empoisonne la soupe de François, ce qui augmente la probabilité de sa mort. Tu empoisonnes sa boisson. Il se trouve qu'il boit d'abord et meurt, sans avoir touché à la soupe : dans ce cas, mon empoisonnement n'a pas été la cause de sa mort bien qu'il ait augmenté la probabilité de sa mort et bien qu'il soit mort."38 Mais la condition (2) n'est pas non plus nécessaire. "Nous sommes à la chasse au cerf à deux, nous n'avons qu'un fusil pour nous deux, et il ne nous reste plus de munitions que pour un seul coup. Un cerf apparaît. Tu es le tireur expert, moi le débutant inutile. Si je ne tire pas, tu le feras. Je tire, ce qui baisse la probabilité que le cerf soit tué. Par chance, je le tue. Mon tir a causé sa mort bien que, dans les circonstances, il aurait eu une plus grande chance d'être tué si je n'avais pas tiré."39 De tels contre-exemples ne suffisent bien entendu pas en eux-mêmes à réfuter l'analyse de la causalité par la probabilité de manière définitive. Il est possible de la modifier de sorte qu'elle puisse surmonter ces contre-exemples. Ils semblent cependant montrer que la relation (2) n'est à son tour qu'un nouvel indicateur faillible de la causalité, mais n'en constitue pas une analyse conceptuelle complète, ou, dans un vocabulaire plus métaphysique, n'épuise pas la nature profonde de la relation causale. Nous avons montré le caractère inadéquat de l'équivalence traditionnelle entre la relation de cause à effet et la relation entre explanans et explanandum. Pour que A soit cause de B il n'est ni nécessaire ni suffisant que A puisse contribuer à expliquer B. L'existence d'explications non causales montre que ce n'est pas nécessaire. La thèse selon laquelle ce n'est pas non plus suffisant est plus controversée car son évaluation dépend de l'analyse de la relation causale. Parmi les propositions réductrices, la conception selon laquelle la causalité est fondée sur un transfert, par exemple d'une quantité d'énergie de la cause à l'effet, est apparue comme prometteuse. Or si on conçoit la relation causale sur le plan microphysique comme le fait la théorie de transfert, la seule identification d'une telle relation n'est clairement pas suffisante pour l'explication d'un phénomène macroscopique, par exemple pour l'explication causale de la maladie d’une personne. La dissociation des notions de causalité et d'explication ainsi fondée permet de comprendre l'intérêt des recherches récentes visant à comprendre ces notions indépendamment l'une de l'autre. 38 39 Edgington (1997, p. 419). Edgington (1997, p. 420).