1 La physique quantique en conflit avec notre intuition Roger Balian, Institut de Physique Théorique, Centre de Saclay, et Académie des Sciences Summary. Quantum physics against intuition. Since Galileo, deeper understanding of physical reality often contradicts everyday’s intuition. This trend has become dramatic a century ago, rendering modern physics abstruse to the laymen. The scientist can exert his intuition and his imagination within an elaborate mathematical language, but it is impossible to translate his ideas faithfully into ordinary language; this difficulty may be one of the causes of the present tarnish of the image of science. A first shock was brought in by relativity, which revolutionized our conceptions of space and time, but quantum physics presents even more counter-intuitive features. One has been led to represent physical quantities pertaining to a system, such as the position or the velocity of a particle, no longer by ordinary numbers but by “observables”, mathematical objects which belong to a non-commutative algebra. Namely, the product of two such observables is not a unique new observable but may depend on their order: the products AB and BA may differ. The values that a physical quantity can take constitute a set of ordinary numbers, the eigenvalues a(n) of the observable A. This set may be discrete as a consequence of the algebra. The discreteness of the eigenvalues of the energy of an atom explains the spectrum of its radiation. Any component of the intrinsic angular momentum of an electron can take only two opposite values, baffling our geometric intuition. If two observables commute (i.e., AB=BA), they are compatible: both may take well-defined values chosen among the eigenvalues. If they do not commute (i.e., AB≠BA), which occurs for the position and velocity of a particle, for the electric and magnetic field, or for the components of an angular momentum, they are incompatible: their values cannot be measured nor even specified simultaneously. Each of them presents statistical fluctuations which must be larger than some lower bound (Heisenberg’s inequality). The state of a system, prepared under some definite conditions, should be identified as the set of expectation values of all observables. Thus, quantum physics, our most fundamental description of nature, is a theory involving irreducible probabilities and unavoidable uncertainties. Its predictions do not refer to a single system, but to a statistical ensemble, and the observer cannot be completely disregarded. Moreover it may involve aspects which are apparently contradictory (Bohr’s complementarity). An electron, an atom or a molecule may behave in limiting cases either as a particle or as a wave; under intermediate conditions, it behaves as both, but each of the descriptions is blurred with probabilities. As a wave, it can interfere with itself. Likewise, an electromagnetic field has the double nature of a set of photons and of a wave. At the macroscopic scale, relative fluctuations are small, so that determinism emerges. 2 Quantum probabilities differ from standard ones. In particular, quantum correlations involving four observables pair wise violate Bell’s inequalities, so that microscopic quantities are intrinsically indeterminate and depend on the observation process. The GHZ paradox, due to Greenberger, Horne and Zeilinger, exemplifies the most troublesome conceptual feature of quantum physics. Indeed, it baffles not only intuition, but also current logics. It deals with a physical system made of three correlated particles. Various observables, A1, A2, A3, B1, B2 and B3≡B1B2, which we do not specify here, can be measured on such a composite system. Each of them may take discrete values a1, a2, a3, b1, b2 equal either to +1 or to –1. Since the three observables A1B1, A2B2 and A3B3 are compatible, they can be simultaneously controlled. Consider then a statistical ensemble of systems, all prepared identically in such a way that A1B1=A2B2=A3B3= +1. If we measure A1 and B1, we shall find either a1=b1= +1 or a1=b1= –1, that is always a1=b1; likewise for a2=b2= ±1 and a3=b1b2= ±1. We are tempted to infer that a simultaneous determination of the values a1, a2 and a3 of A1, A2 and A3 (which are compatible) should verify a3=a1a2, that is, a1a2a3=1. However both theory and experiment provide in all cases a1a2a3= –1. In fact the four statements a1=b1, a2=b2, a3=b1b2 and a1a2a3 = –1 which seem contradictory are separately “true”, in the sense that each one can be verified experimentally; but such experiments cannot be performed on a single system. We are not allowed to make a logical reasoning based on a simultaneous consideration of the values of B1 and A2 because these observables do not commute. No calculation, no experiment can simultaneously provide values for the numbers b1 and a2. Hence, we cannot regard as true together the statements a1=b1 and a2=b2, although they can be checked by separate experiments. Each one is true, but their union is meaningless. Thus, if theory does not allow us to imagine thought experiments in which several statements on a system might simultaneously be checked, we cannot draw conclusions by putting such statements together. We are led to regard the “truth” of a quantum statement as contextual. The values of physical quantities are not attached only to the system in itself, but also refer to the context in which their relations may be verified. Quantum mechanics does not deal with objects per se, but with what we know and what we can infer about them. It does not provide a direct image of the reality of the object since it involves its observation. Although it is a perfect tool for letting us make statistical predictions, and although it appears as our most basic theory owing to its precision and generality, it violates our daily intuition, our elementary mathematical intuition and our feelings about reality. Its probabilities and even its logics obey rather shocking new rules. Au cours des derniers siècles, le champ de la physique n’a cessé de s’élargir. Cette science couvre des phénomènes de plus en plus variés, à des échelles s’étendant de 10–18 m en physique des particules à 1026 m en cosmologie. Elle permet de faire des prévisions de plus en plus précises, et fournit une vision de plus en plus unifiée du monde. Dans une perspective réductionniste, on peut la considérer comme la science la plus « fondamentale », en ce sens que les autres sciences sont supposées en découler sans adjonction de principes nouveaux : la chimie devrait en principe émerger de la physique atomique, la biologie de la chimie – même si cette hiérarchie est de nature plus philosophique que scientifique ; dans la pratique, il n’est pas question de réduire la biologie à la chimie, ou la chimie à la physique. 3 Au fur et à mesure que la physique s’est unifiée, qu’elle est devenue plus explicative et plus fiable, elle a cependant dû s’appuyer sur des outils mathématiques de plus en plus élaborés et abstraits. Afin de rendre intelligible la réalité du monde, nous devons payer un prix : il nous faut remplacer le langage des mots, devenu inadéquat, par un langage mathématique plus adapté et précis. Ce nouveau langage est multiforme, difficile à acquérir ; il peut sembler hermétique au profane, obstacle majeur à l’enseignement et à la vulgarisation. Le chercheur s’en accommode, mais même pour lui, l’intuition ne peut guère s’appuyer sur l’expérience quotidienne. Ce caractère contre-intuitif de nombreuses branches de la physique n’est pas nouveau. La théorie cinétique des gaz, malgré ses succès, a été rejetée par la majorité des savants jusqu’au début du XXème siècle, tant il semblait évident que la matière était continue ; elle ne s’est imposée qu’après la mise en évidence des atomes. Lorsque nous abordons la relativité, nous ne pouvons qu’être troublés par une conception de l’espace-temps aussi peu conforme à l’observation courante. Cependant, parmi les révolutions des bases de la physique contemporaine, c’est la mécanique quantique qui nous paraît la plus choquante, puisqu’elle défie même l’intuition mathématique courante et va jusqu’à ébranler le raisonnement logique, comme nous allons le voir. Nous ne pourrons éviter une certaine technicité, mais essayerons de présenter les outils mathématiques indispensables à la compréhension ; les calculs seront donnés en note. Les observables, représentation quantique des grandeurs physiques La notion même de grandeur physique associée à un système donné présente en physique quantique un aspect surprenant. A l’échelle macroscopique sur laquelle se fondent nos intuitions, les grandeurs physiques auxquelles nous sommes habitués se comportent comme des nombres : on peut les multiplier entre elles, et le produit de deux grandeurs A et B est toujours commutatif, c’est-à-dire qu’il satisfait à l’identité AB=BA. (Par exemple, on obtient la puissance communiquée à un objet en multipliant sa vitesse par la force exercée sur elle). Pourtant, à l’échelle microscopique régie par la mécanique quantique, l’expérience a conduit à représenter les grandeurs physiques non par des nombres, mais par des objets mathématiques, appelés « observables », ayant des propriétés algébriques différentes de celles des nombres réels ordinaires. En particulier, la multiplication présente un caractère nouveau : elle dépend de l’ordre des facteurs. On doit postuler que le produit de deux grandeurs physiques n’est pas commutatif [1] : le produit AB peut différer du produit BA. Ainsi, la position et la vitesse d’une particule sont représentées par des observables qui ne commutent 4 pas ; il en est de même du champ électrique et du champ magnétique. Mathématiquement, les observables microscopiques de la physique quantique sont des éléments d’une algèbre non commutative caractéristique du système considéré, ce qui entraîne des conséquences physiques surprenantes. Déjà, si l’on considère une seule observable A, son appartenance à une structure d’algèbre fait apparaître des concepts nouveaux. Parmi les divers états du système, il existe une famille, celle des « états propres de A », qui a les propriétés suivantes. Dans chaque état propre de A, la grandeur physique correspondante prend une valeur bien définie, appelée « valeur propre de A » ; pour tout autre état, elle est mal définie et présente une fluctuation statistique. Cependant, lorsqu’on teste un système en effectuant une mesure de A, on obtient toujours pour résultat l’une des valeurs propres ; l’existence d’une fluctuation statistique se traduit par la possibilité d’obtenir des résultats différents lorsqu’on répète la mesure sur des systèmes semblables, bien qu’ils soient tous préparés dans le même état. L’ensemble a(1), a(2),… des valeurs propres de A est souvent discret, auquel cas il n’existe aucun état du système dans lequel la grandeur A prendrait une valeur précise située dans les intervalles entre les a(n). Le mot de « quantum » a d’ailleurs été introduit pour désigner un tel comportement non continu des grandeurs physiques. Par exemple, les valeurs propres e(1)≤ e(2)≤ e(3)… de l’observable E qui représente l’énergie d’un atome sont discrètes, et elles dépendent de la nature de cet atome. Lorsque celui-ci passe du niveau 2 au niveau 1, il émet l’énergie e(2)– e(1) sous forme d’un rayonnement électromagnétique dont la fréquence ν est donnée par la relation de de Broglie e(2)– e(1)=hν, où h=6,6×10–34 m² kg s–1 est la constante de Planck. Le fait que l’énergie ne puisse prendre que certaines valeurs discrètes permet de comprendre pourquoi le spectre d’émission d’un atome ne comporte que des fréquences bien définies, caractéristiques de cet atome. Un autre exemple d’observables prenant des valeurs discrètes est donné par le moment cinétique intrinsèque S d’un électron, vecteur dont les trois composantes caractérisent la manière dont il tourne en permanence sur lui-même. Cette rotation, que l’on serait tenté de comparer à celle d’une toupie, a pourtant un comportement très différent de ce que l’on observe sur des objets macroscopiques ; pour marquer cette spécificité, on la désigne par le mot de « spin ». Le spin d’un électron a des propriétés surprenantes, qui résultent de la non commutation de ses composantes : la longueur du vecteur S est donnée par S²=3(h/4π)², mais chacune de ses composantes Sx, Sy, Sz, qui caractérisent la rotation autour des axes Ox, Oy, Oz, ne peut prendre que deux valeurs propres discrètes opposées, +h/4π et – h/4π, au lieu 5 de pouvoir varier continûment. De plus, sa projection Sw sur une direction arbitraire Ow n’a également que les deux valeurs propres +h/4π et – h/4π. Ces caractéristiques insolites violent notre intuition géométrique et semblent contradictoires, mais sont confirmées par de multiples expériences : on peut observer le spin de l’électron en détectant son moment magnétique, qui lui est proportionnel. En mesurant l’une de ses composantes, on trouve bien l’une ou l’autre des deux valeurs propres +h/4π ou – h/4π. Passons maintenant aux relations mutuelles entre deux observables. Si A et B commutent (c’est-à-dire si AB=BA), elles sont compatibles dans le sens suivant. Il est possible, au moins théoriquement, de préparer le système dans un état propre commun à A et B, état où les grandeurs physiques représentées par A et B prennent respectivement des valeurs a(m) et b(n) bien définies, choisies parmi les valeurs propres a(1), a(2),… de A et b(1), b(2),… de B. De plus, il est possible théoriquement de mesurer simultanément A et B. Mais si deux observables ne commutent pas (AB≠BA), les grandeurs physiques qu’elles représentent sont incompatibles : il est en général impossible de spécifier avec précision les valeurs de A et B à la fois, et il est impossible de les mesurer simultanément. Nous préciserons ce point dans la suite à l’aide de l’inégalité de Heisenberg. Même les préparations les plus fines conduisent en général à des états où A prend non pas une valeur définie, mais peut prendre l’une ou l’autre des diverses valeurs propres a(1), a(2),… affectées chacune d’une probabilité, et de même pour B. La physique quantique est ainsi une théorie foncièrement probabiliste : à l’échelle microscopique, elle ne fournit pas de prévisions certaines. Pour un ensemble statistique de systèmes tous préparés de la même façon connue, il existe toujours des dispersions, au moins pour certaines grandeurs physiques. L’état de l’un de ces systèmes est représenté en physique quantique par un objet mathématique qui nous permet d’associer à chaque observable A son espérance E(A), sa fluctuation statistique ∆A (donnée par ∆A²= E[A²−E(A)²], à une paire d’observables leur corrélation. Ces quantités sont mesurables par des séries d’expériences répétées. Un « état quantique » d’un système doit ainsi être identifié à la synthèse de toute l’information (probabiliste) que nous possédons sur ce système dans les conditions considérées. Singularité des probabilités quantiques Cependant, la physique quantique n’est pas régie par la théorie mathématique ordinaire des probabilités, car les observables, objets qui ne commutent pas entre eux, s’y substituent aux variables aléatoires habituelles (qui commutent). Ce remplacement rend la 6 théorie irréductiblement probabiliste, malgré son caractère de science fondamentale. Les probabilités n’y sont pas simplement dues à notre ignorance des valeurs que prendraient les grandeurs physiques pour un système donné, mais à une interdiction pour ces grandeurs de toutes prendre des valeurs bien définies. Nous sommes ainsi conduits à adhérer à une extension de l’interprétation de Bayes ou de Laplace des probabilités : la théorie quantique fait intervenir à la fois les objets et leurs observateurs. En effet, ses inévitables probabilités ne se rapportent pas seulement à l’objet considéré, mais constituent un outil mathématique nous permettant de faire sur lui les prévisions les plus raisonnables compte tenu des données dont nous disposons ; nos incertitudes sont estimées à l’aide des fluctuations statistiques. Tout cela contraste avec la nature déterministe de la physique à notre échelle, où les grandeurs physiques sont susceptibles de prendre des valeurs précises (même si nous ne les connaissons pas), où la description se plaque directement sur le réel et où l’on peut faire abstraction de l’observateur. L’émergence de ce déterminisme macroscopique à partir d’un comportement microscopique aléatoire s’explique par la loi des grands nombres. Une variable macroscopique se rapporte à un grand nombre N de particules, de sorte que sa fluctuation statistique relative, faible comme 1/√ N, est négligeable. Tout se passe ainsi comme si cette variable prenait une valeur bien définie, de sorte que le caractère probabiliste inhérent à la mécanique quantique est masqué à l’échelle macroscopique, ainsi que toutes les bizarreries quantiques. La spécificité des probabilités quantiques se manifeste de diverses façons. Un premier exemple est fourni par l’inégalité de Heisenberg. Etant donné deux observables A et B qui ne commutent pas (AB – BA ≠ 0), elles engendrent une autre observable C selon AB – BA = 2iC. (Cette définition faisant intervenir i =√ −1 met en évidence une autre propriété étrange de la mécanique quantique, la nécessité d’utiliser des variables complexes dans le formalisme, bien que tous les résultats physiques soient représentés par des nombres réels). On montre alors [2] que les fluctuations statistiques ∆A et ∆B de A et B satisfont à l’inégalité ∆A × ∆B ≥ |E(C)|. Par suite, dans tout état du système où E(C) est non nul, ces fluctuations statistiques sont bornées inférieurement : les grandeurs physiques A et B ne peuvent prendre toutes deux des valeurs précises, formulation mathématique de leur incompatibilité. On n’a pas le droit d’imaginer l’absence de fluctuations quantiques ; contrairement à ce qui se passe pour des probabilités ordinaires, leur existence, incontournable, n’est pas un simple effet de notre ignorance mais traduit le caractère flou des grandeurs physiques elles-mêmes. Cette inégalité a été introduite par Heisenberg dans le cas particulier de la position X d’une particule de masse m sur un axe et de sa vitesse V. Ces deux grandeurs physiques ne 7 commutent pas, puisque XV – VX =ih/2πm. Par suite, leurs fluctuations statistiques satisfont à ∆X × ∆V ≥ h/4πm. Cette inégalité est appelée « relation d’incertitude de Heisenberg » car elle signifie que ∆X et ∆V, qui caractérisent notre incertitude sur la position et la vitesse de la particule, ne peuvent être simultanément très faibles. Si l’objet considéré a un comportement de corpuscule localisé, ∆X est petit, ce qui implique une incertitude quasi-totale sur sa vitesse ; inversement, dire que la vitesse est bien déterminée, avec ∆V/V << 1, signifie que l’objet se comporte comme une onde de longueur d’onde λ étalée dans une région de taille ∆X>> λ, car la vitesse V est reliée à la longueur d’onde λ par la relation de de Broglie λ=h/mV. C’est seulement pour une masse très élevée que l’on peut considérer des situations où la particule possède à la fois une position et une vitesse pratiquement déterminées. De même, pour un rayonnement électromagnétique, c’est seulement à la limite d’une intensité assez forte qu’on peut définir de façon précise à la fois le champ électrique et le champ magnétique, grandeurs qui ne commutent pas. Les exemples ci-dessus illustrent le concept de complémentarité mis en avant par Niels Bohr (qui l’a cependant systématisé de façon discutable). Un électron, par exemple, ou un atome, ou une molécule, présente les deux aspects complémentaires de corpuscule et d’onde. Le premier se manifeste dans les situations où l’objet est localisé, le second dans celles où la longueur d’onde est bien déterminée. Les deux comportements ne peuvent coexister que dans des situations intermédiaires, et à condition d’admettre un certain flou dans la description. De même, un rayonnement électromagnétique peut selon les circonstances être observé comme un ensemble de photons ou comme un champ ; mais ce champ est nul en moyenne si le nombre de photons est bien défini, et inversement de faibles fluctuations statistiques du champ impliquent de fortes fluctuations du nombre de photons. Cette double nature des objets microscopiques peut défier l’entendement ; elle est cependant démontrée par de nombreuses expériences, notamment par la possibilité de faire interférer une molécule avec elle-même, dans des conditions où elle présente un caractère ondulatoire. Un autre comportement bizarre des probabilités quantiques est illustré par les inégalités de Bell [3]. Celui-ci a montré que, si des grandeurs physiques satisfont à certaines hypothèses, dites de « réalisme local », d’apparence intuitive, il existe des bornes sur leurs corrélations. Considérons d’abord quatre variables aléatoires classiques A, B, A’, B’ susceptibles de prendre les valeurs +1 ou –1 et régies par une loi de probabilités ordinaire ; celle-ci engendre des corrélations. Nous désignerons ici par « corrélation » de A et B l’espérance E(AB) de leur produit. Les combinaisons A (B–B’) ± A’ (B +B’) peuvent prendre les seules valeurs +2 ou –2 (avec certaines probabilités). Leurs espérances sont donc 8 comprises entre +2 et –2, de sorte que les corrélations de ces variables aléatoires doivent satisfaire aux inégalités –2 ≤ E(AB) – E(AB’) ± E(A’B) ± E(A’B’) ≤ +2. Supposons cependant que A, B, A’, B’ désignent des observables ayant pour valeurs propres +1 et –1 ; alors, ces inégalités peuvent être violées par les corrélations quantiques entre grandeurs physiques. Par exemple, nous avons vu qu’une composante Su du spin S d’une particule avait deux valeurs propres opposées, +h/4π et – h/4π. Soit donc A et A’ deux composantes du vecteur 4π S/h dans des directions différentes. Chacune de ces observables peut individuellement prendre les valeurs +1 ou –1, mais elles ne commutent pas. Soit de même B et B’ deux composantes du spin S’d’une autre particule ; considérons les corrélations de A et B, de A et B’, de A’ et B, de A’ et B’, grandeurs qui commutent. Dans ces conditions, la combinaison de corrélations E(AB) –E(AB’) + E(A’B) + E(A’B’) peut déborder de l’intervalle –2, +2 ci-dessus, et prendre des valeurs allant de –2√ 2 à +2√ 2. Cette violation d’inégalités qui seraient satisfaites en théorie classique des probabilités a été mise expérimentalement en évidence. Elle a de profondes conséquences philosophiques, qui font encore l’objet de controverses. Il est clair que l’on ne peut utiliser le raisonnement courant et les probabilités ordinaires pour décrire les quatre observables A, B, A’, B’. Selon l’interprétation la plus courante, on est conduit à accepter l’idée que pour un objet donné les grandeurs physiques n’ont pas des valeurs bien définies qui seraient indépendantes de l’acte d’observation. De fait, les composantes A et A’ d’un spin, qui ne commutent pas, nécessitent pour être mesurées des expériences différentes sur des objets différents, de sorte que les quatre espérances E(AB), E(AB’), E(A’B) et E(A’B’) ne peuvent être déterminées dans un cadre unique. L’intrusion de probabilités en théorie quantique ne signifie pas simplement que nous connaissons mal les grandeurs microscopiques, mais que celles-ci sont intrinsèquement indéterminées et dépendent du contexte expérimental permettant de les tester. L’étrange paradoxe GHZ Ces conclusions contre-intuitives sont encore renforcées par le paradoxe GHZ [4]. Nous allons présenter l’une des versions de ce paradoxe. Considérons un système faisant intervenir six observables A1, A2, A3, B1, B2, B3. Pour notre propos, il suffira ici de préciser les propriétés algébriques de celles-ci sans spécifier leur signification physique ; dans la réalité, on peut réaliser ces propriétés par exemple à l’aide d’un ensemble de trois spins [5]. Chacune des observables Aj ou Bj (j=1, 2 ou 3) a un carré égal à l’unité (Aj²=Bj²=1). Par suite, elle n’a que deux valeurs propres, +1 ou –1 : la valeur numérique a1 prise, par exemple, par A1 dans un état arbitraire est un nombre aléatoire qui vaut soit +1 soit –1. Les observables Aj 9 commutent entre elles (Aj Ak = Ak Aj), ainsi que les Bj (BjBk = BkBj). De plus, les observables Bj ne sont pas indépendantes ; elles satisfont à B1B2B3 ≡1, c'est-à-dire que B3 est identique au produit B1B2. Les observables Aj et Bj commutent aussi (Aj Bj = Bj Aj). Enfin, pour j≠k, Aj et Bk ne commutent pas : ils satisfont à Aj Bk = – Bk Aj. Ayant ainsi précisé la table de multiplication des observables d’intérêt Aj et Bj, on note que les nouvelles observables Cj définies par Cj≡ Aj Bj = Bj Aj commutent entre elles [6]. Ces trois observables, qui ont encore pour valeurs propres +1 et –1, sont donc compatibles, de sorte que l’on peut, comme on l’a indiqué plus haut, préparer le système considéré dans un état où des valeurs bien définies, +1 ou bien –1, sont assignées à chacune des observables C1, C2 et C3. Considérons donc l’état |Ψ> du système où C1, C2 et C3 prennent avec certitude les valeurs c1= +1, c2= +1 et c3= +1. On peut montrer que ces trois conditions définissent un état unique [7]. Comme tout état quantique, cet état |Ψ> est probabiliste, d’autres grandeurs physiques que les Cj pouvant être aléatoires. Le système que décrit |Ψ> doit être regardé comme un échantillon extrait d’un ensemble statistique de systèmes tous préparés de la même façon, identiques, mais dont les grandeurs physiques peuvent présenter des dispersions en raison de leur non commutation. En particulier, chacune des observables Aj et Bj est dans cet état totalement aléatoire : elle prend les valeurs +1 et –1 avec la probabilité ½ [8]. Cependant, A1 et B1 sont complètement corrélées dans l’état |Ψ>, puisque C1≡A1B1 y prend avec certitude la valeur +1. Il n’existe donc que deux choix pour les valeurs possibles a1 et b1 de A1et B1 : a1=b1= +1 et a1=b1= –1, de sorte que dans l’état considéré |Ψ> du système, les valeurs de a1 et b1 sont toujours égales. Cette propriété peut être considérée comme « vraie ». On peut la vérifier expérimentalement en mesurant simultanément A1et B1, ce qui est permis puisque ces deux observables commutent. De même, on peut affirmer que dans l’état |Ψ> les valeurs a2 et b2 de A2 et B2, les valeurs a3 et b3 de A3 et B3 sont égales. Par ailleurs, l’identité de B3 et de B1B2 implique que les valeurs aléatoires b1, b2 et b3 prises par B1, B2 et B3 satisfont en toutes circonstances à l’égalité b1b2b3 = +1. Ici encore, le fait que B1, B2 et B3 commutent permet de vérifier expérimentalement cette propriété. S’appuyant sur les égalités a1=b1, a2=b2, a3=b3 et b1b2b3 = +1, dont chacune est vérifiable, il est tentant d’inférer que les valeurs a1, a2, a3 que peuvent prendre A1, A2 et A3 dans l’état |Ψ> satisferaient à a1a2a3 = +1. Mais cette conclusion naïve est en contradiction avec les lois de la mécanique quantique ! En effet, l’emploi des règles d’algèbre ci-dessus permet de démontrer [9] l’identité C1C2C3 = –A1A2A3 entre observables. La physique 10 quantique conduit donc à prévoir que, dans l’état |Ψ> caractérisé par c1=c2=c3= +1, les valeurs aléatoires +1 ou –1 de a1, a2 et a3 sont corrélées de telle sorte que a1a2a3 = –1, et non +1. La commutativité de A1, A2 et A3 autorise leur mesure simultanée, et l’on peut donc tester cette prévision. Des expériences cruciales de ce type ont été effectuées ; elles confirment le résultat quantique bien que celui-ci semble contraire au sens commun. (Elles sont cependant plus délicates et moins indiscutables que celles qui permettent de tester la violation des inégalités de Bell.) En définitive, ce paradoxe GHZ se présente comme un défi à la logique. Ayant préparé, par contrôle des observables Cj, le système dans l’état |Ψ> où les cj valent +1, on prévoit avec certitude que a1=b1, a2=b2, a3=b3≡b1b2 et a1a2a3 = –1. Bien qu’elles apparaissent comme contradictoires, ces quatre propositions peuvent être vérifiées par des expériences portant sur des systèmes identiquement préparés dans l’état |Ψ>. En admettant que les aj et bj se comportent comme de variables aléatoires classiques pouvant prendre les valeurs +1 ou –1, on déduirait des trois premières non la quatrième mais son contraire a1a2a3 = +1. Mais en physique quantique cette identification d’observables à des variables aléatoires ordinaires n’est licite que si elles commutent. Or, les observables B1 et A2, par exemple, ne commutent pas, de sorte les règles de la physique quantique interdisent de les déterminer simultanément. Aucun dispositif ne permet de tester à la fois les deux égalités a1=b1 et a2=b2 sur un système unique : il est nécessaire d’opérer sur deux systèmes, préparés dans le même état |Ψ>, mais distincts. On est ainsi amené à mettre en cause le concept de véracité d’un ensemble d’assertions quantiques. Chacune des propositions a1=b1, a2=b2, a3=b3≡b1b2, a1a2a3 = –1, prise séparément, donne lieu à des prévisions fiables, testables expérimentalement, et peut donc être considérée comme « vraie ». Mais il est interdit de les combiner : on doit accepter l’idée qu’une paire de propositions quantiques comme a1=b1 et a2=b2, paire qui fait intervenir les valeurs des observables incompatibles B1 et A2, n’a aucun sens. L’impossibilité d’une mesure simultanée de celles-ci implique l’interdiction d’englober dans un même raisonnement leurs valeurs b1 et a2. On n’a pas le droit en mécanique quantique de considérer comme simultanément « vraies » deux assertions qui ne peuvent être simultanément vérifiées par l’expérience, ni d’en tirer des conclusions logiques – même si elles sont séparément « vraies ». Il faut admettre que « vrai » s’identifie à « expérimentalement vérifiable », de sorte que des propositions séparément vraies peuvent ne pas être conjointement vraies. Cette constatation relativise la validité des assertions quantiques, dont il nous faut admettre le caractère uniquement contextuel. Dans l’état |Ψ>, on prévoit à la fois que a1=b1 et 11 que a1= –a2a3. Mais la première égalité ne vaut que dans un contexte où l’on cherche à déterminer A1 et B1, alors que le contexte de la seconde est celui de la détermination de A1, A2 et A3. Ces deux prévisions sur a1 ne prennent leur sens que dans le cadre de l’une ou l’autre des deux mesures ; il faut considérer que la combinaison d’égalités concernant des contextes différents n’a pas de signification physique. Dans cette perspective, la contradiction entre a1=b1, a2=b2, a3=b3≡b1b2 et a1a2a3 = –1 n’est qu’apparente. Plus clairement encore que les relations d’incertitude ou la complémentarité, la violation des inégalités de Bell aussi bien que le paradoxe GHZ mettent en question l’adéquation au monde réel du concept de valeur prise par une grandeur physique. La description fournie par la mécanique quantique étant irréductiblement probabiliste, ses prévisions présentent un caractère partiellement subjectif, relatif aux opérations que nous allons faire subir à l’objet. Or, certaines de ces opérations, comme la détermination des valeurs d’observables incompatibles, sont irréalisables. Les valeurs que nous attribuons aux grandeurs physiques, avec une probabilité déterminée (et éventuellement avec certitude), ne constituent donc pas des propriétés de l’objet en soi. Il s’agit de valeurs latentes, qui n’émergeront dans le réel que lors d’une mesure, processus d’interaction entre l’objet et un appareil. L’état quantique que nous attribuons à un système (ou plus précisément à un ensemble statistique de systèmes semblables) est un outil nous permettant de faire toutes les prévisions imaginables. Il décrit en fait non seulement le système, mais son devenir lorsqu’on le fera interagir avec un autre système, en particulier un appareil de mesure. Etant donné que des mesures d’observables incompatibles couvrent des réalités distinctes bien qu’elles portent sur des objets identiques, ce que nous appelons « état du système » est un objet mathématique sans interprétation réaliste directe, le système lui-même devant être pensé dans son contexte expérimental. Comme l’a écrit Asher Peres, « unperformed experiments have no results » La précision et la généralité de la mécanique quantique, son accord jamais démenti avec l’expérience, en font la base de la physique contemporaine. Il s’agit cependant d’une théorie étrange. Elle ne met pas seulement à mal l’intuition quotidienne par la nécessité d’utiliser un langage mathématique, mais va jusqu’à défier l’intuition mathématique élémentaire. Ainsi, la manipulation des grandeurs physiques microscopiques nécessite l’emploi d’une algèbre non commutative et non de multiplications ordinaires. Des nombres complexes s’introduisent dans le formalisme, bien que les grandeurs physiques ne prennent que des valeurs réelles. La géométrie elle-même est bousculée, comme le montrent les propriétés des composantes d’un spin. Bien que la mécanique quantique constitue un parfait 12 outil de prévision, elle ne fournit que des probabilités, rarement des certitudes. Pourtant ces probabilités quantiques diffèrent de celles qui sont enseignées dans les cours de mathématiques ; elles violent par exemple les inégalités de Bell. Pis encore, comme nous venons de le voir, le raisonnement courant est malmené pour des assertions faisant intervenir les valeurs de plusieurs grandeurs physiques non mesurables simultanément. Ces valeurs ne doivent pas être considérées comme une image directe du réel, mais comme des informations dont nous disposons sur les objets. La levée des contradictions a ainsi des implications épistémologiques : notre description quantique et les prévisions auxquelles elle conduit ne portent pas sur des objets en soi, car il nous est interdit de faire abstraction de la possibilité de leur observation. [1] Le lecteur ayant besoin de se familiariser avec la notion de commutativité d’un produit pourra se livrer au petit exercice suivant. Considérons un dé, posé initialement avec le 1 sur sa face horizontale supérieure, le 2 sur sa face verticale antérieure. Effectuons successivement l’opération A, qui consiste à faire faire au dé un demitour autour de son axe vertical, et l’opération B, rotation d’un demi-tour autour de l’axe horizontal joignant les faces antérieure et postérieure. La succession de ces deux rotations est encore une rotation, qui va être considérée comme le produit de A par B. Nous voyons que le résultat obtenu (le 1 sur la face inférieure, le 2 sur la face postérieure) est le même quel que soit l’ordre dans lequel ces deux rotations ont été effectuées : les opérations A et B commutent. Recommençons maintenant, mais avec des rotations A’ et B’ d’un quart de tour dans le sens des aiguilles d’une montre. Cette fois, selon que nous procédons dans l’ordre A’ puis B’, ou dans l’ordre B’ puis A’, nous ne trouvons pas le même résultat. (Dans le premier cas, le 1 va sur la face de droite, le 2 sur la face supérieure ; dans le second, le 1 va sur la face antérieure, le 2 sur la face de gauche.) L’ordre des opérations A’ et B’ n’est pas indifférent, ce qui signifie que leur produit, qui représente la succession des deux opérations, n’est pas commutatif : A’B’ ≠ B’A’. Les observables de la mécanique quantique se comportent comme des opérations de ce genre ; l’ordre des facteurs d’un produit d’observables joue le même rôle que l’ordre dans lequel on effectue des opérations. [2] La démonstration repose sur la positivité, quel que soit le nombre réel ξ, de la valeur moyenne E[(ξA’+iB’)(ξA’– iB’)], où A’≡A–E(A), B’≡B–E(B). Il en résulte, en utilisant les expressions de ∆A², ∆B² et C, que ∆A²ξ² +2E(C) ξ+ ∆B² est positive ou nulle pour tout ξ, ce qui s’exprime par E(C)²– ∆A²×∆B²≤0. [3] Bell J.S. (1964) On the Einstein Podolsky Rosen paradox. Physics 1 : 195-200 ; Clauser J.F., Horne M.A., Shimony A., Holt R.A. (1969) Proposed experiment to test local hidden-variable theories. Phys. Rev. Letters 23 : 880-884. 13 [4] Greenberger D.M., Horne M.A., Shimony A., Zeilinger A. (1990) Bell’s theorem without inequalities. Amer. J. Phys. 58 : 1131-1143. [5] Si l’on représente les trois composantes du moment cinétique d’un spin S par les observables σx, σy, σz à l’aide du changement d’unité S=(h/4π)σ, les règles de multiplication de σx, σy, σz en physique quantique sont données par σx²= σy²= σz²=1, σxσy= – σyσx= iσz ; ces dernières relations mettent en évidence une non commutation. Pour trois spins S(j) (j=1, 2 ou 3), les observables associées à des spins différents commutent, par exemple σ(1)xσ(2)y = σ(2)yσ(1)x. En identifiant l’observable A1 à σ(1)x, l’observable B1 à σ(2)yσ(3)y, et de même par permutation circulaire, on vérifie que les Aj et Bj satisfont aux propriétés de multiplication énoncées dans le texte. [6] Les propriétés Aj Bj=Bj Aj et Aj Bk=–Bk Aj (j≠k) des produits impliquent par exemple que C1C2=A1B1A2B2= – A1A2B1B2= – A2A1B2B1=A2B2A1B1= C2C1. [7] Dans la représentation standard pour un spin, où |+> et |–> désignent les états propres de σz associés respectivement à ses valeurs propres +1 et –1, cet état de trois spins a la forme |Ψ>= (|+ + +> – |– – –>)/√ 2. [8] Pour A1, par exemple, on note d’abord, compte tenu des règles de multiplication, que A1C2+C2A1=A2(A1B2+B2A1) = 0. Il en résulte que, dans l’état |Ψ> où C2 vaut +1, la valeur moyenne E(A1) de A1 est nulle puisque 2E(A1) =E(A1C2+C2A1) = 0. Les valeurs possibles de a1 étant +1 et –1, leurs probabilités sont donc égales à ½. [9] Le détail du calcul est le suivant : C1C2C3 = A1B1A2B2A3B3 = –A1A2B1B2A3B3 = +A1A2B1A3B2B3= – A1A2A3B1B2B3= –A1A2A3.