MA PHYSIQUE (TROISIEME EDITION) Giorgio Margaritondo Volume 2: Partie III - ELECTROMAGNETISME Partie IV - PHYSIQUE DU MONDE MICROSCOPIQUE “Ma Physique” Troisième partie: Electromagnétisme et optique Giorgio Margaritondo: Ma Physique 226 Table des matières Page XL. Le début de l’électromagnétisme XL.1. La nécessité des forces électromagnétiques XL.2. Une petite note pour les philosophes. XL.3. Les épouvantables dimensions de l’équilibre XLI. L’idée de champ XLII. La loi de Gauss XLII.1. La forme locale de la loi de Gauss XLIII. La théorie de l’électrostatique et le potentiel XLIII.1. Le potentiel électrostatique XLIII.2. Relation potentiel-champ: équations de Poisson et de Laplace XLIII.3. Enfin, un peu de saine pratique XLIV. Electrostatique des conducteurs: les condensateurs XLIV.1. Les cavités conductrices XLIV.2. Condensateurs XLIV.3. Condensateurs en série et condensateurs en parallèle XLIV.4. Energie du champ électrostatique XLV. Les courants stationnaires XLV.1. L’effet Joule XLV.2. Résistances en série et en parallèle XLV.3. Force électromotrice XLV.4. Equation de continuité XLV.5. Lois de Kirchhoff XLVI. La magnétostatique: force de Lorentz XLVI.1. La relativité révèle le secret bien caché du champ magnétique XLVI.2. Les lois de la magnétostatique: formes non-locales XLVI.3. Les lois de la magnétostatique: formes locales XLVI.4. Le champ magnétique d’un courant stationnaire sur un fil droit XLVI.5. Spires et solénoïdes XLVI.6. Equivalence spire-aimant XLVII. Les phénomènes d’induction XLVII.1. La loi de l’induction: s’agit-il réellement d’une nouveauté? Loi de Lenz XLVII.2. La loi de l’induction: forme locale, alternateurs XLVII.3. Induction mutuelle et self-induction XLVII.4. L’énergie emmagasinée par un champ magnétique XLVII.5. Le transformateur XLVIII. Les circuits électriques XLVIII.1. Les courants et les tensions sinusoïdaux: pourquoi sont-ils importants? XLVIII.2. Les instruments mathématiques les plus efficaces XLVIII.3. Les impédances XLVIII.4. Le circuit RLC série XLVIII.5. La puissance dissipée XLVIII.6. La tension triphasée XLVIII.7. Quelques mots sur le concept de réponse d'un système physique XLIX. Le champ électrique dans la matière XLIX.1. Susceptibilité et constante diélectrique relative XLIX.2. Vecteur déplacement électrique XLIX.3. Changements de E et de D aux interfaces: mesure de E dans les diélectriques XLIX.4. Les mécanismes microscopiques de la polarisation L. Le magnétisme dans la matière L.1. Les lois du magnétisme dans la matière et le champ magnétique H L.2. Changements de B et de H aux interfaces: mesures dans les matériaux 228 228 229 231 234 239 242 251 253 254 255 259 261 262 264 264 267 270 270 271 272 273 276 277 279 281 282 282 288 292 293 294 296 298 300 303 305 307 310 312 314 314 315 318 320 321 322 325 329 331 331 Giorgio Margaritondo: Ma Physique L.3. Le magnétisme dans la matière: analyse microscopique L.4. Le ferromagnétisme L.4.1. Hystérèse magnétique L.4.2. Domaines ferromagnétiques LI. Les ondes électromagnétiques LI.1. Le courant de déplacement LI.2. Les équations de Maxwell LI.3. Les équations des ondes électromagnétiques et leur propriétés LI.4. Interprétation physique: la propagation d’énergie LI.5. La quantité de mouvement des ondes électromagnétiques LI.5.1. La pression du rayonnement Appendice: le corps noir et la physique quantique LII. Ondes sinusoïdales: fréquence, longueur d’onde, spectre électromagnétique LII.1. Le spectre des ondes électromagnétiques LII.2. Ondes planes et ondes sphériques LIII. Interférence et diffraction LIII.1. Le “principe” de Huyghens et Fresnel LIII.2. Interférence de deux fentes LIII.3. La diffraction causée par une fente: la cohérence LIII.4. Les réseaux de diffraction LIV. Réflexions sur la vitesse de la lumière LIV.1. La mesure de la vitesse de la lumière LIV.2. La lumière et la relativité LIV.2.1. L’effet Doppler relativiste pour les ondes électromagnétiques LIV.2.2. L’effet Doppler des ondes non-relativistes LIV.2.3. L’onde de “choc” LIV.3. Vitesse de phase et vitesse de groupe LIV.3.1. Les battements LIV.3.2. La vitesse de groupe LV. Réfraction, dispersion et réflexion; “principe” de Fermat LV.1. La réflexion LV.2. Le “principe” de Fermat LVI. Les équations de Fresnel et la polarisation de la lumière LVI.1. La polarisation LVI.1. 1. Les polariseurs LVI.1.1.1. La biréfringence LVII. Optique géométrique LVII.1. Les miroirs sphériques: images réelles et virtuelles, grandissement LVII.2. Réfraction par une superficie sphérique LVII.3. Les lentilles minces LVII.4. Les aberrations LVII.5. L’oeil LVII.6. Le microscope LVII.7. Le télescope astronomique LVIII. Interaction de la lumière avec la matière LVIII.1. Emission LVIII.2. Emission par un dipôle oscillant LVIII.3. L’absorption, la diffusion et la loi de Rayleigh LVIII.4. Le coefficient d’absorption LIX. Autres types de phénomènes ondulatoires LIX.1. Ondes longitudinales LIX.2. Ondes acoustiques: équation de Newton LIX.3. Notions pratiques d'acoustique LIX.3.1. La fréquence des ondes acoustiques LIX.3.2. Les limites d'audibilité 227 332 336 337 340 343 344 346 347 352 354 355 356 359 360 361 364 364 365 368 371 376 376 377 378 379 380 381 383 384 387 389 390 393 395 397 398 402 402 406 409 410 411 412 414 416 416 418 419 421 424 424 426 427 428 431 Giorgio Margaritondo: Ma Physique 228 XL. Le début de l’électromagnétisme Arrivés au terme de notre discussion sur la physique statistique des systèmes réels, nous sommes maintenant prêts à passer à la deuxième partie du cours de physique: celle qui s’occupe de l’électromagnétisme. Puisque nous devrons travailler beaucoup pour arriver à maîtriser l’électromagnétisme, essayons d'abord de comprendre l’importance de cette branche de la science. La mécanique nous a donné les moyens de comprendre la relation entre les forces et le comportement de systèmes simples tels que les masses ponctuelles. La physique statistique et la thermodynamique nous ont expliqué cette même relation pour des systèmes compliqués tels que les gaz et les solides réels. On parle donc toujours de forces et de leurs effets. Mais en fait, quelles sont les forces en action dans notre univers? Après plusieurs siècles de progrès, qui a conduit à quelques résultats fondamentaux au cours des vingt années dernières, la physique est en mesure de traiter tous les phénomènes connus en faisant intervenir trois types de forces seulement: • Les forces de gravitation entre les masses, • Les forces nucléaires “fortes”, • Les forces unifiées électromagnétiques et nucléaires “faibles”. Ce dernier groupe comprend deux types de forces, dont le caractère commun a été récemment démontré par le travail d’importance historique de l’équipe de M. Carlo Rubbia au CERN à Genève. Il comprend, en particulier, tous les phénomènes de type électrique et magnétique. La plupart des systèmes d’importance technologique sont gouvernés par les forces électromagnétiques. Elles donnent, par exemple, deux catégories d’effets qui forment la base de la technologie moderne: • L’existence des atomes et des liaisons chimiques entre les atomes; • L’existence des ondes électromagnétiques, qui comprennent une grande série de phénomènes fondamentaux tels que la lumière, les ondes radio, les rayons x, ultraviolets et infrarouges, etc. Notre programme d’électromagnétisme comprend deux parties: la première est consacrée à la clarification des règles qui gouvernent les forces électromagnétiques et leur manière de fonctionner. Cette partie sera terminée lorsque nous arriverons à comprendre les cinq équations qui résument tout l’électromagnétisme: les quatre équations de Maxwell et la loi de Lorentz. La deuxième partie utilisera ces mêmes équations pour en dériver l’existence des ondes électromagnétiques et de leurs propriétés, et arriver ensuite à des applications pratiques, par exemple à l’optique. XL.1. La nécessité des forces électromagnétiques L’existence même de systèmes stables tels que les atomes, les molécules et les solides nous révèle l'une des propriétés fondamentales des forces électromagnétiques: elle Giorgio Margaritondo: Ma Physique 229 doivent agir sur deux types différents d’objets, qu’on appelle “charges électriques positives” et “charges électriques négatives”. Par contre, on ne connaît qu’un type d’objets qui soit soumis aux forces de gravitation: les masses, qui ne peuvent être que positives. Pourquoi deux types de charges? Essayons de répondre en analysant la stabilité d’une molécule. Il est évident qu’on ne pourrait pas construire une molécule stable à l’aide des forces de gravitation, puisque ce type de forces ne produit que des attractions entre les masses. Elles tendent toujours à diminuer la distance entre les masses, ce qui ne permet pas d’arriver à des distances d’équilibre entre les atomes d’une molécule. Pour arriver à l’équilibre, on a besoin d’atteindre un bilan nul des forces, et donc tant de forces d’attraction que de forces de répulsion. Si vous prenez par exemple la force électrostatique entre deux charges électriques ponctuelles q et Q, vous constatez qu’elle suit une loi similaire à celle de la force de gravitation entre deux masses ponctuelles m et M. Celle-ci est la loi de Newton (Eq. 9, dans sa forme vectorielle): f=-G mM ^ r, r2 (301) où ^ r est le vecteur unité qui donne la direction des deux masses ponctuelles, c’est-à-dire un vecteur du type “position”, dont la direction est celle qui relie les deux masses, et la grandeur unitaire; r est la grandeur de la distance des deux masses, et G est une constante universelle qu’on appelle la constante de gravitation. De manière similaire, la force entre les deux charges est donnée par la loi de Coulomb: 1 qQ f = 4πε 2 ^ r, o r (302) où (1/4πε o ) est une constante de proportionnalité, caractérisée par la constante diélectrique du vide, εo ≈ 8,9 × 10-12 C2/m2N. A noter que les charges électriques dans le système SI sont mesurées en coulombs (C). Remarquons la différence entre les deux équations 301 et 302. Dans le premier cas, nous n’avons à droite que des quantités positives (distances carrées, masses et constante G); donc la force ne peut qu’avoir le signe négatif, qui correspond à l’attraction des deux masses. Par contre, si nous admettons qu’il existe des charges tant positives que négatives, l’équation 302 peut donner des forces négatives (attraction) si les deux charges ont des signes opposés, ou positives (répulsion) si elles ont le même signe. Donc, tant la répulsion que l’attraction électrostatique sont possibles, et par conséquent peuvent donner un équilibre des forces de ce type: cette simple conclusion est à la base de la stabilité des atomes et de leurs liaisons chimiques, par exemple de la stabilité des liaisons chimiques d’une molécule. XL.2. Une petite note pour les philosophes C'est à dire qu’il s’agit d’une note que les lecteurs enclins au matérialisme peuvent se permettre de négliger, puisqu’elle n’a aucune conséquence sur les examens propédeutiques de physique. Giorgio Margaritondo: Ma Physique 230 Cette note concerne le conflit de base qui existe entre les deux effets fondamentaux de l’électromagnétisme, c’est-à-dire la stabilité (par exemple des atomes) et l’existence d'ondes électromagnétiques. Ce conflit ne peut pas être résolu par la théorie classique de l’électromagnétisme, mais par cette partie de la physique moderne qu’on appelle mécanique quantique. Une molécule de CH4 : on ne pourrait justifier ni son existence ni sa stabilité sans invoquer tant des forces d’attraction que des forces de répulsion entre les charges électriques. Pourquoi y a-t-il conflit? Imaginez un modèle simple d’atome, par exemple l’atome d’hydrogène selon Bohr, avec un seul proton (charge positive +e ≈ 1,6 × 10-19 C, qui forme le noyau) et un seul électron (charge négative -e, masse m) en rotation. Vous pouvez bien comprendre que l'électron d’un atome stable de ce type doit toujours être en mouvement, afin d’atteindre l’équilibre de la force centrifuge, dont la grandeur est mv2/r, v étant la vitesse de rotation, et de la force d’attraction électrostatique, dont la grandeur selon l’Eq. 302 est (1/4πεo)(e2/r2). L’équilibre donne mv2/r = (1/4πεo)(e2/r2) et donc v = e/√ 4πεomr . L’énergie cinétique de cette rotation est mv2/2 = e2/(8πεor), et la grandeur p de sa quantité de mouvement est 4πεor/m . p =mv = e/√ (303) Imaginez, d’autre part, une source d’ondes électromagnétiques, par exemple une antenne radio: nous verrons que l’émission est causée par le changement de la vitesse des charges sur l’antenne, c’est-à-dire par leur accélération. Nous verrons également que les ondes radio transportent de l’énergie, et donc leur émission implique le passage d’énergie des émetteurs (les charges accélérées) aux ondes. Sans une source d’énergie de l’extérieur, ce passage conduit à une diminution de l’énergie cinétique des charges, et enfin à la cessation de leur mouvement. Mais l’électron de l’atome d’hydrogène est lui aussi une charge accélérée: il a une accélération centripète donnée par le mouvement de rotation. Donc, il devrait être forcé à émettre des ondes électromagnétiques, diminuer son énergie de rotation et enfin disparaître dans le noyau! Cette prévision est évidemment en conflit avec la réalité, qui nous montre des atomes bien stables, par exemple ceux de notre corps. Ce mystère, comme nous l'avons vu, ne peut être résolu que par la mécanique quantique. La solution se trouve essentiellement dans le principe d’indétermination de Heisenberg. Si les électrons en équilibre dans un atome émettaient réellement des ondes électromagnétiques, leur détection nous fournirait une manière de révéler le mouvement des électrons et de mesurer la grandeur de leur quantité de mouvement. D’autre part, le principe d’indétermination ne nous permet pas de mesurer des Giorgio Margaritondo: Ma Physique 231 quantités de mouvement trop faibles si le système est trop localisé dans l’espace; par exemple, il ne nous permet pas de mesurer la grandeur de la quantité de mouvement d’un électron en rotation dans un endroit aussi localisé qu’un atome. Plus spécifiquement, la grandeur minimum ∆p de la quantité de mouvement qu’on peut mesurer et la localisation spatiale correspondante de l’électron ∆x sont liées selon le principe d’indétermination par la relation ∆p ∆x ≈ h, où h est une constante. En prenant les grandeurs d’un atome d’hydrogène, ∆x est approximativement sa dimension dans l'espace, r ≈ 10-10 m, et en supposant ∆p ≈ p = e/\R(4πεor/m ) ≈ (1,6 × 10-19)/\R(4π × 9 × 10-12 × 10-10/9 × 10-31 ), dont l’ordre de grandeur est de 10-24 kg m/s. Donc, h = ∆p ∆x est de l’ordre de grandeur de 10-10 × 10-24 = 10-34 joule/s. Avez-vous déjà rencontré cet ordre de grandeur? Eliminez de votre matière grise la poussière qui a recouvert la loi de l’émission du corps noir, et vous constaterez qu’il s’agit de l’ordre de grandeur de notre vieille amie la constante de Planck! Voilà donc que nous avons découvert un autre aspect de cette constante si importante: elle correspond à une limite fondamentale des mesures en physique, et de plus elle nous permet de comprendre le secret de la stabilité de l’univers! Cette parenthèse philosophique terminée, les matérialistes sont fortement priés de se réveiller, car ce qui suit risque bien de se retrouver aux examens. XL.3. Les épouvantables dimensions de l’équilibre Nous reprenons notre discussion matérialiste à partir de la loi de Coulomb, Eq. 302: 1 qQ f = 4πε 2 ^ r, o r afin de discuter deux points. Premièrement: quelle raison avons-nous d’écrire cette loi avec une constante compliquée, (1/4πεo), au lieu d'utiliser une constante plus simple telle que G dans l’Eq. 301? Charles Augustin de Coulomb, pionnier de l’électrostatique. La réponse est que le rapport entre la superficie d’une sphère et son rayon est malheureusement donné par un nombre entier multiplié par π, ce qui nous force à utiliser une constante compliquée telle que (1/4πε o ) pour la loi de Coulomb. Plus précisément, on ne peut pas simplifier la constante de la loi de Coulomb sans être forcé à compliquer la loi de Gauss, que nous discuterons prochainement. Entre les deux, la loi de Gauss joue un rôle plus fondamental, et donc on préfère la garder sous sa forme simple. Giorgio Margaritondo: Ma Physique 232 Deuxième point: réalisez-vous quel miracle d’équilibre des charges électriques vous trouvez dans votre corps -- ou dans tous les objets autour de nous? Voyons: dans la partie du cours consacrée à la thermodynamique, nous avons estimé que le “volume” occupé par un atome est de l’ordre de (10-10)3 = 10-30 m3, et par conséquent dans 1 m3 de solide on trouve un nombre d’atomes de l’ordre de grandeur de 1/10-30 = 1030. Le volume de votre corps est de l’ordre de 0,1-0,2 m3, et donc vous possédez 1029 atomes environ. Chacun de vos atomes a des protons et des électrons, qui se neutralisent réciproquement en donnant une charge électrique nulle. Mais supposons que vous et votre voisin/e (selon votre préférence) êtes affectés par une fluctuation, et que 1% de vos atomes se trouve pourvu d'une charge équivalente à celle d’un électron, -1,6 × 10-19 coulomb. Cela donne tant à vous qu’à votre voisin/e une charge totale de l’ordre de 0,01 × 1029 × (-1,6 × 10-19) ≈ 2 × 108 coulomb. Et donc, une force de répulsion entre vous deux, dont la grandeur est donnée approximativement par la loi de Coulomb, Eq. 302 (approximativement parce que vous n’êtes pas vraiment des charges ponctuelles); à 1 m de distance, vous avez ≈ (1/(4 × 3 × 9 × 10-12))(108 × 108)/12 ≈ 1028 N, c’est-à-dire une répulsion équivalente à un milliard d’un milliard d’un milliard de kilos: vraiment monstrueuse, et certainement pas justifiable même par rapport à la personne la plus dégoûtante du monde (telle que votre professeur de physique lorsqu’il est en train de préparer votre examen propédeutique). Une très petite fraction de cette force à elle seule suffirait à nous détruire de manière instantanée; nous sommes forcés de conclure que l’équilibre des charges de nos atomes doit fonctionner à un niveau presque incroyable: cela principalement grâce au mécanisme de formation des atomes et des liaison chimiques. Le Coin Yankee: Forces nucléaires faibles Forces nucléaires fortes Forces électromagnétiques Forces de gravitation Forces électrostatiques Charge électrique Constante diélectrique Weak nuclear forces Strong nuclear forces Electromagnetic forces Gravitational forces Electrostatic forces Electric charge Dielectric constant “Therefore, both the electrostatic attraction and the electrostatic repulsion are possible, and the equilibrium of this kind of forces: this simple conclusion is the foundation of the stability of atoms and of their chemical bonds, for example the stability of the chemical bonds in a molecule.” Le coin des unités et des ordres de grandeur: Charge électrique Unités SI C (coulomb) Autres unités Giorgio Margaritondo: Ma Physique ε o (constante diélectrique du vide) 233 C 2 /m 2 N (équivalente à farad/m) Ordres de grandeur: ε o ≈ 8,86 × 10-12 farad/m; la charge d’un électron est e ≈ - 1,6 × 10-19 C, et celle d’un proton a la même grandeur mais signe positif. Giorgio Margaritondo: Ma Physique 234 XLI. L’idée de champ La loi de Coulomb, Eq. 302, fournit une première solution aux problèmes de l’électrostatique, c’est-à-dire des systèmes de charges électriques qui ne sont pas en mouvement. La plupart de ces problèmes sont pourtant plus compliqués que celui des deux charges ponctuelles de la loi de Coulomb: pensez, par exemple, aux charges des électrons distribuées dans les liaisons chimiques. D’autre part, ces problèmes sont partiellement simplifiés grâce à une propriété fondamentale des forces électrostatiques: elles s'ajoutent les unes aux autres. Prenez par exemple le cas simple de la Fig. 90. (a) (b) q1 (c) q1 q2 q2 f1 q f2 q q f = f1 + f2 Fig. 90: Somme de deux forces électrostatiques causées par deux charges ponctuelles. Nous voyons dans cette figure: (a) une charge q soumise à la force f1 causée par la charge q1 (la charge q1 est soumise à une force symétrique -f1 causée par la charge q qui n’est pas montrée dans la figure); ensuite (b), la même charge q soumise à la force f2 causée par la charge q2. Notez que les deux forces sont des vecteurs. Enfin, nous voyons que la force combinée des deux charges q1 et q2 sur la charge q est la somme vectorielle f = f1 + f2. Cette propriété, dérivée des expériences et dite principe de superposition, est générale et valable pour n’importe quelle combinaison de charges. Dans le cas d’un ensemble de charges ponctuelles q1, q2, ..., qi, ..., sa force totale sur une autre charge ponctuelle q est donc: f = Σ i fi , (304) où fi est évidemment la force causée par la i-ème charge, et la somme doit être faite pour toutes les charges de l'ensemble. En utilisant la loi de Coulomb, nous trouvons que: qi q f = 4πε Σ i 2 ^r i . ri o (305) Giorgio Margaritondo: Ma Physique 235 Mais attention: si nous remplaçons maintenant la charge q avec une autre charge Q, la force de l’ensemble q1, q2, ..., qi, ..., sur Q peut être simplement calculé en remplaçant q avec Q dans l’Eq. 305, sans autre changement. Cela nous donne une idée: de ne pas dériver, chaque fois que nous changeons la charge, la force causée par l’ensemble, mais au contraire de définir la force E de l’ensemble sur une charge unitaire, et calculer ensuite la force sur une charge quelconque q en la multipliant par E: f = qE . (306) Cette équation est la définition de ce qu’on appelle le champ électrique, E, définition selon les règles de la physique: elle nous donne la manière de mesurer E, avec des mesures de force et de charge électrique. Il est indispensable de consacrer quelques mots à la clarification de cette idée de champ électrique, si importante dans l’électromagnétisme, surtout parce qu’on trouve souvent une grande confusion chez les étudiants -- à cause d’un instrument didactique que nous éviterons comme la peste: les “lignes de force”. Il s’agit d’une manière conventionnelle de représenter un champ sur le papier, à l’aide d’un joli dessin de lignes qui en donnent approximativement la direction. Cela produit effectivement des figures assez impressionnantes mais donne aussi, malheureusement, l’impression que les jolies lignes sont le champ. Oublions donc les figures avec lignes de force que vous pourriez avoir vues au gymnase, et essayons de comprendre l’idée de champ électrique d’une manière à la foi simple et rigoureuse. Tout d’abord, les mathématiques: on appelle un “champ” en géométrie toute fonction de la position dans l'espace, f(x,y,z). Cette idée fit son début en physique avant d’être appliquée à l’électromagnétisme: par example, dans l’hydrodynamique. On s’était aperçu qu'en prenant, par exemple, un tube avec de l’eau en mouvement stationnaire, les molécules d’eau passant par un certain point ont toutes la même vitesse. On peut donc définir une fonction v(x,y,z) comme étant la vitesse qui correspond à chaque point. Puisqu’elle est un vecteur, notre vitesse est un champ vectoriel, comme le champ électrique. L’idée de “champ” étant établie sur le plan des mathématiques, passons à la physique: nous avons déjà mentionné que la définition d’un champ en tant que quantité physique doit être basée sur la description de la manière de le mesurer. Donc, la définition donnée par l’équation 306 est parfaitement rigoureuse et complète: elle nous dit que pour mesurer un champ électrique à n’importe quel point (x,y,z), nous devons placer une charge q à ce même point, mesurer la force électrostatique qu’elle subit, et diviser le résultat, c’est-à-dire les trois nombres qui donnent les composantes du vecteur force, par la grandeur de la charge. C'est tout, mais vraiment tout! N’essayez pas de vous imaginer ce que le champ est “réellement”: il est - réellement - l'ensemble des nombres qui sont les résultats des mesures effectuées suivant l’Eq. 306. Il est nécessaire de discuter à ce point un problème délicat: le fait que la mesure peut influencer, c’est-à-dire changer, le champ même que nous essayons de mesurer. Le champ est causé par un ensemble de charges, dans des positions données dans l'espace. Lorsque nous plaçons la charge de mesure q au point (x,y,z), elle produit des forces électrostatiques sur les charges qui causent le champ, et peut changer leur position; Giorgio Margaritondo: Ma Physique 236 autrement dit, elle participe à la création du champ. Le champ qu’on mesure n’est pas vraiment celui causé par l’ensemble des charges qu’on souhaiterait étudier, mais le champ produit par cet ensemble plus la charge de mesure. Les mathématiciens/nes ont une jolie manière de se sortir d’un tel problème: ils/elles imaginent de faire des mesures avec des charges q de plus en plus petites, pour enfin passer à la limite de charge nulle, de manière que le champ donné par un ensemble isolé puisse être écrit: E = lim (f/q) . q→0 (307) Cette équation serait parfaitement acceptable pour un/e physicien/ne à l’exception d’une difficulté pratique. Cette difficulté ne provient pas de l’idée de limite: étant une personne pratique, il/elle sait que “passer à la limite” veut dire “utiliser une charge tellement petite que sa perturbation sur le champ n’est pas détectable, en considérant la précision qu’on souhaite”. Le problème est qu’il n’est pas possible de réduire la grandeur de la charge au-delà d’un minimum: il n’existe pas dans l’univers des charges plus petites que les charges de l’électron ou du proton! La limite de l’Eq. 307 ne peut pas être poussée au delà de ±e. Quelques-un/es d'entre vous sont probablement au courant de l’existence de charges encore plus petites que l’électron et le proton: il s’agit des charges des quarks, qui forment les particules appelées mesons ou hadrons, comme le proton. Mais, tandis qu'il a été établi que les quarks forment effectivement ces particules, nulle expérience n’a porté sur leurs observations comme particules libres, non engagées dans la formation d’une particule plus compliquée. La plupart des théoriciens pensent que les quarks ne sont pas en mesure de se séparer des particules qu’ils forment, et donc ne peuvent pas fournir des charges libres plus petites que l’électron ou le proton. En tout cas, même les quarks ne changeraient pas le problème de la définition du champ à l’aide de l’Eq. 307, puisque leurs charges, par exemple e/3, sont toujours plus grandes que zéro. On peut donc en conclure que les charges électriques sont toutes quantifiées, étant données par la combinaison de charges élémentaires, par exemple par la combinaison de charges protoniques et électroniques. Cette quantification, dont la cause n’a pas encore été suffisamment clarifiée par la physique théorique, implique que la définition de champ “produit par un système isolé de charges”est limitée: on ne peut pas réduire la perturbation du champ au-dessous de celle produite par une charge de mesure e ou -e. Notez pourtant que sans une manière de la mesurer, une quantité ne peut pas jouer de rôle en physique: pour la physique, elle n’existe pas. Et donc, notre champ “produit par un système isolé de charges” n’existe pas en pratique, parce qu’on ne peut pas le mesurer. Nous trouvons ici une des limites de l’idée de mesure: limites qui ont des conséquences profondes dans la science moderne, et même dans la philosophie. Avant de terminer notre discussion critique de l’idée de champ électrique, il est nécessaire de mentionner un dernier point important. Nous avons présenté l’idée de champ comme une idée pratique pour généraliser la description des forces électrostatiques causées par un ensemble de charges. Mais on a une autre raison d'introduire l'idée de champ: éviter les difficultés conceptuelles soulevées par la notion d'action à distance. Giorgio Margaritondo: Ma Physique 237 On peut comprendre ces difficultés en analysant la force électrostatique exprimée par la loi de Coulomb pour deux charges ponctuelles, Eq. 302. Nous avons dit que la première charge exerce une force sur la deuxième et vice versa: donc, nous avons admis que la première charge, qui se trouve à un certain point dans l’espace, est capable d’influencer le comportement d’un autre objet à un point distant. Cette idée peut créer des difficultés, parce que dans la vie de tous les jours nous observons plutôt les effets produits par des objets en contact. Supposons que vous souhaitez réveiller un ami: vous pouvez lui jeter des pierres, qui vont l'atteindre par contact direct, ou bien vous pouvez pousser des cris épouvantables, qui vont toucher les oreilles de votre victime par l’intermédiaire des molécules d’air perturbées par vos ondes sonores. On pourrait imaginer qu’une exception possible est l’utilisation d’une lumière intense pour toucher le visage de votre ami (qui ne le sera probablement plus après tout cela). Mais nous allons bientôt comprendre que même cette dernière hypothèse n’est pas vraiment une exception à la règle d’action par contact. L’idée de champ électrique nous permet de nous sortir des problèmes de l’action à distance: on peut dire, par exemple, que la première charge crée un champ partout dans l’espace, et que la force sur la deuxième charge est en réalité une action locale du champ sur celle-ci. Mais tout cela apparait pour l’instant un peu comme un jeu de mots. Ce “jeu” est pourtant plus fondamental qu’on peut l'imaginer: nous verrons que la relation entre le champ électromagnétique et ses causes - les charges et leur mouvement - a toujours un caractère local. N’oubliez pas ce caractère: nous le découvrirons dans toutes les équations décrivant les relations champ-causes! Nous commencerons cette découverte par le cas de la forme locale de la loi de Gauss, à discuter bientôt. Giorgio Margaritondo: Ma Physique 238 Le Coin Yankee: Principe de superposition Quantification Quantifié Action locale Superposition principle Quantization Quantized Local action “Having established the idea of ‘field’ from a mathematical point of view, we go now to physics: as we already mentioned, the definition of a field as a physical quantity must be based on the descritpion of the way to measure such a field. Therefore, the definition given by Eq. 306 is rigorous and complete: it tells us that, if we must measure an electric field at any point (x,y,z) in space, we must place a charge q at that point, measure the electrostatic force on it, and divide the result, that is the three numbers that give the components of the force vector, by the magnitude of the charge. And this is all, truly all! Do not try to imagine what the field ‘really’ is: it is, really, the collection of numbers that are the results of the measures performed following Eq. 306.” Giorgio Margaritondo: Ma Physique 239 XLII. La loi de Gauss Nous discuterons maintenant le problème général de l’électrostatique: étant donné un système de charges électriques en équilibre, par exemple le système de charges ponctuelles qi, quel est le champ électrique qu’il produit? En principe, la solution pourrait être fournie par la combinaison de la loi de Coulomb et du principe de superposition, qui donnent l’Eq. 305: qi q f = 4πε Σ i 2 ^r i ; ri o par définition, le champ est le rapport de la force et de la charge de mesure q: qi 1 E = 4πε Σ i 2 ^r i . ri o (308) Cette équation nous permet, en principe, de calculer le champ si nous connaissons la grandeur qi et la position ri de chaque charge du système. La même conclusion est valable si le système est un “nuage” de charge plutôt qu’une série de charges ponctuelles. On peut effectivement passer de la distribution “à nuage” ou continue à une distribution à charges ponctuelles ou discrète, en imaginant de partager l’espace occupé par le “nuage” de charge en petits volumes ∆τ: si ρ(ri) est la densité de charge dans le nuage, c’est-à-dire la charge par unité de volume, on peut approximativement traiter la charge qui occupe le volume ∆τ dans la position r comme une charge ponctuelle ρ(r)∆τ dans la même position. Cette approximation devient plus précise si les volumes ∆τ sont infinitésimaux: ∆τ → dτ. La somme de l’Eq. 308 devient une intégrale: 1 E = 4πε o ⌠ ρ(r)dτ ^ r, ⌡ r2 V (309) où ρ(r) est la densité de charge au point r, et l’intégrale est calculée pour le volume V qui est occupé par le “nuage” de charge. La solution fournie par les équations 308 et 309 au problème central de l’électrostatique, quoique rigoureuse en principe, n’est pas la manière la plus efficace de calculer le champ électrique d’un système de charges. Une meilleure solution est fournie par la loi de Gauss. Voyons donc cette loi, et démontrons qu’elle est équivalente à la loi de Coulomb. Tout d’abord, nous devons discuter les instruments mathématiques nécessaires pour formuler la loi. Le premier est ce qu’on appelle le flux d’un vecteur, par exemple le flux d’un champ électrique E. Point important: n’essayez pas d’interpréter littéralement le mot “flux” (ni les mots “divergence”, “rotationnel” etc. que nous utiliserons par la suite): il s’agit de termes inventés lorsque les mêmes instruments mathématiques étaient utilisés pour d’autres domaines de la physique tels que l’hydrodynamique. Giorgio Margaritondo: Ma Physique 240 Nous donnerons la définition du flux d’un vecteur, comme toujours en physique, avec des formule mathématiques qui correspondent à la manière de le mesurer. Considérez la Fig. 91a: nous voyons une superficie Σ, une portion infinitésimale ds de cette superficie, et un champ vectoriel v. n^ θ (a) Σ v ds n^ θ (b) ds E Σ Fig. 91: Définition du flux d’un vecteur, et loi de Gauss concernant le flux du champ électrique. On appelle flux infinitésimal dΦ du vecteur v par la superficie ds la quantité suivante: dΦ = v • ^ n ds , (310) ^ est le vecteur unité perpendiculaire à la superficie infinitésimale ds. Je vous où n rappelle que le produit scalaire des deux vecteurs v et ^ n , indiqué par le symbole “•”, donne une quantité scalaire, le produit des grandeurs des deux vecteurs et du cosinus de l’angle de leurs directions, θ: dΦ = vds cosθ , (311) où v est la grandeur de v. Notez qu’en choisissant la direction du vecteur unitaire ^ n , on choisit aussi la direction “flux positif” pour la superficie. On peut maintenant passer du flux infinitésimal par la superficie infinitésimale ds au flux total par la superficie Σ, simplement en additionnant les flux infinitésimaux de toutes les parties infinitésimales de la superficie, c’est-à-dire en calculant l’intégrale: ΦΣ = ∫ dΦ Σ = ∫Σ v • ^n ds pour la superficie Σ. (312) Giorgio Margaritondo: Ma Physique 241 Passons maintenant à la Fig. 91b, qui montre une superficie Σ, qui est fermée selon la définition conventionnelle de la géométrie. La loi de Gauss concerne effectivement le flux du champ électrique de l’intérieur à l’extérieur d’une superficie fermée; elle nous dit que: ΦΣ = ∫ E • ^n ds Σ Q = ε , o (313) où Q est la charge électrique totale à l’intérieur de la superficie fermée Σ. Avant d’entamer une discussion détaillée de cette loi, convainquons-nous qu’elle est effectivement équivalente à la loi de Coulomb, Eq. 302. Imaginez donc deux charges ponctuelles q et Q à distance r l’une de l’autre. Considérez d’abord la symétrie du problème: la mécanique (principe d’action et réaction) exige que les forces entre les deux charges soient orientées dans la direction définie par leurs positions respectives; elle exige également que la force exercée par la première charge sur la deuxième soit de la même grandeur que la force exercée par la deuxième sur la première. Enfin, les deux forces doivent être opposées. Imaginez maintenant la charge Q sans la charge q, et examinez la symétrie de son champ électrique. Vous pouvez constater que la symétrie est sphérique: il n’y a pas de différences entre les directions qui proviennent de Q. Cette constatation nous amène à choisir, afin d’appliquer la loi de Gauss de l’Eq. 313, une superficie fermée sphérique centrée sur Q. Prenons spécifiquement une superficie de rayon égal à la distance r. Dans ce problème, la symétrie sphérique exige que le champ électrique ait la même grandeur pour chaque point de cette superficie, et qu’il soit toujours orienté dans la direction perpendiculaire à elle. Donc, le produit E • ^ n ds = Eds cosθ de la loi de Gauss, Eq. 313, devient simplement Eds (puisque cosθ = 1), avec E constant, et: E ∫ ds Σ Q = ε ; o (314) d’autre part, l’intégrale de cette équation correspond simplement à la grandeur 4πr2 de la superficie sphérique, et donc: 1 Q E = 4πε 2 ; o r (315) la force à laquelle la charge q est soumise par la charge Q est calculée en multipliant E par q: 1 qQ f = 4πε 2 . o r Ces résultats sont conformes à la loi de Coulomb, Eq. 302, ce qui demontre l’équivalence de celle-ci et de la loi de Gauss, puisqu’on peut également dériver la deuxième à partir de la première (voir la Fig. 92). Cette dérivation est simple: prenez la définition de flux par la superficie infinitésimale ds, donnée par l’Eq. 311: Giorgio Margaritondo: Ma Physique 242 dΦ = vds cosθ ; dans le cas où le vecteur est le champ électrique coulombien de grandeur Q/4πε or2 causé par la charge Q. Le produit ds cosθ correspond, en géométrie, à la projection de la superficie ds dans la direction perpendiculaire à celle du champ. En utilisant la définition d’angle solide dΩ, cette projection est r2dΩ; donc, dΦ =(Q/4πεor2)r2dΩ = (Q/4πεo)dΩ. Calculée pour une superficie fermée, l’intégrale de cette expression donne le produit de la constante (Q/4πεo) et de l’angle solide 4π, qui est Q/εo, en accord avec la loi de Gauss. Puisque cette dérivation ne dépend pas de la position de Q à l’intérieur de la superficie fermée, elle peut être répétée pour toutes les charges contenues dans la superficie, et on obtient ainsi la loi de Gauss. ds cosθ ^ = r2dΩ n Q θ E dΩ r ds Fig. 92: Dérivation de la loi de Gauss à partir de la loi de Coulomb. Notez que dΩ est l’angle solide qui correspond à la superficie ds cos θ, projection de la superficie ds dans la direction perpendiculaire au champ électrique E. Quant à notre assertion que la loi de Gauss est plus efficace que la loi de Coulomb en ce qui concerne la solution des problèmes d’électrostatique, il est facile de s’en convaincre en l’utilisant pratiquement. Pourtant, cette utilisation se base presque toujours sur la symétrie du système de charges. XLII.1. La forme locale de la loi de Gauss Nous essayerons maintenant de manipuler la loi de Gauss, Eq. 313, à l’aide d’une propriété du calcul vectoriel; l’objectif principal est de découvrir que la relation causeeffet de la loi de Gauss est effectivement une relation locale, comme nous l’avons déjà mentionné. La propriété formelle que nous utiliserons est le théorème de la divergence: Etant donné une superficie fermée Σ et un champ vectoriel v, le flux de v par Σ (calculé de l’intérieur à l’extérieur) est égal à l’intégrale de la divergence du vecteur v, calculé pour le volume VΣ entouré par la superficie Σ. Je vous rappelle que l’idée de divergence a déjà été introduite quand nous avons discuté les phénomènes de diffusion. Nous l’avions alors définie avec l’Eq. 285: Giorgio Margaritondo: Ma Physique 243 ∂Jx ∂Jy ∂Jz ∇ • J = ∂x + ∂y + ∂z , pour le vecteur J. La définition est pourtant valable pour un champ vectoriel quelconque v, dont la divergence est ∇ • v, et spécifiquement pour la divergence du champ électrique, ∇ • E. Le théorème de la divergence appliqué au champ électrique nous dit que: ΦΣ = ∫Σ E • ^n ds ∫ (∇ • E) dτ , = (316) VΣ où dτ est le volume infinitésimal. Cette équation, combinée avec la loi de Gauss, Eq. 313, donne: ∫ (∇ • E) dτ VΣ Q = εo . (317) Karl Friedrich Gauss D’autre part, la charge Q contenue dans le volume V Σ peut être calculée en intégrant sur le même volume la densité de charge ρ(r): Q= ∫ ρ(r)dτ . (318) VΣ Les équations 317 et 318 donnent: ∫ (∇ • E) dτ VΣ 1 = εo ∫ ρ(r)dτ ; (319) VΣ notez que cette relation peut être dérivée pour n’importe quel volume VΣ; elle est donc valable pour tous les volumes, ce qui exige que les quantités à intégrer soient égales, et donc: ρ ∇•E = ε . o (320) Cette équation est la forme locale de la loi de Gauss. Elle nous montre qu’il existe une relation directe entre le champ électrique à chaque point dans l’espace et la densité de Giorgio Margaritondo: Ma Physique 244 charge au même point. On découvre donc le caractère local, déjà mentionné, de la relation cause-effet des charges électrique et du champ. Le coin des mathématiques La théorie de l’électromagnétisme se base sur les mathématiques des champs vectoriels. Nous avons déjà introduit et utilisé une série de notions de ces mathématiques, telles que les produits scalaires et le gradient. Voyons maintenant un résumé un peu plus général des concepts que nous utiliserons, qui comprend tant des notions que nous avons déjà discutées que des points supplémentaires. Rappelons-nous, premièrement, quelle est la différence entre les vecteurs et les quantités scalaires. Une grandeur physique est dite scalaire si elle est définie par un seul nombre exprimant le résultat de sa mesure. La température est un exemple de grandeur scalaire. Un vecteur (libre) est défini, au contraire, par trois nombres; par exemple, par sa grandeur et sa direction, qui à son tour est spécifiée par deux angles. La vitesse, l’accélération, la force, la position d'un point dans l’espace et le champ électrique sont tous des vecteurs. Une autre manière de définir un vecteur est de donner ses trois composantes dans un système de référence cartésien; par exemple, la vitesse v est définie par ses trois composantes v x , v y et v z , et la position r d’un point par les trois coordonnées x, y, z. Un champ vectoriel est un vecteur qui change d’un point à l’autre de l’espace, donc une fonction de la position (x,y,z). Grandeur d’un vecteur La grandeur d'un vecteur est la racine de la somme des carrés de ses composantes: v = vx2 + vy2 + vz2. √ Vecteur (321) unité Le vecteur unité â a la même direction que le vecteur a auquel il correspond, mais sa grandeur est unitaire et sans dimensions. Si nous notons a la grandeur du vecteur a, nous avons: â = a a . (322) Giorgio Margaritondo: Ma Physique 245 Produits de vecteurs Pour l'électromagnétisme (ainsi que pour d'autres branches de la physique), nous avons besoin de deux types de produits entre vecteurs: le produit scalaire et le produit vectoriel. Produit scalaire Nous avons déjà vu que le produit scalaire de deux vecteurs a et b est une grandeur scalaire, donnée par le produit des grandeurs a et b des deux vecteurs, multiplié par le cosinus de l'angle θ entre les directions des deux vecteurs: a • b = a b cos θ ,. (323) ce qui correspond aussi a la somme des produits des composantes des vecteurs: a • b = a xb x + a yb y + a zb z . Produit (324) vectoriel Nous avons également vu que le produit vecteur a × b de deux vecteurs a et b est aussi un vecteur, dont la grandeur est le produit des grandeurs des deux vecteurs multiplié par le sinus de l'angle entre leurs directions. La direction du vecteur produit est perpendiculaire au plan de deux vecteurs a et b, et le sens est défini par la règle de la main droite. Cette définition du produit vectoriel correspond aux composantes suivantes: (a × b )x = a y b z - b y a z (a × b )y = -(a x b z - b x a z ) (a × b )z = a x b y - b y a x . (325) Dérivées. Il existe plusieurs types de dérivées pour les vecteurs. Toutes ces dérivées peuvent être définies très simplement si on utilise pour les formules le pseudo-vecteur "nabla" ou "del", dont le symbole est ∇ . Nous avons déjà vu que celui-ci est un opérateur, c'est-à-dire une entité mathématique, qui se comporte dans les formules comme si elle était un vecteur avec les composantes suivantes: Giorgio Margaritondo: Ma Physique ∇x = ∂ ∂x ∇y = ∂ ∂y ∇z = ∂ ∂z 246 (326) Gradient d'une grandeur scalaire Le gradient d'une grandeur physique scalaire A a été déjà défini (Eq. 71): il est donné par la formule suivante: grad A = ∇ A; (327) il s'agit donc d'un vecteur, dont les composantes sont: (grad A) x = ∂A ∂x ∂A (grad A) y = ∂y (grad A) z = ∂A . ∂z (328) Divergence d'un vecteur La divergence d'un vecteur v est une grandeur physique scalaire, définie par la formule suivante: div v = ∇ • v = ∂ v x ∂ v y ∂vz + + . ∂x ∂y ∂z (329) Rotationnel d'un vecteur Le rotationnel d'un vecteur v est aussi un vecteur défini par la formule suivante: rot v = ∇ × v; (330) les composantes du rotationnel se calculent avec les définitions du pseudovecteur nabla et du produit vectoriel. Par exemple: Giorgio Margaritondo: Ma Physique 247 ∂vz ∂vy (∇ × v )x = . ∂y ∂z (331) Laplacien d'une grandeur scalaire Le laplacien ∇ 2 A d'une grandeur scalaire A est aussi une grandeur scalaire, définie par la formule suivante: ∇ 2 A = (∇ • ∇ ) A ∂2A ∂2A ∂2A + + . ∂x2 ∂y2 ∂z2 = (332) Intégrales: flux et circulation On utilise dans l'électromagnétisme deux types d'intégrales des champs vectoriels: le flux et la circulation. Le flux a été défini par les équations 310, 311 et 312, à l’aide de la Fig. 91. Quant à la circulation, considérez la Fig. 93. Dans la partie supérieure, on peut voir une ligne (que nous appellerons L) entre les positions A et B; on peut également voir le vecteur déplacement infinitésimal dl sur L, et enfin le vecteur v, qui correspond à un champ vectoriel. On appelle intégrale curviligne du vecteur v sur la ligne L la quantité: intégrale curviligne = ∫v • dl . (333) L La définition de travail (Eq. 68) fournit un bon exemple d’intégrale curviligne. Si la ligne est fermée, comme par exemple dans la partie inférieure de la Fig. 93, l’intégrale curviligne est appelée circulation du vecteur, et indiquée par le symbole °∫ . Théorèmes Nous parlerons enfin, sans pourtant les dériver, de deux théorèmes importants qui concernent les intégrales des champs vectoriels et leurs dérivées. Le premier, le théorème du flux et de la divergence, a déjà été discuté et utilisé lorsque nous avons dérivé la forme locale de la loi de Gauss: Etant donné une superficie fermée Σ et un champ vectoriel v, le flux de v par Σ (calculé de l’intérieur à l’extérieur) est égal à l’intégrale de la divergence du vecteur v, calculé pour le volume V Σ entouré par la superficie Σ . Giorgio Margaritondo: Ma Physique 248 Quant au deuxième théorème, dit théorème de la circulation et du rotationnel, il est illustré par la figure 94, qui montre une ligne fermée L et une superficie S limitée par la ligne L. B dl v A Fig. 93: vecteur Définition de la circulation d’un dl v Le théorème de la circulation et du rotationnel nous dit que: La circulation d’un champ vectoriel v , calculée pour une ligne (fermée) L, est égale au flux du rotationnel du même vecteur, par une superficie limitée par la ligne L: °L∫ v • dl = Φ Σ (∇ × v) ; (334) notez que le flux est calculé en prenant la direction perpendiculaire à la superficie Σ identifiée par la grande flèche ombrée de la Fig. 94, c’est à dire la direction qui suit la règle du tire bouchon par rapport à la circulation sur L. Notez que le théorème ne spécifie pas quelle est la superficie Σ qu’on doit utiliser pour calculer le flux, à condition qu’elle soit limitée par L: l’équation 334 est valable pour n’importe quelle superficie de ce type. La raison en est que le flux d’un rotationnel Giorgio Margaritondo: Ma Physique 249 est le même pour deux superficies quelconques limitées par la même ligne fermée L.2 Σ L Fig. 94: Géométrie du théorème de la circulation et du rotationnel Le Coin Yankee: Produit scalaire Produit vectoriel Ligne fermée Rotationnel Integrale curviligne Dot product Cross product Loop Curl Line integral “This equation is the local form of the Gauss law. It shows us that there is a direct relation between the electric field at every point in space and the charge density at the same point. One discovers, therefore, the local character, already announced, of the cause-effect relation for the electric charges and the field” Le coin des unités et des ordres de grandeur: Unités SI Autres unités 2 Afin de vous convaincre de cette propriété, imaginez deux superficies Σ et Σ’, limitées par L. Les deux superficies combinées forment une superficie fermée. Le flux du rotationnel par cette superficie est nul, puisque selon le théorème de la divergence et du flux il est égal à l’intégrale de sa divergence, et d’autre part la divergence d’un rotationnel est toujours nulle (formellement, on peut imaginer que les “directions” des “vecteurs” ∇ × v et ∇ sont perpendiculaires, et donc le produit scalaire ∇ • (∇ × v) est nul). Donc, ΦΣ(∇ × v) − ΦΣ’(∇ × v) = 0 (le signe négatif de − ΦΣ’(∇ × v) est causé par le renversement de ^ lorsqu’on calcule le flux total), et par conséquent ΦΣ(∇ × v) = ΦΣ’(∇ × v). la direction du vecteur unité n Giorgio Margaritondo: Ma Physique Champ électrique Intégrale curviligne du champ électrique N/C (équivalente à V/m = volt/m) N m/C (équivalente à V = volt) 250 Giorgio Margaritondo: Ma Physique 251 XLIII. La théorie de l’électrostatique et le potentiel Nous sommes maintenant prêts à formuler une théorie complète de l’électrostatique. Cette théorie nous permettra de découvrir la deuxième propriété fondamentale du champ électrique en cas d’équilibre: l’existence du potentiel, une quantité physique que nous utilisons continuellement dans la technologie et dans notre vie quotidienne. L’électrostatique est la physique des systèmes de charges électriques qui ne se meuvent pas: on doit toujours se rappeler ce point, parce que nous verrons que les propriétés changent radicalement si aux charges immobiles on ajoute des charges en mouvement, par exemple des courants. La théorie du champ électrique dans le cas de l’électrostatique est entièrement contenue dans trois équations, dont deux ont déjà été discutées. Premièrement, l’Eq. 306: f = qE , qui constitue la définition du champ électrique. Ensuite, deux équations qui décrivent les propriétés du champ ainsi défini; la première de ces équations est la loi de Gauss, par exemple dans sa forme locale, Eq. 320: ρ ∇•E = ε . o Quant à la deuxième, sa forme locale concerne le rotationnel du champ électrostatique: ∇ × E = 0. (335) Cette loi peut être facilement dérivée en tenant compte du fait qu’un champ électrostatique créé par un ensemble de charges est la superposition des champs coulombiens des charges individuelles (voir par exemple l’Eq. 308). L’Eq. 335 est effectivement valable pour un champ de type coulombien, et donc pour une superposition de champs coulombiens. La validité de l’Eq. 335 pour un champ coulombien provient d’une propriété encore plus générale: cette équation est valable pour un champ central quelconque (c’est-à-dire si sa direction est toujours orientée vers un point fixe, par exemple la charge ponctuelle qui crée le champ coulombien) et si sa grandeur ne dépend que de la distance du même point (par exemple, avec une loi du type 1/r2 pour le champ coulombien).3 Le théorème du rotationnel et de la circulation, Eq. 334, nous dit que un rotationnel nul correspond à une circulation nulle; donc, pour le champ électrostatique: °L∫ E • dl = 0, (336) 3 La dérivation est simple: un champ de ce type peut être écrit f(r)r ^, où r = (x2+y2+z2)1/2 est la distance de l’origine (le point vers lequel la direction du champ est orientée), et f(r) est la fonction de la distance qui donne la grandeur du champ. D’autre part, selon l’Eq. 172 le vecteur unité ^r est donné par r/r, où r est le vecteur position par rapport à l’origine, dont les composantes sont les trois coordonnés x, y, z. Donc, les trois composantes du champ f(r)r^ sont f((x 2 +y 2 +z 2 ) 1/2 ) x/(x 2 +y 2 +z 2 ) 1/2 , f((x 2 +y 2 +z 2 ) 1/2 ) y/(x2+y2+z2)1/2, et f((x2+y2+z2)1/2) z/(x2+y2+z2)1/2. Pour dériver l’Eq. 185, on doit tout simplement appliquer la définition du rotationnel, Eq. 180. Giorgio Margaritondo: Ma Physique 252 pour n’importe quelle ligne fermée L. Cette forme non-locale de la deuxième équation fondamentale de l’électrostatique correspond à une propriété bien connue: la conservation de l’énergie mécanique. Afin de comprendre ce point, il faut multiplier l’équation 336 par la charge électrique: l’intégrale curviligne dévient alors le travail de la force du champ électrique pour un parcours fermé (voir le chapitre IV). Cependant, vu l’importance de la conservation de l’énergie, nous présenterons une analyse complémentaire à celle du chapitre IV. En notant U comme l’énergie potentielle d’une particule chargée dans un champ électrique E et K son énergie cinétique, la conservation de l’énergie mécanique donne, si vous prenez deux points A et B dans l’espace: K(A) + U(A) = K(B) + U(B) , (337) et: K(B) - K(A) = U(A) - U(B). (338) Le changement d’énergie cinétique K(B) - K(A) est égal au travail de la force du champ électrique pour le déplacement de A à B: ∫ f • dl = q K(B) - K(A) = L(A,B) ∫ E • dl , (339) L(A,B) Les équations 338 et 339 donnent: q ∫ E • dl = U(A) - U(B) . (340) L(A,B) D’autre part, si la trajectoire L est fermée, les deux points A et B coïncident, et U(A) U (B) = 0, donc l’Eq. 339 pour une ligne fermée est équivalente à l’Eq. 336: la conservation de l’énergie mécanique est une condition suffisante pour que l’Eq. 336 soit valable. On peut également dériver la conservation de l’énergie mécanique, Eq. 337, à partir de l’Eq. 336, afin de compléter la démonstration de l’équivalence de ces deux équation. Prenez la Fig. 95, qui montre deux points A et B sur une ligne fermée. L’Eq. 336 donne: ∫ E • dl + A→(1)→B ∫ E • dl = 0, B→(2)→A où la première intégrale est calculée sur le parcours 1, et la deuxième sur le parcours 2. D’autre part: ∫ E • dl = - B→(2)→A ∫ E • dl A→(2)→B et donc: ∫ E • dl = A→(1)→B ∫ E • dl A→(2)→B . , Giorgio Margaritondo: Ma Physique 253 Qu’implique cette équation? Nous pouvons répéter sa dérivation pour n’importe quelle ligne fermée contenant les deux points A et B, et donc pour n’importe quelle trajectoire du type 1 et 2. Conclusion: l’intégrale curviligne d’un champ électrostatique ne dépend pas d’un parcours spécifique, mais seulement des points de départ A et d’arrivée B. B 1 L A 2 Fig. 95: Conservation de l’énergie mécanique pour un champ en accord avec l’Eq. 336. D’autre part, le champ multiplié par la charge q donne la force, et par conséquent l’intégrale curviligne multipliée par q donne le travail pour le déplacement de A à B. Ce travail ne dépend donc pas du parcours spécifique mais seulement des points de départ et d’arrivée, et on peut l’écrire l’équation 340: q ∫ E • dl = U(A) - U(B), L(A,B) où U est une fonction de la position. Ainsi, nous retrouvons l’Eq. 340 (et aussi les équations 68 et 69); l’Eq. 340 est donc équivalente à la conservation de l’énergie, à condition d’admettre que la fonction U est notre vieille amie l’énergie potentielle! Et nous retrouvons également l’équivalence parfaite de la deuxième loi fondamentale de l’électrostatique, donnée par l’Eq. 335 ou par l’Eq. 336, et de la conservation de l’énergie mécanique. En résumé, la deuxième loi fondamentale implique que le champ électrostatique est un champ conservatif. XLIII.1. Le potentiel électrostatique La discussion précédente et la découverte du caractère conservatif du champ électrostatique nous amène à l’idée de potentiel. L’Eq. 340 montre que le changement d’énergie potentielle d’une charge pour le déplacement du point A au point B est proportionnel à sa grandeur q. L’énergie potentielle par unité de charge est, par définition, le potentiel V: U = qV. (341) Cette définition, combinée avec l’Eq. 340, montre que V(A) - V(B) est le travail qui correspond au déplacement d’une charge unitaire du point A au point B: Giorgio Margaritondo: Ma Physique ∫ E • dl = V(A) - V(B), 254 (342) L(A,B) Le potentiel électrique est très souvent utilisé dans les applications pratiques de l’électromagnétisme: tout le monde connaît son unité de mesure, le volt. L’Eq. 342 donne sa définition physique, c’est-à-dire la manière de le mesurer: on doit essentiellement faire des mesures de travail avec une charge unitaire. Mais attention! Cette définition nous fournit seulement la manière de mesurer les changements du potentiel d’un point à l’autre, par exemple du point A au point B. Nous retrouvons encore une fois le problème discuté pour les mesures de l’énergie mécanique, des fonctions d’état de la thermodynamique ou des hauteurs: on n’obtient que les changements de ces quantités. Si l’on souhaite définir des valeurs absolues, on est obligé d’utiliser un point de référence conventionnel: par exemple, on a vu qu’on mesure l’altitude à partir du niveau de la mer. Afin de donner “le” potentiel d’un point ou d’un objet, au lieu de parler seulement de changements de potentiel d’un point à l’autre, nous devons définir un point de référence qu’on suppose à potentiel nul. Le choix du point de référence n’est pas une question de principe, mais un problème pratique. Le meilleur choix est notre bonne mère la terre, à notre disposition partout. On suppose donc que la terre est à potentiel nul, et on peut déterminer le potentiel d’un point P en mesurant le travail qui correspond au déplacement d’une charge unitaire de la terre à P. XLIII.2. Relation potentiel-champ: équations de Poisson et de Laplace La relation du champ électrostatique et du potentiel est donnée par l’Eq. 342; il est toutefois préférable de modifier cette relation: si vous prenez pour dl un déplacement infinitésimal dx sur l’axe x, cette équation devient Exdx = - dV, et donc: ∂V Ex = - ∂x , (343) qui peut être généralisée pour les autres coordonnées, obtenant: E = - ∇V. (344) Notez que cette simple relation implique directement la deuxième loi de l’électrostatique, Eq. 335: si vous prenez le rotationnel de - ∇V, en considérant l’opérateur ∇ formellement comme un vecteur, vous avez le produit vectoriel de deux “vecteurs” parallèles, ∇ et ∇V, qui est nul, et donc: ∇ × E = 0. (345) D’autre part, l’Eq. 335 implique l’existence d’une fonction potentiel liée au champ électrostatique par l’Eq. 345. L’existence du potentiel et sa liaison au champ fournissent ainsi une nouvelle manière de formuler la deuxième loi de l’électrostatique. Prenez maintenant l’Eq. 344, et calculez-en la divergence: le résultat est ∇ • E = - ∇2V, où ∇2 est le laplacien que nous avons déjà défini (Eq. 332): ∇2V = (∇ • ∇)V = ∂2V ∂2V ∂2V + 2 + ; 2 ∂x ∂y ∂z2 Giorgio Margaritondo: Ma Physique 255 d’autre part, la loi de Gauss met la divergence du champ électrique en relation avec la densité de charge, donnant: ρ ∇ 2V + ε = 0 , o (346) relation qu’on appelle l’équation de Poisson, utilisée fréquemment pour résoudre les problèmes d’électrostatique. Dans le cas d’une région de l’espace sans charges électriques, l’Eq. 346 devient: ∇ 2V = 0 , (347) qui est aussi une relation souvent utilisée pour les problèmes d’électrostatique, appelée équation de Laplace. XLIII.3. Enfin, un peu de saine pratique Mes malheureux lecteurs/rices ont été soumis/ses à un déluge de formules, auquel il faut finalement mettre un terme: passons à des applications pratiques de ces formules! Prenez le cas simple d’une charge ponctuelle Q: quel est le potentiel de son champ électrique? L’Eq. 342 est la clé pour répondre à cette question: afin de trouver la différence de potentiel entre deux points A et B (voir la Fig. 96), nous devons calculer le travail pour le déplacement de A à B d’une charge q, et le diviser par q. Mais quelle trajectoire doit-on choisir pour calculer le travail? La réponse est: cela n’a aucune importance; le travail ne dépend pas de la trajectoire, et donc on peut le calculer en choisissant une trajectoire quelconque. Q rB rA A C B L Fig. 96: Calcul du potentiel du champ électrostatique d’une charge ponctuelle Q. Nous choisirons, bien entendu, une ligne qui simplifie nos calculs, comme montré à la Fig. 96: notre choix ne sera pas la ligne compliquée L, mais par exemple la trajectoire A → C → B, qui est la combinaison d’un arc de cercle centré sur Q et d’une ligne radiale. Sur l’arc de cercle, le produit E • dl est nul puisque le champ électrique est radial, et donc on n’a pas de travail. Sur la ligne étroite, on a: Giorgio Margaritondo: Ma Physique 256 rB ⌠ Q dr = Q 1 - 1 ; E • dl = ∫ ⌡ 4πεo r2 4πεo rA r B (348) rA par conséquent, la différence de potentiel des points A et B est: 1 Q 1 V(A) - V(B) = 4πε r - r ; o A B (349) si nous admettons que le potentiel à distance infinie de la charge Q est nul (en prenant donc la distance infinie comme référence), le potentiel à la distance r de Q est donné par la fonction: Q 1 V(r) = 4πε . o r (350) Notez que cette fonction diminue de grandeur si r augmente quand la charge Q est positive, mais elle augment si Q est négative. Passons maintenant à un exemple d’application de l’équation de Poisson. La Fig. 97 montre le graphique du potentiel à l’intérieur d’un matériau isolant ou semiconducteur, dans la région proche de sa surface. Le système peut être modélisé avec un plan de charge (à la surface) suivi par une région avec une densité de charge constante (causée par les impuretés ionisées). Admettons que la densité de charge est -ne, où n est le nombre d’impuretés ionisées par unité de volume, et -e la charge de chaque impureté ionisée. Le potentiel est constant à une distance suffisamment élevée de la surface, mais il change lorsqu’on arrive près de la surface chargée, et on a une différence de potentiel Vo entre la surface et l’intérieur. L’Eq. 346 (de Poisson) donne dans ce cas: -ne d2V + =0, ε rεo dx2 (351) où la constante diélectrique du vide, εo, a été modifiée en la multipliant par la constante diélectrique relative du matériau, εr, que nous discuterons plus tard dans le cours. Une solution de cette équation est donnée par la fonction: V(x) = ax2 , (352) où a est une constante, déterminée par la condition V(L) = Vo, qui devient: a = Vo/L2 . (353) Les équations 351, 352 et 353 nous permettent de trouver une relation entre l’épaisseur L de la région chargée et la densité de charge; puisque d2V/dx2 = 2a = 2V o/L2, nous avons 2Vo/L2 = ne/εr εo, et donc: L= √ 2Vo εr εo ; ne (354) Giorgio Margaritondo: Ma Physique 257 cette équation donne ce qu’on appelle la longueur de Debye L du matériau, un paramètre de la plus grand importance dans la technologie microélectronique industrielle. x Région chargée Surface (plan de charge) V L Vo 0 x Fig. 97: Potentiel électrostatique près de la superficie d’un matériau semiconducteur (ou isolant), modélisé par un plan de charge suivi par une région avec densité de charge constante. Le comte Alessandro Volta: l’unité de chûte de potentiel tire son nom de lui Giorgio Margaritondo: Ma Physique 258 Le Coin Yankee: Electrostatique Potentiel Différence de potentiel Chute depotentiel Longueur de Debye Electrostatic Potential Potential difference Potential drop Debye length “In summary, the second fundamental law implies that the electrostatic field is a conservative field.” Le coin des unités et des ordres de grandeur: Potentiel Unités SI V (volt) Autres unités Giorgio Margaritondo: Ma Physique 259 XLIV. Electrostatique des conducteurs: les condensateurs En appliquant les lois fondamentales de l’électrostatique au cas des matériaux conducteurs, on obtient immédiatement une série de résultats importants. Avant de les dériver, il nous faut prendre en considération les propriétés de ces matériaux. Tout d’abord: comment peut-on distinguer les conducteurs des non-conducteurs? Il s’agit de voir quels sont les effets d’une chute de potentiel sur un matériau donné. Si le matériau est un isolant, la chute de potentiel ne produit que des courants faibles, à la limite nuls. Par contre, dans les métaux et, d’une façon plus modérée, dans les semiconducteurs, toute chute de potentiel produit un courant. Il y a encore les matériaux supraconducteurs, dans lesquels on peut avoir un courant sans chute de potentiel; ce phénomène ne peut pas être compris dans le cadre de la physique classique, à cause de son caractère purement quantique. La théorie moderne de la structure microscopique des matériaux nous permet de comprendre les différences entre conducteurs et non-conducteurs. Tous les matériaux sont composés d’atomes, contenant eux-mêmes des particules avec des charges électriques. Les protons des noyaux atomiques ne sont pas en mesure de se déplacer et donc ne contribuent pas aux courants. Les électrons des matériaux isolants parfaits ne sont pas non plus en mesure de se déplacer: donc, pas de courant. Par contre, dans les matériaux conducteurs, une partie des électrons peuvent se déplacer en réaction à une chute de potentiel et au champ électrique correspondant, produisant ainsi des courants. Nous arrivons immédiatement à un premier résultat: dans le cas de l’électrostatique, les charges ne peuvent pas se déplacer. Mais, dans un conducteur, elles sont libres de se déplacer si l’on a un champ électrique: par conséquent, le champ électrostatique doit être nul à l’intérieur d’un conducteur. Cette conclusion nous amène rapidement à deux autres résultats: premièrement, l’Eq. 334 (relation potentiel-champ), montre que si le champ est nul, le potentiel à l’intérieur d’un conducteur est constant. Deuxièmement, l’Eq. 320 (loi de Gauss), nous montre qu’un champ nul implique une densité de charge nulle à l’intérieur d’un conducteur, ρ = 0. Quelle en est la signification sur le plan microscopique? Puisqu’un conducteur contient des particules chargées (protons et électrons), on doit avoir l’équilibre local des charges positives et négatives afin de garantir la neutralité de charge à chaque point. Prenons maintenant un morceau de métal électriquement neutre, et ajoutons-y des charges électriques de l’extérieur: où se mettront-elles? Evidemment, ne pouvant pas se placer à l’intérieur, elles seront confinées à la superficie du matériau. La densité de superficie de ces charges, c’est-à-dire le nombre de charges par unité de superficie, σ, changera d’un point à l’autre. La distribution des charges sur la superficie sera déterminée par l’obligation d’avoir un potentiel constant à l’intérieur de la pièce de métal qu’on considère, aussi bien que de tous les autres matériaux conducteurs dans l’espace. Notez que les charges libres d’un conducteur sont également libres de se déplacer sur sa superficie. En électrostatique, donc, on ne peut pas avoir un champ électrique tangent à la superficie d’un conducteur. Le champ électrique est toujours perpendiculaire à Giorgio Margaritondo: Ma Physique 260 la superficie d’un conducteur. Cela exige que toute la superficie soit au même potentiel: on l’appelle superficie équipotentielle. Quelle est la grandeur du champ électrique perpendiculaire à la superficie du conducteur? On peut facilement la dériver à l’aide de la Fig. 98. Nous voyons un cylindre de hauteur infinitésimale, construit sur une partie également infinitésimale, ds, de la superficie, dont la paroi latérale est perpendiculaire à ds. E ds Fig. 98: Champ électrique perpendiculaire à la superficie d’un matériau conducteur. La loi de Gauss sous forme non-locale, Eq. 313, met en relation le flux du champ électrique par ce cylindre et la charge électrique totale qu’il contient. Le flux est nul en ce qui concerne la partie du cylindre à l’intérieur du conducteur. Il est également nul pour la partie de la paroi latérale du cylindre qui se trouve à l’extérieur du conducteur, parce que celle-ci est parallèle au champ électrique. On n’a donc du flux que par ds: le champ étant perpendiculaire à ds, son flux est Eds (où E est la grandeur de E). D’autre part, la seule charge dans le cylindre est σds, donc la loi de Gauss donne Eds = σds/εo, et: σ E = ε . o (355) En résumé, l’électrostatique exige dans le cas d’un conducteur: potentiel constant et champ électrique et densité de charge nuls à l’intérieur; champ électrique perpendiculaire à la superficie (qui est équipotentielle), dont la grandeur est donnée par l’Eq. 355. Prenons maintenant un système composé de plusieurs conducteurs en équilibre, avec une certaine distribution de charges à leur superficie. Ajoutons au système un autre conducteur, chargé ou neutre. L’équilibre du système ainsi modifié exige que le volume occupé par le conducteur ajouté soit équipotentiel, et que le champ électrique soit perpendiculaire à sa superficie. En général, ces deux conditions ne sont pas satisfaites par la distribution de charge antérieure à l’adjonction du nouveau conducteur. On constate que la distribution de charges sur la superficie de chacun des autres conducteurs est modifiée par cette adjonction. Le phénomène appartient à la catégorie qu’on appelle effets d’influence. On peut imaginer, par exemple, que si le nouveau conducteur est chargé positivement, les Giorgio Margaritondo: Ma Physique 261 distributions de charges des autres conducteurs seront changées de manière à augmenter la charge négative sur les superficies plus proches du nouveau conducteur, et la charge positive sur les plus éloignées. Notez enfin une conséquence importante de l’Eq. 355: si nous prenons une partie de la superficie d’un conducteur dont le rayon de courbure est limité, c’est-à-dire une pointe, la densité de superficie σ et par conséquent la grandeur du champ électrique tendent à augmenter: c’est la justification de ce qu’on appelle le pouvoir des pointes, qui est de “concentrer” le champ électrique en leur proximité. Le scientifique, inventeur et politicien Benjamin Franklin et un de ses premiers parafoudres Par exemple, la pointe d’un paratonnerre produit un champ électrique assez grand, qui peut augmenter la densité d’ions dans l’atmosphère, et faciliter les décharges causées par la différence de potentiel entre les nuages et la terre, tant en conditions normales qu’en cas de foudres. Il ne faut donc pas se placer sous les arbres pointus pendant un orage, afin d’éviter d’être victimes de la colère de Zeus! XLIV.1. Les cavités conductrices Considérons maintenant le cas particulier des corps conducteurs enfermant des cavités vides. Prenons par exemple le cas de la Fig. 99, où on voit une cavité dans un corps conducteur A, qui contient à son tour un autre corps conducteur B. Admettons que B est chargé positivement: on a évidemment une distribution de charge négative sur la superficie interne de la cavité, afin d’annuler le champ électrostatique à l’intérieur de la paroi du corps A. On a également une distribution de charge positive sur la superficie externe du corps A, afin de conserver la neutralité de celui-ci. Le champ électrostatique, bien que nul à l’intérieur de la paroi de A, n’est pas nul dans la cavité: on a une différence de potentiel entre les corps A et B. Imaginons maintenant qu’on ajoute des charges électriques sur le corps A, et donc que l’on change son potentiel par rapport à la terre. La nouvelle distribution des charges doit toujours produire un champ nul à l’intérieur de la paroi de A. Mais les charges ajoutées peuvent-elles changer le champ à l’intérieur de la cavité, et par conséquent la différence de potentiel entre A et B? Giorgio Margaritondo: Ma Physique 262 La réponse est négative. Analysons encore la situation avant d’ajouter les charges sur A: le champ dans la cavité peut être calculé avec la loi de Gauss, et il est déterminé par la distribution de charge sur la superficie de B. La distribution de charge sur la superficie interne de A doit être telle que le champ à l’intérieur de sa paroi soit nul (cela implique, par exemple, que la grandeur de la charge totale négative sur la superficie interne est égale à celle de la charge positive sur B). + + + + + - - + + + + + - + + B + + + + + + + + + A - - - + + + + + + Fig. 99: Cavité dans un corps conducteur A, qui contient un autre corps conducteur B. Quand vous ajoutez des charges sur A, elles sont forcées à se distribuer sur la superficie externe, puisqu’A est un conducteur. Les distributions des charges sur la superficie interne et sur B ne sont pas touchées par la charge supplémentaire, puisqu’elles doivent toujours donner un champ nul dans la paroi. Par conséquent, le champ dans la cavité et la différence de potentiel entre A et B ne changent pas non plus. En pratique, cette propriété est utilisée pour isoler les systèmes électroniques délicats des influences externes, en les plaçant dans des cages métalliques (dites cages de Faraday) qui se comportent approximativement comme des corps conducteurs solides avec des cavités. L’isolement électrique produit par un conducteur creux est une conséquence de la lois de Gauss, qui à son tour est une conséquence de la loi de Coulomb. Il peut donc être utilisé pour contrôler les limites de validité de celle-ci. Cette procédure, inventée par Cavendish, a récemment atteint une finesse extrême: l’exposant “-2” dans la loi de Coulomb a été vérifié avec une précision dépassant 10-13%. Le résultat est d’importance fondamentale, puisque toute déviation de la loi de Coulomb exigerait une masse non nulle des particules dites photons, qui forment la radiation électromagnétique, et par conséquent une révision complète de la science. XLIV.2. Condensateurs L’électrostatique des conducteurs trouve une application très importante dans le cas des condensateurs. Un condensateur est formé par deux corps conducteurs, séparés par un isolant ou par le vide. Analysons le comportement d’un condensateur à l’aide de la Fig. 100, qui montre le cas simple du condensateur plan, avec deux plaques conductrices de superficie S, séparées par une région vide d’épaisseur d. Une chute de potentiel V est créée entre les deux plaques par une batterie. Cela correspond à une charge positive Q = σ S (où σ est la densité de superficie) sur une des plaques, et -Q sur l’autre. Giorgio Margaritondo: Ma Physique 263 On appelle capacité du condensateur le rapport de la grandeur Q de la charge et de la chute de potentiel: Q C=V ; (356) la capacité est essentiellement un paramètre qui décrit combien de charge on peut emmagasiner sur une des plaques à l’aide d’une chute de potentiel donnée. Michael Faraday Dans le cas du condensateur plan de la Fig. 100, si l’on néglige les effets dans la région proche du bord, le champ électrique est constant dans l’espace entre les plaques (on peut facilement démontrer cela avec la loi de Gauss, en utilisant la symétrie du système et le fait qu’on n’a pas de densité de charge dans la région vide). d S Fig. 100: Condensateur plan. + V La grandeur de ce champ constant peut être calculée avec l’Eq. 355: E = σ/εo. La chute de potentiel est égale à l’intégrale curviligne du champ; en prenant une ligne perpendiculaire aux plaques, on trouve que V = Ed = σd/εo. Après avoir multiplié cette équation par S, on trouve que: Giorgio Margaritondo: Ma Physique 264 εoS Q C = V = d . (357) Conclusion: on peut augmenter la capacité d’un condensateur en augmentant la superficie de ses plaques, ou en diminuant la distance entre elles. Il existe aussi une troisième possibilité: remplacer le vide entre les plaques par un matériau isolant, qu’on appelle un diélectrique. Le comportement des diélectriques sera analysé plus loin dans le cours; pour le moment, nous dirons seulement que ce comportement peut être assez bien décrit en remplaçant simplement la constante diélectrique du vide, εo, par le produit εoεr, que nous avons déjà utilisé pour dériver la longueur de Debye: ε r est la constante diélectrique relative du matériau. Afin d’augmenter la capacité, on peut donc utiliser un diélectrique avec une valeur de εr élevée. XLIV.3. Condensateurs en série et condensateurs en parallèle Les condensateurs sont très largement utilisés dans la technologie des circuits électriques. On est toujours en mesure d’obtenir la capacité nécessaire pour une application spécifique, même si les condensateurs à disposition ne la donnent pas directement. Il s’agit de combiner deux ou plusieurs condensateurs. Toutes les combinaisons complexes de condensateurs sont à leur tour composées de deux types de combinaisons simples: parallèle et série, illustrées par la Fig. 101. Essayons d’abord d’analyser la combinaison parallèle. Si on crée une chute de potentiel V entre les plaques, la charge de la plaque positive du premier condensateur est Q1 = C1V et celle du deuxième Q2 = C2V . La charge totale est Q = Q1 + Q2, et la capacité des deux condensateurs en parallèle, étant par définition C = Q/V, est donnée en fonction de C1 et C2 par la formule: C = C1 + C2 . (358) Passons maintenant à la combinaison série. Admettons une charge Q sur la première plaque du premier condensateur, ce qui donne une chute de potentiel V1 = Q /C1. La charge sur la deuxième plaque du même condensateur est -Q, et la neutralité de la partie centrale du système implique une charge Q sur la première plaque du deuxième condensateur. Donc, la chute de potentiel sur celui-ci est V2 = Q /C2; la capacité totale est C = Q/V, où V = V1 + V2 = Q /C1 + Q /C2. On trouve donc que: 1 1 1 C = C1 + C2 , et C1C2 C = C +C , 1 2 (359) qui est la loi bien connue des condensateurs en série. XLIV.4. Energie du champ électrostatique L’analyse de la procédure de charge d’un condensateur, par exemple le condensateur plan de la Fig. 100, nous amène à une découverte fondamentale: on a de l’énergie emmagasinée dans l’espace où on a un champ électrique. Afin de comprendre ce point, calculons l’énergie nécessaire pour charger le condensateur de la Fig. 100. Si les plaques sont neutres au départ, on peut les charger en déplaçant des charges d’une plaque à l’autre. Admettons qu’à un certain point du Giorgio Margaritondo: Ma Physique 265 chargement, la charge est ± q sur les deux plaques; la différence de potentiel est de V = q/C; le travail nécessaire pour déplacer une charge supplémentaire infinitésimale dq est Vdq = qdq/C; le travail total pour porter la charge des plaques de zéro à ± Q est calculé en intégrant: Q ⌠qdq 1 Q2 1 travail = = 2 C = 2 CV2 . ⌡C (360) 0 D’autre part, le champ (constant) entre les deux plaques est de grandeur E =V/d; en utilisant les équations 357 et 360, on obtient: 1 travail = 2 (εoE2)(Sd) . Cette énergie ne peut pas disparaître, et effectivement on peut l’extraire du condensateur, par exemple en le déchargeant sur une résistance (nous discuterons plus loin le chauffage des résistances par des courants). On doit donc penser qu’elle est emmagasinée dans la région d’espace entre les deux plaques, où on a créé le champ électrique en chargeant le condensateur. C C1 C2 C1 C2 Fig. 101: Symboles d’un condensateur isolé, de deux condensateurs en parallèle, et de deux condensateurs en série. Puisque Sd est le volume de cette région, on peut conclure qu’une région où le champ électrique n’est pas nul contient de l’énergie, sa densité (énergie par unité de volume) étant donnée par l’équation: 1 densité d’énergie = 2 (εoE2) , (361) un résultat d’importance fondamentale, qu’on peut étendre du cas particulier du condensateur plan au cas général d’une région quelconque de l’espace où existe un champ électrique. Giorgio Margaritondo: Ma Physique 266 Le Coin Yankee: Conducteur Métal Influence Semiconducteur Condensateur Capacité Série Parallèle Densité d’énergie Conductor Metal Induction Semiconductor Condenser Capacity Series Parallel Energy density “Essentially, the capacity is a parameter that describes how much charge one can store in one of the condenser’s plates by means of a given potential drop.” Le coin des unités et des ordres de grandeur: Capacité Unités SI F (farad) Autres unités Ordres de grandeur: Les condensateurs utilisés pour les circuits électroniques ont des capacités de l’ordre des picofarad (10 -12 F), nanofarad (10-9 F) et microfarad (10- 6 F). En ce qui concerne le pouvoir des pointes, il est important de noter que le champ de claquage de l’air (la grandeur de E à partir de laquelle l’air est ionisé) est de 3 × 106 kV/m environ. Giorgio Margaritondo: Ma Physique 267 XLV. Les courants stationnaires Ayant terminé de traiter le sujet de l’électrostatique, nous sommes maintenant prêts à passer au premier domaine de la dynamique de l’électromagnétisme: les courants stationnaires. Le phénomène le plus simple de courant stationnaire est illustré par la Fig. 102. Une batterie externe crée une chute de potentiel V à travers un conducteur. L’instrument A (ampèremètre) mesure un courant sur le fil externe, qui correspond à un flux de particules chargées dans le matériau conducteur. On appelle intensité de courant, ou courant tout court, la charge qui passe par le conducteur par unité de temps: dq i = dt . (362) R S l A V Fig. 102: Courant stationnaire créé par la chute de potentiel sur une résistance: loi d’Ohm. Notez que cette définition implique que le courant est positif dans la direction du déplacement si la charge qui se déplace est positive, et négatif si la charge est négative. Sur le plan macroscopique et empirique, on constate que le courant dépend de façon linéaire de la chute de potentiel, et sa direction est telle qu’une charge positive (négative) se déplace dans la direction dans laquelle le potentiel diminue (augmente): V i = R . (363) L’Eq. 363 est la loi d’Ohm bien connue. La constante de proportionnalité R est dite résistance du corps conducteur; on constate empiriquement que la résistance dépend tant de la géométrie que de la composition et de la microstructure du corps. En notant S sa superficie perpendiculaire à la direction du courant, et l sa longueur parallèle à cette direction: l R=ρS , (364) Giorgio Margaritondo: Ma Physique 268 où la constante ρ (qu’on ne doit pas confondre avec la densité de charge, ρ, malgré la similarité des symboles) est la résistivité du matériau qui forme le conducteur. On utilise souvent le réciproque de cette quantité, qu’on appelle conductivité du matériau: 1 σ=ρ , (365) (à ne pas confondre avec la densité de superficie de charge, σ). En passant de la description macroscopique du phénomène au plan microscopique, on utilise le vecteur densité de courant, j, qui est défini par l’équation: i = ΦΣ(j) , (366) où i est l’intensité de courant qui passe par la superficie Σ, et qui est égale au flux du vecteur densité de courant par cette superficie. On peut mieux comprendre cette définition un peu compliquée si on la considère dans le cas simple de la Fig. 102: le vecteur densité de courant est évidemment dans la direction perpendiculaire à la superficie S, et sa grandeur est donnée par j = i/S. Avec ces hypothèses, effectivement, si vous calculez le flux de ce vecteur par S vous obtenez simplement le produit de j et de S, qui donne (i/S)S = i. Georg Simon Ohm James Prescott Joule André Ampère Nous réalisons de cette manière que la grandeur de la densité de courant est l’intensité de courant par unité de superficie, si l’on prend la superficie dans la direction perpendiculaire au mouvement de charges qui donne le courant. Cette définition permet de traiter, non seulement les courants homogènes (Fig. 101, par exemple), mais aussi ceux qui changent d’un point à l’autre. Nous pouvons manipuler la loi d’Ohm en utilisant le concept de densité de courant; prenons encore le cas simple de la Fig. 102: nous avons j = i/S = [vu l’Eq. 363] = V/RS = [vu les Eq. 364 et 365] = Vσ/l. Mais V/l correspond à la grandeur du champ électrique, E, et donc la loi d’Ohm devient: j = σE . (367) Le courant et la densité de courant sont produits par le mouvement des particules libres et chargées dans le conducteur. Ces charges libres se comportent un peu comme les particules d’un gaz; même sans chute de potentiel, elles se meuvent au niveau microscopique, et dans le cas d’un gaz parfait classique la vitesse quadratique moyenne Giorgio Margaritondo: Ma Physique 269 est liée à la température. Ce mouvement ne donne pas un courant macroscopique, parce que la vitesse (vecteur) moyenne est nulle. Par contre, une chute de potentiel dans une direction donnée crée un mouvement préférentiel des particules chargées dans la même direction: la vitesse (vecteur) moyenne n’est plus nulle. Nous adopterons le modèle simplifié suivant: à cause de la chute de potentiel et du champ électrique qui lui correspond, toutes les particules chargées se meuvent à une vitesse égale à la vitesse moyenne v. Considérons alors la Fig. 103: on voit quatre des charges d’un conducteur qui se meuvent à la vitesse v dans la direction d’une chute de potentiel. Analysons le flux de charges qui passe par la superficie S pendant un temps t. On peut bien voir que pendant ce temps les particules 1, 2 et 3 arrivent à passer par S, tandis que la particule 4 n’y arrive pas. En général, seules les particules qui se trouvent initialement à une distance de moins de vt sont en mesure de passer par S. Il s’agit évidemment des particules contenues dans le cylindre ombré de la Fig. 103, dont la base est S et la longueur vt . Si le conducteur contient n particules chargées libres par unité de volume, chacune ayant une charge de grandeur q, la charge totale qui passe par S pendant le temps t est de (Svt)nq; le courant est par définition i = (Svt )nq/t = (Sv)nq, et la grandeur de la densité de courant est obtenue en divisant le courant par S: j = nqv . (368) La densité de courant est donc liée à la vitesse moyenne des charges qui se déplacent. vt 1 2 3 S 4 q Fig. 103: Relation de la densité de courant et du mouvement microscopique des charges. Nous parlons ici de courants stationnaires. Cet adjectif veut dire que, même si les charges se déplacent et que l’on n’est pas dans le domaine de l’électrostatique, leur mouvement demeure constant par rapport au temps. Plus spécifiquement, si le courant est stationnaire, la densité de courant (qui est évidemment un champ vectoriel) ne dépend pas du temps. Selon l’Eq. 367, cette propriété implique que la vitesse moyenne de déplacement des charges ne dépend pas du temps non plus: on n’a pas d’accélération. Ce résultat peut paraître un peu surprenant. La loi d’Ohm montre qu’un courant stationnaire est causé dans une résistance par une chute de potentiel constante par rapport au temps, qui à son tour correspond à un champ électrique constant (Eq. 363 et 367). Mais un champ constant devrait soumettre les charges à une force constante, et donc à une accélération! Comme peut-on donc justifier l’absence d’accélération, et quelles en sont les conséquences pratiques? Giorgio Margaritondo: Ma Physique 270 La justification est fournie par les mécanismes microscopiques produisant la résistance. Une particule qu’on dit “libre” de se déplacer dans un conducteur ne l’est pas pleinement. Soumise au champ électrique qui cause le courant, elle est tout d’abord accélérée; mais ensuite, elle est diffusée par des “obstacles” microscopiques qui prennent au moins une partie de son énergie cinétique. Par exemple, par des impuretés ou par des vibrations thermiques des atomes du corps. L’accélération est donc interrompue, et la vitesse qu’elle avait produite est réduite ou supprimée. Ensuite, la charge est à nouveau accélérée, jusqu’à un nouveau processus de diffusion. Le courant est maintenu grâce à la succession de phases d’accélération et d’annulation de vitesse, qui a lieu pour chacune des charges “libres”. Ainsi, un champ électrique et sa force ne donnent pas un courant qui augmente, mais un courant stationnaire; un peu, si vous voulez, comme l’action continue des forces qui mettent une voiture en mouvement donne souvent une vitesse constante au lieu d’une accélération, à cause du frottement. Les supraconducteurs constituent une exception importante à la règle qu’un courant stationnaire exige un champ électrique constant. Les matériaux qui deviennent supraconducteurs à basse température n’ont pas de résistance, et donc sont en mesure d’avoir des courants stationnaires sans aucun champ électrique. XLV.1. L’effet Joule Parmi les conséquences des phénomènes microscopiques qui causent la résistance, il en est une qui est particulièrement importante: la dissipation d’énergie par les résistances. On peut facilement réaliser qu’on a dissipation d’énergie, parce que la force du champ électrique qui crée un courant stationnaire produit un travail, mais n’augmente pas l’énergie cinétique moyenne des charges: le courant stationnaire, nous l’avons vu, correspond à un déplacement des charges à vitesse moyenne constante. Prenons une charge q qui contribue au courant. La force du champ est qE, et son travail par unité de temps (puissance) est qEv, où v est la vitesse moyenne. En considérant la Fig. 102, on réalise que le nombre total des charges qui participent au courant est nlS, et donc la puissance totale est nlSqEv. D’autre part, l’Eq. 368 donne nqv = j, et donc la puissance totale est lSjE. L’Eq. 367 (loi d’Ohm) donne à son tour E = j/σ = jρ, et la puissance devient alors lSj2ρ = (ρl/S)(j2S2) = Ri2. Cette puissance ne se retrouve pas sous forme d’énergie cinétique des charges; elle est observée sous forme de chaleur, par exemple de chauffage de la résistance. En conclusion, tout passage de courant dans une résistance comporte une dissipation d’énergie par effet Joule, dont la puissance est: P = Ri2 = V2/R . (369) XLV.2. Résistances en série et en parallèle Les résistances qu’on utilise dans les circuits électriques peuvent être combinées pour obtenir les valeurs dont on a besoin. Comme pour les condensateurs, toutes les combinaisons complexes sont formées par des combinaisons de base du type série ou parallèle, illustrées par la Fig. 104. Giorgio Margaritondo: Ma Physique 271 Essayons de calculer, tout d’abord, la résistance équivalente à la combinaison série. Les chutes de potentiel sur les deux résistances sont, selon la loi d’Ohm, V1 = iR1 et V2 = iR2. La chute de potentiel totale sur les deux résistances est V = V1 + V2. La résistance totale R est par définition V/i, et donc: R = R1 + R2 . (370) R R1 R2 R1 R2 Fig. 104: Résistance individuelle, résistances en série et résistances en parallèle. Par contre, si les deux résistances sont en parallèle, leurs courants i1 et i2 n’ont pas la même intensité. La chute de potentiel est V pour les deux, et donc on doit avoir, selon la loi d’Ohm, V = i1R 1 = i2R 2; d’autre part, R = V/i, où i est le courant total, i = i1 + i2 = V/R1 + V/R2. Donc: 1 1 1 = + R R1 R2 , et R1R2 R = R +R . 1 2 (371) XLV.3. Force électromotrice Les phénomènes impliquant des courants stationnaires n’appartiennent pas à l’électrostatique, et on ne peut pas leur appliquer automatiquement les lois fondamentales de l’électrostatique. On peut pourtant constater que la loi de Gauss n’est pas modifiée par les courants. Par contre, l’Eq. 336 n’est plus valable: dans le cas de la Fig. 102, par exemple, si nous calculons l’intégrale sur une ligne qui passe dans la résistance, dans la batterie et dans les fils de connexion, le résultat n’est pas nul mais égal à la chute de potentiel V. Les chutes de potentiel qui créent des courants sont appelées forces électromotrices, et les instruments qui les créent, tels que la batterie de la Fig. 102, sont des générateurs de force électromotrice. On doit faire attention à ne pas confondre un générateur idéal de force électromotrice, c’est-à-dire un système qui ne provoque qu’une chute de potentiel, et un générateur réel tel qu’une batterie. Celui-ci est équivalent à un générateur idéal en série avec une résistance, dite résistance interne Ri du générateur. Giorgio Margaritondo: Ma Physique 272 Supposons l’utilisation d’un générateur réel pour créer un courant stationnaire sur une résistance R. Le circuit est équivalent à celui de la Fig. 105: on a en série la résistance externe et la résistance interne Ri. Par conséquent, le courant sur la résistance externe n’est pas V/R, mais V/(R + Ri). R Ri V Générateur de fem Fig. 105: Générateur réel de force électromotrice, connecté à une résistance externe R. Calculons maintenant la puissance dissipée sur la résistance externe: elle est i2R = (V/(R + Ri))2R . On peut maximiser cette puissance en choisissant la valeur de R qui annule la dérivée de (R + R i)-2R, ce qui donne R = R i. On dit alors que la résistance externe est adaptée à la résistance interne du générateur de force électromotrice. XLV.4. Equation de continuité Les courants, stationnaires ou non stationnaires, sont toujours soumis à un principe fondamental: celui de conservation de la charge électrique. Il n’existe pas de phénomènes qui créent ou détruisent des charges, augmentant ou diminuant ainsi la charge totale concernée. Quelles sont les conséquences de cette loi de conservation? Considérons la région de l’espace illustrée par la Fig. 106. On voit des courants (i2 et i3) qui amènent des charges dans cette région, mais aussi des courants qui les font diminuer (i1 ). En vertu du principe de conservation de la charge électrique, le bilan de ces deux types de courants doit correspondre à l’augmentation ou à la diminution de la charge qui se trouve dans la région. Nous adopterons la convention suivante en ce qui concerne le signe des courants: ils sont positifs s’ils diminuent la charge (positive) à l’intérieur de la région. Donc, les courants i 2 et i 3 sont négatifs, tandis que i 1 est positif. Avec cette convention, la conservation de la charge conduit à la relation suivante: ∂Q (i1 + i2 + i3) = − ∂t , (372) ce qui veut dire que le bilan des courants correspond au changement par unité de temps de la charge contenue dans la région. Giorgio Margaritondo: Ma Physique 273 Cette relation peut être facilement généralisée: le courant total dans une situation quelconque est donné par le flux de la densité de courant par la superficie externe de la région (notée Σ). D’autre part, la charge dans la région est l’intégrale de la densité de charge ρ, pour le volume correspondant, VΣ. La forme générale de l’Eq. 372 est donc: ∫Σ j• n^ds ⌠ ∂ρ ∂ = - ∂t ∫ ρdτ = - ⌡ ∂t dτ ; VΣ VΣ i2 i1 Q i3 Fig. 106: Dérivation de l’équation de continuité à partir du principe de conservation de la charge électrique. le théorème de la divergence et du flux nous permet de manipuler la première partie de cette équation, obtenant ainsi: ⌠ ∂ρ dτ ; (∇ • j) dτ = ∫ ⌡ ∂t V Σ VΣ puisque cette équation peut être dérivée pour n’importe quelle région, elle implique l’égalité des fonctions à intégrer: ∇•j + ∂ρ ∂t = 0 , (373) relation qu’on appelle équation de continuité. XLV.5. Lois de Kirchhoff Passons maintenant à des formules simples, qu’on peut dériver des lois générales de l’électromagnétisme, et qui sont très utiles pour l’analyse des circuits électriques: les deux lois de Kirchhoff. Prenons un circuit quelconque, comme celui de la Fig. 107: on peut identifier deux types de constituants: les noeuds et les parcours fermés. Pour chacun des noeuds, on peut appliquer la conservation de la charge et l’équation de continuité. Puisque la charge dans un noeud ne change pas, la somme des courants doit être nulle. On peut donc écrire la première loi de Kirchhoff: Giorgio Margaritondo: Ma Physique 274 Σk ik = 0 , (374) où la somme est faite pour tous les courants qui arrivent sur le noeud ou partent du noeud. Chaque courant a son signe; si l’on utilise la même convention que pour l’équation de continuité, celui-ci est positif si le courant part du noeud et vice-versa; notez pourtant que la convention opposée est souvent adoptée dans l’analyse des circuits. noeud R1 R3 fem1 fem2 R2 R4 fem3 R5 R6 Fig. 107: Constituants d’un circuit qui sont concernés par les deux lois de Kirchhoff: noeuds et parcours fermés (le chemin ombré). La deuxième loi de Kirchhoff concerne les chemins fermés, et constitue une généralisation de la loi d’Ohm; elle remplace la loi de la circulation (Eq. 336) qui est valable seulement pour le cas de l’électrostatique. Sur un chemin fermé, tel que celui ombré de la Fig. 107, on peut trouver des branches avec des courants et des générateurs de force électromotrice. La somme des forces électromotrices (fem1 et fem3 dans le cas du chemin ombré de la Fig. 107) est égale à la somme des produits “ohmiques” courant par résistance (i1R 1, i2 R 2 et i5 R 5 pour le même chemin de la Fig. 107, où i1 , i2 et i3 sont les courants des résistances R1, R2 et R3). En général: Σk Rkik = Σkfemk , (375) où la somme doit comprendre toutes les branches du chemin fermé considéré. Notez que chaque force électromotrice et chaque courant de l’Eq. 375 doivent avoir leur signe correct. Premièrement, on doit sélectionner la direction du chemin, par exemple la direction des aiguilles d’une montre. Ensuite, le signe de chaque force électromotrice et de chaque courant peut être facilement trouvé si l’on prend pour référence la loi d’Ohm (Eq. 363 et Fig. 102): une force électromotrice est positive si, sur le parcours, on passe d’abord par le pôle négatif, et ensuite par le pôle positif. Un courant est simplement positif si sa direction coïncide avec celle du parcours fermé, autrement il est négatif. En essayant de calculer les courants d’un circuit, on doit sélectionner un nombre suffisant de noeuds et de parcours fermés, écrire les équations de Kirchhoff, et trouver leur solution: il s’agit d’un système d’équations linéaires, donc très faciles à résoudre. Giorgio Margaritondo: Ma Physique 275 Le Coin Yankee: Courant Résistance Résistivité Conductivité Force électromotrice Circuit Energie dissipée Résistance interne Conservation de la charge Equation de continuité Noeud Current Resistance Resistivity Conductivity Electromotive force Circuit Dissipated energy Internal resistance Charge conservation Continuity equation Node “Let us consider the region illustrated by Fig. 106. One sees currents (i2 and i3) that carry charge into this region, but also currents that tend to decrease it (i1). The principle of conservation of the electric charge requires the balance of the currents of the first and second type to correspond to the increase or decrease of the charge stored in the region.” Le coin des unités et des ordres de grandeur: Courant Densité de courant Unités SI A (ampère) = C/s A/m2 Résistance Résistivité Conductivité Ω (ohm) Ωm Ω 1m - 1 Force électromotrice V (volt) Autres unités A / c m 2 = 10- 4 A/m2 Ω cm = 10-2 Ω m Ω -1c m - 1 = 102 Ω -1 m - 1 Ordres de grandeur: La résistivité d’un isolant est de l’ordre de 106 - 1018 Ω cm. La résistivité d’un métal est de 10 -6 - 10-4 Ω cm. La résistivité d’un supraconducteur (dans la phase de supraconductivité) est effectivement nulle. La résistance interne d’un élément de batterie voltaïque est typiquement de 0,05 - 100 Ω . Giorgio Margaritondo: Ma Physique 276 XLVI. La magnétostatique: force de Lorentz Ce chapitre introduit un nouvel élément de l’électromagnétisme: le champ magnétostatique. Notre discussion de ses propriétés commence par quelques observations empiriques. Prenons l’expérience illustrée par la Fig. 108: on peut voir un fil conducteur avec un courant i, et une charge électrique q qui se déplace à vitesse v. On constate que la charge est soumise à une force dans la direction perpendiculaire à la vitesse. Les expériences sur ce phénomène démontrent que sans vitesse, on n’a pas de force: celle-ci n’est pas une force électrostatique du type force de Coulomb (nous verrons pourtant que cette conclusion devra être partiellement modifiée à l’aide de la relativité). v i f q Fig. 108: Une charge électrique qui se déplace est soumise à la force causée par un courant. Les expériences suggèrent également la présence d’un deuxième champ créé par le courant, qui n’est pas le champ électrostatique (la charge totale du fil est nulle grâce à l’équilibre des charges libres et des charges fixes). On appelle ce champ mystérieux le champ magnétique, B (où plus spécifiquement le champ d’induction magnétique). Pour l’instant, nous traiterons seulement le cas des champs magnétiques qui ne changent pas en fonction du temps: c’est le domaine qu’on appelle la magnétostatique. En développant la théorie du champ magnétostatique, nous suivrons l’approche suggérée par notre traitement du champ électrostatique: d’abord, nous donnerons la définition du champ B, c’est-à-dire la manière de le mesurer. Ensuite, nous discuterons les équations qui présentent les relations entre le champ et ses causes. Nous verrons qu’il existe une certaine correspondance entre les lois fondamentales de la magnétostatique et celles de l’électrostatique. En ce qui concerne la définition de B, on constate qu’une charge électrique q, dans une région où existe un champ magnétique, est soumise à une force proportionnelle à sa vitesse, donnée par l’équation: f = qv × B ; (376) on peut généraliser cette équation en considérant la force causée par un éventuel champ électrique dans la même région: Giorgio Margaritondo: Ma Physique 277 f = q(E + v × B) ; (377) la force est donc la somme de la force du champ électrique et de la force de Lorentz, qv × B, causée par le champ magnétique. Notez que l’équation 377 est la définition tant du champ électrique que du champ magnétique, puisqu’elle décrit la manière de les mesurer: on doit faire des mesures de force, de charge et de vitesse; on peut distinguer la force du champ magnétique et celle du champ électrique en faisant des mesures à vitesse nulle, afin d’annuler la force de Lorentz. Celle-ci a une propriété très importante: vu l’Eq. 376 et les règles du produit vectoriel, la force est perpendiculaire à la vitesse, donc selon la mécanique elle ne fait pas de travail. La force de Lorentz ne cause jamais de changement de l’énergie cinétique. La force de Lorentz est perpendiculaire à la vitesse, aussi bien que son accélération: celle-ci change la direction de la vitesse, mais pas sa grandeur. XLVI.1. La relativité révèle le secret bien caché du champ magnétique "The magnetic field is the price the good Lord pays for the beauty of relativity." G. Margaritondo, 1988 Au début de la magnétostatique, nous avons catégoriquement déclaré que la force de la Fig. 108 ne peut pas être une force électrostatique, puisque son existence exige une vitesse non nulle de la charge. Nous allons maintenant découvrir que cette conclusion était peut-être un peu prématurée. Nous verrons plus loin que le champ B causé par le courant i au point P où se trouve la charge q (voir la Fig. 109) est tangent au cercle dans le plan perpendiculaire au courant. Le champ est orienté dans la direction qui suit la règle du tire bouchon par rapport au courant, et sa grandeur est de: µo i B= , 2π r (378) où µoest la constante universelle qu’on appelle permeabilité magnétique du vide (dont la grandeur dans le système SI est de 1,26 × 10-6 kg m/C2 environ, ou plus précisément 4π × 10-7 kg m/C2) et r est la distance entre le fil (le courant) et le point P (la charge). La grandeur de la force dans la Fig. 108 est donc: µo ivq f= . 2π r (379) A ce point, je vous invite à réfléchir sur les propriétés que nous avons énoncées, afin de réaliser que quelque chose “ne joue pas”. Admettons que nous nous déplaçons à vitesse constante en suivant la charge q, c’est-àdire que nous avons changé notre référentiel; dans le nouveau référentiel, la vitesse de Giorgio Margaritondo: Ma Physique 278 la charge devient zéro, et donc la force de Lorentz devrait être nulle, ce qui n’est pas le cas. La physique classique prévoit au contraire que la force ne change pas d’un référentiel à l’autre. i O r P B Fig. 109: Géométrie du champ magnétique causée par un fil droit avec un courant i. Mais où est donc passée, cette force du diable? Voilà un joli paradoxe, qui devrait vous priver de sommeil (si vous étiez même modérément intéressés/ées à la culture). La solution ne peut pas nous être fournie par la physique classique: on doit invoquer la relativité, et plus spécifiquement ce bel effet relativiste qu’on a appellé la contraction de Lorentz: mesurée du point de vue d’un référentiel qui se déplace, une longueur diminue (Eq. 110). Analysons de nouveau la situation du point de vue du référentiel qui voyage avec la charge: sa vitesse par rapport au fil est v. Celle-ci est aussi la vitesse par rapport aux charges fixes du fil métallique. Par contre, la vitesse par rapport aux charges libres du courant doit être corrigée pour tenir compte du mouvement de celles-ci. Donc, la contraction de Lorentz n’est pas la même pour les charges “fixes” et “libres”. D’autre part, la contraction de Lorentz change la densité des charges tant fixes que libres. La différence de contraction entre les deux types de charges implique une différence de densité. Donc, l’équilibre des deux densités qui donnait une charge nulle pour le fil dans son référentiel n’existe plus dans le référentiel en mouvement. La charge du fil, vue de celui-ci, n’est plus nulle, et donne une force électrostatique sur la charge q. Nous verrons que cette force est précisément la force de Lorentz. Donc, le champ magnétique est un produit de la relativité: une force électrostatique dans un référentiel devient la force magnétique de Lorentz dans l’autre, grâce à la contraction relativiste des longueurs. Sur le plan quantitatif: analysons la situation du premier référentiel, en admettant que le fil de la Fig. 108 (dont la section est s) a une charge fixe Qf et une charge libre Ql sur un trait de longueur l. La densité des charges fixes est ρf = Qf/ls, et celle des charges libres ρl = Ql/ls. Ces deux densités sont égales et opposées: ρf + ρl = 0; donc le fil est neutre, et dans le premier référentiel la charge externe q de la Fig. 108 ne subit que la force de Lorentz de l’Eq. 379. Changeons maintenant le référentiel et déplaçons-nous avec la charge externe q: la charge fixe Q f se déplace à vitesse -v dans ce référentiel, donc la longueur l qu’elle occupe subit la contraction relativiste (Eq. 110) et devient l(1 - v2/c2)1/2. La densité des Giorgio Margaritondo: Ma Physique 279 charges fixes est, à son tour, Q f/sl(1 - v 2/c 2)1/2. D’autre part, la vitesse des charges libres est -(v - vl), où vl est la vitesse moyenne qui correspond au courant i (c’est-à-dire, en utilisant les Eq. 366 et 368, i = ρ lv ls); donc, la contraction relativiste est l(1 - (v vl)2/c2)1/2, et la densité des charges libres est Ql/sl(1 - (v - vl)2/c2)1/2. Dans ce référentiel, les deux densités des charges fixes et libres ne s’annulent pas réciproquement: on a une densité totale Qf/sl(1 - v2/c2)1/2 - Ql/sl(1 - (v - vl)2/c2)1/2 = ρ f/(1 - v2/c2)1/2 - ρ l/(1 - (v - vl)2/c2)1/2 = ρ l((1 - v2/c2)-1/2 - (1 - (v - vl)2/c2)-1/2). On peut montrer4 que cette expression est approximativement égale à ρlvlv/c2; la force f subie par la charge q à cause de cette densité des charges dans le fil est 5 (ρlvlsv/c2)q/2πεor, c’est-à-dire: 1 ivq ; f= 2πεoc2 r (380) expression qui est effectivement équivalente à l’Eq. 379 si: µoεoc2 = 1 ; (381) voilà une très intéressante relation de trois constantes fondamentales, µo, εo, et c: nous retrouverons cette relation plus tard dans la théorie des ondes. XLVI.2. Les lois de la magnétostatique: formes non-locales Nous avons déjà mentionné qu’il existe une similarité formelle entre la théorie du champ magnétostatique et celle du champ électrostatique. Les lois fondamentales du champ électrostatique sont les équations 313 et 336 (formes non-locales): ΦΣ = ∫Σ E • ^n ds = Q εo , o ∫ E • dl = 0, L ou les équations 320 et 335 (formes locales): ρ ∇ • E = εo . ∇×E=0. Ces équations électrostatiques ont été dérivées à partir de propriétés empiriques. Pour la magnétostatique, nous adopterons la procédure inverse: nous énoncerons d’abord ses lois fondamentales, puis nous utiliserons celles-ci pour en dériver des propriétés empiriques. 4 L’approximation est dérivée en utilisant le fait que v 2 /c 2 << 1 et, en général, v << v. On a: (1 l v2/c2)-1/2 ≈ 1 + v2/2c2 et (1 - (v - vl)2/c2)-1/2 ≈ 1 + (v - vl)2/2c2 ≈ 1 + v2/2c2 - vlv/c2; donc, (1 - v2/c2)1/2 - (1 - (v - vl)2/c2)-1/2 ≈ vlv/c2. 5 La force peut être facilement dérivée en utilisant le théorème de Gauss, appliqué à une superficie cylindrique dont l’axe est le fil métallique. Giorgio Margaritondo: Ma Physique 280 Voici donc les lois fondamentales de la magnétostatique, considérées dans le vide comme nous l’avons fait pour l’électrostatique; tout d’abord, les formes non-locales: ΦΣ(B) = ∫Σ B • ^n ds = 0 , (382) o ∫ B • dl = µoi . (383) L Quel est le message de ces deux lois? Essayons de les comprendre en les comparant à celles de l’électrostatique. L’Eq. 382 correspond au théorème de Gauss pour l’électrostatique; celui-ci mettait en relation le flux et les charges électriques. Dans le cas de la magnétostatique, nous trouvons zéro: la raison en est que les “charges magnétiques” n’existent pas. On peut comprendre ce point fondamental si l’on considère quelques phénomènes de magnétisme élémentaire. On constate que la présence d’un champ magnétique est liée à la présence de courants électriques ou d’aimants. Nous verrons que le champ magnétique des aimants est causé par leurs courants microscopiques au niveau atomique. En tout cas, ni les courants macroscopiques ni les aimants ne correspondent à des “charges magnétiques” isolées. Ce résultat empirique est illustré par la Fig. 110. On observe la différence entre les “objets” électriques et magnétiques élémentaires: des charges (monopoles) électriques isolées, et des aimants ou dipôles magnétiques. n (nord) q (a) s (sud) n n s n s (b) n s n s s Fig. 110: Non-existence des “charges magnétiques”. (a) On a des charges électriques isolées telles que q, mais dans un aimant on n’a que la combinaison de deux pôles magnétiques n et s, ce qu’on appelle un dipôle. (b) Si l’on essaie de couper un aimant en deux afin de séparer la “charge magnétique” ou pôle nord de la “charge magnétique” sud, on n’y parvient pas: on obtient deux dipôles. Si on essaie encore, on obtient toujours le même résultat. Giorgio Margaritondo: Ma Physique 281 Le champ magnétique, donc, n’est pas le produit de “charges” isolées. Sa relation avec ses causes - les courants macroscopiques et microscopiques - est exprimée par l’Eq. 383, dite loi d’Ampère ou loi du rotationnel: o ∫ B • dl = µoi . L Cette loi, dont la géométrie est illustrée par la Fig. 111, nous dit que la circulation, c’està-dire l’intégrale curviligne sur un parcours fermé, du champ B est proportionnelle au courant total qui passe à l’intérieur de ce parcours (c’est-à-dire le courant qui passe par une superficie quelconque définie par la ligne L). i3 i2 i1 Σ L Fig. 111: Géométrie de la loi d’Ampère: dans le cas illustré ici, le courant total qui passe par le chemin fermé d’intégration, L, est i = i1 + i2 - i3. Notez, dans la Fig. 111, les directions du courant total et de la ligne L: comparez-les à celles de la Fig. 94 (théorème du rotationnel et de la circulation). La loi d’Ampère est donnée par l’Eq. 383 si l’on admet que la direction positive du courant suit la règle du tire bouchon par rapport à la direction d’intégration sur L. XLVI.3. Les lois de la magnétostatique: formes locales Avant de passer aux applications pratiques des deux lois fondamentales de la magnétostatique, voyons leurs formes locales, qu’on peut facilement dériver en utilisant les théorèmes du calcul vectoriel. Le théorème du flux et de la circulation, par exemple, montre que le flux nul de l’Eq. 382 implique une divergence nulle partout: ∇•B = 0, (384) équation qui exprime l’effet local de la non-existence de “charges magnétiques”. Passons maintenant à la forme locale de la loi d’Ampère, Eq. 383. Vu le théorème du rotationnel et de la circulation (Eq. 334), la circulation de B est donnée par: o ∫ B • dl = ΦΣ(∇ × B) , L où la superficie Σ pour laquelle on calcule le flux du rotationnel : (385) Giorgio Margaritondo: Ma Physique ΦΣ(∇ × B) = 282 ∫Σ (∇ × B) • ^n ds est du type qu’on avait utilisé pour définir le courant i qui passe par la ligne fermée L. On peut donc évaluer ce courant en prenant le flux de la densité de courant par Σ: i = ΦΣ(j) ; (386) cette équation, combinée avec la loi d’Ampère (Eq. 383) et l’Eq. 385, amène à: ΦΣ(∇ × B) = µoΦΣ(j) ; (387) d’autre part, cette égalité est valable pour n’importe quelle superficie du type considéré, et donc elle implique l’égalité des deux vecteurs dont on prend le flux: ∇ × B = µoj , (388) qui est la forme locale de la loi d’Ampère. Notez la différence entre cette loi et la loi du rotationnel du champ électrostatique, Eq. 335, qui est toujours nul. Le fait que le rotationnel et la circulation de B ne soient pas nuls n’a pourtant aucune conséquence sur la conservation de l’énergie mécanique, puisque la force de Lorentz donnée par le champ magnétique ne produit pas de travail. XLVI.4. Le champ magnétique d’un courant stationnaire sur un fil droit Commençons maintenant à utiliser les lois fondamentales de la magnétostatique pour résoudre des problèmes pratiques. Le premier est celui du champ magnétique produit par un courant i sur un fil droit, tel que celui de la Fig. 109. Il s’agit de dériver l’Eq. 378, que nous avons déjà présentée et utilisée. La symétrie du problème exige que la grandeur du champ B ne change pas sur un cercle, par exemple sur le cercle de rayon r de la Fig. 109. On peut également démontrer que la symétrie et les lois fondamentales de la mécanique exigent que le champ soit orienté comme montré par cette figure. Il est clair que le cercle susmentionné est le parcours le plus efficace pour le calcul de la circulation de la loi d’Ampère, Eq. 383. Puisque B est toujours tangent à la ligne d’intégration, la circulation est égale à la grandeur B multipliée par la longueur de la ligne, 2πr. L’Eq. 383 donne 2πrB = µoi, et nous obtenons immédiatement l’Eq. 378: µo i B = 2π r . XLVI.5. Spires et solénoïdes Prenons maintenant le cas plus général du champ magnétique créé par un courant stationnaire quelconque sur un fil quelconque. On peut toujours décomposer ce fil en petits traits infinitésimaux dl, comme montré par la Fig. 112. Le champ magnétique infinitésimal dB produit au point P par le trait dl sur lequel on a un courant i est: Giorgio Margaritondo: Ma Physique 283 µoi dl × R dB = 4π , R3 (389) où R est le vecteur qui donne la position du point P par rapport au trait dl. Le champ total B produit par tous les éléments du fil au point P est calculé en prenant la somme, c’est-à-dire l’intégrale, des contributions infinitésimales dB: B = ∫dB fil µoi = 4π ⌠ dl × R . ⌡ R3 (390) fil La dérivation de cette équation, qu’on appelle loi de Biot et Savart, se base sur la propriété de superposition du champ magnétique: le champ produit par plusieurs courants est la somme des champs produits individuellement par chacun des courants. Cette propriété, qui a des points communs avec le principe de superposition de l’électrostatique, est une des conséquences de la loi d’Ampère, équations 383 et 388. L’équation 389, que nous avons donnée sans démonstration, peut pourtant être dérivée directement de la loi du rotationnel. Nous ne discuterons pas cette dérivation, mais contrôlerons par contre la validité de l’Eq. 389 dans un cas particulier, en l’utilisant pour calculer le champ produit par un fil droit, et en retrouvant (de moins nous espèrons) encore une fois l’Eq. 378. dB i P dl R Fig. 112: Champ magnétique créé par un courant quelconque: on décompose le fil sur lequel on a un courant i en traits infinitésimaux dl. Le champ dB produit par le trait dl au point P est donné par l’Eq. 389. Le champ total produit par le fil est la superposition (c’est-à-dire l’intégrale) des contributions dB de chacune de ses parties dl. Considérons la Fig. 113; la grandeur dB du champ dB produit par le trait infinitésimal dl est: µoi (dl) sinθ µoi (dl) r µoi (dl) r dB = 4π = 4π = 4π 2 2 3/2 , 2 3 R (r R +l ) (391) où R, r, dl et l sont les grandeurs des vecteurs correspondants. Passons maintenant au champ total: Giorgio Margaritondo: Ma Physique 284 ∞ ∞ ⌠ ⌠ µ dη i µ i r dl o o 2 2 3/2 = [en notant η = l /r] = B = 2 = ⌡ 4π (r + l ) 4πr ⌡ (1 + η2)3/2 0 -∞ ∞ µoi η µoi = 2πr = 2πr , √ 1 + η2 0 (392) et nous avons heureusement retrouvé la formule 378, ce qui confirme la validité de la loi de Biot et Savart, Eq. 389. Jean-Baptiste Biot, co-auteur de la loi de Biot-Savart, et l’un de ses autographes. i dl θ R l r P dB Fig. 113: Calcul du champ magnétique d’un courant sur un fil droit, à partir de la loi de Biot et Savart, Eq. 389. On peut utiliser la formule 378 pour calculer la force entre deux courants droits et parallèles i1 et i2, à la distance r l’un de l’autre (Fig. 114). Prenons un trait infinitésimal de longueur dl sur le deuxième fil, et admettons que le courant i2 est produit par le Giorgio Margaritondo: Ma Physique 285 mouvement à vitesse v des charges libres sur ce fil, dont la densité (charge libre par unité de longueur) est ξ. Les équations 366 et 368 donnent j2 = ξv/S (où S est la section du fil) et i2 = j2S = ξv . D’autre part, la force de Lorentz df2 sur la charge libre du trait dl , qui est ξdl et qui se meut à vitesse v, est ξ(dl )vB, où la grandeur du champ magnétique B produit par le premier courant au trait dl est (µoi1/2πr). Donc, df2 = ξ(dl)v(µoi1/2πr) = (µoi1i2/2πr)dl. La force totale est obtenue en intégrant sur toute la longueur du fil, L2: µoi1i2 f2 = 2πr L2 . (393) La force produite par le deuxième fil sur le premier peut évidemment être calculée par le même procédé. Passons maintenant à des exemples d’applications de la loi de Biot et Savart (Eq. 389) pour le calcul de champs magnétiques comme celui produit par un fil circulaire avec un courant i, ce qu’on appelle une spire (voir la Fig. 115). Nous nous limiterons à considérer le cas simple du champ sur l’axe de la spire. Pour des raisons de symétrie, supposons que le champ est orienté dans la direction de l’axe. Calculons donc sa grandeur B à l’aide des équations 389 et 390: B = ⌠ µoi dl cos(π/2 - α) = µoi r ∫ dl , ⌡ 4π R2 4π R3 spire spire i1 i2 r B df2 dl Fig. 114: Calcul de la force entre des courants droits et parallèles i1 et i2. ce qui donne, puisque l’intégrale n’est que la longueur de la spire 2πr: µoi r2 B = 2 2 3/2 2 (r + x ) . En particulier, le champ au centre de la spire (x = 0) est: (394) Giorgio Margaritondo: Ma Physique 286 µoi B = 2r . (395) Nous reprendrons plus loin la discussion de ce résultat. Pour l’instant, remarquons que le champ change assez rapidement en fonction de la position par rapport à la spire. De toute évidence, une spire ne fournit pas la solution au problème de la production d’un champ magnétique uniforme. i Fig. 115: Calcul du champ magnétique d’une spire circulaire avec un courant . x r R P α dB dl On obtient une solution en combinant deux spires, ce qu’on appelle une bobine de Helmoltz, illustrée par la Fig. 116. On peut constater que les variations sur l’axe des champs des deux spires tendent à se compenser réciproquement dans la région centrale. On obtient un champ approximativement homogène dans cette région, surtout si la distance entre les deux spires est proche du rayon. d 2r Fig. 116: La bobine d’Helmoltz, composée de deux spires, produit un champ magnétique approximativement homogène dans sa région centrale . i i Giorgio Margaritondo: Ma Physique 287 La manière la plus efficace de produire un champ homogène est pourtant l’utilisation d’un solénoïde, c’est-à-dire d’une série de spires. Un solénoïde est essentiellement caractérisé par son nombre de spires par unité de longueur, n = N/L. i B L a b d c B Fig. 117: En haut: un solénoïde produit un champ magnétique interne. En bas: calcul du champ à l’aide de la loi d’Ampère. Le champ interne produit par un solénoïde peut être facilement dérivé de la loi d’Ampère, Eq. 383. Considérons la Fig. 117: nous voyons en haut un solénoïde presque idéal, dont le champ magnétique est quasi constant à l’intérieur, et très faible à l’extérieur. Passons à la limite d’un solénoïde idéal, dont la longueur est infinie, de sorte qu’on peut négliger les effets des régions proches de la première et de la dernière spire. Des considérations sur la symétrie du problème nous suggèrent que le champ B à l’intérieur du solénoïde est orienté dans la direction de son axe, comme on peut le voir à la figure 117. On peut également constater qu’un solénoïde infini n’a pas de champ à l’extérieur (la circulation devant être nulle pour n’importe quelle ligne fermée à l’extérieur). On peut donc calculer la grandeur du champ B grâce à la loi d’Ampère, en utilisant un circuit du type a-b-c-d montré dans la partie inférieure de la Fig. 117. Les parties externes de la ligne ne contribuent pas à la circulation, parce que le champ B y est nul. Les parties internes des traits b et d n’y contribuent pas non plus, parce qu’elles sont perpendiculaires au champ. Il ne reste donc à calculer que l’intégrale curviligne sur le trait c, qui est simplement BL. La loi d’Ampère. Eq. 383, donne: BL = µoNi , où N est le nombre de spires qu’on trouve sur la distance L; donc: (396) Giorgio Margaritondo: Ma Physique 288 B = µo(N/L)i = µoni , (397) champ qui est déterminé par le nombre de spires par unité de longueur, et par l’intensité du courant. XLVI.6. Equivalence spire-aimant Nous avons vu que les courants sont une des causes apparentes du champ magnétique. Nous avons également mentionné que les aimants en sont une autre cause. Il est maintenant nécessaire de réaliser qu’on a une relation directe entre ces deux causes, et nous le ferons à l’aide de considérations empiriques. Prenons la Fig. 118: nous voyons sur la gauche une “boîte fermée” contenant un objet mystérieux qui produit un champ magnétique. Après avoir analysé le champ, nous constatons qu’à des distances assez grandes de la boîte, il est proche de celui d’une spire; par exemple, on trouve une direction - qu’on peut présumer être l’axe de la spire - dans laquelle le champ est donné approximativement par l’Eq. 394 dans la limite x » r, c’est-à-dire: 1 B ∝ 3 . x (398) Tout cela nous amène à l’hypothèse que l’objet dans la boîte est une spire. Mais après avoir ouvert la boîte, nous constatons que l’objet n’est pas une spire: il s’agit d’une baguette ou aiguille magnétique: bref, d’un aimant! Il existe par conséquent une équivalence entre le champ produit par cette aiguille magnétique et celui d’une spire; on peut en fait exprimer le champ sur l’axe de l’aiguille et dans la limite de grande distance de manière similaire aux équations 394 et 398: m 1 B = 2π 3 , x (399) où m est par définition le moment magnétique de l’aiguille. En comparant cette dernière équation et l’Eq. 394 dans la limite de grande distance (x » r), nous trouvons spécifiquement qu’une spire est équivalente à une aiguille magnétique dont le moment est: m = µoiS , (400) S = πr2 étant la superficie de la spire, et i son courant. Mais l’équivalence spire-aiguille ne se limite pas aux champs qu’elles créent. Considérons la partie droite de la Fig. 118, avec une autre “boîte fermée” soumise à un champ magnétique. On observe un moment de torsion, ce qui suggère que l’objet est une aiguille magnétique. On constate pourtant que si on remplace l’aiguille par une spire, suivant l’Eq. 400, on obtient le même moment de torsion. Il nous faut donc en conclure qu’il existe une équivalence entre spire et aiguille tant pour les champs qu’elles créent que pour la torsion à laquelle elles sont soumises dans Giorgio Margaritondo: Ma Physique 289 un champ. Cette constatation nous amène à envisager l’existence d’une relation microscopique entre les deux objets. Nous verrons plus loin que cette relation existe effectivement: l’effet macroscopique qu’on appelle moment magnétique d’une aiguille est le résultat de la coordination, au niveau microscopique, des courants électroniques de ses atomes, qui sont à leur tour équivalents à des spires microscopiques: encore une fois, des observations expérimentales macroscopiques nous conduisent à des découvertes fondamentales sur la structure microscopique de la matière. B r n s ? B ? i Fig. 118: A gauche: l’équivalence entre une aiguille magnétique (aimant) et une spire avec un courant ne nous permet pas de distinguer l’une de l’autre en analysant le champ magnétique qu’elles créent. A droite: de manière similaire, on ne peut pas les distinguer non plus, à l’aide des effets que provoque sur elles un champ magnétique. Sur le plan pratique, on utilise l’équivalence spire-aiguille magnétique pour mesurer les courants avec les instruments appelés galvanomètres. Prenons une spire avec le courant que nous souhaitons mesurer, et mettons-la dans un champ magnétique. Le moment de torsion auquel elle est soumise dépend de façon linéaire du moment magnétique qui, à son tour, selon l’Eq. 400 dépend de façon également linéaire du courant. Ainsi, une mesure de courant peut être ramenée à une mesure de moment de torsion. Le coin des mathématiques Les discussions de physique nous ont souvent amenés à faire des approximations; l’art de trouver les approximations les plus efficaces pour arriver à des résultats quantitatifs raisonnables est un des points communs les plus importants de toutes les disciplines scientifiques et technologiques, ainsi que d’autres domaines. Nous n’avons pas, évidemment, la possibilité de Giorgio Margaritondo: Ma Physique 290 présenter une discussion complète de cet art si fondamental; mais nous essayerons au moins d’introduire quelques règles qu’on utilise souvent. Ces règles sont des applications des séries de Taylor et McLaurin. Il s’agit essentiellement d’apprendre des méthodes efficaces pour simplifier une fonction lorsque nous savons qu’une partie de son argument est de grandeur beaucoup plus petite que le reste. Les simplifications les plus souvent utilisées sont: • si x est très petit (x → 0): sinx ≈ x ; cosx ≈ 1 - x 2 /2 ; tgx ≈ x ; exp(x ) ≈ 1 + x ; • plus spécifiquement, si x « 1: (1 + x) 2 ≈ 1 + 2x ; 1 ≈ 1-x ; 1 + x x 1 + x ≈ 1 + ; √ 2 (1 + x) n ≈ 1 + nx ; ln(1 + x) ≈ x . En ce qui concerne l’utilisation pratique de ces formules, deux règles sont à suivre: premièrement, toujours essayer de ramener les approximations à un des deux cas x → 0 ou x « 1; par exemple, vous avez une fonction f(a 2 + b 2 ) et vous savez que |b| « |a|: vous écrivez l’argument sous la forme a 2 (1 + (b 2 /a 2 )), ce qui vous permet de le ramener à (1 + x), où x = (b 2 /a 2 ) « 1. Deuxièmement, si vous avez des fonctions plus compliquées que celles dont nous avons donné l’approximation, vous pouvez toujours essayer de combiner plusieurs approximations. Par exemple, vous avez la fonction (1 - sin 2 x) -3/2 , et vous savez que la grandeur de x est très petite. D’abord, sinx ≈ x ; donc, sin2 x ≈ x 2 , et (1 sin 2 x) -3/2 ≈ (1 + x 2 ) -3/2 ≈ 1 - 3x 2 /2, fonction que vous pouvez évaluer numériquement sans difficulté. Giorgio Margaritondo: Ma Physique 291 Le Coin Yankee: Magnétostatique Champ d’induction magnétique Force de Lorentz Aimant Dipôle Spire Solénoïde Aiguille magnétique Bobine d’Helmoltz Moment magnétique Magnetostatics Magnetic induction, B-field Lorentz force Magnet Dipole Loop, coil Solenoid Magnetic needle “The magnetic field, therefore, is not caused by isolated magnetic “charges”. Its relation with its causes - the currents - is shown by Eq. 383, which is called Ampère’s law or the curl law.” Helmoltz coils Magnetic moment Le coin des unités et des ordres de grandeur: flux du champ B ( Φ (B )) champ d’induction magnétique (B) moment magnétique Unités SI Autres unités Weber (w) (équivalent à V s = volt seconde) Tesla (T) = Gauss = 10-4 w/m 2 Weber/m 2 (w/m2 ) wm Ordres de grandeur: La grandeur du champ magnétique B de la terre est de l’ordre de 2 ¥ 10- 5 tesla. Un aimant permanent donne des champs de l’ordre de grandeur de 0,1 tesla, qui arrive à quelques tesla pour les électroaimants conventionnels. Les applications industrielles et scientifiques exigent parfois des grandeurs plus élevées: avec les électroaimants supraconducteurs, on peut atteindre 10-20 tesla, et encore plus pour les champs pulsés. Giorgio Margaritondo: Ma Physique 292 XLVII. Les phénomènes d’induction Nous passons maintenant de la magnétostatique à la magnétodynamique, c’est-à-dire au traitement des phénomènes causés par les changements du champ magnétique par rapport au temps. Commençons par un exemple pratique, fourni par la Fig. 119: on voit une spire de fil conducteur dans un champ magnétique. Le courant sur la spire, dont la résistance est R, est mesuré à l’aide d’un ampèremètre A. B A Fig. 119: Spire conductrice dans un champ magnétique variable par rapport au temps: loi de Faraday-Neumann-Lenz. Au début de l’expérience, le champ B ne change pas; puisqu’on n’a pas de générateur de force électromotrice sur la spire, l’ampèremètre ne mesure pas de courant. Si nous faisons maintenant varier B, l’ampèremètre révèle un courant et donc une force électromotrice induite sur la spire. Nous constatons qu’il existe une relation entre la force électromotrice fem et la variation par rapport au temps du flux du champ B par la spire: fem = - dΦ(B) dt . (401) Cette relation est connue comme loi de Faraday, Neumann et Lenz. La définition du flux du champ B par la spire est simple: il s’agit du flux du vecteur B par une superficie quelconque limitée par la spire, comme montré par la Fig. 120 (superficie Σ). Notez que nous pouvons choisir une superficie quelconque puisque le flux ne change pas d’une superficie de type Σ à l’autre. La raison en est que la divergence de B est toujours nulle (Eq. 384), donc, selon le théorème de la divergence et du flux (Eq. 316, par exemple), le flux par une superficie fermée est toujours nul. En utilisant la même argumentation que celle que nous avons adoptée afin de comprendre le théorème du rotationnel et de la circulation (Eq. 334), nous arrivons à l’équivalence Φ(B)Σ = Φ(B)Σ’ pour deux superficies quelconques Σ et Σ’ limitées par la même ligne fermée (spire). Giorgio Margaritondo: Ma Physique 293 XLVII.1. La loi de l’induction: s’agit-il réellement d’une nouveauté? Loi de Lenz Nous allons maintenant voir qu’on pourrait soupçonner que la loi de l’induction n’est qu’une conséquence de la loi de la force de Lorentz, Eq. 376. Le flux du champ B par la spire peut être modifié tant en changeant le champ lui-même qu’en déplaçant la spire par rapport au champ et en gardant celui-ci constant. Les deux effets peuvent coexister et donner le changement total de flux. Si l’on analyse le second, on comprend qu’en déplaçant la spire par rapport au champ, les charges libres à l’intérieur ont une vitesse non nulle par rapport au champ; on crée donc une force de Lorentz: pourrait-elle justifier la force électromotrice et le courant sur la spire? B(t) Σ i Fig. 120: Définition du flux du champ B pour la loi de Faraday-NeumannLenz. Analysons cette hypothèse dans le cas particulier de la Fig. 121: nous avons une spire conductrice rectangulaire dont le plan est perpendiculaire à un champ B homogène et constant, de grandeur B. Une partie de la spire peut se déplacer dans une direction qui est également perpendiculaire au champ, à vitesse v. La superficie de la spire dans le plan est donc ab = a(bo - vt), ou bo est évidemment la longueur b au temps t = 0 s. i b= bo+vt B v a Fig. 121: L’induction magnétique dans ce cas particulier est justifiée par la force de Lorentz sur les charges libres de la partie de la spire qui se déplace. Giorgio Margaritondo: Ma Physique 294 Le flux par la spire est Φ(B) = Ba(bo + vt), et la loi de l’induction (Eq. 401) donne: |fem| = Bav . (402) D’autre part, le mouvement à vitesse v des charges libres dans la partie de la spire qui se déplace les soumet à une force de Lorentz de grandeur f = qvB. Le champ électrique équivalent est de grandeur E = f/q = vB. La force électromotrice qui lui correspond est la chute de potentiel sur la distance a, qui à son tour est l’intégrale curviligne du champ électrique sur le même trait: |fem| = Ea = Bav . (403) En conclusion, la grandeur de la force électromotrice d’induction est effectivement, au moins dans ce cas, justifiée par la force de Lorentz. L’analyse des directions de la force de Lorentz et de la chute de potentiel montre que la direction du courant est également en accord avec la force de Lorentz: celle-ci justifie pleinement le phénomène d’induction. Mais attention! On ne peut pas généraliser cette conclusion. Si vous répétez l’expérience de la Fig. 121, sans déplacer aucune partie de la spire mais en changeant le champ B par rapport au temps, vous ne pouvez plus justifier la force électromotrice d’induction à l’aide de la force de Lorentz. L’induction est donc un phénomène indépendant, qu’on ne peut pas toujours assimiler à un effet de la force de Lorentz. La Fig. 121 nous donne l’occasion d’analyser le rôle important du signe négatif de la loi de Faraday-Neumann-Lenz (Eq. 401); à noter que le nom “Lenz” pour cette loi correspond justement à la présence du signe négatif. On peut réaliser que le signe négatif est nécessaire afin d’éviter que les phénomènes d’induction se trouvent en conflit avec la loi de conservation de l’énergie. Prenez par exemple le phénomène de la Fig. 121. Le courant causé par l’induction donne un champ magnétique qui s’ajoute à celui qui était présent a priori. En analysant les directions du courant et du champ magnétique, qui sont déterminées par le signe négatif de la loi de Faraday-Neumann-Lenz, on peut constater que l’induction tend à diminuer la grandeur de B. Elle tend donc à diminuer le flux, tandis que le changement de forme de la spire tendait à l’augmenter. Si l’on renverse la direction de la vitesse de la partie mobile de la spire, on diminue le flux par le mouvement de celle-ci, mais le courant causé par l’induction tend à augmenter la grandeur de B, et par conséquent son flux. On peut donc constater que l’induction, grâce au signe négatif de sa loi, produit des courants qui ont toujours tendance à réduire leurs causes. Cela élimine toute possibilité de conflit avec la conservation de l’énergie; par contre, si la tendance était d’augmenter les causes, le phénomène aurait eu un “feed-back” positif et la tendance à augmenter toujours sans conservation de l’énergie. XLVII.2. La loi de l’induction: forme locale, alternateurs Passons maintenant, comme d’habitude, de la forme non-locale de la loi de l’induction magnétique, Eq. 401: fem = - dΦ(B) dt , Giorgio Margaritondo: Ma Physique 295 à sa forme locale équivalente. La force électromotrice n’est que l’intégrale curviligne du champ électrique calculée sur la spire, c’est-à-dire sa circulation. D’autre part, le théorème de la circulation et du rotationnel, Eq. 334, nous permet d’écrire la circulation en fonction du flux du rotationnel: fem = o ∫ E • dl = Φ(∇ × E) ; (404) L la comparaison des équations 401 et 404 donne: Φ(∇ × E) = - dΦ(B) dt . (405) Considérons maintenant seulement les phénomènes d’induction causés par les changements de B par rapport au temps, en excluant de l’analyse ceux qui sont causés par le changement de la géométrie de la spire (qui, nous l’avons vu, sont justifiés par la force de Lorentz). Cela implique que la superficie pour laquelle on calcule le flux ne dépend pas du temps, et donc: dΦ(B) ∂B dt = Φ ∂t ; (406) les équations 405 et 406 donnent l’équivalence des flux de ∇ × E et de la dérivée négative de B par rapport au temps. D’autre part, puisque l’égalité des flux est valable pour n’importe quelle superficie (limitée par la ligne de la spire), elle implique celle des vecteurs dont on calcule les flux. En conclusion: ∂B ∇ × E = - ∂t . (407) L’équation 407 est la forme locale souhaitée de la loi de Faraday-Neumann-Lenz. Notez qu’elle remplace l’Eq. 335, qui exigeait un champ électrique à rotationnel nul pour le cas statique, sans changements par rapport au temps. Le rotationnel nul nous donnait également un champ électrostatique conservatif, à circulation nulle. Par contre, dans le cas de l’électrodynamique, les changements du champ B par rapport au temps peuvent causer un champ électrique dont la circulation n’est plus nulle. Cette propriété a des conséquences tant sur le plan fondamental que dans le domaine des applications pratiques. Du point de vue fondamental, la loi de l’induction, sous la forme locale (Eq. 404) et également sous la forme non-locale (Eq. 407), prouve qu’il existe une relation entre le champ électrique E et le champ magnétique B. On commence à réaliser, par conséquent, que les phénomènes du type “électrique” et ceux du type “magnétique”, considérés séparément les uns des autres pendant une longue période de l’histoire de la science, sont en fait deux manifestations du même type de phénomènes: ceux de l’électromagnétisme. En ce qui concerne les applications pratiques, des phénomènes tels que ceux de l’induction sont certainement bienvenus en technologie car ils nous permettent de créer des forces électromotrices et donc des courants pour toutes les applications pratiques de l’électricité, si nombreuses dans notre vie quotidienne. Puisque la création d’un courant implique la dissipation d’énergie par effet Joule, le problème de générer une force électromotrice est, au fond, un problème de transformation de l’énergie. On a souvent à disposition de l’énergie mécanique, par Giorgio Margaritondo: Ma Physique 296 exemple l’énergie potentielle de gravitation de l’eau d’un de ces merveilleux lacs de montagne qu’on peut trouver presque partout en Suisse. On souhaite produire de l’énergie électrique à partir de cette énergie mécanique: par exemple, on peut canaliser l’eau vers un dispositif qui comprend des spires libres de tourner dans un champ magnétique fixe, et provoquer leur rotation. Celle-ci cause un changement périodique du flux par rapport au temps; si les spires sont planes et l’axe de rotation est perpendiculaire au champ, le flux de B est proportionnel à cosθ, le cosinus de l’angle entre le champ et la perpendiculaire au plan de la spire. A son tour, la rotation fait varier θ suivant une loi du type θ = ωt, ω étant la vitesse angulaire. L’Eq. 401 montre par conséquent que la force électromotrice suit une loi du type ωsinωt, avec des oscillations périodiques par rapport au temps. C’est le principe de fonctionnement des générateurs de force électromotrice périodique ou alternative, les alternateurs. XLVII.3. Induction mutuelle et self-induction Prenons maintenant deux circuits électriques avec des courants, par exemple les deux spires montrées par la Fig. 122. Le courant i1 de la première spire produit un champ magnétique dont la grandeur en chaque point est proportionnelle à son intensité. Le flux par la deuxième spire de ce champ est à son tour proportionnel à la grandeur du champ et donc à i1. Tout changement de i1 par rapport au temps provoquera une force électromotrice sur la deuxième spire, qui selon l’Eq. 401 doit être proportionnelle à la dérivée di1/dt. i2 M12 i1 M21 Fig. 122: Induction mutuelle dans le cas de deux spires avec des courants i1 et i2 . Le coefficient de proportionnalité par rapport à i1 du flux par la deuxième spire, Φ12, qui est causé par la première, est dit coefficient d’induction mutuelle: Φ12 M12 = i ; 1 (408) la force électromotrice causée sur la deuxième spire par les changements de i1 est évidemment: Giorgio Margaritondo: Ma Physique 297 di1 fem 12 = - M12 dt . (409) De façon symétrique, on peut constater que le courant i2 sur la deuxième spire cause un flux de champ magnétique: Φ12 = M21i1 , (410) sur la première spire; en cas de changement par rapport au temps, la force électromotrice sur la première spire est: di2 fem 21 = - M21 dt . (411) De manière générale, on peut montrer que les deux coefficients d’induction mutuelle ont la même valeur: M12 = M21 = M , (412) et donc on peut parler du coefficient d’induction mutuelle de deux circuits. Continuons maintenant à analyser les deux spires de la Fig. 122: le champ magnétique produit par la première spire ne contribue pas seulement au flux par la deuxième spire, mais aussi au flux par elle-même. On doit donc compléter l’Eq. 411 en tenant compte du phénomène correspondant, qui s’appelle self-induction, et en ajoutant la force électromotrice qu’il produit: di2 di1 fem 1 = - M21 L 1 dt dt , (413) où fem1 est la force électromotrice totale sur la première spire, et L1 est le coefficient de self-induction de la première spire. De façon symétrique: di1 di2 fem 2 = - M12 dt - L2 dt , (414) où l’interprétation des symboles est évidente. Notez qu’à ces forces électromotrices d’induction, on doit ajouter les forces électromotrices causées par d’éventuels générateurs sur les deux circuits. Prenons maintenant un circuit isolé, pour lequel on n’a pas d’induction mutuelle: tout changement de son courant i produit une force électromotrice: fem = - L di , dt (415) où L est le coefficient de self-induction du circuit. Dans la technologie des circuits électriques, on appelle “self” un élément de circuit pour lequel on a un grand coefficient de self-induction. L’exemple typique en est fourni par un solénoïde, surtout lorsque les spires entourent un matériau tel que le fer doux, qui tend à concentrer le flux du champ magnétique B. Giorgio Margaritondo: Ma Physique 298 XLVII.4. L’énergie emmagasinée par un champ magnétique L’analyse des condensateurs nous a amenés à la découverte fondamentale qu’une région dans laquelle se trouve un champ électrique est un réservoir d’énergie, dont la densité est donnée par l’Eq. 361: 1 densité d’énergie = 2 (εoE2) . Nous arrivons maintenant à une deuxième découverte, tout aussi fondamentale: une région où se trouve un champ magnétique est elle aussi un réservoir d’énergie, dont nous essayerons de trouver la densité. Prenez le simple circuit de la Fig. 123: il illustre la combinaison d’un solénoïde idéal, dont la résistance est nulle et le coefficient de self-induction est L, d’un générateur de force électromotrice constante f, d’une résistance R et d’un interrupteur I. Au début de l’expérience, l’interrupteur est ouvert et le courant nul; ensuite, au temps t = 0 s, on ferme l’interrupteur; on a un régime transitoire d’augmentation progressive de l’intensité du courant, suivi par un régime stationnaire avec i = f/R. Voyons maintenant quel est le courant pendant le régime transitoire. L I R f Fig. 123: Circuit utilisé pour calculer l’énergie emmagasinée dans une région où se trouve un champ magnétique. La force électromotrice totale est la combinaison de f et de la self-induction: fem = f - L di , dt (416) et la loi d’Ohm (ou la deuxième loi de Kirchhoff, Eq. 375) donne: f L di i = R - R dt ; (417) celle-ci est une équation différentielle bien connue, dont la solution est du type i = ioexp(-at) + b, où io, a et b sont des constantes. Les conditions aux limites, i nul au temps t = 0 s et i → f/R si t → ∞, donnent b = f/R et io = b = f/R. En remplaçant l’expression du courant ainsi dérivée, i = (f/R)(1 - exp(-at)), dans l’Eq. 417, on constate que la solution est en accord avec cette équation si a = R/L. On peut donc en conclure que: Giorgio Margaritondo: Ma Physique 299 f i = R (1 - exp(-Rt/L)) ; (418) cette fonction est illustrée par la Fig. 124: on voit que le courant tend à la valeur asymptotique io = f/R, et que son augmentation par rapport au temps est caractérisée par le paramètre L/R. i∝B f/R f/Re L/R t Fig. 124: Courant du circuit de la Fig. 123 (qui est proportionnel au champ magnétique dans le solénoïde), en fonction du temps. Analysons maintenant le circuit de la Fig. 123 en ce qui concerne l’énergie. Dans un laps de temps dt infinitésimal, la source de force électromotrice fournit une quantité d’énergie qui correspond au passage d’une charge idt par une chute de potentiel f, donc une quantité d’énergie fidt. Une partie de cette énergie est dissipée par effet Joule dans la résistance et est transformée en chaleur; l’énergie ainsi dissipée dans la période dt est, selon la loi de l’effet Joule, i2Rdt. Mais où va la partie qui n’est pas dissipée, fidt - i2Rdt = i(f - iR)dt? Voyons: la création d’un courant dans le circuit s’accompagne également de la création d’un champ magnétique à l’intérieur du solénoïde; on est donc amené à la conclusion que l’énergie qui est fournie par la batterie, mais n’est pas dissipée, est emmagasinée dans ce champ magnétique. Calculons donc cette énergie: l’Eq. 417 montre que (f - iR) = L(di/dt), donc l’énergie donnée au champ magnétique pendant la période dt est i(f - iR)dt = Li(di/dt)dt = Lidi. L’énergie totale emmagasinée dans le champ du solénoïde est la somme, voire l’intégrale, de toutes ces contributions: io io2 Energie emmagasinée = ∫ Lidi = L 2 . 0 (419) Cette équation peut être manipulée afin d’arriver à la densité de l’énergie emmagasinée dans le champ du solénoïde. La grandeur du champ est donnée par l’Eq. 397: B = µ o(N/l)i, où l est la longueur du solénoïde. Le flux total du solénoïde est obtenu en multipliant la grandeur du champ magnétique par la superficie d’une spire, S, et par le nombre total de spires: Φ = (SN)B = (SN)µoNi/l. Le coefficient d’induction mutuelle est par définition: Giorgio Margaritondo: Ma Physique L = Φ/i = (SN)µo N N2S = µo . l l 300 (420) L’Eq. 419 montre que l’énergie emmagasinée dans le champ est Lio2/2 = µoN2Sio2/2l = (1/2µo)(Sl)(µo(N/l)io)2 = (1/2µo)(Sl)B 2. Notez que (Sl) est le volume contenu dans le solénoïde, c’est-à-dire le volume dans lequel se trouve le champ magnétique. Ce résultat peut donc être interprété comme le produit de la densité d’énergie emmagasinée par le volume, si l’on admet que: 1 densité d’énergie = 2µ (B2) . o (421) Cette équation peut être combinée avec l’Eq. 361, valable pour le champ électrique, afin d’exprimer la densité d’énergie d’un champ électromagnétique, c’est-à-dire d’une région de l’espace où l’on a tant un champ électrique qu’un champ magnétique: 1 B2 densité d’énergie = 2 εoE2 + µ . o (422) D’autre part, l’analyse de l’origine relativiste du champ magnétique avait révélé une relation entre les constantes εo, µo et c, illustrée par l’Eq. 381: µoεoc2 = 1 , qui nous permet d’exprimer la densité d’énergie sous la forme suivante: εo densité d’énergie = 2 (E2 + c2B2) . (423) XLVII.5. Le transformateur Pour conclure le chapitre consacré aux phénomènes d’induction, nous discuterons une importante application technologique de ceux-ci: le transformateur. Le schéma de cet instrument est illustré par la Fig. 125. On voit qu’un transformateur se compose de deux solénoïdes (dits primaire et secondaire), connectés par une carcasse de fer doux. Celle-ci a la propriété de concentrer le flux du champ magnétique. Les transformateurs ont plusieurs types d’utilisation pratique, parmi lesquels nous analyserons seulement l’amplification d’une tension alternative. Afin de comprendre le mode de fonctionnement de l’instrument, calculons d’abord les coefficients d’induction. L’Eq. 420 nous donne presque immédiatement les coefficients de self-induction: N12S l ; N22S L2 = µoµr l , L1 = µoµr (424) (425) où µr est la permeabilité magnétique relative du fer doux de la carcasse (on discutera plus loin de ce paramètre) et l est sa longueur; le sens des autres symboles est évident. Giorgio Margaritondo: Ma Physique 301 Passons maintenant au coefficient d’induction mutuelle, M. En admettant que le flux est complètement confiné à la carcasse de fer doux, un courant i1 sur le primaire donne un flux total L1i1 pour le primaire, ou L1i1/N1 par spire. Le même courant donne le même flux par spire pour le secondaire, et le flux total pour celui-ci est L 1 i1 N 2 /N 1 ; par conséquent, M = L 1N 2/N 1; symétriquement, on a M = L 2N 1/N 2; en multipliant ces deux formes de M, on obtient M2 = L1L2 et donc: M = L 1L 2 √ . (426) N2 N1 Fig. 125: A gauche: schéma d’un transformateur. A droite: symbole d’un transformateur qu’on utilise pour illustrer les circuits. Prenons maintenant un générateur de force électromotrice alternative, ou alternateur, et mettons-le en connexion avec le primaire. Notez: f 1 = fo1sinωt (427) comme la force électromotrice de l’alternateur, dont fo est l’amplitude (maximum), et R1 sa résistance interne. Admettons que le secondaire est ouvert, donc que son courant est nul, i2 = 0. Dans ces conditions, l’équation 413 donne une force électromotrice de (self) induction L1 (di1/dt ), qui s’ajoute à celle de l’alternateur; la deuxième loi de Kirchhoff nous dit que: di1 Ri1 = - L1 dt + fo1sinωt , (428) qui, à la limite de résistance interne nulle du générateur, devient: di1 L1 dt = fo1sinωt . (429) Giorgio Margaritondo: Ma Physique 302 D’autre part, la force électromotrice créée par l’induction mutuelle sur le secondaire est L2/L1 f2 = - M(di1 /dt) = [vu l’Eq. 429] = - Mf o 1 (sin ω t )/L 1 = [vu l’Eq. 426] = - √ fo1(sinωt ). On constate donc que l’amplitude de la force électromotrice sur le secondaire est L2/L1 déterminée par l’amplitude sur le primaire, amplifiée ou réduite d’un facteur - √ qui, vu les équations 424 et 425, est simplement égal au rapport des nombres de spires du secondaire et du primaire: N2 facteur d’amplification = - N . 1 (430) Notez le signe négatif de ce facteur qui correspond à un déphasage de π/2 de la fonction sinωt . Le Coin Yankee: Induction Induction mutuelle Self-induction Alternateur Induction Mutual induction Self-induction Alternator, AC generator Transformateur Transformer Primaire Primary Secondaire Secondary “We will arrive now to a second and equally fundamental discovery: a region where there is a magnetic field is also a reservoir of energy, of which we will try to calculate the density.“ Le coin des unités et des ordres de grandeur: M ( coefficient d’induction mutuelle) et L (coefficient de self-induction) Unités SI Henry (Hy) = Vs/A Autres unités Ordres de grandeur: La grandeur du coefficient de self-induction L d’un self peut varier généralement des microHenry (mHy = 10 -6 Hy) aux dizaines d’Henry. Giorgio Margaritondo: Ma Physique 303 XLVIII. Les circuits électriques Cette partie du cours est consacrée à une importante application pratique des notions d’électromagnétisme: l’analyse des circuits électriques qui sont à la base de presque toute la technologie moderne. Nous avons déjà discuté les propriétés de plusieurs des composants électroniques qui, combinés à l’aide de fils conducteurs, peuvent être utilisés pour construire une série infinie de circuits. La Fig. 126 montre les symboles de quelques-uns de ces composants: les condensateurs, les résistances, les selfs, les transformateurs et les générateurs de force électromotrice, tant continue qu’alternative. C R L M, L1, L1 f fo, ω Fig. 126: Quelques-uns des éléments dont peut se composer un circuit électrique. Nous commencerons par discuter les circuits alimentés par des générateurs continus, puis nous passerons aux circuits incluant des alternateurs. Rappelons que nous avons déjà traité un des circuits à générateur continu: le circuit de la Fig. 123, formé par un self, L, et une résistance R en série, alimenté par une batterie, et appelé "circuit LR série". La Fig. 124 illustre le comportement de ce circuit. Passons maintenant au circuit RC série illustré par la partie gauche de la Fig. 127: un générateur de force électromotrice est utilisé pour charger un condensateur avec une résistance en série. Au début de l’expérience, l’interrupteur est ouvert et on n’a ni courant ni charge sur les plaques du condensateur. Au temps t = 0 s, on ferme l’interrupteur et le générateur de force électromotrice commence à charger le condensateur. Voyons quelle est la charge sur le condensateur en fonction du temps: à la limite, t → ∞, elle deviendra évidemment q = Cf. Au temps intermédiaire t, elle sera déterminée par le Giorgio Margaritondo: Ma Physique 304 fait que la force électromotrice f est partagée entre la chute de potentiel sur le condensateur, V = q(t)/C, et celle sur la résistance, Ri = R(dq/dt): dq q f = R dt + C . (431) La solution d’une équation de ce type est bien connue: il s’agit évidemment d’une fonction q(t) dont la dérivée est égale à la même fonction multipliée par une constante: donc, une fonction exponentielle du type q(t) = Aexp(αt) + B, où A, B et α sont des constantes. Les conditions limites q(0) = 0 et q(∞) = Cf exigent que α soit négatif, et donnent immédiatement A = - B et B = Cf. D’autre part, en utilisant la fonction ainsi obtenue, q(t) = (Cf)(1 - exp(αt)), l’Eq. 431 donne: R(Cf)(-αexp(αt)) + (Cf)(- exp(αt))/C, et donc α = -1/RC; en conclusion, la charge du condensateur en fonction du temps est donnée par: q(t) = (Cf)(1 - exp(-t/RC) , (432) fonction illustrée par la partie supérieure de la Fig. 128. Notez la similarité entre cette fonction et celle qui décrit le courant du circuit LR de la Fig. 123, illustrée par la Fig. 124. On constate encore une fois une augmentation en fonction du temps, avec une tendance asymptotique à une valeur limite stationnaire. La rapidité de l’augmentation vers la valeur limite est essentiellement caractérisée par le paramètre RC, qui est le “temps caractéristique” de ce circuit. En ce qui concerne le courant dans le circuit et la chute de potentiel sur le condensateur V, notez que celle-ci est q/C, et donc sa dépendance du temps est qualitativement similaire à la fonction q(t), avec une tendance à la valeur asymptotique f. Le courant est donné par la dérivée de la charge par rapport au temps: i(t) = (f/R) exp(-t/RC) , (433) qui est une fonction allant toujours décroissant, de la valeur initiale i(0) = f/R (toute la chute de potentiel se trouve sur la résistance) à la valeur asymptotique de courant nul. Passons maintenant au circuit RC parallèle de la partie droite de la Fig. 127: au début de l’expérience, l’interrupteur est fermé et le générateur de force électromotrice cause une chute de potentiel f tant sur le condensateur que sur la résistance; on a un courant sur celle-ci, dont l’intensité est i(0) = f/R. Ensuite, au temps t = 0 s, on ouvre l’interrupteur: la charge sur le condensateur commence à diminuer de sa valeur initiale Cf à la valeur finale nulle. De quelle manière ce déchargement est-il dépendant du temps? Après l’ouverture de l’interrupteur, le condensateur et la résistance sont isolés du générateur. Par conséquent, la chute de potentiel sur le condensateur q/C doit être égale à celle sur la résistance, Ri = R(dq/dt): dq q R dt + C = 0. (434) La solution d’une telle équation est encore une fois une fonction exponentielle du type q(t) = Aexp(αt) + B; les conditions limites susmentionnées donnent immédiatement A = Giorgio Margaritondo: Ma Physique 305 Cf et B = 0. En utilisant la fonction (Cf)(exp(αt)), l’Eq. 434 donne encore une fois α = -1/RC et: q(t) = (Cf)exp(-t/RC) , (435) fonction illustrée par la partie inférieure de la Fig. 128. Le courant suit une loi qualitativement similaire; notez que le paramètre RC caractérise encore une fois la rapidité des changements de situation du circuit (charge, chutes de potentiel, courant) en fonction du temps. XLVIII.1. Les courants et les tensions sinusoïdaux: pourquoi sont-ils importants? Nous sommes maintenant prêts à passer à l’analyse des circuits avec des courants alternatifs. Cela exige un effort mathématique considérable, afin de maîtriser l’utilisation pratique du formalisme des nombres complexes. Nous allons voir que cet effort est justifié par l’importance des circuits de ce type. C f R C f R Fig. 127: Circuits du type RC: en série (à gauche) et an parallèle (à droite). Nous avons vu que la transformation de l’énergie mécanique en énergie électrique donne très souvent des forces électromotrices alternatives, et donc des courants sinusoïdaux: par exemple, la plupart des appareils électriques et électroniques sont alimentés par des tensions alternatives. Cela fournit déjà une bonne justification à nos efforts. Mais l’importance des courants et tensions alternatifs est bien plus fondamentale; elle est liée au théorème de Fourier, que vous avez étudié dans les cours de mathématiques. Afin de comprendre le rôle vraiment central de ce théorème, prenons un système audio hi-fi, avec lequel nous pouvons reproduire de la musique et écouter avec plaisir aussi bien Mozart que Dire Straits. Pour essayer d'estimer la qualité du système, nous considérons sa réponse en fonction de la fréquence, par exemple le fait qu'on ne doit pas avoir de résonances dans la région des fréquences audio. Mais pourquoi cette réponse en fonction de la fréquence, c'est-à-dire la réponse à des tensions sinusoïdales? Ce que nous voulons du système, c'est une bonne réponse pour le son en général, pas seulement pour les sons sinusoïdaux! Le mystère est clarifié si nous considérons le théorème de Fourier. Sans trop de rigueur, on peut dire que toute fonction du temps, sous des conditions assez générales, est égale à la superposition de fonctions sinusoïdales. Le cas le plus simple est celui des fonctions périodiques: une fonction f(t) est périodique avec période T Giorgio Margaritondo: Ma Physique 306 si f(t + T) = f(t). La fréquence (angulaire ou pulsation) de la fonction est ω = 2π/T . Dans ce cas, la fonction f est donnée par une somme infinie (série) de fonctions sinus et cosinus, dont les fréquences sont ω et les harmoniques 2ω, 3ω, etc. q∝V Cf Cf (e-1)/e RC t RC t q∝V Cf Cf /e Fig. 128: Charge du condensateur en fonction du temps pour les deux circuits de la Fig. 127. Si nous prenons une fonction f(t) plus générale, et non plus nécessairement une fonction périodique, nous avons une intégrale au lieu d'une série, c'est-à-dire la superposition de fonctions sinusoïdales, mais cette fois avec toutes les fréquences possibles de zéro à l'infini. Le fait fondamental est néanmoins le même: la fonction est toujours une superposition de fonctions sinusoïdales. Donc, pour définir la réponse du système hi-fi à un son quelconque, il n'est pas nécessaire de considérer tous les sons possibles (ce qui serait évidemment impossible); il suffit de considérer la réponse à des fonctions sinusoïdales selon leur fréquence. Un son quelconque peut toujours être reconstitué à l'aide de telles fonctions. On peut généraliser cette conclusion: chaque fois que nous essayons de comprendre la réponse d’un circuit à l’arrivée d’un signal compliqué, nous pouvons séparer celui-ci en composants (de Fourier) sinusoïdaux, analyser la réponse pour chaque composant, et enfin reconstituer la réponse au signal total en prenant la somme des réponses aux composants individuels. Par conséquent, le fonctionnement général du circuit peut être analysé si l’on connaît son fonctionnement en présence de signaux sinusoïdaux, en fonction de leur fréquence. Notez que cette propriété de décomposition en composants sinusoïdaux se retrouve dans presque tous les domaines de la science et de l’ingénierie; par exemple en optique, la lumière "blanche" est en réalité la superposition de toutes les couleurs du spectre visible, qui sont des ondes sinusoïdales; en génie civil, le comportement de bâtiments lors d’un tremblement de terre peut être analysé en décomposant celui-ci en ondes Giorgio Margaritondo: Ma Physique 307 sinusoïdales; en mécanique quantique, on utilise le même type de décomposition pour les “fonctions d’onde” des électrons, par exemple les fonctions d’onde des liaisons chimiques des matériaux. Conclusion: l’effort consenti pour maîtriser les mathématiques des phénomènes sinusoïdaux est un très bon investissement! XLVIII.2. Les instruments mathématiques les plus efficaces Considérons un simple problème pratique concernant les courants et les tensions sinusoïdaux: un circuit composé d’un self et d’un condensateur (voir la partie supérieure de la Fig. 129). Le circuit n’a pas de générateur de force électromotrice, donc la chute de potentiel totale doit être nulle: la chute sur le condensateur, q/C, doit être annulée par la chute sur le self, - L(di/dt): q di = L C dt ; (436) la dérivée par rapport au temps de cette relation donne: LC d2i + i = 0 ; dt2 (437) La solution de cette équation est encore une fois bien connue: il s’agit d’une fonction dont la dérivée seconde est la même fonction multipliée par une constante: donc, une fonction du type sinus ou cosinus: i = io sin(ωot) , où io est l’amplitude du courant. En insérant cette fonction dans l’Eq. 437, on obtient: ωo = 1/LC √ . (438) Le circuit LC est donc un oscillateur, dont la fréquence (angulaire) ω o , sa fréquence propre, est déterminée par les paramètres L et C. Supposons maintenant que nous ajoutons au circuit LC un alternateur, comme on peut le voir dans la partie centrale de la Fig. 129. On réalise que l’Eq. 436 doit être modifiée de la manière suivante: di q = - L dt + fo sin(ω t) , C (439) où fo sin(ω t) est la force électromotrice alternative de l’alternateur (dont la fréquence, en général, ne coïncide pas avec la fréquence propre ωo du circuit). L’Eq. 437 devient, par conséquent: LC d2i + i = Cω fo cos(ω t) . dt2 (440) La théorie des équations différentielles de ce type nous révèle que la solution générale est la somme d’une solution particulière quelconque, plus la solution générale de l’équation associée qu’on obtient en annulant la partie à droite de l’équation. L’équation Giorgio Margaritondo: Ma Physique 308 associée coïncide donc avec l’Eq. 437, dont nous avons vu que la solution est une fonction sinusoïdale de fréquence ωo. Une partie du courant dans le circuit correspond donc à l’oscillation qu’on aurait eue sans alternateur. C L L C fo , ω C L R fo , ω Fig. 129: Circuits LC isolé, et circuits LC et RLC série alimentés par un alternateur de fréquence ω. Quant à l’autre partie, on peut imaginer que l’alternateur force le circuit à osciller avec sa fréquence ω. On peut donc proposer une solution du type: i = io cos(ω t) , (441) qui, insérée dans l’Eq. 440, donne: - LCω 2 io cos(ω t) + io cos(ω t) = Cωfo cos(ω t) , (442) et donc: io = Cω fo = 1 - LCω 2 fo . 1 ωC - ωL (443) Cette relation montre que l’amplitude de l’oscillation forcée par l’alternateur change en fonction de la fréquence de celui-ci. Notez que l’amplitude devient infinie si la fréquence de l’oscillateur coïncide avec la fréquence propre du circuit: ω = 1/LC √ = ωo . (444) Giorgio Margaritondo: Ma Physique 309 Ce résultat est le phénomène bien connu de la résonance: la réponse d’un système (le circuit) devient très grande s'il est stimulé (par l’alternateur) à une fréquence qui coïncide avec sa fréquence propre d’oscillation. On trouve des phénomènes de résonance presque partout dans la nature; par exemple, si vous essayez de faire osciller une balançoire, vous devez pousser celle-ci de manière périodique en essayant de reproduire sa fréquence propre d’oscillation. Si vous souhaitez produire un son avec un orgue, vous devez stimuler le tuyau dont la fréquence propre est égale à celle du son. Nous analyserons maintenant à nouveau le circuit au centre de la Fig. 129, afin d'introduire une approche mathématique plus efficace. Cette approche se base sur le remplacement des fonctions sinus et cosinus par des fonctions exponentielles complexes du type Aexp(j (ω t + φ)), où φ est l'angle de phase ou simplement la phase (et j est l'unité imaginaire, c'est-à-dire j2 = -1). La relation entre ces trois types de fonctions est illustrée par la formule d'Euler (le mathématicien suisse du billet de 10 francs): Aexp(j (ω t + φ)) = A(cos(ω t + φ) + j sin(ω t + φ)) . (445) Les fonctions exponentielles complexes sont donc des combinaisons de fonctions du type sinus et cosinus. Mais pourquoi remplacer les unes par les autres? Cela peut nous paraître une complication assez inutile, un jeu pour mathématiciens! Mais il ne s'agit pas d'un jeu intellectuel: nous verrons que ce remplacement simplifie beaucoup la manipulation des formules mathématiques des circuits alternatifs. Prenez par exemple les dérivées de la fonction Aexp(j (ω t + φ )): la dérivée d'ordre n est simplement le produit de la même fonction et du facteur (jω)n. Par contre, dans le cas de la fonction sinus, le facteur ω n doit être multiplié ou par le même sinus ou par un cosinus, dépendant de l'ordre de la dérivée: cela complique la manipulation des formules. L'utilisation des fonctions exponentielles complexes nous permet aussi de visualiser le problème de façon géométrique, ce qui simplifie la recherche des solutions. L'équation 445 peut être en fait interprétée à l'aide du plan complexe (voir la Fig. 130), c'est-à-dire du plan géométrique dont l'axe horizontal correspond à la composante réelle des nombre complexes, et l'axe vertical à leur composante imaginaire. Chaque nombre complexe correspond à un point sur ce plan. A son tour, chaque point correspond à un vecteur position par rapport à l'origine. L'équation 445 nous dit que le vecteur position qui correspond au nombre complexe Aexp(j (ω t + φ )) a pour composantes deux fonctions du type cosinus et sinus. Cela correspond, en géométrie, à un vecteur position en rotation à vitesse angulaire ω. Afin de simplifier la visualisation des phénomènes, nous adopterons donc un nouveau référentiel (voir encore la Fig. 130), également en rotation à vitesse angulaire ω. Dans ce nouveau référentiel, le vecteur position du nombre complexe Aexp(j (ω t + φ)) n'est plus en rotation, donc ω = 0 et l'équation 445 se réduit à la forme simplifiée: Aexp(jφ) = A(cos(φ) + j sin(φ)) . (446) Le changement de référentiel nous permet donc de simplifier la visualisation en éliminant les facteurs qui dépendent du temps. Notez que l'équation 446 peut être renversée. Admettons, par exemple, que la solution d'un circuit alternatif donne un courant qui est représenté par le nombre complexe i = iR + jiI, où selon l'Eq. 446 iR = iocos(φ) et iI = iosin(φ). L'amplitude io de ce courant est: Giorgio Margaritondo: Ma Physique 310 io = iR2 + iI2 , √ (447) et la phase est donnée par: φ = tg-1(iI/iR) , (448) où le symbole "tg-1" signifie la fonction tangente inverse. XLVIII.3. Les impédances Appliquons maintenant le formalisme des fonctions exponentielles complexes au circuit LC de la partie centrale de la Fig. 129, afin de découvrir le concept d'impédance. axe imaginaire Aexp(j (ω t+ φ)) Aexp(j (ω t+φ)) nouveau référentiel Asin(ω t+φ) ωt ω t+φ O φ axe réel Acos( ω t+ φ) nouveau référentiel φ Asinφ Acosφ Fig. 130: Visualisation géométrique des fonction exponentielles complexes. A gauche: la fonction Aexp(j (ω t + φ )) correspond sur le plan complexe à un vecteur position qui est en rotation à vitesse angulaire ω . A droite: afin de simplifier la visualisation, on change de point de vue en adoptant un nouveau référentiel qui est également en rotation à vitesse angulaire ω. En bas: dans le nouveau référentiel, la fonction devient Aexp(j φ) et correspond à un vecteur position sans rotation. Giorgio Margaritondo: Ma Physique 311 Nous avons vu que le courant forcé dans le circuit par l'alternateur est iocos(ω t), qui correspond à la partie réelle de la fonction exponentielle complexe ioexp(jω t). La force électromotrice alternative du générateur, fosin(ω t), correspond à la partie réelle de la fonction foexp(j(ω t + π/2)) = fo(cos(ω t + π/2) + jsin(ω t + π/2)) = fo(sin(ω t) - jcos(ω t)). Notez la différence de phase de π/2 entre les deux fonctions "courant" (un cosinus) et "force électromotrice" (un sinus). Considérons maintenant la chute de potentiel sur la self, qui est L(di/dt) = L(d(ioexp(jω t))/dt) = jωLioexp(jω t) = (jω L)i. Comparons ce résultat à la chute de potentiel sur une résistance, Ri: on constate que le comportement du self peut être caractérisé de manière similaire à la résistance, en utilisant le paramètre jω L au lieu de la résistance R. On appelle ce paramètre, Z = jω L , (449) l'impédance du self. On écrit donc la chute de potentiel sur le self Zi. Peut-on caractériser de manière similaire le comportement du condensateur? Voyons: si l'on essaie d'écrire la chute de potentiel sur le condensateur sous la forme Zi, on trouve Zi = q/C; en prenant la dérivée de cette équation par rapport au temps, on obtient: Z(di/dt) = (dq/dt)/C = i/C. D'autre part, (di/dt) = (d(ioexp(jω t))/dt) = jω ioexp(jω t) = jω i, donc on obtient Z(jω i) = i/C, et: 1 Z = jω C ; (450) en conclusion, on peut effectivement caractériser le comportement du condensateur avec un paramètre impédance, spécifié par l'Eq. 450. Passons maintenant à l'application pratique du concept d'impédance. Le circuit de la partie centrale de la Fig. 129 est formé par un générateur de force électromotrice appliqué à la série self + condensateur. Si ceux-ci étaient simplement deux résistances en série, la résistance (impédance) totale serait leur somme. Prenons donc la somme des impédances self + condensateur: 1 Z = jω L + jω C ; (451) appliquons maintenant l'équivalent de la loi d'Ohm (ou de la deuxième loi de Kirchhoff), en exigeant que la force électromotrice de l'alternateur, foexp(j(ω t + π/2)), soit égale à Zi = Zioexp(jω t): 1 foexp(j(ω t + π/2)) = jω L + jω C ioexp(jω t) ; (452) exp(j(ω t + π/2)) = exp(jω t) exp(jπ/2), il existe dans l'Eq. 452 un facteur commun exp(jω t), qu'on peut éliminer en obtenant: 1 foexp(j π/2) = jω L + jω C io , et donc: (453) Giorgio Margaritondo: Ma Physique io = fo exp(j π/2) cos(π/2) + jsin(π/2) fo = , 2 1 = foj Cω -ω LC + 1 1 j ω L + jω C ωC - ωL 312 (454) qui est le même résultat que l'Eq. 443: avec cette nouvelle formulation, nous avons heureusement retrouvé le phénomène de résonance. Quant à la phase, on peut la dériver à l'aide de l'Eq. 448: dans le référentiel en rotation de la Fig. 130, le courant ioexp(jω t) est le vecteur dont les composantes sont io (réelle) et 0 (imaginaire); donc, φ = 0. Puisque la tension de l'alternateur, foexp(j(ω t + π/2)) a une phase de π/2, il existe un déphasage de π/2 entre tension et courant. Cela confirme le résultat de la première analyse du circuit, qui avait donné une fonction du type "sinus" pour le courant, tandis que la force électromotrice était du type "cosinus". XLVIII.4. Le circuit RLC série Fortifiés/ées par le succès de l'analyse du circuit LC, nous sommes maintenant prêts à la bataille, c'est-à-dire à l'application immédiate de notre nouvelle formulation mathématique à un circuit de comportement inconnu, stimulé par un générateur de force électromotrice alternative f = foexp(j(ω t). La règle consiste à trouver l'impédance du circuit en combinant les impédances des composantes comme s'il s'agissait de résistances. Après avoir ainsi dérivé l'impédance totale du circuit Z = Z R + jZ I (où Z R et Z I sont évidemment ses parties réelle et imaginaire), le courant i = ioexp(jω t + φ) est donné par: foexp(jω t)(ZR - jZI) foexp(jω t) f i = Z = = ; ZR + jZI ZR2 + ZI2 (455) afin de calculer l'amplitude io du courant, on combine les équations 455 et 447: io = fo ZR2 + ZI2 √ ; (456) quant à la phase φ, on combine les équations 455 et l'Eq. 448: φ = tg-1(-ZI/ZR) . (457) Prenons par exemple le circuit RLC série illustré par la partie inférieure de la Fig. 129. Immédiatement après avoir fermé l'interrupteur, on a un régime transitoire, suivi par une situation stationnaire de courant alternatif forcé par l'alternateur. Nous négligerons le régime transitoire et analyserons le courant alternatif du régime stationnaire à l'aide des équations 456 et 457. Calculons d'abord l'impédance totale du circuit, qui est la combinaison en série des impédances individuelles R, jω L et 1/jω C de la résistance, du self et du condensateur. Le résultat est: 1 Z = R + jω L + 1 = R + j ω L - ω C . jω C (458) Giorgio Margaritondo: Ma Physique 313 En utilisant l'Eq. 456, nous obtenons immédiatement l'amplitude du courant: io = fo √ 1 R2 + ω L - ω C . (459) 2 Prenons le cas limite de résistance nulle, qui correspond au circuit LC; on retrouve la résonance: le courant donné par l'équation 459 devient infini si R = 0 et la fréquence est égale à √ 1/LC . Si par contre R ≠ 0, on n'arrive jamais à obtenir un dénominateur nul dans l'équation 459 et un courant infini (notez que le dénominateur est la racine carrée de la somme de deux carrés); on trouve pourtant le minimum du dénominateur, et donc le maximum 1/LC . On a de l'amplitude du courant, si la fréquence est égale à la fréquence propre √ donc une résonance amortie, qui produit un courant d'amplitude maximale mais non pas infinie. Passons maintenant à la phase: en combinant l'Eq. 457 et l'Eq. 458, nous obtenons: 1 ω C - ω L ; φ = tg-1 R (460) notez que, si la fréquence de l'alternateur est égale à la fréquence propre de résonance 1/LC, le déphasage entre tension de l'alternateur et courant est nul. Les conséquences √ d'un déphasage nul seront clarifiées plus loin. Les résultats des équations 459 et 460 sont illustrés par la Fig. 131. En ce qui concerne l'amplitude, on peut voir la résonance, qui correspond à la valeur maximum fo/R. Circuit RLC série π /2 fo /R Amplitude Phase 0 ωo ω Fig. 131: Amplitude et phase du courant dans un circuit série RLC, données par les équations 459 et 460. Quant au déphasage entre courant et tension, on voit qu'on passe de la valeur π/2 pour les basses fréquences, à la valeur -π/2 pour les hautes fréquences, avec déphasage nul à la résonance. Giorgio Margaritondo: Ma Physique 314 XLVIII.5. La puissance dissipée Considérons maintenant la puissance dissipée sur un circuit stimulé par un générateur de force électromotrice alternative: il s'agit de généraliser la loi de Joule. Prenons d'abord simplement une résistance: la loi de Joule nous donne une puissance iR fR , où iR et fR sont les parties réelles des fonctions courant et force électromotrice. Puisque i = io exp(j( ω t + φ )) et f = fo exp(j ω t) (φ étant le déphasage entre courant et tension), nous avons iR = iocos(ω t + φ) et fR = focos(ω t), donc iRfR = iofocos(ω t + φ)cos(ω t) = iofo(cos(ω t)cosφ - sin(ω t)sinφ))cos(ω t) = iofo(cos2(ω t)cosφ - sin(ω t)cos(ω t)sinφ). Considérons la moyenne par rapport au temps de cette expression: la moyenne du carré du cosinus est 1/2, tandis que la moyenne du produit du sinus et du cosinus est nulle. Par conséquent: Puissance moyenne dissipée = iofocosφ . 2 (461) Ce résultat fondamental révèle l'importance du déphasage entre courant et tension: il détermine la puissance dissipée par le circuit. Par exemple, la condition de résonance donne un déphasage nul, donc le maximum du cosinus et de la puissance dissipée. Analysons maintenant la puissance dissipée par les composantes élémentaires des circuits. Tout d'abord, les résistances: leur impédance, Z = R, n'a que la partie réelle; l'Eq. 457 montre que le déphasage est nul, et donc la puissance dissipée est simplement le produit iofo/2, qui correspond à la puissance moyenne prévue par la loi de Joule. Il s'agit également du maximum de puissance dissipée. Ensuite, les selfs: leur impédance n'a que la partie imaginaire, jω L; l'Eq. 457 prévoit un déphasage de π/2 et l'Eq. 461 révèle qu'on n'a pas de puissance dissipée. Le même résultat est valable pour les condensateurs. En général, un circuit compliqué avec plusieurs composantes donne un facteur cosφ et une puissance dissipée qui ne sont ni nuls ni maximums, et qui dépendent de la fréquence. Les quantités io/√ 2 et fo/√ 2 sont par définition les valeurs efficaces du courant et de la tension alternatifs, ieff et feff; avec ces définitions, l’Eq. 461 devient: Puissance moyenne dissipée = ieff feff cosφ . (462) XLVIII.6. La tension triphasée La dissipation de l’énergie a d’importantes conséquences pratiques: par exemple, une partie de l’énergie électrique produite par les centrales est perdue par effet Joule sur les lignes de transmission. Puisque la résistance, et donc la dissipation d’énergie, augmente avec la longueur de la ligne, on doit essayer de minimiser celle-ci. L’utilisation de la tension triphasée est une solution au moins partielle à ce problème. L’énergie électrique est par conséquent fournie sous cette forme dans la plupart des pays: le réseau de distribution comporte trois tensions alternatives différentes à chaque Giorgio Margaritondo: Ma Physique 315 prise triphasée. Ces trois tensions ont la même amplitude, mais trois phases différentes: 0, 2π/3 et 4π/3. Les trois “phases” sont fournies par trois des fils d’une prise triphasée, identifiés par leurs couleurs. En plus, la prise a un quatrième fil dit “neutre” (et aussi un cinquième fil de “terre”). Cela peut paraître surprenant: comment peut-on transporter trois tensions à l’aide de quatre au lieu de six fils? Le secret réside dans la somme des trois “phases”; on peut facilement effectuer cette somme à l’aide de la représentation vectorielle dans le plan complexe, illustrée par la Fig. 132. Nous voyons d’abord (a) les trois vecteurs qui correspondent aux trois “phases”, 1, 2 et 3. Leur somme vectorielle est montrée par la partie (b) de la figure: on peut facilement constater que le résultat est nul! Donc, on peut compléter la prise triphasée avec un seul fil “neutre”, sans tension ni courant, qui transporte la somme (nulle) des trois phases: cela permet non seulement de réduire de six à quatre les lignes, mais aussi d’avoir dissipation d’énergie sur trois lignes seulement, car le “neutre” n’a évidemment pas de dissipation . 2 (a) 1 3 Fig. 132: Analyse sur le plan complexe de la tension triphasée: (a) les trois “phases”; (b) la somme des trois phases donne une tension nulle (neutre); (c) schéma triangle. 3 (b) 2 1 (c) 2 3 1 Pour les applications pratiques, on peut effectuer deux types de connexions à une prise triphasée: le premier est la connexion entre une des phases et le neutre (schéma étoile), qui donne une tension dont l’amplitude est égale à celle de la phase connectée. Le deuxième, illustrée par la Fig. 132 (c) (schéma triangle), est la connexion entre deux phases, qui donne une amplitude plus élevée. XLVIII.7. Quelques mots sur le concept de réponse d'un système physique Giorgio Margaritondo: Ma Physique 316 La théorie des circuits alternatifs est un exemple particulier de la théorie générale sur la réponse des système physiques, qui peut être appliquée à un nombre énorme de systèmes divers, en optique, en mécanique, dans l'électromagnétisme et dans d'autres domaines. La théorie s'occupe de la réponse du système à une perturbation, telle que le courant (réponse) d'un circuit (système) causé par une force électromotrice alternative (perturbation). Supposons que le système est linéaire, c'est-à-dire qu'une superposition linéaire de perturbations produit une réponse qui est la combinaison linéaire des réponses aux perturbations individuelles. Cette propriété de linéarité nous permet d'utiliser le théorème de Fourier: une perturbation quelconque peut être décomposée en perturbations sinusoïdales, et la réponse du système est la combinaison de ses réponses individuelles aux perturbations sinusoïdales. Prenons donc, pour un système linéaire quelconque, une perturbation sinusoïdale p = p o exp(j ω t). La réponse r est donnée par r = Fp, où F est la fonction de réponse du système. Dans le cas d'un circuit électronique, p est la force électromotrice, r est le courant, et la fonction de réponse est 1/Z, l'inverse de l'impédance. Nous avons vu que la fonction de réponse dans le cas du circuit RLC ne concerne pas seulement l'amplitude de la réponse, mais aussi le déphasage entre perturbation et réponse. Nous avons également vu qu'il existe des relations entre amplitude et déphasage, comme on peut le voir dans la Fig. 131: par exemple, la résonance donne tant le maximum de l'amplitude que le minimum du déphasage. Des relations similaires existent pour une grande partie des systèmes physiques. Ces relations entre amplitude et déphasage correspondent à des relations entre la partie réelle et la partie imaginaire de la fonction de réponse, comme on peut le constater par les équations 456 et 457. A leur tour, les relations entre les parties réelle et imaginaire de la fonction de réponse dérivent directement de deux propriétés fondamentales du système: la linéarité et la causalité, celle-ci exigeant qu’aucune réponse n’existe avant le début de la perturbation. Tout ceci a des conséquences très intéressantes dans presque tous les domaines de la science et de la technologie. Pour les circuits électroniques, par exemple les systèmes hifi, on peut montrer qu'il est impossible d'amplifier un signal sans toucher sa phase. En optique, on met en relation les phénomènes de réflexion et d'absorption de la lumière. Par exemple, un corps qui absorbe beaucoup reflète également beaucoup: on a utilisé cette propriété pendant des siècles, pour fabriquer des miroirs avec des verres couverts de vernis noir qui absorbe la lumière. Or, cette propriété est directement liée aux principes fondamentaux de linéarité et causalité! Admettez, Messieurs et Mesdames les cyniques, que la physique se révèle parfois étonnante, voir charmante! Giorgio Margaritondo: Ma Physique 317 Le Coin Yankee: Composante de Fourier Impédance Résonance Fréquence propre Nombre complexe Nombre imaginaire Fonction de réponse Fourier component Impedence Resonance Self-frequency Complex number Imaginary number “This fundamental result reveals the importance of the phase difference between current and tension: it determines the power dissipated by the circuit. Note, for example, that the resonance condition gives zero phase difference, and therefore amaximum of its cosine: the resonance Response function is also the condition of maximum dissipated power.” Le coin des unités et des ordres de grandeur: Fréquence et fréquence angulaire (pulsation) Unités SI Hertz (Hz) Autres unités Kilohertz (kHz) = 103 Hz; Megahertz (MHz) = 106 Hz; Gigahertz (GHz) = 109 Hz; Ordres de grandeur: Les fréquences des circuits électroniques se trouvent dans un domaine qui commence à la fréquence nulle, et touche parfois les GHz. Giorgio Margaritondo: Ma Physique 318 XLIX. Le champ électrique dans la matière Pour la plupart des cas, la discussion de l’électromagnétisme a concerné des phénomènes qui ont lieu dans le vide. Pourtant, les applications pratiques de l’électromagnétisme se basent souvent sur les propriétés du champ électromagnétique dans la matière. Supposons dès lors que nous mesurons le champ électrostatique créé par une certaine distribution de charge, non pas dans le vide mais dans un solide. On se heurte immédiatement à un problème tant conceptuel que pratique: afin de définir, voire mesurer, le champ électrostatique, on doit mesurer sa force sur une charge unitaire. Mais comment diable peut-on placer cette charge unitaire à l'intérieur d'un solide? Nous discuterons plus loin ce problème; admettons pour l'instant que nous en avons trouvé la solution, et que nous pouvons mesurer le champ électrostatique. Nous constatons que celui-ci ne coïncide pas avec le champ qui serait créé dans le vide par la même distribution de charges. Notre connaissance de la structure microscopique des solides, quoiqu’élémentaire, nous permet de comprendre les causes de cette différence. Un solide est formé par des atomes, qui contiennent des charges électriques: les électrons et les protons des noyaux. Ces charges microscopiques contribuent au champ électrostatique, et en causent les différences par rapport au vide. Notez que les charges microscopiques du solide sont elles-mêmes influencées par les charges externes, qui peuvent modifier leur distribution dans l'espace. Afin de trouver le champ, on doit trouver quelle est cette distribution. On peut distinguer deux types de phénomènes de modification de la distribution des charges d’un solide par des charges externes: ceux qui concernent les conducteurs, et ceux qui concernent les matériaux isolants ou diélectriques. L'électrostatique nous a déjà fourni la théorie de la première classe de phénomènes; les règles en sont: potentiel constant et champ électrique et densité de charge nuls à l'intérieur de chaque conducteur; champ électrique perpendiculaire à chaque superficie conductrice, sa grandeur étant spécifiée par l’Eq. 455. Nous devons maintenant analyser les phénomènes concernant les matériaux diélectriques, qu'on appelle phénomènes de polarisation. Commençons par les discuter dans un cas spécifique, illustré par la Fig. 133: (a) on prend un condensateur plan, et on le charge à l'aide d'un générateur de tension, ensuite (b) on déconnecte le générateur, et enfin (c) on insère une plaque diélectrique entre les plateaux du condensateur. Avant l’insertion du diélectrique, la chute de potentiel sur le condensateur était égale à la tension du générateur, V. On constate que l’insertion du diélectrique cause une diminution de la chute de potentiel. Puisque la distance sur laquelle cette chute a lieu ne change pas, sa diminution manifeste une diminution de grandeur du champ électrique. La raison physique est assez facile à comprendre sur le plan microscopique (voir la Fig. 134 on a dans le diélectrique des charges électriques microscopiques (électrons, protons) qui globalement se neutralisent. A cause du champ du condensateur, les charges positives et négatives du diélectrique se déplacent un peu dans des directions opposées. La superficie du diélectrique proche de la plaque positive du condensateur se trouve, par conséquent, en possession d’une charge nette négative et vice versa. Les charges sur les deux superficies du diélectrique neutralisent en partie les charges du condensateur, et diminuent la grandeur du champ électrique interne. Notez σ P et -σ P la charge par unité de superficie produite sur les deux surfaces du diélectrique par ce phénomène de polarisation. Avant l’insertion du diélectrique, la Giorgio Margaritondo: Ma Physique 319 grandeur du champ est E o = σ /ε o , où σ est la grandeur de la charge par unité de superficie des plaques du condensateur. Avec le diélectrique, la grandeur devient: E = (σ -σP)/εo . (463) (a) (b) (c) I C - D V + −σ σp S L − σp σ Fig. 133: (a) Condensateur avec son champ électrique, créé par la batterie qui produit la chute de potentiel V ; (b) l’interrupteur I est ouvert et le condensateur est isolé de la batterie; (c) un diélectrique D est placé entre les plaques du condensateur: le champ change à cause des densités de superficie de charge de polarisation, ±σP, qui diminuent l’effet des densités de superficie ±σ de charge sur les plaques du condensateur. On peut manipuler cette relation à l’aide du concept de dipôle électrique. On appelle dipôle électrique un système formé par deux charges électriques de grandeur égale et de signes opposés, qui se trouvent à une certaine distance l’une de l’autre. Si la distance est L et la grandeur des charges est q, le dipôle est par définition un vecteur p orienté dans la direction qui mène de la charge positive à la charge négative, dont la grandeur est: p = qL . (464) Dans le cas du diélectrique de la Fig. 133, la polarisation crée un dipôle électrique total de grandeur p = σPSL, où S est la superficie des plaques du condensateur. Le dipôle par unité de volume est donc un vecteur de grandeur: P = σP . (465) on appelle ce vecteur “dipôle par unité de volume” la polarisation du diélectrique, P. L’équation 463 peut donc s’écrire: E = (σ -P)/εo . (466) Giorgio Margaritondo: Ma Physique 320 XLIX.1. Susceptibilité et constante diélectrique relative Nous devons considérer maintenant un résultat physique de la plus grande importance: pour la plupart des phénomènes réels, la polarisation du diélectrique augmente avec le champ électrique de façon linéaire: + - + - + - + - + - + - + - + - + - + - + + - + - + - + - + - + - + - + - + - + - + - CHAMP ELECTRIQUE + - + - + - + - + - + - + - + - + - + - + + - + - + - + - + - + - + - + - + - + - + - Fig. 134: Polarisation d’un diélectrique soumis à l’action d’un champ électrique: le diélectrique demeure localement neutre à l’intérieur, mais il se charge sur les deux superficies. Ce résultat important n’est pas du tout évident: le déplacement de charges microscopiques dont résulte la polarisation est un phénomène très compliqué, dont la description au niveau des atomes et des changements de liaisons chimiques est fournie par la physique quantique. On peut facilement comprendre que l’importance du phénomène doit augmenter avec la grandeur du champ électrique; mais il n’est pas évident que leur relation est une relation linéaire, comme le démontrent pourtant les études empiriques. La constante de proportionnalité entre polarisation et champ électrique s’écrit sous la forme: P/E = εoχE , (467) où χE est par définition la susceptibilité électrique du matériau diélectrique. En utilisant les grandeurs des vecteurs concernés, l’Eq. 467 devient: P = εoχEE, , (468) et l’équation 466 peut être écrite sous la forme: E = (σ - εoχEE)/εo = σ /εo - χEE , (469) Giorgio Margaritondo: Ma Physique 321 d’où: E = σ εo(1 + χE) . (470) La constante (1 + χE) est appelée constante diélectrique relative du diélectrique: εR = 1 + χE ; (471) avec cette définition, le champ en présence du diélectrique s’écrit: σ Eo E = ε ε = ε , o R R (472) où Eo est la grandeur du champ électrique avant l’insertion du diélectrique. Conclusion: la grandeur du champ électrique diminue à cause du diélectrique d’un facteur εR. XLIX.2. Vecteur déplacement électrique Les manipulations que nous venons de présenter sont un peu un jeu mathématique: ne leur permettez pas de vous faire oublier les faits physiques! Ceux-ci sont les suivants: premièrement, le champ électrique provoque la polarisation des diélectriques, qui à son tour tend à diminuer la grandeur du champ. Deuxièmement, le phénomène, quoique très compliqué sur le plan microscopique, se révèle simplement linéaire par rapport au champ. L’équation 472 n’est qu’une conséquence de cette linéarité. L’importance de la polarisation d’un diélectrique augmente, évidemment, si sa constante diélectrique relative est élevée. Cela a des conséquences qui se révèlent parfois très agréables. Prenez par exemple de l’eau: sa constante diélectrique εR ≈ 80 est énorme. Par conséquent, la grandeur des forces électrostatiques dans l’eau est très faible par rapport au vide. Cela s’applique, en particulier, à la grandeur des forces qui causent les liaisons chimiques entre les ions des matériaux ioniques. Sur le plan pratique, si l’on met du sel (NaCl) dans l’eau, on observe sa dissolution: donc, le phénomène de la polarisation nous permet de préparer un bon plat de spaghetti, cet apogée épicurien de la haute cuisine internationale, pour lequel vous me permettrez de proposer ma recette préférée au bas de la page.6 On peut généraliser le résultat de l’équation 472 en disant que la théorie entière du champ électrique dans les matériaux diélectriques peut être simplement dérivée de la théorie dans le vide, en remplaçant la constante εo avec εo εR . Par exemple, la loi de Gauss devient, sous ses formes non-locale et locale: Q ΦΣ = εoε ; R (473) 6 Prenez 100 grammes de spaghetti par personne, et préparez-les comme d’habitude, bien entendu al dente, en utilisant beaucoup d’eau bouillante et salée. Après les avoir égouttés, ajouter une sauce préparée en mélangeant des asperges, préalablement bouillies et coupées en morceaux d’un centimètre de longueur environ et salées, à de l’huile d’olive extra vierge. Ajoutez encore du parmesan rapé, mélangez et mettez sur la table, pour le plaisir de vos amis, ce résultat incomparable, qui s’appelle spaghetti quantiques à la mode de Madison. Giorgio Margaritondo: Ma Physique 322 ρ ∇ • E = εoε . R (474) Par contre, on ne doit pas changer les deux formes de la loi de Faraday-Neumann-Lenz, équations 401 et 407, parce que la constante diélectrique n’y joue pas de rôle. On a dans un diélectrique comme dans le vide: fem = - dΦ(B) dt . ∂B ∇ × E = - ∂t . La constante εoεR des équations 473 et 474 exprime le fait que le champ électrique dans un diélectrique ne dépend pas seulement des charges qui causent le champ dans le vide, mais aussi des charges de polarisation. On aimerait pourtant, au moins pour une partie des applications de la théorie, simplifier celle-ci en utilisant un vecteur qui ne dépend pas des charges de polarisation. Cela nous suggère d’introduire le vecteur déplacement électrique: D = εoεRE . (475) Prenons d’abord le cas du condensateur plan de la Fig. 133; puisque E = σ/ε o ε R , la grandeur D du vecteur D est: D=σ , (476) qui ne dépend que des charges sur les plaques du condensateur, et non des charges de polarisation. La loi de Gauss pour le vecteur D s’écrit: ∇•D=ρ , (477) également sans dépendance des charges de polarisation. XLIX.3. Changements de E et de D aux interfaces: mesure de E dans les diélectriques Nous sommes maintenant prêts à analyser le problème susmentionné de la définition, voire de la mesure, du champ électrique dans un matériau. On doit évidemment créer des cavités dans le matériau, afin d’insérer les instruments de mesure, idéalement une charge électrique unitaire, et les instruments pour mesurer la force à laquelle elle est soumise. Mais quelle garantie avons-nous que le champ dans la cavité est égal au champ à l’intérieur du matériau? Afin de répondre à cette question, il est évidemment nécessaire de trouver quels sont les changements du champ électrique lorsqu’on passe à travers une interface, par exemple l’interface entre un diélectrique et le vide. On peut simplifier le problème en analysant une interface exempte de charges à l’exception des charges de polarisation. Cette hypothèse nous permet de réaliser immédiatement que D p, la composante perpendiculaire à l’interface du vecteur D, ne Giorgio Margaritondo: Ma Physique 323 change pas d’un côté de l’interface à l’autre. Considérons la partie supérieure de la Fig. 135: on voit deux matériaux diélectriques 1 et 2 avec leur interface. Juste à l’interface, on a sélectionné un cylindre (vu de côté) de dimensions infinitésimales; plus précisément, les surfaces ds, parallèles à l’interface des deux matériaux, sont des quantités infinitésimales du premier ordre, tandis que la surface latérale du cylindre est une quantité infinitésimale d’ordre supérieur. Le flux du vecteur D est approximativement donné par (D p2 - D p1)ds, où D p1 et D p2 sont les composantes perpendiculaires du vecteur D aux deux côtés de l’interface. Notez que le signe de D p1 est négatif, puisque le flux se calcule en prenant le vecteur ds perpendiculaire à la superficie orienté vers l’extérieur du petit cylindre. D’autre part, le petit cylindre ne contient pas de charges à l’exception de celles de polarisation. Le théorème de Gauss pour le vecteur D (Eq. 477) exige par conséquent que le flux soit nul, donc (Dp2 - Dp1)ds = 0 et: Dp1 = Dp2 , (478) comme nous l’avions précisément annoncé. Passons maintenant à l’analyse du comportement à l’interface du vecteur E. Prenons la partie inférieure de la Fig. 135: on voit à l’interface une ligne fermée, sur laquelle on peut calculer la circulation de E. La ligne est de longueur infinitésimale, et plus spécifiquement ses traits parallèles à l’interface sont de longueur dl infinitésimale du premier ordre, et les autres des infinitésimales d’ordre supérieur. La circulation du vecteur E est approximativement (E t2 - E t1)dl, où E t1 et E t2 sont les composantes du vecteur E tangentes à l’interface, aux deux côtés de celle-ci. Le signe de Et1 est négatif dans cette expression parce que nous calculons la circulation en parcourant la ligne fermée dans la direction des aiguilles d’une montre. 1 2 ds D2 D1 1 2 E2 dl E1 Fig. 135: Changements des vecteurs D et E en passant d’une partie à l’autre de l’interface entre des matériaux diélectriques 1 et 2. Giorgio Margaritondo: Ma Physique 324 D’autre part, on n’a pas de flux variable du champ magnétique dans la ligne fermée, donc l’Eq. 401 exige que la circulation soit nulle, et: Et1 = Et2 , (479) c’est-à-dire que, pour le champ électrique, la composante qui ne change pas d’une partie à l’autre de l’interface est celle tangente à l’interface. Le fait que les composantes perpendiculaire au vecteur D et tangente au vecteur E ne changent pas lorsqu’on passe d’un matériau à l’autre a une série de conséquences tant pratiques que fondamentales. Considérons premièrement la Fig. 136: on peut voir que la grandeur et la direction du champ électrique changent d’une partie à l’autre de l’interface entre deux matériaux diélectriques, tout en gardant constante la composante tangente. En tenant compte des relations 478 et 479, et également de la définition du vecteur D, Eq. 475, on trouve que sinθ1 = Et1/Ep1 = Et1εoεR1/Dp1, et sinθ2 = Et2/Ep2 = Et2εoεR2/Dp2, d’où: εR1 sinθ1 = , ε sinθ2 R2 (480) le rapport des deux constantes diélectriques des deux matériaux. Ce phénomène de changement de direction est parfois appelé “réfraction” du champ électrique. La deuxième conséquence des équations 478 et 479 est la possibilité de mesurer le vecteur E dans un diélectrique. L’invariance de sa composante tangente est la clé du problème: on peut introduire les instruments de mesure dans une cavité, à condition qu’elle soit beaucoup plus longue que large, donc un tunnel, et orientée dans la direction du champ. On rend ainsi négligeable la composante perpendiculaire aux parois de la cavité, et on ne mesure que la composante tangente, qui ne change pas de l’intérieur à l’extérieur de la cavité. 1 2 Ep1 Et1 θ1 θ2 Ep2 Et2 Fig. 136: “Réfraction” du champ électrique en passant d’une partie à l’autre de l’interface entre des diélectriques. Notez que cette définition, quoique apparemment approximative, est parfaitement rigoureuse: lorsqu’on dit que la cavité doit être “plus longue que large”, on implique que le rapport longueur/largeur doit être sélectionné afin de rendre les effets des extrémités de la cavité négligeables par rapport à la précision souhaitée de la mesure du champ. Giorgio Margaritondo: Ma Physique 325 XLIX.4. Les mécanismes microscopiques de la polarisation La constante diélectrique relative nous a fourni une manière macroscopique de traiter les effets des phénomènes de polarisation. Il s'agit malheureusement d'une approche empirique, qui ne nous permet pas de comprendre la différence entre un matériau et l'autre au niveau microscopique. Prenons deux exemples spécifiques: du verre et de l'eau. Les valeurs typiques de la constante diélectrique relative des verres se situent entre 5 et 7; par contre, la valeur de l'eau est 81. La connaissance des valeurs de εR nous permet de prévoir les propriétés du champ électrique dans ces matériaux; mais quelle est la cause réelle d’une telle différence de grandeur? Essayons de répondre en analysant leurs structures microscopiques. Les verres sont des solides amorphes, sans ordre global dans la position des atomes, qui sont connectés rigidement les uns aux autres par des liaisons chimiques. La polarisation en présence d'un champ électrique a lieu approximativement comme illustré par la Fig. 134 (à l'exception du manque d'ordre en ce qui concerne la disposition des atomes): le champ électrique cause un déplacement des charges microscopiques positives et négatives dans deux directions opposées, créant ainsi un dipôle. Notez que sans le champ électrique on n'a pas de dipôles, que ce soit au niveau macroscopique ou microscopique. La polarisation a lieu dans ce cas par création d'un dipôle qui n’existait pas. Avant de passer à l'eau, essayons de comprendre la grandeur du phénomène. Prenons encore la Fig. 134, et notons δ le déplacement entre les distributions des charges microscopiques positives et négatives. Ce déplacement ne change pas la charge microscopique nette à l’intérieur, qui demeure nulle. Mais il crée une région de charge positive ou négative sur les deux superficies, dont l'épaisseur est justement δ. Admettons que la densité de charge microscopique positive et négative du matériau est ± ρ ; la densité de superficie de charge de polarisation est ±σ p = ±ρ δ. D'autre part, les équations 463 et 472 nous donnent: (σ/εoεR) = E = (σ - σp)/εo, d'où l'on obtient σp = σ(1- 1/εR) et: δ = σp/ρ = (σ/ρ)(1- 1/εR) . (481) On peut essayer de calculer l'ordre de grandeur du déplacement en prenant des valeurs raisonnables pour un verre; par exemple, une valeur de l'ordre de 200 Å3 = 2 × 10-28 m3 pour le "volume" occupé par un atome, et une moyenne de l'ordre de 10 électrons (ou protons) par atome, équivalente à ≈ ± (2 × 10-18) coulomb par atome, et donc ρ ≈ (2 × 10 -18 )/(2 × 10-28 ) = 1010 coulomb/m3 . Mettons ce verre dans un condensateur qui donne un champ E = 106 V/m, qui correspond à σ = ε o E ≈ 10-11 × 106 = 10- 5 coulomb/m 2 . Puisque (1- 1/ε R ) est de l'ordre de 0,8, l'équation 481 donne un déplacement δ de l'ordre de (10-5/1010) × 0,8 ≈ 10-15 m, donc très petit même à l’échelle atomique. D'autre part, ce déplacement est raisonnable si l'on considère la grandeur des forces en jeu. Le déplacement δ est l’effet de la force du champ électrique externe sur les charges microscopiques, qui change un peu l’équilibre créé par les liaisons chimiques. L’ordre de grandeur de la force d’une liaison chimique peut être estimé dans le cas, par exemple, Giorgio Margaritondo: Ma Physique 326 de la force coulombienne entre deux ions, soit deux charges électroniques, à la distance typique, disons, r ≈ 1,5 Å = 1,5 × 10-10 m. La grandeur de la force étant f = Q2/4πεor2, un petit déplacement δ cause un changement de l'ordre de |∂f/∂r|δ = 2(Q2/4πεor3)δ ≈ 2 × ((2 × 10-19)2/(4 × 3 × 10-11 × (1,5 × 10-10)3)) × 10-15 ≈ 2 × 10-13 newton. Ce changement est équilibré par la force du champ externe. L’ordre de grandeur de 1013 newton correspond à la force causée sur une charge électronique par un champ externe de l’ordre, justement, de 106 V/m. Donc, le déplacement des densités de charges microscopique est cohérent avec l'action du champ macroscopique sur ces charges. Mais ce modèle microscopique n'arrive pas à justifier la différence de polarisabilité entre verre et eau, manifestée par la différence de grandeur des constantes diélectriques relatives. Voyons quelle est la structure microscopique de l’eau, à l'aide de la Fig. 137. Nous constatons que chaque molécule d'eau possède un dipôle électrique microscopique, dû à la distribution dans l'espace de la charge microscopique des atomes dans la molécule. Avant la formation des liaisons chimiques, chacun des atomes a une distribution de charge, tant négative des électrons que positive des protons du noyau, symétrique et centrée sur le noyau; l'atome n'est pas seulement neutre, mais en plus sans dipôle. Lors de la formation des liaisons chimiques hydrogène-oxygène, la distribution de la charge électronique change, et on a une charge négative plus grande dans la région de l'atome d'oxygène, ce qui exige que les régions occupées par les atomes d'hydrogène soient chargées positivement afin de conserver la neutralité totale. La structure qualitative de la molécule, telle que montrée par la Fig. 137, est équivalente à un petit dipôle; la distance entre les atomes étant de l'ordre de grandeur de l’angstrom, et la charge de celui de l'électron, soit 1.6 × 10-19 coulomb, l'ordre de grandeur de ces dipôles moléculaires est de 10-28 coulomb-mètre. La partie inférieure de la Fig. 137 illustre l'action d'un champ électrique sur les microdipôles moléculaires: sans celui-ci, on n'a pas d’orientation précise des microdipôles, qui n’engendrent donc pas de dipôle macroscopique. Le champ tend à orienter les dipôles microscopiques, produisant ainsi un dipôle macroscopique, puisque l'eau a plus de charge négative que positive à la superficie inférieure du récipient et vice-versa. Ce dipôle macroscopique est décrit par le vecteur polarisation, P. On peut facilement réaliser qu'il est plus facile d'orienter des microdipôles qui existent déjà plutôt que de créer un dipôle en déplaçant des charges microscopiques. Pour une certaine valeur du champ externe, P est plus grand pour l'eau que pour le verre, d'où la grandeur plus élevée de la susceptibilité électrique et par conséquent de la constante diélectrique. La différence entre les deux cas est donc que pour l'eau on a des dipôles microscopiques même sans champ électrique, tandis que pour le verre on n’en a pas. Dans le premier cas la polarisation a lieu par orientation, et dans le second par déplacement de charges. Il existe pourtant des matériaux, dits ferroélectriques, dont les propriétés de polarisation ne sont comparables ni à l'eau ni au verre: tant pour l’une que pour l’autre, la grandeur de P augmente de façon linéaire avec E, et est nulle si E est nul. La structure microscopique des matériaux ferroélectriques, par contre, peut donner un dipôle macroscopique même sans champ électrique externe. Elle peut également causer Giorgio Margaritondo: Ma Physique 327 la non-linéarité du rapport polarisation-champ. Les matériaux ferroélectriques sont très importants pour leurs applications industrielles, notamment dans le domaine des télécommunications: leurs propriétés optiques sont utilisées afin de moduler à très grande fréquence les rayons lasers, permettant ainsi d'utiliser plus efficacement le transport des informations par ce biais, par exemple sur les fibres optiques. - O + H + H -2e = p +2e E E=0 = Fig. 137: Chaque molécule d’eau possède un dipôle électrique microscopique; par conséquent, la polarisation de l’eau se produit par orientation de ses dipôles microscopiques, et donne une constante diélectrique relative plus élevée que celle du verre. P Giorgio Margaritondo: Ma Physique 328 Le Coin Yankee: Diélectrique Polarisation Dipôle Susceptibilité Constante diélectrique relative Déplacement électrique Ferroélectrique Dielectric Polarization Dipole Susceptibility Relative dielectric constant D-vector “The difference between the two cases, therefore, is that for the water there are microscopic dipoles even without an electric field, whereas for the glass they do not exist. In the first case, the polarization is caused by orientation, and in the second, by charge displacement. ” Ferroelectric Le coin des unités et des ordres de grandeur: Dipôle électrique Polarisation D (vecteur déplacement électrique) Unités SI Coulomb-mètre (Cm) C/m 2 C/m 2 Autres unités Ordres de grandeur: L’ordre de grandeur typique du dipôle microscopique d’une molécule qui en possède un est de 10-18 -10 -19 Cm. Giorgio Margaritondo: Ma Physique 329 L. Le magnétisme dans la matière Le traitement du champ électrique dans les matériaux diélectriques nous fournit également un guide pour le traitement des phénomènes magnétiques dans la matière. Résumons encore une fois les points principaux concernant le champ électrique: • Le champ est modifié en remplaçant le vide par un diélectrique, à cause des charges de polarisation. • Celles-ci correspondent à un dipôle électrique macroscopique, qui est décrit par le vecteur polarisation, P. • Le vecteur P augmente de façon linéaire avec le champ E. • On peut définir un vecteur D = εoεRE qui ne dépend pas des charges de polarisation. • La polarisation peut avoir lieu grâce à la création de dipôles ou à l'orientation de dipôles microscopiques existants. En passant des phénomènes électriques au magnétisme dans la matière, le rôle joué par les charges est remplacé par celui des courants. Au lieu de la polarisation des charges atomiques, on a une aimantation des courants qui sont produits par le mouvement des électrons. Voyons donc quelle est l'influence d'un champ B sur ces courants microscopiques. Prenons donc le solénoïde illustré par la Fig. 138. Le champ B produit par un courant i change de grandeur si le vide est remplacé par un matériau au centre du solénoïde. La grandeur peut augmenter ou diminuer par rapport au vide: dans le premier cas on parle d’un matériau paramagnétique, dans le second d’un matériau diamagnétique. Analysons d’abord le phénomène au niveau macroscopique. Dans le cas du champ électrique, nous avons utilisé la constante diélectrique relative εR pour définir (voir l’Eq. 472) le rapport entre le champ dans le matériau et celui qu’on aurait dans le vide. Dans le cas de la Fig. 138, nous utiliserons ce qu’on appelle la perméabilité relative µ R du matériau pour définir le rapport entre la grandeur B du champ B dans le matériau et celle du vide, Bo: B = µRBo . (482) Notez qu’il existe une petite différence formelle entre cette équation et l’équation 472 pour le champ électrique: la grandeur du champ, B, est multipliée par la constante µR dans le premier cas, tandis que la grandeur E est divisée par εr dans le deuxième. Cette différence, essentiellement d’origine historique, est liée à la manière d’écrire les deux lois fondamentales, théorème de Gauss et loi de la circulation d’Ampère, pour les deux champs. La constante µ R est évidemment plus grande que l’unité pour les matériaux paramagnétiques, et plus petite pour les matériaux diamagnétiques. Dans le cas du condensateur de la Fig. 133, nous avons attribué la différence entre E et E o aux charges de polarisation, qui à leur tour sont liées par l’Eq. 465 au vecteur polarisation. Dans le cas du solénoïde de la Fig. 138, nous attribuons la différence entre B et Bo aux effets des courants atomiques du matériau. Giorgio Margaritondo: Ma Physique 330 Sans le matériau, le solénoïde donnerait un champ dont la grandeur est spécifiée par l’Eq. 497: Bo = µoni ; (483) d’autre part, l’Eq. 400 montre que chaque spire du solénoïde est équivalente à une aiguille magnétique, dont le moment est m = µoi S. Le moment magnétique total des N spires du solénoïde est µoi SN; puisque n est le nombre de spires par unité de longueur et S la section du solénoïde, le moment magnétique par unité de volume du solénoïde est µ o ni. Conclusion: le vecteur B correspond aussi au moment magnétique par unité de volume. B i Fig. 138: Etude du champ B produit par le courant i du solénoïde en présence d’un matériau. Admettons maintenant que les courants atomiques du matériau de la Fig. 138 causent un moment magnétique supplémentaire, un peu comme les charges de polarisation d’un diélectrique causent un dipôle électrique. Le moment magnétique supplémentaire par unité de volume ou aimantation, M, joue pour le magnétisme un rôle similaire à la polarisation P pour le champ électrique. Avec l’aimantation M du matériau, l’Eq. 483 doit être modifiée: B = µoni + M ; (484) Pour les matériaux tant diamagnétiques que paramagnétiques, M est lié au champ B par une relation linéaire (un peu comme le vecteur P au champ E). Nous écrirons cette relation linéaire: χM M = B , 1 + χM (485) où χM est la susceptibilité magnétique du matériau; la justification de l’expression de la relation linéaire entre M et B sous une forme apparemment follement compliquée, telle que l’Eq. 485, sera fournie par la suite. En comparant les équations 483, 484 et 485, on obtient B = µoni + M = Bo + M = Bo + (χM/(1 + χM))B , d’où: B/(1 + χM) = Bo, et, en utilisant l’Eq. 482: Giorgio Margaritondo: Ma Physique 331 µR = 1 + χM . (486) Voilà donc la justification de l’expression “follement compliquée” de la relation 485: elle nous permet d’arriver à une relation simple entre susceptibilité et perméabilité magnétiques. Notez que pour un matériau paramagnétique χ M est positive, tandis qu’elle est négative pour les matériaux diamagnétiques. L.1. Les lois du magnétisme dans la matière et le champ magnétique H La définition de la constante µ R nous permet d’écrire les lois fondamentales du magnétisme dans la matière en tenant compte de manière purement empirique et formelle des effets des courants atomiques. Le fait que les “charges magnétiques” isolées n’existent pas est toujours valable, et donc on a toujours le équations 482 et 484: ΦΣ(B) = ∫Σ B • ^n ds = 0 , et ∇•B = 0. Par contre, on doit changer la loi d’Ampère (équations 483 et 488) afin de tenir compte des effets des courants atomiques, en remplaçant µo par µoµR: o ∫ B • dl = µoµRi . (487) ∇ × B = µoµRj . (488) L Il est parfois préférable d’utiliser, au lieu de B, un vecteur champ magnétique H qui ne dépend pas des courants atomiques, et qui joue un rôle un peu similaire à celui du vecteur D par rapport au champ électrique. On définit le champ H de la manière suivante: B H = µ µ ; o R (489) Les équations 487 et 488, en fait, donnent pour le champ H: o ∫ H • dl = i ; (490) ∇×H = j , (491) L sans trace de µR et de l’action des courants atomiques. L.2. Changements de B et de H aux interfaces: mesures dans les matériaux Comment peut-on mesurer le champ magnétique B dans un matériau? Le problème est analogue à celui de la mesure de E dans un solide. La solution est fournie par les Giorgio Margaritondo: Ma Physique 332 propriétés des changements des champs aux interfaces entre deux matériaux et, en particulier, entre un matériau et le vide. Notons d’abord que la divergence de B est nulle, et la même dérivation qui nous a amenés à l’Eq. 478 donne dans ce cas: Bp1 = Bp2 ; (492) la composante perpendiculaire ne change donc pas en passant d’un côté à l’autre de l’interface. Les règles de mesure du champ B dans un matériau solide sont évidemment complémentaires à celles du champ E: on doit utiliser une cavité qui est beaucoup plus large que longue. En ce qui concerne le champ H, admettons qu’à l’interface on n’a pas de courants (à l’exception des courants atomiques, qui ne touchent pas ce vecteur). L’Eq. 490 montre que la circulation de H est nulle, et le même type de dérivation qui aboutit à l’Eq. 479 donne dans ce cas: Ht1 = Ht2 . (493) L.3. Le magnétisme dans la matière: analyse microscopique Nous n’avons toujours pas analysé les phénomènes microscopiques qui causent l’aimantation M. Essayons de nous imaginer le mouvement des électrons dans un atome. Le modèle d’atome à “système solaire” de Bohr, tout en étant très primitif par rapport aux théories modernes de la structure atomique, nous permet de comprendre le rapport entre ce mouvement et l'existence de M. Imaginons donc (Fig. 139 (a) et (b)) un électron dans un atome qui circule sur une trajectoire fermée autour du noyau: il s'agit essentiellement d'une charge électrique qui circule sur une "spire", donc d'une spire avec un courant. Cet électron possède évidemment un moment magnétique, dont la grandeur est spécifiée par l'Eq. 400: m = µoiS . Le courant correspond au passage d’une charge de grandeur égale à celle d’un électron chaque fois que l’électron complète une trajectoire fermée. Admettons que celle-ci est un cercle de rayon r, sur lequel l’électron circule à vitesse angulaire ω : le courant est celui d’une charge de grandeur e pendant une période de 2π/ω; on a donc i = eω/2π, et m = µoiS = µo(eω/2π)πr2, d’où: m = µoeωr2 . 2 (494) Soumis à l’action d’un champ magnétique, ce moment microscopique tend à s’orienter dans la direction du champ donnant lieu au phénomène de l’aimantation magnétique. Par conséquent, il change le champ. Le mouvement des électrons qui circulent sur leurs trajectoires atomiques n’est pas le seul mouvement microscopique qui cause des moments magnétiques. Chaque électron est en rotation par rapport à son axe, un peu comme une toupie (Fig. 139 (c) et (d)). Imaginons que l’électron en rotation est séparé en petits morceaux de charge électrique: Giorgio Margaritondo: Ma Physique 333 chacun d’eux (Fig. 139 (d)) est équivalent à une charge qui circule sur une ligne fermée, et donc encore une fois à un courant qui circule sur une spire. Chaque morceau de charge donne donc un petit moment magnétique, et tous les morceaux combinés sont équivalents au moment microscopique de l’électron-toupie. (a) (b) i -e (d) (c) -e -e Fig. 139: Les mouvements microscopiques des électrons correspondent à des moments magnétiques, également microscopiques: (a) mouvement d’un électron sur une trajectoire (atomique), qui est équivalent (b) à un courant sur une spire; (c) mouvement d’un électron du type toupie, qui correspond (d) à une série de mouvements circulaires des parties de l’électron, et donc à une série de “spires” microscopiques, qui donnent lieu à un moment magnétique total, dit de “spin”. Le nom yankee de la rotation à toupie étant “spin”, on appelle celle-ci le moment magnétique de “spin” de l’électron. Soumis à un champ magnétique, les moments magnétiques de spin peuvent contribuer à l’aimantation. Notez qu’à l’exception du cas des matériaux ferromagnétiques qu’on discutera plus tard, sans l’action d’un champ magnétique externe on n’a pas d’orientation préférentielle des moments magnétiques microscopiques, et ceux-ci tendent à s’annuler réciproquement sans causer d’aimantation. Avec un champ externe, on a orientation des moments microscopiques et aimantation. Mais s’agit-il d’une aimantation de type paramagnétique ou diamagnétique? Imaginons la spire carrée qui est illustrée par la Fig. 140: on peut voir que le champ magnétique B tend à la faire tourner vers le plan perpendiculaire au champ. Le courant de la spire dans ce plan crée un champ supplémentaire dans la même direction que le champ Giorgio Margaritondo: Ma Physique 334 original; donc, la spire tend à augmenter la grandeur de B, grâce à une aimantation de type paramagnétique. Le même résultat est valable pour le moment de spin. B B i i Fig. 140: (à gauche) un champ magnétique B tend à faire tourner une spire de fil conducteur avec un courant, jusqu’au point où le plan de la spire est perpendiculaire au champ. Par conséquent, le moment magnétique de la spire devient parallèle au champ, dont elle tend à augmenter la grandeur. Mais quelle est, par contre, la cause microscopique du comportement d’un matériau diamagnétique? On pourrait soupçonner que tout matériau possède des spires microscopiques; comment peut-il donc avoir un comportement différent du paramagnétisme? La réponse est suggérée par la Fig. 141: imaginons deux électrons dans un atome, qui circulent sur deux trajectoires circulaires mais dans des directions opposées. Chaque électron possède un moment magnétique. Pourtant, les deux moments s’annulent réciproquement et le moment total est nul. B v-∆v e -v v e v+∆v Fig. 141: A gauche: la combinaison de deux électrons qui circulent sur deux trajectoires circulaires dans deux directions opposées ne donne aucun moment magnétique total. A droite: par contre, quand les deux électrons sont soumis à l’action d’un champ magnétique, leur vitesse de rotation change un peu, ce qui correspond à un moment magnétique total non nul pour le système. Les moments magnétiques des électrons d’un atome ont souvent tendance à s’annuler réciproquement, en annulant le moment total de l’atome. Dans ce cas, on ne peut pas avoir aimantation de type paramagnétique. Par contre, un deuxième effet est toujours présent, qui donne une aimantation de type diamagnétique. Prenons encore les deux électrons de la Fig. 141, qui se déplacent sur Giorgio Margaritondo: Ma Physique 335 deux trajectoires atomiques circulaires. Soumettons-les à l’action d’un champ magnétique de grandeur B, perpendiculaire aux plans des trajectoires. La physique quantique montre que les trajectoires, et en particulier leurs rayons, ne changent pas sous l’action du champ. Par contre, le champ cause une force de Lorentz, qui doit être compensée par un changement de la force centrifuge, et qui exige donc un changement de la vitesse de rotation de chaque électron. Prenons par exemple l’électron qui circule sur la trajectoire inférieure de la Fig. 141. Avant la mise en fonction du champ magnétique, la force centrifuge de grandeur mv2/r (où m est la masse de l’électron, v la grandeur de sa vitesse et r le rayon de la trajectoire) est évidemment compensée par la force électrostatique entre l’électron et le noyau de l’atome, de manière que la force totale, vue du référentiel de l’électron en rotation, est nulle. Mettons maintenant en fonction le champ magnétique, et admettons que la grandeur de la vitesse de rotation change de v à v+∆v (où v«∆v). La nouvelle grandeur de la force centrifuge est m(v+∆v)2/r ≈ m(v+2v∆v)/r, avec une augmentation de ≈2mv∆v/r par rapport à la situation sans champ magnétique. Cette augmentation doit compenser la force de Lorentz du champ, e(v+∆v)B ≈ evB, donc on obtient 2mv∆v/r ≈ evB, d’où ∆v/r ≈ eB/2m, et: eB ∆ω ≈ 2m , (495) où ∆ω = ∆v/r est le changement de vitesse angulaire causée par le champ. Si l’on répète l’analyse pour le deuxième électron de la Fig. 141, on constate que la force de Lorentz s’exerce dans la direction opposée à celle du premier électron, donc la vitesse de rotation doit diminuer de v à v-∆v, afin de diminuer la grandeur de la force centrifuge. Notez que le changement ∆v se fait dans la même direction que celui du premier électron; la grandeur du changement est aussi la même, et donc l’Eq. 495 est valable tant pour le deuxième électron de la Fig. 141 que pour le premier. L’Eq. 495 est connue comme le théorème de Larmor, et nous dit finalement que le champ B change la vitesse de rotation de eB/2m, toujours dans la même direction. Maintenant examinons le phénomène en ce qui concerne le moment magnétique du système des deux électrons. Le changement ∆ ω de vitesse angulaire du premier électron change également son moment magnétique. La grandeur du changement est spécifiée par l’Eq. 495: ∆m = µ o e∆ ω r 2 /2 = µ o e 2 Br 2 /4m. Ce changement n’est pas compensé par le changement de vitesse angulaire du deuxième électron, parce que celui-ci circule dans la direction opposée au premier; donc le changement de sa vitesse angulaire, et par conséquent le changement ∆m qui lui correspond, ainsi que sa direction, est le même que celui du premier électron. Conclusion: les deux changements de vitesse angulaire induits par le champ magnétique pour les deux électrons causent un moment magnétique total qui n’est plus nul. On constate que la grandeur du moment ainsi créé, et donc de l’aimantation totale du matériau, est linéaire par rapport à la grandeur du champ, en accord avec l’Eq. 485. Enfin, l’analyse de la direction des phénomènes susmentionnés montre que ceux-ci diminuent la grandeur du champ magnétique externe: on a donc trouvé la justification microscopique du diamagnétisme. Giorgio Margaritondo: Ma Physique 336 L.4. Le ferromagnétisme Il existe une troisième classe de matériaux qui ne sont ni diamagnétiques ni paramagnétiques, et qu’on appelle ferromagnétiques. Ces matériaux sont caractérisés par la présence d’aimantation même sans champ magnétique externe. Ils sont donc en mesure de créer un champ magnétique de façon autonome, propriété qu’on utilise pour fabriquer des aimants. En plus, la relation entre champ B et aimantation n’est plus linéaire comme le prévoit l’Eq. 485, ce qui implique que la susceptibilité magnétique χM du matériau n’est plus une constante, mais une fonction de la grandeur du champ magnétique. Par conséquent, la quantité µR = 1 + χM n’est pas une constante non plus. La présence d’aimantation sans champ magnétique indique, sur le plan microscopique, la tendance des moments microscopiques à s’orienter dans la même direction. Cette tendance ne correspond pas du tout à ce qu’on peut observer dans le monde macroscopique. Prenons la Fig. 142: nous voyons d’abord l’orientation réciproque préférentielle de deux aiguilles magnétiques, comme par exemple deux aimants, pour deux configurations différentes. Ensuite, nous voyons l’orientation d’ensemble d’un réseau d’aiguilles, qui pourrait modéliser les moments microscopiques des atomes d’un cristal. s n Fig. 142: Des aiguilles magnétiques organisées en réseau n’ont pas tendance à s’orienter toutes dans la même direction: à gauche, nous voyons les orientations réciproques préférentielles de deux couples d’aiguilles, et à droite les orientations dans un réseau à symétrie carrée, qui ne donne pas d’aimantation. Il est évident que les forces purement magnétiques n’ont pas tendance à orienter les aiguilles dans la même direction: la justification de l’orientation qui cause l’aimantation ferromagnétique doit être cherchée ailleurs. Cette justification ne peut pas être fournie par la physique classique et est liée à une propriété quantique fondamentale appelée le principe de Pauli, d’après son découvreur Wolfgang Pauli, ancien professeur de l’Ecole Polytechnique Fédérale de Zürich. Sans entrer dans les détails du principe de Pauli, nous mentionnerons qu’il s’agit d’une symétrie fondamentale des propriétés physiques par rapport à l’échange de deux électrons quelconques. Prenons donc deux électrons équivalents avec leurs moments magnétiques microscopiques: en les échangeant l’un avec l’autre et vice-versa, on peut constater que la symétrie des moments n’est pas touchée si les moments sont orientés dans la même direction. Les matériaux ferromagnétiques sont justement ceux pour lesquels le principe de Pauli exige ce type d’orientation symétrique des moments atomiques. Giorgio Margaritondo: Ma Physique 337 L.4.1. Hystérèse magnétique Sur le plan macroscopique, le comportement d’un matériau ferromagnétique peut être efficacement décrit de la manière suivante. Supposons que le matériau forme le noyau d’un solénoïde, et prenons les équations 490 et 484; nous avons: B = µoni + M = µoH + M, (496) donc la différence des champs H et B est déterminée par l’aimantation magnétique M. Wolfgang Pauli, physicien autrichien et professeur à l’Ecole Polytechnique Fédérale de Zürich de 1928 à 1958: son célèbre principe fournit la base théorique tant de la chimie que du ferromagnétisme. Il était aussi connu pour ses commentaires, souvent vitrioliques (“Cet article est tellement mauvais qu’il n’est même pas erroné”). Prenons alors la fonction B(H), illustrée par la Fig. 143. On voit d’abord que même quand le champ H est nul, le champ B n’est pas nul, en accord avec l’Eq. 496: si H = 0, on a toujours l’aimantation M causée par l’orientation cohérente des moments magnétiques microscopiques du matériau. La grandeur du champ B pour H = 0 est appelée induction magnétique rémanente, ± Br. Si l’on part du champ rémanent -Br et qu’on commence, à l’aide d’un courant dans le solénoïde, à augmenter la grandeur du champ H dans la direction opposée à celle de l’aimantation, on constate que la grandeur du champ B diminue, devient nulle quand la grandeur de H est Hc, puis commence à augmenter dans la direction de H. B est d’abord une fonction presque linéaire de H, même avec une pente B/H = µoµR beaucoup plus élevée que pour un matériau paramagnétique; mais on arrive finalement à un régime de non-linéarité. Le mécanisme qui cause le changement de B est la combinaison de deux phénomènes, qu’on peut dériver de l’équation 496: d’abord, l’effet direct du courant du solénoïde, qui augmente la composante µ o H du champ B. Deuxièmement, l’effet beaucoup plus important du changement de l’aimantation, c’est-à-dire du changement d’orientation des moments magnétiques microscopiques. Le courant du solénoïde tend en fait à orienter ceux-ci dans la direction de H. Quand l’orientation est complète, on constate que B augmente toujours avec H, mais beaucoup moins rapidement. Cette augmentation lente de B correspond au régime non-linéaire et à la pente des lignes L de la Fig. 143, qui est en fait modérée: on a presque une saturation de l’augmentation de B. Imaginons maintenant que nous commençons à diminuer le courant du solénoïde et donc la grandeur du champ H: nous constatons que la grandeur du champ B diminue Giorgio Margaritondo: Ma Physique 338 également, pourtant sans suivre à l’inverse la courbe qui l’avait amené au point de quasi-saturation. Elle suit plutôt la courbe qui mène à la valeur B r lorsque H = 0. La raison en est que, même sans courant dans le solénoïde, on a toujours une orientation résidue des moments microscopiques, qui donne un champ B sans pourtant produire un champ H. B L A Br -Hc Hc -B r H L Fig. 143: Courbe d’hystérèse, qui illustre le comportement du champ B en fonction du champ H dans un matériau ferromagnétique. Si l’on souhaite annuler le champ B, on doit renverser la direction du courant et par conséquent celle du champ H, forçant ainsi l’annulation de l’orientation des moments microscopiques. Celle-ci a lieu pour la valeur -Hc du champ H, qui correspond en fait à B = 0. La valeur Hc est appelée champ coercitif. Si l’on augmente ultérieurement la grandeur de H dans la direction inverse, la grandeur du champ B commence à augmenter dans la même direction. Cela est causé encore une fois par l’effet important de l’orientation des moments microscopiques, et par celui, beaucoup moins important, de la contribution directe du champ H. On constate une parfaite symétrie des phénomènes dans les deux directions, comme il ressort de la Fig. 143. L’ensemble des phénomènes illustrés par la Fig. 143 s’appelle hystérèse, et la courbe de cette figure est la courbe d’hystérèse du matériau ferromagnétique considéré. Notons que, si la grandeur du champ H n’arrive pas au niveau nécessaire à l’orientation complète des moments microscopiques, le matériau ferromagnétique suit une courbe B-H qui est qualitativement similaire à celle de la Fig. 143, sans pourtant arriver au régime de quasi-saturation. L’existence du champ rémanent ±B r sans courants externes est utilisée dans la fabrication des aimants. L’aimantation d’un aimant, dont la présence est manifestée par le champ rémanent, peut être détruite en chauffant l’aimant au-dessus d’une température limite, dite température de Curie. La raison en est l’équilibre thermodynamique: d’une part, les moments magnétiques atomiques ont tendance à s’orienter tous dans la même direction, donc à créer un état thermodynamique ordonné, et d’autre part les mouvements thermiques qui correspondent à la température de l’aimant ont une l’action desordonnante. L’aimantation réelle correspond à l’équilibre de ces deux facteurs. Giorgio Margaritondo: Ma Physique 339 A baisse température, la tendance à l’ordre domine, et l’aimantation est plus forte; celleci devient moins importante si la température augmente et est éliminée au-dessus de la température de Curie. Celle-ci correspond à un des phénomènes de transition de phase dont nous nous sommes occupés dans le cours de thermodynamique. L’état d’un aimant dont l’aimantation a été détruite par chauffage ne correspond à aucune branche de la courbe d’hystérèse de la Fig. 143: il est représenté par l’origine du plan B-H. Si l’on commence à soumettre l’aimant à l’action d’un champ H, on constate le rétablissement de l’aimantation dans la direction de H. La fonction B-H qui correspond à ce phénomène est illustrée par la courbe A de la Fig. 143. Après avoir atteint l’orientation complète des moments microscopiques, l’aimant re-aimanté suit la courbe d’hystérèse ordinaire de son matériau. Pierre Curie, découvreur de la “température de Curie”, avec sa femme, la célèbre physicienne Marie Sklodowska Curie, dans leur laboratoire à Paris. Les courbes d’hystérèse telles que celle de la Fig. 143 ont des conséquences importantes en ce qui concerne la consommation d’énergie. Imaginons encore une fois des expériences sur un matériau ferromagnétique qui forme le noyau d’un solénoïde. Afin de créer un courant dans celui-ci, on doit lui fournir de l’énergie par un générateur de force électromotrice. Nous avons vu qu’une partie de l’énergie n’est pas dissipée par effet Joule, mais emmagasinée dans le champ magnétique du solénoïde. L’énergie emmagasinée, qui correspond à un changement di du courant, peut être dérivée de l’Eq. 419. Pour chacune des spires: d(énergie) = Lidi . (497) D’autre part, pour un solénoïde avec un noyau ferromagnétique, L = (µ oµ R n)(NS) = µoµRn2lS, donc Lidi. = µoµRn2lSidi. = (lS)(µoµRni)d(ni) = (lS)BdH. Puisque lS est le volume du noyau ferromagnétique du solénoïde, BdH est l’énergie magnétique par unité de volume qui correspond à di. Imaginons maintenant que nous intégrons cette expression: l’intégrale ∫BdH correspond à la superficie entre l’axe horizontal et la courbe B(H) de la Fig. 143. Si l’on considère un cycle complet comme celui de la Fig. 143, l’intégrale correspond à la superficie entourée par la courbe d’hystérèse. Cette intégrale correspond également à l’énergie par unité de volume qu’on doit fournir au solénoïde de l’extérieur, afin de compléter un cycle. Evidemment, la consommation d’énergie du solénoïde augmente si la superficie susmentionnée est grande, et on souhaite donc réduire celle-ci en choisissant des Giorgio Margaritondo: Ma Physique 340 matériaux ferromagnétiques ayant des courbes d’hystérèse à basse superficie. Cela justifie l’utilisation de matériaux tels que le fer doux pour les électroaimants industriels. Cette exigence devient critique pour les dispositifs ferromagnétiques qui fonctionnent de façon alternative, à haute fréquence et donc avec plusieurs cycles par unité de temps. Notez cependant qu’on a une deuxième cause de consommation d’énergie: les courants alternatifs créent par self-induction des courants dans le noyau du solénoïde, qu’on appelle courants de Foucault. Ceux-ci consomment de l’énergie par dissipation, à cause de l’effet Joule. On souhaite donc augmenter la résistance du noyau afin de réduire l’intensité du courant, ce qui justifie la structure à lamelles des électroaimants industriels. L.4.2. Domaines ferromagnétiques La figure 143 suggère que la grandeur de la superficie entourée par la courbe d’hystérèse est de quelque façon liée à la grandeur de l’induction magnétique rémanente B r. Afin de réduire la superficie et la consommation d’énergie, on doit essayer de mieux comprendre le mécanisme d’aimantation qui cause Br. On constate que l’aimantation n’est pas la même dans toutes les régions du matériau. La Fig. 144 illustre la situation au niveau microscopique: en haut, on voit un matériau ferromagnétique avec un champ H produit par des courants externes. Ce matériau comprend plusieurs régions, dans chacune desquelles on a une orientation d’aimantation, qui change d’une région à l’autre. La justification de la présence de ces régions, qu’on appelle domaines magnétiques, est fournie par la partie inférieure de la Fig. 144. Considérons premièrement un matériau ferromagnétique qui ne contient qu’un domaine: il crée un champ magnétique occupant un grand volume de l’espace externe. L’énergie d’un champ magnétique augmente avec le volume occupé par celui-ci: le système a un seul domaine possède donc une énergie élevée. Les systèmes physiques ont tendance à diminuer si possible leur énergie. La Fig. 144 montre une manière de diminuer l’énergie en formant d’abord deux, et ensuite quatre domaines. Le champ externe diminue d’importance et touche une région de volume réduit. Donc, l’énergie magnétique du système diminue avec la formation de domaines. Le système tend donc à évoluer vers la création de ceux-ci. Cette tendence est partiellement contrastée par le fait que la formation de domaines consomme de l’énergie. Celle-ci est essentiellement confinée aux interfaces entre deux domaines, qu’on appelle interfaces de Bloch, et correspond aux interactions des moments magnétiques atomiques des deux côtés de chaque interface. La présence des domaines magnétiques joue un rôle fondamental dans le mécanisme de l’aimantation. Imaginons un matériau ferromagnétique avec ses domaines, et soumettons-le à l’action d’un champ magnétique externe afin d’augmenter son aimantation. On peut atteindre cet objectif par deux mécanismes complémentaires: premièrement, on peut augmenter le volume des domaines dont les directions d’aimantation sont proches de celle du champ externe, et diminuer le volume des autres domaines. Deuxièmement, on peut changer l’orientation d’aimantation des domaines dont l’orientation n’est pas proche de celle du champ. Le deuxième mécanisme est beaucoup moins efficace que le premier, qui d’ordinaire joue le rôle principal. On peut pourtant éliminer ou au moins diminuer d’importance le Giorgio Margaritondo: Ma Physique 341 premier mécanisme, par exemple à l’aide d’une microstructure granulaire artificielle du matériau, en utilisant des particules de dimension plus limitée que le volume typique d’un domaine. On peut ainsi artificiellement contrôler le mécanisme de l’aimantation, afin de l’adapter aux besoins de la technologie. H M Fig. 144: En haut: un matériau ferromagnétique soumis à l’action d’un champ magnétique externe comprend toute une série de domaines, chacun avec sa direction d’aimantation donnée par l’orientation des moments magnétiques microscopiques de ses atomes. En bas, à gauche: un matériau avec un seul domaine crée un champ magnétique qui touche une grande région d’espace, et donc possède une grande énergie; au centre et à droite: avec des domaines, on peut réduire le volume de la région touchée par le champ magnétique, et donc son énergie. Giorgio Margaritondo: Ma Physique 342 Le Coin Yankee: Diamagnétique Paramagnétique Ferromagnétique Aimantation Champ magnétique H Hystérèse Domaines magnétiques Diamagnetic Paramagnetic Ferromagnetic Magnetization H-vector Hysteresis Magnetic domains “The magnitude (of the B-field) may increase or decrease with respect to vacuum. In the first case one has a paramagnetic material. in the second a diamagnetic material”. Le coin des unités et des ordres de grandeur: Moment magnétique Aimantation H Unités SI Weber-mètre (Wm) Autres unités W/m 2 A/m Ordres de grandeur: L’ordre de grandeur typique du moment magnétique microscopique d’un atome, quand il existe, est de 10-29 Wm. Giorgio Margaritondo: Ma Physique 343 LI. Les ondes électromagnétiques Le chapitre précédent a conclu la discussion générale des propriétés du champ électromagnétique, et nous sommes maintenant prêts à passer à l’étude d’un des phénomènes les plus importants de la nature: les ondes électromagnétiques. Nous verrons spécifiquement que les propriétés du champ électromagnétique impliquent l’existence d’ondes électromagnétiques. Mais avant de commencer à parler d’ondes, essayons de répondre à la question suivante: quelles sont les propriétés qui distinguent les ondes des autres phénomènes du monde physique? Les ondes sont un type particulier de phénomène de propagation. On parle de "propagation" si l’on trouve “quelque chose”, qui était à un certain endroit à un moment donné, à un autre endroit plus tard; peut-être un peu modifié, mais toujours reconnaissable. Si l’on analyse les phénomènes de propagation dans la vie quotidienne, on peut réaliser qu'il y en a de deux types: les particules ou corps solides, et les ondes. Une balle de tennis est une particule, une goutte de pluie est composée de particules (molécules d'eau), le vent correspond au déplacement des particules de gaz dans l'air. Le son, au contraire, se propage, mais sans propagation de particules; les vibrations non stationnaires sur une corde de violon se propagent, mais sans déplacer de particules dans la direction de propagation. Autrement dit, les ondes du type “son” ou “vibration” propagent des perturbations sans propager de particules. Peut-on utiliser ces intuitions empiriques afin d’obtenir une définition rigoureuse de ce qu’est une onde? La réponse est négative, parce qu’en physique quantique la différence entre “onde” et “particule” est moins nette qu’en physique classique. Il faut donc chercher des caractéristiques plus spécifiques des ondes. On doit considérer, par exemple, les phénomènes d'interférence et de diffraction. Dans un phénomène d'interférence de la lumière, nous voyons que la composition de deux rayons, c'est-à-dire de deux ondes, provoque parfois l’obscurité (voir par exemple la Fig. 145). Et en ce qui concerne l'interférence du son, deux ondes superposées donnent parfois le silence. Par contre, on a de la peine à imaginer des phénomènes d’interférence pour les particules: “une balle de tennis plus une autre balle de tennis” donne toujours “deux balles de tennis”, et jamais “zéro balles de tennis”! On peut donc proposer la définition suivante des phénomènes ondulatoires: Les ondes sont des phénomènes de propagation, qui peuvent donner lieu à des phénomènes d'interférence et de diffraction. Notez que cette définition implique une différence entre “onde” et “particule” en physique classique, mais non en physique quantique. La distinction entre ondes et particules, qui paraît très évidente pour les balles de tennis, n'est plus si claire pour les particules élémentaires (telles que les électrons): celles-ci se comportent parfois comme des particules et parfois comme des ondes, ayant des effets d’interférence et de diffraction. En principe, même les balles de tennis pourraient engendrer des phénomènes d’interférence ou de diffraction, du type “deux balles de tennis est égal à zéro balles de tennis”. Mais ne commençons pas à remettre en question l’état mental de l’auteur et des physiciens en général: la probabilité de phénomènes ondulatoires pour les balles de Giorgio Margaritondo: Ma Physique 344 tennis est tellement faible qu’ils n’existent pratiquement pas. Le même résultat est valable pour toutes les “particules” macroscopiques, tandis que les phénomènes ondulatoires sont loin d’être négligeables pour les particules élémentaires. écran (b) rayon laser écran (a) Fig. 145: Les ondes, par exemple les ondes de lumière d’un laser, sont caractérisées par des phénomènes tels que la diffraction et l’interférence. Ici nous voyons un phénomène d’interférence: les deux fentes de l’écran (a) donnent deux rayons, dont la superposition sur l’écran (b) cause une figure d’interférence, avec des zones de lumière séparées par des zones d’obscurité. Donc on peut dire que parfois “lumière plus lumière” égale “obscurité”. Cela étant précisé, nous passons de l’idée d’onde en général au traitement spécifique des ondes électromagnétiques. LI.1. Le courant de déplacement Les propriétés des ondes électromagnétiques, à commencer par leur existence même, peuvent être directement dérivées des équations qui illustrent les propriétés du champ électromagnétique. Nous devons pourtant éliminer un problème qui affecte les équations liant le champ électromagnétique et ses causes. Celles-ci sont, dans leurs formes locales et pour l’espace vide, les équations 320, 407, 384 et 388: ρ ∇•E = ε . o ∂B ∇ × E = - ∂t . ∇•B = 0. Giorgio Margaritondo: Ma Physique 345 ∇ × B = µoj . D’autre part, nous avons vu que la loi de conservation des charges électriques implique l’équation de continuité, Eq. 373: ∇•j + ∂ρ ∂t = 0 . Le problème est que cette équation n’est pas compatible avec les précédentes, ce qui crée un grave conflit dans la logique interne de la théorie de l’électromagnétisme. Prenons, en fait, la divergence de l’Eq. 388. Nous avons, d’une part, (∇ • (∇ × B)) = 0, puisque, en utilisant les propriétés formelles du pseudovecteur ∇, on peut dire que le “vecteur” ∇ × B est “perpendiculaire” à ∇, et donc son produit scalaire par celui-ci est nul. L’Eq. 388 comporte donc toujours ∇ • j = 0, ce qui n’est pas en accord avec l’équation de continuité. Sur le plan purement formel, on peut facilement identifier le moyen d’éliminer ce conflit logique. Il s’agit de modifier l’Eq. 388 de la manière suivante: ∂E ∇ × B = µoj + µoεo ∂t . (498) En fait, si l’on prend la divergence de l’Eq. 498, on trouve que: 0 = µo(∇ • j ) + µoεo(∇ • (∂E/∂t)) = µo(∇ • j + ∂(εo∇ • E)/∂t) = [vu la loi de Gauss, Eq. 320] = µo(∇ • j + ∂ρ/∂t), en accord cette fois avec l’équation de continuité. Cette solution formelle, quoique élégante et efficace, ne peut pourtant être acceptée sans base physique: on doit aller dans le laboratoire, mesurer le champ B en présence d’une variation du champ E par rapport au temps, et vérifier que les résultats des mesures sont en accord avec les prévisions de l’Eq. 498. Sans vérification expérimentale positive, l’Eq. 498 n’est qu’une belle formule sans aucune valeur pour la physique. Les résultats des vérifications sont pourtant indubitables: l’Eq. 498 correspond à la réalité révélée par les expériences. On peut interpréter cette équation de la manière suivante: sans variation du champ électrique par rapport au temps, le champ magnétique est créé par les courants, qui sont décrits par la densité de courant j. En cas de variation de E par rapport au temps, le champ magnétique est créé tant par les courants proprement dits que par ce qu’on appelle les “courants de déplacement”, qui sont décrits par le vecteur densité de courant de déplacement εo(∂E/∂t). Notez que le mot “courant de déplacement” est justifié par le fait que la quantité εo(∂E/∂t) a les mêmes dimensions qu’une densité de courant. On ne doit pourtant pas s’imaginer qu’un courant de déplacement correspond à de vraies charges électriques qui se déplacent. Malgré son nom, il ne correspond à aucun déplacement, mais seulement à une variation du champ électrique, qui peut avoir lieu même dans une région sans aucune charge électrique, par exemple dans l’espace vide. Afin de mieux comprendre les courants de déplacement, considérons la Fig. 146: il s’agit du même circuit de la partie gauche de la Fig. 127. Prenons maintenant la ligne L et calculons l’intégrale du champ B sur cette ligne. La loi d’Ampère prévoit que le résultat est proportionnel au courant qui passe par le plan (a) qui coupe le fil conducteur, et qui est donné par l’Eq. 488. Giorgio Margaritondo: Ma Physique 346 Mais la loi d’Ampère prévoit également que l’intégrale est proportionnelle au courant qui passe par la superficie formée par le plan (b) et la paroi du cylindre dont la base est définie par la ligne L. Malheureusement, aucune partie de cette superficie ne coupe un conducteur, donc le courant réel est nul. Comment peut-on réconcilier l’une avec l’autre les prévisions de la loi d’Ampère? R C a b L f Fig. 146: Analyse de la nature physique du courant de déplacement dans un circuit du type RC. La solution est fournie par le courant de déplacement concernant le plan (b). La grandeur de la densité de courant de déplacement sur (b) est εo(∂E/∂t) = (εo/d)(∂V/∂t) = (εo/Cd)(∂q/∂t) = i/S; donc, le courant de déplacement est (i/S)S = i, égal au courant réel dans la partie conductrice du circuit. On constate donc que l’idée de courant de déplacement permet de généraliser la loi d’Ampère, éliminant ainsi les problèmes logiques de cette loi, comme le conflit apparent entre les deux prévisions susmentionnées. Le courant de déplacement remplace le courant réel dans les régions où on ne peut pas avoir de charges qui se déplacent, de manière que la somme des courants réels et de déplacement ne change pas d’un point à l’autre du circuit. LI.2. Les équations de Maxwell La découverte du courant de déplacement marque la fin de notre long chemin vers une théorie complète du champ électromagnétique. Nous possédons enfin toutes les lois qui caractérisent le comportement de celui-ci. Premièrement, la loi de Lorentz (Eq. 377) qui nous permet de définir, c’est-à-dire de mesurer, le champ électromagnétique: f = q(E + v × B) ; deuxièmement, les quatre équations 320, 407, 484 et 498 qui lient le champ et ses causes: ρ ∇•E = ε . o ∂B ∇ × E = - ∂t . ∇•B = 0. Giorgio Margaritondo: Ma Physique 347 ∂E ∇ × B = µoj + µoεo . ∂t Cet ensemble de quatre équations résume une grande quantité de phénomènes découverts de façon empirique durant des années de recherche sur le champ électromagnétique. L’effort qui a abouti à une formulation théorique si synthétique et efficace, et spécifiquement à la notion de courant de déplacement, doit être principalement crédité à James C. Maxwell (chapitre XIII); par conséquent, on appelle équations de Maxwell les quatre équations 320, 407, 484 et 498. Notez que celles-ci sont les formes locales des équations de Maxwell; sous leur forme non-locale, elles s’expriments comme suit (équations 473, 401, 382 et 499): Q ΦΣ = εoε ; R fem = o ∫ E • dl = L dΦ(B) dt . ΦΣ(B) = 0 . ∂E o ∫ B • dl = µoi + Φεo∂t L , (499) où la dernière partie de l’Eq. 499 correspond au flux de la densité de courant de déplacement. Notez que les équations de Maxwell doivent être modifiées si l’on passe du vide à un matériau, en utilisant soit les constantes εR et µR, soit les vecteurs D et H. LI.3. Les équations des ondes électromagnétiques et leur propriétés Les équations de Maxwell impliquent l’existence des ondes électromagnétiques: elles exigent qu’une perturbation du champ magnétique, obtenue en modifiant ses causes à un temps et en un point donnés de l’espace ne puisse pas demeurer localisée. La perturbation se propage dans l’espace à partir du moment où elle est créée, et atteint des points de plus en plus éloignés, à une vitesse qu’on peut prévoir à partir des équations de Maxwell, et qui est égale à la vitesse de la lumière. Cela suggère que la lumière est ellemême une onde électromagnétique, fournissant ainsi une solution à l’ancienne querelle sur sa nature (ondes ou particules?) Ces résultats, qui sont souvent considérés comme les plus importants de la physique classique et qui constituent certainement l’un des achèvements les plus fondamentaux du genre humain, peuvent être dérivés des équations de Maxwell à l’aide de quelques passages mathématiques. Prenons donc les équations de Maxwell dans le cas simple d’une région vide, sans courants ni charges: ∇•E = 0 . (500) Giorgio Margaritondo: Ma Physique 348 ∂B ∇ × E = - ∂t . (501) ∇•B = 0. (502) ∂E ∇ × B = µoεo ∂t . (503) Prenons également la formule suivante de calcul vectoriel: a × (b × c) = (a • c) b - (a • b) c, qui nous donne: ∇ × (∇ × E) = ∇(∇ • E) - ∇2E , et par conséquent, en utilisant l’Eq. 500: ∇ × (∇ × E) = - ∇2E . (504) Si on prend maintenant le rotationnel de l’Eq. 501 en tenant compte de l’Eq. 504, on trouve que: - ∂ (∇ × B ) = - ∇2E , ∂t ce qui, avec l’Eq. 503, donne: -µoεo ∂2E = - ∇2E , ∂ t2 ou: ∂2E ∇2E - µoεo 2 = 0. ∂t (505) Une dérivation similaire donne une équation avec la même structure pour le champ B: ∂2B ∇2B - µoεo 2 = 0. ∂t (506) Les équations du type 505 et 506 sont appelées en mathématiques et en physique équations des ondes, puisqu’elles impliquent la propagation ondulatoire des perturbations de la quantité physique concernée, c’est-à-dire des champs E et B dans le cas présent. Afin de comprendre cette propriété, il est nécessaire d’analyser les caractéristiques des fonctions E(r,t) ou B(r,t) qui sont les solutions des équations du type 505 et 506. Les trois caractéristiques principales sont les suivantes: 1. E(r,t) ou B(r,t) ne sont pas des fonctions génériques de la position r et du temps t, mais des fonctions dont l’argument est une combinaison linéaire des variables “position” et “temps”. Les fonctions de ce type correspondent aux phénomènes de propagation susmentionnés des perturbations des champs E et B. Giorgio Margaritondo: Ma Physique 349 2. La propagation a lieu à la vitesse c = 1/√ µoεo ≈ 3 × 108 m/s. 3. De plus, les équations 500-503 impliquent l’existence d’une série de relations entre les champs E et B: la propagation ondulatoire des perturbations du champ E est donc indissolublement liée à celle des perturbations du B: champ et vice-versa, de manière qu’on ne peut pas parler d’ondes “électriques” ou “magnétiques”, mais seulement d’ondes “électromagnétiques”. Afin de vérifier les propriétés susmentionnées, nous considérerons un cas simplifié: celui d’une onde qui ne dépend que du temps et de la coordonnée z (la troisième composante du vecteur position r), donc qui est indépendante des deux autres coordonnées x et y. L’Eq. 500 donne dans ce cas: ∂Ez ∂z = 0 , (507) ce qui veut dire que la composante du champ électrique dans la direction z est constante. Puisque nous sommes intéressés par les phénomènes de propagation des perturbations du champ, c’est-à-dire par ses changements en fonction de la position et du temps, nous simplifierons notre analyse en négligeant ses composantes constantes. Nous adopterons donc l’hypothèse que ces composantes sont nulles, par exemple: Ez = 0 ; (508) de manière tout à fait similaire, on peut arriver au résultat: Bz = 0 . (509) Passons maintenant à la version simplifiée de l’équation des ondes 505 qui correspond aux hypothèses susmentionnées, et également à l’hypothèse que le champ électrique est dans la direction de l’axe x (donc, Ey = 0). L’Eq. 505 devient: ∂2Ex ∂2Ex µ ε o o ∂ t2 = 0 ; ∂ z2 (510) on peut facilement vérifier que les solutions de cette équation sont des fonctions de l’argument (z ± ct), qui est effectivement une combinaison linéaire des coordonnées “espace” et “temps”: Ex = Ex(z ± ct) ; (511) en fait, si l’on prend la deuxième dérivée de la fonction 511 par rapport au temps, ∂2Ex/∂t2 = Ex”c2, où Ex” est la deuxième dérivée de la fonction Ex”(z ± ct) par rapport à son argument (z ± ct), et puis la deuxième dérivée de la même fonction par rapport à la coordonnée z, Ex”, on trouve que ces deux dérivées sont en accord avec l’Eq. 511 si: c2 = 1/(µoεo) . (512) Quelle est la nature de la constante c? On peut répondre à cette question en réalisant que les fonctions du type de l’Eq. 511 correspondent à des phénomènes de propagation. Afin de comprendre ce point, considérons la Fig. 147, qui illustre un exemple de champ électrique de la forme de l’Eq. 511. Spécifiquement, on considère dans ce cas une fonction du type Ex(z - ct). Giorgio Margaritondo: Ma Physique 350 Imaginons que le temps est fixé à la valeur to: la partie supérieure de la Fig. 147 illustre le champ électrique Ex(z - cto) en fonction de la coordonnée z, qui est pratiquement nul à l’exception d’une région limitée d’espace. Ensuite, attendons jusqu’au temps to + ∆t: qu’est devenu le champ en fonction de z? La fonction Ex(z - ct) ne change pas si son argument z - ct ne change pas. Donc, la valeur qu’on avait à un point z o au temps to peut être retrouvée au temps to + ∆t si l’on se déplace sur l’axe z d’une distance ∆z telle que la nouvelle valeur de l’argument de la fonction Ex est égale à la précédente: zo + ∆z - c(to + ∆t) = (zo - cto) ; (513) conclusion: comme illustré par la Fig. 147, la fonction E x se déplace sur l’axe z sans changer de forme, c’est-à-dire rigidement. Autrement dit, si nous voulons avoir un champ constant, nous devons nous déplacer sur l’axe z à la vitesse qu’on dérive de l’Eq. 513: (∆z - c∆t) = 0, et donc: ∆z ∆t = c . (514) Ex (z,t) = Ex(z-ct) Ex au temps t o: ∆z = c∆t Ex z au temps t o+∆t: z Fig. 147: Propagation d’un champ électrique correspondant à une fonction du type de l’Eq. 511. Notez que, si l’argument de la fonction Ex est z + ct plutôt que z - ct, l’Eq. 513 devient ∆z/∆t = -c. La conclusion générale est que la vitesse de propagation de la perturbation du champ électrique est ±c, les valeurs positive et négative correspondant aux deux directions sur l’axe z: ∆z = ±c . ∆t (515) Giorgio Margaritondo: Ma Physique 351 Cette conclusion éclaircit le sens de l’Eq. 512: la constante c est la vitesse de propagation des ondes électromagnétiques. L’Eq. 512 nous permet de prévoir la grandeur de cette vitesse; on trouve que: c = 1/√ µoεo ≈ 3 × 108 m/s . (516) Ce résultat numérique a une importance vraiment fondamentale: il correspond à la valeur mesurée de la vitesse de la lumière, suggérant ainsi que la lumière est formée par des ondes électromagnétiques. Notez cependant que les ondes électromagnétiques comprennent une quantité énorme de phénomènes à part la lumière: rayons x, ultraviolets et infrarouges, ondes radio, micro-ondes etc. La découverte que la constante c est la vitesse de la lumière nous permet également de réaliser que la relation 512 n’est pas une nouveauté dans notre cours: elle n’est que la relation 381, que nous avions dérivée pour montrer que la relativité justifie l’existence du champ magnétique! L’analyse des propriétés du champ magnétique B qu’on peut dériver de l’Eq. 506 est en tous points similaire à celle du champ E et donne des résultats équivalents: encore une fois, propagation à vitesse c des perturbations. Nous avons donc démontré que les équations de Maxwell impliquent effectivement la propagation des perturbations tant du champ électrique que du champ magnétique. Nous verrons maintenant qu’elles impliquent également toute une série de relations entre le champ électrique et le champ magnétique des ondes électromagnétiques. Heinrich Hertz fut le premier à observer les ondes électromagnétiques prévues par la théorie de Maxwell. Ces expériences lui permirent d’obtenir un deuxième résultat fondamental: la découverte de l’effet photoélectrique. Premièrement, on peut facilement réaliser que le champ B, comme le champ E, n’a pas de composantes variables dans la direction de propagation z. On dit par conséquent que les ondes électromagnétiques sont des ondes transversales, puisque leurs perturbations ne concernent pas la direction de propagation. En principe, le champ B pourrait avoir tant une composante B x (la direction de E) qu’une composante By. La dérivée de Bx par rapport au temps est liée par l’Eq. 501 à la composante x du rotationnel du champ électrique. Mais attention: si nous calculons (∇ × E)x, nous trouvons facilement que cette composante est nulle, puisque les composantes Ey et Ez sont nulles. Conclusion: le champ magnétique d’une onde électromagnétique est dans la direction perpendiculaire au champ électrique, et tous deux sont perpendiculaires à la direction de propagation z. Voyons maintenant quelle est la relation entre les grandeurs des champs d’une onde électromagnétique. Afin de la dériver, on doit considérer l’Eq. 503 et la comparer tant à l’Eq. 511 qu’à l’équation équivalente pour le champ magnétique (By = By(z ± ct)). On obtient d’abord: Giorgio Margaritondo: Ma Physique 352 ∂By ∂Ex = µ ε o o ∂z ∂t , (517) et ensuite: By’ = µo εo Ex’( ± c ) = ± Ex’/c , qui, après avoir intégré et en ne considérant que les valeurs absolues, donne: |Ex| |B y| = c , (518) la relation cherchée entre les grandeurs des champs de l’onde. LI.4. Interprétation physique: la propagation d’énergie Essayons maintenant de résumer les résultats physiques que nous avons dérivés avec nos manipulations mathématiques. Les équations de Maxwell nous ont donné les équations des ondes électromagnétiques, 505 et 506, et les propriétés des solutions de celles-ci démontrent que si l’on cause une perturbation du champ électromagnétique à un point de l’espace et à un temps donnés, celle-ci ne peut pas rester localisée. Au contraire, elle se propage sous forme d’une onde électromagnétique, et arrivera après un certain laps de temps aux autres points de l’espace. Ce laps de temps est donné par la vitesse limitée de la propagation, dont la grandeur correspond à la valeur mesurée de la vitesse de la lumière. La perturbation concerne les composantes tant électrique que magnétique du champ électromagnétique; les deux composantes de la perturbation sont perpendiculaires l’une à l’autre, et elles sont également perpendiculaires à la direction de propagation. Ainsi, la perturbation transmise par une onde électromagnétique ne peut pas se produire dans la direction de propagation. On a, par contre, d’autres exemples d’ondes longitudinales, qui donnent des perturbations dans la direction de leur propagation: par exemple, les ondes du son dans l’atmosphère, et une partie des ondes de compression qu’on peut créer en frappant un objet solide. Enfin, la grandeur du champ électrique de l’onde et celle du champ magnétique sont liées par l’Eq. 518. Celle-ci a des conséquences importantes en ce qui concerne le phénomène de propagation d’énergie qui est lié à l’onde électromagnétique, et que nous allons maintenant discuter. Afin de réaliser qu’une onde électromagnétique donne en fait lieu à une propagation d’énergie, examinons la Fig. 148. On imagine une onde électromagnétique qui se propage à l’intérieur d’un tube dans la direction de l’axe z (il s’agit de ce qu’on appelle un guide d’onde). La section du tube est Lx × Ly. Imaginons que le champ électrique de l’onde, Ex(z - ct), est nul si z - ct > 0, sinon il est égal à Eo. A un certain point zo, on n’a pas de champ si t <zo/c, et on a un champ constant Eo après l’arrivée de l’onde au temps t =zo/c. Considérons maintenant les deux plans ombrés de la Fig. 148: au temps (zo + Lz)/c, le champ électrique est E o dans le volume entier du tube entre les deux plans. Cela implique que le volume a reçu de l’extérieur l’énergie correspondante Giorgio Margaritondo: Ma Physique 353 (εoEo2/2)(LxLyLz). En plus, on doit considérer le champ magnétique de l’onde, qu’on peut dériver de l’Eq. 518: B y = E o/c, qui correspond à l’énergie (B y2/2µ o)(LxL yL z) = (εoEo2/2)(LxLyLz). L’énergie totale est donc (εoEo2)(LxLyLz). On peut conclure que l’onde amène de l’énergie dans le volume, et que par conséquent elle transporte de l’énergie. En plus, on constate que la partie “magnétique” de l’onde amène dans le volume la même quantité d’énergie que la partie “électrique”. Puisque l’onde nécessite un temps Lz/c pour remplir d’énergie le volume entre les plans ombrés, on peut en conclure que l’énergie qui passe par le premier plan par unité de temps, c’est-à-dire la puissance, est de (εoEo2)(LxLyLz)/(Lz/c) = (cεoEo2)(LxLy). L’intensité de l’onde, qui est par définition la puissance transportée par unité de superficie du plan, est donc I = (cεoEo2)(LxLy)/(LxLy) = cεoEo2. Ces résultats peuvent être généralisés à une onde électromagnétique quelconque et à une région quelconque de l’espace vide. On trouve que: • L’onde transporte de l’énergie. • La quantité d’énergie transportée est la même pour la partie “électrique” de l’onde et pour sa partie “magnétique”. y Lz Lx onde zo Ly z x Fig. 148: La propagation d’une onde électromagnétique est également une propagation d’énergie. On calcule ici l’énergie transportée par l’onde, qui arrive dans la région entre les deux plans ombrés. L’intensité, qui est la puissance transportée à travers une superficie unitaire perpendiculaire à la direction de propagation, est en général: I = c(εoE2 + B2/µo)/2 , (519) où E et B sont les grandeurs du champ électrique et du champ magnétique de l’onde. D’autre part, on a toujours une relation du type de l’Eq. 518 entre ces deux grandeurs, et on peut exprimer l’intensité sous une des formes suivantes: Giorgio Margaritondo: Ma Physique 354 c I = cεoE2 = µo B2 . (520) LI.5. La quantité de mouvement des ondes électromagnétiques Nous allons maintenant voire que le transport d’énergie d’une onde électromagnétique s’accompagne aussi du transport de quantité de mouvement. On a des résultats similaires pour d’autres phénomènes; par exemple, pour la propagation d’une masse ponctuelle. Admettons que la masse n’est pas soumise à des forces: l’énergie qui se “propage” avec elle est son énergie cinétique, W = mv 2/2 (où m et v sont la masse et la vitesse), et la grandeur correspondante de la quantité de mouvement est: p = mv = √ 2mW . (521) Pour la masse ponctuelle, on a donc une relation quadratique W ∝ p2 entre énergie et quantité de mouvement. Ce résultat n’est pas valable pour les ondes électromagnétiques, parce que la relation entre énergie et quantité de mouvement change d’un phénomène de propagation à l’autre. Notre démonstration a donc deux objectifs: premièrement, de montrer qu’une onde électromagnétique transporte, en fait, de la quantité de mouvement; deuxièmement, de trouver la relation entre énergie et quantité de mouvement. Ah... bronzer sur la plage! En réalité, il s’agit d’une expérience scientifique: on capture l’énergie transportée par les ondes électromagnétiques émises par le soleil, afin de déclencher des réactions chimiques sur la peau. Imaginons de lors une particule avec charge électrique q. Au temps t = 0, cette particule commence à être soumise à l’action des champs Ex et By d’une onde électromagnétique qui se propage dans la direction de l’axe z. Analysons la situation pendant un laps de temps δt, suffisamment court pour négliger les variations de Ex et By . La force du champ magnétique n’accomplit aucun travail, donc elle ne peut pas changer l’énergie cinétique de la particule. Le changement d’énergie ∆W de la particule est causé uniquement par le travail de la force (qEx) du champ électrique: ∆W = qExvxδt , (522) où v x est la composante de la vitesse de la particule dans la direction du champ électrique. Le changement de quantité de mouvement dans la direction de propagation des ondes, ∆p z , est causé seulement par le champ magnétique, puisque le champ électrique ne donne pas une force dans cette direction. La grandeur de ce changement est égale au produit de la force par δt: Giorgio Margaritondo: Ma Physique 355 ∆pz = qByvxδt ; (523) la comparaison des relations 522 et 523 suggère que le rapport de l’énergie et de la quantité de mouvement transportées par l’onde est égal au rapport des grandeurs des champs de l’onde, Ex/By, et donc d’après l’Eq. 518, à la vitesse de la lumière. En notant po la quantité de mouvement de l’onde et W son énergie, nous avons: po = W/c . (524) Notez la différence fondamentale entre la relation 521, qui est valable pour une particule avec masse, et la relation 524 qui est valable pour une onde électromagnétique, qui n’a pas de masse; il ne s’agit pas seulement de changer les coefficients: les deux relations sont qualitativement différentes, la première étant du type racine carrée et la deuxième linéaire (voir la Fig. 149). quantité de mouvement masse ponctuelle onde énergie Fig. 149: La relation entre énergie et quantité de mouvement est différente même sur le plan qualitatif entre une onde électromagnétique et une masse ponctuelle. Nous pouvons maintenant résumer encore une fois les points fondamentaux de la théorie des ondes électromagnétiques. Nous avons trouvé que les perturbations du champ électromagnétique ne demeurent pas localisées dans l’espace, mais sont forcées de se propager en accord avec les équations des ondes; la vitesse de propagation est égale à la vitesse mesurée de la lumière, suggérant que celle-ci est une onde électromagnétique; les champs (variables) de l’onde sont perpendiculaires à la direction de propagation (donnant des ondes transversales) et le champ électrique est également perpendiculaire au champ magnétique; le rapport des grandeurs des deux champs est égal à la vitesse de la lumière; une onde électromagnétique transporte de l’énergie avec intensité cεoEx2 et aussi de la quantité de mouvement dans la direction de propagation, dont la grandeur est égale à l’énergie divisée par c. LI.5.1. La pression du rayonnement Imaginons un récipient vide, sauf pour la présence de lumière, ou plus généralement d’ondes électromagnétiques. Le fait que celles-ci possèdent une quantité de mouvement implique une conséquence intéressante: les ondes créent une pression sur les parois de la bouteille. On peut tirer cette conclusion sur la base d’une analyse très similaire à celle utilisée en thermodynamique dans le cas d’un récipient de gaz parfait (chapitre XII); prenons la Giorgio Margaritondo: Ma Physique 356 Fig. 61, mais imaginons qu’au lieu des particules de gaz, la bouteille ne contient que des ondes électromagnétiques. Les ondes qui arrivent sur la superficie S pendant le temps t sont la moitié de celles qui se trouvent dans un volume dont la base est S et la hauteur cz t = ct/ √ 3 (c est évidemment la vitesse des ondes et cz est sa composante moyenne dans la direction perpendiculaire à S). Notons U l’énergie totale des ondes dans la bouteille, V le volume de celle-ci et donc U/V la densité d’énergie. L’énergie des ondes arrivant sur S pendant le temps t est (U/V)(Sct/2√ 3 ). Supposons que la paroi se comporte comme un miroir parfait: les ondes qui arrivent sur S rebondissent, changeant ainsi leur quantité de mouvement. Cela implique une force sur la superficie S et donc une pression. La quantité de mouvement correspondant à l’énergie (U / V )(S ct/ 2 √ 3) est (U/V)(Sct/2√ 3)/c = (U/V)(St/2 √ 3); sa composante moyenne dans la direction perpendiculaire à S est ((U/V)(St/2√ 3))(cz/c) = ((U/V)(St/2√ 3))(1/√ 3) = (U/V)(St/6). Le changement de quantité de mouvement pendant le temps t est le double de cette quantité, et donc égal à (U/V)(St/3). La force qui correspond à ce changement de quantité de mouvement est obtenue en divisant par t, et la pression en divisant par S, ce qui donne: 1 p = 3 (U/V ) . Cette intéressante équation révèle donc la relation entre la pression du rayonnement et sa densité d’énergie. Appendice: le corps noir et la physique quantique Le résultat de la section précédente nous permet de clarifier la liaison entre la loi d’émission du corps noir de Planck (Eq. 296) et la physique quantique dont elle a marqué le début. On peut en fait découvrir que le rayonnement dans une bouteille se comporte comme un “gaz” de “particules de lumière” ou “photons” d’énergie (h/2π)ω . L’analyse s’inspire de celle qui, en 1905, a amené Einstein à l’hypothèse de l’existence des photons. Nous utiliserons à cette fin les notions de longueur d’onde λ et de fréquence (pulsation) ω, discutées dans le chapitre suivant, ainsi que leur relation (Eq. 529): ω = 2πc λ , qui implique: dω = -2πc dλ ; λ2 Imaginons que nous ouvrons un petit trou dans la bouteille: celui-ci se comporte comme un corps noir dont la loi d’émission est donnée par l’Eq. 296: Giorgio Margaritondo: Ma Physique Eλ(T) = 357 Eo 1 . 5 λ exp(hc/λkT) - 1 Il est facile de réaliser que, dans une situation stationnaire, l’émission par le trou doit correspondre à la distribution en fonction de λ de l’énergie du rayonnement dans la bouteille. L’énergie dans l’intervalle dλ est donc proportionnelle à Eλ(T)dλ. L’énergie dans l’intervalle correspondant de fréquences dω est alors proportionnelle à Eω(T)dω, où Eω(T) est la fonction de distribution en fréquence. Puisqu’on doit avoir | Eλ(T)dλ.| = | Eω(T)dω | , les relations ci-dessus entre λ et ω et entre dλ et dω nous permettent de conclure que: ω3 Eω(T) ∝ exp(hω/2πkT) - 1 . D’autre part, les effets quantiques à la base de cette loi ne deviennent importants que si la fréquence - et donc l’énergie des photons - est assez élevée. On peut donc considérer le cas limite (h/2π)ω » kT, qui donne approximativement: Eω(T) ∝ ω3exp(-hω/2πkT) . Il est facile de vérifier que cette fonction possède un maximum à la fréquence: ωM = 3 (2π/h) kT . Imaginons maintenant que la bouteille est munie d’un piston qui permet d’en changer le volume. Si le volume change de V à V + dV, quel est le changement d’entropie? En prenant une transformation réversible équivalente on obtient: dS = δQ dU + p dV dV U dV = p = T = T T 3T V . Ce dernier résultat nous amène à une étonnante découverte: le changement d’entropie des ondes dans la bouteille est parfaitement équivalent à celui d’un gaz parfait, donné par l’Eq. 240: dV dS = Nk V , à condition d’imaginer le rayonnement comme un “gaz” de N particules, avec N = (U/3kT). D’autre part, 3kT = (h/2π)ωM, et donc: U N = (h/2π)ω M , résultat qu’on peut interpréter de la manière suivante: l’énergie totale U du rayonnement dans la bouteille est équivalente à la somme des énergies de N particules, dont l’énergie moyenne est (h/2π)ωM. Cela nous amène à l’hypothèse que l’énergie de chaque particule ou photon est donnée par (h/2π)ω. Giorgio Margaritondo: Ma Physique 358 Le Coin Yankee: Courant de déplacement Onde transversale Intensité Displacement current Transverse wave Intensity “We found that the perturbations of the electromagnetic field cannot remain localized in space but are forced to propagate in agreement with the wave equation. The propagation velocity is equal to the measured speed of light, suggesting that light is made up of electromagnetic waves. The (variable) wave’s field is perpendicular to the direction of propagation (giving transverse waves), and the electric field is perpendicular to the magnetic field. The ratio of the magnitudes of the two fields is equal to the speed of light. An electromagnetic wave carries both energy, with intensity ceoEx2, and momentum in the direction of propagation, whose magnitude is equal to the energy divided by c”. Le coin des unités et des ordres de grandeur: Courant de déplacement Intensité Unités SI Ampères (A) Autres unités Watt/m2 Ordres de grandeur: Une source typique de lumière à la maison donne une intensité de l’ordre de 10 -2 -50 watt/m 2 , qui correspond selon l’Eq. 520 à un champ électrique de l’ordre de 2-100 Vm. Giorgio Margaritondo: Ma Physique 359 LII. Ondes sinusoïdales: fréquence, longueur d’onde, spectre électromagnétique La discussion des équations d’onde a montré que leurs solutions sont des fonctions de combinaisons linéaires des coordonnées et du temps. Jusqu’à maintenant on n’a pourtant pas spécifié le type de fonction. Nous nous occuperons maintenant d’une classe de solutions particulièrement importante: les fonctions du type sinus et cosinus. La raison de leur importance est encore une fois le théorème de Fourier. Si l’on souhaite analyser le comportement d’un système par rapport à une onde électromagnétique quelconque, on peut utiliser le théorème de Fourier afin de décomposer l’onde “quelconque” en fonctions du type sinusoïdal, et analyser la réponse du système à l’arrivée d’ondes de ce type. Les phénomènes physiques qui correspondent au théorème de Fourier pour les ondes électromagnétiques sont bien connus. Pour la lumière, par exemple, chaque composante de Fourier correspond à une couleur, et leur composition correspond à la combinaison des couleurs, par exemple pour obtenir la lumière blanche. Prenons le cas d’une onde qui se propage sur l’axe z, correspondant à l’équation des ondes 510, dont la solution générale est une fonction de (z ± ct). Si l’on essaie d’écrire une fonction sinusoïdale de cette variable, on doit utiliser la forme suivante: Ex = Exosin(k(z ± ct)) , (525) où la constante k transforme en angle (l’argument d’un sinus) la quantité (z ± ct), qui est une longueur. La Fig. 150 nous aide à analyser les propriétés de la fonction de l’Eq. 525. Afin de simplifier l’analyse, il faut éviter de mélanger la dépendance du temps et la dépendance de la position. Supposons donc que le temps est fixé, c’est-à-dire que le champ de l’onde est mesuré en fonction de la position z, à un temps donné. La quantité ct dans l’argument du sinus est un déphasage constant, et la fonction de z est du type illustré par la partie supérieure de la Fig. 150. On constate en particulier que la fonction est périodique: elle a la même valeur pour n’importe quel ensemble de deux points dont la distance λ correspond à un changement de 2π de l’argument de la fonction sinus. La distance λ, qui est la période dans l'espace de la fonction, s’appelle longueur d’onde. Puisque, par définition, k((z +λ) ± ct) = k(z ± ct) + 2π, on a: λ = 2π k ; (526) le paramètre k, qui est essentiellement le réciproque de la longueur d’onde, est appelé nombre d’onde. Passons maintenant à la partie inférieure de la Fig. 150: nous avons fixé la position, c’est-à-dire que nous nous sommes placés à un certain endroit et avons mesuré le champ de l’onde en fonction du temps. On a encore une fois une fonction périodique. La période T est définie par la relation k(z ± c(t + T)) = k(z ± ct) + 2π, d’où l’on a T = 2π/kc et, en tenant compte de l’Eq. 526: T = λ c . (527) Giorgio Margaritondo: Ma Physique 360 Au lieu de la période T, on utilise souvent la fréquence ν = 1/T, ou la pulsation ω = 2πν = 2π/T. Les relations entre ces paramètres et la longueur d’onde sont facilement dérivées de l’Eq. 527: c ν = λ ; ω = (528) 2πc λ . (529) En utilisant la pulsation, l’onde sinusoïdale de l’Eq. 525 peut s’écrire: Ex = Exosin(kz ± ωt) . (530) Ex t = constante z λ Ex z = constante t T Fig. 150: Analyse des propriétés de la fonction d’onde de l’Eq. 525, dans les deux cas particuliers de temps constant et de position constante. LII.1. Le spectre des ondes électromagnétiques Nous discuterons maintenant la base physique des paramètres que nous avons introduits de manière purement mathématique: longueur d’onde et pulsation ou fréquence. La grandeur de ces paramètres exprime la différence entre les divers types d’ondes électromagnétiques. Celles-ci comprennent, en fait, une grande série de types de rayonnement tels que la lumière visible, les ondes radio, et les rayons ultraviolets. La Fig. 151 illustre le cadre général du spectre des ondes électromagnétiques, en montrant la correspondance entre longueur d’onde et type de rayonnement. Notez en particulier la région spectrale de la lumière visible, qui part de 4000 Å (violet) et arrive jusqu’à 7000 Å (rouge), avec son centre à 5000 Å environ (vert). Giorgio Margaritondo: Ma Physique 361 LII.2. Ondes planes et ondes sphériques Le théorème de Fourier et l’utilisation d’ondes sinusoïdales nous permet de simplifier l’analyse des ondes électromagnétiques, ce qui est très important parce que celles-ci peuvent être des fonctions très compliquées. On a néanmoins deux types d’ondes dont la dépendance des coordonnées est assez simple, et qui correspondent à des phénomènes importants. x "durs" gamma 10 -2 1 ultraviolet infrarouge ondes radio x "mous" visible micro-ondes 102 10 4 10 6 10 8 1010 longueur d'onde en angstroms Fig. 151: Spectre des ondes électromagnétiques, avec ses divers types de rayonnement. Le premier type est les ondes planes, qui correspondent (approximativement) à l’émission d’une source très éloignée du point d’observation, par exemple le soleil par rapport à la terre. Le deuxième est les ondes sphériques, qui correspondent à l’émission d’une source ponctuelle et isotrope, telle que (encore une fois approximativement) une lampe électrique observée d’une assez grande distance. Les ondes décrites par l’Eq. 511: Ex = Ex(z ± ct) fournissent un exemple d’ondes planes. Examinons-le à l’aide encore une fois de la Fig. 147. On a vu que la situation qu’on trouvait à z = zo au temps to se retrouve déplacée de ∆z = c∆t au temps to + ∆t. Autrement dit, l’onde qu’on avait au temps to sur le plan z = zo se retrouve sur le plan z = z o + c∆t au temps t o . On peut donc réaliser que la propagation de l’onde correspond à la propagation de plans perpendiculaires à la direction de propagation sur lesquels l’onde demeure constante, dits surfaces d’onde; on parle donc d’onde plane. Considérons maintenant encore une fois l’onde de la Fig. 148, qui est aussi une onde plane. Nous avons vu que son intensité est nulle avant l’arrivée de l’onde, et ensuite égale à I = cε o E o 2 , donc indépendante de la position et du temps. On ne peut pas généraliser ce dernier résultat, qui n’est valable que si l’émission de l’onde a lieu à puissance constante par rapport au temps. On peut pourtant généraliser une partie du résultat, en disant que pour une onde plane, l’intensité demeure constante pour tout plan qui se déplace avec l’onde. Par exemple, l’intensité des ondes du soleil ne change presque pas avec la hauteur sur la superficie de la terre. Giorgio Margaritondo: Ma Physique 362 Passons maintenant aux ondes sphériques, en considérant la Fig. 152. On voit une source ponctuelle d’ondes électromagnétiques. Les superficies sphériques centrées sur la source jouent un rôle similaire à celui des plans des ondes planes; en particulier, les surfaces d’onde sont des superficies de ce type. Fig. 152: Onde sphérique émise par une source ponctuelle de rayonnement électromagnétique. R(to) R(to+∆t) Supposons, par exemple, que la source n’émet pas d’onde avant le temps t = 0, et que son émission est à puissance constante pour t > 0. La région dans laquelle on a le champ de l’onde est contenue dans une superficie sphérique, dont le rayon augmente avec le temps. Au temps to, le rayon est R(to) = cto, tandis qu’au temps to + ∆t il devient R(to + ∆t ) = c(to + ∆t ). L’énergie doit être conservée, donc celle qui passe par unité de temps par la première superficie doit être égale à celle qui passe par unité de temps par la deuxième superficie. L’intensité, c’est à dire la puissance par unité de superficie, est donc moins élevée à la deuxième superficie. Si I(to) est l’intensité à la première superficie, la puissance qui passe par celle-ci est I(to)(4π(R(to))2). La puissance par la deuxième superficie est I(to + ∆t )(4π(R(to + ∆t ))2). La conservation de la puissance implique: I(to + ∆t )/I(to) = (R(to))2/(R(to + ∆t ))2 = (to + ∆t )2/to + ∆t 2 , (531) et donc une diminution du type carré réciproque tant de la distance que du temps. Sur le plan de la sémantique, il faut préciser qu’une onde plane sinusoïdale, donc de longueur d’onde et fréquence spécifiées, est fréquemment appelée onde monochromatique. Le mot signifie “d’une seule couleur”, et donc il s’appliquerait seulement à la lumière visible, pour laquelle la couleur correspond à la longueur d’onde. On utilise pourtant l’expression “onde monochromatique” dans un sens plus général pour tous les domaines spectraux des ondes électromagnétiques, pour signifier une onde, par exemple, du type de l’Eq. 530. Giorgio Margaritondo: Ma Physique 363 Le Coin Yankee: Longueur d’onde Onde plane Surface d’onde Onde sphérique Onde monochromatique Wavelength Plane wave Wave surface Spherical wave Monochromatic wave “The physical phenomena that correspond to the Fourier theorem for the electromagnetic waves are well known. For the light, for example, each Fourier component correspond to a color, and their combination to the combination of colors, for example to obtain white light.” Le coin des unités et des ordres de grandeur: Longueur d’onde Unités SI Mètres (m) Autres unités Angstroms (Å) = 1 0 -10 m Nanomètres (nm) = 1 0 -9 m Microns (mm) = 1 0 -6 m Giorgio Margaritondo: Ma Physique 364 LIII. Interférence et diffraction L’interférence et la diffraction sont deux des phénomènes les plus caractéristiques des ondes. Leur origine est essentiellement la même: quand vous prenez deux ondes, par exemple deux ondes électromagnétiques, et les combinez, l’onde totale est leur somme, qui est une combinaison linéaire. Puisque la quantité physique qui correspond à chaque onde, par exemple les champs B et E, possède une direction qui peut changer d’une onde à l’autre, la combinaison linéaire peut avoir une grandeur moins élevée que chacune des deux ondes: “lumière plus lumière égale obscurité”. La base de ces phénomènes est donc le principe de combinaison linéaire des ondes ou principe de superposition. A son tour, celui-ci est une conséquence des propriétés mathématiques des équations des ondes. Prenons, par exemple, l’Eq. 510: ∂2Ex ∂2Ex µ ε o o ∂ t2 = 0 , ∂ z2 dont les solutions sont des fonctions du type défini par l’Eq. 511: Ex = Ex(z ± ct) ; on peut facilement constater que si deux fonctions E xA (z ± ct) et E xB (z ± ct) sont des solutions de l’Eq. 510, alors tant ExA ± ExB que toutes les combinaisons linéaires du type ξE xA + ζE xB (où ξ et ζ sont des constantes) sont également des solutions de la même équation. Notez que cette propriété mathématique correspond à une série de phénomènes importants, par exemple la combinaison des couleurs et la superposition des ondes radio. LIII.1. Le “principe” de Huyghens et Fresnel Avant de commencer à analyser des phénomènes spécifiques de diffraction et d’interférence, nous introduirons un moyen pratique et très efficace pour traiter tant ceux-ci qu’une grande partie des effets de propagation des ondes. Imaginons une région d’espace où des ondes électromagnétiques se propagent. En principe, le comportement des ondes peut être prévu en dérivant la solution des équations des ondes qui est en accord avec les conditions spécifiques de la région; par exemple, avec la condition de champ électrique nul à l’intérieur de chacun de ses conducteurs. Cette approche est souvent difficile ou impossible à réaliser à cause des difficultés mathématiques. On peut pourtant prévoir le comportement de l’onde à l’aide du “principe” de Huyghens et Fresnel, qui n’est pas du tout un principe mais une conséquence de l’équation des ondes (il est appelé “principe” pour des raisons historiques). Le “principe” permet, étant donné la surface d’onde à un certain temps t, de prévoir son évolution postérieure. Considérons la Fig. 153: le “principe” nous dit que chaque point de la surface d’onde au temps t devient pratiquement une source ponctuelle d’ondes sphériques secondaires. Giorgio Margaritondo: Ma Physique 365 La combinaison de ces petites ondes d’Huyghens et Fresnel ne donne rien dans la direction opposée à celle de propagation de l’onde. Dans celle-ci, elle donne l’onde propagée. t t+∆t Fig. 153: Illustration du “principe” de Huyghens et Fresnel, appliqué à la propagation d’une surface d’onde du temps t au temps t + ∆t. Christiaan Huyghens et Augustin Jean Fresnel, les auteurs du célèbre “principe” qui nous permet de prévoir facilement le comportement des ondes. Dans le cas de la Fig. 153, par exemple, on voit que la surface d’onde propagée est tangente aux petites ondes sphériques d’Huyghens et Fresnel. Cette approche fournit une méthode simple et efficace pour reconstituer la propagation de la surface d’onde. LIII.2. Interférence de deux fentes Nous appliquerons maintenant le “principe” d’Huyghens et Fresnel à une série de phénomènes d’interférence et de diffraction. Les figures 145 et 154 illustrent un des phénomènes d’interférence les plus simples: l’effet Young. Une onde monochromatique de longueur d’onde λ, émise par exemple par un laser, arrive sur le premier écran (a). Chacune des deux fentes devient une source d’ondes sphériques secondaires; au cas limite de fentes infiniment étroites, on n’a que deux sources ponctuelles pour chaque plan du type de la Fig. 154. L’onde totale sur l’écran (b) est la somme des ondes sphériques. Au centre (θ = 0) cela correspond simplement à la somme de deux fonctions sinusoïdales égales, du type: Giorgio Margaritondo: Ma Physique 366 E ∝ sin(ωt) + sin(ωt) = 2sin(ωt), (532) qui peut être dérivée par exemple de l’Eq. 530, en supposant que les ondes sphériques deviennent localement presque planes à une grande distance (L) des fentes, et en prenant l’origine de l’axe z à l’écran (b). Par ailleurs, si θ ≠ 0, on doit considérer la différence de phase entre les petites ondes. Celle-ci est causée par la différence de chemin δ entre les rayons provenant des deux fentes qui arrivent sur le même point de l’écran (b). La partie inférieure de la Fig. 154 montre que δ ≈ d sinθ ≈ d θ, où les approximations sont valables pour des faibles valeurs de l’angle θ et pour L» d, de manière que l’angle θ est presque le même pour les deux rayons. x écran (a) θ rayon laser (λ) d L écran (b) d θ δ Fig. 154: Géométrie du phénomène d’interférence à deux fentes de la Fig. 145, dit effet Young. Evaluons alors la différence de phase causée par δ. Deux ondes qui sortent en même temps des deux fentes n’ont pas de différence de phase; mais deux ondes qui arrivent en même temps sur le même point de l’écran (b) doivent être sorties des deux fentes à des temps différents, la différence correspondant au temps nécessaire pour parcourir δ, soit ∆t = δ/c. Par conséquent, les fonctions sinusoïdales des ondes sont du type sin(ωt) et sin(ω(t + ∆t)), avec une différence de phase ω∆t = ωδ/c = [vu l’Eq. 529] = 2πδ/λ. La somme des ondes qui correspond à la différence de chemin δ est donc: E ∝ sin(ωt) + sin(ωt + 2πδ/λ) . (533) La Fig. 155 illustre trois cas possibles de cette somme, correspondant aux trois valeurs 0, π et π/2 de la différence de phase 2πδ/λ. Le premier cas donne simplement la somme des deux ondes: on parle alors d’interférence constructive. Le deuxième cas donne une onde nulle, et correspond à l’interférence destructive. Le troisième est un cas intermédiaire. Giorgio Margaritondo: Ma Physique 367 On a donc interférence constructive si 2πδ/λ = 0, ce qui comporte δ = 0. L’interférence devient destructive si 2πδ/ λ = π, et δ = λ /2. On peut généraliser ces conclusions en réalisant que l’interférence est constructive chaque fois que 2πδ/λ = n(2π) et δ = nλ, où n est un nombre entier quelconque, positif, négatif ou nul. D’autre part, l’interférence est destructive chaque fois que 2πδ/λ = nπ (avec n impair), et δ = nλ/2 (où n ≠ 0). On en conclut que l’interférence constructive se produit si la différence de chemin des rayons des deux fentes est un nombre entier de longueurs d’onde, et destructive si elle est un nombre entier de demi-longueurs d’onde. sin(ω t) sin(ωt) t sin(ωt) sin(ωt) t sin(ωt+π) t sin(ωt) + sin(ωt) sin(ω t+π/2) t sin(ωt) + sin(ωt+π) t t t sin(ω t) + sin(ω t+π /2) t t Fig. 155: Interférence de deux ondes sinusoïdales, du type constructif (à gauche), destructif (au centre) et intermédiaire (à droite). Puisque δ ≈ d θ, en changeant l’angle θ on passe de la situation constructive à celle destructive, puis à nouveau constructive, etc., comme illustré par le figures 145 et 156. Les angles du type θ = nλ/d donnent une interférence constructive, et ceux du type θ = nλ/2d une interférence destructive. La figure 156 illustre l’intensité sur le deuxième écran en fonction de l’angle θ. Puisque l’intensité est proportionnelle au carré tant du champ magnétique que du champ électrique de l’onde totale, la fonction qu’on voit dans la Fig. 156 devrait être du type: Intensité ∝ E2 ∝ (sin(ωt) + sin(ω + 2πδ/λ))2 = (sin(ωt) + sin(ω + 2πθd/λ))2 . (534) Cette équation donnerait une série de maxima d’intensité égale; on note pourtant dans la Fig. 156 que l’intensité des maxima n’est pas la même, mais diminue si la grandeur de l’angle augmente. Cela est un effet de diffraction, lié au fait que les fentes ne sont pas vraiment des sources ponctuelles; il s’agit du même type de phénomènes que nous discuterons plus loin. Giorgio Margaritondo: Ma Physique 368 LIII.3. La diffraction causée par une fente: la cohérence L’analyse de l’interférence causée par deux fentes nous fournit également la base pour comprendre la diffraction qui se produit quand une onde plane monochromatique arrive sur un écran, où se trouve une fente de petite largeur. Le phénomène est illustré par la Fig. 157: on admet que la distance L entre la fente et l’écran (b) sur lequel on observe la diffraction est beaucoup plus grande tant par rapport à la largeur de la fente qu’à la longueur d’onde: ce sont les conditions pour la diffraction du type Fraunhofer. intensité -2λ/d -3λ/2d −λ/d −λ/2d λ/2d 0 λ/d 3λ/2d θ 2λ/d Fig. 156: Intensité des ondes combinées sur l’écran (b) des figures 145 et 154, en fonction de l’angle θ. x écran (a) θ rayon laser (λ) L 2d écran (b) d d θ δ 2d<< L λ << L Fig. 157: Géométrie du phénomène de diffraction causé par une fente dans l’écran (a), concernant une onde électromagnétique monochromatique de longueur d’onde λ. Giorgio Margaritondo: Ma Physique 369 Examinons ce phénomène à l’aide du “principe” d’Huyghens et Fresnel: à l’arrivée de l’onde primaire sur la fente, chaque point de celle-ci devient une source ponctuelle de petites ondes secondaires. Si nous partageons maintenant la fente en deux, la largeur totale est 2d: chaque source ponctuelle de la partie inférieure correspond à une source ponctuelle de la partie supérieure, à la distance d. La partie inférieure de la Fig. 157 montre l’interférence des ondes émises par une de ces paires de sources ponctuelles. Il est facile de réaliser que les conditions d’interférence de chaque paire de sources ponctuelles sont équivalentes à celles des deux fentes de l’effet Young, figures 145, 155 et 156. Les conditions d’interférence ne changent pratiquement pas d’une paire à l’autre. Nous pouvons par conséquent appliquer les résultats trouvés pour l’interférence du type Young à la diffraction de la fente de largeur 2d: on a les conditions de diffraction constructive et destructive spécifiées par l’Eq. 534. La diffraction induite par une fente nous permet de comprendre les différences d’intensité entre les maxima de la Fig. 156. Si les deux fentes sont infiniment étroites, on n’a pas de différence. Sinon, on doit tenir compte de la diffraction par chacune des fentes, dont les effets sont combinés à ceux de l’interférence entre les deux fentes. Dans le cas de la Fig. 156, on montre des maxima d’interférence qui se trouvent tous dans l’intervalle d’angle occupé par le maximum central de diffraction: ils sont donc visibles, mais leur intensité diminue si l’angle θ augmente. Il est très intéressant d’analyser l’influence de la largeur 2d de la fente sur le phénomène de diffraction. La distance angulaire entre le maximum central d’intensité (θ = 0) et les deux directions d’interférence destructive les plus proches du centre est ∆θ = λ/2d. Si la fente est très large, spécifiquement si d >> λ, alors ∆θ devient très petit et on n’a pratiquement plus de séquence de maxima et minima d’intensité: on n’arrive plus à les distinguer l’un de l’autre, et on n’a pratiquement que l’illumination sans diffraction de l’écran (b) par la fente. Si par contre la fente est très étroite, c’est-à-dire si d << λ, alors la distance angulaire ∆θ devient très grande: tout l’écran (b) est occupé par le maximum central et on n’observe pas de minima. Cette situation correspond à la limite à une fente ponctuelle qui émet une onde sphérique de Huyghens et Fresnel; celle-ci illumine l’écran (b) de manière pratiquement uniforme. On peut donc constater que les phénomènes de diffraction sont facilement observables si la dimension de l’objet qui les provoque, la largeur de la fente dans notre cas, n’est ni trop grande ni trop petite par rapport à la longueur d’onde. L’idée de “grand” ou “petit” change donc beaucoup d’un domaine de longueur d’onde à l’autre. Pour la lumière visible, les longueurs d’onde sont telles qu’on a de la diffraction par des objets dont la dimension est au plus une fraction de millimètre. Les rayons x exigent par contre des dimensions de l’ordre des distances entre les atomes dans les cristaux, et nous verrons que leur diffraction est en fait utilisée pour analyser la structure de ceuxci. Enfin, pour les ondes radio, la diffraction peut être causée par des objets de grandes dimensions, tels que les bâtiments et les arbres, ce qui contribue à leur caractéristique d’arriver presque partout. Analysons maintenant les conditions de diffraction en considérant le rôle de la longueur d’onde. Nous avons vu que pour une onde parfaitement monochromatique, c’est-à- Giorgio Margaritondo: Ma Physique 370 dire avec une seule longueur d’onde λ, la distance angulaire entre le premier maximum d’intensité et les premiers minima est de ∆θ = λ/2d. Admettons par contre que l’onde n’est pas parfaitement monochromatique, mais un mélange qui contient plusieurs longueurs d’onde. Afin de simplifier l’analyse, on peut considérer par exemple le mélange de deux longueurs d’onde λ et λ + ∆λ. Le centre de l’écran (b) correspond à un maximum d’intensité tant pour la première onde que pour la deuxième. Le premier minimum d’intensité est à la distance angulaire λ/2d du centre pour la première onde, et à (λ + ∆λ)/2d pour la deuxième. Imaginons que ∆λ augmente à partir de zéro; si ∆λ = 0, les minima de la première onde et ceux de la deuxième coïncident. Mais si ∆λ ≠ 0, les minima de la deuxième onde sont déplacés par rapport à ceux de la première. Par conséquent, la distribution d’intensité sur l’écran (b) ne révèle plus le phénomène de diffraction aussi nettement que pour une seule longueur d’onde. Si ∆λ arrive à la valeur λ, les minima d’intensité de la deuxième onde coïncident avec les maxima d’intensité de la première, et les effets de la diffraction d’une des ondes tendent à annuler ceux de la diffraction de l’autre. On peut généraliser cette conclusion en disant que, même avec un mélange de longueurs d’onde on peut voir des effets de diffraction, si la bande de longueurs d’onde du mélange n’est pas trop large. Si l’on prend une bande centrée à la valeur λ et de largeur ∆λ, la condition pour observer une diffraction est que ∆λ << λ. Considérons enfin le cas d’une onde dont λ change d’un point à l’autre de la surface d’onde. Peut-on observer la diffraction induite par une fente? Admettons par exemple que la longueur d’onde est λ pour la partie inférieure de la fente de la Fig. 157, et λ + ∆λ pour la partie supérieure. On peut analyser la diffraction en imaginant de partager la fente en deux. Les premiers minima d’intensité de la partie inférieure sont à la distance angulaire λ/d du centre, et ceux de la partie supérieure à (λ + ∆λ)/d. Les minima de celle-ci coïncident avec les maxima de la partie inférieure si ∆λ arrive à la valeur λ, éliminant ainsi les effets de diffraction. On peut généraliser ce résultat en disant que, pour observer les effets de la diffraction d’un objet de dimension d, la variation relative ∆λ/λ de la longueur d’onde doit être << 1 sur une distance de l’ordre de d. On dit dans ce cas que l’onde est cohérente sur la distance d. Notez que la cohérence concernant la longueur d’onde implique également cohérence pour la fréquence. Prenons en fait l’Eq. 528: c ν = λ ; une petite variation ∆λ de la longueur d’onde donne une variation ∆ν = c∆λ/λ2 pour la fréquence; donc, les variations de longueur d’onde sont liées à celles de fréquence. Des conditions similaires de monochromaticité et cohérence existent pour les autres phénomènes d’interférence et de diffraction. On peut démontrer que la cohérence implique que les divers points de la source de l’onde émettent d’une manière assez coordonnée l’un par rapport à l’autre. Ce qui n’est pas automatique, parce que l’émission est un phénomène microscopique qui a lieu au niveau des atomes, et dans la Giorgio Margaritondo: Ma Physique 371 plupart des cas on n’a pas de coordination entre les émissions des divers atomes d’une source. La coordination est facilitée si la source est petite; par exemple, on peut obtenir une onde cohérente à partir d’une onde incohérente si l’on élimine la plus grand partie de celle-ci avec un écran où se trouve un petit trou: celui-ci devient une source presque ponctuelle d’ondes sphériques d’Huyghens et Fresnel, qui sont cohérentes. La cohérence, ainsi que la monochromaticité, sont automatiquement obtenues si la source est un laser, dont l’émission a lieu de manière coordonnée grâce au phénomène qu’on appelle émission stimulée. LIII.4. Les réseaux de diffraction Nous analyserons maintenant les phénomènes d’interférence concernant les réseaux, dispositifs qui sont très fréquemment utilisés pour obtenir des ondes monochromatiques. Celles-ci sont indispensables, par exemple, pour les applications de spectroscopie, utilisées pour l’analyse chimique. La Fig. 158 illustre un type simple de réseau: une série régulière de N fentes sur un écran. Les conditions d’interférence constructive et destructive peuvent être dérivées à l’aide d’une analyse similaire à celle des deux fentes de l’effet Young. On peut réaliser que la condition pour avoir un maximum d’intensité dans le cas des deux fentes, θ = n λ /d, valable pour deux fentes isolées à la distance d, est également valable pour l’ensemble des fentes du réseau. écran (a) x θ d L écran (b) d θ δ Fig. 158: Réseau de diffraction, formé par une série de fentes à la même distance d l’une de l’autre. Giorgio Margaritondo: Ma Physique 372 Le champ total causé sur le deuxième écran par la série d’ondes émises par les N fentes du réseau est: E ∝ sin(2π(δ/λ)) + sin(2π(2δ/λ)) + sin(2π(3δ/λ)) + ... + sin(2π(Nδ/λ)) . (535) Afin de simplifier la manipulation mathématique, nous adopterons la formulation que nous avons déjà utilisée pour les circuits alternatifs, en remplaçant les fonctions sinusoïdales par des fonctions exponentielles complexes; l’Eq. 535 devient: E ∝ exp(j2π(δ/λ)) + exp(j2π(2δ/λ)) + exp(j2π(3δ/λ)) + ... + exp(j2π(Nδ/λ)) , (536) qui est une série géométrique, dont la somme donne: exp(jπ(Nδ/λ))(exp(-jπ(Nδ/λ)) - exp(jπ(Nδ/λ))) 1 - exp(j2π(Nδ/λ)) = E ∝ 1 - exp(j2π(δ/λ)) = exp(jπ(δ/λ))(exp(-jπ(δ/λ)) - exp(jπ(δ/λ))) exp(jπ(Nδ/λ)) sin(πNδ/λ) = exp(jπ(δ/λ)) sin(πδ/λ) . (537) L’intensité correspond au carré (complexe) de ce nombre, qui donne: sin(πNδ/λ) 2 Intensité ∝ . sin(πδ/λ) (538) Cette fonction a des propriétés intéressantes. Nous voyons d’abord que dans le cas N = 2 (effet Young) elle donne les conditions d’interférence qui correspondent à l’Eq. 534. En fait, si N = 2, la fonction de l’Eq. 538 devient sin2(2πδ/λ)/sin2(πδ/λ) = 4cos2(πδ/λ), et on peut constater que la valeur de cette fonction devient maximale si δ = nλ , la même condition d’interférence constructive qu’on avait trouvée précédemment. En général, la fonction de l’Eq. 538 a la forme illustrée par la Fig. 159. On voit des maxima très prononcés, qui correspondent aux valeurs de δ pour lesquelles le dénominateur est nul; cela amène encore une fois à la condition δ = nλ , donc les maxima principaux de la fonction de l’Eq. 538 correspondent aux directions d’interférence constructive de l’effet Young à deux fentes. Mais on peut constater que les pics de la Fig. 159 sont beaucoup plus étroits que ceux de la Fig. 156, ce qui est dû à la présence de plusieurs fentes. Le numérateur de l’Eq. 538 force la fonction à être nulle chaque fois que Nδ = nλ; par conséquent, après le premier pic principal δ = 0 on a immédiatement un point nul (Nδ = λ), à la distance ∆δ = λ/N - 0 = λ/N du pic. La largeur du pic est donc proportionnelle à 1/N, et tend à s’annuler pour un réseau composé d’un grand nombre de lignes. La largeur angulaire correspondante est ∆θ ≈ ∆δ/d = (λ/d)(1/N). On peut facilement démontrer que le même résultat est valable pour les autres pics. Afin de comprendre quelle est l’application pratique d’un réseau, imaginons que nous envoyons sur celui-ci le mélange de deux ondes monochromatiques dont les longueurs d’onde sont λ et λ + ∆λ. Prenons le pic d’intensité pour l’onde λ qui correspond à δ = nλ et donc à l’angle θ = nλ /d. Le maximum correspondant pour l’onde λ + ∆ λ a lieu à l’angle n(λ + ∆λ)/d, et donc à la distance angulaire n∆λ/d du précédent. Cette différence de direction nous permet de bloquer une des deux longueurs d’onde, et d’en obtenir une seule, à l’aide d’un écran avec une fente, comme montré par la Fig. 160. L’opération de filtrage qui réduit à une seule longueur d’onde, et donc à une onde Giorgio Margaritondo: Ma Physique 373 INTENSITE monochromatique, est appelée “monochromatiser”, et les dispositifs tels que celui de la Fig. 160 sont par conséquent des monochromateurs. -8 -6 -4 -2 0 2 θ 4 6 8 Fig. 159: Intensité d’un réseau en fonction de l’angle θ = δ/L, donnée par la fonction de l’Eq. 538. λ et λ+∆λ (n) λ+∆λ λ fente RESEAU Fig. 160: Schéma de monochromateur à réseau, avec filtrage des longueurs d’onde par une fente. Notez pourtant que la possibilité de séparer deux longueurs d’onde avec le dispositif de la Fig. 160 a des limites. Si la distance angulaire entre les longueurs d’onde à séparer, n∆λ/d, est plus petite que la largeur angulaire ∆θ ≈ (λ/d)(1/N) du pic correspondant d’interférence constructive, on n’arrive plus à éliminer complètement une des longueurs d’onde avec la fente du deuxième écran. Un monochromateur à réseau est donc en mesure de séparer deux longueurs d’onde si leur différence ∆λ est telle que n∆λ/d > (λ/d)(1/N) et par conséquent: Giorgio Margaritondo: Ma Physique 374 ∆λ 1 λ > nN . (539) La quantité λ /∆ λ = nN définie par l’Eq. 539 est appelée le pouvoir de résolution du monochromateur, et illustre les performances de monochromatisation de celui ci. On constate que le pouvoir de résolution augmente avec le nombre total N de fentes des réseaux, d’où la nécessité d’une technologie avancée pour la production de ceux-ci. On constate également que le pouvoir de résolution augmente avec n, c’est à dire avec ce qu’on appelle l’ordre du maximum d’intensité qu’on utilise. Notez pourtant qu’un réseau est affecté par les mêmes effets de diffraction qu’on a trouvés pour l’effet Young (voir la Fig. 156), et donc l’intensité réelle diminue si n augmente, ce qui empêche d’utiliser des ordres dont la valeur de n est trop élevée. Notons également que la possibilité pratique de séparer deux longueurs d’ondes proches l’une de l’autre avec une fente dépend aussi des conditions géométriques du monochromateur. La distance angulaire n∆λ/d correspond à une distance Ln∆λ/d des rayons d’ordre n des deux longueurs d’onde λ et λ + ∆λ, où L est la distance réseaufente; vu l’impossibilité technique de fabriquer des fentes de largeur infinitésimale, cette distance doit être assez grande pour permettre le filtrage avec une fente réaliste. Cette condition peut être remplie en diminuant la grandeur de la période d du réseau, ou en augmentant la distance L. Notons également que, l’angle θ des deux rayons de l’ordre n étant θ = nλ/d, la période d du réseau ne peut être ni excessivement grande ni excessivement petite par rapport à la longueur d’onde; sinon, l’angle est trop petit ou trop grand et ne permet pas une bonne monochromatisation. Les réseaux doivent donc être fabriqués avec une période qui est déterminée par la grandeur des longueurs d’onde qu’on souhaite filtrer. Un cas intéressant est celui des rayons x: leurs longueurs d’onde se situant dans l’intervalle qui va des fractions d’angströms jusqu’aux dizaines d’angströms, la période idéale d’un réseau est bien au-delà des possibilités de la technologie de fabrication des fentes. Heureusement, on trouve des réseaux naturels avec des périodes de cette grandeur: les cristaux, dont les atomes ont une périodicité justement de l’ordre de quelques angströms. En fait, la cristallographie à rayons x, l’une des branches les plus importantes de la recherche fondamentale et industrielle en physique, chimie, pharmacologie et médecine, se base sur l’effet à réseau des cristaux en ce qui concerne les rayons x: on utilise cet effet pour analyser la position dans l'espace des atomes dans les cristaux. Giorgio Margaritondo: Ma Physique 375 Le Coin Yankee: Interférence Diffraction Superposition Fente Cohérence Réseau Monochromateur Pouvoir de résolution Interference Diffraction Superposition Slit Coherence Grating Monochromator Resolving power “The quantity λ/∆λ = nN defined by Eq. 539 is called the resolving power of the monochromator. and describes its monochromatization performances. One realises that the resolving power increases with the total number N of slits, in the grating, which makes necessary an advanced technology for its fabrication. Le coin des unités et des ordres de grandeur: Unités SI Période d’un réseau Autres unités lignes par millimètre Ordres de grandeur: L’ordre de grandeur du pouvoir de résolution d’un monochromateur se situe normalement dans le domaine de 102 à 104 . Giorgio Margaritondo: Ma Physique 376 LIV. Réflexions sur la vitesse de la lumière La vitesse de la lumière a joué un rôle fondamental en physique. Considérons par exemple les premières mesures historiques de la vitesse de la lumière: le résultat le plus important fut la démonstration de l’existence de celle-ci, c’est-à-dire la démonstration que la transmission des informations à l’aide des ondes électromagnétiques n’a pas lieu à vitesse infinie. LIV.1. La mesure de la vitesse de la lumière La figure 161 illustre deux des méthodes qu’on utilisa afin de mesurer c. La méthode de Fizeau se base sur une roue R dont le bord a des espaces pleins séparés par des vides. Les espaces vides et pleins ont la même largeur. La lumière émise par une source S est partiellement réfléchie par le miroir semi-transparent m1; admettons que la position de R, qui tourne à la vitesse angulaire ω, permet le passage de la lumière par un de ses espaces vides. La lumière arrive sur le deuxième miroir m2, y est réfléchie et retourne sur R après un temps ∆t = 2L/c, où L est la distance entre R et m1. Pendant ce temps, la roue a tourné d’un angle ω∆t = 2ωL/c. Si l’on commence à augmenter la vitesse de rotation ω à partir de zéro, on constate que le rayon vu par l’observateur O devient de moins en moins intense, et enfin il disparaît: le rayon de retour sur R a trouvé un espace plein. Si n est le nombre d’espaces vides de la roue, on a cette situation quand l’angle 2ωL/c est égal à 2π/2n et la vitesse angulaire est ω = πc/2nL, d’où: c = 2nLω/π . (540) Afin d’augmenter la précision de la mesure il est nécessaire d’utiliser des valeurs élevées pour la distance L et la vitesse de rotation. La méthode de Foucault se base sur la rotation à vitesse angulaire ω du miroir m1. La lumière émise par la source S passe par un écran semi-transparent m3, arrive sur m1 et y est réfléchie, arrivant ensuite sur le miroir concave m2 . A son retour sur m1 , la lumière trouve celui-ci tourné d’un angle ω∆t = 2ωD/c, où D est la distance entre m1 et m 2. Par conséquent, le rayon est réfléchi par m1 dans une direction qui ne coïncide pas exactement avec celle d’arrivée. L’angle entre les deux trajectoires m3 → m1 et m1 → m3 est égal à 2(2ωD/c), et correspond à la distance ∆ = L(4ωD/c) entre les deux points lumineux sur l’écran m3. On trouve donc que: c = 4LDω/∆ . (541) La précision de la mesure est augmentée dans ce cas en augmentant la vitesse de rotation et les distances L et D. LIV.2. La lumière et la relativité Nous avons vu que les valeurs expérimentales données par les mesures de c coïncident avec la valeur théorique de la vitesse des ondes électromagnétiques, c = 2,998 × 108 Giorgio Margaritondo: Ma Physique 377 m/s. Cela constitua la deuxième découverte fondamentale sur la vitesse de la lumière, après celle de son existence. ω R m2 m1 O L S ω L m1 S ∆ m 3 D m2 Fig. 161: Dispositifs pour la mesure de la vitesse de la lumière. En haut: la méthode de Fizeau; en bas: celle de Foucault. La troisième découverte fut que la vitesse de la lumière ne change pas d’un référentiel à l’autre. La relativité d’Einstein (chapitre V.2.) se base sur ce fait, qui est clairement prouvé par une série d’expériences. Admettons que la lumière se déplace à la vitesse c par rapport à un référentiel particulier (on l’appelait éther au bon vieux temps de la physique classique), et change si le référentiel utilisé est en mouvement par rapport à celui-ci. On devrait être en mesure d’observer les effets de ce changement avec, par exemple, des expériences d’optique. La plus célèbre de ces expériences fut celle de Michelson et Morley aux Etats Unis: il s’agissait de révéler les effets de l’éther sur l’interférence de deux rayons de lumière. On n’observa pourtant aucun effet: l’idée de référentiel absolu ou éther pour le déplacement des ondes électromagnétiques est donc en conflit avec les expériences. Le problème conceptuel posé par l’invariance de la vitesse de la lumière d’un référentiel à l’autre peut être éliminé en tenant compte du fait que le déplacement d’une onde électromagnétique est profondément différent de celui d’une masse. Toutes nos Giorgio Margaritondo: Ma Physique 378 expériences quotidiennes sur le changement de référentiel concernent des masses telles que les balles de tennis. Il est tout simplement impossible de transférer leurs résultats aux ondes électromagnétiques, pour lesquelles on n’a pas d’expérience dans la vie de tous les jours. Le fait apparemment absurde de l’invariance de c d’un référentiel à l’autre peut être confirmé a posteriori, en l’utilisant pour prévoir des phénomènes et en vérifiant l’existence de ceux-ci. C’est ce que nous avons fait dans le chapitre V.2: après avoir utilisé l’invariance de la vitesse de la lumière pour obtenir les transformations de Lorentz (équations 105-108), nous avons prévu des phénomènes tels que la contraction de Lorentz, dont l’existence a été vérifiée. LIV.2.1. L’effet Doppler relativiste pour les ondes électromagnétiques L’effet Doppler est le changement de fréquence d’une onde lorsqu’elle est mesurée d’un référentiel en mouvement par rapport à la source qui l’émet. On constate, par exemple, que le ton d’un klaxon est plus aigu quand une voiture vient vers l’observateur que quand elle s’en éloigne. Imaginons alors qu’une source de lumière sur la voie de la Fig. 162 émet des ondes monochromatiques de fréquence (pulsation) ω . Quelle est la fréquence ω ’ de l’onde détectée du train qui s’éloigne de la source? Admettons que l’onde est plane et donc de la forme de l’Eq. 530, écrite pour la propagation dans la direction de l’axe x: E ∝ sin(kx - ωt) = [vu les équations 526 et 529 qui donnent ω/k = c] = sin(ω((x/c) - t)). Du point de vue du train qui s’éloigne, l’onde a la forme sin(ω ’((x’/c) - t’)), où toutes les quantités ont été changées en utilisant la transformation de Lorentz, à l’exception de la vitesse de la lumière qui demeure invariante. On note, d’autre part, que chaque maximum de l’oscillation vue de la voie correspond à un maximum de l’oscillation vue du train; la même conclusion s’applique aux minima. On conclut par conséquent que l’argument de la fonction sinusoïdale de l’onde ne change pas d’un référentiel à l’autre, et donc: ω((x/c) - t) = ω’((x’/c) - t’) ; (542) x x' u Fig. 162: Encore une fois, notre train relativiste: on l’utilise pour analyser l’effet Doppler de la lumière en utilisant la transformation de Lorentz des équations 105-108 on a: ω ’((x’/c) - t’) = ω ’((x/c) - t)(1 + u/c)/√ 1 - u 2 /c 2 = ω ’((x/c) - t)√ (1 + u/c)/(1 - u/c), et donc l’Eq. 542 donne: Giorgio Margaritondo: Ma Physique √ ω’ = ω c-u . c+u 379 (543) Cette équation spécifie le changement de fréquence causé par l’effet Doppler. Notons que le signe de la vitesse u devient négatif si le train s’approche de la source au lieu de s’en éloigner. On constate par conséquent que la fréquence diminue si la distance source-observateur augmente, et vice-versa. On constate, par exemple, que les émissions caractéristiques des atomes qui se trouvent dans les constellations sont déplacées en fréquence par rapport à ce qu’on mesure sur la terre. Le déplacement a lieu dans la direction des basses fréquences, vers la partie rouge du spectre visible, et on l’appelle en anglais red shift: il révèle la tendance des distances entre les étoiles à augmenter, tendence qu’on attribue aux effets de l’explosion primordiale ou big bang. Sur un plan plus terre à terre, l’effet Doppler des micro-ondes est utilisé par les cops afin de mesurer la vitesse des voitures qui réfléchissent l’émission de radars, diaboliquement camouflés en bordure des autoroutes; procédure détestable, qui peut forcer des professeurs de physique de bonne réputation morale et scientifique à se soumettre, hélas, aux risques de procédures légales modèle Torquemada, et à se défendre en étonnant et en confondant cops et juges grâce à leurs connaissances des belles formules relativistes de l’effet Doppler, qui mettent heureusement ces derniers en condition d’infériorité psychologique, face à la majesté de la Science. LIV.2.2. L’effet Doppler des ondes non-relativistes Si l’on analyse l’effet Doppler des ondes du son, on constate tout d’abord des similarités qualitatives par rapport aux ondes électromagnétiques: diminution de fréquence si la distance source-observateur augmente et vice-versa. Pourtant, on arrive rapidement à des différences importantes entre les deux types d’onde. Ces différences manifestent une dissimilitude profonde de la nature des ondes. Pour la propagation de la lumière et des ondes électromagnétiques en général, on n’a pas un référentiel privilégié tel que l’éther, par conséquent la vitesse de la lumière est invariante d’un référentiel à l’autre. Dans le cas du son, la propagation a lieu dans l’atmosphère, qui est le référentiel privilégié de ce type d’ondes; la vitesse du son change d’un référentiel à l’autre, et dépend de la vitesse du référentiel par rapport à l’atmosphère. Admettons alors qu’une source liée à la voie de la Fig. 162 émet une onde sonore d’une seule fréquence, dont la forme dans l’atmosphère est du type sin(kx - ωt) = sin(ω((x/vs) t)), où vs est la vitesse du son par rapport à l’atmosphère (qui coïncide avec la vitesse par rapport à la voie). Dans le référentiel du train, l’argument de la fonction sinusoïdale est ω ’((x’/vs’) - t’). Notez que cette fois la vitesse de l’onde change d’un référentiel à l’autre. Puisque les vitesses en jeu sont beaucoup plus faibles que la vitesse de la lumière, on peut remplacer la transformation de Lorentz par celle de Galilée. On obtient: ω’((x’/vs’) - t’) = ω’((x - ut)/(vs - u) - t) = ω’(x - vst) /(vs - u). L’égalité des arguments de la fonction sinusoïdale dans les deux référentiels donne: ω((x/vs) - t) = ω’(x - vst)/(vs - u), et donc: Giorgio Margaritondo: Ma Physique 380 vs ω’ = ω v - u , s (544) qui correspond à un effet Doppler dans le même sens, mais d’un type différent de celui de l’Eq. 543. La différence entre son et lumière en ce qui concerne l’effet Doppler, déjà évidente si l’on compare les équations 543 et 544, devient encore plus claire en généralisant l’analyse au cas de mouvement tant de la source, que de l’observateur par rapport à l’atmosphère. Admettons que leurs vitesses sont u s et u o ; une extension facile de l’analyse précédente donne: vs - uo ω’ = ω v - u . s s (545) La question des signes de cette équation est assez délicate: il faut noter que toutes les vitesses sont positives dans la direction positive de l’axe x de la Fig. 162. Cela implique que la vitesse de l’observateur, uo, est positive quand la distance source-observateur augmente; par contre, la vitesse de la source, us, est positive quand cette distance diminue. On trouve donc que la tendance de la distance source-observateur à augmenter comporte toujours une diminution de fréquence et vice-versa, ce qui est en accord avec nos expériences de la vie quotidienne. LIV.2.3. L’onde de “choc” A ce propos, je me souviens d’un t-shirt réservé aux femmes, assez amusant quoique on est forcé à l’admettre - un peu machiste, qui disait: “On aime les hommes: à 20 ans pour le choc [voir onde de ...], à 40 ans pour le chic, à 60 pour le chèque”. Mais passons aux questions scientifiques. Supposons que la vitesse u s de la source augmente dans l’Eq. 545 de l’effet Doppler, jusqu’à la valeur de la vitesse du son. Le dénominateur devient nul, et on a une divergence. Le phénomène correspondant est celui de l’onde de choc. Ce phénomène est illustré par la Fig. 163. On voit d’abord l’onde sonore d’une source qui ne se déplace pas. La fréquence détectée ω’ a la même valeur que la fréquence dans le référentiel de la source, ω. Pareillement, les longueurs d’onde ont la même valeur. Passons maintenant à la partie centrale de la Fig. 163. La source se déplace à vitesse us, sans pourtant arriver à la valeur de la vitesse du son. L’effet Doppler donne (si nous admettons que l’observateur ne se déplace pas) ω’ = ω vs/(vs - us), et en ce qui concerne les longueurs d’onde, λ’ = 2πvs/ω’ = 2π(vs - us)/ω. Quand la vitesse de la source atteint celle du son, la fréquence ω’ devient infinie, et la longueur d’onde λ’ nulle. La raison est illustrée par la partie inférieure de la Fig. 163: on voit les surfaces d’onde correspondant aux maxima des oscillations, et on constate que si u s = vs , les surfaces d’onde s’accumulent dans la direction de mouvement de la source. Cela implique une concentration d’intensité sonore, appelée “bang”. Il s’agit du son explosif qu’on peut entendre quand on est proche d’un Concorde ou d’un avion militaire qui dépassent la vitesse du son. Giorgio Margaritondo: Ma Physique 381 La vitesse des ondes acoustiques dans l’atmosphère, vs ≈ 340 m/s, est souvent appelée “mur du son”. La Fig. 164 montre la situation lorsque la vitesse de la source dépasse le mur du son. Les ondes sphériques créées par la source dans les positions (ombrées) qui correspondent à son mouvement donnent lieu à une surface d’onde conique Σ. L’angle d’ouverture de la superficie conique peut être facilement calculé: pendant le temps ∆t nécessaire pour le déplacement us∆t de la source, l’onde sphérique émise de la première position se propage de vs∆t. Par conséquent, l’angle d’ouverture est de 2sin1(vs∆t/us∆t) = 2sin-1(vs/us). Les effets de ce type ne sont pas limités aux ondes sonores: ils justifient les ondes des bateaux sur l’eau lorsque leurs vitesses sont plus élevées que celle des vagues. Dans les matériaux, on a un effet similaire dit effet Cerenkov, qui concerne la lumière. La vitesse de la lumière dans le matériau est moins élevée que dans le vide, et peut donc être dépassée par la vitesse d’une particule sans violer les prévisions de la relativité: la particule peut émettre des ondes sur une superficie conique similaire à celle de la Fig. 164. LIV.3. Vitesse de phase et vitesse de groupe Nous devons discuter maintenant un point à la fois délicat et très important, qui concerne la transmission des informations par les ondes, en particulier les ondes électromagnétiques. La propagation des informations est la fonction la plus importante de celles-ci, tant sur le plan fondamental qu’en technologie. Prenons une onde sinusoïdale, de la forme de l’Eq. 530, c’est-à-dire: E ∝ sin(kz ± ωt) ; (546) en tenant compte des équations 526 et 529, la vitesse de la lumière qui caractérise la propagation de cette onde peut être écrite: c = ω k ; (547) cette vitesse ou célérité, qu’on trouve dans l’argument du sinus et qui en détermine l’angle de phase, est appelée la vitesse de phase de l’onde. Il est très important de réaliser qu’une onde telle que la fonction (546) ne suffit pas à transmettre des informations. Supposons qu’il s’agit d’une transmission radio: elle n’aurait pas de modulation, qui d’autre part est nécessaire pour transmettre des informations telles que les mots et la musique. Une des formes les plus élémentaires d’information est l’interruption de l’onde. Mais si vous interrompez la transmission, l’onde n’est plus de la forme de l’Eq. 546, qui est strictement valable seulement pour le cas -∞ < t < ∞ et -∞ < z < ∞. Toute interruption et toute déformation en général donne une onde qui n’est plus exactement sinusoïdale. Analysons cette constatation à l’aide du théorème de Fourier. Une onde du type de l’Eq. 546 n’a qu’une composante de Fourier à une seule fréquence (et à une seule longueur d’onde). Si l’on commence à moduler l’onde afin de transmettre des informations, on n’a plus seulement une composante de Fourier, mais une superposition de plusieurs composantes de fréquences diverses. Giorgio Margaritondo: Ma Physique 382 λ' us=0 source λ' 0<us<v s λ'=0 us=v s Fig. 163: En haut: émission d’ondes sonores par une source qui ne se déplace pas; au centre: effet Doppler causé par le mouvement de la source; en bas: onde de choc. Giorgio Margaritondo: Ma Physique 383 On est donc forcé d’utiliser une superposition de plusieurs ondes sinusoïdales si l’on veut transmettre des informations. La question qu’on doit considérer est la suivante: quelle est la vitesse de propagation des informations? LIV.3.1. Les battements Nous commencerons à analyser cette question en utilisant le type le plus simple possible de superposition d’ondes sinusoïdales: la somme de deux ondes du type de l’Eq. 546. Admettons que l’onde combinée est mesurée dans un point fixe de l’espace, qu’on peut placer à z = 0. Ecrivons les deux ondes sin(ωt) et sin((ω + δω)t), où ω et (ω + δω) sont leurs fréquences (pulsations). vs∆t Σ us>v s Σ us∆t Fig. 164: Ondes émises par un objet qui se déplace à vitesse plus élevée que celle des ondes. La somme sin((ω + δ ω )t) + sin(ω t) peut être manipulée à l’aide des formules de la trigonométrie: sin((ω + δω)t) + sin(ωt) = 2sin((((ω + δω)t) + ωt)/2)cos((((ω + δω)t) - ωt)/2) = 2sin((ω + (δω/2))t)cos((δω/2)t). Si l’on suppose que les deux fréquences sont proches l’une de l’autre, c’est-à-dire que δω << ω, on peut écrire: superposition ≈ 2sin(ω t)cos((δω/2)t) . (548) L’interprétation de ce résultat est assez intéressante: l’onde combinaison est à son tour une oscillation à fréquence proche des deux ondes combinées. Mais cette oscillation est modulée par le facteur cos((δω/2)t), qui donne une oscillation de fréquence δω/2. Ce résultat, illustré par la Fig. 165, correspond au phénomène des battements. On voit dans la figure deux ondes sinusoïdales (a) et (b) approximativement de la même fréquence ω , et leur somme (a) + (b). Celle-ci est en fait une oscillation de fréquence proche de ω, modulée à une fréquence beaucoup moins élevée, et qui correspond à la moitié de la différence de fréquence des ondes (a) et (b). Dans le cas d’une onde sonore, la combinaison de deux sons “purs” dont les fréquences sont proches l’une de l’autre peut produire un son du même type, modulé à basse Giorgio Margaritondo: Ma Physique 384 fréquence: ce qu’on appelle, justement, des battements. Il s’agit d’un phénomène qui peut causer des problèmes importants dans l’acoustique des salles de concert. LIV.3.2. La vitesse de groupe A quelle vitesse se propage la modulation de l’onde combinée et donc l’information qu’elle transporte? Afin de répondre à cette question, écrivons la forme complète des deux ondes et de leur combinaison, en incluant la dépendance de la position z: ≈ sin(kz ± ω t) + sin((k + δk)z ± (ω + δω)t) ≈ 2sin(kz ± ω t)cos(((δk)z + (δω)t)/2) , superposition (549) où l’on peut reconnaître le facteur sin(kz ± ω t), similaire aux deux ondes combinées, et le facteur de modulation, cos(((δk)z + (δω)t)/2). La vitesse de propagation de la modulation peut être dérivée en généralisant l’Eq. 546, c’est-à-dire en écrivant celle-ci avec les paramètres δk et δ ω qui jouent le rôle de la fréquence et du nombre d’onde dans le facteur de modulation cos(((δk)z + (δω)t)/2); on a alors: δω vitesse de propagation de la modulation ≈ δk ; (550) l’approximation est liée au fait que les différences de fréquence et de nombre d’onde entre les deux ondes combinées ne sont pas infinitésimales; à la limite de différences infinitésimales: dω vitesse de propagation de la modulation = vg = dk . (551) La modulation n’est pas un phénomène individuel des deux ondes combinées: il s’agit d’un effet qui affecte leur combinaison. On appelle donc vg la vitesse de groupe de l’onde totale. La vitesse de groupe est la vitesse de propagation tant de la modulation que de l’information qu’elle transporte. (a)+(b) (b) (a) -30 -20 -10 0 10 20 30 Radians Fig. 165: La composition de deux ondes sinusoïdales dont les fréquences sont proches l’une de l’autre donne lieu au phénomène des battements. Giorgio Margaritondo: Ma Physique 385 On peut généraliser ce résultat en l’appliquant à une combinaison quelconque d’ondes du type sinusoïdal et donc, grâce au théorème de Fourier, à n’importe quelle forme d’onde: l’Eq. 551 définit toujours la vitesse de groupe de l’onde. La modulation qui se propage est souvent concentrée, dans le sens qu’à un temps donné elle est confinée à une région limitée de l’espace, pour se déplacer ensuite à une autre région, toujours limitée: pensez, par exemple, à la pulsation de lumière d’un flash. La composition de Fourier donne lieu dans ce cas à un paquet d’onde, qui se propage bien sûr à la vitesse de groupe. Le Coin Yankee: Diffraction Choc Battements Vitesse de phase (célérité) Vitesse de groupe Diffraction Shock Beats Phase velocity Group velocity “These differences reflect a fundamental difference of the waves’ nature. For the propagation of light and of the electromagnetic waves in general, there is no special reference frame such as the ether, therefore the speed of light is invariant from one reference frame to another. In the case of sound, the propagation occurs in the atmosphere, which is the special reference frame for this type of waves; the speed of sound changes from one frame to another, and depends on the speed of the reference frame with respect to the atmosphere. Le coin des unités et des ordres de grandeur: Ordres de grandeur: L’importance des phénomènes relativistes est déterminée par la grandeur du facteur √ 1 - u 2 /c 2 qu’on trouve, par exemple, dans les équations de la transformation de Lorentz. Prenons la vitesse typique d’un coureur ou d’une voiture, 10-20 m/s: le facteur √ 1 - u 2 /c 2 est égal à l’unité à 0,000003% près, donc les effets relativistes sont négligeables. Par exemple, la contraction de Lorentz d’une voiture vue de l’autoroute est de l’ordre de 1/10 de micron. Même pour un avion qui atteint le mur du son, la correction est toujours négligeable. Par contre, un électron qui circule dans un accélérateur de particules élémentaires, tel qu’un anneau d’accumulation à 1 GeV, se déplace à la vitesse de 0,9999 c, et donc son comportement est strictement relativiste. Giorgio Margaritondo: Ma Physique 386 LV. Réfraction, dispersion et réflexion; “principe” de Fermat Existe-t-il vraiment une différence entre la vitesse de groupe de la lumière, vg, définie par l’Eq. 551, et sa vitesse de phase? Prenons l’Eq. 547: ω c = k , qui correspond à une fonction du type ω(k) = ck. Sa dérivée étant justement c, on n’a pas de différence entre les deux vitesses. Ce résultat est valable dans le vide. Mais considérons maintenant la vitesse de la lumière dans un matériau. On doit changer l’Eq. 516, c = 1/√ µoεo, en remplaçant les deux constantes µ o et ε o par µ o µ R et ε o ε R . On peut dont écrire la vitesse dans le matériau: c v = n , (552) où n, appelé indice de réfraction du matériau, est donné par: n = √ µ RεR . (553) Prenons alors l’Eq. 547: dans le matériau, elle implique: ω = kc/n ; (554) notez que, si l’indice de réfraction est constant, la vitesse de groupe dω/dk est toujours égale à celle de phase. Par contre, si n = n(ω) n’est pas une constante mais une fonction de ω, on trouve que v ≠ c. Le phénomène qui donne un indice de réfraction dépendant de la fréquence est appelé dispersion. La fonction ω(k) est dite par conséquent fonction de dispersion. Comment peut-on mettre en évidence la dispersion dans un matériau? On peut utiliser le phénomène de réfraction, par exemple en utilisant l’expérience classique du prisme de Newton, illustrée par la Fig. 166. La partie supérieure de la figure montre le phénomène de réfraction qui se produit quand une onde de lumière arrive à une interface entre le vide (à gauche) et un matériau tel que le verre. Le phénomène est analysé à l’aide du “principe” d’Huyghens et Fresnel. Prenons le point A: quand la surface d’onde l’atteint, il commence à émettre des petites ondes sphériques à l’intérieur du verre. Au moment où la surface d’onde atteint le point D, les ondes émises par le point A sont déjà arrivées au point C. Si n est l’indice de réfraction du verre, et ∆t l’intervalle de temps séparant l’arrivée de la surface d’onde aux points A puis D, on a AC = (c/n)∆t et BD = c∆t, d’où l’on déduit que AC/BD = 1/n. D’autre part, AC = AD sin r et BD = AD sin i, et donc: sin r 1 = sin i n , (555) qui est la célèbre équation de la réfraction, spécifiant la relation entre les angles d’incidence i et de réfraction r, et donc la déviation du rayon causée par la réfraction. Giorgio Margaritondo: Ma Physique 387 Admettons maintenant que l’indice de réfraction de l’Eq. 555 n’est pas constant, mais qu’il est une fonction de la fréquence ω . Deux ondes de fréquences différentes sont réfractées dans des directions différentes. Ce phénomène augmente lorsqu’on utilise deux interfaces en séquence, à un angle θ l’une de l’autre: c’est justement le prisme de Newton illustré par la partie inférieure de la Fig. 166. Dans le cas de la lumière visible, chaque fréquence correspond à une couleur, donc les phénomènes de diffraction et de réfraction sont utilisés à l’aide du prisme afin de séparer les couleurs l’une de l’autre. Si l’on bloque, à l’aide d’un écran muni d’un trou, tous les rayons à l’exception d’une seule couleur, on obtient un monochromateur à prisme. A i i C B r r D θ Fig. 166: Le prisme de Newton révèle le phénomène de diffraction et sépare l’une de l’autre les diverses couleurs, c’est-à-dire les diverses fréquences, de la lumière. En haut: réfraction d’ondes électromagnétiques à l’interface videverre. En bas: prisme de Newton qui sépare deux rayons lumineux de couleurs (et donc de fréquences) différentes. La dérivation de l’Eq. 555 peut être facilement généralisée au cas de la réfraction d’un rayon de lumière à l’interface entre deux matériaux, dont les indices de réfraction sont n1 et n2. On trouve alors que: n1 sin r = sin i n2 . (556) Giorgio Margaritondo: Ma Physique 388 Notez que, puisque sin r ≤ 1, l’Eq. 556 implique sin i ≤ n2/n1; si i ≤ n2/n1, pour les angles d’incidence plus grands que l’angle limite sin-1(n2/n1), on n’a pas de réfraction mais réflexion totale. LV.1. La réflexion La réfraction n’est pas le seul phénomène qu’on observe quand une onde atteint une interface telle que l’interface vide-verre de la partie supérieure de la Fig. 166: on a également la réflexion d’une partie de l’onde. Ce dernier phénomène est illustré par la Fig. 167. Son analyse se base encore une fois sur le “principe” de Huyghens et Fresnel. Suivant une logique similaire à celle adoptée pour la réfraction, on trouve facilement que la relation entre les angles d’incidence et de réflexion est: r = i . (557) Cette loi peut être considérée comme la limite de l’Eq. 556, si l’on adopte pour les angles r un signe positif dans le matériau (réfraction) et négatif dans le vide (réflexion), et si l’on prend n = -1 pour le cas de la réflexion. La réflexion ne produit pas seulement le changement de direction du rayon, mais aussi un changement de l’angle de phase de l’onde. Ce point peut être réalisé si l’on prend une onde sinusoïdale du type de l’Eq. 430: Ex = Exosin(kz ± ωt) . Admettons que l’angle d’incidence, et par conséquent celui de réflexion, sont nuls; si l’on prend l’origine de l’axe z sur l’interface, l’onde incidente à z = 0 devient Exosin(-ωt), où le signe est déterminé par la direction de propagation. L’onde réfléchie se propage dans la direction opposée; pourtant, elle ne peut pas être de la forme Exosin(ωt), parce que cette forme ne permettrait pas l’égalité des deux ondes au point de réflexion, vu qu’on a toujours sin(α) ≠ sin(-α) si α ≠ 0. i C B A r i r D Fig. 167: Le phénomène de la réflexion d’une onde à une interface, analysé à l’aide du “principe” de Huyghens et Fresnel. Giorgio Margaritondo: Ma Physique 389 On doit alors adopter une forme du type Exosin(ωt + φ) pour l’onde réfléchie, avec un changement de phase φ par rapport à l’onde incidente. La condition d’égalité des deux ondes à l’origine donne Exosin(-ωt) = Exosin(ωt + φ), et donc φ = π: l’onde réfléchie est déphasée de π par rapport à l’onde incidente. LV.2. Le “principe” de Fermat Les phénomènes de réflexion et de réfraction sont à la base du fonctionnement des systèmes optiques complexes. L’analyse de ceux-ci est facilitée par ce qu’on appelle le “principe” de Fermat. Comme pour le “principe” d’Huyghens et Fresnel, il ne s’agit pas d’un vrai principe, mais d’une propriété des rayons de lumière qu’on peut dériver de l’équation des ondes, et qui est très efficace afin de traiter les problèmes pratiques. Pierre de Fermat, auteur du “principe” de Fermat en optique, mais encore plus célèbre grâce à ses résultats mathématiques, notamment le “dernier théorème de Fermat”. Le “principe” de Fermat traite du chemin optique d’un rayon, que nous définirons par la suite. Pour un trait infinitésimal dr de la trajectoire du rayon, dont la grandeur est dr, le chemin optique est n(r)dr, où n(r) est l’indice de réfraction du matériau où se trouve le trait dr. Le chemin optique total pour un parcours donné est la somme, voire l’intégrale, des chemins optiques infinitésimaux: chemin optique = ∫n(r)dr . (558) Le “principe” de Fermat affirme qu’entre tous les parcours possibles qui relient deux points fixes, un rayon de lumière suit celui qui minimise le chemin optique. Avant d’appliquer ce résultat à des problèmes pratiques, notons que le temps nécessaire à un rayon pour parcourir le trait dr est dr/(c/n) = ndr/c. Par conséquent, la minimisation du chemin optique comporte également la minimisation du temps nécessaire pour le déplacement du rayon d’un point fixe à l’autre. La Fig. 168 illustre la dérivation de la loi de réfraction à partir du “principe” de Fermat. On cherche le chemin qui amène un rayon du point A au point B. Le chemin optique est xA/cos i + nxB/cos r. Imaginons que l’angle i varie d’une quantité infinitésimale δi, et l’angle r d’une quantité également infinitésimale δr. Afin d’avoir un chemin optique minimum, la variation correspondante de celui-ci doit être nulle: Giorgio Margaritondo: Ma Physique 390 xA nxB ∂ cos i ∂ cos r xAsin i nxBsin r 0 = δi + δr = δi δr ; ∂i ∂r cos2i cos2r A D (559) xA i r xB B Fig. 168: Dérivation de la loi de réfraction à l’aide du “principe” de Fermat. d’autre part, la somme xA tg i + xB tg r doit toujours être égale à la constante D, par conséquent sa variation correspondante à δi et δr doit également être nulle, ce qui donne 0 = (∂(xA tg i)/∂i)δi + (∂(xB tg r)/∂r)δr = - (xA /cos 2 i)δi - (xB /cos 2 r)δr, et donc (xA/cos2i)δi = - (xB/cos2r)δr, relation qui, combinée à l’Eq. 559, amène à l’Eq. 555: 1 sin r = n , sin i On a donc trouvé que le “principe” de Fermat peut en fait être utilisé afin de dériver la loi de réfraction. On peut également dériver, à partir de ce “principe”, la loi de réflexion. Et on peut l’appliquer efficacement à une grande quantité de problèmes pratiques d’optique. Giorgio Margaritondo: Ma Physique 391 Le Coin Yankee: Indice de Refraction index réfraction Réflexion totale Total reflexion Chemin optique Optical path “Fermat’s ‘principle’ says that, among all possible trajectories that link two fixed points, a light ray follows the one that minimizes the optical path. Before applying this result to practical problems, we note that the time needed by a ray to travel along the segment dr is dr/(c/n) = ndr/c. As a consequence, the minimization of the optical path implies also the minimization of the time required for the ray to travel from one fixed point to the other.” Giorgio Margaritondo: Ma Physique 392 LVI. Les équations de Fresnel et la polarisation de la lumière Le chapitre précédent a discuté les lois qui gouvernent la réfraction et la réflexion de la lumière. Nous passons maintenant aux combinaisons de ces phénomènes: à l’arrivée d’un rayon à une interface, nous avons à la fois réflexion et réfraction, comme on peut le constater, par exemple, quand la lumière arrive sur le verre d’une fenêtre. La lumière est partiellement réfléchie, mais le reste passe à travers le verre. Quelles sont alors les relations qui lient l’onde réfléchie et l’onde réfractée? Ces relations sont spécifiées par les équations de Fresnel, dérivées des propriétés des champs E, D, B et H aux interfaces, qui sont résumées par les équations 478, 479, 492 et 493: Dp1 = Dp2 ; Et1 = Et2 ; Bp1 = Bp2 ; Ht1 = Ht2 ; ces équations gouvernent le comportement des champs d’une onde qui arrive à une interface. Prenez la Fig. 169: on voit un rayon incident qui arrive à l’interface I entre les matériaux 1 et 2, dont les indices de réfraction sont n1 et n2. Le rayon est en partie réfléchi et en partie réfracté. Les angles des rayons incident, réfléchi et réfracté (transmis) par rapport à la direction perpendiculaire à l’interface sont θi, θr et θt. Dans le cas particulier de la Fig. 169, le champ électrique de l’onde incidente est parallèle à l’interface; la grandeur du champ électrique est donc égale à celle de la composante parallèle, E i|| . Le champ électrique total à l’interface est, du côté du matériau 1, la combinaison de E i|| et du champ de l’onde réfléchie, qui est également parallèle à l’interface, Er||; le total est Ei|| + Er||. L’Eq. 479 exige que celui-ci soit égal au champ à l’interface du côté du matériau 2, qui est le champ (parallèle à l’interface) de l’onde réfractée, Et||. Donc: Ei|| + Er|| = Et|| . (560) Analysons maintenant les champs magnétiques, afin d’appliquer l’Eq. 493. Prenons d’abord l’onde incidente: son champ magnétique est perpendiculaire au champ électrique, et sa grandeur est B i⊥ . La composante perpendiculaire à l’interface est Bi⊥cosθi. D’autre part, les champs magnétique et électrique de l’onde sont liés par l’Eq. 518, qui dans ce cas donne Bi⊥ = Ei||/(c/n1), et donc la composante perpendiculaire (à l’interface) du champ magnétique de l’onde incidente est n1Ei||cosθi/c. De façon similaire, on trouve que les composantes perpendiculaires des champs magnétiques des ondes réfléchie et réfractée sont n1Er||cosθi/c et n2Et||cosθt/c (notez que θr = θi). Remarquons pourtant que la combinaison des champs magnétiques des ondes incidente et réfléchie doit cette fois tenir compte de leurs directions respectives, qui sont opposées à cause du changement de phase causé par la réflexion. Le champ magnétique total perpendiculaire à l’interface, du côté du matériau 1, est donc n1cosθi(Ei|| - Er||)/c. Giorgio Margaritondo: Ma Physique 393 L’Eq. 493, en tenant compte de la relation B = µ o µ R H , et en notant µ 1 et µ 2 les perméabilités relatives des deux matériaux, donne: n1cosθi(Ei|| - Er||)/µ1 = n2cosθtEt||/µ2 . (561) Bi⊥ θi θr 1 I Br⊥ Er|| Ei|| 2 Bt⊥ θt Et|| Fig. 169: Dérivation des équations de Fresnel pour le cas d’une onde dont le champ électrique est parallèle à l’interface I des deux matériaux 1 et 2. Combinée à l’Eq. 420, cette relation implique: Et|| 2n1cosθi/µ1 = n cosθ /µ + n cosθ /µ . || Ei 1 i 1 2 t 2 (562) A l’exception des matériaux ferromagnétiques, on peut admettre que µ 1 ≈ µ 2 ≈ 1, de façon que l’Eq. 562 donne: 2n1cosθi Et|| = n cosθ + n cosθ . || Ei 1 i 2 t (563) Dans la même hypothèse, on peut également dériver des équations 561 et 562: Er|| n1cosθi - n2cosθt = n cosθ + n cosθ . || Ei 1 i 2 t (564) Une ligne logique similaire peut être adoptée dans le cas d’un champ magnétique de l’onde incidente parallèle à l’interface; on trouve que: E t⊥ 2n1cosθi = n cosθ + n cosθ ; ⊥ Ei 1 t 2 i (565) n1cosθt - n2cosθi Er⊥ = n cosθ + n cosθ . ⊥ Ei 1 t 2 i (566) Giorgio Margaritondo: Ma Physique 394 Les équations 563-566 sont dites équations de Fresnel, et spécifient les relations des ondes incidente, réfléchie et réfractée. On peut simplifier ces équations à l’aide de la loi généralisée de la réfraction, Eq. 556, qui donne dans ce cas n2/n1 = sinθi/sinθt. Après quelques passages mathématiques, on trouve que: 2sinθtcosθi Et|| = sin(θi + θt) ; Ei|| (567) sin(θt - θi) Er|| = sin(θi + θt) ; Ei|| (568) 2sinθtcosθi E t⊥ = sin(θi + θt)cos(θi - θt) ; E i⊥ (569) tg(θi - θt) Er⊥ = tg(θi + θt) . E i⊥ (570) Afin d’essayer de comprendre les implications pratiques des équations de Fresnel, notez par exemple que si: θi + θt = π/2 , (571) alors E r⊥ = 0: le champ électrique de l’onde réfléchie est parallèle à l’interface. L’angle d’incidence θi pour lequel l’Eq. 571 est valide s’appelle angle de Brewster ou angle de polarisation. Puisque n2 /n 1 = sinθ i/sinθ t, la condition illustrée par l’Eq. 571 est équivalente à: tgθi = n2/n1 . (572) L’élimination de la composante perpendiculaire de l’onde à l’angle de Brewster est un cas extrême d’un phénomène général: le rapport des composantes parallèle et perpendiculaire change quand l’onde est réfléchie ou réfractée. On constate, par exemple, que la lumière du soleil réfléchie par le lac Léman a un champ électrique de grandeur plus élevée dans la direction parallèle à la superficie que dans la direction perpendiculaire. On peut donc éliminer les réflexions génantes (par exemple, celles qui empêchent MM. les professeurs de physique de se relaxer en regardant les jolies filles sur la plage), par des verres de lunettes qui suppriment justement les ondes “parallèles”, appelées Polaroïd@. LVI.1. La polarisation La discussion qui précède nous amène à la notion de polarisation de la lumière. Nous avons vu que la théorie des ondes électromagnétiques prévoit le caractère transverse de celles-ci, tant avec le champ électrique que le champ magnétique confinés au plan perpendiculaire à la direction de propagation. En plus, elle prévoit que le champ électrique est perpendiculaire au champ magnétique. Considérons le champ électrique, par exemple dans le cas de l’onde plane illustrée par la Fig. 170. A un moment donné et à un point donné de l’espace, on peut trouver les deux composantes Ex et Ey du champ. La direction du champ est spécifiée par l’angle φ, qui à son tour est donné par: Giorgio Margaritondo: Ma Physique 395 φ = tg-1(Ey/Ex) . (573) Cette direction ne demeure pas constante dans le temps: elle change en général d’un instant à l’autre. y Ey E φ z Ex x Fig. 170: Champ électrique d’une onde plane, utilisé pour analyser les divers types de polarisation. Si, par contre, la direction du champ E (et par conséquent celle du champ magnétique) demeure constante, alors on dit que l’onde est polarisée linéairement. La condition de polarisation linéaire ressort clairement de l’Eq. 573: le rapport des deux composantes doit demeurer constant. La polarisation linéaire n’est qu’un cas particulier d’une série de phénomènes dits de polarisation. Essayons donc de généraliser notre discussion, en utilisant une onde monochromatique du type de l’Eq. 430: Ex = Exosin(kz ± ωt) . Nous adopterons pourtant une forme modifiée de cette équation; d’abord, nous n’admettrons pas que la seule composante de l’onde soit E x : nous utiliserons des équations du type de l’Eq. 430 tant pour Ex que pour Ey: Ex = Exosin(kz ± ωt) ; (574) Ey = Eyosin(kz ± ωt + η(t)) . (575) Notez la différence de phase η entre les deux composantes: si elle est nulle, le rapport des deux composantes est simplement E xo/E yo , donc constant: l’onde est polarisée linéairement. Cette situation est illustrée par la partie gauche de la Fig. 171. Giorgio Margaritondo: Ma Physique 396 En général, la différence de phase η n’est pas nulle, et de plus elle change avec le temps. On dit que l’onde est polarisée elliptiquement si la différence de phase est constante par rapport au temps. Afin de comprendre cette dénomination, prenons les équations 574 et 575 à l’origine, z = 0, et choisissons le signe positif pour l’angle ωt: Ex = Exosin(ωt) ; (576) Ey = Eyosin(ωt + η) . (577) Ces équations sont les équations paramétriques d’une ellipse (voir la partie centrale de la Fig. 171): par conséquent l’extrémité du vecteur E, dont la direction change d’un instant à l’autre, se trouve toujours sur la même courbe elliptique: voilà l’origine du terme polarisation elliptique. η = 0: φ = cte y Ey φ η = π/2 = cte Eox = Eoy y η = cte y E Ex E x E x x Fig. 171: Ondes à polarisation linéaire, elliptique et circulaire. Prenons maintenant le cas η = π/2; les équations 576 et 577 donnent: Ex = Exosin(ωt) , Ey = Eyocos(ωt) , (578) qui sont les équations paramétriques d’une ellipse dont les axes coïncident avec les axes x et y. Si en plus Exo = Eyo, alors l’ellipse devient un cercle (partie droite de la Fig. 171), et on parle de polarisation circulaire. LVI.1.1. Les polariseurs Comment peut-on obtenir des ondes polarisées, linéairement, elliptiquement ou circulairement? Nous avons déjà vu que la réflexion à l’angle de Brewster produit une onde linéairement polarisée. On peut également utiliser un polariseur du type Polaroïd: il s’agit d’un matériau qui ne permet le passage que de la lumière dont le champ électrique est parallèle à son axe de polarisation. Les Polaroïds sont utilisés tant pour la production de lumière polarisée que pour l’analyse de celle-ci. Admettons que vous savez qu’un rayon de lumière est polarisé de façon linéaire, mais vous ignorez quelle est la direction de polarisation. On peut Giorgio Margaritondo: Ma Physique 397 facilement identifier celle-ci à l’aide d’un polaroïd. Considérons la Fig. 172: notons θ l’angle entre les directions de l’axe de polarisation de la lumière et de l’axe du polaroïd. Seule la composante parallèle à l’axe du polaroïd peut être transmise par celui-ci, ce qui modifie évidemment l’intensité du rayon de lumière. Avant l’arrivée sur le polaroïd, l’intensité est proportionnelle au carré E2 du champ électrique de l’onde. La composante du champ dans la direction de l’axe du polaroïd est Ecosθ. Par conséquent, l’intensité I après le polaroïd est proportionnelle à (Ecosθ)2, ce qui donne la loi de Malus: I ∝ cos2θ . (579) On peut donc identifier la direction de polarisation de la lumière en changeant l’angle θ et en trouvant l’orientation du polaroïd pour laquelle l’intensité est au minimum, voire nulle: l’axe du polaroïd dans ce cas est perpendiculaire à la direction de polarisation. LVI.1.1.1. La biréfringence On peut changer l’état de polarisation d’un rayon de lumière, par exemple de la polarisation circulaire à la polarisation linéaire et vice versa, à l’aide du phénomène de biréfringence, qui a lieu pour des cristaux tels que ceux de calcite. Considérons la Fig. 173: on voit un rayon de lumière qui passe par un cristal biréfringent, et dont l’état de polarisation est ensuite analysé à l’aide d’un polaroïd. axe de polarisation θ axe du polaroid lumière polarisée linéairement polaroid Fig. 172: Analyse d’une onde polarisée linéairement à l’aide d’un polariseur du type polaroïd. On trouve la loi de Malus. Le cristal biréfringent est caractérisé par son axe optique; la lumière polarisée linéairement dans la direction de l’axe se propage dans le cristal à la vitesse c/n|| , déterminée par l’indice de réfraction n||. A cause du phénomène de la biréfringence, cet indice change si l’on considère la lumière polarisée linéairement dans une direction perpendiculaire à l’axe optique, et il devient n⊥ ≠ n||. Admettons alors, par exemple, que la lumière arrivant sur le cristal biréfringent de la Fig. 173 est polarisée linéairement. On peut écrire son champ électrique sous la forme des équations 574 et 575, avec une différence de phase η nulle, et le signe négatif du terme ωt: Giorgio Margaritondo: Ma Physique 398 Ex = Exosin(kz - ωt) ; (580) Ey = Eyosin(kz - ωt) . (581) Admettons que l’axe y coïncide avec l’axe optique du cristal, et que l’origine de l’axe de propagation z coïncide avec la surface d’entrée du cristal. Sur cette surface on a: Ex = Exosin(-ωt) ; (582) Ey = Eyosin(-ωt) . (583) Dans le cristal, le nombre d’onde change par rapport à la valeur k dans le vide; pour la composante y (parallèle à l’axe optique), les équations 526 et 529, après avoir remplacé la vitesse c par c/n||, donnent une valeur n||k du nombre d’onde. Pour la composante x, le nombre d’onde dans le cristal est n⊥k. axe optique lumière cristal biréfringent analyseur polaroïd@ Fig. 173: Le phénomène de la biréfringence est utilisé afin de changer l’état de polarisation de la lumière. Par conséquent, les équations 580 et 581 deviennent dans le cristal biréfringent: Ex = Exosin(n⊥kz - ωt) ; (584) Ey = Eyosin(n||kz - ωt) . (585) Si d est l’épaisseur du cristal, à la surface de sortie les équations 584 et 585 donnent: Ex = Exosin(n⊥kd - ωt) ; (586) Ey = Eyosin(n||kd - ωt) . (587) Comparé aux équations 582 et 583, ce résultat montre que le cristal a causé une différence de phase kd(n⊥ - n||) entre les deux composantes du champ électrique de l’onde: celle-ci n’est plus polarisée linéairement, sa polarisation linéaire ayant été transformée en polarisation elliptique par le cristal. La transformation peut être révélée par l’analyseur polaroïd de la Fig. 173. Giorgio Margaritondo: Ma Physique 399 Si l’épaisseur du cristal est telle que la différence de phase kd(n⊥ - n||) est égale à π/2, alors la plaquette biréfringente s’appelle lame 1/4 d’onde (la différence de chemin optique d(n⊥ - n||) est égale à λ/4). Notez que la condition correspondante d = π/(2k(n⊥ - n||) dépend de la valeur du nombre d’onde k = 2π/λ, et donc dépend de la longueur d’onde: l’épaisseur d nécessaire pour avoir une lame 1/4 d’onde change d’une longueur d’onde à l’autre. La plaquette s’appelle lame 1/2 d’onde si le déphasage est de π. Notez que si l’onde initiale est polarisée circulairement, une lame 1/4 d’onde transforme le déphasage initial de π/2 en déphasage de π. En utilisant les équations 574 et 575, on peut facilement constater que celui-ci correspond à une onde polarisée linéairement: voilà donc la manière de transformer la polarisation circulaire en polarisation linéaire. La biréfringence à un seul axe optique est un cas particulier de phénomène d’anisotropie optique. Un cristal pour lequel on n’a qu’un indice de réfraction et une seule vitesse de la lumière pour toutes les directions est dit isotrope. Un cristal biréfringent n’est pas isotrope mais anisotrope. L’anisotropie optique peut être causée dans un cristal isotrope par des contraintes mécaniques, qui le transforment en cristal biréfringent. Puisque la différence des indices de réfraction est déterminée par la grandeur locale des contraints, un appareil similaire à celui de la Fig. 173, utilisant la lumière initialement polarisée de façon linéaire, peut révéler tant la localisation dans l'espace que l’importance des contraintes. On peut donc développer des modèles de pièces mécaniques et en étudier de cette façon les contraintes dans des conditions de fonctionnement réalistes. Le Coin Yankee: Polarisation linéaire Polarisation circulaire Polariseur Analyseur Biréfringence Isotropie (anisotropie) optique Axe optique Lame 1/4 (1/2) d’onde Linear polarization Circular polarization Polarizer Analyzer Birefringence Optical isotropy (anisotropy) “If, on the contrary, the direction of the E field (and as a consequence that of the magnetic field) remain constant, one says that the wave is linearly polarized. The condition of linear polarization is evident from Eq. 573: the ratio of the two components must remain constant.” Optical axis Quarter-wave (half-wave) plate Le coin des unités et des ordres de grandeur: Ordres de grandeur: La différence des indices de réfractions parallèle et perpendiculaire à l’axe optique, pour le cas spécifique du quartz, est (n⊥ - n|| ) = 1,5534 - 1,5443 = 0,0091. Cela correspond à une épaisseur minimum de l’ordre de 0,015 mm pour une lame 1/4 d’onde. Giorgio Margaritondo: Ma Physique 400 LVII. Optique géométrique L’optique géométrique est la branche de l’électromagnétisme qui analyse la formation et les propriétés des images dans les instruments optiques sur la base des lois de réflexion et de réfraction des surfaces sphériques. Les instruments optiques sont des combinaisons d’instruments élémentaires tels que les miroirs et les lentilles, que nous allons maintenant analyser. LVII.1. Les miroirs sphériques: images réelles et virtuelles, grandissement La Fig. 174 illustre plusieurs phénomènes concernant un miroir sphérique concave, dont le rayon est r et le centre de courbure de la superficie est C. Dans la partie supérieure, on voit des rayons de lumière provenant d’une source à distance infinie par rapport au miroir (pensez par exemple aux rayons provenant du soleil, qui se trouve à une grande distance de la terre). Tous ces rayons, après avoir été réfléchis par le miroir, passent par le même point F, qui s’appelle le point focal du miroir. Le distance f entre le point F et le miroir s’appelle la distance focale de celui-ci. La concentration sur F des rayons provenant d’une source à distance infinie s’appelle focalisation. Essayons maintenant de trouver la relation entre la distance focale f et le rayon de courbure du miroir, r. Nous adopterons quelques approximations afin de simplifier le calcul. La première de celles-ci est d’appliquer la loi de réflexion (Eq. 557), que nous avons dérivée pour une superficie plane, à la superficie sphérique du miroir. On peut pourtant montrer que cette approximation fonctionne très bien si le rayon de courbure du miroir est grand par rapport à la longueur d’onde de la lumière réfléchie, ce qui est pratiquement toujours vrai pour la lumière visible. La deuxième approximation est que les rayons de lumière ne forment pas de grands angles par rapport à l’axe du miroir, ce qui implique des valeurs basses des angles θi et ^ θr. Notez alors que, l’angle PCF étant égal à θ i et les angles θ i et θ r ayant la même valeur, les deux distances CF et CP sont égales à (r/2)cosθi ≈ r/2. Donc, puisque f est égal à r moins la distance CF, on a: f ≈ r/2 . (588) La distance focale du miroir est donc approximativement la moitié de son rayon de courbure. La partie centrale de la Fig. 174 illustre la symétrie du phénomène de focalisation. Si la source est située au point focal, alors les rayons sont réfléchis dans la direction parallèle à son axe. Il s’agit d’un cas particulier d’une propriété générale: source et image peuvent changer de rôle l’une avec l’autre, ne donnant lieu qu’au renversement de la direction de propagation des rayons. La partie inférieure de la Fig. 174 montre un exemple d’analyse de la formation d’image par le miroir. La source de lumière, c’est-à-dire l’objet dont le miroir forme l’image, est la flèche S sur la gauche. On prend sa pointe, et on essaie de trouver la position de la pointe de l’image I, en analysant deux rayons particuliers: le rayon 1 parallèle à l’axe du miroir, qui après la réflexion doit arriver sur le point focal, et le rayon 2 qui passe par le centre. Celui-ci, arrivant sur le miroir dans la direction perpendiculaire à sa surface, est évidemment réfléchi dans la direction opposée à celle d’arrivée. Giorgio Margaritondo: Ma Physique 401 Le point d’intersection des deux rayons susmentionnés correspond à la position de la pointe de l’image de la flèche. On constate donc, dans ce cas particulier, que l’image I est renversée par rapport à l’objet (la flèche S), et que sa grandeur a diminué. θi P θr F C f r F C 1 S 1 2 F C I p q Fig. 174: Optique géométrique: la formation d’images par les miroirs sphériques concaves. Giorgio Margaritondo: Ma Physique 402 Essayons maintenant de généraliser la discussion en considérant les divers cas illustrés par la Fig. 175. Dans la partie supérieure, on voit la source placée dans l’intervalle entre le point focal et le centre de courbure. La construction de l’image suivant la méthode que nous venons de discuter montre que l’image I est renversée, mais cette fois elle est agrandie par rapport à l’objet S. Quelle est la position de l’image? Nous voyons, dans la partie inférieure de la Fig. 174 et dans la Fig. 175, que la distance entre l’objet et le miroir est p; il s’agit de trouver la distance q entre image et miroir, en fonction de p et des paramètres du miroir. Prenons alors la partie inférieure de la Fig. 174; en utilisant les propriétés des triangles, on trouve que le rapport de grandeur des hauteurs de I et S est égal à (r - q)/(p - r) = (2f - q)/(p - 2f). Le même rapport est (dans l’approximation de petits angles des rayons par rapport à l’axe du miroir) ≈(q - f)/f. On a donc, approximativement, (2f - q)/(p - 2f) = (q - f)/f, d’où pq - fq - fp = 0 et, après avoir divisé par (pqf): 1 1 1 2 + = = p q f r . (589) Il est facile de vérifier que la même équation est valable dans le cas de la partie supérieure de la Fig. 175. Notez également que, à la limite, si p → ∞, alors q → f = r/2, ce qui est justement la définition de la distance focale; de façon symétrique, si p → f (source dans le point focal), alors q → ∞, ce qui veut dire que les rayons deviennent parallèles à l’axe du miroir. Passons maintenant à la partie inférieure de la Fig. 175. La source se trouve entre le miroir et le point focal. On peut constater que les deux rayons utilisés pour l’analyse ne convergent pas sur un point dans la région à gauche du miroir. On peut cependant prolonger ces rayons, et on constate que la convergence a lieu dans la région à droite du miroir. L’image correspondante est agrandie et non pas renversée. On dit dans ce cas que l’image est virtuelle, tandis que dans les cas précédents on avait des images réelles. Afin de comprendre ces termes, imaginons que nous voulons visualiser pratiquement l’image. Nous pouvons, par exemple, prendre un écran (une feuille de papier peut suffire), et le placer dans la position de l’image: on voit celle-ci sur l’écran. Cette procédure est possible pour les images réelles; mais dans le cas de l’image virtuelle de la partie inférieure de la Fig. 175, la région où l’image se forme n’est pas accessible, et on ne peut pas placer l’écran dans la position de l’image. Nous pouvons cependant voir l’image avec nos yeux: ils révèlent les rayons provenant du miroir, et notre cerveau constate que leurs directions sont parfaitement égales à celles qu’on aurait si les rayons avaient été émis par une source dans la position de l’image virtuelle. Notre cerveau ne fonctionne qu’avec les rayons et leurs directions, donc il n’est pas en mesure de distinguer une image virtuelle d’une image réelle: il “voit” l’image réelle comme s’il s’agissait d’un véritable objet. D’un point de vue formel, si p < f = r/2, l’Eq. 589 implique q < 0: les distances négatives entre image et miroir correspondent à la région au-delà du miroir, et donc à des images virtuelles. Passons maintenant à l’analyse du grandissement de l’image par rapport à l’objetsource. On appelle grandissement le rapport des dimensions de l’image et de la source. Nous avons déjà vu, en analysant la partie inférieure de la Fig. 174, que la grandeur de ce rapport est égale à (2f - q)/(p - 2f); si l’on considère le renversement de l’image par Giorgio Margaritondo: Ma Physique 403 rapport à la source, on doit changer le signe de cette grandeur afin d’obtenir le grandissement, en trouvant -(2f - q)/(p - 2f). En utilisant l’Eq. 589, on trouve que cette expression est à son tour égale à f/(f - p), et donc: f grandissement = f - p . (590) S I F C p q S I C F p q Fig. 175: Formation d’images réelles et virtuelles par un miroir sphérique concave. Ce résultat est heureusement en accord avec nos conclusions précédentes: si S se trouve à gauche de C, alors p > 2f et le grandissement est négatif (renversement de l’image), tandis que sa grandeur est <1, c’est-à-dire que l’image est plus petite que l’objet-source. Si S se trouve entre C et F, alors la grandeur du grandissement est >1. Si enfin S se trouve entre F et le miroir, alors p < f et le grandissement est positif, c’est-à-dire qu’on n’a pas de renversement de l’image. Les résultats des équations 589 et 590 peuvent être formellement appliqués au cas des miroirs convexes, si l’on admet que le rayon de courbure est négatif. La Fig. 176 illustre la formation d’images dans ce cas. Notez que les deux rayons réfléchis ne convergent Giorgio Margaritondo: Ma Physique 404 pas dans ce cas, tandis que leurs prolongations convergent, donnant lieu à l’image dans la région “virtuelle” à droite du miroir. La construction géométrique montre que l’image est virtuelle, sans renversement, et plus petite que la source. Ces caractéristiques sont importantes, par exemple, dans le cas des rétroviseurs des voitures, qui sont en fait des miroirs convexes: on doit avoir une image non renversée et plus petite que la source, et on doit éviter que ces caractéristiques changent si la distance entre source et miroir diminue. Prenons maintenant l’Eq. 589 avec r < 0 et donc f < 0: on constate immédiatement que q doit également être négatif pour n’importe quelle valeur de p, et donc on a toujours des images virtuelles. Enfin, le grandissement: l’Eq. 590 avec f < 0 et p > 0 donne toujours un grandissement positif (pas de renversement) et <1, en accord avec les conclusions de l’analyse géométrique. LVII.2. Réfraction par une superficie sphérique Le deuxième phénomène-clé utilisé dans les instruments optiques est la réfraction par une superficie sphérique qui sépare deux matériaux, typiquement verre et vide (ou atmosphère). L’analyse des propriétés de ce système est similaire à celle des miroirs sphériques. Prenez la Fig. 177, illustrant le cas d’une superficie sphérique convexe. S I C F q p f r Fig. 176: Analyse de la formation d’images virtuelles par un miroir sphérique convexe. On peut constater que l’analyse de la formation des images peut se faire, comme pour les miroirs, en trouvant le parcours de deux rayons particuliers, celui qui passe par le centre de courbure et celui qui est parallèle à l’axe du système. Le premier ne change pas de direction à cause de la réfraction, puisqu’il arrive sur la superficie sphérique dans sa direction perpendiculaire. Le deuxième est réfracté dans la direction qui amène au point focal du système, dont nous allons déterminer la position ci-dessous. Les deux rayons convergent dans le deuxième matériau, donnant une image réelle, renversée et plus petite que la source. Notez cependant que la région “réelle”, dans laquelle se forment les images réelles, est la région de propagation des rayons après la Giorgio Margaritondo: Ma Physique 405 réfraction, donc celle à droite de la superficie sphérique, tandis que pour les miroirs de la Fig. 174-176. il s’agissait de la région à gauche de cette superficie. On pourrait dériver la relation entre p et q et la position du point focal en utilisant les propriétés des triangles. Mais il est peut-être plus intéressant d’utiliser le principe de Fermat. Prenons alors la source ponctuelle S de la Fig. 178, et considérons deux rayons particuliers qui partent de S et convergent sur l’image I: celui sur l’axe du système, et le rayon qui passe par le point P de la superficie sphérique. θi θt S C F I r p f q Fig. 177: Formation d’images par une interface sphérique convexe séparant deux matériaux. Le principe de Fermat exige que le chemin optique (Eq. 558) d’un rayon soit minimum. Puisque la lumière, dans le cas de la Fig. 178, peut suivre tant le parcours du premier rayon que celui du deuxième, les deux rayons doivent correspondre au minimum du chemin optique; par conséquent, leurs chemins optiques doivent être égaux. Calculons alors les deux chemins optiques. Pour le premier rayon, il est simplement n1p + n2q, où n1 et n2 sont les indices de réfraction des deux matériaux. Pour le deuxième rayon, nous utiliserons l’approximation de petits angles des rayons par rapport à l’axe, qui implique que la distance PP’ est beaucoup plus petite que p, q ou r. La distance SP est donnée par (SP’2 + PP’2)1/2 = ((p + OP’)2 + PP’2)1/2 = ((p + r - P’C)2 + PP’2)1/2 = ((p + r - (r2 - PP’2)1/2)2 + PP’ 2 ) 1/2 ≈ ((p + r - (r - PP’2/2r))2 + PP’ 2)1/2 = ((p - PP’2/2r))2 + PP’ 2 ) 1/2 ≈ (p2 - 2pPP’ 2 /2r + PP’ 2 ) 1/2 ≈ p - PP’ 2 /2r + PP’ 2/2p. Le chemin optique correspondant à cette distance est n1SP ≈ n1(p - PP’2/2r + PP’2/2p). De façon similaire, on peut montrer que le chemin optique correspondant au deuxième trait PI est ≈n2 (q + PP’2/2r + PP’2/2q), et donc le chemin optique total du deuxième rayon est ≈n1(p - PP’2/2r + PP’/2p) + n2(q + PP’2/2r + PP’2/2q). Le principe de Fermat exige donc que n1p + n2q = n1(p - PP’2/2r + PP’2/2p) + n2(q + PP’2/2r + PP’2/2q), d’où l’on obtient: Giorgio Margaritondo: Ma Physique 406 n1 n2 n2 - n1 . p + q = r (591) Cette équation donne la liaison entre la position de la source et celle de l’image, de façon similaire à ce que donnait l’Eq. 589 pour les miroirs. Notez qu’on peut immédiatement dériver la distance focale à partir de l’Eq. 591: si l’on prend p → ∞, alors q = r(n2 /(n2 - n1)); donc: f = r(n2/(n2 - n1)) , (592) et l’équation 591 peut s’écrire: n2 n2 n1 + = p q f . (593) Il faut noter que nous avons implicitement changé les règles qui gouvernent les signes des distances par rapport au cas des miroirs. Pour ceux-ci, on avait q positif si l’image était à gauche, et r positif si le centre de courbure était à gauche (miroir convexe). Pour la réfraction par la surface sphérique, q est positif si l’image est à droite, et r est positif si le centre de courbure est à droite (surface convexe). Tant pour les miroirs que pour les superficies sphériques, on admet que la source (avec p positif) est à gauche. Calculons maintenant le grandissement à l’aide de la Fig. 177. On peut facilement constater que le grandissement, c’est-à-dire le rapport des dimensions de l’image et de la source, est égal à (q - r)/(p + r). Après avoir utilisé les équations 591 et 592, et quelques passages mathématiques, on trouve que: grandissement = n1f n2p - n1f . (594) Les résultats des équations 591-594 peuvent être facilement appliqués au cas des superficies concaves, en changeant le signe du rayon de courbure. La construction des images peut se faire en suivant la procédure qui est illustrée par la Fig. 177. P r S C I O P' r p q Fig. 178: Dérivation de l’équation de la réfraction par une superficie sphérique à l’aide du principe de Fermat. Afin d’éliminer les ambiguïtés, les règles qui gouvernent les signes sont résumées cidessous, tant pour les miroirs que pour la réfraction par des superficies sphériques: Giorgio Margaritondo: Ma Physique Réflexion par un miroir sphérique r (rayon de courbure) + si le centre de courbure est à gauche p (source) + si la source est à gauche q (image) + si l’image est à gauche 407 Réfraction par une superficie sphérique + si le centre de courbure est à droite + si la source est à gauche + si l’image est à droite LVII.3. Les lentilles minces Une lentille optique est la combinaison de deux superficies sphériques, qui séparent le matériau formant la lentille et l’atmosphère. L’indice de réfraction de celle-ci est égal à l’unité, et l’on admet que l’indice de réfraction du matériau de la lentille, typiquement un verre, est n. Considérons alors la construction de la Fig. 179: cette fois, nous avons deux points focaux F1 et F2, et la construction se fait en utilisant les rayons qui passent par ces deux points. Notez que la distance focale est la même pour les deux points, comme on peut le dériver des équations des superficies sphériques. Prenons en fait les rayons qui arrivent sur la lentille dans la direction parallèle à l’axe de celle-ci. La superficie d’entrée de la lentille focalise ces rayons sur son point focal, qui se trouve à la distance dérivée en remplaçant n1 avec 1 et n2 avec n dans l’Eq. 592, c’est-àdire r1(n/(n - 1)), où r1 est le rayon de courbure de la superficie. Ensuite, le point focal de la superficie d’entrée devient la source de formation d’une image par la deuxième superficie sphérique de la lentille. Le point focal se trouve sur la droite de celle-ci, et donc on doit prendre sa distance avec le signe négatif. La position de l’image, qui est le point focal F2 de la lentille en tant qu’ensemble des deux superficies sphériques, est donnée par l’Eq. 591, avec p = -r1(n/(n - 1)), n1 = n, n2 = 1 (notez le renversement des rôles des deux indices par rapport à la première superficie sphérique), et r = r2 (notez que r2 , le rayon de courbure de la deuxième superficie, est négatif, parce que le centre de courbure est à gauche de celleci). On obtient (1/q) = (n - 1)((r2 - r1)/r1r2), qui coïncide avec le point focal de la lentille: (r2 - r1) 1 = (n 1) f r1r2 . (595) Notez qu’en dérivant cette formule, nous avons admis que les distances sont mesurées par rapport au même point tant pour la première que pour la deuxième superficie. Cela n’est pas complètement vrai, parce que les origines des deux superficies sont différentes à cause de l’épaisseur de la lentille. L’équation 595, et en général notre discussion, est valable dans la limite de lentilles minces, c’est-à-dire si l’épaisseur de la lentille est beaucoup plus petite que les autres distances en jeu (rayons de courbure, distances focales, distances de la source et de l’image). On peut également noter que la dérivation de l’Eq. 595 peut être renversée, en admettant que les rayons parallèles à l’axe arrivent de droite. On trouve que la focalisation de la lentille concentre les rayons sur le point focal F1, dont la distance de la lentille coïncide avec celle de F2. On peut donc appeler f la distance focale de la lentille sans préciser s’il s’agit du point focal à gauche ou à droite: l’Eq. 596 est toujours valable. Giorgio Margaritondo: Ma Physique 408 S F2 F1 I p f f q Fig. 179: Analyse de l’image formée par une lentille mince sphérique biconvexe. Soulignons pourtant encore une fois que, dans le calcul pratique de la distance focale d’une lentille, il faut toujours prendre les rayons de courbure avec leur signe correct, en accord avec la convention que nous avons adoptée pour les superficies sphériques. Cette convention est résumée par la Fig. 180 dans le cas des lentilles. Il faut souligner que le signe de la distance focale donnée par l’Eq. 595 peut être tant positif que négatif, selon les signes et les grandeurs des rayons de courbure. Par exemple, avec n > 1, les deux lentilles (divergentes) à droite en bas de la Fig. 180 donnent toujours f < 0. Quant à la position de l’image, on peut la dériver suivant la même procédure que pour la distance focale de la lentille: on applique deux fois la loi des superficies sphériques (Eq. 591), en utilisant l’image de la première superficie comme source pour la deuxième, toujours avec les signes spécifies par la convention sur les superficies sphériques et l’approximation de lentilles minces. En utilisant l’Eq. 595 pour la définition de la distance focale, on arrive à la célèbre équation des fabricants de lentilles: 1 1 1 + = p q f . (596) Il s’agit sur le plan purement formel de la même équation qui était valable pour les miroirs (Eq. 596), mais avec une définition différente de la distance focale et avec une convention différente pour les signes. Quant au grandissement, la Fig. 179 montre que celui-ci est donné par: f grandissement = f - p , (597) qui est encore une fois un résultat similaire à ce qui est valable pour les miroirs sphériques. LVII.4. Les aberrations La théorie des lentilles se base sur plusieurs hypothèses qui simplifient tant les dérivations que les résultats, mais qui ne sont valables que de façon approximative. Les Giorgio Margaritondo: Ma Physique 409 limites de validité de ces hypothèses causent des déviations du comportement prévu par la théorie, qu’on appelle en général aberrations. r 1>0, r2<0 |r 1|>|r2| r1 >0, r2<0 |r1|<|r2| r 1>0, r2>0 |r 1|<|r2| r 1>0, r2>0 |r1 |>|r2| r1<0, r 2<0 |r1|>|r2| r1<0, r 2<0 |r1|<|r2| r 1<0, r2>0 |r 1|<|r2| r 1<0, r2>0 |r1|>|r2 | Fig. 180: Convention des signes des rayons de courbure pour les divers types de lentilles. Par exemple, l’Eq. 596 prévoit que tous les rayons d’un faisceau provenant d’une source à distance infinie sont focalisés sur le même point focal. Ce résultat est dérivé en utilisant deux approximations: lentilles minces et faible inclinaison des rayons par rapport à l’axe. Si l’une ou l’autre de ces hypothèses n’est pas valable, alors on constate que la focalisation ne se produit pas sur le même point pour tous les rayons. Par exemple, les rayons qui arrivent au bord de la lentille (dont l’inclinaison par rapport à l’axe n’est plus négligeable) ne sont pas focalisés exactement sur le point focal de la lentille: on parle dans ce cas d’aberration sphérique. Un autre type d’aberration, qu’on appelle chromatique, est causé par le fait que l’indice de réfraction du verre qui forme la lentille change avec la longueur d’onde de la lumière. L’Eq. 595 implique alors que le point focal change d’une longueur d’onde à l’autre, c’est-à-dire d’une couleur à l’autre de la lumière. On peut éliminer partiellement cette aberration, qui cause évidement des problèmes dans les appareils photographiques, avec des lentilles combinées de verres différents, dont les effets chromatiques se compensent donnant ainsi une lentille achromatique. LVII.5. L’oeil L’oeil de l’homme et des animaux est un instrument optique à la fois très simple et très avancé. Il fonctionne en formant des images sur une superficie courbe qui révèle tant l’intensité que la couleur: la rétine. Les images sont formées par une lentille biconvexe qui s’appelle le cristallin. Afin de contrôler l’intensité de la lumière qui arrive sur la rétine, et d’éviter des phénomènes de saturation qui peuvent parfois produire la Giorgio Margaritondo: Ma Physique 410 destruction de ses éléments de détection, le cristallin est muni d’un diaphragme qui s’appelle iris. Le problème le plus délicat du point de vue technique est la nécessité de former des images dans une position q fixe (la distance cristallin-rétine) à partir d’objets dont la distance p du cristallin peut varier de quelques centimètres jusqu’à des valeurs élevées. Les équations 595 et 596 montrent clairement que, l’indice de réfraction du matériau qui forme le cristallin étant fixé, la seule solution possible est de changer les axes de courbure de la lentille. C’est précisément ce qu’on fait lorsqu’on essaie de focaliser des objets avec ses yeux: les muscles qui contrôlent le cristallin en changent la forme. Sans action des muscles, nos yeux focalisent automatiquement un point éloigné qu’on appelle punctum remotum (ah, le latin! Ne fait-il pas toujours très chic?), et qui se trouve pratiquement à l’infini pour un oeil normal. Si l’objet est plus proche du punctum remotum, on est forcé de modifier la forme du cristallin afin de le focaliser. Cela est possible jusqu’à une distance minimum dite le punctum proximum, de 25 cm environ pour un oeil normal. La vieillesse diminue la faculté d’accommodation du cristallin, donnant lieu au défaut qui s’appelle presbytie: ce problème frappe les professeurs de l’EPFL plus tôt que la moyenne à cause des efforts qu’ils font pour identifier les étudiants/es anarchistes et faiseurs/euses de bruit, qui sont assis/es le plus loin possible d’eux, afin de leur régler leurs comptes aux examens. En ce qui concerne les couleurs, il est intéressant de noter que nos yeux ne révèlent pas les diverses longueurs d’onde de la lumière avec la même efficacité. Les yeux sont très efficaces pour la détection de la lumière verte, dont la longueur d’onde est de l’ordre de 5000 Å, et moins efficaces pour le rouge ou le bleu. Nous en avons déjà mentionnée la raison dans le chapitre consacré au corps noir: le maximum d’émission du soleil en tant que corps noir se situe justement dans le vert, et les yeux sont optimisés pour la détection de la lumière du soleil. LVII.6. Le microscope Un microscope se compose, comme illustré par la Fig. 181, de deux lentilles qui s’appellent objectif et oculaire, formant des images très agrandies de l’objet. La distance focale de l’oculaire est plus grande que celle de l’objectif. L’objet à observer est placé à une distance de l’objectif un peu plus grande que la distance focale de celui-ci. L’objectif forme une image réelle, agrandie et renversée. Cette image, dont la distance de l’oculaire est plus petite que sa distance focale, devient la source de l’image finale qui est formée par celui-ci. L’image finale est alors virtuelle, toujours renversée par rapport à la source originale, et fortement agrandie. Le grandissement total du microscope est le rapport de la grandeur de l’image finale et de la source originale. Il est évident qu’il s’agit du produit des grandissements des deux lentilles, qu’on peut calculer à l’aide de l’Eq. 597. Notez p1 la distance entre la source et l’objectif, et D la distance entre objectif et oculaire. Le grandissement de l’objectif est f1/(f1 - p1). La distance entre l’objectif et l’image intermédiaire formée par celui-ci est (voir l’Eq. 596) p1 f1 /(p 1 - f1 ), et donc l’image intermédiaire se trouve à la distance D - p1f1/(p1 - f1) par rapport à l’oculaire. Giorgio Margaritondo: Ma Physique 411 Le grandissement de celui-ci est, par conséquent et en utilisant encore une fois l’Eq. 597, f2/(f2 - (D - p1f1/(p1 - f1))) = f2(p1 - f1)/((f2 - D)(p1 - f1) + p1f1). Le grandissement total du microscope est alors (f1/(f1 - p1))(f2(p1 - f1)/((f2 - D)(p1 - f1) + p1f1)) = -f1f2/((f2 - D)(p1 f1) + p1f1), qui est négatif et augmente de grandeur si (p1 - f1) diminue. f' f f' f S F2 F1' F1 I' objectif F2' I oculaire p1 D Fig. 181: Microscope optique. Sur le plan pratique, l’efficacité de la détection de petits objets peut être définie tant par le grandissement que par un autre paramètre qu’on appelle grossissement (voir la Fig. 182). L’idée du grossissement se base sur le fait que la détection d’un petit objet a lieu dans l’oeil qui se trouve près de l’oculaire: ce qui compte réellement est le rapport des dimensions des images formées par le cristallin sur la rétine, à partir de l’objet original et de l’image formée par le microscope. Ce rapport est approximativement égal au rapport des angles sous lesquels l’oeil voit l’objet et l’image créée par le microscope: α’ grossissement ≈ α . (598) La géométrie d’un microscope est déterminée par des contraintes pratiques; par exemple, on essaie de former l’image finale à une distance de l’oculaire, et donc de l’oeil de l’observateur, qui correspond approximativement au punctum proximum de celui-ci, 25 cm environ. Cette contrainte fixe les distances entre la source et les lentilles et donc le grandissement et le grossissement, qu’on peut changer seulement en changeant les distances focales des lentilles. Notons que les performances d’un microscope sont limitées par les effets de diffraction. Supposons, par exemple, un échantillon avec deux objets ponctuels séparés par une petite distance δ: peut-on les distinguer l’un de l’autre à l’aide d’un microscope? La réponse dépend de plusieurs facteurs. Chaque lentille, et plus spécifiquement l’objectif, se comporte comme un trou, donnant lieu à des phénomènes de diffraction. Ceux-ci donnent une divergence des rayons qui passent par le “trou”, et une augmentation de Giorgio Margaritondo: Ma Physique 412 la largeur pratique des images des objets. Si, à cause de cette augmentation, la largeur devient plus grande que δ, on n’arrive plus à distinguer un objet de l’autre. oculaire objectif oeil rétine α S α' I cristallin Fig. 182: Définition du grossissement d’un microscope. L’analyse des phénomènes de diffraction nous a montré que la divergence angulaire produite par ceux-ci est de l’ordre de λ/2d, où d est la dimension du “trou”, c’est-à-dire dans ce cas la largeur de la lentille, et λ est la longueur d’onde de la lumière. Celle-ci étant fixée par le fait qu’on travaille avec la lumière visible, on peut améliorer les performances du microscope en augmentant la dimension des lentilles, qui sont pourtant limitées par des facteurs pratiques. L’autre possibilité consiste à remplacer la lumière visible par d’autre types de rayons de longueur d’onde moins élevée, notamment les rayons x, ou les faisceaux d’électrons. Ceux-ci donnent en fait lieu à des phénomènes ondulatoires qui sont justifiés par la mécanique quantique, et se comportent comme si les électrons possédaient une longueur d’onde dont la grandeur typique dans le cas des microscopes électroniques est moins grande que celle de la lumière visible. LVII.7. Le télescope astronomique L’objectif de cet instrument, qui est illustré par la Fig. 183, est de créer une image agrandie et virtuelle à partir d’un objet-source qui est très éloigné. oculaire objectif S F 1' F2 F1 I Fig. 183: Un type simple de télescope. I' F2' Giorgio Margaritondo: Ma Physique 413 Ce résultat peut être atteint en utilisant toute une série d’instruments divers, qui se basent tant sur des lentilles que sur des miroirs ou des combinaisons de miroirs et lentilles. La Fig. 183 illustre un des plus simples de ces systèmes, formé par deux lentilles qui, comme pour le microscope, s’appellent oculaire et objectif. Celui-ci forme une image réelle et renversée, à dimensions réduites, de la source. L’oculaire prend cette image intermédiaire et la transforme, en donnant une image virtuelle, encore renversée et fortement agrandie. Le renversement n’est pas important pour les applications pratiques, qui concernent principalement les objets astronomiques. La distance des deux points focaux F2 et F1 ’ est petite. On peut alors calculer le grossissement α’/α dans la limite F2 ≡ F1’; si en plus on considère comme infinie la grande distance entre la source et le télescope, on peut montrer que: f grossissement ≈ - f ’ , (599) où le signe négatif est causé par le renversement de l’image. Le Coin Yankee: Optique géométrique Miroir sphérique Point focal Distance focale Image réelle (virtuelle) Lentille (mince) Aberration Aberration sphérique, Aberration chromatique Microscope Oculaire Objectif Télescope Geometrical optics Spherical mirror Focal point Focal distance Real (virtual) image (Thin) lens Aberration Spherical aberration Chromatic aberration Microscope Eyepiece Objective Telescope “For example, the rays arriving at the edge of the lens (whose inclination with respect to the axis is no longer negligeable) are not exactly focalized on the focal point of the lens: one calls this a spherical aberration. Giorgio Margaritondo: Ma Physique 414 LVIII. Interaction de la lumière avec la matière La dérivation des équations de Fresnel nous a permis de trouver la relation entre les ondes réfractée et réfléchie à l’interface de deux matériaux. Le phénomène peut pourtant être plus complexe: à la réflexion et à la réfraction peuvent s’ajouter la diffusion et l’absorption. Dans le premier cas, l’onde continue à voyager tant dans le premier que dans le deuxième matériau, mais pas seulement dans les directions prévues par les lois de réflexion et de réfraction: son intensité est distribuée dans toutes les directions. Quant à l’absorption, ce phénomène provoque l’élimination d’une partie de l’intensité de l’onde: l’énergie correspondante est transformée et se retrouve dans le matériau sous une autre forme. Tous ces phénomènes ont lieu au niveau des électrons dans les atomes et les molécules. Par conséquent, leurs descriptions exigent le traitement des propriétés de ces électrons, ce qui à son tour exige l’utilisation de la branche de la physique moderne qui s’appelle mécanique quantique. Nous essayerons de présenter ici des idées plus simplifiées, qui sans arriver au traitement quantique justifient quelques-uns des principes gouvernant l’interaction entre lumière (rayonnement électromagnétique) et matière. LVIII.1. Emission Commençons par le phénomène de l’émission d’ondes électromagnétiques. Nous pouvons arriver immédiatement à son principe fondamental: l’émission d’ondes électromagnétiques ne peut avoir lieu que si des charges électriques sont accélérées. En fait, l’émission ne peut pas être causée par des charges immobiles: nous avons vu que les ondes électromagnétiques sont la propagation de perturbations du champ électromagnétique, c’est-à-dire de variations du champ en fonction du temps; mais des charges sans mouvement ne donnent qu’un champ électrostatique, donc sans changements en fonction du temps. Prenons maintenant une charge électrique q en mouvement, comme montré par la partie supérieure de la Fig. 184. Si la vitesse v de la charge ne change pas avec le temps, c’est-à-dire si la charge n’est pas accélérée, alors la charge n’émet pas non plus d’ondes électromagnétiques. En fait, si nous changeons de référentiel en prenant celui qui se déplace avec la charge, celle-ci n’a plus de mouvement et donc elle ne peut pas émettre d’ondes électromagnétiques. Considérons maintenant l’énergie qui aurait été émise sous la forme d’une éventuelle onde électromagnétique: elle est évidemment nulle dans le référentiel de la charge, et également nulle dans le référentiel original pour les directions perpendiculaires à l’axe x, qui ne sont pas concernées par le mouvement de la charge. Quant à la direction de l’axe x, notons qu’il s’agit également de la direction du champ électrique de la charge. On ne peut donc pas avoir des ondes électromagnétiques émises par celle-ci dans la directions x, vu que les ondes électromagnétiques sont transversales et doivent toujours avoir des champs perpendiculaires à la direction de propagation. L’énergie qui se propage dans la direction x est simplement celle de la charge qui se déplace avec son champ électrostatique, et ne correspond pas à une onde électromagnétique transversale. On est donc forcé de conclure qu’une charge qui se déplace à vitesse constante n’émet pas d’ondes électromagnétiques. Cette conclusion est valable tant pour la physique classique que pour la théorie de la relativité restreinte, vu que le mouvement de la charge et de son référentiel a lieu à vitesse constante. Giorgio Margaritondo: Ma Physique 415 Le résultat change pourtant en ce qui concerne la relativité restreinte si la charge et son référentiel sont accélérés. On peut démontrer que la charge accélérée émet des ondes électromagnétiques, et que l’intensité émise est proportionnelle au carré de l’accélération: Intensité émise ∝ a2 . (600) x v q P y x -q δ(t) +q P r y Fig. 184: Analyse de l’émission d’ondes électromagnétiques par une charge électrique en mouvement (en haut) et d’un dipôle qui change avec le temps (en bas). Nous analyserons ce résultat, sans le dériver en général, dans le cas particulier d’un courant sur un fil droit, qui a été illustré par la Fig. 109. Le champ magnétique est donné par l’Eq. 378: µo i B= , 2π r qui ne prévoit pas de changement du champ si le courant ne change pas par rapport au temps. Afin de simplifier l’analyse, admettons que le courant correspond à un flux de charges qui se déplacent toutes à la même vitesse v; celle-ci est liée à la densité de courant par l’Eq. 368: Giorgio Margaritondo: Ma Physique 416 j = nqv ; par conséquent, si les charges ne sont pas accélérées, alors leur vitesse est constante, ainsi que la densité de courant et le courant: on retrouve le même résultat que précédemment, à savoir que sans accélération des charges on n’a pas de changement du champ électromagnétique du type qui correspond aux ondes électromagnétiques. Si par contre la vitesse v change par rapport au temps, on a une variation du champ B, et on peut réaliser que la partie du champ qui change avec le temps, et donc correspond à une onde électromagnétique, est proportionnelle à la variation du courant par rapport au temps et par conséquent à l’accélération. Puisque l’intensité émise est proportionnelle au carré du champ magnétique de l’onde, on peut également réaliser que l’intensité est proportionnelle au carré de l’accélération, comme prévu par l’Eq. 600. LVIII.2. Emission par un dipôle oscillant Passons maintenant à l’analyse d’un type de phénomène d’émission d’ondes électromagnétiques d’importance fondamentale, illustré par la partie inférieure de la Fig. 184. On voit un dipôle électrique formé par deux charges +q et -q à la distance δ. Celle-ci change avec le temps à cause du mouvement de la charge -q; notons que ce mouvement ne peut pas avoir lieu sans accélération si la distance des deux charges doit demeurer limitée. Calculons maintenant le champ électrique causé par le dipôle au point P, dont la distance du dipôle est beaucoup plus grande que la distance entre ses deux charges: r >> δ. La grandeur des champs causés par les deux charges dans la direction x est approximativement la même, mais leurs directions sont opposées; donc, le champ dans cette direction est approximativement nul. Quant à l’axe y, la charge positive ne donne pas de champ dans cette direction. Par contre, la charge négative a une composante y, dont la grandeur est donnée par celle du champ de la charge -q, multipliée par le sinus de l’angle entre la direction qui lie -q et P, et l’axe y. Admettons maintenant que le mouvement accéléré de la charge -q soit du type oscillatoire à pulsation ω , x = x o sin( ω t). L’accélération de ce mouvement est proportionnelle à ω 2 ; par conséquent, l’intensité émise sous la forme d’ondes électromagnétiques est proportionnelle à la quatrième puissance de la fréquence (pulsation): Intensité émise ∝ ω4 . (601) On peut compléter cette analyse en considérant l’émission d’ondes non pas seulement dans la direction perpendiculaire au dipôle, mais dans une direction qui forme un angle θ par rapport à celui-ci (voir la Fig. 185). On peut constater que l’intensité est proportionnelle au carré de la composante du dipôle dans la direction perpendiculaire à celle de l’angle θ. On trouve par conséquent que: Intensité émise ∝ (sin2θ)ω4 . (602) Giorgio Margaritondo: Ma Physique 417 La Fig. 185 montre le diagramme polaire de cette fonction. On constate que l’intensité émise est maximum dans la direction perpendiculaire au dipôle, et nulle dans la direction parallèle à celui-ci. Sur le plan pratique, ce résultat s’applique à l’émission d’ondes par une antenne radio, qui se comporte approximativement comme un dipôle. L’émission est maximum dans la direction perpendiculaire à l’antenne, donc il faut orienter une antenne réceptrice dans la même direction. intensité émise θ dipôle Fig. 185: Diagramme polaire de l’intensité des ondes électromagnétiques émises par un dipôle oscillant. L’idée d’émission par un dipôle oscillant s’applique également à l’émission de lumière par les électrons dans les atomes. L’ensemble d’un atome est neutre comme le dipôle de la Fig. 184, mais le mouvement de ses électrons peut donner un dipôle oscillant et donc entraîner l’émission d’ondes électromagnétiques. Ce phénomène est pourtant de nature quantique, et exige une description sur la base, par exemple, du modèle d’atome de Bohr. Ce modèle prévoit l’émission d’ondes électromagnétiques quand un électron change son énergie quantifiée, qui correspond à une des trajectoires permises par les règles de quantification, d’un niveau quantique à l’autre. La théorie du phénomène montre qu’il existe une équivalence de base entre le phénomène quantique de changement de niveau d’énergie et le phénomène classique d’un électron qui se comporte comme une charge en oscillation. LVIII.3. L’absorption, la diffusion et la loi de Rayleigh Nous utiliserons maintenant le résultat concernant l’émission des dipôles oscillants afin de comprendre certains des phénomènes de diffusion de la lumière, par exemple ceux qui donnent la couleur bleue du ciel. Imaginons alors les rayons du soleil qui arrivent sur l’atmosphère de la terre. On peut imaginer que la diffusion de ces rayons se compose de deux phénomènes: d’abord, le rayon est absorbé par les molécules de l’atmosphère. Ensuite, celles-ci émettent l’énergie absorbée sous la forme d’ondes de lumière. Notez que l’émission n’a pas lieu, en général, dans la même direction que le rayon original, d’où le fait que la lumière est diffusée. Giorgio Margaritondo: Ma Physique 418 Essayons alors de modéliser la combinaison des deux phénomènes, en imaginant que les électrons des molécules sont forcés par l’absorption de la lumière à se comporter comme des dipôle oscillants, qui donnent donc lieu à l’émission de lumière. Le modèle est illustré par la Fig. 186. On admet qu’à l’équilibre, la distribution des charges électriques des électrons et des noyaux à l’intérieur de la molécule ne donne pas de dipôle. Quand la molécule est frappée par l’onde électromagnétique d’un rayon de lumière, la force de son champ électrique tend à déplacer tant les charges négatives des électrons que les charges positives des noyaux. La masse de ceux-ci est pourtant très élevée, et on peut imaginer que l’onde n’est pas en mesure de les déplacer. L’onde peut pourtant déplacer les électrons, qui sont beaucoup moins lourds. Les forces à l’intérieur de chaque atome tendent à s’opposer au déplacement de l’équilibre antérieur. On modélise ces forces pour chaque électron à l’aide d’un ressort qui le lie à un point fixe. On a donc un oscillateur élastique soumis à une force externe, dont les propriétés ont été analysées dans le cours de mécanique. La force du ressort est -kδ, où k est la constante de rappel et δ est le déplacement de l’électron par rapport à l’équilibre. Sans force externe, cette force produit des oscillations à la fréquence (pulsation) propre ω o = (k/m)1/2 , où m est la masse de l’électron. La force externe du champ de l’onde, qu’on imagine arriver sur l’électron dans la direction perpendiculaire au ressort, peut s’écrire -eE o sin( ω t), où ω est la fréquence de l’onde. L’équation de Newton est alors: m d2δ = -kδ - eEosin(ωt) , dt2 (603) dont la solution donne un mouvement oscillatoire du type: δ = δosin(ωt) , (604) noyau électron - + δ ressort Fig. 186: Modèle classique utilisé pour justifier l’absorption de lumière par les atomes et les molécules. Giorgio Margaritondo: Ma Physique 419 le déplacement maximum δo étant: δo = e2Eo . m(ωo2 - ω2) (605) Le déplacement δ de l’électron cause un dipôle (oscillant) de grandeur eδ. A son tour, ce dipôle oscillant entraîne l’émission d’ondes électromagnétiques de fréquence ω , dont l’intensité est proportionnelle au carré de la grandeur du dipôle et (voir l’Eq. 602) à la quatrième puissance de la fréquence. En utilisant l’Eq. 605 on a: Intensité diffusée ∝ ω4 . (ωo2 - ω2)2 (606) Prenons le cas spécifique de la diffusion de la lumière par l’atmosphère: les fréquences propres ω o des atomes sont de l’ordre de 1016 Hz, beaucoup plus élevées que les fréquences ω de la lumière visible, typiquement de l’ordre de 1015 Hz; donc (ωo2 - ω2) ≈ ωo2: on appelle le phénomène correspondant la diffusion de Rayleigh. L’Eq. 606 implique alors que l’intensité diffusée du type Rayleigh est approximativement proportionnelle à ω 4 . On a par conséquent beaucoup plus de diffusion pour les fréquences élevées que pour les fréquences faibles; dans le cas de la lumière, plus de diffusion pour le bleu que pour le rouge. Puisque la couleur du ciel est donnée par la diffusion des rayons du soleil par l’atmosphère, on justifie de cette façon sa couleur bleue. Par contre, quand le soleil se couche on observe plus directement sa lumière non diffusée, ce qui justifie le changement de couleur par rapport au bleu qu’on observe pendant le jour. LVIII.4. Le coefficient d’absorption La description de la diffusion du type Rayleigh nous amène à l’idée d’absorption, un phénomène qui s’ajoute aux autres interactions matière-lumière que nous avons déjà rencontrées. Si l’on considère encore une fois la Fig. 169, on doit donc considérer une troisième possibilité qui s’ajoute à la réflexion et à la réfraction de l’onde incidente: celleci peut être absorbée tant par le premier que par le deuxième matériau, en lui cédant au moins une partie de son énergie. Dans un cas réaliste, tous ces phénomènes sont présents simultanément, et jouent un rôle plus ou moins important selon les caractéristiques des matériaux, de leur interface et de l’onde. L’absorption est spécifiquement caractérisée par le coefficient d’absorption du matériau, que nous allons définir maintenant. Prenons une onde plane monochromatique du type de l’Eq. 430, qui se propage dans la direction positive de l’axe z: E x = E xo sin(kz - ω t). Afin de simplifier l’analyse mathématique, nous remplacerons la fonction sinusoïdale par une fonction exponentielle complexe: Ex = Exoexp(j(kz - ωt)) = Exoexp(jkz) exp(-jωt)) = [vu l’Eq. 554] = Exoexp(jωnz/c) exp(-jωt)) , où n est l’indice de réfraction du matériau où l’onde se propage. (607) Giorgio Margaritondo: Ma Physique 420 Admettons maintenant que l’indice de réfraction n’est pas une quantité réelle, mais complexe, et donc qu’il se décompose d’une partie réelle et d’une partie imaginaire: n = nR + jnI ; (608) l’Eq. 607 devient alors: Ex = Exoexp(-ωnIz/c) exp(j(ω(nRz/c - t)) . (609) Essayons d’analyser cette équation: le deuxième facteur est une fonction exponentielle imaginaire, qui correspond donc à des fonctions sinusoïdales réelles; il s’agit simplement d’une onde qui se propage sur l’axe z à la vitesse c/nR. Par contre, le premier facteur est une fonction exponentielle réelle, -ωnIz/c, ce qui ne donne pas une fonction oscillante, mais une décroissance monotone exponentielle quand la valeur de z augmente. Ce facteur module, par conséquent, la grandeur de l’onde Exoexp(j(ω(nRz/c - t)) qui se propage, en la diminuant progressivement: il s’agit du phénomène d’absorption d’une partie de l’onde par le matériau où la propagation a lieu. Le résultat de l’absorption est illustré par la Fig. 187, qui montre une onde se propageant dans la direction z et qui est progressivement absorbée par le matériau dans lequel elle voyage, de sorte que sa grandeur diminue. Onde z Fig. 187: Une fonction du type de l’Eq. 609 correspond à une onde oscillante qui est progressivement absorbée par le matériau où la propagation a lieu, et dont la grandeur diminue de façon monotone sur l’axe z. La figure illustre spécifiquement la partie réelle du facteur exponentiel complexe à un temps fixe, multiplié par le facteur d’absorption. L’intensité I de l’onde, étant proportionnelle au carré de son champ électrique, diminue également sur l’axe z; puisque l’énergie doit se conserver, on doit en conclure que l’énergie perdue par l’onde doit être absorbée par le matériau. En prenant le carré du champ défini par l’Eq. 609, on trouve que: I(z) = Ioexp(-2ωnIz/c) , (610) où Io est évidemment l’intensité au point z = 0. En notant: α = 2ωnI/c le coefficient d’absorption du matériau, on peut écrire: (611) Giorgio Margaritondo: Ma Physique 421 I(z) = Ioexp(-αz) ; (612) la rapidité de la diminution d’intensité sur l’axe z causée par l’absorption dépend de la grandeur du coefficient d’absorption; à son tour, celui-ci dépend de la composition chimique du matériau, de sa structure et d’autres propriétés. Notez que si l’on prend le logarithme de l’Eq. 612 et qu’on calcule la dérivée, on a: dI(z) = -αdz ; I(z) (613) l’interprétation de cette équation est la suivante: le changement relatif d’intensité de l’onde, dI(z)/I(z), est négatif puisqu’il s’agit d’une diminution, et constant pour chaque trait infinitésimal dz; l’importance de cette diminution est déterminée par le coefficient d’absorption α. Le Coin Yankee: Diffusion Diffusion de Rayleigh Emission Absorption Coefficient d’absorption Rayleigh Scattering scattering Emission Absorption Absorption coefficient “For example, the rays arriving at the edge of the lens (whose inclination with respect to the axis is no longer negligeable) are not exactly focalized on the focal point of the lens: one calls this a spherical aberration. Le coin des unités et des ordres de grandeur: Coefficient d’absorption Unités SI m-1 Autres unités cm-1 Ordres de grandeur: Le coefficient d’absorption peut varier énormément d’un matériau à l’autre et d’une fréquence à l’autre de l’onde absorbée, comme on peut le constater si l’on considère, par exemple, la grande absorption de la lumière d’une couleur donnée par un verre de la même couleur, qui devient très faible pour la lumière d’une autre couleur. Pour un matériau transparent, a est donc négligeable, tandis qu’il atteint des valeurs très grandes (de l’ordre de 108 m -1 ou plus), par exemple, pour l’absorption des rayons x par les solides. Giorgio Margaritondo: Ma Physique 422 LIX. Autres types de phénomènes ondulatoires La théorie des ondes électromagnétiques nous fournit les instruments pour traiter une série d’autres phénomènes ondulatoires, tels que les vibrations des solides, les ondes sonores dans les gaz, les ondes à la superficie des liquides, etc. La similarité mathématique est la clé de tous ces problèmes, qui permet d’exporter les solutions et l’étude des propriétés d’un phénomène à l’autre, avec bien sûr les changements nécessaires. Dans le cas des ondes électromagnétiques, une grande partie des propriétés physiques importantes dérivent des propriétés mathématiques des équations des ondes (Eq. 505), soit: ∇2E - µoεo ∂2E = 0 . ∂ t2 Il est clair que tout phénomène gouverné par une équation de la même structure mathématique que l’Eq. 505 doit avoir des propriétés similaires à celles du champ électromagnétique, par exemple la propagation ondulatoire des perturbations, qui à son tour donne lieu à la réflexion, à la réfraction, à l’absorption, à la diffusion, etc. LIX.1. Ondes longitudinales Il importe pourtant de ne pas généraliser cette conclusion: les similarités ne sont pas absolues, et on a également des différences entre les phénomènes ondulatoires. La plus importante est que la propagation ondulatoire concerne des quantités physiques différentes: le champ électromagnétique pour les ondes électromagnétiques, ou bien la densité du gaz pour les ondes sonores, etc. On remarque aussi que le caractère transversal des ondes électromagnétiques n’est pas généralisé aux autres ondes, qui peuvent être tant transversales que longitudinales, c’est-à-dire concernant une quantité dans la direction de propagation de l’onde et non pas dans la direction perpendiculaire à celle-ci. La figure 188 illustre, par un exemple concret, la différence entre ondes longitudinales et ondes transversales. La partie supérieure de la figure illustre un cas classique d’ondes transversales non électromagnétiques: les ondes qui propagent la perturbation de la hauteur de la surface d’un liquide, par exemple l’eau d'un lac dans laquelle on jetterait une pierre. Il est évident qu’il s’agit d’ondes transversales, puisque la hauteur est perpendiculaire à la direction de propagation de la perturbation. Par contre, la partie inférieure de la Fig. 188 illustre un cas d’ondes longitudinales: en frappant l'extrémité d’un solide, on crée une déformation élastique locale de celui-ci. Cette perturbation ne demeure pas localisée, mais se propage de façon ondulatoire. La déformation concerne la direction dans laquelle a lieu la propagation, et on a par conséquent une onde longitudinale. Afin de démontrer l’existence des ondes longitudinales de déformation dans le barreau solide, considérons la Fig. 189 et la tranche d’épaisseur infinitésimale qui se trouve entre les coordonnées z et z + dz. Admettez qu’à cause de l’onde créée par le marteau le plan d’atomes qui se trouve à z est soumis au temps t à un déplacement ξ(z,t). La loi de Hooke prévoit que le déplacement ξ(z,t) correspond à une force élastique SE(∂ξ/∂z), où S est la section du barreau et E son module de Young. La force nette sur la tranche d’épaisseur dz est alors la différence des forces à z et à z + dz, soit SE(∂(∂ξ/∂z)/∂z)dz = SE(∂2ξ/∂z2)dz. Giorgio Margaritondo: Ma Physique 423 Cette force cause l’accélération (∂2ξ/∂t2) de la tranche d’épaisseur dz. La masse de celleci étant ρSdz, où ρ est la densité du solide, on a: SE(∂2ξ/∂z2)dz = (ρSdz)(∂2ξ/∂t2), et par conséquent: ∂2ξ ∂2ξ (ρ/E) = 0; ∂z2 ∂t2 (614) cette équation a la même structure mathématique que l’équation d’onde (505 et 506) pour les ondes électromagnétiques, et ses solutions ont par conséquent des propriétés similaires; notez pourtant que la quantité concernée n’est plus le champ électromagnétique mais la déformation ξ. onde transversale: pierre lac propagation onde longitudale: solide propagation Fig. 188: En jetant une pierre dans le lac, on crée des ondes transversales qui concernent la hauteur de sa surface. Par contre, la partie inférieure de la figure illustre des ondes longitudinales concernant une déformation élastique à l'intérieur d’un solide, créée en frappant avec un marteau une extrêmité de celui-ci. On peut donc immédiatement prévoir la propagation ondulatoire de la déformation et des phénomènes tels que réflexion, réfraction, absorption etc., similaires à ceux que nous avons traités pour les ondes électromagnétiques. En comparant les équations 614 et 505, on trouve que la célérité de propagation de l’onde de déformation est (E/ρ)1/2. Pour l’acier, par exemple, ρ = 7,8 × 103 kg/m3 et E = 2,2 × 1011 N/m2 , donc la célérité est de l’ordre de 5000-6000 m/s. Pour le béton, la célérité est également élevée; par contre, pour des matériaux tels que le bois, elle Giorgio Margaritondo: Ma Physique 424 diminue de presque un ordre de grandeur, parce que même si la densité diminue d’un ordre de grandeur par rapport aux métaux, le module de Young diminue de trois ordres de grandeur. LIX.2. Ondes acoustiques: équation de Newton Passons maintenant à la dérivation de l’équation d’onde concernant les phénomènes acoustiques, soit la propagation des perturbations de la pression et de la densité des gaz. La dérivation sera faite pour le cas spécifique illustré par la Fig. 190: un très long cylindre rempli de gaz parfait et muni à une extrémité d’un piston P, avec lequel on peut créer des perturbations de pression. Celles-ci ne peuvent pas demeurer localisées, mais sont forcées à se propager. z z + dz axe z Fig. 189: Dérivation de l’équation d’onde pour les déformations dans un barreau solide. Imaginons alors une tranche du cylindre, d’épaisseur infinitésimale dz, à la position z. A l’arrivée de l’onde, la pression du gaz change par rapport à la situation d'équilibre, et on a une différence de pression dp = p(z) - p(z + dz) = - (dp/dz)dz entre les deux superficies qui terminent la tranche. Cela correspond à une force nette Sdp, où S est la section du cylindre, qui cause le mouvement des atomes du gaz dans la tranche. Si l'on appelle ξ le déplacement de ceux-ci, et donc ∂2ξ/∂t2 leur accélération, on a (ρoSdz) (∂2ξ/∂t2) = - Sdp , où ρo est la densité du gaz dans la tranche (qu'on suppose approximativement égale à la densité d'équilibre avant l'arrivée de l'onde) et (ρoSdz) sa masse; par conséquent: ρo ∂2ξ dp = - dz . ∂t2 (615) D'autre part, le déplacement n'est pas exactement le même pour les deux superficies de la tranche: ξ(z) ≠ ξ(z + dz); cette différence comporte un changement de volume de la tranche de dV = S(ξ(z + dz) - ξ(z)) = S(dξ/dz)dz par rapport au volume Vo à l'équilibre avant l'arrivée de l'onde. Le changement relatif est dV/V o = (S(dξ/dz)dz)/(Sdz) = (dξ/dz). Admettons que la transformation qui cause le changement de volume est du type adiabatique, puisque la transmission de chaleur est limitée à l'intérieur du gaz. On peut donc utiliser l'Eq. 217: dV dp γ V = p , Giorgio Margaritondo: Ma Physique 425 qui dans ce cas devient dp = -γ po(dξ/dz), où po est la pression d'équilibre avant l'arrivée de l'onde. On a par conséquent (dp/dz) = -γpo(d2ξ/dz2), ce qui avec l'Eq. 615 donne: ∂2ξ ∂2ξ (ρ /γp ) = 0; o o ∂z2 ∂t2 (616) on a ainsi trouvé, une fois de plus, une équation dont la structure mathématique est celle des équations d'onde, telle que l'Eq. 614. z z + dz P axe z Fig. 190: Dérivation de l’équation d’onde de Newton pour un cylindre rempli de gaz parfait. On est alors en mesure de conclure que la perturbation causée par le piston se propage de façon ondulatoire dans le cylindre, et que la célérité de cette propagation est: u = (γpo/ρo)1/2. (617) Dans le cas spécifique de la propagation du son dans l'atmosphère, on a po ≈ 105 N/m2, ρo ≈ 1,2 kg/m3, et γ ≈ 7/5 = 1,4, et donc u ≈ 3,4 × 102 m/s. Il faut noter que le rapport po/ρo, qui détermine la vitesse du son, ne dépend que de la température. La relation quantitative entre la vitesse du son et la température est u ≈ (331,4 + 0,607t) m/s, où t est la température mesurée en degrés Celsius. A la température ambiante de t ≈ 25 C, on a u ≈ 346,5 m/s. LIX.3. Notions pratiques d'acoustique La similarité formelle des équations d’onde du champ électromagnétique et du son dans l’atmosphère (ainsi que d’autres phénomènes ondulatoires) nous permet, comme déjà mentionné, de transférer les résultats théoriques d’un domaine à l’autre. On peut alors prévoir pour le son des phénomènes de réflexion, de réfraction, de diffraction et d’interférence, et envisager des propriétés telles que la longueur d’onde et la fréquence des ondes sonores du type sinusoïdal. On peut retrouver, en particulier, le phénomène d’absorption, qui était gouverné dans le cas des ondes électromagnétiques par les équations 612 et 613. La perte d'énergie correspondante subie par l’onde est justifiée par exemple par le chauffage de l’atmosphère et des corps frappés par celle-ci. On note, par exemple, que quand nous “écoutons” un son, nous utilisons pratiquement une partie de l’énergie de l’onde correspondante afin de produire des vibrations de la membrane de nos oreilles: l’énergie de l’onde sonore devient donc énergie mécanique. Giorgio Margaritondo: Ma Physique 426 On observe également que le transfert d'information, par les ondes sonores comme par les ondes électromagnétiques, correspond toujours à un transfert d’énergie. L’absorption d’une onde sonore par l’atmosphère est caractérisée par le coefficient d'atténuation, dont la définition est presque équivalente à celle du coefficient d’absorption des ondes électromagnétiques, à l’exception d’un facteur 2; la diminution d’intensité en fonction du chemin z de l’onde, qui pour les ondes électromagnétiques était donné par l’Eq. 612: I(z) = Ioexp(-αz) , s'écrit, dans le cas des ondes sonores: I(z) = Ioexp(-2αz) ; (618) la diminution relative d’intensité (Eq. 613 pour les ondes électromagnétiques) devient: dI(z) = -2αdz . I(z) (619) La grandeur du coefficient d'atténuation α pour l’atmosphère change rapidement avec la fréquence du son; on constate également que l'atténuation change avec les conditions de l‘atmosphère. La Fig. 191 illustre le coefficient d'atténuation en fonction de la fréquence pour deux conditions atmosphériques différentes. Notons les unités de mesure du coefficient d'atténuation dans la Fig. 191: dB par 100 m, où “dB” signifie “décibel”. Celui-ci est une unité de mesure de l'atténuation de l’intensité sonore, dont la définition est la suivante: si l’on admet que l’intensité diminue de I1 à I2 < I1, alors la diminution en décibels est -10 log10(I2/I1). On peut facilement constater que cette définition nous permet de mesurer le coefficient d’atténuation en décibels divisés par une longueur, comme on le voit dans la Fig. 191. Le décibel peut être également utilisé pour des mesures d’intensité et non pas d'atténuation, en adoptant une intensité de référence IR = 10-12 W/m2: Intensité en décibels = 10 log10(I/IR) . (620) La justification de la définition du décibel est pratique: l’intensité de référence IR est l’intensité minimum qu’une oreille humaine moyenne peut détecter à la fréquence de 2000 Hz. On utilise une échelle logarithmique et non pas linéaire dans la définition du décibel parce que l’oreille humaine réagit à l’intensité de façon logarithmique, ce qui nous permet de détecter des sons sur un grande intervalle d’intensité. LIX.3.1. La fréquence des ondes acoustiques L’importance des ondes sinusoïdales, soit à une seule fréquence, est liée tant au théorème de Fourier qu’aux propriétés physiques correspondant à la fréquence. Nous avons vu que le théorème de Fourier nous fournit le moyen d’analyser la réponse d’un système physique à une perturbation quelconque, en analysant sa réponse aux ondes sinusoïdales en fonction de la fréquence de celles-ci. Giorgio Margaritondo: Ma Physique 427 Ce fait fondamental, que nous avons rencontré pour la première fois dans le cas des ondes électromagnétiques (la fréquence correspondant à la couleur dans le cas de la lumière), se retrouve pour les ondes acoustiques. Pour celles-ci, la fréquence correspond au ton: aux plus hautes fréquences on trouve les sons aigus, aux basses fréquences les sons graves. Coefficient d'atténuation (dB/100 m) 5 Brouillard 4 3 2 15 C, 75% humidité 1 0 0 2000 4000 6000 8000 Fréquence (Hz) Fig. 191: Coefficient d'atténuation de l’intensité du son pour deux conditions atmosphériques, en fonction de la fréquence. Une onde sonore parfaitement sinusoïdale correspond à ce qu’on appelle un son pur. Si l’on analyse le son produit par un instrument de musique, en faisant sa décomposition en ondes de Fourier, on constate que celui-ci n’est pas un son pur: il s’agit d’une fonction périodique, mais la composante de Fourier à la fréquence fondamentale ν est superposée aux composantes harmoniques, qui ont des fréquences du type nν, n étant un entier. La superposition des harmoniques donne ce qu’on appelle le timbre de l’instrument, de manière qu’une note produite par un violon ne sonne pas comme la même note produite par une trompette, et toutes deux sont plus agréables à nos oreilles que le son pur correspondant. Si une onde sonore n'est pas une fonction périodique, alors on n'a pas de son, ni pur ni composé, mais du bruit. Les exigences de l’art ont forcé les musiciens à s’occuper de l’analyse de Fourier plusieurs siècles avant sa découverte en mathématiques, et également de la physiologie et psychologie de la réaction humaine aux ondes acoustiques. On peut créer une mélodie avec une succession quelconque de sons. On constate pourtant que la mélodie est plus agréable à l’oreille humaine si les sons ont des fréquences fondamentales dont les rapports sont donnés par des petits nombres entiers, tels que 3/2 ou 4/3. On ne doit par conséquent utiliser pour la composition des mélodies que des sons en accord avec cette conditions et qui soient adoptés par tout le monde: c’est ce qu'on appelle les notes. Afin de définir une échelle (musicale) de notes, on doit alors adopter une fréquence (note) de référence, et une règle pour en dériver les fréquences des autres notes. Giorgio Margaritondo: Ma Physique 428 On a, par exemple, une échelle diatonique si l'on adopte la règle suivante: les fréquences des notes, divisées par celle de référence, correspondent aux rapports 9/8, 5/4, 4/3, 3/2, 5/3, 15/8 et 2. La fréquence de référence peut être, par exemple, le do à 256 Hz. Les notes suivantes sont ré, mi, fa, sol, la, si; le rapport 2 donne encore un do puisqu'il s'agit d'une fréquence harmonique par rapport à celle de référence. L'intervalle de fréquence d'un do à l'autre, qui correspond à une augmentation de fréquence d'un facteur 2, s'appelle une octave. Le problème de l'échelle diatonique simple est qu'elle prévoit moins de notes dans chaque octave qu'on n’en souhaiterait pour composer la plupart des thèmes musicaux. On peut donc prendre les intervalles les plus grands entre deux notes successives, et y ajouter des notes supplémentaires. Cela se fait pour les intervalles do-ré, ré-mi, fa-sol, sol-la et la-si; pour chaque intervalle on ajoute deux notes, un bémol dont la fréquence est un peu plus élevée que l'extrémité inférieure et un dièse à fréquence un peu moins élevée que l'extrémité supérieure. Les règles anciennes pour dériver les demi-tons donnaient des fréquences diverses pour le bémol et pour le dièse dans le même intervalle, par exemple pour le do dièse et pour le ré bémol. Le nombre total de notes dans une octave se montait par conséquent à 17, ce qui exigeait un nombre excessif de clés dans les instruments tels que le piano ou le clavecin. La solution, qui fut développée par Werckmeister et adoptée par J. S. Bach, est fournie par l'échelle tempérée, qui se base sur 12 notes par octave et sur 5 demi-tons: on force chaque bémol à avoir la même fréquence que le dièse dans le même intervalle. L'échelle d'une octave comprend donc les notes do, do dièse, ré, ré dièse, mi, fa, fa dièse, sol, sol dièse, la, la dièse, si; le rapport de fréquence entre une note et la note précédente est toujours de 21/12, de manière qu'au début d'une octave on retrouve le facteur 2 par rapport au début de l'octave précédente. La fréquence de référence est fournie par le la fondamental, à 440 Hz. Les avantages de l'échelle tempérée, qui est la plus fréquemment utilisée, furent mis en avant par J. S. Bach à l'aide de sa fameuse collection de compositions qui s'appelle justement le clavecin bien tempéré. Johann Sebastian Bach, grand musicien mais également grand scientifique, et son Clavecin bien tempéré Il faut mentionner que dans la combinaison de deux notes simultanées, on arrive à des résultats agréables pour l'oreille (consonance) si leurs fréquences ont un rapport égal au rapport de petits nombres entiers (3/2, 4/3, 5/4, etc.); on a par contre dissonance si les nombres entiers sont élevés. Pour les combinaisons de trois notes, les effets les plus Giorgio Margaritondo: Ma Physique 429 agréables se produisent si les fréquences sont en rapport 4:5:6 (accord parfait majeur) ou en rapport 10:12:15 (accord parfait mineur). LIX.3.2. Les limites d'audibilité L'efficacité de la détection des ondes acoustiques par l'oreille humaine change en fonction de la fréquence, et aussi d'une personne à l'autre; pour chaque personne, elle change avec l’âge. On ne peut donc que dériver de façon empirique une réponse moyenne, qui est illustrée par la Fig. 192. La figure montre spécifiquement deux courbes: celle du "seuil d'audibilité", qui est l'intensité minimum qui peut être révélée, et le "seuil de douleur", soit l'intensité pour laquelle le son cause une sensation de douleur, qui peut se transformer en dégâts permanents à des intensités encore plus élevées. Intensité (dB) ultrasons seuil de douleur 120 80 infrasons 40 0 10-1 seuil d'aubilité 10 10 3 Fréquence (Hz) 105 Fig. 192: Courbes empiriques pour la réponse de l'oreille humaine "moyenne" aux ondes acoustiques, en fonction de leur fréquence. On constate que la détection des ondes acoustiques par l'oreille humaine n'a lieu que pour un domaine limité de fréquences, entre les infrasons et les ultrasons. On arrive normalement à "écouter" les fréquences de ≈ 20 à ≈ 10'000 Hz, mais la réponse individuelle peut varier. On constate par exemple que les jeunes sont plus capables d’entendre les hautes fréquences que les personnes plus âgées. En ce qui concerne la musique, on limite normalement les notes à l'intervalle de 27 à 4'700 Hz parce que les sons plus aigus ou plus graves sont désagréables. Ce domaine touche 9 octaves, dont 7 sont complètes. La première octave est incomplète parce qu'elle ne commence pas avec le do mais avec le la à la fréquence de 27,5 Hz; la dernière est également incomplète, et se termine avec le ré (ottavino) de 4698,0 Hz. Giorgio Margaritondo: Ma Physique 430 Le Coin Yankee: Ondes acoustiques Son Harmoniques Octave Échelle tempérée Acoustic waves Sound Harmonics Octave Tempered scale “A perfectly sinusoidal wave correspond to what one calls a pure sound. If one analylizes the sound produced by a musical instrument, by making its decomposition into Fourier waves, one finds that it is not a pure sound: it consists of a periodic function, but the Fourier component at the fundamental frequency n is accompanied by harmonic components which have frequencies of the type nn, where n is an integer number. The superpositions of harmonics produces what is called the tone of the instrument, so that a note produced by a violin does not sound like the same note produced by a trumpet, and both are more agreeable for our ears than the corresponding pure sound." Le coin des unités et des ordres de grandeur: Coefficient d’absorption Unités SI m-1 Autres unités cm-1 “Ma Physique” Quatrième partie: La physique du monde microscopique Giorgio Margaritondo: Ma Physique 434 Table des matières Page LX. Quelque chose cloche LX.1. Comme faire survivre les atomes? LX.1.1. L’effet photoélectrique fournit une suggestion LX.1.2. L’électron: lui aussi, parfois particule et parfois onde LX.1.3. Atome de Bohr quantique LXI. Principe d’indétermination et principe de correspondance LXI.1. La bizarre découverte de M. Heisenberg LXI.2. Correspondance entre le monde microscopique et le monde macroscopique LXII. Qu’est-ce que les “ondes” des électrons? LXII.1. La probabilité comme quantité physique LXIII. Théorie des ondes des électrons LXIII.1. Electron “libre” LXIII.2. Electron dans une boîte LXIII.3. Oscillateur quantique LXIII.4. Effet “tunnel” LXIX. Atomes, éléments et liaisons chimiques LXIX.1. Principe de Pauli, le spin et la table périodique des éléments LXIX.1.1. “Construction” de la table périodique LXIX.2. Liaisons chimiques covalentes LXX. Molécules et solides LXX.1. Solides: de très grandes molécules LXX.1.1. Impuretés LXX.1.2. Phénomènes quantiques macroscopiques LXXI. Noyau et particules élémentaires LXXI.1. “Quarks” et modèle standard LXXI.1.1. Bosons de “gauge” (jauge) LXXI.1.2. Leptons LXXI.1.3. Hadrons On ne cesse jamais de découvrir Quelques mots pour conclure: Remerciements 435 437 437 442 444 449 450 452 455 456 460 461 462 465 468 473 474 477 479 484 484 488 489 491 491 492 492 493 498 499 500 Giorgio Margaritondo: Ma Physique 435 LX. Quelque chose cloche L’enseignement avancé des sciences de base et de la technologie a parfois pour effet de décourager les jeunes gens qui auraient envie de contribuer à leur progrès. L’impression domine peut-être que tout a été découvert, que tout a été inventé, de la mécanique, en passant par la chimie et la physique des particules élémentaires, jusqu’à la bière “dry” et au tire-bouchon! Un jeune peut-il espérer contribuer quelque chose dans des domaines qui ont profité des meilleures intelligences pendant des siècles? Rien ne pourrait être plus loin de la réalité que ce point de vue. Malgré tout le progrès de la science et malgré ses produits technologiques si évidents dans notre vie quotidienne, nous ne comprenons presque rien des mécanismes qui gouvernent la nature. La liste des mystères de base est extrêmement longue; elle était pourtant encore plus longue à l’aube du XXème siècle, quand le cadre de la physique correspondait plus ou moins à ce que nous avons présenté dans les trois premières parties de notre cours. Amusons-nous, dès lors, à découvrir quelques-uns des mystères les plus fondamentaux qui existaient à cette époque; et aussi à réaliser que plusieurs d’entre eux n’ont pas encore été clarifiés: 1. C’était un fait plus ou moins connu que la matière est formée par des atomes et que ceux-ci contiennent des particules encore plus petites avec des charges électriques positives et négatives. Mais l’électromagnétisme ne pouvait pas justifier la stabilité des atomes, et prévoyait par contre leur destruction en un laps de temps extrêmement court. 2. On avait découvert l’existence des particules appelées “électrons”, qu’on avait identifiés comme l’un des constituants des atomes. Mais on n’avait aucune idée du mécanisme qui permettait de concentrer leur charge négative dans un volume extrêmement limité et de produire une particule stable. 3. Le même problème se posait pour un autre ingrédient de base des atomes: le proton. A-t-il un temps de vie limité, même si celui-ci est très long? La réponse à cette question est d’importance capitale, même sur le plan philosophique et métaphysique: si les protons vivent indéfiniment, alors la vie de l’univers n’a pas de limites propres; dans le cas opposé, elle est intrinsèquement limitée. 4. Même en oubliant la question de la stabilité des protons, comment est-ce possible de mettre plusieurs protons avec leurs charges positives dans le volume extrêmement limité d’un noyau atomique sans causer - littéralement - une explosion nucléaire? 5. La question No. 2 suggère que l’électron est un objet très compliqué. L’électromagnétisme nous suggère que ses interactions avec les autres électrons et les noyaux des atomes sont tout aussi compliquées. Mais comment donc expliquer qu’en prenant un nombre énorme d’électrons dans un métal, ils se comportent collectivement de manière extrêmement simple, leurs effets étant décrit par la loi d’Ohm qui est une des lois les plus élémentaires de la physique? 6 Cette tendance à la simplicité se manifeste souvent dans les systèmes compliqués. En prenant, au lieu des métaux, les matériaux appelés “supraconducteurs”, on constate que le comportement collectif de leurs électrons est encore plus simple; cette simplicité est absolument étonnante. 7. Dans le même ordre d’idées, comment comprendre que des systèmes extrêmement compliqués comme ceux formés par la matière vivante - par exemple, nous-mêmes peuvent fonctionner pendant très longtemps, tandis que le “temps de vie” de Giorgio Margaritondo: Ma Physique 436 systèmes beaucoup moins compliqués de notre technologie est très limité (combien de fois devez-vous amener votre voiture au garage en dix ans?) 8. Toujours sur le même plan, comment peut-on comprendre que des systèmes “chaotiques”, c’est-à-dire des systèmes pour lesquels des petites perturbations peuvent produire des phénomènes d’une grande ampleur, se comportent de manière globalement prévisible? Par exemple, le système météorologique du monde peut provoquer de terribles phénomènes même si ceux-ci ne sont causés que par de très petites perturbations (le fameux paradoxe du papillon de Pékin qui perturbe l’atmosphère de manière extrêmement limitée, mais produit finalement un orage en Californie); néanmoins, le comportement global du système continue à donner lieu aux saisons, à permettre la production de nourriture par l’agriculture, etc. 9. L’intuition ne nous permet pas de comprendre le fonctionnement de plusieurs des objets les plus communs. Prenons un aimant: il est aisé de voir que l’action combinée de ses atomes produit un très grand dipôle magnétique. Mais en imaginant les atomes comme des microdipôles magnétiques, il faut alors conclure que ceux-ci ont tendance à s’orienter tous dans la même direction; par contre, si nous mettons deux dipôles magnétiques macroscopiques l’un à coté de l’autre, leur tendance est plutôt à s’orienter dans des directions opposées. Et bien, Mesdames et Messieurs, lesquelles parmi ces questions ont-elles été clarifiées depuis les premières années de ce siècle? La réponse est assez surprenante: on a assez bien clarifié les questions No. 1, 4, 5 et 9; on n’a que (très) partiellement clarifié les questions No. 6, 7 et 8, et on est encore dans l’incertitude en ce qui concerne les questions No. 2 et 3. De plus, même la “clarification” des premières questions est en partie décevante. Une série de règles plus ou moins empiriques ont été adoptées, appelées “physique quantique”: l’acceptation de leur validité permet de justifier les questions mentionnées ci-dessus, par ailleurs, des questions fondamentales demeurent sur les règles elles-mêmes; en particulier, il est toujours difficile de connecter ces règles, qui s’appliquent surtout au monde microscopique, avec notre expérience du monde macroscopique. Bref, ne vous laissez pas ensorceler par les magiciens de la Science Moderne, chers (futurs/es) collègues. Nous sommes bien loin de comprendre l’univers. Plus précisément, il faut confesser que nous avons à peine commencé à y comprendre quelque chose, et encore de manière très rudimentaire. Avant de clôre cette discussion qui, j’espère, vous a choqués, il faut mentionner que la situation n’est pas plus avancée dans le domaine de la technologie. Tout d’abord, l’expérience nous enseigne que, sans comprendre les mécanismes de base par la recherche fondamentale, le progrès technologique est extrêmement inefficace; donc, le nombre énorme de questions qui restent sans réponse nous empêche également de progresser rapidement dans le domaine de la technologie. De plus, même dans les domaines où les questions de base ont été plus ou moins clarifiées, le progrès technologique est toujours très limité par rapport à son potentiel. Prenez, par exemple, ces merveilles que sont les ordinateurs, produits de la microéléctronique. Celle-ci ne cesse de nous surprendre en concentrant un nombre étonnant de dispositifs dans des micropuces à semiconducteurs, si petites qu’on a de la peine à les voir. Croyez-vous que le sommet de cette technologie soit atteint? Pas du tout, parce que ces formidables dispositifs sont connectés toujours à des objets mécaniques de grande dimension, de vitesse et d’efficacité très limitées. Ce qui est un peu, si vous le permettez, comme utiliser le charme féminin de Mlle Claudia Schieffer Giorgio Margaritondo: Ma Physique 437 afin de séduire un vétéran de la légion étrangère de retour de dix ans de campagne dans le désert. Autrement dit, ne nous faisons pas d’illusions: ni dans la science ni dans la technologie nous ne sommes proches du but. Il nous faut de l’humilité, face à un univers qui garde toujours la plupart de ses secrets. LX.1. Comme faire survivre les atomes? La discussion du problème de la stabilité des atomes a déjà été entamée dans le chapitre XL.2. On a vu que le modèle d’atome d’hydrogène selon Bohr ne peut pas en expliquer la stabilité dans le cadre de la physique classique; la raison, rappelons-la, en est l’accélération centripète de l’électron qui, doté de charge électrique, devrait émettre des ondes électromagnétiques. Par conséquent, il devrait perdre rapidement son énergie et “chuter” sur le noyau, au lieu de se maintenir dans un état stationnaire, compatible avec la stabilité de l’atome. La solution de ce problème, comme déjà mentionné, est fournie par la mécanique quantique (nous avons brièvement discuté le rôle du principe de Heisenberg). Il faut maintenant généraliser l’analyse, puis trouver la solution détaillée du paradoxe apparent que nous venons de discuter. Tout d’abord, l’instabilité des atomes selon la physique classique n’est pas un résultat confiné au modèle à “système solaire” de Bohr. Il s’agit d’une propriété beaucoup plus générale, qui n’exige que trois hypothèses: 1. L’atome contient un ou plusieurs électrons, confinés dans un volume (dont l’ordre de grandeur typique est 1 ångstrom cube). 2. Chaque électron est une particule, avec une charge électrique -e. 3. La charge négative des électrons de l’atome est équilibrée par la charge positive du noyau, qui est confinée dans un espace beaucoup plus petit que celui de l’atome. En effet, il est impossible pour l’électron de ne pas tomber sur le noyau sans se trouver en mouvement (à cause de l’attraction électrostatique); d’autre part, un mouvement dans un espace limité est nécessairement sujet à des accélérations (le seul mouvement sans accélération est le mouvement uniforme sur une droite); à son tour, l’accélération de la charge électronique cause la perte d’énergie par émission d’ondes électromagnétiques, et donc l’instabilité de l’atome. Cette instabilité causerait une destruction très rapide des atomes, absolument incompatible avec la stabilité de l’univers qu’on peut observer à chaque instant de notre vie quotidienne. LX.1.1. L’effet photoélectrique fournit une suggestion La seule échappatoire à ce paradoxe est de renoncer à une des hypothèses sur la structure de l’atome mentionnées ci-dessus. Mais laquelle des trois faut-il abandonner? Afin de répondre à cette question fondamentale, nous sommes obligés de faire un petit détour, consacré à l’analyse d’une très curieuse propriété des ondes électromagnétiques. Giorgio Margaritondo: Ma Physique 438 Cette propriété, appelée dualité, se manifeste par exemple dans l’effet photoélectrique, illustré par la Fig. 193. Cet effet provoque l’émission de quelques-uns des électrons d’un solide, par exemple d’un métal, lorsque celui-ci est illuminé par des ondes électromagnétiques dans le domaine spectral de l’ultraviolet ou des rayons X. La partie inférieure de la figure 193 montre un modèle “à piscine” des électrons d’un métal qui aide beaucoup à comprendre l’émission de “photoélectrons”. Dans ce modèle, les électrons du métal sont distribués sur un grand intervalle d’énergies, comme l’eau d’une piscine est distribuée sur un intervalle de niveaux (qui correspond à un intervalle de valeurs de l’énergie potentielle de gravité). Même les électrons à plus haute énergie (EF) de la distribution ne peuvent pas quitter le métal, à cause d’une barrière Φ (dite “travail de sortie”) qui sépare EF du “bord” (Ev = énergie minimale hors du métal). En arrivant sur le métal, l’onde de lumière cède une partie de son énergie aux électrons, et quelques-uns arrivent à des énergies plus élevées que le sommet de la barrière, pouvant ainsi quitter le métal et devenir des photoélectrons. A l’aide de ce modèle, on peut par exemple prévoir que l’augmentation d’intensité de la lumière produit une augmentation linéaire de l’intensité du courant de photoélectrons. Jusqu’ici, rien de mystérieux. Mais ensuite, on se retrouve dans les ténèbres absolues: si l’on mesure l’intensité de l’émission de photoélectrons en fonction de la fréquence ν de l’onde électromagnétique, on trouve le résultat de la partie supérieure droite de la Fig. 193: l’intensité dépend de ν, et il existe une valeur de seuil νo , au-dessous de laquelle il n’y a pas de photoélectrons! Mais alors! Quelle peut bien être la relation entre fréquence et énergie? Comment la première peut-elle influencer le transfert de l’énergie entre onde et électrons? Voila des questions qui préoccupaient beaucoup M. Albert Einstein en 1905. Nous avons déjà vu que, ennuyé par les paperasses de son travail administratif à Berne, le jeune M. Einstein préférait occuper son temps à des questions plus intéressantes, telles que la relativité spéciale. De plus, en cogitant sur la recherche fort peu connue d’un scientifique allemand, M. Max Planck, il avait trouvé un très curieux résultat: il s’agissait d’une équation qui décrivait le changement d’entropie des ondes électromagnétiques dans un récipient, si le volume de celui-ci est modifié de façon isotherme: E V B S(B) - S(A) = h k ln , ν VA (621) où E est l’énergie des ondes dans le récipient dont la fréquence est proche de ν (et h est notre vieille amie la constante de Planck). Essayons de comparer cette équation à l’Eq. 252, qui décrit le changement d’entropie pour la même transformation dans le cas d’une mole de gaz parfait: il s’agit formellement de la même équation, à condition d’interpréter (E/hν) comme le nombre de “particules” de ce “gaz”. Tombé entre les mains d’un scientifique moins révolutionnaire, ce résultat aurait probablement été classé comme une simple coïncidence. Einstein, par contre, décida de le prendre au sérieux, déclenchant ainsi la plus grande révolution scientifique de notre siècle. “Et si par hasard - se demanda votre collègue polytechnicien fédéral - le rayonnement électromagnétique se comportait réellement comme un ensemble de particules, voire comme un gaz? Ceci serait absurde, vu qu’on a pris des siècles, jusqu’à M. Maxwell, pour démontrer exactement le contraire, c’est-à-dire que le rayonnement Giorgio Margaritondo: Ma Physique 439 est constitué par des ondes! Mais pourtant ... mettons de côté la question de l’absurdité: quelles seraient les conséquences d’un tel comportement?” Analysons celles-ci, par exemple, pour l’effet photoélectrique: si (E/hν) est le nombre de “particules” de lumière, alors l’énergie de chaque particule est hν. Dans le métal, un électron peut absorber une de ces particules, qu’on appelle “photons” (ah, la beauté d’une éducation classique qui permet de maîtriser le grec ancien!). Ajoutée à son énergie initiale Ei (voir la partie inférieure de la Fig. 193), l’énergie du photon absorbé permet à l’électron d’atteindre une énergie E dépassant la valeur minimale E i pour devenir un photoélectron. lumière (ultraviolette) nombre de photoélectrons photoélectrons métal νo photoélectron (énergie E) énergie EV EF = 0 Ei ν (fréquence de la lumière) Φ photon hν -e Fig. 193: Effet photoélectrique, en particulier le nombre de photoélectrons en fonction de la fréquence de l’onde de lumière, et modèle d’Einstein. Les électrons dans la condition la plus favorable pour quitter le métal sont ceux d’énergie Ei; même ceux-ci ont besoin d’un minimum d’énergie supplémentaire égal à Φ pour devenir des photoélectrons. Donc, raisonna Einstein, aucune émission ne peut avoir lieu si l’énergie des “photons” ne dépasse pas Φ, c’est-à-dire si leur fréquence n’est pas plus élevée que: Φ νo = h ; (622) Giorgio Margaritondo: Ma Physique 440 ceci explique le seuil de fréquence illustré par la Fig. 193! L’hypothèse révolutionnaire de M. Einstein permet donc une clarification insoupçonnée. Il faut par ailleurs souligner que l’enchaînement historique est un peu différent: les données expérimentales sur l’effet photoélectrique étaient très mauvaises en 1905, et M. Einstein prévit le seuil de fréquence plutôt que de le vérifier; sa théorie étant très controversée, la vérification expérimentale n’arriva qu’en 1918. La clarification permise par la théorie d’Einstein eut son prix, très élevé. Les idées d’Einstein exigèrent une révision radicale de la manière de considérer les objets en physique. Einstein ne put pas remplacer tout simplement la notion “lumière = ondes” par l’ancienne notion “lumière = particules”, parce qu’il existait une grande quantité d’expériences, notamment sur les phénomènes de diffraction et d’interférence, qui révélaient la nature ondulatoire de la lumière. D’autre part, dans l’effet photoélectrique et dans d’autres phénomènes la lumière ne se comporte pas comme “onde” mais comme “particule”. Donc, il faut ajouter la notion “lumière = particule” à la notion “lumière = onde” sans toutefois renoncer à celle-ci: c’est la dualité de la lumière. Mais un instant: ne sommes-nous pas par hasard sur le chemin de la folie? La vie quotidienne nous suggère qu’il existe une différence claire entre “ondes” et “particules”, sans aucune possibilité de confusion entre les unes et les autres. On jette une pierre dans le lac: la pierre est une “particule”, et elle cause sur le lac une “onde”. Comme peut-on les distinguer l’une de l’autre? C’est simple: on fait une expérience de diffraction ou d’interférence. Ou une expérience d’absorption partielle: une onde de lumière arrivant sur un verre peut être partiellement transmise et partiellement réfléchie; une pierre ne peut que passer par le verre (en le cassant) ou rebondir si le verre est assez dur. Pourtant, la découverte clé de la physique moderne est que cette distinction n’est plus valable au niveau microscopique: des objets tels que les photons se comportent parfois comme des ondes et parfois comme des particules. Cette dualité ne peut pas heureusement - créer d’absurdité, grâce à une raison fondamentale qui sera clarifiée un peu plus loin. (a) (b) (c) (a) On jette une pierre dans le lac et on crée des ondes: on peut ainsi constater que les particules et les ondes sont des phénomènes tout-à-fait différents dans le domaine de la physique classique. Mais si l’on essaie de trouver cette même différence au niveau d’un électron dans un atome d’hydrogène, on a des difficultés. L’électron nous apparaît parfois comme une particule (b) et parfois comme un nuage de charge correspondant à une onde (c). Mais avant d’accepter la notion de dualité onde-particule, il faut appliquer la procédure de base de la physique: aucun résultat ne peut être accepté sans une vérification expérimentale. Si la lumière se comporte parfois comme un ensemble de particules Giorgio Margaritondo: Ma Physique 441 plutôt que comme une onde, ce fait doit être vérifié par des expériences. Ce point a en effet été vérifié par l’effet photoélectrique. Et sa vérification peut être complétée grâce à d’autres phénomènes. La Fig. 194 en fournit un bel exemple: l’effet Compton. Il s’agit d’un “effet billard”, où la boule qui est frappée est un électron, et celle qui frappe est un photon. En considerant le phénomène du point de vue “ondulatoire”, on observe un changement de direction et de fréquence de l’onde électromagnétique qui arrive sur l’électron; de plus, on observe que l’électron est mis en mouvement. Mais si la dualité onde-particule correspond à la réalité, on doit pouvoir changer de point de vue et analyser le phénomène en considérant une particule-photon qui frappe l’électron. La relation entre le changement de fréquence (c’est-à-dire d’énergie du photon) et la direction de diffusion de l’onde-photon se justifie ainsi grâce aux règles de conservation de l’énergie et de la quantité de mouvement pour des particules. Le succès de cette approche démontre la validité de la notion de dualité. électron hν hν' Fig. 194: L’effet Compton nous aide à accepter la notion de dualité ondeparticule. Arthur Compton jouant au billard avec des particules de lumière De plus, l’analyse de l’effet Compton utilise, pour la particule “photon”, des propriétés spécifiques des ondes électromagnétiques, par exemple la relation linéaire entre énergie et quantité de mouvement. Encore une fois, on ne peut éliminer ni la nature “onde” ni la nature “particule”, mais il faut les accepter toutes les deux. Voilà le noyau de la dualité. Giorgio Margaritondo: Ma Physique 442 LX.1.2. L’électron: lui aussi, parfois particule et parfois onde Nous avons découvert la notion de dualité onde-particule pour les photons. Maintenant, nous allons proposer une autre idée révolutionnaire. Les électrons se comportent-ils eux aussi parfois comme des particules et parfois comme des ondes? Nous verrons d’ici peu qu’une telle hypothèse de dualité élimine le paradoxe de l’instabilité de l’atome de Bohr. Avant d’analyser ce point, il est prudent de vérifier l’hypothèse de la dualité des électrons. Comment révéler leur comportement ondulatoire? Il faut utiliser des expériences du type diffraction ou interférence. Mais il y a un obstacle: prenons par exemple un réseau de diffraction (figures 158 et 159), dont l’interférence positive au premier ordre a lieu aux angles θ ≈ ±λ/d (d étant la période du réseau). Vérifions si un phénomène équivalent pourrait être observé pour des électrons. A cette fin, il faut estimer l’hypothétique “longueur d’onde” de ceux-ci. Si nous utilisons une pile électrique de 9 V afin d’accélérer des électrons à l’énergie E = eV ≈ 1,4 × 10-18 joule, cette énergie serait liée pour un photon à la fréquence par l’équation: E = hν , (623) qui donnerait (h étant ≈6,6 × 10-34 J s) ν ≈ 2 × 1015 hertz. La longueur d’onde du photon est λ = c/ν = hc/E. Puisque E/c = p, la quantité de mouvement de l’onde-photon, on peut alors écrire: h λ = p . Louis-Victor de autographes. révolutionnaires fûrent le sujet de (624) Broglie et un de ses Ses idées tout-à-fait en physique quantique son travail de doctorat. Giorgio Margaritondo: Ma Physique 443 Nous adopterons, suivant M. Louis De Broglie, l’hypothèse que les équations 623 et 624 sont valables autant pour un électron que pour un photon. La fréquence de l’électron est encore ν ≈ 2 × 1015 hertz. Mais en ce qui concerne la longueur d’onde, il faut d’abord calculer la quantité de mouvement par l’équation valable pour une particule dotée d’une masse. Il ne faut donc pas utiliser la relation pour un photon, p = E/c, mais plutôt la loi E = mv2/2 = (mv)2/2m, qui donne: p2 E = 2m , (625) d’où, utilisant les équations 623 et 624, la relation entre la fréquence et la longueur d’onde pour un électron (libre, c’est-à-dire non soumis à des forces): hν = h2 , 2mλ2 (625) qui, dans le cas de notre exemple (hν ≈ 1,4 × 10-18 joule), donne une longueur d’onde de l’ordre de ≈4 × 10-10 m, soit 4 Å. Cette valeur révèle un grave problème technique: la période d’un réseau de diffraction pour les électrons concernés ne devrait pas dépasser de beaucoup quelques ångstroms; mais la technologie, même la plus avancée, ne nous permet pas de construire des objets d’une telle précision. Heureusement, la nature nous fournit d’excellents “réseaux” pour les électrons: si nous prenons un cristal, la distance typique entre deux plans d’atomes est justement de quelques ångstroms. On peut donc révéler la nature ondulatoire des électrons en utilisant des cristaux pour des expériences de diffraction. La Fig. 195 en fournit un bel exemple. crystal faisceau d'électrons écran Fig. 195: La diffraction des électrons par un cristal nous fournit la preuve de leur nature ondulatoire. On peut voir à gauche l’illustration simplifiée de la technique expérimentale: le faisceau d’électrons (d’énergie bien déterminée) est diffracté par le cristal; après interaction avec le cristal, les électrons sont détectés par un écran fluorescent. La partie à droite de la figure montre l’écran: les aires lumineuses sont celles où les électrons sont détectés. Le résultat est clair: pour certaines directions seulement on trouve des électrons, à cause d’un effet d’interférence typique des phénomènes ondulatoires. Donc, le comportement ondulatoire des électrons se vérifie. Giorgio Margaritondo: Ma Physique 444 En résumé, cette mystérieuse propriété de dualité onde-particule est vérifiée tant pour la lumière (et pour les ondes électromagnétiques en général) que pour les particules dotées de masse. Mais à ce point, une question fondamentale s’impose: la coexistence des deux natures particule et onde - ne donne-t-elle pas lieu à des incohérences logiques? Nous analyserons ce problème plus loin, à l’aide du célèbre “principe d’indétermination”. C. J. Davisson, chercheur de la compagnie Bell Laboratories qui, en collaboration avec L. H. Germer fut le premier à observer des phénomènes de diffraction des électrons à la surfaces des crystaux LX.1.3. Atome de Bohr quantique Prenons un atome d’hydrogène modèle Bohr, mais remplaçons l’électron-particule - en mouvement le long d’une trajectoire circulaire de rayon r - par une onde. Les conséquences peuvent être visualisées à l’aide de la Fig. 196: à gauche, l’électronparticule circule autour du noyau; à droite, on a un modèle équivalent de caractère ondulatoire: un anneau métallique qui, ayant été touché, est affecté par des oscillations stationnaires. Niels Bohr, protagoniste sympathique et courageux de la naissance de la physique quantique Giorgio Margaritondo: Ma Physique 445 Pour avoir une onde stationnaire, il faut que la longueur 2πr de la trajectoire soit égale à un nombre entier de longueur d’onde λ: 2πr = nλ . (626) D’autre part, la longueur d’onde est liée par l’Eq. 624 à la quantité de mouvement; à son tour, celle-ci est donnée par l’Eq. 303 (chapitre XL.2): λ e r r -e Fig. 196: Atome d’hydrogène de Bohr et son modèle équivalent ondulatoire. p = e/√ 4πεor/m . La combinaison de ces trois résultats nous amène à la condition suivante: 2πr = nh √ 4πεor/m e2 , qui équivaut à: r = n2 εoh2 ; πm e2 (627) L’Eq. 627 est d’importance capitale: elle montre que, à cause de sa nature ondulatoire, a distance r de l’éléctron par rapport au noyau ne peut avoir que des valeurs spécifiques, dont chacune correspond à une valeur (nombre entier) de la constante n. En utilisant la terminologie de la physique quantique, on dit que r est “quantisé”, et que n est le “nombre quantique” correspondant. Il faut souligner que la quantisation de la distance r implique aussi celle de l’énergie mécanique de l’électron. L’énergie cinétique est p 2/2m = [compte tenu des équations 4πεor/m ] = me4/2(2hεo n)2; l’énergie potentielle est -e2/(4πεor) = 627 et 303, p = e/√ [compte tenu de l’Eq. 627] = -me4/(2hεo n)2; l’énergie totale correspondant au nombre quantique n est donc: En = - me4 , 2(2hεo n)2 (628) qui est, justement, une énergie quantisée; donc, l’électron doit se trouver dans un des niveaux quantisés d’énergie illustrés par la Fig. 197. Chaque niveau, identifié par une valeur entière du nombre quantique n, correspond aussi à une valeur de la distance r, spécifiée par l’Eq. 627. Toutes ces propriétés de quantisation peuvent se résumer en Giorgio Margaritondo: Ma Physique 446 disant que la valeur de n identifie un état quantique n〉 de l’atome, dont l’énergie et la distance électron-noyau peuvent être dérivées des équations 627 et 628. Le passage d’un état quantique n〉 à un autre état quantique m 〉 implique un changement d’énergie: la conservation de celle-ci exige alors que l’atome absorbe ou émette une quantité équivalente d’énergie. Ceci implique des règles restrictives en ce qui concerne l’absorption et l’émission d’ondes électromagnétiques: seuls les photons dont l’énergie correspond à un de ces “sauts” quantiques peuvent être émis ou absorbés par l’atome: hν = - me4 1 1 - , 2(2hεo)2 m2 n2 (629) où m > n, de manière que hν est une quantité positive; si le photon est absorbé, alors la transition est n〉 →m〉; s’il est émis, elle est m〉 →n〉. Energie 0 états "libres" n=4 n=3 n=2 n=∞ états "liés" n=1 Fig. 197: Niveaux d’énergie quantisés de l’atome d’hydrogène, dérivés par l’Eq. 628. L’équation 629 fut découverte empiriquement par Rydberg et d’autres chercheurs en mesurant et analysant les spectres (c’est-à-dire les fréquences des photons absorbés) de l’atome d’hydrogène. Le modèle quantisé de Bohr justifia la formule de Rydberg, et ce succès donna une excellente preuve de la validité de ses hypothèses. Il faut noter que, si l’atome de Bohr se trouve dans l’état quantique 1〉 correspondant à la valeur n = 1, alors il ne peut plus diminuer son énergie (voir l’Eq. 628, qui implique une énergie minimale pour n = 1). Par conséquent, l’atome ne peut pas émettre de photons. Toute émission d’ondes électromagnétiques ou d’autres formes d’énergie étant impossible, l’atome reste indéfiniment dans le même état 1〉. Voici donc la justification de la stabilité des atomes: lorsqu’ils se trouvent dans leur état “fondamental”, leur énergie est minimale et toute émission d’énergie est interdite! Le paradoxe de l’instabilité qui avait stimulé notre analyse de l’atome d’hydrogène est donc résolu. Giorgio Margaritondo: Ma Physique 447 Continuons maintenant cette analyse à l’aide de la Fig. 197. On voit les quatre premiers niveaux quantiques n=1, 2, 3 et 4. La distance d’un niveau au suivant devient de plus en plus petite si n augmente. A la limite, pour n = ∞ on obtient E∞ = 0. Toutes les énergies de l’Eq. 628 sont négatives, c’est-à-dire moins élevées que la valeur E∞ = 0; la plus petite est évidemment l’énergie du niveau n = 1, et les autres augmentent progressivement en fonction de n. L’Eq. 627 montre que la distance r devient aussi plus grande lorsque n augmente, tendant à la valeur infinie si n → ∞. Sur la base de ces résultats, on peut comprendre la nature des états correspondant aux niveaux d’énergie de la Fig. 197: pour n = 1 on a l’état fondamental 1〉, dont la distance r est: εoh2 r = ao = , πm e2 (630) où la constante ao est dite “rayon de Bohr”. Si n augmente, on trouve une série d’états avec des énergies et des distances r progressivement plus grandes: il s’agit d’états pour lesquels l’électron, quoiqu’à une distance du noyau plus grande que ao , demeure toujours lié à celui-ci. Si l’énergie arrive au niveau limite E ∞ = 0, la distance devient infinie: on a séparé l’électron du noyau, et on dit que l’atome est ionisé. Des énergies positives, plus élevées que E ∞ = 0, correspondent aux valeurs (non quantisées) de l’énergie cinétique de l’électron “libre”. Il faut noter que, si l’atome se trouve dans son état fondamental 1〉, sa ionisation exige l’absorption d’au moins une énergie m e 4 /2(2hε o ) 2 ), qu’on appelle “énergie de ionisation”. C’est l’un des résultats dérivés du modèle quantisé de Bohr, tous vérifies par les expériences. Sur le plan quantitatif, ao ≈ 0,5 Å, et l’énergie de ionisation est ≈ 2,2 × 10-18 joule. Ces deux quantités jouent un rôle fondamental: la première détermine la dimension typique des atomes, qui est de l’ordre d’un demi-ångstrom. La deuxième fixe l’ordre de grandeur des énergies qui lient les électrons aux atomes. Il faut noter qu’étant donné la grandeur de cette énergie de liaison, l’énergie thermique moyenne kT à la température ambiante ne suffit pas à détacher les électrons des atomes, des molécules ou des solides; il faut des énergies plus grandes, par exemple l’énergie des photons qui correspondent aux ondes ultraviolettes ou aux rayons X. Voilà pourquoi on bronze avec le rayonnement ultraviolet! Enfin, il faut mentionner que la version complète du modèle de Bohr est plus compliquée que la version simplifiée présentée ici. Elle prévoit, notamment, la possibilité de trajectoires de forme elliptique au lieu des trajectoires circulaires. Néanmoins, notre version simplifiée est en mesure d’expliquer les propriétés quantiques de base des atomes, et en particulier leur stabilité. Giorgio Margaritondo: Ma Physique 448 Le Coin Yankee: Mécanique quantique Dualité Effet photoélectrique Photoélectron Quantisation Etat quantique Nombre quantique Niveau d’énergie Energie de ionisation Quantum mechanics Duality Photoelectric effect Photoelectron Quantization Quantum state Quantum number Energy level Ionization energy “Moreover, the analysis of the Compton effect uses for the particle `photon’ several specific properties of the electromagnetic waves, such as the linear relation between energy and momentum (the proportionality constant being the speed of light). This emphasizes the duality, i.e., that the phenomenon is neither entirely particle-like nor entirely wave-like, but sometime particle-like and some other time wave-like Le coin des unités et des ordres de grandeur: h (constante de Planck) Unités SI joule sec Autres unités Ordres de grandeur: h ≈ 6,6× 1 0 - 3 4 joule sec. Si un électron est potentiel de V volt, alors son énergie est E quantité de mouvement p ≈ 5,4× 10 -25 × R(V) longueur d’onde correspondantes sont: ν accéléré par une chute de ≈ 1,6× 1 0 - 1 9 × V joule et sa kg m/sec; la fréquence et la ≈ 2,4× 1 0 1 4 × V hertz et λ ≈ (1,2 × 1 0 -9 )/ √ V m, ou λ ≈ 12/ √ V Å. En ce qui concerne l’énergie de ionisation, nous avons vu que sa valeur est ≈2,2× 10 -18 joule; enfin, il faut souligner encore une fois que le rayon de Bohr ao est de l’ordre de 0,5 Å Giorgio Margaritondo: Ma Physique 449 LXI. Principe d’indétermination et principe de correspondance A ce point, il faut aborder la discussion de la question ouverte par la découverte de la dualité onde-particule: comment éviter des conflits logiques entre deux types de phénomènes qui sont nettement différents dans notre expérience quotidienne? Autrement dit, on voit tous les jours des choses qui sont des particules et d’autres qui sont des ondes, mais on ne voit jamais quelque chose qui est en même temps onde et particule! Où est alors la cohérence logique de ce qui vient d’être discuté? Analysons la thèse suivante: “Les expériences montrent qu’un électron se comporte parfois comme une particule et parfois comme une onde”. Son analyse ne révèle aucun problème logique, parce que les deux types de comportement ne sont pas observés en même temps. Par contre, on aurait des problèmes si une expérience pouvait démontrer qu’un électron se comporte, en même temps, comme une onde et comme une particule. Essayons alors de construire une telle expérience: si nous y réussirons, nous aurons réduit la physique quantique à néant, éliminé le reste du cours! Premièrement, comment démontrer qu’un objet tel qu’un électron est une particule? Il faut observer qu’à un temps donné il est concentré dans un petit volume (à la limite, un volume infinitésimal). Et comment démontrer qu’il est une onde? Il faut observer des phénomènes typiquement ondulatoires, par exemple d’interférence. Prenons, par exemple, l’expérience de Young (interférence de deux fentes, voir la Fig. 154); la Fig. 198 montre son application au cas d’un faisceau d’électrons, tous d’énergie hν. En envoyant dans l’appareil un nombre assez élevé d’électrons, l’un après l’autre ou tous en même temps, on observe leurs points d’arrivée sur le deuxième écran par un détecteur. Ces mesures révèlent un phénomène d’interférence, caractérisé par des régions de maximum du nombre d’électrons détectés, séparées par des régions de minimum. Cette observation fournit l’évidence de la nature ondulatoire des électrons. Comment simultanément prouver que ceux-ci sont des particules? Si un électron est une particule, alors il ne peut pas passer, comme une onde, à la fois par la fente α et par la fente β: il doit passer à travers l’une ou l’autre. On peut alors ajouter à l’appareil un autre détecteur, placé par exemple sur la fente α, qui puisse montrer sans incertitude qu’un électron passe par cette fente et ne passe pas par l’autre. Si cette procédure fonctionnait, on aurait réussi à détruire toute la physique moderne! Mais peut-on réellement atteindre cet objectif méprisable? Il faut faire attention: la seule manière d’être absolument sûr qu’un électron passe par la fente α est de le maintenir dans celle-ci; mais en retenant tous les électrons qui passent par cette fente, on détruit le phénomène d’interférence: tout an réussissant à démontrer que les électrons se comportent comme des particules, on a perdu l’évidence qu’ils se comportent comme des ondes! Pourrions-nous modérer nos exigences, en utilisant des détecteurs plus “gentils” qui ne retiennent pas les électrons, et ne détruisent pas entièrement le phénomène d’interférence? Bien sûr que oui, mais ces détecteurs “gentils” ne peuvent pas fournir l’évidence absolue que l’électron passe par une seule fente, c’est-à-dire qu’il est une particule. En résumé, on peut démontrer avec certitude que les électrons se comportent comme des particules, mais il faut renoncer à démontrer qu’ils se comportent simultanément comme des ondes. Par contre, on peut démontrer avec certitude leur nature ondulatoire, mais il faut renoncer à démontrer qu’il s’agit de particules. Dans les cas intermédiaires, on peut démontrer que les électrons se comportent comme des ondes Giorgio Margaritondo: Ma Physique 450 et comme des particules de façon complémentairs, sans créer de problèmes d’incohérence logique. LXI.1. La bizarre découverte de M. Heisenberg Cette conclusion est une manifestation d’une propriété plus générale: le principe d’indétermination, découvert par W. Heisenberg, lorsqu’il était un jeune homme et travaillait à la célèbre école de Copenhague, fondée et dirigée par Niels Bohr. Tant Heisenberg que Bohr avait des caractères très forts, et le premier, malgré son jeune âge, n’hésitait pas à s’élever contre le prestigieux M. Bohr quand il se trouvait en désaccord avec lui. Werner Heisenberg en 1927: un jeune homme au fort caractère, en train de découvrir le principe d’indétermination Suite à une série de ces conflits, Heisenberg décida de prendre des vacances prolongées, ce qui lui donna le temps de réfléchir à plusieurs questions ouvertes de la physique quantique. Grâce à ces cogitations, il put développer une théorie quantique complète et, en passant, découvrir le principe d’indétermination. Alors, chers étudiants: vous ne dépassez pas l’âge de Heisenberg au moment de ce travail: qu’allez-vous faire pendant vos prochaines vacances? x α faisceau d'électrons β d θ L Fig. 198: Expérience de Young (interférence de deux fentes) appliquée aux électrons. Giorgio Margaritondo: Ma Physique 451 Laissons cette question embarrassante et reprenons la discussion du principe d’indétermination. Prenons l’expérience de la Fig. 199, dont le but est de mesurer tant la position que la quantité de mouvement d’un électron dans la direction x. Pour déterminer la position le long de l’axe x, on utilise un écran avec une fente: seuls les électrons localisés dans la fente peuvent passer au-delà de l’écran. Une fois la position ainsi déterminée, la quantité de mouvement dans la direction x peut ensuite être mesurée. Quelle est la précision des deux mesures? Celle de la mesure de position x est évidemment déterminée par la largeur de la fente, ∆x. En ce qui concerne la quantité de mouvement px dans la direction x, vu la géométrie de l’expérience, on pourrait croire que px est toujours parfaitement nulle. Mais attention! A cause de leur nature ondulatoire, les électrons traversant la fente sont soumis à un phénomène de diffraction. Si l’on envoie sur la fente un faisceau parfaitement collimé d’électrons, la diffraction cause une certaine divergence angulaire ∆θ après la fente. x ∆θ faisceau d'électrons ∆x Fig. 199: Dérivation du principe d’indétermination de Heisenberg pour les électrons. Cette divergence implique un certain degré d’indétermination dans la direction de mouvement des électrons; plus précisément, la grandeur de la quantité de mouvement est h/λ (selon l’Eq. 624) et la précision limite de la mesure de px est ∆px ≈ psin(∆θ/2) = (h/λ)sin(∆θ/2) ≈ (h/λ)(∆θ/2). La divergence ∆θ peut être évaluée sur la base des résultats du chapitre LIII.3, appliqués à la diffraction par une fente de largeur ∆x. En première approximation, ∆θ correspond à la largeur (angulaire) du maximum central de diffraction: ∆θ ≈ 2(λ/∆x). On obtient ainsi: ∆px = (h/λ)(∆θ/2) ≈ (h/λ) × 2(λ/∆x)/2 = h/∆x, et donc: ∆px∆x ≈ h . (631) Cette équation est une des formes du principe d’indétermination, et sa validité est générale: quelles sont ses implications? Giorgio Margaritondo: Ma Physique 452 Elle fixe une limite insurmontable à la précision des mesures simultanées de position et de quantité de mouvement. Il s’agit d’une limite parce que des mesures réelles sont encore moins précises, à cause des problèmes liés aux instruments de mesure; en tenant compte de ces problèmes, il faut écrire: ∆px∆x ≥ h . (632) Il faut noter que rien ne nous empêche d’augmenter la précision de la mesure de x, jusqu’à la limite ∆x = 0: le prix en est la diminution de la précision de px: si ∆x → 0, alors ∆px →∞, et vice-versa. L’expérience de Young discutée précédemment échoue à cause du principe d’indétermination. Pour vérifier qu’un électron passe par une fente plutôt que par l’autre, il faut mesurer sa position le long de l’axe x avec une précision ∆x < d. Mais cela, vu l’Eq. 632, implique une incertitude dans la quantité de mouvement dans la même direction. Celle-ci équivaut à une divergence angulaire des électrons après les fentes, qui suffit à détruire les effets de l’interférence. Donc, l’impossibilité de prouver qu’un électron se comporte simultanément comme une onde et comme une particule n’est pas limitée à une expérience spécifique; en particulier, elle n’est pas limitée à l’expérience de la Fig. 198. Il s’agit plutôt d’une propriété générale, provenant du principe d’indétermination. D’autre part, l’hypothétique incohérence logique provoquée par la dualité onde-particule ne peut pas être prouvée sans procéder à des expériences. Mais celles-ci échouent à cause du principe d’indétermination, et donc l’incohérence n’existe pas en ce qui concerne la physique. Le principe d’indétermination est donc l’élément clé qui garantit la cohérence de la physique quantique. La procédure pour dériver l’Eq. 632 n’a pas tenu compte de la définition formelle de la précision des mesures. Une approche plus complète amène à une version un peu différente, sans pourtant modifier le contenu de base du résultat: ∆px∆x ≥ h/2π . (633) D’autres formes du principe d’indétermination peuvent aussi être dérivées pour d’autres couples de grandeurs physiques; par exemple, si l’électron se trouve dans un état d’énergie E pendant une période de temps t, la précision combinée de ces deux quantités ne peut pas dépasser la limite suivante: ∆E∆t ≥ h/2π . (634) Enfin, il faut souligner que le principe d’indétermination n’est pas limité aux électrons. Au contraire, il s’applique à n’importe quelle particule, y compris les photons et les protons, ainsi que les pierres, les balles de tennis, et nous-mêmes. LXI.2. Correspondance entre le monde microscopique et le monde macroscopique Analysons maintenant les conséquences du principe d’indétermination sur notre corps. Supposons, afin de combattre notre image pantouflarde, que nous faisons du jogging, et que nous mesurons notre vitesse, soit notre quantité de mouvement, quand nous passons par un certain point. L’ordre de grandeur de la quantité de mouvement, pour une masse ≈102 kg et une vitesse ≈5 m/s, est p ≈ 5 × 102 kg m/s. Giorgio Margaritondo: Ma Physique 453 Quant à la précision, celle des mesures de vitesse aux Jeux Olympiques arrive facilement à 0,01%. La précision de la mesure de masse dépasse ce niveau, donc la précision globale de p arrive aussi à 0,01%, ce qui donne ∆p ≈ 5 × 10-2 kg m/s. En introduisant cette valeur dans l’Eq. 633, on obtient ∆x ≈ 2,1 × 10-33 m, soit une indétermination de 23 ordres de grandeur plus petite que la dimension d’un de nos atomes. C’est une limite de précision qui dépasse de beaucoup les possibilités techniques actuelles et futures. Donc, le principe d’indétermination n’a aucune conséquence pratique en ce qui concerne notre jogging. La différence entre un électron et nous-mêmes est la grandeur: notre masse et nos dimensions appartiennent au monde macroscopique, tandis qu’un électron se situe dans le monde microscopique. Dans celui-ci, l’Eq. 633 a des conséquences importantes à cause de la grandeur de la constante de Planck: puisque celle-ci est très petite, les effets pratiques du principe d’indétermination sont confinés aux atomes, aux molécules et aux particules élémentaires. Cette conclusion s’applique en général à toutes les propriétés quantiques: leur importance est déterminée par la grandeur de la constante de Planck, et donc confinée au monde microscopique. Dans le monde macroscopique, on retrouve les résultats justifiés par la physique classique. Les mêmes résultats peuvent être retrouvés en prenant la limite des formules quantiques pour h → 0. Prenons, par exemple, l’Eq. 627: r = n2 εoh2 ; πm e2 la différence entre les rayons des états quantiques n〉 et n+1〉 est ((n+1)2 - n2)(εoh2/πm e 2 )). Si h → 0, elle tend à s’annuler, et tous les rayons deviennent possibles: nous retrouvons les propriétés du système solaire, qui est l’équivalent macroscopique de l’atome de Bohr. En résumé, la grandeur de la constante de Planck marque la différence entre le monde microscopique et le monde macroscopique, c’est-à-dire entre les objets qui sont intrinsèquement quantiques et ceux dont le comportement quantique est négligeable. Le passage du comportement microscopique-quantique au macroscopique-classique est une manifestation de ce qu’on appelle “principe de correspondance”. Giorgio Margaritondo: Ma Physique 454 Le Coin Yankee: Précision Principe d’indétermination Principe de correspondance Accuracy Uncertainty principle Correspondence principle “On the other hand, one cannot prove the alleged logical lack of coherence of the wave-particle duality without experimentally observing it: nothing exists for physics outside experiments. Therefore, the lack of coherence does not exist: the uncertainty principle is the key to obtain a coherent formulation of quantum physics” . Giorgio Margaritondo: Ma Physique 455 LXII. Qu’est-ce que les “ondes” des électrons? Avant de nous lancer dans les applications pratiques de la physique quantique, nous sommes obligés d’attaquer un dernier point de base: quelle est la nature des ondes attribuées aux électrons? La situation est comparable à celle de l’optique avant Maxwell: grâce aux expériences, on savait que les faisceaux de lumière se comportent comme des ondes, mais on ignorait la nature de celles-ci. Cette ignorance n’empêcha pas les scientifiques de progresser dans le domaine de l’optique. De façon similaire, nous avons obtenu plusieurs résultats importants, sans pourtant avoir clarifié la nature des ondes associées aux électrons. Afin d’analyser celle-ci, revenons encore une fois à l’expérience de Young des figures 154 et 198. Tout d’abord, utilisons des photons: leur nature ondulatoire justifie le phénomène d’interférence qui produit des maxima et des minima d’intensité sur le deuxième écran. Si, par ailleurs, les photons sont considérés comme des particules, une question se pose: l’interférence est-elle causée par l’interaction entre plusieurs photons, ou est-elle une propriété intrinsèque de chaque photon? Afin d’y répondre, nous conduirons l’expérience avec deux stratégies différentes. Premièrement, nous envoyons dans l’appareil une intensité de lumière suffisamment élevée pour garantir qu’à chaque instant plusieurs photons se trouvent dans l’appareil. Ensuite, nous diminuons l’intensité, jusqu’à n’avoir, à chaque instant, pas plus d’un photon transitant par l’appareil. Si l’interférence observée avec la première stratégie est causée par l’interaction entre plusieurs photons, alors elle devrait disparaître avec la seconde. Mais elle ne disparaît pas: les effets de l’interférence s’observent en comptant les photons détectés sur les différent points de l’écran. Si le nombre total de photons détectés est suffisamment élevé, leur distribution sur l’écran tend à reproduire les maxima et minima d’intensité du phénomène d’interférence. Donc, l’interférence n’est pas causée par l’interaction de plusieurs photons. Il faut bien réfléchir à ce point fondamental: le phénomène d’interférence est le même, pour un nombre assez élevé de photons, que l’on “jette” tous les photons en même temps dans l’appareil ou qu’on les y “jette” l’un après l’autre! Où trouver un comportement similaire? Imaginons que, suite à des performances catastrophiques à l’université, vos parents se refusent à vous entretenir. Mettant à profit les notions dérivées de la thermodynamique, vous décidez de gagner de quoi vivre par le jeu de hasard. Un jeu très simple: on jette des pièces d’un franc, et on parie sur le résultat. La fréquence de chaque résultat correspond, à la limite, à sa probabilité: si les pièces ne sont pas pipées, on obtient 50%. Il y a deux manières d’obtenir ce résultat: soit jeter simultanément un grand nombre de pièces, soit jeter celles-ci l’une après l’autre. Vu son caractère statistique, le résultat ne change pas! Donc, les photons se comportent un peu comme les pièces du jeu de hasard. Quelle est leur relation? Analysons la nature de l’onde associée aux photons: il s’agit d’un champ électromagnétique. Le carré de l’onde est proportionnel à son intensité, qui à son tour est proportionnelle au nombre de photons. Plus spécifiquement, dans l’effet Young, la fréquence de détection des photons à chaque point du deuxième écran est proportionnelle au carré de l’onde dans le même point. Giorgio Margaritondo: Ma Physique 456 A la limite, donc, le carré de l’onde électromagnétique associée à un faisceau de photons est proportionnel à la probabilité de détecter ceux-ci. De façon similaire, le carré de l’onde associée à des électrons est proportionnel à la probabilité de détecter ceux-ci: c’est l’hypothèse de base de ce qu’on appelle l’interprétation de l’école de Copenhague de la physique quantique. Plus précisément, si Ψ(r,t) est la fonction (de l’espace et du temps) qui décrit l’onde, alors Ψ(r,t) 2 est proportionnel à la probabilité de détecter des électrons au point r. Avant d’approfondir cette notion aussi fondamentale que révolutionnaire, il faut remarquer deux points. Tout d’abord, l’onde Ψ(r,t) peut être une quantité complexe, donc son carré est défini par: Ψ(r,t)2 = Ψ*Ψ , (635) où Ψ* est le nombre complexe conjugué de Ψ. Max Born, auteur de l’hypothèse liant le carré de la fonction d’onde d’un électron à la probabilité d’observer celui-ci Deuxièmement, on peut mesurer le carré de l’onde associée aux électrons: il s’agit de mesurer la probabilité de détecter des électrons; on obtient celle-ci comme valeur limite de la fréquence de détection, pour un nombre assez élevé d’électrons détectés. Cette procédure est équivalente à celle pour mesurer le carré de l’onde (électromagnétique) associée à des photons. Mais il existe une différence importante entre les photons et les électrons. Pour les photons, on peut mesurer directement l’onde, puisqu’il s’agit d’un champ électromagnétique. Pour les électrons, on ne peut mesurer que le carré de l’onde, parce que celle-ci ne correspond pas à une quantité mesurable. LXII.1. La probabilité comme quantité physique Cette dernière remarque nous permet de terminer la discussion (commencée dans le chapitre XVI) du rôle fondamental de la probabilité - en tant que quantité physique dans la physique moderne. Dans le cas de la thermodynamique, les variables globales ont été utilisées, y compris des variables statistiques liées à la notion de probabilité: par exemple, la température. La justification était pratique: on ne peut pas tenir compte du comportement individuel de chaque microcomposante d’un système complexe. Par exemple, en pratique, un gaz ne peut pas être traité en étudiant la position et la vitesse de chacune de ses particules. Giorgio Margaritondo: Ma Physique 457 Pourtant, cette impossibilité est purement pratique, et rien ne nous empêche en principe de prévoir ou justifier l’évolution (position et vitesse) d’une particule de gaz. Passons maintenant à un système constitué par des électrons, par exemple les électrons d’un métal. Vu leur nombre élevé, ceux-ci pourraient être assimilés aux particules d’une bouteille de gaz, ce qui nous amène à une approche statistique dans l’étude de leur comportement. Mais l’approche statistique n’est plus une exigence pratique: il s’agit d’une question de principe. Aucune théorie ne peut, même en principe, décrire exactement le comportement d’un électron individuel; seul le comportement global, c’est-à-dire statistique, peut être prévu et justifié. Donc, grâce à l’interprétation “de Copenhague” des propriétés quantiques des électrons, la probabilité se situe au centre de la physique moderne. C’est, au fond, la seule chose qu’on peut mesurer et traiter théoriquement. Cette notion révolutionnaire suscita de grandes controverses, et ne fut jamais acceptée par des physiciens de la stature d’Einstein, Dirac et Wigner. Néanmoins, elle a passé tous les tests et a ouvert la porte aux grands et nombreux succès de la physique quantique, par exemple aux théories des liaisons chimiques, des métaux, des supraconducteurs et des particules élémentaires. Les scientifiques qui se trouvaient en 1931 à l’institut de Niels Bohr à Copenhague, site de gestation de l’interprétation “de Copenhague” de la physique quantique. L’évolution historique qui amena la probabilité à jouer un rôle central en physique est très intéressante. Le point de départ fut la deuxième moitié du XIXème siècle, marquée par l’élaboration de la théorie de l’électromagnétisme. Combinée à la mécanique classique, elle constituait un instrument efficace pour attaquer le problème central de la science: prévoir ou justifier l’évolution de n’importe quel système. L’ensemble mécanique-électromagnétisme donnait l’impression de pouvoir calculer sans limites de précision le comportement de toutes les variables définissant l’état d’un système (par exemple, position et vitesse d’une particule). Ce point de vue est appelé “déterminisme”: le pouvoir de prévoir et justifier complètement le comportement d’un système et de toutes ses composantes. Ce pouvoir de prévision absolu créait des problèmes philosophiques, notamment en ce qui concerne la liberté des êtres humains et leur responsabilité. Ce n’est pas une coïncidence que le déterminisme inclue des efforts pour justifier plusieurs types de comportement criminel sur une base héréditaire. A la fin du XIXème siècle, la théorie statistique de la thermodynamique renonça partiellement à traiter toutes les variables d’un système complexe, et les remplaça par des variables statistiques. Mais il ne s’agissait pas d’une renonciation de principe: on pouvait toujours, en principe, prévoir le comportement individuel de chaque composante du système, par exemple de chaque particule d’un gaz. Giorgio Margaritondo: Ma Physique 458 Par ailleurs, une découverte fondamentale avait déjà dirigé le progrès scientifique vers un conflit fondamental avec la philosophie déterministe: l’observation de la radioactivité par Henri Becquerel. Quelques années plus tard, une très jeune Mme Curie réalisa que la radioactivité est un phénomène des atomes individuels, qui les affecte indépendamment l’un de l’autre. Paul A. M. Diract et Eugene Wigner, deux fondateurs de la physique quantique qui, comme Albert Einstein, ont continué à critiquer les bases de l’interprétation “de Copenhague” Remarquons l’importance de ce point: le début d’un phénomène radioactif ne peut pas être prévu pour un atome individuel; néanmoins, on peut prévoir le comportement radioactif global, voire statistique, d’un très grand nombre d’atomes, et définir une loi statistique précise. L’impossibilité de traiter le comportement de chaque microcomposant n’est plus une question pratique: il s’agit plutôt d’une propriété intrinsèque! La réalisation de Mme Curie portait donc déjà en elle tous les éléments de la transition révolutionnaire du déterminisme au probabilisme. Le pas suivant de cette transition eut lieu en 1905: l’hypothèse du photon par Albert Einstein. Pour comprendre le rôle de cette hypothèse sur le chemin vers le probabilisme, imaginons une antenne radio qui émet des ondes électromagnétiques sphériques. La théorie classique de celles-ci nous permet d’en calculer la grandeur et le carré, qui est lié à l’intensité. Mais imaginons maintenant le phénomène comme “émission de photons”. La direction d’émission de chaque photon n’est pas prévisible; néanmoins, en analysant un très grand nombre de photons, on constate que l’intensité (le nombre de photons détectés) a une symétrie sphérique. Donc, pas de prévision pour le comportement individuel des photons, mais la possibilité de prévoir précisément leur comportement statistique. Il s’agissait là d’un coup mortel porté à la science “déterministe”. De façon paradoxale, Albert Einstein rejeta ce résultat probabiliste, auquel lui-même avait beaucoup contribué. Il essaya toute sa vie - en vain - de le modifier. Par contre, Max Born et plusieurs autres physiciens acceptèrent sans compromis les conséquences de la révolution probabiliste, et la poussèrent à ses limites en l’étendant des photons aux électrons et aux autres particules microscopiques. Le résultat est une théorie efficace - la physique quantique - en mesure de justifier les propriétés des atomes, des noyaux et des particules élémentaires. Grâce aux succès de la physique quantique basée sur le probabilisme, celui-ci est actuellement accepté par la plupart des scientifiques. Néanmoins, le débat n’est pas terminé, et de nouvelles expérience sont conçues et effectuées pour tester ce point central de notre culture scientifique. Albert Einstein exprima son opposition au probabilisme en disant que “Le bon Dieu ne joue pas aux dés”. Apparemment, il se trompa sur ce point. Mais il avait aussi affirmé que “Dieu est subtil, mais non malveillant”; c’est-à-dire, qu’on doit être optimiste en ce qui concerne la recherche de la Giorgio Margaritondo: Ma Physique 459 base rationnelle de la nature, même quand elle nous échappe - ce qui est actuellement vrai pour le probabilisme. Le Coin Yankee: Déterministe Deterministic Probabiliste Probabilistic “Similarly, the `Copenhagen interpretation” of quantum physics assumes that the square of the wave function of the electrons in the system is proportional to the probability of detecting the electrons. More precisely, if ψ(r,t) is the function (of space and time) which describes the wave, then |ψ(r,t)|2 is proportional to the probability of detecting electrons at the point r”. Giorgio Margaritondo: Ma Physique 460 LXIII. Théorie des ondes des électrons Ayant en quelque sorte liquidé les questions de base, nous sommes presque prêts à utiliser la physique quantique pour résoudre une série de problèmes du monde microscopique. Il nous faut pourtant développer les moyens théoriques pour attaquer ces problèmes. La partie du cours consacrée aux ondes électromagnétiques peut nous guider: le point de départ en est la dérivation de l’équation d’onde, à laquelle nous essayerons de trouver des solutions, c’est-à-dire les fonctions d’onde pour décrire chaque phénomène. Passant alors des ondes électromagnétiques à celles “de probabilité” associées aux électrons, il faut trouver l’équation d’onde, et ensuite en discuter quelques solutions importantes. L’analyse se limitera à une seule dimension - l’axe z - afin de simplifier les formules. Analysons donc la structure de l’équation des ondes électromagnétiques et la plus simple de ses solutions. Les équations 510 et 530 donnent, vu que µoεo = 1/c2: ∂2Ex 1 ∂2Ex = 0 ; ∂ z2 c2 ∂ t2 Ex = Exosin(kz ± ωt) . Combinées, ces équations amènent à la relation k2 = ω2/c2 . D’autre part, k = 2π/λ = [vu l’Eq. 624] = 2πp/h; et ω = 2πν = [vu l’Eq. 623] = 2π(énergie)/h. En résumé, on trouve que k2 = ω2/c2 est équivalent à p2 = (énergie)2/c2 . Donc, l’équation des ondes électromagnétiques implique la relation entre énergie et quantité de mouvement d’un photon. Cela nous suggère de chercher l’équation des ondes pour les électrons en essayant de reproduire la relation entre leur quantité de mouvement et leur énergie. Prenons le cas d’un électron “libre”, c’est-à-dire non soumis à des forces, pour lequel: (énergie) = p2 2m , (636) et supposons que sa fonction d’onde soit simplement: Ψ = Ψoexp(i(kz - ωt)) , (637) qui est la fonction exponentielle imaginaire (i = unité imaginaire, et Ψ o = constante) correspondant à une fonction sinusoïdale du type Ψ o sin(kz - ω t) (voir le chapitre XLVIII.2). Compte tenu des équations utilisées pour les photons, l’équation des ondes doit avoir la forme suivante: -h2 ∂2Ψ ih ∂Ψ 2 - = 0 ; 8π m ∂ z2 2π ∂ t (638) si l’électron est soumis à des forces conservatives, la relation entre énergie et quantité de mouvement est un peu plus compliquée que l’Eq. 636: (énergie) = p2 2m + U , (639) Giorgio Margaritondo: Ma Physique 461 où U est l’énergie potentielle. Dans ce cas, l’Eq. 638 doit se transformer comme suit: -h2 ∂2Ψ ih ∂Ψ 2 + UΨ - 2π ∂ t = 0 , 8π m ∂ z2 (640) la vérification n’exigeant plus que quelques passages mathématiques élémentaires. L’Eq. 640 est la célèbre “équation de Schrödinger”, d’après le physicien qui la découvrit. Erwin Shrödinger, découvreur de l’équation de base de la physique des ondes des électrons. Pour plusieurs problèmes importants concernant les électrons, la fonction d’onde consiste en deux facteurs séparés, l’un fonction de l’espace et l’autre du temps (l’Eq. 637 en est un exemple): Ψ(z,t) = ψ(z) exp(-iωt) ; (641) dans ces cas, l’Eq. 640 donne: (-h2/8π2m)) (∂2ψ/∂ z2) exp(-iωt) + Uψ exp(-iωt) - (hω/2π) ψ exp(-iωt) = 0 , d’où, ayant noté Ee = hν = (hω/2π) l’énergie totale de l’électron: -h2 ∂2ψ + Uψ = Eeψ ; 2 8π m ∂ z2 (642) cette version simplifiée de l’équation de Schrödinger est utilisée pour la plupart des problèmes importants de la physique des électrons. LXIII.1. Electron “libre” Le premier exemple d’utilisation des équations de Schrödinger concerne un électron libre, non soumis à une force. Force nulle équivaut à énergie potentielle constante, qu’on peut supposer égale à zéro grâce à un choix approprié du point de référence des énergies potentielles. L’Eq. 642 devient alors simplement: -h2 ∂2ψ 2 = Eeψ ; 8π m ∂ z2 la solution est une fonction d’onde du type: (643) Giorgio Margaritondo: Ma Physique 462 ψ = ψoexp(ikz) , (644) à condition que: (h2/8π2m)k2 = E e; compte tenu que (hk/2π)2 = (h/λ)2 = p2 , cette condition équivaut à: p2 2m = Ee , (645) qui est - justement et heureusement - la relation entre quantité de mouvement et énergie (cinétique) d’une particule dotée de masse et non soumise à une force. En ce qui concerne la probabilité d’observer un électron décrit par cette onde, l’Eq. 641 donne: Ψ2 = Ψ*Ψ = ψ*ψ = ψ2 , (646) qui dans ce cas devient: ψ2 = ψo2 , (647) c’est-à-dire une constante! Autrement dit, un électron décrit par la fonction d’onde 644 a la même probabilité d’être observé dans tous les points de l’espace: il est complètement “délocalisé”. Rien de plus éloigné de notre notion conventionnelle de “particule”, infiniment concentrée dans l’espace. Pour obtenir un électron moins délocalisé, il faut utiliser une somme (ou une intégrale) de fonctions du type de l’Eq. 644. Puisqu’il s’agit de fonctions oscillatoires, cette opération est réglée par le théorème de Fourier. LXIII.2. Electron dans une boîte Passons maintenant à un système-modèle qui sert à traiter, de façon approximative, plusieurs systèmes réels, notamment quand un électron est confiné dans une région limitée de l’espace. Il faut noter que la technologie actuelle peut fabriquer de très minces dispositifs de ce type. Le système “électron dans une boîte” est illustré par la Fig. 200: on voit, en haut et à gauche, la partie de l’axe z entre -L/2 et +L/2 où l’électron est confiné. Dans cette région, l’électron n’est pas soumis à des forces, donc l’énergie potentielle est constante: on la suppose égale à zéro. L’équation de Schrödinger est l’Eq. 643 (électron libre) et ses solutions sont fournies par l’Eq. 644. Mais attention! La fonction ψ doit être nulle tant pour z = -L/2 que pour z = +L/2, ce qui n’est pas directement possible avec des fonctions du type de l’Eq. 644. Il faut utiliser des combinaisons linéaires de ces fonctions. Essayons les plus simples d’entre elles: ψ = ψo(exp(ikz) + exp(-ikz)) = 2ψocos(kz) ; (648) ψ = ψo(exp(ikz) - exp(-ikz)) = 2iψosin(kz) ; (649) La condition ψ(±L/2) = 0 donne pour toutes les deux: kL = nπ ; (650) Giorgio Margaritondo: Ma Physique 463 il faut souligner que, pour l’Eq. 648, on a n = 1, 3, 5..., tandis que, pour l’Eq. 649, n = 2, 4, 6...; globalement, chaque état quantique n〉 est identifié par une des valeurs: n = 1, 2, 3, 4, 5, 6,... (651) énergie n=4 -L/2 0 +L/2 z |ψ|2 n=1 ψ n=3 z z n=2 |ψ|2 n=2 ψ z 0 n=1 z Fig. 200: Problème de l’électron dans une boîte à une dimension, ses deux premières solutions et ses quatre premiers niveaux quantisés d’énergie. donc, les valeurs possibles du nombre d’onde k sont: π k = n L , avec n = 1, 2, 3, 4, 5, 6... (652) Les fonctions d’onde pour n=1 et n=2 sont illustrées par la Fig. 200 (gauche), avec leurs carrés. Quelle est la conséquence de ce résultat? L’énergie de l’état n〉 est toujours donnée par l’Eq. 645, valable pour un électron libre. Les équations p = h/λ et k = 2π/λ donnent: h p = 2π k , (653) Donc, chacune des valeurs de k spécifiées par l’Eq. 652 correspond à un niveau quantisé d’énergie: Giorgio Margaritondo: Ma Physique 464 p2 h 2 k2 h 2 n2 Ee = 2m = 2π 2m = 2L 2m , avec n = 1, 2, 3, 4, 5, 6...; (654) les quatre premiers niveaux sont illustrés à droite de la Fig. 200. Notons que ces niveaux sont très différents par rapport à ceux de l’atome de Bohr. La différence entre les deux premiers niveaux de l’Eq. 654 est 3 × (h/2L)2/2m ≈ 1,8 × 1037/L2 joule. Si nous prenons une boîte “macroscopique”, disons avec L = 0,01 m, cette différence déevient extrêmement petite, et les effets quantiques sont négligeables. Par contre, pour une boîte de dimension “atomique”, soit avec L ≈ 0,5 Å = 0,5 × 10-10 m, la différence devient ≈4,5 × 10-18 joule, ordre de grandeur comparable aux énergies des niveaux atomiques. Par conséquent, les effets quantiques ne sont pas négligeables. C’est une des formes du “principe de correspondance”. L’analyse des carrés ψ2 révèle un point intéressant: il ne changent pas en fonction du temps. Or, ψ(z)2 est proportionnel à la probabilité de détecter l’électron au point z. En multipliant par -e, on obtient donc la distribution dans l’espace de la charge de l’électron. Donc, chaque état quantique correspond à une distribution de charge stationnaire, qui ne change pas par rapport au temps. D’autre part, la condition pour l’émission d’ondes électromagnétiques est qu’une charge électrique soit accélérée; donc, une distribution stationnaire ne peut pas produire une émission d’ondes c’est-à-dire de photons. Si l’électron dans la boîte reste dans un état quantique, il ne perd pas d’énergie: c’est le même résultat que pour l’atome de Bohr. Pour celui-ci, pourtant, l’émission (ou l’absorption) de photons peut avoir lieu si le système “saute” d’un état à l’autre, c’est-à-dire d’un niveau quantisé d’énergie à l’autre. L’électron dans la boîte a la même propriété; essayons de comprendre pourquoi. Prenons le “saut” du niveau E i au niveau E j (avec E i > E j ). Les fonctions d’onde correspondantes peuvent être dérivées de l’Eq. 641: Ψi(z,t) = ψi(z) exp(-iωit) ; Ψj(z,t) = ψj(z) exp(-iωjt) ; (655) Pendant le “saut”, on peut supposer que la fonction d’onde Ψ(z,t) soit une combinaison de celle de départ Ψi et d’arrivée Ψj: Ψ(z,t) = Aψi(z) exp(-iωit) + Bψj(z) exp(-iωjt) ; (656) la distribution de charge est proportionnelle au carré de cette onde: Ψ 2 = Ψ*Ψ = (Aψi*(z) exp(iωit) + Bψj*(z) exp(iωjt))(Aψi(z) exp(-iωit) + Bψj(z) exp(-iωjt)) = Aψi2 + Bψj2 + (AB)(exp(i(ωi-ωj)t) + exp(-i(ωi-ωj)t)) = constantes + AB cos((ωi-ωj)t). Par ailleurs, les pulsations ωi et ωj sont liées aux énergies par ωi = 2πνi = 2πEi/h et ωj = 2πEj/h, donc: 2π(Ei-Ej)t , distribution de charge = constantes + C cos h (657) Giorgio Margaritondo: Ma Physique 465 où C est une constante. L’équation 657 révèle que pendant le “saut” la distribution de charge n’est plus stationnaire, mais soumise à des oscillations de fréquence ν = ((E iEj)/h)). Ces oscillations peuvent produire une émission d’ondes électromagnétiques d’égale fréquence, c’est-à-dire de photons d’énergie hν donnée par l’équation: hν = Ei-Ej ; (658) c’est donc la raison pour laquelle les “sauts” quantiques donnent lieu à une émission de photons, dont l’énergie est égale à la différence entre le niveaux initial et final. LXIII.3. Oscillateur quantique En mécanique (chapitres II.8, IV en général et plus spécifiquement IV.7) nous avons discuté les propriétés des oscillateurs aonsi que leur importance, notamment en tant que modèles approximatifs des systèmes proches de l’équilibre. Ceux-ci comprennent les liaisons chimiques des molécules et des solides; par exemple, la chaleur spécifique des solides (loi de Dulong-Petit) se justifie en considérant ceux-ci comme des ensembles d’oscillateurs. Mais quelque chose cloche: quand nous avons calculé la chaleur spécifique d’un gaz parfait, nous avons considéré les énergies cinétiques de déplacement et de rotation des molécules, mais sans tenir compte de l’énergie liée aux oscillations des atomes dans les molécules. Néanmoins, les résultats étaient en accord avec les expériences (du moins, celles à la température ambiante: des déviations peuvent être observées à basse température). La solution de ce paradoxe nous est fournie par la théorie quantique des oscillateurs. Le point de départ en est l’équation de Schrödinger, Eq. 642; la fonction énergie potentielle peut être dérivée de la Fig. 20: U = kz2/2 = [vu l’Eq. 38] = mω2z2/2. L’Eq. 642 devient alors: mω2z2 -h2 ∂2ψ 2 + 2 ψ = Eeψ . 8π m ∂ z2 (659) Les équations différentielles du type de l’Eq. 659 ontz été analysées par les mathématiciens, qui en ont déduit les solutions ψ et leurs propriétés. Nous nous limiterons à mentionner deux points: (1) les solutions de l’Eq. 659 sont basées sur ce qu’on appelle “fonctions de Hermite”; (2) chaque fonction correspond à un état quantique n〉, identifié par la valeur du nombre quantique n et correspondant à un niveau quantifié d’énergie: 1 h Ee(n) = n + 2 2π ω , où n = 0, 1, 2, ...; (660) les quatre premiers de ces niveaux sont illustrés par la Fig. 201. Il faut souligner que l’état d’énergie minimale (n = 0) correspond au niveau E e(n) = (1/2)(h/2π)ω, appelé “énergie de point zéro” et qui n’est pas une valeur nulle. Ceci ne correspond pas du tout à notre expérience quotidienne: si l’on prend un pendule, le Giorgio Margaritondo: Ma Physique 466 minimum de son énergie correspond à l’état de manque total de mouvement, avec énergie nulle. Par contre, un oscillateur quantique ne peut pas avoir moins d’énergie que le “point zéro”; c’est une des conséquences du principe d’indétermination. Pour un oscillateur sur l’axe z, l’Eq. 633 implique: ∆pz∆z ≥ h/2π ; (661) d’autre part, un manque absolu de mouvement impliquerait ∆pz = 0 et ∆z = 0, en conflit avec l’Eq. 661. Utilisons alors celle-ci pour estimer la valeur minimale de l’énergie. énergie n=4 n=3 Fig. 201: Niveaux d’énergie d’un oscillateur quantique. Il faut noter que le niveau le plus bas ne correspond pas à une énergie nulle. n=2 n=1 0 Supposons que l’état correspondant implique une oscillation classique z = zosin(ω t); l’énergie mécanique est Ee(0) = mω2zo2/2. L’oscillation cause une indétermination dans la position ∆z ≈ zo. A cause des changements continus de vitesse, l’oscillation implique également une incertitude pour la quantité de mouvement, égale à m multiplié par l’incertitude de la vitesse, ωzocos(ωt). L’ordre de grandeur de celle-ci est ωzo; donc, ∆pz ≈ mωzo. L’Eq. 661 donne alors, à la limite: h/2π ≤ ∆pz∆z ≈ zo × mωzo = mωzo2 = 2Ee(0)/ω ; et donc: Ee(0) ≈ (1/2)(h/2π)ω , (662) qui est, effectivement, l’énergie de point zéro. Mais pourquoi, alors, l’oscillation de “point zéro” n’est-elle pas visible lorsqu’on observe, par exemple, un pendule sans mouvement? Celui-ci nous paraît bel et bien Giorgio Margaritondo: Ma Physique 467 immobile dans son état d’énergie minimale! La solution de ce paradoxe est fournie par la grandeur de l’oscillation de “point zéro”. Prenons un pendule avec m = 1 kg et ω ≈ 5 s-1; son énergie de point zéro est E e(0) = (1/2)(h/2π) ω ≈ 2,6 × 10-34 joule, qui donnerait une oscillation de l’ordre de (2 Ee(0)/mω2)1/2 ≈ 4,5 × 10-18 mètres, dont l’observation est absolument impossible. Par contre, si nous prenons un atome dans une molécule, avec m de l’ordre de 10-26 kg et ω de l’ordre de 1014 s-1, l’oscillation de point zéro devient ≈0,1 Å, qui est une fraction non négligeable des dimensions atomiques. La quantisation de l’énergie d’oscillation révélée par l’Eq. 660 joue un rôle important dans la théorie des chaleurs spécifiques. Dans le chapitre XXV, nous avons discuté la loi de Dulong et Petit en prenant comme modèle de solide un ensemble de 3N oscillateurs. On a pourtant vu (chapitre XXV.1) que cette approche ne fonctionne pas à basse température. La raison en est, justement, la quantisation des niveaux d’énergie. A température élevée, l’énergie thermique moyenne kT est beaucoup plus grande que la différence entre deux niveaux d’énergie quantisés, et la quantisation a des effets négligeables. Mais si la température diminue, l’énergie thermique moyenne ne suffit même pas pour produire le plus petit changement possible de l’état de vibration, qui est le “saut” d’un niveau quantisé d’énergie au suivant. Dans ce cas, l’excitation de vibrations n’est plus en mesure de contribuer à la chaleur spécifique, et une diminution de la chaleur spécifique doit être observée. A basse température (kT < ((h/2π)ω), il faut alors abandonner le modèle de Dulong et Petit, qui donne une chaleur spécifique indépendante de la température; un modèle quantique justifie la dépendance expérimentale de la température, qualitativement illustrée par la Fig. 202. Il faut noter que l’annulation de la chaleur spécifique à T = 0 élimine le problème concernant le point zéro de l’entropie (théorème de Nerst), discuté dans le chapitre XXIV. Les chaleurs spécifiques des gaz parfaits ont été dérivées en négligeant les vibrations des atomes des molécules. Cette approximation est justifiée si la température n’est pas trop élevée, parce que les phénomènes thermiques ne modifient pas l’état quantisé de vibration. cv 3R Fig. 202: Chaleur spécifique molaire d’un solide en fonction de la température, avec une diminution à basse température et une tendance asymptotique au résultat du modèle de Dulong et Petit à haute température. T Giorgio Margaritondo: Ma Physique 468 A titre d’exemple, dans le cas de molécules d’hydrogène la distance minimale entre deux niveaux d’énergie d’oscillation est de l’ordre de 10-19 joule, et la valeur correspondante de kT implique une température de l’ordre de plusieurs milliers de degrés. Donc, il est justifié de négliger les vibrations moléculaires. LXIII.4. Effet “tunnel” Ce phénomène est l’une des conséquences les plus surprenantes de la nature ondulatoire des électrons. En jettant une masse macroscopique (par exemple, une balle de tennis, Fig. 203 en haut) contre un verre, on constate que, si celui-ci ne se casse pas, la balle rebondit. Il n’existe que deux possibilités: soit la balle rebondit, soit elle passe de l’autre côté. Par contre, quand un rayon de lumière arrive sur un verre (Fig. 203, au centre), il se partage en deux: une partie passe au travers, l’autre est réfléchie. Un tel phénomène est-il concevable pour des électrons? Prenons un électron qui voyage vers une barrière d’énergie (potentielle), illustrée par la Fig. 203 en bas, de hauteur U. L’électron arrive avec une énergie (cinétique) E e < U, donc insuffisante, selon les règles de la physique classique, pour passer la barrière. balle de tennis verre lumière énergie électron U Ee 0 0 L z Fig. 203: En haut et au centre: la physique classique prévoit une différence claire entre le comportement des masses et des ondes lorsqu’elles arrivent sur une barrière. En bas: l’effet tunnel quantique permet à un électron de passer à travers une barrière, ce qui serait impossible pour la physique classique. Adoptons maintenant le point de vue “ondulatoire” de la physique quantique. Dans la région z < 0, on trouve un électron libre, dont la fonction d’onde est donnée par l’Eq. 644; Giorgio Margaritondo: Ma Physique 469 ψ = ψoexp(ikz) , où, vu l’Eq. 645, k = 2π/λ = 2πp/h = ( 2π/h)√ 2mEe , (663) et donc: ψ = ψoexp(i( ( 2π/h)√ 2mEe )z) . (664) Quand l’électron pénètre dans la barrière, son énergie mécanique totale doit se conserver, donc elle est toujours égale à Ee. Cependant, en calculant le nombre d’onde k à partir de l’énergie cinétique, il faut soustraire de Ee l’énergie potentielle U, et l’Eq. 663 devient: 2m(Ee-U) = ( 2π i/h)√ 2m(U-Ee) , k = 2π/λ = 2πp/h = ( 2π/h)√ (665) donc la fonction d’onde doit s’écrire: ψ = ψoexp(-( ( 2π/h)√ 2m(U-Ee) )z) . La différence entre cette fonction d’onde et celle de l'Eq. 666 est que la deuxième est une fonction exponentielle complexe, dont le carré est une constante (Eq. 647): ψ2 = ψo2 , tandis que la deuxième est une simple fonction exponentielle dont l’argument est négatif, donc le carré décroît de valeur lorsque z augmente. Ceci révèle la difficulté de l’électron à pénétrer dans une barrière épaisse. Cependant, à la fin de la barrière (z = L) le carré de l’onde n’est pas nul: on a donc une probabilité non nulle d’observer l’électron au-delà de la barrière. Plus spécifiquement, l’onde à la fin de la barrière est: ψ ( L) = ψoexp(-( ( 2π/h)√ 2m(U-Ee) ) L) , et son carré est: ψ2 = ψo2 exp(-( ( 4π/h)√ 2m(U-Ee) ) L) ; (666) essayons de comprendre ce résultat: ψ 2 correspond à la probabilité d’observer l’électron au-delà de la barrière; cette probabilité doit être mesurée en observant le comportement d’un grand nombre d’électrons. Si nous envoyons un faisceau d’électrons vers la barrière (Fig. 193, en bas) une partie d’entre eux sont détectés audelà de la barrière, ce qui nous permet de vérifier la validité de l’Eq. 666. Par contre, pour la physique classique la probabilité de cet événement serait strictement nulle. L’Eq. 666 prévoit que la probabilité de passage à travers de la barrière par “effet tunnel” diminue de façon exponentielle en fonction de (1) la largeur de la barrière et (2) la racine carrée de la différence entre la hauteur de la barrière et l’énergie des électrons. On peut ainsi comprendre pourquoi les phénomènes d’“effet tunnel” ne sont pas observés dans le monde macroscopique. Par exemple, si nous décidons de passer une Giorgio Margaritondo: Ma Physique 470 barrière de H = 2,5 mètres, dont la largeur est 30 cm, et nous arrivons à une vitesse de 5 m/s, notre énergie (vu que notre masse est de l’ordre de 102 kg) est mv2/2 ≈ 1,25 × 103 joule, la hauteur en énergie potentielle de la barrière est mgH ≈ 2,45 × 103 joule, et le facteur exponentiel de l’Eq. 666 devient ≈ exp(-2,8 × 1036), une quantité extrêmement petite. D’autre part, le facteur exponentiel de l’Eq. 666 correspond au rapport ψ2/ψo2 , c’est-à-dire au rapport entre les probabilités d’observation après ou avant la barrière; donc, la probabilité qu’on puisse passer à travers la barrière par effet tunnel est absolument négligeable (il faudrait plutôt essayer de sauter la barrière en nous exerçant pour les prochains jeux olympiques). Remarquons que la constante h joue un rôle important dans l’Eq. 666: sa grandeur détermine la probabilité de l’effet tunnel, et la rend minime pour des objets macroscopiques comme nous. La situation change radicalement en considérant un phénomène au niveau microscopique. Par exemple, supposons qu’un électron d’énergie Ee ≈ 0,8 × 10-19 joule arrive sur une barrière d’épaisseur “atomique”, de l’ordre de L ≈ 10 Å = 10-9 m, et de hauteur U = 1,6 × 10-19 joule. L’Eq. 666 donne ψ2/ψo2 ≈ 0,07%, ce qui n’est plus négligeable. Donc, l’effet tunnel devient une réalité pour les électrons et les autres particules du monde microscopique. Cet effet est même une telle réalité que, grâce au travail scientifique de MM. Rohrer et Binnig de IBM à Zürich, il peut être utilisé dans un des instruments les plus intéressants de la recherche sur les matériaux: le microscope à balayage à effet tunnel (STM = scanning tunnel microscope). Le principe de fonctionnement de ce remarquable instrument est illustré à la Fig. 204. générateur de tension instrument de mesure du courant dispositif de balayage pointe échantillon Fig. 204: A gauche: principe de fonctionnement du microscope à effet tunnel à balayage (STM). A droite: exemple d’image STM révélant des atomes individuels. On peut voir à gauche une pointe ultramince montée sur un dispositif de balayage, capable de se déplacer avec une précision de l’ordre d’une fraction d’ångstrom grâce à des systèmes piezoélectriques. La pointe se trouve à une infime distance des atomes de la surface d’un échantillon; à cause de cette distance, une barrière s’oppose au passage des électrons de la pointe à l’échantillon et vice versa. Donc, même en tenant compte des effets du générateur de tension, la physique classique ne pourrait pas justifier la détection d’un courant dans le circuit de la Fig. 204. Giorgio Margaritondo: Ma Physique 471 Mais la physique quantique, grâce à l’effet tunnel entre pointe et échantillon, n’a aucun problème à justifier ce courant. L’Eq. 666 montre que l’effet dépend très fortement (de façon exponentielle) de l’épaisseur de la barrière, c’est-à-dire de la distance entre pointe et échantillon. Donc, même les moindres variations de distance, causées par la forme des atomes, peuvent modifier le courant d’effet tunnel. Heinrich Rohrer et Gerd Binnig, scientiques qui, travaillant à la compagnie IBM à Rüschlikon, ont inventé le microscope à effet tunnel à balayage. En balayant la pointe, on modifie sa position de manière à garder le courant d’effet tunnel. Ceci implique également que la distance par rapport à la surface de l’échantillon demeure constante: on obtient ainsi une “image” des ondulations de la surface au niveau atomique, qu’il est possible de visualiser avec un ordinateur. La Fig. 204 montre la micrographie STM de la surface d’un métal, révélant sa structure atomique. Le microscope STM est rapidement devenu l’application pratique la plus importante de l’effet tunnel. Il faut toutefois mentionner que d’autres applications importantes existent, notamment les diodes à effet tunnel en microélectronique. Le Coin Yankee: Mécanique ondulatoire Electron libre Boîte Effet tunnel Microscope à effet tunnel à balayage Wave mechanics Free electron Box Tunneling Scanning Tunnel Microscope (STM) “First of all, one must stress that the lowest-energy state (n = 0) corresponds to the level Ee(n) = (1/2)(h/2π)ω, which is not zero energy. This does not match at all our daily experience: if one considers a pendulum, the minimum of its energy is given by the state with absolute lack of motion, which implies zero mechanical energy”. Giorgio Margaritondo: Ma Physique 472 Le coin des unités et des ordres de grandeur: Ordres de grandeur: Dans l’étude des propriétés atomiques, on utilise souvent des unités pratiques, qui n’appartiennent pas au système SI mais qui sont plus proches des grandeurs atomiques que les unités SI. Par exemple, les longueurs (y compris les longueurs d’onde) sont mesurées en ångstroms (1 Å = 10-10 m), et les énergies en électronvolts (1 eV = énergie d’un électron après l’avoir accéléré avec une chute de potentiel de 1 V ≈ 1,6 ¥ 10-19 joule). La transformation de l’énergie en longueur d’onde est dérivée, comme nous l’avons vu, des relations entre énergie et quantité de mouvement. On peut pourtant accélérer les calculs en mémorisant de simples règles numériques: longueur d’onde d’un photon en ångstrom ≈ 12’400/(énergie en eV). longueur d’onde d’un électron en ångstrom ≈ 12/√ (énergie en eV) . Giorgio Margaritondo: Ma Physique 473 LXIX. Atomes, éléments et liaisons chimiques Le chapitre LX.1.3 ne nous a donné qu’une idée très approximative des propriétés des atomes. Nous avons besoin d’un cadre plus complet avant de discuter la table périodique des éléments et leurs propriétés chimiques. Malheureusement, la théorie quantique des atomes n’est pas simple: la théorie générale des ondes des électrons présentée à une dimension doit être formulée à 3 dimensions, ensuite il faut écrire l’équation de Schrödinger en utilisant l’énergie potentielle d’un électron soumis à la force de Coulomb du noyau et des autres électrons, et en trouver les solutions. Afin de simplifier notre analyse, nous ne dériverons pas ces solutions: nous nous limiterons à en présenter les propriétés principales. En trois dimensions, le nombre quantique n ne suffit pas à identifier l’état quantique de l’atome d’hydrogène. En fait, le même niveau d’énergie pourrait être donné aussi bien par une trajectoire circulaire de l’électron que par des trajectoires elliptiques, chacune correspondant à un état quantique différent. Le type de trajectoire doit donc être identifié par un deuxième nombre quantique, s’ajoutant au nombre n. De façon similaire, il faut utiliser d’autres nombres quantiques pour identifier d’autres caractéristiques de l’état quantique. Tout bien considéré, l’identification des états de l’atome d’hydrogène doit se baser sur trois nombres quantiques, qu’on appelle n, l et m. Leurs valeurs possibles sont: n = 1, 2, 3, ... l = 0, 1, ... (n-1) m = 0, ±1,...±l ; (667) par exemple, n = 2 peut correspondre aux valeurs suivantes de l: 0 ou 1; à son tour, l = 0 ne permet que la valeur m = 0. Par contre, pour l = 1 on peut triuver m = 0, ±1. Donc, n = 2 ne correspond plus à un seul état quantique, mais à quatre états. En physique et en chimie, on utilise des noms conventionnels pour ces états atomiques, composés de la valeur du nombre n suivie d’une lettre identifiant la valeur du nombre l, selon le schéma suivant: l=0→ l=1→ l=2→ l=3→ lettre “s” lettre “p” lettre “d” lettre “f” . Donc, par exemple, n = 3 donne lieu aux états 3s, 3p et 3d, tandis que l’état 3f n’existe pas. Notons, par ailleurs, que chacun de ces “états” est réellement un ensemble d’états, en raison des différentes valeurs possibles du troisième nombre quantique m. Par exemple, 3d est l’ensemble de cinq états correspondant aux valeurs m = 0, ±1, ±2. En ce qui concerne les énergies, tous les états de l’atome d’hydrogène correspondant à la même valeur du nombre n ont la même énergie, spécifiée par l’Eq. 628 (en négligeant de petites corrections qui ne nous concernent pas). Pourtant, ce résultat n’est pas valable pour les autres éléments: par exemple, les états 2s et 2p ont des énergies très différentes. Chaque état atomique correspond à une certaine fonction d’onde ψ, dont le carré ψ2 est proportionnel à la distribution dans l’espace de la charge électronique. Ce point de Giorgio Margaritondo: Ma Physique 474 vue est entièrement différent de celui de l’atome de Bohr, qui considère l’électron comme une particule bien localisée en mouvement sur une trajectoire. Dans les atomes à électrons “ondulatoires”, la distribution de charge spécifiée par ψ2 n’est plus celle d’un électron localisé. Si l’on veut imaginer les électrons d’un atome, il ne faut pas les considérer comme des particules, mais plutôt comme des “nuages” de charge, appelés “orbitaux”. Chaque état quantique correspond à un orbital d’une certaine forme et symétrie. Plus spécifiquement, forme et symétrie du “nuage” de charge sont déterminées par le nombre quantique l. La forme des orbitaux, dont quelques exemples sont illustrés à la Fig. 205, joue un rôle central dans la création des liaisons chimiques. état "s" z y x états "p" z z y x z y x y x Fig. 205: Orbitaux électroniques correspondant aux états quantiques de type s et p (l = 0 et l = 1). On peut constater que l’orbital de type “s” est de symétrie sphérique, tandis que les orbitaux “p” ont une forme caractéristique qui rappelle celle d’une saucisse. LXIX.1. Principe de Pauli, le spin et la table périodique des éléments Nous possédons maintenant presque tous les instruments pour comprendre la propriété fondamentale des éléments: la “périodicité” de leurs propriétés chimiques. Giorgio Margaritondo: Ma Physique 475 Celle-ci a été empiriquement découverte par Mendeleiev, et utilisée comme guide pour prévoir et chercher les éléments correspondant à des places “vides” de la table périodique. D’autre part, la périodicité ne peut pas être justifiée sans la physique quantique. Pour attaquer ce problème, il faut tout d’abord comprendre que les propriétés chimiques d’un atome sont déterminées par les électrons des orbitaux “externes”, correspondant aux plus hauts niveaux d’énergie. Ce fait fondamental est une conséquence de la grandeur des énergies des liaisons chimiques. Celle-ci peut être estimée par des considérations élémentaires. Par exemple, les réactions chimiques qui incitent notre peau à “bronzer” exigent des photons ultraviolets, ce qui implique des énergies de l’ordre de 10-18- 10-19 joule. Comparons cette grandeur aux énergies typiques d’un atome, essentiellement de trois types: les énergies des particules dans le noyau, celles des électrons “profonds” et l’énergie des électrons “de valence”, qui peuvent participer aux liaisons chimiques. Considérons tout d’abord l’énergie liant les particules dans le noyau: les expériences de physique nucléaire montrent qu’elle dépasse l’énergie des liaisons chimiques d’un facteur >105; par conséquent, le noyau ne joue aucun rôle en chimie. Analysons maintenant l’énergie des niveaux électroniques “profonds”; le plus profond est celui de l’état 1s, dont l’énergie est dérivée de l’Eq. 628, avec n = 1: - me4 ; E1s = Z2 2(2hεo)2 (668) notons le facteur Z2 qui n’était pas présent pour l’atome d’hydrogène (Eq. 628). Sa justification est la suivante: dans l’atome d’hydrogène, l’énergie potentielle est causée par la force de Coulomb noyau-électron, qui contient un facteur (-e × e) = -e2; son carré donne le facteur e4 de l’Eq. 628. Mais si en passant de l’hydrogène aux autres éléments, la charge du noyau est Ze au lieu de e, Z étant le “nombre atomique” de l’élément (nombre total d’électrons, égal au nombre de protons du noyau), d’où le facteur Z2e4 de l’Eq. 668. Dimitri Mendeleiev, qui découvrit sur un plan essentiellement empirique la périodicité des propriétés chimiques des éléments, dont la justification est fournie par la physique et la chimie quantiques. Puisque Z peut varier de quelques unités jusqu’à 92 (uranium), le facteur Z2 augmente la grandeur de l’énergie d’ionisation d’un facteur 10-104 par rapport à la valeur de l’hydrogène, 2,2 × 10-18 joule. Donc, l’énergie du niveau “profond” 1s est de 10-17-10-14 joule, trop élevée pour jouer un rôle en chimie. Giorgio Margaritondo: Ma Physique 476 En passant du niveau 1s aux autres états quantiques, la grandeur de l’énergie d’ionisation diminue, pour deux raisons principales: premièrement, on doit tenir compte du nombre quantique n, qui (Eq. 628) introduit un facteur (1/n2) dans l’Eq. 668. De plus, un électron est soumis à la fois à la force du noyau et aux interactions avec les autres électrons de l’atome. On peut imaginer que la charge du noyau “vue” par un électron est partiellement annulée par la charge des autres électrons; par conséquent, la grandeur de son énergie (d’ionisation) diminue. L’importance de cet effet dépend du type d’orbital de l’électron; la Fig. 206 montre, par exemple, la correspondance qualitative entre le niveau n = 4 de l’atome d’hydrogène et les quatre niveaux 4s, 4p, 4d et 4f des autres atomes. Pourtant, même en tenant compte de ces diminutions, l’énergie d’ionisation d’un niveau “profond” est toujours élevée par rapport aux énergies des liaisons chimiques, et donc les états “profonds” ne contribuent pas à celles-ci. Seuls les électrons dont l’énergie d’ionisation n’est pas trop élevée par rapport à celle des liaisons chimiques peuvent participer à leur formation. On appelle ceux-ci “électrons de valence”. Cette analyse nous met face à un apparent paradoxe. Un système physique tend toujours à diminuer son énergie pour atteindre un état stable d’équilibre (c’est ce que nous faisons en nous asseyant). On pourrait en conclure que tous les électrons d’un atome tendent à occuper le niveau 1s, qui est le plus bas en énergie. Mais dans ce cas, on n’aurait pas d’électrons de valence et la chimie n’existerait pas! énergie n=4 4f 4d 4p 4s hydrogène autres atomes Fig. 206: Séquence qualitative des niveaux d’énergie des états électroniques d’un atome différent de l’hydrogène (à droite), correspondant à l’état n = 4 de l’hydrogène (à gauche). La solution de ce paradoxe fut trouvée par Wolfgang Pauli de l’ETH-Zürich, en introduisant dans la physique quantique ce qui est appelé justement le “principe de Pauli”. Il s’agit d’une règle qui limite le nombre d’électrons pouvant occuper un état quantique: chaque état ne peut accueillir plus de deux électrons. Par exemple, le niveau 1s d’un atome ne peut être occupé par plus de deux électrons. La même conclusion est valable pour les niveaux 2s et 3s. Mais si nous considérons le niveau 2p, nous constatons qu’il correspond réellement à trois états (parce que le Giorgio Margaritondo: Ma Physique 477 nombre m a trois valeurs possibles: 0, ±1). Donc, le niveau 2p peut accueillir jusqu’à 6 électrons. De même, les niveaux 3d et 4d peuvent en accueillir jusqu’à 10 chacun. Pourquoi cette limite de deux électrons par état? Cette valeur deux peut paraître un peu curieuse: pourquoi pas trois ou cinq électrons par état? Qu’y a-t-il de spécial pour le nombre deux? En réalité, chaque état ne peut être occupé que par un seul électron. Mais chacun des états que nous avons trouvés précédemment est réellement l’ensemble de deux états différents. La justification en est fournie par un quatrième nombre quantique s’ajoutant à n, l et m: le nombre s (spin) qui n’a que deux valeurs possibles: s = ±1/2. Par exemple, 1s n’est pas un seul état, mais l’ensemble de deux états, l’un avec s = -1/2 et l’autre avec s = 1/2; chaque état ne peut être occupé que par un seul électron, et donc les états 1s peuvent accueillir jusqu’à deux électrons. Chaque nombre quantique est associé à une des caractéristiques du mouvement classique des électrons de l’atome: par exemple, le nombre l correspond au caractère elliptique de la trajectoire classique. A quelle propriété de mouvement correspond alors le nombre s? Il faut réaliser que l’électron n’est pas réellement un point géométrique, mais plutôt une très petite boule; cette boule peut tourner autour d’un de ses axes; ce mouvement de rotation (de spin) correspond au nombre quantique s.7 LXIX.1.1. “Construction” de la table périodique Grâce au principe de Pauli, nous sommes enfin en mesure de “construire” la table périodique et de justifier les tendances générales des propriétés chimiques des éléments. Le premier pas est l’atome d’hydrogène, dont le seul électron se trouve dans l’état 1s. Si l’on passe à l’hélium, avec deux électrons, on ajoute un deuxième électron dans le même état 1s, remplissant complètement celui-ci. 7 Puisque M. Pauli était un membre de l’institution soeur de l’EPFL, nous nous sentons obligés d’approfondir un peu la discussion de son principe. Tout d’abord, le spin n’est pas une invention “ad hoc” pour justifier ce principe, mais une conséquence de la relativité d’Einstein. La théorie ondulatoire de l’électron se basant sur les équations de Schrödinger n’est pas une théorie relativiste, c’est-à-dire invariable pour la transformation de Lorentz. La théorie quantique relativiste a été developpée par Paul A. M. Dirac, et l’existence du spin est une de ses prévisions. Deuxièmement, le principe de Pauli est lié à une propriété curieuse des électrons: on ne peut pas les distinguer l’un de l’autre. Donc, si l’on prend un système contenant plusieurs électrons, son état quantique ne peut pas changer si l’on echange un électron avec un autre. Considérons la fonction d’onde de l’état, Φ(...a,...b,...), où on a donné les étiquettes “a” et “b” aux deux électrons concernés; son carré ne peut pas changer si nous echangeons les deux électrons: |Φ(...b,...a,...)|2 = |Φ(...a,...b,...)|2. Mais cette condition est valable pour Φ(...b,...a,...)= Φ(...a,...b,...) comme pour Φ(...b,...a,...)= -Φ(...a,...b,...); dans le premier cas l’onde est symétrique par rapport à l’echange des électrons, et dans le deuxième antisymétrique. Le principe de Pauli implique des fonctions d’onde antisymétriques par rapport à l’echange de deux électrons. Supposons maintenant que Φ(...a,...b,...) = ψ(...a,...b,...)S(...a,...b,...), où ψ est la fonction d’onde du type Schrödinger et S est le facteur tenant compte du spin; si les deux électrons se trouvent dans le même état en ce qui concerne ψ, par exemple l’état 2s, alors ψ (...b,...a,...) = ψ (...a,...b,...); la condition Φ (...b,...a,...) = -Φ (...a,...b,...) implique S(...b,...a,...) = -S(...a,...b,...); autrement dit, si un électron a s=1/2, l’autre doit avoir s=-1/2, en accord avec le principe de Pauli. Remarquons que le mouvement de rotation de spin implique un moment magnétique microscopique; si le système se trouve dans un état pour lequel ψ(...b,...a,...)= -ψ(...a,...b,...) pour toutes les paires d’électrons, alors S(...b,...a,...) = S(...a,...b,...), ce qui exige que les spins soient tous alignés dans la même direction. La justification de l’existence des aimants est la suivante: le principe de Pauli élimine la tendence des moments magnétiques microscopiques des électrons à s’aligner dans des directions opposées. Giorgio Margaritondo: Ma Physique 478 Or, un état atomique complètement rempli est très stable, et il est difficile de le changer par la formation de liaisons chimiques. Donc, un atome d’hélium ne se lie pas à d’autres atomes: on l’appelle un “gaz noble”. L’élément suivant est le lithium, qui a trois électrons, deux dans l’état 1s (qui correspond à un niveau profond et ne joue pas de rôle en chimie) et le troisième dans l’état 2s. La configuration stable serait plutôt d’avoir, comme pour l’hélium, les états n = 1 complètement remplis et les états n = 2 complètement vides. Donc, le lithium tend à “perdre” son électron 2s, c’est-à-dire à devenir un ion positif. Cette tendance peut amener à la formation de liaisons chimiques du type “ionique” avec des éléments de tendance complémentaire. Considérons le gaz noble néon et l’élément fluor, qui ont 10 et 9 électrons par atome. Avec 10 électrons, on peut complètement remplir les états n = 1 (2 électrons 1s) et n = 2 (2 électrons 2s et 6 électrons 2p); puisque le néon est un gaz noble, cette configuration doit être très stable. Avec 9 électrons, le fluor est très proche de cette stabilité, ayant 7 électrons dans les états n = 2; donc, il tend à retenir un électron supplémentaire pour ces états, devenant ainsi un ion négatif. Ces tendances complémentaires montrent que le lithium et le fluor peuvent facilement se lier l’un à l’autre et former des cristaux de fluorure de lithium (LiF). Le transfert d’un électron d’un atome de lithium à un atome de fluor provoque une attraction électrostatique entre les ions positif et négatif ainsi formés. Ce mécanisme justifie les propriétés des liaisons ioniques. Par exemple, l’attraction électrostatique est affaiblie par la présence d’eau, en raison de sa constante diélectrique relative très élevée, d’où la solubilité dans l’eau des cristaux ioniques comme le sel de cuisine. Les propriétés chimiques des éléments sont principalement déterminées par le nombre d’électrons occupant les états de type s et p de plus haute énergie. Par conséquent, tous les atomes avec un seul électron dans ces états doivent avoir des propriétés similaires à celles du lithium; c’est ce qu’on observe empiriquement pour les éléments du groupe I de la table périodique, dits “métaux alcalins”: lithium, sodium, potassium, etc. Des considérations similaires et complémentaires sont valables pour les éléments du groupe VII, les “halogènes” (fluor, chlore, brome, etc.) et pour les gaz nobles du groupe VIII (hélium, néon, argon, etc.). En passant du lithium (groupe I) au fluor (groupe VII) et au néon (groupe VIII), on trouve un série d’éléments de la table périodique: béryllium (groupe II), bore (groupe III), carbone (groupe IV), azote (groupe V), oxygène (groupe VI); l’ensemble, de ces éléments constitue la première période de la table de Mendeleiev. Leurs propriétés chimiques changent progressivement à cause du remplissage des niveaux n = 2. Le nombre d’éléments dans la période est évidemment déterminé par le nombre maximal d’électrons qui peuvent occuper les niveaux n = 2, c’est-à-dire 8 électrons (2 pour 2s et 6 pour 2p). On passe ensuite à la deuxième période qui commence avec le sodium du groupe I, et se termine avec le gaz noble argon, en remplissant progressivement les niveaux 3s et 3p. Mais attention: les niveaux avec n = 3 comprennent aussi les états 3d; donc, la période se termine avant d’avoir complètement rempli tous les états n = 3. L’énergie des niveaux 3d est moins élevée que celle des niveaux 4s et 4p: on commence donc par remplir ceux-ci, et par “construire” la troisième période de la table, avant d’arriver aux niveaux 3d. La période correspond au remplissage des niveaux 4s et 4p. Après avoir mis 2 électrons dans ceux-ci, et ainsi formé l’élément calcium du groupe II, on arrive à l’énergie des niveaux 3d. Il faut donc “suspendre” le remplissage des niveaux 4s et 4p, et commencer à remplir les niveaux 3d. Ceux-ci peuvent être occupés Giorgio Margaritondo: Ma Physique 479 au maximum par 10 électrons (puisque l = 2 correspond à m = 0, ±1, ±2); ainsi on trouve dans la table périodique dix éléments de la quatrième période (dits “métaux de transition”) caractérisés par des propriétés similaires. Après avoir complètement rempli les niveaux 3d, on reprend le remplissage des niveaux 4s et 4p, terminant ainsi la première période “longue” de la table. Tout compris, on trouve 8+10 = 18 éléments se trouvent dans cette quatrième période. Il faut noter qu’à ce point nous n’avons encore rempli ni les niveaux 4d ni les niveaux 4f. On doit appliquer à la prochaine (cinquième) période une analyse assez similaire à celle de la période précédente. La cinquième période comprend 18 éléments, dont 8 liés au remplissage des niveaux 5s et 5p, et 10 métaux de transition liés au remplissage du niveau 4d. Pourtant, à la fin de cette période les niveaux 4f ne sont pas encore remplis, et les niveaux 5d sont également vides. Ceux-ci sont remplis pendant la construction de la prochaine (sixième) période, qui comprend: 8 éléments pour remplir les niveaux 6s et 6p, 10 métaux de transition liés au remplissage des niveaux 5d, et quatorze éléments liés au remplissage des niveaux 4f. Ceux-ci sont appelés “lanthanides”, parce que le remplissage des niveaux 4f commence avec l’élément lanthane. Tout compris, la sixième période comprend 32 éléments. Nous arrivons ainsi à la septième et dernière période, qui ne comprend que 6 éléments, jusqu’à l’uranium qui est l’élément naturel comprenant le plus grand nombre d’électrons (92); ensuite, nous ne trouvons que des éléments produits artificiellement. La procédure pour construire la table périodique peut être résumée comme suit (chaque élément étant identifié par le nombre total d’électrons, c’est-à-dire par son “nombre atomique”): 1 3 11 19 37 55 87 4 12 20 38 56 88 21 39 57 89 30 48 80 5 13 31 49 81 6 14 32 50 82 7 15 33 51 83 8 16 34 52 84 9 17 35 53 85 lanthanides: 63 64 65 66 67 68 69 70 71 22 40 72 métaux de transition: 23 24 25 26 27 28 41 42 43 44 45 46 73 74 75 76 77 78 58 59 60 61 62 29 47 79 2 10 18 36 54 86 actinides: 90 91 92 LXIX.2. Liaisons chimiques covalentes La discussion de la table périodique nous a aussi donné une idée, même simplifiée, du mécanisme de formation de liaisons chimiques ioniques. Il existe d’autres types de liaisons chimiques à analyser; leur stabilité, c’est-à-dire l’énergie nécessaire pour les rompre, peut être comparable et même plus élevée que les liaisons ioniques. Les plus importantes sont les liaisons covalentes, caractérisant des solides aussi stables et durs que le diamant. Les liaisons ioniques ne peuvent jouer aucun rôle dans la formation du diamant, vu que celui-ci ne contient que des atomes de carbone: il n’existe aucune raison pour le transfert d’électrons d’un atome à un autre atome du même élément. Giorgio Margaritondo: Ma Physique 480 Analysons le mécanisme de formation des liaisons covalentes, en prenant l’exemple le plus simple possible: une molécule ionisée d’hydrogène, formée par deux protons et un seul électron. On voit dans la Fig. 207 la molécule décomposée (1 atome d’hydrogène plus un proton, soit un ion H+). Qu’est-ce qui peut “convaincre” les deux protons et l’électron de se “marier” en formant la molécule H2+? Il nous faut un mécanisme diminuant l’énergie à cause de la formation de la molécule. Il est à noter que l’énergie potentielle électrostatique de l’électron diminue dans la région entre les deux protons quand ils se rapprochent (Fig. 207, centre). Prenons maintenant les fonctions d’onde des états fondamentaux 1s des atomes d’hydrogène, ψ 1 et ψ 2: la partie en bas de la Fig. 207 montre (quoique de manière très simplifiée) comment ces deux fonctions d’onde peuvent être combinées pour obtenir la fonction d’onde ψ de la molécule. H+ H H2+ + d énergie potentielle ψ1 »d d ψ2 ψ1−ψ2 2 ψ1+ψ22 Fig. 207: Analyse simplifiée de la formation de la liaison chimique de la molécule H2+. Les deux protons ne peuvent pas être distingués l’un de l’autre; donc, le carré de la fonction d’onde combinée ne peut pas changer si l’on échange les deux protons. Cette condition peut être respectée en prenant une des deux combinaisons illustrées par la figure: ψ = ψ1 + ψ2 ou ψ = ψ1 - ψ2. Plus spécifiquement, la figure illustre les carrés de ces combinaisons (pour simplifier l’analyse, les fonctions d’onde 1s ont été simulées par des fonctions constantes dans des Giorgio Margaritondo: Ma Physique 481 régions sphériques). On constate que la distribution |ψ1 + ψ2 |2 concentre beaucoup de charge dans la région entre les deux atomes, où la proximité des deux protons tend à diminuer l’énergie potentielle de la charge électronique. Donc, l’énergie du système peut effectivement diminuer en liant ses trois composantes, c’est-à-dire en formant la molécule H2+. La diminution est plus importante si la distance d entre les protons diminue, parce que cela fait baisser l’énergie potentielle électronique dans la région entre les noyaux (Fig. 207, centre). Qu’est-ce qui empêche alors cette distance de continuer à diminuer jusqu’à s’annuler? C’est la répulsion électrostatique entre les deux protons. L’action combinée des deux facteurs d’attraction et de répulsion détermine l’énergie potentielle en fonction de la distance d. Le résultat équivaut à ce que nous avons discuté dans le chapitre IV.7 (Fig. 26). Remarquons l’existence d’une valeur d’équilibre de la distance d, et de vibrations autour de celle-ci (vibrations quantisées, comme discuté dans le chapitre LXIII.3.) Linus Pauling, pionnier de la théorie quantique des liaisons chimiques, et un de ses autographes. Plusieurs des propriétés dérivées pour la molécule H2+ s’appliquent également aux autres liaisons covalentes, notamment: • La manipulation des fonctions d’onde des atomes isolés pour construire les fonctions d’onde de la molécule. Cette procédure est appelée “hybridation”. • La concentration par hybridation de charge électronique dans les régions intermédiaires entre les noyaux. Il faut noter la différence par rapport aux liaisons ioniques, qui concentrent la charge des électrons sur les ions négatifs. Il existe pourtant une différence importante entre le cas simple de la molécule H2+ et les autres liaisons covalentes: le mécanisme de répulsion qui empêche les distances entre les atomes de diminuer sans limite. Dans le cas de la molécule H2+, la répulsion est celle (électrostatique) des charges positives des noyaux. Pour les autres atomes, un autre phénomène, lié aux électrons plutôt qu’aux noyaux, s’ajoute à la répulsion de ceux-ci et joue le rôle principal. Prenons, par exemple, une molécule de fluor, F2. Les deux électrons 2s participent à formation de la liaison chimique, tandis que les 2 + 2 = 4 électrons “profonds” 1s ne sont que des témoins passifs, sauf pour l’effet suivant. Giorgio Margaritondo: Ma Physique 482 Supposons que nous pouvons “pousser” un atome contre l’autre jusqu’à leur superposition parfaite: le résultat serait un noyau avec 3 + 3 = 6 protons, c’est-à-dire le noyau de l’élément carbone. Mais l’atome résultat aurait 4 électrons dans l’état 1s, ce qui est défendu par le principe de Pauli. Il faut donc faire monter deux des électrons jusqu’au niveau 2p, ce qui coûte de l’énergie. Donc, l’énergie électronique du système augmente si la distance entre les atomes diminue, ce qui correspond à une force de répulsion. Il faut noter que cette force n’est pas électrostatique: il s’agit d’un effet purement quantique, causé par le principe de Pauli. Nous découvrons, alors, que cette belle invention de M. Pauli n’est absolument pas confinée au domaine aseptique et bizarre de la physique théorique, mais touche des applications bien pratiques. Par exemple: qu’est-ce qui vous permet d’être “assis”, c’està-dire qui empêche les atomes de votre corps de traverser les atomes de la chaise et vous de tomber par terre, ou encore pire de traverser le sol et de tomber au centre de la Terre? Réponse: la répulsion des atomes, qui à son tour est causée par le merveilleux principe de M. Wolfgang Pauli. Le Coin Yankee: Bronzer Niveau profond Electron de valence Spin Principe de Pauli Table périodique Métaux alcalins Halogènes Gaz nobles Hybridation Liaison ionique Liaison covalente To get tanned Core level Valence electron Spin Pauli principle Periodic table Alkali metals Halogens Noble gases Hybridization Ionic bond Covalent bond “As far as the periodicity of the element properties is concerned, one must realize that it is determined by the number of electrons in the highest-in-energy s and p states. As a consequence, all atoms with only one electron in these states must have properties similar to those of lithium; this is what one observes empirically for the elements of group 1, the “alkali metals”, including lithium, sodium, potassium, etc. Similar and complementary considerations are valid for the group 7 elements, the “halogens“ (fluorine, chlorine, bromine, etc.) and for the noble gases of group 8 (helium, neon, argon, etc.).” Giorgio Margaritondo: Ma Physique 483 Le coin des unités et des ordres de grandeur: Ordres de grandeur: Mesurées en eV, les grandeurs des énergies des électrons de valence se situent entre 0,1 et 20-30 eV; celles des niveaux de coeur entre 5 et 105 eV; les grandeurs typiques des liaisons chimiques se situent entre 0,1 et 2030 eV. Giorgio Margaritondo: Ma Physique 484 LXX. Molécules et solides Les électrons de valence formant les liaisons chimiques déterminent la plupart des propriétés importantes des molécules et des solides (une exception est fournie par les propriétés thermiques, liées aux vibrations des noyaux). Par exemple, les propriétés optiques - notamment, la couleur - comme les propriétés de transport électrique sont causées par les électrons de valence et par leurs effets quantiques. Une discussion complète de ces points se situe bien au-delà des objectifs de ce cours: nous nous limiterons à une discussion qualitative de quelques exemples. Supposons que des ondes électromagnétiques, c’est-à-dire des photons, sont absorbés par des molécules dans un gaz: quels sont les mécanismes quantiques responsables de leur absorption? Tout d’abord, comme pour les atomes, on peut exciter le “saut” d’un électron d’un niveau quantique à un autre. Les niveaux moléculaires sont différents par rapport à ceux des atomes isolés. Néanmoins, les différences en énergie entre les niveaux sont du même ordre, typiquement quelques eV pour les niveaux de valence, et jusqu’aux dizaines de milliers d’eV pour les niveaux profonds, qui ne changent pas beaucoup par rapport aux atomes isolés. Quels types de photons absorbés correspondent à ces “sauts” d’énergie? Ceux de la lumière visible se situent à 2-3 eV; à plus haute énergie on trouve les rayons ultraviolets (de 3 à 20 eV environ), puis les rayons X, ces derniers exigeant l’intervention de niveaux profonds. Peut-on absorber des photons de plus basse énergie? La réponse est positive: tout d’abord, quelques “sauts” entre des niveaux électroniques arrivent jusqu’au domaine de l’infrarouge. Mais celui-ci est plutôt dominé par un autre phénomène: les changements des niveaux (quantiques) d’énergie de vibration. On peut analyser ce phénomène en appliquant les propriétés des oscillateurs quantiques (chapitre LXIII.3) aux oscillations des distances entre les atomes. Le “saut” entre deux niveaux consécutifs de vibration est hν, où ν est la fréquence de vibration. Vu les grandeurs typiques de celles-ci, les “sauts” correspondent à des photons infrarouges. Nous avons ainsi découvert pourquoi le rayonnement infrarouge “chauffe”, par exemple celui du soleil ou d’un bon feu de cheminée. L’étude de l’absorption et de l’émission de photons (étude qu’on appelle “spectroscopie”) est un des instruments principaux utilisés pour analyser les propriétés des états électroniques et de vibration des molécules et des solides. LXX.1. Solides: de très grandes molécules Considérer les solides comme de grandes molécules peut nous aider à comprendre plusieurs de leurs propriétés. Par exemple, l’analyse des propriétés optiques liées à l’absorption de photons peut largement se baser sur celle des molécules. Voyons comment. Prenons un exemple de solide représentant une famille importante de matériaux: un cristal de silicium (Si), c’est-à-dire un isolant électrique du type appelé semiconducteur. Un atome de Si contient 14 électrons, dont 10 électrons profonds du type 1s, 2s et 2p, et 4 électrons de valence des états 3s et 3p. Les fonctions d’onde 3s et 3p sont transformées par hybridation lors de la formation des liaisons chimiques du cristal, donnant lieu à des états appelés “sp 3 ”; les distributions de charge électronique de ces états sont Giorgio Margaritondo: Ma Physique 485 concentrées le long des quatre directions d’un tétraèdre ayant pour centre l’atome de Si (Fig. 208, à gauche et au centre). Par conséquent, la structure du cristal se base sur une coordination tétraédrique des atomes (voir encore la Fig. 208); il s’agit d’une structure “ouverte”, avec beaucoup d’espace vide entre les atomes, ce qui contribue à la basse densité du silicium. Quelles sont les conséquences de l’hybridation en ce qui concerne les niveaux d’énergie? Pour les molécules, nous avons vu que: • L’hybridation crée des états quantiques d’énergie moins élevée que les niveaux des atomes isolés. • La diminution d’énergie est obtenue grâce à une redistribution de la charge des électrons, qui favorise les régions à basse énergie potentielle entre les atomes. Si Fig. 208: A gauche: géométrie des liaisons chimiques du silicium, dont les directions correspondent aux quatre coins d’un tétraèdre centré sur l’atome de Si; au centre: distributions de charge des orbitaux correspondants (sp3 ); à droite: structure d’un cristal de Si. Il faut pourtant mentionner deux autres points importants: • L’hybridation ne produit pas seulement des états de plus basse énergie que les états atomiques. On en obtient aussi de plus haute énergie ou d’énergie comparable; par exemple, la fonction d’onde ψ1 - ψ2 de la Fig. 207 ne peut pas réduire l’énergie, parce que sa densité de charge est très limitée dans la région entre les atomes. Les états qui diminuent l’énergie par rapport aux niveaux des atomes isolés sont appelés états de “liaison”, ceux qui augmentent l’énergie états d’“anti-liaison” et ceux qui changent peu l’énergie des états de “non-liaison”. La condition de diminution de l’énergie est satisfaite si les états de liaison sont remplis et ceux d’anti-liaison vides, ce qui est le cas des états ψ1 + ψ2 et ψ1 - ψ2 de la molécule H2+. • Si l’on considère un solide, le nombre d’électrons occupant les états hybridés de liaisons est beaucoup plus élevé que pour de simples molécules (telles que H2+, O2 ou Cl2 ). Le principe de Pauli ne permet pas à plus de deux électrons d’occuper chaque niveau quantique; donc, pour accueillir un nombre très élevé d’électrons on ne peut pas utiliser des niveaux isolés. On a plutôt des séquences ou “bandes” de niveaux; chaque niveau est si proche du suivant qu’on peut considérer chaque “bande” comme un domaine continu d’énergies. Ce dernier point est illustré par la Fig. 209, qui présente une comparaison des niveaux de la molécule H2+ et des bandes d’un cristal de silicium. On voit, en particulier, les deux bandes de liaison et d’anti-liaison du cristal, appelées “bande de conduction (vide) et Giorgio Margaritondo: Ma Physique 486 “bande de valence” (entièrement remplie d’électrons). Les deux bandes sont séparées par une région sans niveaux permis (quantiques) d’énergie, qu’on appelle “gap interdit”. L’existence des bandes et du “gap” permet de comprendre la plupart des propriétés importantes des solides, et en particulier celles traitées ici, liées à l’absorption de photons. énergie Si H2+ bande de conduction ψ1−ψ2 1s "gap" interdit 3s, 3p ψ1+ψ2 bande de valence Fig. 209: A gauche: la formation de la liaison chimique de la molécule H2 + change les niveaux atomiques 1s des fonctions d’onde ψ1 et ψ2, donnant lieu à un niveau (de liaison) d’énergie moins élevée, ainsi qu’à un niveau (d’antiliaison) d’énergie un peu plus élevée. Le niveau de liaison est rempli par deux électrons tandis que celui d’anti-liaison est vide; par conséquent, l’énergie du système diminue quand la liaison est créée. A droite: mécanisme similaire de formation des liaisons d’un cristal de silicium. Il faut noter que, à cause du très grand nombre d’électrons, il n’y a pas de niveaux, mais plutôt des “bandes”: la bande de valence (entièrement remplie) et la bande de conduction (vide). Analysons la simple expérience illustrée par la Fig. 210. Un rayon de lumière arrive sur une tranche de silicium: quels sont les effets possibles? Premièrement, si la tranche a une surface plate de type “miroir”, une partie du faisceau peut être réfléchie. Si la surface n’est pas de type “miroir”, il y a de la diffusion au lieu de la réflexion. Mais la partie restante du faisceau n’est ni réfléchie ni diffusée; elle pénètre dans la tranche de silicium, et peut la traverser intégralement, ou être absorbée, partiellement ou totalement. Remarquons que plusieurs phénomènes ont lieu en même temps: le faisceau peut être partiellement réfléchi et partiellement absorbé et/ou transmis. Tous ces phénomènes dépendent de l’énergie des photons, qui est elle-même liée à la fréquence. Analysons, par exemple, les phénomènes d’absorption, illustrés par la Fig. 210 (en haut à droite, et en bas). Pour être absorbé par la tranche de silicium, un photon doit céder son énergie à un électron, qui doit “sauter” d’un état occupé (énergie Ei), par exemple un état de la bande de valence, à un état vide (énergie E f) de la bande de conduction. Mais le “saut” n’est possible que si le photon fournit une énergie plus élevée que la valeur minimale de la différence Ef - Ei. Il est évident (Fig. 210) que cette valeur minimale coïncide avec la largeur du “gap” interdit. D’où la conclusion fondamentale illustrée par la partie inférieure de la Fig. 210: Giorgio Margaritondo: Ma Physique 487 seuls les photons d’énergie hν ≥ E g , c’est-à-dire les ondes de fréquence ν ≥ E g /h, peuvent être absorbés par le solide. Ceci justifie une série de phénomènes de la vie quotidienne: pour le silicium, la fréquence limite Eg/h se situe dans l’infrarouge, donc la lumière visible est entièrement absorbée, ce qui est facile à constater. De plus, le phénomène de réflexion est lié à celui d’absorption: par exemple, de bons miroirs très réfléchissants sont fabriqués en recouvrant du verre avec une couche mince d’un matériau absorbant la lumière (noir). Donc, la propriété du silicium d’absorber la lumière correspond également à une forte réflexion/diffusion, ce qui justifie la couleur gris-noire de ce solide. photons Ef hν absorption bande de conduction Eg Ei réflexion et diffusion transmission bande de valence absorption Eg hν Fig. 210: En haut, à gauche: un faisceau de lumière (photons) qui arrive sur une tranche de silicium peut être soumis à plusieurs effets: réflexion et diffusion, absorption et transmission. Ces effets peuvent être simultanément présents. A droite: l’absorption a lieu grâce à des “sauts” d’électrons des états de la bande de valence à ceux de la bande de conduction. En bas: l’absorption ne peut avoir lieu que si l’énergie du photon est plus grande que la largeur du “gap” interdit. Par contre, un matériau à gap large, tel que le sel de cuisine, est transparent et sans couleur: la raison en est que la fréquence limite E g /h se situe dans l’ultraviolet, et aucune partie du visible n’est absorbée. Quant à l’apparence “métallique” des métaux, elle est justifiée par le fait que la largeur de leur gap est nulle. Ceci introduit la relation entre les bandes d’énergie et la conduction électrique. Voyons pourquoi le silicium n’est pas un conducteur. La loi d’Ohm prévoit qu’un courant électrique est créé par une chute de potentiel le long de l’échantillon. Sans chute de potentiel, les états électroniques occupés ne produisent globalement pas de courant. La raison en est la symétrie du cristal, qui correspond à une symétrie de l’ensemble de ses Giorgio Margaritondo: Ma Physique 488 états électroniques: un courant dans une direction spécifique serait en conflit avec cette symétrie d’ensemble. Afin de créer un courant, la chute de potentiel appliquée au solide doit donc rompre la symétrie. Mais cela n’est pas possible pour un isolant tel que le silicium, parce que tout changement de l’étal global des électrons exige, à cause du principe de Pauli, un transfert d’électrons des états occupés aux états vides. A son tour, ce transfert exige une énergie plus grande que la largeur du gap interdit. L’application de la chute de potentiel ne fournit pas une telle énergie, donc la symétrie ne peut pas être rompue et il n’y a pas de courant. Par contre, les métaux tels que l’aluminium ou l’or n’ont pas de gap, donc la plus faible quantité d’énergie peut rompre la symétrie d’ensemble des états électroniques, et créer du courant. L’absence de gap interdit est justifiée par le caractère des liaisons chimiques des métaux, très différent des liaisons covalentes et ioniques. Les états hybrides correspondants sont fortement délocalisés, avec une distribution de charge électronique beaucoup plus homogène, ce qui ne permet pas l’existence du gap interdit. John Bardeen, qui avec William Shockley and Walter Brattain inventa le transistor, sur la base de la théorie quantique des semiconducteurs, à la formulation de laquelle il avait beaucoup contribué. Il développa ensuite la théorie des supraconducteurs à basse température. Cette même ligne logique nous permet de comprendre une propriété générale de la nature. La largeur du gap pour les matériaux isolants est indirectement liée à la distance entre l’énergie “moyenne” des états de la bande de valence et l’énergie “moyenne” de ceux de la bande de conduction. A son tour, cette distance est déterminée par l’énergie “moyenne” des liaisons chimiques; donc, une largeur plus élevée du gap implique souvent une plus grande énergie de liaison, et donc un système (solide) plus stable. On peut ainsi comprendre l’abondance relative des isolants électriques. LXX.1.1. Impuretés Mais comment justifier le fait qu’une grande partie de ces matériaux ne sont pas transparents? Il faut introduire dans notre analyse les impuretés. Celles-ci peuvent changer localement le mécanisme de formation des liaisons chimiques, produisant des états qui ne sont ni de “liaison” ni d’“anti-liaison”, mais de caractère intermédiaire, et dont l’énergie peut se trouver dans le gap interdit. Les “sauts” des électrons concernant ces états peuvent permettre l’absorption de lumière visible, qui serait transmise par le solide pur. On peut ainsi comprendre l’apparence colorée ou même métallique de matériaux isolants qui, si ils étaient purs, seraient transparents. Giorgio Margaritondo: Ma Physique 489 Prenons, par exemple, le quartz (SiO2 ), qui est un des matériaux isolants les plus importants pour ses applications industrielles. A l’état pur, il est parfaitement transparent et sans couleur. Mais des impuretés et d’autres défauts justifient l’apparence colorée d’échantillons tels que le “quartz rose” ou le “quartz améthyste”, utilisés en bijouterie. Les impuretés mettent à notre disposition un instrument d’importance capitale pour transformer et maîtriser les propriétés des solides. Elles sont à la base d’applications industrielles qui ont radicalement changé notre vie quotidienne, à partir des utilisations des “semiconducteurs” en microélectronique et pour les ordinateurs. LXX.1.2. Phénomènes quantiques macroscopiques La discussion des solides nous permet de clarifier la nature “microscopique” de la physique quantique. Les phénomènes quantiques sont confinés au monde microscopique en raison de la grandeur de la constante de Planck. On peut donc affirmer que le comportement d’objets microscopiques tels que les atomes est intrinsèquement quantique. Mais attention: cette conclusion n’implique pas que tous les phénomènes quantiques sont négligeables pour les objets macroscopiques. Nous avons vu, par exemple, que la couleur ou le comportement électrique d’un solide macroscopique sont liés aux phénomènes quantiques de ses composantes microscopiques. Donc, le comportement macroscopique révèle souvent des effets quantiques de niveau microscopique. D’autre part, des phénomènes quantiques individuels tels que l’effet tunnel sont négligeables pour les objets macroscopiques. Mais il existe des exceptions, c’est-à-dire des phénomènes dans lesquels un objet macroscopique se comporte lui-même de façon quantique. Il s’agit de phénomènes d’une grande importance pratique et industrielle, et extrêmement intéressants pour la science fondamentale, dont l’exemple principal est fourni par les supraconducteurs. Dans un matériau supraconducteur, les électrons qui contribuent au courant électrique ne se comportent plus comme des particules individuelles mais plutôt, à cause de phénomènes de nature parfaitement quantique, comme un ensemble extrêmement coordonné. Ceci permet d’annuler la résistance électrique et d’avoir des courants sans chute de potentiel, en conflit avec la loi d’Ohm des métaux conventionnels. Vu leur extrême importance, les phénomènes quantiques macroscopiques constituent un des sujets de recherche les plus actifs, avec des ramifications dans plusieurs domaines hors de la physique, notamment en biologie, en chimie, en science de matériaux et en informatique. Giorgio Margaritondo: Ma Physique 490 Le Coin Yankee: “This last point is illustrated by Semiconducteur Semiconductor Fig. 209, which shows the Etat de liaison Bonding state comparison between the levels of the Etat d’anti-liaison Antibonding state H2+ molecule and those of a silicon crystal. One can see, in particular, Bande de valence Valence band the two bands, bonding and Bande de Conduction band antibonding, of the silicon crystals; conduction these two bands are called the (fully Gap interdit Forbidden gap occupied) ‘valence band’ and the Impureté Impurity (empty) ‘conduction band’, Supraconducteur Superconductor separated by a region of forbidden energies, called the forbidden gap. ” Le coin des unités et des ordres de grandeur: Ordres de grandeur: Mesurée en eV, la largeur du gap interdit peut varier de zéro (pour les métaux) à 0,1-2,5 eV (pour les semiconducteurs) et à plusieurs eV (pour les isolants proprement dits). Giorgio Margaritondo: Ma Physique 491 LXXI. Noyau et particules élémentaires La physique du monde microscopique ne se limite pas au traitement des électrons; elle a clarifié une grande partie des propriétés des autres composantes des atomes: les noyaux et les particules élémentaires qui les composent. A l’origine, les atomes étaient considerées comme des objet indivisibles, c’est-à-dire comme les véritables “composantes élémentaires” qui forment la matière. Ensuite, on réalisa que les atomes sont eux-mêmes formés de composantes plus “élémentaires”: les électrons et les noyaux. A ce jour, les électrons sont considérés comme de véritables “particules élémentaires”, sans de composantes encore plus “élémentaires”. Par contre, les noyaux sont constitués par des particules plus élémentaires qu’on appelle “protons” et “neutrons”. Le noyau du plus léger des éléments, l’hydrogène, est un proton, de charge électrique +e et de masse presque équivalente à celle de l’atome tout entier. Les autres noyaux sont formés par plusieurs protons, ce qui soulève au moins trois problèmes. Premièrement, la charge totale d’un noyau doit être équivalente celle des électrons de l’atome correspondant: on peut ainsi évaluer combien de protons se trouvent dans le noyau. Pourtant, la masse totale d’un atome, qui est proche de celle du noyau parce que la masse des électrons est très petite, est beaucoup plus grande que celle des protons. La solution de ce paradoxe est que le noyau contient aussi des particules appelées “neutrons”, de masse similaire aux protons mais sans charge. Le deuxième problème est la distance très limitée entre les protons d’un noyau: leurs charges électriques toutes positives provoquent une forte répulsion électrostatique. Cette répulsion ne peut pas être compensée par l’attraction de gravitation entre les masses des protons, parce que sa grandeur est beaucoup moins élevée. Il faut alors considérer d’autres forces d’attraction entre les protons (et les neutrons) du noyau. Une analyse complète des phénomènes nucléaires révèle deux types de forces qui s’ajoutent aux forces électromagnétiques et de gravitation: les “interactions faibles” et les “interactions fortes”. Les “interactions fortes” justifient la stabilité des noyaux en créant une liaison entre protons et neutrons, neutralisant ainsi la répulsion électrostatique des protons. Le troisième problème réside dans la nature des protons et des neutrons: sont-ils des particules élémentaires comme les électrons? La réponse est négative: protons et neutrons ont une structure interne, et sont “formés” par des particules encore plus élémentaires. Cette même conclusion s’applique à la majorité des particules qui furent appelées “élémentaires” il y a trente ans. La structure et les propriétés des particules sont actuellement justifiées par la théorie dite “modèle standard”. LXXI.1. “Quarks” et modèle standard L’hypothèse de base du modèle standard est l’existence des “quarks”. Ceux-ci sont des particules réellement élémentaires formant les protons, les neutrons et plusieurs autres particules. On peut grouper toutes les particules en trois grandes familles: • Bosons de “gauge” (jauge), tels que les photons; Giorgio Margaritondo: Ma Physique 492 • Leptons, tels que les électrons; • Hadrons, famille qui à son tour comprend les mésons et les baryons. Les protons et les neutrons sont des baryons. Les bosons de “gauge” sont les particules responsables des interactions (forces) entre les leptons, les hadrons et les objets formés par ceux-ci. Les leptons et les hadrons comprennent les particules - électrons, protons et neutrons - formant la plupart de la matière. Les leptons sont des particules réellement élémentaires, tandis que les hadrons sont formés par des “quarks”. LXXI.1.1. Bosons de “gauge” (jauge) La physique moderne justifie toutes les forces en utilisant des particules du type bosons de “gauge” comme “médiateurs” entre les objets concernés. Chaque type de force correspond à un type spécifique de particules médiatrices. Par exemple, les forces électromagnétiques utilisent les photons. On a déjà vu plusieurs exemples d’action de ceux-ci, par exemple l’absorption et l’émission d’ondes électromagnétiques. Mais leur rôle est beaucoup plus général: tout phénomène impliquant des forces électromagnétiques entre deux objets peut être justifié en imaginant que le premier objet émet continuellement des photons (virtuels) qui sont absorbés par le deuxième, et viceversa. La force électromagnétique est “transmise” par ces photons. Des mécanismes similaires sont responsables detous les autres types de force. Pour la gravitation, les particules médiatrices sont les “gravitons” (nons encore observés). Pour les forces nucléaires “fortes” ce sont les “gluons” et pour les forces nucléaires faibles les particules W+, W- et Zo. Un avantage fondamental de cette approche est l’unification progressive des forces. Le premier pas vers l’unification est la théorie de Maxwell, qui permet la description unifiée des forces électriques et magnétiques. Les forces électriques et magnétiques sont la manifestation d’une seule entité: le champ électromagnétique. La plupart des physiciens sont de l’opinion que cette unification comprendra dans le futur tous les types de force. Récemment, ce point de vue a été renforcé par un grand succès: la théorie unifiée des forces électromagnétiques et nucléaires faibles. Développée par Weinberg, Salam et Glashow et complétée par 't Hooft, cette théorie a été définitivement prouvée par la découverte des particules W+ , W- et Zo , obtenue au CERN à Genève par l’équipe dirigée par M. Carlo Rubbia. Mais l’unification complète n’est pas encore été achevée, même si cet objectif est un des points focaux de la recherche actuelle. LXXI.1.2. Leptons “Lepton” est un nom d’origine grecque qui signifie “particule légère”; en réalité, il existe des particules encore plus légères (les photons, par exemple, de masse nulle): le mot “lepton” signifie des particules légères par rapport aux hadrons (en grec, les particules “lourdes”). Tous les leptons sont de véritables particules élémentaires, sans composantes. Giorgio Margaritondo: Ma Physique 493 Il existe douze leptons; premièrement, trois particules chargées: électron, µ et τ. Chacune d’elles est associée à un lepton du type “neutrino” (particules légères et neutres). Chacune de ces six particules peut être associée à une “anti-particule” de masse égale et de charge électrique inverse. Par exemple, l’électron est associé à une anti-particule de charge +e, le “positron”. Le chemin vers l’unification des forces électromagnétiques et nucléaires faibles: Enrico Fermi, auteur de la théorie de la radiation β ; Abdus Salaam, co-auteur de la théorie sur l’unification électro-faible; Carlo Rubbia, qui dirigea l’équipe UA1 au CERN et fournit l’évidence expérimentale de cette unification Découvrons maintenant une propriété importante des leptons en analysant deux phénomènes. Premièrement, l’effet photoélectrique: photon + électron lié → électron libre. Ensuite, l’émission de radiation β: noyau → noyau transformé + électron + anti-neutrino. Quelle est la propriété commune de ces deux phénomènes? Il s’agit de la conservation du “nombre leptonique”, c’est-à-dire du nombre total de leptons moins le nombre total d’anti-leptons. Dans le premier cas, le nombre est 1 avant et après le phénomène, tandis que dans le deuxième, il est zéro; dans les deux cas, il ne change pas. La conservation du nombre leptonique est une règle générale pour tous les phénomènes concernant les leptons. LXXI.1.3. Hadrons Cette famille comprend les mésons (tels que le méson µ et le méson J/ψ) et les baryons (comme le proton, le neutron et les particules “delta”, “gamma” et “sigma”). La terminologie “mésons” et “baryons” signifie que les premiers sont plus légers que les secondes. La théorie des quarks justifie les propriétés des hadrons en supposant que Giorgio Margaritondo: Ma Physique 494 chaque méson est formé de deux quarks (un quark et un anti-quark), tandis que chaque baryon est formé de trois quarks. Le modèle standard se base sur l’hypothèse qu’il existe six quarks, et que chacun d’eux correspond à un anti-quark, au total douze particules. Leurs noms conventionnels sont les initiales des noms en anglais: Quark: Nom en anglais: u up d down c charmed s strange t top b bottom Anti-quark: — u — d — c — s — t — b Ceux et celles qui connaissent l’anglais s’étonneront sans doute de ces noms. Ma suggestion est tout simplement de les ignorer. On pourrait changer les noms des quarks et les appeler, par exemple, François ou Brigitte ou peut-être Sophorin: cela ne changerait pas leurs propriétés. Celles-ci sont déterminées par une série de caractéristiques que nous allons discuter brièvement. Murray Gell-Mann, le théoricien qui proposa pour la première fois l’existence des “quarks” et leur donna leur nom en s’inspirant de la littérature. Tout d’abord, la charge électrique est: 2e/3 pour les quarks u, c et t; -e/3 pour les quarks d, s et b; chaque anti-quark a la charge électrique du quark correspondant, avec — un signe inversé (par exemple, e/3 pour d ). Deuxièmement, le spin est ±1/2 (comme pour les électrons) pour tous les quarks. Ensuite, il faut considérer d’autres propriétés qui créent d’énormes difficultés sémantiques, puisqu’on les identifie par des mots anglais tels que “charm” (charme) ou “color” (couleur). Ne permettez pas à ces noms de créer une confusion dans votre esprit: il ne s’agit que de noms conventionnels. Afin de les comprendre, analysons la propriété qu’on appelle “charge électrique”. Supposons que la charge électrique ne soit pas connue, et donc que personne ne l’ait appelée “charge”. Supposons également que des expériences commencent à révéler les propriétés (électromagnétiques) liées aux charges. Au moment de les baptiser, on Giorgio Margaritondo: Ma Physique 495 choisit avec un peu d’imagination le nom “bonté”; on constate que les objets peuvent posséder tant de la “bonté” (charge positive) que de l’“anti-bonté” ou “méchanceté” (charge négative). Les quantités les plus petites de “bonté” et de “méchanceté” sont celles des quarks, ±e/3 et ±e/3. Il est clair que les propriétés électromagnétiques des objets ne sont absolument pas touchées par l’appellation différente des “charges”. Il est à noter que la nouvelle appellation “Margaritondo” a des avantages sur le plan psychologique (hélas, il est souvent vrai que les bons sont attirés par les méchants et viceversa). Néanmoins, les noms “charge positive” et “charge négative” sont tellement bien établis que personne n’essayera jamais de les remplacer par “bonté” et “méchanceté”. De façon similaire, on ne changera pas les mots “masse” ou “spin”. Mais lors de la découverte de nouvelles caractéristiques, on peut utiliser n’importe quel nom pour celles-ci. En général, on essaie d’utiliser des noms qui facilitent la description des caractéristiques correspondantes. Prenons par exemple la “couleur” des quarks: il s’agit d’une propriété qui n’a rien à voir avec les couleurs de la vie quotidienne, et qui joue pour les forces nucléaires fortes un rôle assez similaire à celui des charges pour les forces électromagnétiques. Par exemple, pour obtenir un atome neutre il faut combiner un nombre égal de charges négatives et positives. De façon similaire, pour obtenir un hadron ou un méson, particules de “couleur neutre” (blanche), il faut combiner des quarks selon les règles de combinaison des couleurs réelles. Les valeurs possibles de couleur sont: “rouge”, “vert” et “bleu” pour les quarks et “anti-rouge”, “anti-vert” et “anti-bleu” pour les anti-quarks. Un méson doit toujours être composé d’un quark d’une certaine couleur et d’un anti-quark de l’anti-couleur correspondante; par exemple, “bleu” et “anti-bleu”, dont la combinaison est neutre (blanc). Par contre, un baryon doit toujours être composé de trois quarks de couleurs différentes (ou par trois anti-quarks d’anti-couleurs différentes). Par exemple trois quarks “rouge”, “vert” et “bleu” donnent un baryon “blanc”. Voilà quelques exemples de composition des hadrons. En ce qui concerne les mésons, la particule π de cette famille se compose d’un quark u d’une certaine couleur et d’un anti— quark d de l’anti-couleur correspondante. Donc, la couleur du méson π est blanche et sa charge électrique est 2e/3 + e/3 = e. Prenons maintenant les baryons: le proton est le résultat de la combinaison (uud), tandis que le neutron est donné par (ddu). Il est facile de vérifier que ces combinaisons donnent les charges correctes. Une dernière question: peut-on vérifier l’existence des quarks en “observant” ces particules? Ces dernières annéess, les journaux ont souvent publié des articles sur la “découverte des quarks”, c’est-à-dire l’observation expérimentale d’une de ces particules. Mais tous ces articles se sont révélés incorrects. La plupart des physiciens sont actuellement de l’opinion que les quarks n’existent que dans les hadrons, en tant que constituants de ceux-ci. Ce point de vue est parfois difficile à accepter, parce que les autres particules peuvent être détectées et observées à l’état libre. Pourtant, il ne pose pas de problème logique. De façon similaire, les propriétés d’un atome ne changeraient même si les électrons qui les forment se révélaient impossibles à détecter à l’état libre. Giorgio Margaritondo: Ma Physique 496 Il faut enfin noter que les forces nucléaires fortes agissant entre les quarks sont très différentes des forces qu’on observe dans la vie quotidienne: les forces de gravitation et électromagnétiques. Celles-ci ont toutes un domaine d’action infini, produisant des effets à grande distance (par exemple, une force de gravitation ≈(1/d2) ne s’annule qu’à distance infinie). Par ailleurs, les forces nucléaires ne fonctionnent qu’à très courte distance, les distances typiques dans les noyaux. Un modèle très simplifié de force nucléaire “forte” est la colle: les protons et les neutrons d’un noyau sont “collés” les uns aux autres par une force énorme. Pourtant, si leur distance augment même de peu, la force devient pratiquement nulle; la répulsion électrostatique des protons produit alors des phénomènes d’instabilité explosive. Pour les quarks, les interactions à courte distance causent le confinement et l’impossibilité de se libérer: un baryon, par exemple le proton se comporte un peu comme un sac pour ses quarks; dans le sac les quarks sont libres, mais ils ne sont pas libres de sortir du sac. Toutes ces propriétés sont justifiées par la théorie appelée “chromodynamique quantique”. Le nom a été suggéré par la théorie correspondante des phénomènes liés aux charges électriques: “électrodynamique quantique”. Pour les forces nucléaires fortes, le rôle des charges est joué par les “couleurs”, et “électrodynamique” devient ainsi “chromodynamique”. Le Coin Yankee: Noyau Particule élémentaire Interaction faible Interaction forte Boson de “gauge” (jauge) Proton Neutron Lepton Hadron Méson Baryon Nucleus Elementary particle Weak interaction Strong interaction “The quark theory justifies the properties of mesons and baryons by Gauge boson assuming that each of the first is formed by two quarks (a quark and Proton an anti-quark) whereas each baryon Neutron is formed by three quarks. ” Lepton Hadron Meson Baryon Giorgio Margaritondo: Ma Physique 497 Le coin des unités et des ordres de grandeur: Ordres de grandeur: Mesurée en eV, l’énergie de liaison d’un proton ou d’un neutron à un noyau est de l’ordre de 1 à 10 millions, donc beaucoup plus grande que l’énergie qui lie un électron à un atome. C’est la raison pour laquelle, d’ordinaire, les réactions chimiques affectent les électrons mais ne touchent pas le noyau. Giorgio Margaritondo: Ma Physique 498 On ne cesse jamais de découvrir Toutes les présentations de la physique, à n’importe quelle époque, peuvent facilement causer un malentendu: l’impression qu tout est découvert et compris. Cela n’a jamais été vrai, et ne l’est certainement pas plus aujourd’hui. La recherche scientifique a amené beaucoup de progrès pendant ce siècle, mais parfois les mystères que nous découvrons sont plus nombreux que ceux que nous pouvons clarifier. Donc, l’aventure de la recherche n’est certainement pas près de se terminer. Par exemple, après des dizaines d’années de recherche dans le domaine des supraconducteurs, les scientifiques de IBM à Zürich dirigés par Alex Müller ont découvert une famille totalement inconnue de ces composés, avec des propriétés absolument étonnantes: les supraconducteurs à haute température. On n’a encore aucune idée du mécanisme qui détermine ces propriétés. Donc, celui qui pense qu’on a tout découvert se fait des illusions et manque de sens des réalités. K. Alex Muller et Georg Bednorz des laboratoires de la compagnie IBM à Rüschlikon: ils découvrirent le phénomène toujours mystérieux de la supraconductivité à haute température. Des découvertes comme celle des supraconducteurs à haute température suggèrent que nous commençons à peine à comprendre les propriétés les plus élémentaires des solides les plus simples et élémentaires: au delà de ces limites, c’est l’inconnu. Des conclusions similaires s’appliquent à tous les systèmes de la matière condensée, et encore plus à ceux de la matière vivante. D’autre part, les systèmes physiques peuvent se comporter de manière non-linéaire, produisant des phénomènes de grande ampleur et imprévisibles suite à des événements d’ampleur limitée. Ceci est vrai, par exemple, pour le système de la météorologie terrestre. On n’a commencé à traiter ce type de phénomènes qu’assez récemment, grâce au début de la “physique du chaos”. Même sur le plan fondamental, notre compréhension du monde physique demeure très limitée. Prenons la physique quantique: elle peut être utilisée pour comprendre et Giorgio Margaritondo: Ma Physique 499 prévoir une grande série de phénomènes, notamment en chimie et en science des matériaux. Mais on a de la peine à justifier les hypothèses fondamentales de cette théorie, notamment le dualisme et le principe de correspondance, et à les comprendre sur le plan philosophique. En résumé: nous sommes bien loin de l’objectif final de la recherche scientifique, et il faut être fort humble face aux mystères d’un univers que nous ne comprenons pas et maîtrisons encore moins. On peut bien arriver sur la lune et y planter un drapeau, mais les être humains qui arrivent à cela sont toujours sujets à la grippe et ne peuvent toujours pas empêcher la chute de leurs cheveux! Quelques mots pour conclure: “Si, par quelque désastre, toute la connaissance scientifique était détruite, et qu’on ne puisse transmettre qu’une phrase à la prochaine génération d’êtres humains, quelle phrase contiendrait la plus grande quantité d’informations dans le plus petit nombre de mots? Je crois qu’il s’agit de l’hypothèse atomique (ou le fait atomique, si vous préférez) que tous les objets sont formés par des atomes -- des petites particules qui sont toujours en mouvement, et qui sont attirées les unes vers les autres quand elles se trouvent à une petite distance, mais qui se révoltent contre toute tentative de les comprimer ensemble.” Richard Feynman Image à résolution atomique d’une superficie solide, obtenue par Rosendo Sanjinés de l’EPFL à l’aide du microscope à effet tunnel. “It is good while it lasts, but it’s damn better when it’s over.” Giorgio Margaritondo Giorgio Margaritondo: Ma Physique 500 Remerciements Prétendant avoir écrit des livres en anglais, en italien et en français, je suis bien au courant d’une règle générale: un livre est toujours écrit par une équipe de plusieurs personnes, dans laquelle le rôle de l’auteur est essentiellement négligeable. Même les classiques ne sont pas une exception: on discute depuis des siècles sur le véritable auteur de Hamlet, et on sait très bien qu’Alexandre Dumas n’a écrit qu’une partie des Trois Mousquetaires. Voilà donc, avec tous les remerciements de l’auteur et - espèrons-le - ceux des étudiants, la liste des vrais responsables: Mme Claude Zwicky, qui a traduit le livre d’un mélange amorphe anglo-franco-italien en vaudois digne d’un vigneron de la Côte; Mme Fabia Gozzo, M. Philippe Alméras, M. Marco Grioni et Mme Ivana Vobornik, qui ont traduit en “mathématiquois” les formules, en ajoutant tous les “π” qui sont si ennuyeux, cependant nécessaires afin d’arriver à des résultats conformes tant à la physique qu’aux règles de la bonne éducation. Ils étaient, bien sûr, des volontaires: j’y ai veillé personnellement. Giorgio Margaritondo: Ma Physique 501 INDEX Page Aberrations Absorption (coefficient de) Absorption de lumière Accélération Accélération centripète Action à distance Adiabatiques (transformations) Alliages Ampère (loi de) Analyse dimensionnelle Angstrom Anti-particules Archimède (principe de) Avion Avogadro (nombre de) 410 421 419, 466, 487 7 23 236 168 156 281 14 158 493 95 101 72, 106 Bande de conduction Bande de valence Baryons Battements Bednorz Bernouilli (théorème de) Binnig Biot et Savart (loi de) Biréfringence Bohr (atome de) Bohr (rayon de) Boltzmann (constante de) Boltzmann (distribution de) Bosons de “gauge” (jauge) Brewster (angle de) Bruit 485 486 493 383 498 100 470 283 398 444 447 118 131 492 395 429 Capacité Carnot (Cycle de) Cave à vin Cavités conductrices Centre de gravité CERN Chaleur Chaleur latente Chaleur spécifique Champ d’induction magnétique Champ électrique 262 187 208 261 74 69 161 158, 193 127, 165, 170, 465 276 235 Giorgio Margaritondo: Ma Physique 502 Champ magnétique Charges électriques Chemin optique Choc (onde de) Choc Chromodynamique quantique Circuits électriques Circulation d’un vecteur Clausius (principe de) Clausius-Clapeyron (équation de) Coefficient d'atténuation acoustique Cohérence Compas gyroscopique Compton (effet) Condensateurs Conduction de chaleur Conductivité Constante diélectrique Constante diélectrique relative Continuité (loi ou équation de) Convection de chaleur Copenhague (interprétation de) Corps noir Correspondance (principe de) Couleur des quarks Coulomb (loi de) Courant de déplacement Courants sinusoïdaux Courants stationnaires Curie (Marie) Curie (température de) Cycles 276 229 390 380 78 496 303 247 174 193 428 368 91 441 262 204 268 229 320 99, 206, 272 201 456 216 452 494 229 344 305 267 458 338 188 De Broglie Décibel Degrés de liberté Densité de courant Déplacement électrique (vecteur) Deuxième principe de la thermodynamique Diagrammes de phase Diamagnétique (matériau) Diffraction Diffusion (équation de) Diffusion Diffusion de lumière Dipôle électrique Dipôle oscillant Dispersion 442 428 128 268 322 173 148, 154 329 364, 443 207 206 441, 486 330 418 387 Giorgio Margaritondo: Ma Physique 503 Distance focale Divergence d’un vecteur Domaines ferromagnétiques Doppler (effet) Dualité onde-particule Dulong et Petit (loi de) 402 210 340 67, 378 440 171 Eau Echelle musicale Echelle tempérée (Werckmeister-Bach) Effet “tunnel” Einstein Electron Electron dans une boîte Electron libre Electrons de valence Emission de lumière Emittance Emittance spectrale Energie cinétique Energie de “point zéro” Energie de ionisation Energie interne Energie libre Energie mécanique Energie potentielle Enthalpie Enthalpie libre Entropie Equation des ondes Equilibre Etat fondamental Etat quantique Etats d’anti-liaison Etats de liaison Etats de non-liaison Eutectique (point) 151, 326 429 430 468 60, 438, 457 437, 442, 460 462 461 476 416, 437, 446, 484 213 214 40 465 447 160 199 40 40, 49 200 200 176 347 49 447 446 485 485 485 155 Fabricants de lentilles (équation des) Faraday-Neumann-Lenz (loi de) Fermat (principe de) Ferromagnétisme Fick (loi de) Fluides Flux d’un vecteur Fonction de distribution Fonctions d’état Force centrifuge 410 292 387 336 222 48, 95 239, 247 121 110 55 Giorgio Margaritondo: Ma Physique 504 Force de Coriolis Force de gravité Force électromotrice Forces centrales Forces d’inertie Forces internes et externes Forces nucléaires fortes et faibles Fourier (loi de) Fourier (théorème de) Fréquence Fresnel (équations de) Frottement 56 18 271 36 53 72 228, 491 204 305 359 393 46 Gap interdit Gauss (loi de) Gaz parfait Gibbs (règle de) Gluons Gradient Grandissement Gravitons Grossissement Groupe (vitesse de) Gyroscopes 486 239 113, 124 151 492 44, 204, 246 402 492 413 384 90 Hadrons Hauteur Heisenberg Huygens et Steiner (théorème de) Huyghens et Fresnel (principe de) Hystérèse magnétique 493 135 230, 450 88 364 337 IBM (Zürich) Images réelles et virtuelles Impédance Impuretés Indétermination (principe de) Induction Induction mutuelle Influence électrique Information Infrarouge Infrasons Intensité Interfaces Interférence Isothermes (transformations) 470, 402 310 488 230, 292 296 259 196 351, 431 353 322, 365 113, 498 450 484 331 165 Giorgio Margaritondo: Ma Physique 505 Joule (effet) 270 Kepler (lois de) Kirchhoff (loi de) Kirchhoff (lois de, pour les circuits) 37 213 273 Lame 1/4 d’onde Laminaire (mouvements) Laplace (équation de) Laplacien Lentilles minces Leptons Liaison chimiques Liaisons chimiques covalentes Liaisons chimiques ioniques Longueur d’onde Lorentz (contraction de) Lorentz (force de) Lorentz (transformation de) Lumière synchrotron Luminance 400 102 254 247 409 492 473, 475 478 479 214, 359, 442 65, 278 276 64 66 213 Malus (loi de) Masse Masse d’inertie Masse de gravitation Maxwell (distribution de) Maxwell (équations de) McLaurin (série de) Mésons Mesures Microscope Microscope à balayage à effet tunnel Miroirs sphériques Modèle standard Molécules Moment cinétique Moment d’inertie Moment magnétique Moyennes Müller 398 7, 17 19 19 124 346 290 493 7 412 470 402 491 50, 127, 484 75 85 288 121 498 Nerst (principe de) Neutrino Neutron Newton (équation des ondes acoustiques de) Newton (loi de) Niveaux d’énergie 184 493 491, 495 426 13 446, 468, 476 Giorgio Margaritondo: Ma Physique 506 Nombre d’onde Nombre leptonique Noyau Nutation 359 493 491 91 Octave Oeil Ohm (loi de) Ondes acoustiques Ondes des électrons Ondes électromagnétiques Ondes longitudinales Ondes planes Ondes sphériques Ondes transversales Onduleurs Optique géométrique Ordre et désordre Oscillateur quantique Oscillations 430 411 267 426 460 347 424 361 362 351, 425 66 402 196 465 29 Paramagnétique (matériau) Particules élémentaires Pascal (principe de) Pauli (principe de) Période Perméabilité magnétique Perméabilité magnétique relative Phase (angle de phase) Phase (vitesse de) Phases (règle des): voir Gibbs (règle de) Photoélectrique (effet) Photon Planck (constante de) Planck (loi de) Planck Point critique Point focal Poisson (équation de) Polarisation circulaire Polarisation de la lumière Polarisation diélectrique Polarisation elliptique Polariseurs Potentiel du champ électrique Précession Premier principe de la thermodynamique Pression 329 491 97 474 14 288 300 30, 309 381 437 439 141, 217, 438, 453 217 438 144 402 254 397 393 318 397 397 253 90 160 95, 107 Giorgio Margaritondo: Ma Physique 507 Pression de vapeur saturante Pression partielle Principe d’équipartition Probabilité Produit scalaire Produit vectoriel Proton Puissance Puissance dissipée Pulsation 148 149 127 131, 456 22, 240 22, 245 495 48 314 30, 306 Quantité de mouvement Quarks 35, 354 491 Rayleigh (loi de) Rayonnement Rayons X Référentiel (changement de) Référentiels d’inertie Réflexion Réflexion totale Réfraction (indice de) Réfraction Relativité d’Einstein Relativité galiléenne Rendement d’un moteur Réseaux de diffraction Résistance Résistance interne Résistivité Résonance Rohrer Rosée Rotationnel d’un vecteur Rubbia Rydberg 419 213 360, 484 53 55 389, 486 389 387 387 60 54 186 371 267 271 268 308 470 148 246 492 446 Scanning tunnel microscope: voir STM Schrödinger (équation de) Self-induction Semiconducteurs Serre (effet de) Seuil d'audibilité Seuil de douleur Silicium Solénoïdes Solides Spectre électromagnétique 461 296 256 219 431 431 484 282 81, 170, 484 359 Giorgio Margaritondo: Ma Physique 508 Spin Spires Stationnaires (mouvements) Stefan (loi de) STM: voir microscope à balayage à effet tunnel Superposition (principe de) Supraconducteurs Suprasaturation Susceptibilité électrique Susceptibilité magnétique Synchrotron (lumière) Système isolé 333, 474 282 99 218 Table périodique des éléments Taylor (série de) Télescope Température Tension triphasée Tensions sinusoïdaux Théorème de la circulation et du rotationnel Timbre Tire bouchon (règle du) Torricelli (théorème de) Toupies Transfert de chaleur Transformateur Transformations réversibles et irréversibles Transitions de phase Travail Turbulence 499, 474 290 414 107, 114, 189 314 305 248 429 248 100 90 201 300 111 147, 151 40, 161 102 Ultrasons Ultraviolet Unités de mesure (systèmes) 431 360, 438, 447 15 Van der Waals (gaz de) Variables d’état Vecteurs Viscosité Vitesse Vitesse angulaire Vitesse de la lumière 143, 191 107 19 48 7 23 62, 351, 376 Weinberg, Salam et Glashow (théorie de) Wien (loi de) 492 218 Young (effet d’interférence de) 365, 449 364 259, 489, 498 150 320 330 66 178