Le fonctionnement de la parole: aspects articulatoire, acoustique et perceptif Bernard Teston Laboratoire Parole et Langage CNRS et Université de Provence Aix en Provence Quelques définitions • • • • • • Phonème (système phonologique) Syllabe Morphéme (sémantique) Mot (lexique) Phrase (syntaxe) Discours (pragmatique) PSYCHOLINGUISTIQUE NEUROLINGUISTIQUE ENCODAGE DECODAGE PHONETIQUE PHYSIOLOGIE DE LA PRODUCTION NEUROMOTRICITE ACOUSTIQUE PHYSIOLOGIE DE LA PERCEPTION PSYCHOACOUSTIQUE Aire de Broca Aire motrice Aire somato-sensorielle Encodage phonético-acoustique Fabrication du message Programmation pré-motrice Programmation motrice Réalisation du geste Contrôle Modélisation du conduit vocal: relation entre articulation et acoustique Modélisation acoustique: Le conduit vocal vu comme un système acoustique Modélisation géométrique: coupe sagittale du conduit Modélisation mathématique: à partir des équations d’ondes Modélisation dynamique: Langue, machoire Modélisation du larynx Phonologie articulatoire Inversion du modèle Aire auditive Aire de Wernike Décodage Acoustico-Phonétique Traitements psycho-acoustiques Décodage auditif Décodage du message Aire auditive Aire de Wernike Décodage Acoustico-Phonétique Traitements psycho-acoustiques Décodage auditif Décodage du message Modélisation de la perception • Perception catégorielle Identification des phonèmes et de leur frontières Traits phonologiques (voisement, lieu, mode). L’auditeur a du mal à percevoir les différences dans une même catégorie • Théorie motrice Perception à travers les sons, des gestes articulatoires qui ont servi à les générer. La reconnaissance du message se fait elle au niveau du phonème, de la syllabe ou du mot ? Coupe schématique du conduit vocal Mouvements du voile Mouvements de la langue Mouvements des lèvres Mouvements de la mandibule Mouvements du larynx Débit d’air nasal Débit d’air oral Pression intra orale Pression sous glottique Paramètres aérodynamiques et mouvements des principaux organes articulateurs du conduit vocal Pression intra orale P Pression sous glottique 2 1 3 4 Mouvements des cordes vers l’extérieur (glotte convergente) 3 P 1 Mouvements des cordes vers l’intérieur (glotte divergente) 2 4 Modèle du larynx à 3 masses d’après Titze (1996) Caractéristiques articulatoires des voyelles du français Lieu d’articulation: antérieur (i) – moyen (a de pate) – postérieur (ou) Résonance: orale (a, o) – nasale (an, on) Aperture: fermée (i) – mi fermée (o) – mi ouverte (eu) – ouverte (a) Labialisation: écartée ( i)- labialisée (u) F1 F2 Allongement minimal et maximal du conduit vocal Coupes sagittales du conduit vocal d’un locuteur standard dans la réalisation des voyelles du français (10 orales et 4 nasales) Caractéristiques articulatoires des consonnes du français • Mode d’articulation: occlusive (p) constrictive (ch) • Lieu articulatoire: labiale (b) dentale (d) palatale (g) • Résonnance: orale (p) nasale (m) • Sonorité: voisée (d) non voisée (p) Les consonnes du français labiales non-voisées p t k voisées b d g nasales m n gn non-voisées f s ch voisées v z j orales occlusives dentales palatales constrictives Lieux d’articulation des consonnes nasales Lieu d’articulation des consonnes occlusives Lieu d’articulation des consonnes constrictives Lieu d’articulation des consonnes liquides (latérale l et vibrante R) Lieu d’articulation des des consonnes approximantes Le signal acoustique • Signaux périodiques (voix) – Plus ou moins longs – Jamais stables • Bruits – Écoulements – Turbulences – Transitoires (explosions, clics) Souvent mélangés dB 60 0.4 0.3 50 0.2 40 0.1 30 0.0 -0.1 20 -0.2 10 -0.3 -0.4 0 585 590 595 600 605 ms -10 -20 0 Hz 1000 2000 3000 4000 5000 6000 1 0 0.4 0.3 0.2 0.1 0.0 -0.1 -0.2 -0.3 -0.4 [a] de état 0 200 400 e 600 t 800 a ms 1000 dB 60 0.6 50 0.4 40 0.2 30 0.0 20 -0.2 10 -0.4 510 515 520 525 ms 0 -10 -20 0 Hz 1000 2000 3000 4000 5000 6000 0 0.6 0.4 0.2 0.0 -0.2 -0.4 [] de pâte 400 p 500 600 700 800 t 900 ms dB 60 0.8 50 0.6 40 0.4 0.2 30 0.0 20 -0.2 10 -0.4 0 -0.6 -10 -0.8 570 575 580 585 590 -20 0 ms Hz 1000 2000 3000 4000 5000 6000 0 0.4 0.2 0.0 -0.2 -0.4 300 [i] de épi 400 500 p 600 i 700 ms dB 60 0.4 0.3 50 0.2 40 0.1 0.0 30 -0.1 20 -0.2 10 -0.3 -0.4 -0.5 0 665 670 675 680 685 ms -10 -20 0 Hz 1000 2000 3000 4000 5000 6000 0 0.4 0.3 0.2 0.1 0.0 -0.1 -0.2 -0.3 -0.4 -0.5 [e] de épée 200 400 e 600 p 800 e 1000 ms dB 60 0.4 50 0.2 40 30 0.0 20 -0.2 10 0 -0.4 595 600 605 610 615ms -10 -20 0 Hz 1000 2000 3000 4000 5000 6000 0 0.4 0.2 0.0 -0.2 [] de épais -0.4 200 300 e 400 500 p 600 700 800 ms Les outils de mesure • Analyse acoustique • Mesures articulatoires (Sons) • • • • • FFT DFT Bandes critiques Cepstre (coefficients) Prédiction linéaire • Spectrogrammes (Mouvements) Aérodynamiques Cinéradiographie IRM Kinésiographie Magnétométrie Électropalapographie (EPG) • Électromyographie • • • • • • S p e c tr e 1 0 - 1 m s 5 0 0 n Hz 8000 il e 1 0 0 0 k a r s d l æ 1 5 0 0 r m 2 0 0 0 t r n i l a p æ t=755.5, f= 1286.3, i=36.6 S p ectre 7000 6000 5000 4000 3000 2000 1000 0 ms 500 1000 1500 2000 Spectrogramme en bande large (FFT 256 points - 96 Hz – 8 ms) S p e c tr e 1 0 - 1 m s 5 0 0 1 0 0 0 n i l e k a r s d l æ r Hz t=774.1, f= 1251.1, i=30.1 S p ectre 8000 1 5 0 0 m 2 0 0 0 t r n i l a p æ 7000 6000 5000 4000 3000 2000 1000 0 ms 500 1000 1500 2000 Spectrogramme en bande étroite (FFT 1024 points - 24 Hz – 32 ms) 2 5 8 4 .6 H z , 3 5 .5 d B dB 70 60 50 40 30 20 10 0 -10 Hz -20 0 1000 2000 3000 4000 5000 6000 Spectre en bande large (FFT 256 points - 96 Hz – 8 ms) et LPC ordre 14 2 2 7 5 .8 H z , 2 2 .5 d B dB 7 0 6 0 5 0 4 0 3 0 2 0 1 0 0 - 10 Hz - 20 0 10 00 2000 3000 4000 5000 60 00 Spectre en bande étroite (FFT 1024 points - 24 Hz – 32 ms) et LPC ordre 14 F2 F1 ba da a Influence de la consonne sur la transition des formants de la voyelle Schéma des capteurs aérodynamiques 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 11000 11500 12000 s e t y na f r t 12500 ere s a a 13000 t 13500 k aa p aa 14000 ms s e v u dm3/s 0.6 0.5 0.4 0.3 0.2 0.1 0.0 11000 11500 12000 12500 13000 13500 14000 ms 13500 14000 ms Débit d’air oral en dm3 par seconde dm3/s 0.4 0.3 0.2 0.1 0.0 11000 11500 12000 12500 13000 Débit d’air nasal en dm3 par seconde 0 7 1 2 3 4 5 6 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 2000 p 2200 0 p 7 2400 a n m 1 2600 a p a 2 2800 p 3000 a r 3200 l e d 3 3400 b o 4 3600 p a 3800 p 5 ms a 6 hPa 8 6 4 2 0 -2 -4 -6 2000 2200 2400 2600 2800 3000 3200 3400 3600 3800 ms 3800 ms Pression intra-orale en hecto Pascal 0 7 1 2 3 4 5 6 dm3/s 0.5 0.4 0.3 0.2 0.1 0.0 2000 2200 2400 2600 2800 3000 3200 Débit d’air nasal en dm3 par seconde 3400 3600 8 0 1 2 3 4 5 6 7 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 0 500 1000 1500 2000 2500 3000 3500 pu 4000 ipa ms 4500 api ipi Ci contre, palais à 62 contacts de type « Edimbourg » ( Hardcastle) Mesure des contacts de la langue sur le palais au moyen de l’électropalatographie (EPG) 1 u 2 u 3 i 4 a 5 a 6 i 7 i 8 i Contacts lingo palatins sur les voyelles: oupou ipa api et ipi Multistack Simultaneous acquisition of 13 slices in 12 sec 1 2 3 44 5 6 7 8 9 10 11 12 13 Erasmus H&N 99 ULB 12 11 10 6 5 4 9 8 2 3 7 1 Saturation bands! Erasmus H&N 99 ULB 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 500 s yrl k 1000 e 1500 2000 ms e v id a m a 700 600 500 400 300 200 100 500 1000 1500 Activité du muscle orbicularis oris en microvolts RMS 2000 ms 700 600 500 400 300 200 100 500 1000 1500 2000 ms 2000 ms Activité du muscle cricothyroîdien en microvolts RMS 600 500 400 300 200 100 500 1000 1500 Activité du muscle sternohyoîdien en microvolts RMS 400 300 200 100 0 Variation de la Fo en Hertz l-e—s-ielé--p-arde-s-ule--t--oi--------------------------s--i-b--l--e---------------s-i-c-a-l-m-e Signal acoustique de la phrase : “Le ciel est par dessus le toit, si bleu, si calme”, déclamée par un sujet normal. L’axe des abscisses représente le temps en millisecondes. Courbe des variations de la Fo de la voix qui définissent la ligne mélodique de la phrase. L’axe des ordonnées est en Hertz (Hz). l-e--s—ielé-p-arde-s-ule--t--oi--------------------------s-i--b--l---e---------------si-c--a—l-me Signal acoustique de la phrase : “Le ciel est par dessus le toit, si bleu, si calme”, déclamée par un sujet normal. L’axe des abscisses représente le temps en millisecondes. Courbe de variation de l’énergie acoustique de la voix qui définit la ligne d’intensité de la phrase. L’axe des ordonnées est en décibels (dB). La valeur de l’intensité est calculée toutes les 10 ms. Exemple de variations prosodiques décrites par les trois paramètres: mélodie, durée, intensité. 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 0 500 1000 1500 2000 2500 nile k a r sd loe m tr nila p oerdylu 3000 3500 4000 ms ri nle r t n e Hz 180 160 140 120 100 0 500 1000 1500 2000 2500 3000 3500 Courbe mélodique de la lecture normale d’une partie d’un texte de référence 4000 ms Lecture normale d’une partie d’un texte de référence (la chèvre de Monsieur Seguin) La durée d’élocution est de 13,6 secondes Lecture rapide d’une partie d’un texte de référence (la chèvre de Monsieur Seguin) La durée d’élocution est de 10,5 secondes Lecture très rapide d’une partie d’un texte de référence (la chèvre de Monsieur Seguin) La durée d’élocution est de 7,3 secondes 0.4 0.3 0.2 0.1 0.0 -0.1 -0.2 -0.3 -0.4 0 500 1000 1500 nile ar sd loer m tr n ila 2000 p oerdyl u 2500 ms r i n le r t n e 180Hz 160 140 120 100 80 60 0 500 1000 1500 2000 2500 Courbe mélodique de la lecture rapide d’une partie d’un texte de référence ms 0.3 0.2 0.1 0.0 -0.1 -0.2 -0.3 0 200 400 n i l e k a d l 600 oe m 800 n ila 1000 p oed y l u 1200 r i 1400 n l e 1600 t n 1800 ms 1800 ms e Hz 140 120 100 80 60 40 20 00 200 400 600 800 1000 1200 1400 1600 Courbe mélodique de la lecture très rapide d’une partie d’un texte de référence 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.60 500 l o d b a d 1000 wa 1500 e b 2500 ms 2000 y tr o v i t 220Hz 200 180 160 140 120 100 0 500 1000 1500 2000 Courbe mélodique de la phrase: « l’eau de Badoit est bue trop vite » 2500 ms 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 500 la v 1000 a l i z d m a 1500 b 2000 o n e k 2500 a s ms e Hz 220 200 180 160 140 120 100 500 1000 1500 2000 Courbe mélodique de la phrase: « La valise de ma bonne est cassée » 2500 ms Hz 300 250 200 150 100 50 0 200 m 300 400 a 500 600 ms a Courbe tonale Haut-Haut du mot « maa » en chinois de Pékin: Maman Hz 300 250 200 150 100 50 0 1700 1800 1900 m 2000 a 2100 2200 2300 2400 ms a Courbe tonale Haut-Bas du mot « maa » en chinois de Pékin: Le cheval Hz 300 250 200 150 100 50 0 2600 2650 2700 m 2750 2800 2850 a 2900 2950 3000 ms a Courbe tonale Bas-Haut-Bas du mot « maa » en chinois de Pékin: Injurier Hz 300 250 200 150 100 50 0 0 100 200 m 300 400 a 500 600 ms a Courbe tonale Bas-Haut du mot « maa » en chinois de Pékin: le chanvre Hz 250 200 150 100 cadence 50 Hz 0.4 0 1200 1250 1300 260 1350 1400 ms 1450 0.2 240 0.0 -0.2 220 -0.4 1200 1250 1300 1350 1400 1450 ms 200 180 160 140 120 100 80 200 400 200 400 600 800 1000 800 1000 1200 1400 ms 0.4 0.2 0.0 -0.2 -0.4 J’ai dit merde 600 1200 j’vais (l’)envoyer à Bernard Ta- pi 1400 ms 140 120 100 Hz 80 180 60 160 Hz 12300 0.4 12400 12500 12600 12700 12800 ms 0.2 180 0.0 -0.2 -0.4 12300 12400 12500 12600 12700 12800 ms 160 cadence 140 120 100 80 60 11800 12000 12200 12400 12600 ms 12800 0.4 0.2 0.0 -0.2 -0.4 11800 dif- fi- 12000 12200 ci- ldac- GAMin 12400 cès 12600 par des GAMaj 12800 ms routes GAMaj UI } P PAR «... difficiles d’accès par des routes.» Les contributeurs de l’espace francophone • Modélisation du conduit vocal (relation entre articulation et acoustique) Modélisation acoustique: (Le conduit vocal vu comme un système acoustique) Pierre Badin, René Carré. Modélisation géométrique: (coupe sagittale du conduit) Sinji Maéda. Modélisation mathématique: Xavier Pellorson, Paul Jospa Modélisation dynamique: (Langue, machoire) Raphaël Laboissière, Pascal Perrier • Modélisation du larynx Xavier Pellorson, Antoine Giovanni, Jean Schoengen, Christophe d’Alessandro. Inversion du modèle Jean Schoentgen, Alain Socquet, Gérard Bailli, Yves Laprie • Prosodie Jacqueline Vaissière, Philippe Martin, Piet Mertens, Véronique Aubergé, Albert Di Cristo, Daniel Hirst, Mario Rossi. • Acoustique de la parole François Longchamp, Jacqueline Vaissière, Michel Chafcouloff Louis Jean Boé (Ontogénèse et phylogénèse) • Phonologie articulatoire (Modèle axé sur les gestes articulatoires) Didier Demolin, Rudolph Sock • Perception Christian Cavé, Jean Luc Schwartz, Noël Nguyen, Scot Mc Adams, Alain de Chevigné FIN