Chapitre 2 -------Audition et psychoacoustique Jean-Sylvain Liénard LIMSI-CNRS ORSAY M2 Recherche Informatique Filière Sciences Cognitives Module PNPA Déc 04 – Fév 05 branche verbale branche prosodique niveau 6 500ms unités cognitives niveau 5 200ms unités lexicales niveau 4 60ms unités phonetiques niveau 3 30ms traits phonétiques niveau 2 15ms indices acoustiques niveau 1 1ms unités cochléaires niveau 0 0.1ms Signal L'oreille, anatomie et physiologie L'oreille, anatomie et physiologie L'oreille, anatomie et physiologie Deux modes de fonctionnement de l'étrier: adaptation au niveau sonore L'oreille, anatomie et physiologie L'oreille, anatomie et physiologie L'oreille, anatomie et physiologie L'oreille, anatomie et physiologie L'oreille, anatomie et physiologie L'oreille vue comme un banc de filtres passe-bande Ou comme une succession de filtres passe-bas (ligne à retard) Mais on n'explique pas ainsi la sélectivité de l'oreille: mécanisme actif mettant en jeu les cellules ciliées externes Voies auditives - plusieurs relais -croisements à divers niveaux - afférences/efférences - autres efférences L'oreille, anatomie et physiologie Site Inserm Montpellier: Promenade autour de la cochlée http://www.iurc.montp.inserm.fr/cric/audition/fran%E7ais/sound/fsound.htm En bref: - 25000 cellules ciliées Sorte d'analyse spectrotemporelle Résolution de l'ordre de 1ms Ordre spatial préservé: tonotopie Spikes partiellement synchrones avec le signal L'analyse dépend d'informations top-down Psychoacoustique Perception de l'intensité Perception de la fréquence Perception du temps et de la durée Barks Masquage Perception de l'intensité Seuil différentiel relatif constant--> échelle logarithmique pour les petits accroissements. Doublement amplitude --> niveau + 6 dB Exemple IPO plages 8-11 : the decibel scale Pour les grands accroissements --> la sonie (loudness) double tous les 10 dB; Exemple IPO plages 19-20 : loudness scaling Niveau et sonie de sons usuels Dynamique auditive: 100 dB ou 40 dB ? La sonie dépend de la fréquence Mesure pratique de l'intensité: dBA Perception de la fréquence Distinguer Fo et hauteur perçue (Pitch). Echelle des Mels Valable seulement pour des sons sinusoïdaux Exemple IPO plage 31 : octave matching 985 - 1035 Hz par échelons de 5 Hz Bandes critiques. Echelle de Bark Deux manières de mettre en évidence les bandes critiques 1 - par masquage d'un son simple entouré d'une bande de bruit Exemple IPO plages 2-6 : Critical bands by masking Son test, décroissant par paliers Après env. 5 paliers, le test est masqué par le bruit … …………... En haut : le bruit masquant est plus large que la bande critique. Le test est rapidement masqué. Les sonies ne s'ajoutent pas. En bas : le bruit masquant est plus étroit que la bande critique. Le test reste perceptible plus longtemps, et cela d'autant plus que le bruit est plus étroit. Les sonies s'ajoutent. 2 - par comparaison de sonie Exemple IPO plage 7 : Critical bands by loudness comparisons Bandes critiques Echelle Bark Intégration de la valeur des bandes critiques sur la dimension F Comparaison de diverses échelles fréquentielles Intégration temporelle • Comment la sonie d'un son impulsionnel se compare-t-elle à la sonie d'un son permanent de même niveau sonore ? • La sonie croît avec la durée jusqu'à environ 200 ms (+10 dB quand la durée est multipliée par 10) et reste constante ensuite. • Dans cette démonstration des segments de bruit à bande large de durée 1000, 300, 100, 30, 10, 3 et 1 ms sont présentés à 8 niveaux décroissants (0, -16, -20, -24, -28, -32, -36 et –40 dB) en présence d'un bruit de référence à -44 dB. Compter le nombre d'échelons entendus avant masquage. 8 0 7 -4 6 -8 5 12 4 16 3 2 20 24 1 1000 300 100 30 10 3 1 28 32 Quelques conséquences des observations psychoacoustiques • même au niveau des sensations, les grandeurs perceptives (sonie, hauteur, timbre) ne sont pas des fonctions simples des paramètres acoustiques correspondants (intensité, fréquence fondamentale, spectre). Tout varie avec tout. • rôle top-down de la nature des sons (sinusoïdal, complexe, évolutif), de la durée et du contexte; confirmation physiologique (rôle actif des cellules ciliées externes, réflexe stapédien...) • échelle Bark/Mel pour la perception des grandeurs spectrales: meilleurs résultats en Reconnaissance •un problème difficile: comment séparer périodicité perçue (pitch) et caractères spectraux • importance et complexité de la notion de flux sonore (stream). Scènes acoustiques, cf chap 7