Page 1 sur 12
PARTIE 2 : SON ET MUSIQUE
CHAP 07 : LES EMETTEURS ET RECEPTEURS SONORES
MOTS CLES :
Voix ; acoustique physiologique.
Microphone ; enceintes acoustiques ; casque audio.
Reconnaissance vocale
1. LA VOIX
La voix est considérée comme le plus ancien des instruments de musique, l'oreille comme le plus ancien récepteur
sonore.
Comment la voix est-elle créée? Comment l'oreille capte-t-elle les sons?
1.1. Comment naît la voix ?
La formation de la voix est déterminée par le jeu de plusieurs structures (systèmes).
a) L'appareil respiratoire producteur de souffle
Le souffle sera maîtrisé différemment pour l'émission de la voix.
Page 2 sur 12
b) Le vibreur laryngé producteur du son de la voix
L'indispensable passage du souffle entre les deux cordes vocales, rapprochées de façon adéquate, les fait vibrer.
C'est l'origine du son de la voix.
Les deux cordes (plis vocaux) sont placées horizontalement dans le larynx (à hauteur de la pomme d'Adam).
c) Les espaces d'amplification et de résonance
Ces espaces, ou cavités (gorge, nez, bouche), changent de volume et de forme grâce au jeu des muscles du voile du
palais, de la langue, des lèvres... Ainsi, peuvent se modifier les qualités de la voix. »
1.2. Description de la voix
La voix peut être caractérisée par quatre paramètres principaux.
La hauteur est la sensation auditive liée à la fréquence des vibrations des cordes vocales (son grave, son
aigu). L'unité de mesure est le hertz.
L'intensité est la sensation auditive liée à l'amplitude des vibrations des cordes vocales (son fort, son
faible). L'unité de mesure est le décibel.
-
Le timbre est la sensation auditive liée aux harmoniques présents (son sombre, son clair).
-
La tenue est la sensation auditive liée à la durée des vibrations des cordes vocales (son long, son court).
1.3. Les registres de la voix
On peut changer la fréquence de vibration des cordes vocales en modifiant leur tension, et surtout leur épaisseur.
Cela a pour effet de faire varier la hauteur des sons émis par la voix. Ces modifications sont le fruit d'actions
neuro-cérébrales.
Le registre d'une voix est l'étendue de son échelle vocale, de la note la plus grave à la note la plus aiguë.
Pour la voix chantée,
l'échelle des sons
pouvant être émis de
façon homogène est
appelée tessiture, c'est
une partie du registre
d'un interprète.
Page 3 sur 12
2. L'OREILLE HUMAINE
1.1. Acoustique physiologique
L'oreille comporte trois parties.
- L'oreille externe est la seule partie en
communication directe avec l'extérieur.
Elle est composée d'un pavillon et d'un
conduit auditif. C'est une simple
structure de transmission des sons vers le
tympan.
- L'oreille moyenne tient le rôle de
protection et de transmission mécanique.
Les vibrations du tympan sont transmises
au marteau, à l'enclume et à l'étrier.
- L'oreille interne est la partie la plus
fragile de l'oreille. Elle est constituée de
quelques milliers de cellules ciliées
situées dans la cochlée qui convertissent
les vibrations mécaniques en signaux
électriques. C'est « notre capital auditif »
2.2. Sensibilité de l'oreille
L'oreille perçoit convenablement les sons dont le niveau d'intensité sonore est compris entre le seuil d'audibilité et
le seuil de douleur.
Sa sensibilité varie en fonction de la fréquence.
Cela peut être représenté par une série de courbes dites d'égale sensation auditive.
- Ces courbes montrent, par exemple, qu'un son de 1 000 Hz dont le niveau d'intensité sonore est de 40 dB donne
la même sensation d'intensité qu'un son de 30 Hz de 90 dB (points rouges).
- Par ailleurs, la sensibilité de l'oreille diminue avec l'âge, ce qui conduit à des pertes auditives.
Page 4 sur 12
2.3. Les dangers du bruit
Les sons deviennent nocifs lorsque leur intensité dépasse les possibilités de réception de l'oreille.
Le niveau d'intensité sonore est exprimé en décibel (dB).
L'échelle va de 0 à 120 dB, mais certaines sources (avions, canons, fusées) émettent des sons d'un niveau
supérieur.
La réglementation limite à 100 dB le niveau de sortie des baladeurs et à 105 dB celui dans les lieux musicaux.
La limite de nocivité est située à 85-90 dB.
Après exposition prolongée à un niveau proche de 100 dB, par exemple, après une soirée en discothèque, on
constate divers états auditifs que l'on peut classer par gravité croissante:
aucun phénomène auditif particulier, c'est le cas le plus fréquent, mais à coup sûr, quelques cellules ont été
fragilisées;
phénomènes temporaires tels que des bourdonnements ou des sifflements (acouphènes);
phénomènes de type acouphènes persistants et irréversibles, baisse sensible de l'audition.
3. MICROPHONE
Un microphone convertit les ondes sonores en signaux électriques.
Il émet des sons à partir des signaux électriques qu'il reçoit.
3.1. Principe du microphone électrodynamique
Un microphone électrodynamique comporte deux éléments essentiels : une bobine (enroulement d'un fil
conducteur) et un aimant.
La bobine mobile, est placée dans le champ magnétique créé par l'aimant fixe.
Une membrane souple, solidaire de la bobine, capte les vibrations de l'air engendrées par une onde sonore.
Les déplacements de la bobine, provoqués par ceux de la membrane, dans le champ magnétique de l'aimant créent
une tension électrique aux bornes de la bobine.
C'est le phénomène d'induction électromagnétique.
La fréquence de la tension électrique est égale à celle des vibrations de l'air, donc à celle du son correspondant à
ces vibrations.
L'amplitude de cette tension est d'autant plus grande que le niveau d'intensité sonore est grand.
Page 5 sur 12
3.2. Caractéristiques techniques d'un microphone
Les caractéristiques d'un microphone sont indiquées sur la fiche technique du constructeur.
a) La bande passante
C’est le domaine de fréquences qu'il capte convenablement. Elle se déduit de la courbe de réponse du microphone.
Cette courbe est la représentation graphique du niveau de sortie, exprimé en dB, en fonction de la fréquence du
son qu'il capte.
Par convention, on affecte le niveau 0 dB à la valeur obtenue pour 1 000 Hz.
b) La sensibilité
C’est son aptitude à fournir une tension élevée pour des sons de faible niveau d'intensité sonore.
Un microphone de grande sensibilité captera bien les sons peu intenses, mais sera sensible aux parasites sonores.
c) La directivité
C’est son aptitude à réagir suivant la direction de propagation du son.
Un micro omnidirectionnel capte les sons provenant de toutes les directions;
un microphone directif capte les sons provenant d'une seule direction.
L'axe du microphone est l'axe défini par l'angle θ = 0°, la membrane pointant vers la graduation 0°.
On déplace la source sonore le long d'un cercle centré sur le microphone.
Chaque position de la source est repérée par l'angle θ.
On compare la réponse du microphone pour cette position à celle obtenue lorsque la position de la source est
repérée par θ = 0°.
Cela permet de calculer un niveau de réponse, exprimé en dB.
Une valeur négative traduit un microphone qui capte moins bien les sons que dans la direction de référence (0°).
Page 6 sur 12
- Par exemple, le micro ci conte n'est pas omnidirectionnel
pour des sons de fréquences 125, 2000 ou 8000 Hz.
- Cependant, il capte mieux les sons de 125 Hz de fréquence
en arrière de lui (de 150° à 180°) que les sons de 2000 Hz
4. HAUT-PARLEUR
Un haut-parleur convertit les signaux électriques en ondes sonores, c’est l’inverse du micro
4.1. Principe du haut-parleur électrodynamique
Le haut-parleur le plus largement utilisé (à 99 %) est le hautparleur électrodynamique.
Sa fonction dans une enceinte est d'agir comme un double
transformateur d'énergie.
Il reçoit le signal audio, une énergie électrique, qu'il
transforme en une énergie mécanique.
En effet, la bobine mobile du haut-parleur se met en
mouvement lorsqu'un signal audio est reçu.
Puis le haut-parleur transforme cette énergie mécanique en
énergie acoustique, grâce à sa membrane.
Celle-ci est reliée à la bobine mobile et reproduit donc les
mêmes mouvements que cette dernière.
C'est en se déplaçant sous l'action de la bobine mobile que la
membrane crée une pression acoustique, le son.
Page 7 sur 12
4.2. Caractéristiques techniques d'un haut-parleur
Les caractéristiques d'un haut-parleur sont indiquées sur la fiche technique du constructeur.
a) La bande passante d'un haut- parleur
- C’est le domaine de fréquences des sons qu'il est capable de
restituer.
- La bande passante se déduit de la courbe de réponse du
haut-parleur.
- Cette courbe est la représentation graphique du niveau
d'intensité sonore obtenu, exprimé en dB, en fonction de la
fréquence de la tension qui l'alimente, exprimée en Hz.
b) Un boomer (ou woofer)
C’est un haut-parleur dont la bande passante est située dans les basses fréquences. Il restitue essentiellement les
sons graves.
c) Un médium
Il restitue les sons de fréquences moyennes.
d) Un tweeter
Il restitue les sons aigus.
e) La couverture angulaire
C’est son aptitude à diffuser des sons dans le plan horizontal et dans le plan vertical.
f) La puissance admissible
C’est la puissance électrique maximale qu'il peut supporter sans dégâts.
Au-delà de cette valeur, le haut-parleur sera endommagé.
g) Le rendement
Il mesure sa faculté à transformer la puissance électrique reçue en puissance mécanique.
Page 8 sur 12
5. LA RESTITUTION DES SONS
L'enceinte acoustique ou le casque audio constituent le dernier maillon d'une chaîne haute-fidélité (Hi-Fi)
. Quels sont les critères de qualité d'un système de restitution du son ?
5.1. L'utilité de l'enceinte acoustique
Une enceinte acoustique maintient les haut- parleurs et leur permet de transmettre efficacement à l'air les
vibrations de leurs membranes.
Quand un haut-parleur est utilisé seul, sa membrane fait à la
fois vibrer l'air devant elle mais aussi l'air derrière elle. En
effet, lorsqu'elle avance, la pression augmente devant elle et
diminue derrière.
Inversement, la pression diminue devant et augmente derrière
lorsqu'elle recule.
Cela crée deux ondes sonores, une émise vers l'avant et une
autre émise vers l'arrière.
Du fait de leur mode de production, ces deux ondes sont en
opposition de phase.
Si elles se rencontrent et se superposent, elles peuvent
s'annuler.
Cela se produit surtout pour les basses fréquences.
Pour éviter ce phénomène, il faut supprimer les ondes arrière.
Cela peut être réalisé en fixant le haut-parleur sur un « support infini » constitué d'une plaque de grande
dimension.
Un tel support permet de séparer les ondes avant et arrière et empêche leur superposition.
Une autre solution consiste à renvoyer les ondes arrière vers l'avant tout en les déphasant de 180°.
C'est le système bass-reflex.
Il empêche l'annulation qui pourrait se produire lorsque ces ondes arrière, renvoyées vers l'avant, se superposent
aux ondes avant.
5.2. Tester des enceintes acoustiques
Si l'électronique envoie un signal « propre », encore faut-il que l'acoustique le restitue avec un minimum de
dégradation.
Qualité des haut-parleurs, des filtres, choix des matériaux, des formes et des volumes, autant de paramètres qui
nécessitent un gros zeste de savoir-faire pour obtenir le bon son.
Pour le noter, on fait appel à une batterie de tests réalisés en « chambre sourde », afin d'absorber les réflexions
sonores.
a) Principaux tests discriminants
- Vibration du coffret :
Les haut-parleurs font vibrer la "caisse" de l'enceinte acoustique.
A certaines fréquences, à une certaine puissance, ce phénomène devient franchement dérangeant.
A l'aide d'un accéléromètre, nous relevons le niveau de cette vibration à différentes fréquences.
- Pureté des graves :
C’est la mesure des déformations générées par des harmoniques sur trois fréquences fondamentales du grave, 40,
50 et 60 Hz. Facilement audibles, elles deviennent vite très désagréables et perturbantes pour l'écoute.
- Rendement :
C’est le niveau sonore mesuré par un micro situé à 1 mètre qu'une enceinte est capable de restituer lorsqu'on lui
envoie une puissance de 1 watt.
C'est un paramètre essentiel pour optimiser le couplage ampli-enceintes au niveau de la puissance : pas d'enceinte
de rendement très faible sur un ampli de faible puissance !
Page 9 sur 12
- Directivité :
On relève la dégradation de la courbe de réponse sur le plan horizontal à 30° et 45° de l'axe du "tweeter".
Avec des enceintes à faible déperdition latérale, la zone d'écoute stéréo et Home Cinéma sera plus vaste et plus
confortable.
5.3. Améliorer l'écoute de son baladeur : les casques audio
Tout comme les enceintes acoustiques pour la haute-fidélité, le casque est l'élément essentiel de la qualité d'écoute.
Or, pour « tirer » les prix des baladeurs vers le bas, ou augmenter leurs profits, la plupart des fabricants
choisissent d'équiper leurs baladeurs avec des casques tout à fait médiocres.
Le remplacer par un bon casque transformera radicalement le son d'un baladeur moyen car en fait, le rôle du
casque est beaucoup plus important pour la musicalité que la qualité électronique du baladeur.
Pour le choisir, il y a bien sûr des critères subjectifs comme l'esthétique ou la mode, des critères de confort,
essentiels pour le supporter longtemps et la bonne tenue sur les oreilles.
a) Les clips :
Ils sont de type oreillette traditionnelle, inter ou supra-auriculaires. Ils sont maintenus grâce à un contour d'oreille
qui garantit une parfaite stabilité du casque, au prix parfois d'un inconfort après plusieurs heures d'utilisation.
b) Les intra-auriculaires :
Ils sont discrets et souvent de bien meilleure qualité que les écouteurs traditionnellement proposés avec les
baladeurs. Ces écouteurs pénètrent plus ou moins profondément dans le conduit auditif
Ils isolent ainsi mieux l'oreille des bruits ambiants et offrent une qualité sonore comparable aux casques Hi-Fi.
c) Les casques à arceau :
Ils sont de deux types, les casques supra- auriculaires et les casques circum- auriculaires.
Les casques supra-auriculaires
Ils se placent sur l'oreille et sont reliés entre eux par un arceau, qui entoure le sommet du crâne ou ceinture la
nuque. Parfois pliables, ils sont alors destinés à un usage en extérieur. Leur capacité d'isolation et leur qualité
sonore sont meilleures que celles des oreillettes « simples », mais moindres que celles des casques Hi-Fi.
Les casques circum-auriculaires
Ils se placent autour de l'oreille. Ils sont plus volumineux que les casques supra-auriculaires, leurs qualités
sonore et d'isolation sont optimales, à un tel point que les bruits de la ville sont totalement étouffés; attention
aux risques urbains. Les casques n'offrent pas une restitution linéaire, selon la technologie employée ils
favorisent certaines fréquences, tantôt les graves, les médiums ou les aigus. [...] Leur courbe de
réponse vous permet de faire votre choix selon vos propres critères et le type de musique que vous écoutez.
Page 10 sur 12
6. LA RECONNAISSANCE VOCALE
6.1. Comment ça marche
Du jour où le téléphone a été inventé, des esprits ingénieux ont relevé que le micro constituait un détecteur de son
susceptible d'envoyer un signal électrique au moindre bruit. D'où l'idée d'envoyer ce signal à une machine pour
qu'elle obéisse à la voix.
Pour que la reconnaissance vocale devienne réalité, il fallait donc un outil capable d'analyser les sons pour séparer
le bruit de fond d'un atelier et les ordres du machiniste.
Les progrès de la reconnaissance vocale sont donc intimement liés à l'évolution des ordinateurs.
En 1971 apparaît le premier dispositif de commande vocale, le Voice Command System, fondé sur une
calculatrice capable, après un cycle d'apprentissage, de reconnaître 24 ordres. Le procédé va ensuite se scinder en
deux grandes familles.
• La première est une simple commande vocale. L'appareil doit être capable de reconnaître l'énoncé d'un nom et,
pour cela, il faut répéter plusieurs fois le nom choisi qui sera alors mémorisé sous forme d'une séquence sonore.
Une fois que le nom aura été prononcé de trois à cinq fois, l'électronique de l'appareil analyse l'évolution de
l'intensité sur plusieurs plages de fréquences (en général huit) pour chacun de ces échantillons vocaux.
Après avoir réalisé une moyenne des huit échantillons, l'appareil en déduit un profil acoustique numérisé du nom
et le met en mémoire. En usage normal, pour reconnaître un nom prononcé par l'utilisateur, il compare le nouveau
profil à ceux qu'il possède en mémoire. Il attribue alors des notes statistiques de ressemblance et décrète que le
nom prononcé est celui qui a obtenu la meilleure note.
• La seconde famille, celle des systèmes de dictée, nécessite un ordinateur puissant car leur principe de
reconnaissance vocale est infiniment plus complexe: ils doivent être capables de reconnaître des mots prononcés
en langage dit naturel, c'est-à-dire au sein de phrases où notamment en français les mots s'enchaînent.
Qui plus est, ils doivent tenir compte des liaisons, et aussi des homophones qui se créent spontanément par la
juxtaposition de mots.
Après amplification et tri par fréquences, grâce à un jeu de filtres électroniques rappelant les « égaliseurs » des
chaînes haute-fidélité, un spectrogramme de la phrase est obtenu.
Pour l'ordinateur, la première tâche consiste à séparer chaque phonème (c’est la plus petite unité qui permet de
distinguer des mots les uns des autres). Il le transforme alors en un fichier numérique: un tableau de données.
Ensuite, il compare ces tableaux obtenus à ceux que contient un dictionnaire, stocké sur le disque dur, où sont
associés phonèmes ou groupes de phonèmes et mots réels. Mais, par la présence des liaisons ou par homophonie,
de très nombreux mots peuvent correspondre au message parlé.
Interviennent alors des logiciels d'analyse contextuelle et sémantique.
Souvent, l'ordinateur devra attendre qu'une grande partie de la phrase ait été prononcée pour que ces logiciels
puissent commencer leur travail. L'apparition d'un nouveau mot peut bouleverser son sens et donc le choix de
coupe des phonèmes. Par déduction statistique, les logiciels retiennent la solution la plus probable qui se révèle, le
plus souvent, être la bonne.
Beaucoup de systèmes actuels sont encore monolocuteurs, c'est-à-dire qu'ils ne peuvent « comprendre » qu'une
seule personne, et encore après une phase d'apprentissage. On cherche donc maintenant à faire des systèmes
multilocuteurs qui « entendront » aussi bien le langage d'un homme à l'accent parisien que celui d'une femme au
parler méditerranéen, et cela sans phase d'apprentissage.
Page 11 sur 12
6.2. spectrogramme
Un spectrogramme est la représentation
visuelle d'un son. Il représente la
fréquence en fonction du temps et
l'intensité sonore associée à chaque
fréquence est représentée par un niveau
de couleur : plus le point est de couleur
foncée, plus l'intensité est élevée.
6.3. Application à la commande vocale
Un logiciel de reconnaissance automatique de la parole analyse la voix et la traduit en commandes informatiques.
Il s'agit de donner oralement des instructions à une machine, ce qui libère les mains pour d'autres tâches ou les
remremplace. Les principaux acteurs du marché des logiciels de reconnaissance vocale grand public sont
IBM®, Microsoft® et Nuance
Page 12 sur 12
6.4. Application à l'identification
- Identifier un individu par sa voix est une tâche complexe. La voix dépend de paramètres physiologiques, mais
aussi de l'humeur ou de l'état de santé de chaque individu.
- En outre, une voix peut être volontairement déformée, elle peut aussi être imitée. Les conditions
d'enregistrements sont également très importantes (qualité du matériel, bruit ambiant, etc.).
- Cependant, l'expérience quotidienne montre qu'une voix (d'un proche, d'une personnalité publique) peut être
reconnue.
- La comparaison avec des enregistrements de référence permet de donner la probabilité (et non l'assurance) qu'une
personne soit l'auteur d'un enregistrement vocal.
- La reconnaissance vocale est utilisée dans la police scientifique et technique ou pour le contrôle de l'accès à
certaines zones ou matériels
Téléchargement

cours-ts-spe-chap07-emetteurs-recepteurs