23
Pan, phase, expansion stéréo
Le « panning » est la méthode la plus simple pour placer une source dans un espace stéréo (peut aussi s’étendre au multicanal). Il
consiste simplement à changer les amplitudes des signaux sur chaque canal selon une courbe; pour placer la source complètement à
gauche, le gain est 100% à gauche et 0% à droite, pour placer la source complètement à droite c’est l’inverse, et pour placer la source
au centre les deux gains sont égaux (il y a plusieurs niveaux possibles; souvent 0dB, -3dB, -4,5dB ou -6dB).
Dans la configuration « stéréo sur hautparleurs », le son semble provenir d’un des hautparleurs lorsque l’autre est à 0%, et du centre
lorsque les deux gains sont égaux (les deux oreilles reçoivent le même signal, qui est perçu comme une seule source au centre). Par
contre, si la tête n’est pas au centre, un son identique sur les deux hautparleurs ne donnera pas l’impression d’être au centre.
Dans des écouteurs, un son complètement d’un côté ne parait pas naturel, il semble provenir d’une source collée sur l’oreille (dans
certains cas ça peut être voulu, mais pas en général). Pour donner un meilleur effet dans les écouteurs, il faut modifier les amplitudes
des deux canaux et leur phase; on suppose une certaine distance entre les oreilles (ex. 15cm) et une vitesse du son (ex. 340m/s) pour
calculer le délai que prend le son pour arriver à chaque oreille et on utilise une simple loi d’atténuation selon la distance.
Un signal de même amplitude et en phase, sur deux canaux, semble au centre, mais si la phase est différente il donnera l’impression de
deux sources plus ou moins loin du centre. Plus la phase est différente, plus les sources paraissent loin du centre.
L’« expansion stéréo », pour donner un effet stéréo plus large, soustrait, avec une certaine atténuation, le signal d’un hautparleur du
signal de l’autre hautparleur. Les signaux utilisant le « panning » auront donc une position accentuée à droite ou à gauche, pour ceux
qui n’étaient pas déjà au maximum. Les signaux qui étaient déjà complètement d’un côté (ou presque) se retrouveront en phase
inverse sur les deux canaux. Sur des hautparleurs, jusqu’à un certain point l’effet sera un peu comme si la source était plus loin que le
hautparleur car l’autre haut parleur va soustraire une partie du signal qui se rend à l’oreille opposée; par contre, la phase n’est pas
vraiment la bonne, et cette soustraction fera donc un effet de filtre en peigne, qui sera plus évident si on soustrait avec un facteur plus
grand.
Souvent, on fait l’expansion en convertissant le signal en « milieu-côté » (« Mid-Side » ou M-S) : milieu = (droite + gauche)/2; côté
= (droite – gauche)/2.
L’expansion est alors : gauche’ = milieu – facteur · côté; droite’ = milieu + facteur · côté. Les facteurs > 1 donnent une expansion.
Pour un facteur d’expansion de 1, les signaux restent inchangés, pour un facteur d’expansion de 0, les deux canaux deviennent
identiques (la moyenne des deux signaux originaux).
HRTF (voir réponse de l'oreille)
La réponse de l’oreille, causée par la forme de son pavillon, est mesurée pour différentes direction d’arrivées des sons, puis on utilise
ces réponses pour filtrer les sons qu’on veut positionner virtuellement. Prenons l’exemple des mesures faites au MIT Media Lab
(1994), qui sont publiques sur Internet. Pour différentes élévations de sources, entre -40° et +90°, par rapport à la tête, ils ont fait
tourner un mannequin KEMAR (il était plus facile de faire tourner le mannequin que faire tourner la source de son) et évalué la
réponse à l’impulsion pour un grand nombre d’angles (aux 5° pour les élévations entre -20° et +20°). Tous les angles sont mesurés
par rapport au centre de la tête, et non par rapport aux oreilles, et la distance du hautparleur est de 1,5m. Ils ont aussi estimé la
réponse du hautparleur, avec un micro sans le mannequin; les micros utilisés ont normalement des données de correction fournies par
le manufacturier. Ils ont utilisé la technique de la MLS avec corrélation croisée pour déterminer les réponses à l’impulsion. Les deux
oreilles utilisées sont différentes, et par conséquent il faut utiliser les données provenant d’une seule des oreilles (celle la plus
semblable à celles de l’auditeur), mais à des angles miroirs par rapport à 0°. Pour simuler des sources à des distances différentes, il
faut corriger les amplitudes et les angles (pour la différence entre l’angle d’arrivée à l’oreille et celle au centre de la tête; à 1,5m cette
différence est de ~3°), en supposant que le son se propage en ligne droite. Noter que pour des sources ponctuelles très proches de la
tête, les réponses seront des moins bonnes approximations.
Configuration de l’expérience du Media Lab pour les HRTF, dans une salle anéchoïque.