22
Simulation d’environnement
Écho (delay) / reverb
L’écho est un rebondissement du son sur une surface solide. Entre deux murs, y aura rebondissement successif « infini », alors que
dans un espace ouvert avec un seul mur on entendra un seul rebondissement. L’effet le plus simple utilise un filtre en peigne avec ou
sans rétroaction, avec la position du terme correspondant au temps de propagation du son au mur. Comme une salle a souvent plus de
deux murs, des filtres en peigne de différents délais peuvent être mis ensemble pour approximer les rebondissements sur les différents
murs.
Si on veut un peu mieux représenter l’effet du mur à chaque rebondissement, il ne faut pas une atténuation égale à toutes les
fréquences, mais plutôt un filtre. On peut donc passer les échantillons de sortie pris espacés dans le passé dans des filtres FIR ou IIR
avant de les ajouter à l’échantillon présent.
L’effet de réverbération (« reverb ») est similaire à l’écho, mais les murs diffusent les rebondissements. Le temps avant la
première arrivée du son sera comme l’écho, mais comme le mur a diffusé le son, il prendra différents chemins de longueur légèrement
différente pour revenir, faisant encore l’effet d’un filtre en peigne. Donc, il faut une plus grande densité de termes de rétroaction, mais
le premier étant tout de me assez loin. « Freeverb » utilise 8 filtres en peigne avec rétroaction et filtre passe bas (une description
plus détaillée se trouve à https://ccrma.stanford.edu/~jos/pasp/Freeverb.html ).
Positionnement virtuel de source sonore
Pour qu’un auditeur ait l’impression qu’un son provient d’une certaine direction ou plus précisément d’une certaine position, tout en
ayant réellement un nombre très limité d’émetteurs de son (quelques hautparleurs, ou une paire d’écouteurs), différentes techniques
plus ou moins élaborées existent. Pour toute technique, il faut premièrement savoir quelle sera la configuration de l’écoute.
Stéréo sur écouteurs :
Dans ce cas, il est possible de contrôler presque exactement ce que chaque oreille entend. Comme chaque émetteur est très proche
d’une oreille, l’amplitude à l’autre oreille est normalement négligeable. Pour avoir la plus grande précision sur ce qu’entend l’oreille,
il faut avoir une évaluation de la réponse de l’émetteur jusqu’au tympan. Cette réponse dépend plus ou moins de la forme de l’oreille
selon comment la source est placée proche du pavillon de l’oreille ou dans le canal.
Les techniques de positionnement vont placer les sources par rapport à la tête, et les sources vont donc « se déplacer avec la tête » si
elle tourne. Pour des techniques en temps réel, il est possible d’évaluer la position de la tête pour calculer le son, et alors garder les
bonnes positions des sources lorsque la tête se déplace.
Stéréo sur hautparleurs :
Les oreilles entendent un certain mélange de ce que les deux hautparleurs jouent, avec l’effet complet des pavillons des oreilles et de
l’obstruction de la tête et du corps, selon la position des hautparleurs, en plus de l’acoustique de la salle d’écoute. Il n’est plus
possible de contrôler de manière indépendante ce que chaque oreille entend.
Les sources ne se déplacent pas avec la tête, mais l’effet ne sera pas le même selon sa position et son orientation. On va souvent
supposer que la tête est à égale distance entre les hautparleurs et que l’angle entre les hautparleurs est approximativement connu, pour
donner l’effet voulu.
Hautparleurs stéréo: chaque oreille entend les deux hautparleurs, avec « filtre » différent mais approximativement symétrique.
Multi hautparleurs :
Des hautparleurs sont placés tout autour de la personne, soit sur un me plan, soit en demi-sphère ou même sphère complète
(demande une salle spéciale).
23
Pan, phase, expansion stéréo
Le « panning » est la méthode la plus simple pour placer une source dans un espace stéréo (peut aussi s’étendre au multicanal). Il
consiste simplement à changer les amplitudes des signaux sur chaque canal selon une courbe; pour placer la source complètement à
gauche, le gain est 100% à gauche et 0% à droite, pour placer la source complètement à droite c’est l’inverse, et pour placer la source
au centre les deux gains sont égaux (il y a plusieurs niveaux possibles; souvent 0dB, -3dB, -4,5dB ou -6dB).
Dans la configuration « stéréo sur hautparleurs », le son semble provenir d’un des hautparleurs lorsque l’autre est à 0%, et du centre
lorsque les deux gains sont égaux (les deux oreilles reçoivent le me signal, qui est perçu comme une seule source au centre). Par
contre, si la tête n’est pas au centre, un son identique sur les deux hautparleurs ne donnera pas l’impression d’être au centre.
Dans des écouteurs, un son complètement d’un côté ne parait pas naturel, il semble provenir d’une source collée sur l’oreille (dans
certains cas ça peut être voulu, mais pas en général). Pour donner un meilleur effet dans les écouteurs, il faut modifier les amplitudes
des deux canaux et leur phase; on suppose une certaine distance entre les oreilles (ex. 15cm) et une vitesse du son (ex. 340m/s) pour
calculer le délai que prend le son pour arriver à chaque oreille et on utilise une simple loi d’atténuation selon la distance.
Un signal de même amplitude et en phase, sur deux canaux, semble au centre, mais si la phase est différente il donnera l’impression de
deux sources plus ou moins loin du centre. Plus la phase est différente, plus les sources paraissent loin du centre.
L’« expansion stéréo », pour donner un effet stéréo plus large, soustrait, avec une certaine atténuation, le signal d’un hautparleur du
signal de l’autre hautparleur. Les signaux utilisant le « panning » auront donc une position accentuée à droite ou à gauche, pour ceux
qui n’étaient pas déjà au maximum. Les signaux qui étaient déjà complètement d’un côté (ou presque) se retrouveront en phase
inverse sur les deux canaux. Sur des hautparleurs, jusqu’à un certain point l’effet sera un peu comme si la source était plus loin que le
hautparleur car l’autre haut parleur va soustraire une partie du signal qui se rend à l’oreille opposée; par contre, la phase n’est pas
vraiment la bonne, et cette soustraction fera donc un effet de filtre en peigne, qui sera plus évident si on soustrait avec un facteur plus
grand.
Souvent, on fait l’expansion en convertissant le signal en « milieu-côté » (« Mid-Side » ou M-S) : milieu = (droite + gauche)/2;
= (droite – gauche)/2.
L’expansion est alors : gauche’ = milieu facteur · té; droite’ = milieu + facteur · té. Les facteurs > 1 donnent une expansion.
Pour un facteur d’expansion de 1, les signaux restent inchangés, pour un facteur d’expansion de 0, les deux canaux deviennent
identiques (la moyenne des deux signaux originaux).
HRTF (voir réponse de l'oreille)
La réponse de l’oreille, causée par la forme de son pavillon, est mesurée pour différentes direction d’arrivées des sons, puis on utilise
ces réponses pour filtrer les sons qu’on veut positionner virtuellement. Prenons l’exemple des mesures faites au MIT Media Lab
(1994), qui sont publiques sur Internet. Pour différentes élévations de sources, entre -40° et +90°, par rapport à la tête, ils ont fait
tourner un mannequin KEMAR (il était plus facile de faire tourner le mannequin que faire tourner la source de son) et évalué la
réponse à l’impulsion pour un grand nombre d’angles (aux pour les élévations entre -20° et +20°). Tous les angles sont mesurés
par rapport au centre de la tête, et non par rapport aux oreilles, et la distance du hautparleur est de 1,5m. Ils ont aussi estila
réponse du hautparleur, avec un micro sans le mannequin; les micros utilisés ont normalement des données de correction fournies par
le manufacturier. Ils ont utilisé la technique de la MLS avec corrélation croisée pour déterminer les réponses à l’impulsion. Les deux
oreilles utilisées sont différentes, et par conséquent il faut utiliser les données provenant d’une seule des oreilles (celle la plus
semblable à celles de l’auditeur), mais à des angles miroirs par rapport à 0°. Pour simuler des sources à des distances différentes, il
faut corriger les amplitudes et les angles (pour la différence entre l’angle d’arrivée à l’oreille et celle au centre de la te; à 1,5m cette
différence est de ~3°), en supposant que le son se propage en ligne droite. Noter que pour des sources ponctuelles très proches de la
tête, les réponses seront des moins bonnes approximations.
Configuration de l’expérience du Media Lab pour les HRTF, dans une salle anéchoïque.
24
Pour que l’effet soit bon, il faut pouvoir contrôler avec précision ce que chaque oreille entend, donc avec écouteurs, et que
l’expérience ressemble à la réalité, entre autres la forme des oreilles. Il faut aussi corriger pour la réponse des écouteurs et leur
interaction avec la forme de l’oreille (l’expérience du Media Lab mesure l’effet de quelques types d’écouteurs).
Effet de la distance sur la HRTF (Source : Creating three dimensions in virtual auditory displays)
"Surround" ou multicanal
Il est possible de positionner plusieurs hautparleurs autour de l’auditeur, pour donner une bonne impression de direction. Le
« surround » 5.1 (ou plus) dans les films, permet de donner un peu cette impression, mais les canaux « surround » sont supposés être
diffus, alors que des sources ponctuelles (ou directionnelles) sont requises pour avoir une impression plus précise de direction. Pour
positionner entre les hautparleurs, une technique similaire au « panning » peut être utilisée. Noter qu’il est difficile de bien simuler
des sources proches en utilisant des hautparleurs éloignés; on peut utiliser une technique similaire à l’expansion stéréo pour tenter de
le faire.
Calcul d'acoustique temps réel
Comme on l’a dit dans la section sur la propagation du son, on peut approximer la trajectoire du son comme étant linéaire,
réfléchissant sur les murs, si la longueur d’onde est petite par rapport à la taille des murs.
Le calcule le plus simple va supposer que chaque mur ne fait que des réflexions spéculaires avec un facteur d’atténuation. Pour
chaque source dans l’espace avec les murs, si l’auditeur voit la source on placera une source à la même position dans un espace sans
murs. Ensuite, pour chaque mur sur lequel peut rebondir le son d’une source (mur visible par la source), une « source virtuelle » sera
créée en miroir de la source par rapport au mur. L’intersection entre le mur et la ligne qui relie la source virtuelle à l’auditeur indique
à quel endroit le son rebondit; s’il n’y a pas d’intersection (le « rayon » passe à du mur), on ne considère pas cette contribution,
sinon on place une source à la position de la source virtuelle, dans l’espace sans murs, avec intensité ajustée par le facteur
d’atténuation du mur. Chaque source virtuelle pourrait aussi réfléchir sur un autre mur, jusqu’à ce que le son soit très faible, mais
c’est souvent la première réflexion sur un mur qui est la plus importante, les autres peuvent être approximées par un simple
écho/reverb indépendant de la position de la source et de l’auditeur.
Contribution de la source et des « sources virtuelles »
Chaque contribution a une amplitude, un délai et une direction d’arrivée à l’auditeur. On peut alors appliquer une des techniques
précédentes (pan, HRTF, …) selon la direction d’arrivée.
Avec la méthode simple, lorsque l’auditeur passe dans l’ombre d’un mur par rapport à la source (ne voit plus la source), d’un coup
l’auditeur n’entend plus la source directe, qui ne correspond pas à la réalité. En fait il y aura une diffraction du son, qui ne donnera
25
pas une telle discontinuité. Il existe des méthodes pour approximer la diffraction selon l’angle que le son doit faire au coin du mur
pour atteindre l’auditeur.
Position où l’auditeur entend principalement la diffraction du son d’une source
Acoustique par réponse à l'impulsion
Il est possible de mesurer la réponse à l’impulsion d’une vraie salle, pour une certaine position d’écoute et pour différentes positions
de sources, puis ensuite les utiliser pour convoluer des signaux qu’on veut placer à ces positions. Plutôt que de mesurer la ponse
d’une vraie salle, il est aussi possible de simuler une salle, avec beaucoup plus de précision que ce qui est possible en temps réel.
La plupart des technique de rendu 3D « réaliste » (par lancé de rayon, radiosity, photon mapping, …) peuvent avoir des équivalents
pour le son. Par exemple, une passe de type « photon mapping » serait d’envoyer des impulsions dans des directions aléatoires à partir
d’une source, et à chaque mur la faire rebondir dans une direction aléatoire ayant une distribution qui dépend des propriétés de
diffusion du mur. Chaque mur peut filtrer l’impulsion selon la direction d’arrivée et de rebond. Pour chaque intersection avec un
mur, on évalue aussi quelle contribution elle pourrait avoir dans la direction de l’auditeur.
1 / 4 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !