L`algorithme MaximalSound

publicité
L'algorithme MaximalSound
L'algorithme MaximalSound
Auteur: Laurent Sevestre
Date: janvier 2017
Ce document apporte une vue d'ensemble sur l'algorithme MaximalSound. Son organisation
correspond à l'ordre de traitement du signal.
1.
2.
3.
4.
5.
6.
7.
Analyse
Générateur d'harmoniques
Filtre séparateur
Dé-expandeur
Limiteur
Conversions de format
Liens
1 Analyse
Comme MaximalSound est un service de mastering totalement automatisé, la première étape
est une analyse complète du fichier reçu, destinée à l'ajustement des paramètres de chaque
processeur. Malheureusement, cela rend aussi impossible tout traitement en temps réel.
2 Générateur d'harmoniques
Le générateur d'harmonique, cette vieille invention de la compagnie Aphex, présente
l'avantage sur un égaliseur de ne pas appliquer d'amplification fixe sur le haut du spectre.
Cette technique permet d'éclaircir de manière naturelle sans amplification systématique et
fatigante des fréquences aigües. Dans l'algorithme les harmoniques paires et impaires sont
générées séparément suivant le contenu dynamique du signal afin d'adopter un comportement
différent suivant qu'il s'agit de l'attaque ou du corps de la note. Ce générateur confère un
caractère “tube” au son. Cette génération d’harmoniques est aussi bénéfique lors du traitement
(déconseillé) des formats audio « lossy » tels que mp3, ogg, aac etc… La version simplifiée du
son retrouve ainsi de sa complexité et du naturel.
www.MaximalSound.com
1
L'algorithme MaximalSound
3 Filtre séparateur
Un filtre répartiteur 32 bandes permet au signal d'être traité par 32 dé-expandeurs avant
d'être reconstruit en large bande par sommation de toutes les bandes individuellement
traitées. Cela permet de produire une égalisation dynamique où chaque partie du spectre est
amplifiée dans les faibles niveaux suivant un modèle psycho-acoustique standard.
Ce modèle établi pour des son purs et constants, a été modifié pour correspondre aux timbres
complexes et variables de la musique. Cette adaptation purement empirique repose sur des
milliers d'heures d'écoute attentive.
Bien qu'une solution de filtrage IIR (infinite impulse response) ait été choisie, la déviation de
phase maximale du traitement tient dans une page de quelques degrés. Cela autorise une
reconstruction quasi parfaite d'un signal carré. Une topologie de filtre FIR (finite impulse
response) présente l'avantage d'introduire un retard constant et de conserver une phase
linéaire sur tout le spectre audio. Mais elle a été écartée lors des tests d'écoute en raison des
aberrations produites par tout traitement de dé-expansion situé en aval.
L'image précédante correspond à la déformation d'un signal carré passé au travers d'un filtre
www.MaximalSound.com
2
L'algorithme MaximalSound
IIR 3 pôles. Les valeurs RMS et instantanée du signal ont été notablement modifiées. Bien que
l'audition humaine soit peu sensible aux rotations de phases, ces changements affectent tout
traitement situé en aval.
Le signal ci-dessus est recueilli après reconstruction à la sortie du filtre séparateur
MaximalSound (sans autre traitement). Le processeurs en aval n'ont à souffrir d'aucun
changement dans les valeurs instantanée et RMS. Ce point est particulièrement important dès
qu'il s'agit de modifier la dynamique du signal.
Ce signal carré est recueilli à l'issue de l'ensemble du traitement MaximalSound (générateur
d'harmoniques, filtre séparateur, dé-expandeur, limiteur). Le signal carré a été choisi pour sa
sensibilité à toute variation dans la phase ou le temps de propagation.
www.MaximalSound.com
3
L'algorithme MaximalSound
4 Dé-expander
Un dé-expandeur peut aussi être appelé expandeur-inverse (ratio inversé). C'est à dire qu'il
amplifie le signal en dessous d'un seuil fixé à la différence d'un expandeur qui atténue le signal
en dessous de ce seuil. Ce choix est fondamentalement différent des techniques liées à la
compression. Le signal est ainsi amplifié quand il est faible et non pas raboté quand il est
devenu trop fort (au-delà du seuil).
La différence peut paraitre subtile, mais elle est sensible dès qu'on prend en considération le
temps d'attaque du traitement. Un compresseur agira toujours en retard (son temps
d'attaque) sur les transitoires obligeant le limiteur à agir et à déformer ces transitoires qui sont
si précieuses à la perception de l'espace. Le dé-expandeur n'amplifiera le signal qu'après ce
temps d'attaque évitant ainsi au limiteur d'agir inutilement sur le signal.
Cette technique ne peut être confondue avec la compression parallèle. Notez qu'aucun “lookahead” n'est utilisé. C'est technique qui produit un son très doux en empêchant tout
dépassement de la valeur de seuil, présente cependant l'inconvénient d'atténuer le caractère
percussif du son ce qui peut conduire à un rendu artificiel.
www.MaximalSound.com
4
L'algorithme MaximalSound
5 Limiteur
Contrairement au domaine analogique, le numérique n'autorise aucun dépassement du signal,
même bref. Le limiteur est là pour gérer les situations où la sommation de toutes les bandes
traitées produit un signal supérieur au maximum (0dBFS) permis dans le domaine numérique.
Le limiteur est donc un point essentiel du traitement puisqu'à ce stade le signal est complet
(large bande) et tout défaut peut conduire à déséquilibrer le rendu global en favorisant, ou
pénalisant certaines parties du spectre. Dans un limiteur le temps d'attaque est nul ou négatif
(look ahead) pour prévenir tout dépassement de la valeur limite fixée. Tout l'art est alors de
trouver un temps de relâchement (release) optimal, capable de préserver le contenu
fréquentiel et la perception de la dynamique d'origine quelle que soit la complexité de ce signal
alors que sa valeur est radicalement modifiée.
7 Conversions de format





Les fichiers mono ou multi-cannaux sont convertis en stéréo
Toute fréquence d’échantionnage inférieure à 44100 Hz est portée à 44100 Hz
Toute fréquence d’échantionnage supérieure à 96000 Hz est convertie à 96000 Hz
mp3, ogg, mpga, wma, mp4a. Les formats audio avec perte reviennent en
mp3 320kbps, et wav (CD - 16 bits @ 44100 Hz)
o Les codecs sans perte sont préférables pour un travail de mastering
aif, flac, wav. Les formats audio sans perte reviennent mp3 320kbps, wav (CD - 16
bits @ 44100Hz), haute définition (HD - 24 bits @ 96000 Hz), et “same format” (même
format) si différent des 3 premiers formats de restitution
o Un fichier 8 canaux 32 bits @ 192 KHz reviendra au format stéréo 32 bits @ 96
KHz qui est la résolution maximale offerte même si étiquetée “same format”
o Le format wav doit être utilisé pour préserver les fréquences d’échantillonnage
non standard de type 47952 Hz, ou 48048 Hz qui peuvent être utilisées en vidéo
6 Liens
Vidéo







MaximalSound At Work
The Phase Matters
Multiband De-expander
Compressor vs De-expander
Dynamic Processors by Transfer Curves
Digital Overload
All Limiters aren't Equal
Papier

Recommandations pour le mastering
www.MaximalSound.com
5
Téléchargement