L'algorithme MaximalSound L'algorithme MaximalSound Auteur: Laurent Sevestre Date: janvier 2017 Ce document apporte une vue d'ensemble sur l'algorithme MaximalSound. Son organisation correspond à l'ordre de traitement du signal. 1. 2. 3. 4. 5. 6. 7. Analyse Générateur d'harmoniques Filtre séparateur Dé-expandeur Limiteur Conversions de format Liens 1 Analyse Comme MaximalSound est un service de mastering totalement automatisé, la première étape est une analyse complète du fichier reçu, destinée à l'ajustement des paramètres de chaque processeur. Malheureusement, cela rend aussi impossible tout traitement en temps réel. 2 Générateur d'harmoniques Le générateur d'harmonique, cette vieille invention de la compagnie Aphex, présente l'avantage sur un égaliseur de ne pas appliquer d'amplification fixe sur le haut du spectre. Cette technique permet d'éclaircir de manière naturelle sans amplification systématique et fatigante des fréquences aigües. Dans l'algorithme les harmoniques paires et impaires sont générées séparément suivant le contenu dynamique du signal afin d'adopter un comportement différent suivant qu'il s'agit de l'attaque ou du corps de la note. Ce générateur confère un caractère “tube” au son. Cette génération d’harmoniques est aussi bénéfique lors du traitement (déconseillé) des formats audio « lossy » tels que mp3, ogg, aac etc… La version simplifiée du son retrouve ainsi de sa complexité et du naturel. www.MaximalSound.com 1 L'algorithme MaximalSound 3 Filtre séparateur Un filtre répartiteur 32 bandes permet au signal d'être traité par 32 dé-expandeurs avant d'être reconstruit en large bande par sommation de toutes les bandes individuellement traitées. Cela permet de produire une égalisation dynamique où chaque partie du spectre est amplifiée dans les faibles niveaux suivant un modèle psycho-acoustique standard. Ce modèle établi pour des son purs et constants, a été modifié pour correspondre aux timbres complexes et variables de la musique. Cette adaptation purement empirique repose sur des milliers d'heures d'écoute attentive. Bien qu'une solution de filtrage IIR (infinite impulse response) ait été choisie, la déviation de phase maximale du traitement tient dans une page de quelques degrés. Cela autorise une reconstruction quasi parfaite d'un signal carré. Une topologie de filtre FIR (finite impulse response) présente l'avantage d'introduire un retard constant et de conserver une phase linéaire sur tout le spectre audio. Mais elle a été écartée lors des tests d'écoute en raison des aberrations produites par tout traitement de dé-expansion situé en aval. L'image précédante correspond à la déformation d'un signal carré passé au travers d'un filtre www.MaximalSound.com 2 L'algorithme MaximalSound IIR 3 pôles. Les valeurs RMS et instantanée du signal ont été notablement modifiées. Bien que l'audition humaine soit peu sensible aux rotations de phases, ces changements affectent tout traitement situé en aval. Le signal ci-dessus est recueilli après reconstruction à la sortie du filtre séparateur MaximalSound (sans autre traitement). Le processeurs en aval n'ont à souffrir d'aucun changement dans les valeurs instantanée et RMS. Ce point est particulièrement important dès qu'il s'agit de modifier la dynamique du signal. Ce signal carré est recueilli à l'issue de l'ensemble du traitement MaximalSound (générateur d'harmoniques, filtre séparateur, dé-expandeur, limiteur). Le signal carré a été choisi pour sa sensibilité à toute variation dans la phase ou le temps de propagation. www.MaximalSound.com 3 L'algorithme MaximalSound 4 Dé-expander Un dé-expandeur peut aussi être appelé expandeur-inverse (ratio inversé). C'est à dire qu'il amplifie le signal en dessous d'un seuil fixé à la différence d'un expandeur qui atténue le signal en dessous de ce seuil. Ce choix est fondamentalement différent des techniques liées à la compression. Le signal est ainsi amplifié quand il est faible et non pas raboté quand il est devenu trop fort (au-delà du seuil). La différence peut paraitre subtile, mais elle est sensible dès qu'on prend en considération le temps d'attaque du traitement. Un compresseur agira toujours en retard (son temps d'attaque) sur les transitoires obligeant le limiteur à agir et à déformer ces transitoires qui sont si précieuses à la perception de l'espace. Le dé-expandeur n'amplifiera le signal qu'après ce temps d'attaque évitant ainsi au limiteur d'agir inutilement sur le signal. Cette technique ne peut être confondue avec la compression parallèle. Notez qu'aucun “lookahead” n'est utilisé. C'est technique qui produit un son très doux en empêchant tout dépassement de la valeur de seuil, présente cependant l'inconvénient d'atténuer le caractère percussif du son ce qui peut conduire à un rendu artificiel. www.MaximalSound.com 4 L'algorithme MaximalSound 5 Limiteur Contrairement au domaine analogique, le numérique n'autorise aucun dépassement du signal, même bref. Le limiteur est là pour gérer les situations où la sommation de toutes les bandes traitées produit un signal supérieur au maximum (0dBFS) permis dans le domaine numérique. Le limiteur est donc un point essentiel du traitement puisqu'à ce stade le signal est complet (large bande) et tout défaut peut conduire à déséquilibrer le rendu global en favorisant, ou pénalisant certaines parties du spectre. Dans un limiteur le temps d'attaque est nul ou négatif (look ahead) pour prévenir tout dépassement de la valeur limite fixée. Tout l'art est alors de trouver un temps de relâchement (release) optimal, capable de préserver le contenu fréquentiel et la perception de la dynamique d'origine quelle que soit la complexité de ce signal alors que sa valeur est radicalement modifiée. 7 Conversions de format Les fichiers mono ou multi-cannaux sont convertis en stéréo Toute fréquence d’échantionnage inférieure à 44100 Hz est portée à 44100 Hz Toute fréquence d’échantionnage supérieure à 96000 Hz est convertie à 96000 Hz mp3, ogg, mpga, wma, mp4a. Les formats audio avec perte reviennent en mp3 320kbps, et wav (CD - 16 bits @ 44100 Hz) o Les codecs sans perte sont préférables pour un travail de mastering aif, flac, wav. Les formats audio sans perte reviennent mp3 320kbps, wav (CD - 16 bits @ 44100Hz), haute définition (HD - 24 bits @ 96000 Hz), et “same format” (même format) si différent des 3 premiers formats de restitution o Un fichier 8 canaux 32 bits @ 192 KHz reviendra au format stéréo 32 bits @ 96 KHz qui est la résolution maximale offerte même si étiquetée “same format” o Le format wav doit être utilisé pour préserver les fréquences d’échantillonnage non standard de type 47952 Hz, ou 48048 Hz qui peuvent être utilisées en vidéo 6 Liens Vidéo MaximalSound At Work The Phase Matters Multiband De-expander Compressor vs De-expander Dynamic Processors by Transfer Curves Digital Overload All Limiters aren't Equal Papier Recommandations pour le mastering www.MaximalSound.com 5