PLAN Introduction Multimédia L’image La vidéo Bibliographie 20 DÉFINITION : LE SON Définition 1: C’est un phénomène ondulatoire dû à un phénomène physique, c'est donc un phénomène continu (analogique) qui peut-être produit par vibration. Définition 2: Le son est une onde sinusoïdale produite par la vibration mécanique d'un support fluide ou solide et propagée grâce à l'élasticité du milieu environnant sous forme d'ondes longitudinales. Par extension, le son désigne la sensation auditive liée à cette vibration L'onde sonore est représentée le plus souvent par une courbe sinusoïdale. 21 DÉFINITION : SON ET PROJET MULTIMÉDIA Deux types d’utilisation: Contenu Sonore Narration Description de contenu (voice-overs) Musique (chanson) Ambiance sonore Fond sonore (musique d’accompagnement) Effets sonores (clic sonore) 22 PROPRIÉTÉS DU SON Le son sous forme d’onde (spectre de modulation d'amplitude) Fréquence : • L’inverse de la période (1/p) • C’est la hauteur (grave, aigu) • Nombre de pics (crête) par seconde • Unité : Hz (1 Hz= 1pics par seconde) • Plage audible : 20 Hz - 20KHz 23 PROPRIÉTÉS DU SON Les sons dont les fréquences sont plus faibles que la plus petite fréquence audible (donc, du côté des graves) sont appelés les infrasons (20 Hz chez l'homme). Les sons dont les fréquences sont plus élevées que la plus haute fréquence audible (donc, du côté des aigus) sont appelés les ultrasons (20 000 Hz chez l'homme). Les fréquences les plus utilisées par l'Homme sont comprises entre 1 et 3 KHz. Mais, la plage audible est de 20Hz à environ 20 KHz (non audibles : infrasons et ultrasons) Largeur de bande : différence entre plus haute et plus basse fréquence Intensité (volume) 24 PROPRIÉTÉS DU SON ~ INTENSITÉ Intensité (différence de pressions) L'intensité correspond à l’amplitude (différence de pression). Exprimée en décibels (dB) qui sont des unités logarithmiques. 25 PROPRIÉTÉS DU SON ~ INTENSITÉ 26 PROPRIÉTÉS DU SON ~ INTENSITÉ I: l’intensité sonore en W.m-2 L: niveau d’intensité sonore en dB. I0 est une constante correspondant à l’intensité sonore minimale, on a : I0 = 1,00 × 10-12 W.m-2 Réciproquement on a 27 PROPRIÉTÉS DU SON ~ INTENSITÉ Imaginons que l’on ait un violon jouant à L=70 dB. Si un deuxième violon joue de la même manière, quel va être le niveau d’intensité sonore ? Heureusement cela ne va pas être le double, sinon on aurait 140 dB : le seuil de douleur serait dépassé, et à trois cela ferait 210 dB, on serait bien loin du seuil de douleur !!! Ainsi, les dB ne s’additionnent pas !! En revanche, les intensités sonores (les I) s’additionnent ! 28 PROPRIÉTÉS DU SON ~ INTENSITÉ Commençons par le plus simple : on suppose que l’on a un violon jouant à un niveau d’intensité sonore de 70 dB. On cherche l’intensité sonore correspondant à 2 violons jouant de manière identique. Pour 2 violons, il faut trouver l’intensité sonore d’un violon, la multiplier par 2, et calculer le niveau d’intensité sonore correspondant. 29 PROPRIÉTÉS DU SON ~ INTENSITÉ 30 PROPRIÉTÉS DU SON ~ TIMBRE Timbre: C’est la différence entre deux sons ayant la même hauteur et le même volume (même fréquence, même intensité) : c’est la qualité de sensation. Il permet d'identifier un son d'une façon unique. Deux sons peuvent avoir la même fréquence fondamentale et la même intensité, mais ne peuvent jamais avoir le même timbre. C’est grâce au timbre qu’on distingue une même note jouée au piano ou au violon, mais aussi qu’on reconnaît la voix d’une personne. Exemple: Des instruments de musique jouant un do ont des intensités d'harmoniques différentes. Cela n'empêche pas de reconnaître ce do qu'il soit émis par une soprane, un piano ou un cor de chasse. 31 PROPRIÉTÉS DU SON ~ TIMBRE 32 PROPRIÉTÉS DU SON Fondamentale et harmoniques Une onde périodique complexe peut-être décomposée en un ensemble d’ondes périodiques simples. Ainsi, un son est, en général, un mélange de fréquences dites " harmoniques " qui sont des multiples entiers de la fréquence de base (fondamentale). 33 PROPRIÉTÉS DU SON • Calcul des harmoniques : Transformée de Fourier – Signal analogique Signal analogique x(t): Périodique Série de Fourier Apériodique Transformée de Fourier Signal discret TFD 34 PROPRIÉTÉS DU SON 35 PROPRIÉTÉS DU SON Vitesse de son La vélocité du son varie suivant le milieu dans lequel il se propage. Le principal facteur de la variation est la densité de ce milieu : dans un gaz, sa vitesse est plus faible que dans un liquide. Par exemple, le son se propage approximativement à 343 m.s-1 dans l'air et à 1500 m.s-1 dans l'eau. 36 NUMÉRISATION Un signal analogique est un signal continu qui peut prendre une infinité de valeurs, alors que le signal numérique est un signal discret (discontinu), qui se résume en une succession de « 0 » et de « 1 ». 37 NUMÉRISATION L’objectif de la numérisation est de transformer le signal analogique qui contient une quantité infinie d'amplitudes en un signal numérique contenant lui une quantité finie de valeurs. Deux étapes dans la numérisation sont l’échantillonnage et la quantification. 38 NUMÉRISATION Les contraintes sont: Ne pas détériorer le signal analogique. Limiter l’espace de stockage. Le nombre d'échantillons composant le signal numérique devra être suffisamment grand pour pouvoir représenter le signal analogique de départ mais pas trop grand non plus pour ne pas être trop volumineux. Deux facteurs devront être ajustés pour répondre à ce cahier des charges : la précision et la rapidité. 39 NUMÉRISATION La conversion est obtenue grâce à un circuit électronique intégré appelé Convertisseur Analogique-Numérique (CAN). Etapes résumées dans la figure 1 et 2 suivantes. Exemple de numérisation d’un signal analogique 40 NUMÉRISATION 41 NUMÉRISATION: ÉCHANTILLONNAGE Modèle de l’échantillonnage L’opération mathématique associée à cette discrétisation revient à multiplier le signal x(t) par un peigne de Dirac p(t): Xs (t) = X(t).p (t) = Xs(t). Σk (t – kTe) 42 NUMÉRISATION: ÉCHANTILLONNAGE Principe On prend ainsi des valeurs de x(t) à des intervalles de temps régulier (tous les Te, période d’échantillonnage) à une fréquence Fe (Fe=1/Te) dite fréquence d’échantillonnage. Plus la fréquence est élevée, plus la numérisation est de qualité. 43 NUMÉRISATION: ÉCHANTILLONNAGE Le premier paramètre à fixer est la vitesse à laquelle seront prélevés les échantillons pour que la reconstruction du signal de sortie soit fidèle au signal d'entrée. La fréquence d'échantillonnage doit être suffisamment grande. En effet, si celle-ci est trop faible, les variations rapides du signal ne pourront être retranscrites. Voici deux exemples d'échantillonnage du même signal pour deux fréquences où 44 NUMÉRISATION: ÉCHANTILLONNAGE Signal échantillonné à Te1 45 NUMÉRISATION: ÉCHANTILLONNAGE Signal échantillonné à Te2 > Te1 46 NUMÉRISATION: ÉCHANTILLONNAGE Signal échantillonné à Te2 > Te1 il est clair que les échantillons recueillis ne sont pas suffisants pour reconstruire le signal d'origine. 47 NUMÉRISATION: ÉCHANTILLONNAGE Le théorème de Shannon permet de connaître la fréquence d'échantillonnage à choisir pour un signal donné : Pour reconstruire un signal de sortie de manière fidèle au signal d'entrée, il faut choisir une fréquence d'échantillonnage au moins deux fois supérieure à la fréquence maximale contenue dans le signal d'entrée. 48 EXEMPLE: CAS D'UN SIGNAL SINUSOÏDAL Spectre d'un signal sinusoïdal 49 EXEMPLE: CAS D'UN SIGNAL SINUSOÏDAL Spectre du signal sinusoïdal échantillonné à 50 EXEMPLE: CAS D'UN SIGNAL SINUSOÏDAL Spectre du signal sinusoïdal échantillonné à 51 EXEMPLE 2 : CAS D'UN SIGNAL QUELCONQUE Spectre d'un signal quelconque échantillonné à 52 EXEMPLE 2 : CAS D'UN SIGNAL QUELCONQUE Spectre d'un signal quelconque échantillonné à 53 EXEMPLE 3 : CAS D'UN SIGNAL QUELCONQUE 54 NUMÉRISATION: ÉCHANTILLONNAGE Conclusion: Choix de la fréquence d’échantillonnage théorème de Shannon Éviter le repliement du spectre qui rend la restitution du signal impossible. 55 NUMÉRISATION: ÉCHANTILLONNAGE Principe Avant d’échantillonner le signal, on applique un filtre pour limiter cet effet de repliement : Filtre passe bas (filtre anti-repliement) pour enlever les fréquences supérieures à ½ Fe. Utilisation du filtre en amont de l’échantillonneur 56 NUMÉRISATION: ÉCHANTILLONNAGE Exemple Pour la musique, la fréquence maximale audible est de 20 kHz, en comptant très large. La fréquence d'échantillonnage des CD-audio, de 44,1 kHz, respecte bien ce théorème. Application à la voix en téléphonie : fréquence maximale : 3700 Hz. Quelle fréquence d'échantillonnage minimale choisir ? Choix d’une fréquence d’échantillonnage Les fréquences usuelles sont de 44,1 kHz et 48 kHz !!! Le choix est également fonction des performances de l’oreille Comme il faut au moins 2 échantillons pour recréer un signal, le choix sera : fe ≥ 2 fréquence max (théorème de Shannon ou de Nyquist) 57 EXERCICE 1 58 EXERCICE 2 59 NUMÉRISATION: ÉCHANTILLONNAGE L’échantillonnage blocage Une fois le signal filtré et échantillonné, il reste à le quantifier. On doit maintenir constant la valeur à quantifier afin de permettre au CAN de traiter l'échantillon et de le numériser. On appelle cette opération, le blocage. Ce blocage doit être d’une durée supérieure au temps de conversion. Chaine de Conversion Analogique numérique 60 NUMÉRISATION: QUANTIFICATION Théorie de la quantification Le signal échantillonné - bloqué peut à ce stade être converti sous forme binaire (numérique) pour être stocké. Ce codage s'appelle la quantification. De là vient le nom de la technique : PCM ("Pulse Code Modulation") ou MIC ("Modulation Impulsion Codée"). Le rôle de la quantification est de donner une image binaire d’un signal analogique 61 NUMÉRISATION: QUANTIFICATION Effectué par un circuit intégré (CAN, ADC). A Chaque valeur mesurée est associée une valeur binaire codée sur n bits (nombre de bits de quantification). N bits permettent de distinguer 2n niveaux de tension entre –Vm et +Vm. On a ainsi le pas de quantification : la plage de quantification Application : Un signal de +/- 5 V codé sur 8 bits, donner le pas de quantification q. Réponse : 39 mV. 62 NUMÉRISATION: QUANTIFICATION Fonction escalier d’un CAN La caractéristique d’entrée sortie d’un CAN est une caractéristique en marche d’escalier. Chaque palier a une largeur d’un pas de quantification q. Le passage d’un palier à un autre correspond à une variation de ‘1’ du code. Le pas de quantification est appelée quantum, il correspond à la résolution du convertisseur. Le quantum est la plus petite variation de tension que le convertisseur peut coder. Fonction escalier d’un CAN 63 NUMÉRISATION: QUANTIFICATION Bruit de quantification Lors de la quantification, une erreur de codage entre le signal échantillonné et la valeur du code correspond à un niveau de tension (ce niveau de tension étant la moyenne des tensions correspondant à ce code) : Gamme de tension Code unique Lors du codage, tous les niveaux compris dans la gamme reçoivent le même code. La quantification fournie une valeur approximative du signal donc introduit un bruit : Rapport Signal Bruit (Signal Noise Ration) : 64 NUMÉRISATION: QUANTIFICATION Bruit de quantification Le rapport Signal/Bruit pour un signal utilisant la pleine échelle vaut environ : SNR dB =6.N + 2 • Amplitude du signal et rapport S/B : Le rapport Signal/Bruit S/B=6N+2 est obtenu pour la pleine échelle et diminue si l’amplitude du signal numérisé est plus faible. Exemple: un CAN 8 bits travaille sur une plage d’entrée de -5V à+5V : un signal d’amplitude Smax= 5V sera digitalisé sur 256 niveaux, d’où un rapport S/B = 6.N + 2 = 50 dB un signal d’amplitude 1,25V sera digitalisé sur 64 niveaux soit 6 bits, d’où un rapport S/B = 38 dB pour S/Smax= 0,25 = -12 dB 65 QUANTIFICATION UNIFORME (LINÉAIRE) La fonction de quantification uniforme attribue le même niveau à tous les signaux situés dans une plage de tension donnée : le quantum q est donc constant. Le bruit de quantification (ou bruit de numérisation) apparut, diminue si la précision, c’est-à-dire le nombre de bits N, de la conversion augmente 66 QUANTIFICATION UNIFORME (LINÉAIRE) Le nombre de niveaux de quantification est bien-sûr lié au nombre de bits N du CAN : Un convertisseur 8 bits quantifie le signal analogique sur 256 niveaux, q = 19,5 mV si E = 5V Un convertisseur 12 bits quantifie le signal analogique sur 1024 niveaux, q = 4,9 mV si E = 5V Un convertisseur 16 bits quantifie le signal analogique sur 65536 niveaux, q = 0,076 mV si E = 5V Application: Calculer en Volts le quantum lorsque le signal analogique a une amplitude 10 et la conversion est sur 8 bits. (Réponse : q=20/256=0,078). 2. Le rapport signal/bruit est particulièrement défavorable pour les signaux de petites amplitudes. Une quantification non-linéaire est donc requise. 1. 67 QUANTIFICATION NON LINÉAIRE Pour obtenir un rapport signal/bruit de quantification constant (ie indépendant de l'amplitude), il faut évidemment faire varier le pas de quantification selon l'amplitude. le pas est petit pour les échantillons de faible amplitude le pas est grand pour des échantillons de forte amplitude En téléphonie, la quantification est à pas variable et utilise une courbe non linéaire appelée “loi A” en Europe et “loi mu” aux Etats-Unis Quantification non linéaire 68 FORMATS ET STANDARDS On peut calculer la taille d’un fichier son comme suit : Taille(en bits) = Fe * N * D * V Avec : Fe : Fréquence d’échantillonnage (8 KHz, 44,1 KHz, …etc) N : nombre de bits de quantification (8 bits, 16 bits) D : Durée(en s) V : Nombre de voies (mono : 1 voie, stéréo : 2 voies, quadri, etc) On peut aussi calculer le débit : Débit (en bps)= Fe * N * V 69 CODAGE En principe, le codage désigne le type de correspondance que l'on souhaite établir entre chaque valeur du signal analogique et le nombre binaire qui représentera cette valeur. Le type de codage : PCM - Différentiel (delta) - Prédictif - Adaptatif - etc. Codage PCM (Pulse Coded Modulation) En français, MIC : Modulation par Impulsions Codées. Utilisé au départ pour la téléphonie. Il s’agit de coder chaque échantillon à sa valeur réelle (contrairement à ce qui se fait dans le codage différentiel). 70 CODAGE (suite) Codage différentiel ou codage "delta" Ce codage consiste à évaluer (coder) la différence entre le niveau du signal à l'instant de l'échantillonnage et le niveau qu'il avait lors de l'échantillonnage précédent. Standard DPCM (Differential PCM) Codage différentiel 71 CODAGE (suite) Codage prédictif Fonction de prédiction Coder la différence entre la valeur réelle et la valeur prédite Standard : LPC (Linear Predictive Coding/ Codage linéaire prédictif pour la parole), WarpedLPC. Codage adaptatif Adapte le nombre de bits au type de variation sonore qu'il détecte. Très utile pour adapter la qualité d'un son à l'encombrement du réseau qui le transmet. Standard : ADPCM (Adaptative PCM). Codage par transformation Transformer le signal avant codage Standards : DCT (Discrete Cosine Transform), DFT (Fourier), DWT (Wavelet) 72 COMPRESSION DE SON Un son numérisé est une séquence d'octets en mémoire. La compression consiste à trouver une séquence d'octets plus courte dont l'effet sonore soit semblable à celui de la séquence initiale. Buts de la compression: Gain de place dans le cas d'un enregistrement, Économie de bande passante dans le cas d'une transmission, Gain de temps dans le cas d'un transfert de fichier (Internet) On calcule ainsi le taux de compression : Taux de compression (%) = Taille compressé/ Taille originale Exemple : C= 25/100= 0,25 soit 25 % 73 ALGORITHME DE COMPRESSION On cite ci-dessous quelques algorithmes de compression/décompression (Codec) : Algorithme de compression sans perte La suite de bits obtenue après les opérations de compression et de décompression est strictement identique à l’originale, cet algorithme est utilisé pour nombreux types de données (documents, fichiers exécutables, fichiers textes). RLE (Run Length Encoding): Toute suite de bits ou de caractères identiques est remplacé par un couple :(nombre d’occurrence, bit ou caractère répété) Exemple : AAAAAAAAZZZEEEE devient 7A3Z4E. LZW : Codage par dictionnaire (une table de données contenant des chaînes de caractères), peu efficace pour les images et donne de bons résultats pour les textes et les données informatiques en général (plus de 50 %). 74 ALGORITHME DE COMPRESSION Algorithme de compression avec perte La suite de bits obtenue après les opérations de compression et de décompression est différente de l’originale mais l’information reste sensiblement la même, utilisé pour les types de données : images, sons et vidéos. MPEG ADPCM 75 FORMATS DE FICHIERS AUDIO Ils sont plus que 50 formats : WAV, MP3, WMA, AAC, OGG, RA, MIDI,…etc WAV : Waveform audio format Développer par IBM et Microsoft (plateforme Windows), Conteneur capable de recevoir des formats variés Il peut être mono ou stéréo. Extension : .wav 76 FORMATS DE FICHIERS AUDIO (SUITE) MP3 : abréviation de MPEG-1/2 Audio Layer 3 Moving Picture Expert Group (Layer 3: couche 3) La partie audio du MPEG-1 est décomposée en MPEG-1 Audio Layer I, II et III. Ce dernier format est plus connu sous le nom de MP3 et permet une compression sur 2 voies audio. Concurrent de WMA, Très rapide à l’encodage, Débit jusqu’à 320 kbps. WMA (Windows Media Audio) Alternative au MP3 par Microsoft Compatible seulement avec les logiciels Microsoft Suffixe : .wma 77 FORMATS DE FICHIERS AUDIO (SUITE) AAC (Advanced Audio Coding) OGG Extension du MPEG-2 Concurrent de WMA par Apple (iPod, iTunes) Compression avec bonne qualité De 8 à 96KHz et jusqu’à 48 canaux Extensions .mp4, .aac, .m4a Format Open source (libre et gratuit) Amélioration du MP3 (Compression et qualité) Compression selon Vorbis (algorithme différent de MP3, WMA et AAC) RA (RealAudio) Format de RealNetworks Application en streaming Grand taux de compression Compatible avec Realplayer uniquement. 78 SON MULTI-CANAL Désigne l’utilisation de plusieurs pistes audio en vue de la restitution sur un système comportant plusieurs enceintes (baffles) horizontalement (restitution 3D). Exemple : Il existe une terminologie associé : deux chiffres séparés par un point (2.1, 5.1). 1er chiffre: Nombre de canaux principaux destinés à être restituer sur une enceinte. 2ème chiffre: désigne la présence d’effets basse fréquence destinés à être restitué sur une enceinte (caisson de basse). 1.0 : monocanal / 2.0 : source sonore stéréo. 79 APPLICATION Considérons une chanson de 5 min numérisée avec une carte son en qualité CD. 1) Calculer le volume occupé par cette chanson en Méga octet. Pour cette chanson la carte va générer 44100 échantillons par seconde. Chaque échantillon va occuper 16 bits= 2 octets. 2) Déduire le débit en bps et la capacité d’un CD 700 MOctet en minutes. 80