Table des matières
1 Recherche d’information musicale 8
1.1 Représentations symboliques . . . . . . . . . . . . . . . . . . . . 8
1.2 Représentations de l’audio . . . . . . . . . . . . . . . . . . . . . . 9
1.2.1 Domaine temporel . . . . . . . . . . . . . . . . . . . . . . 9
1.2.2 Domaine fréquentiel . . . . . . . . . . . . . . . . . . . . . 10
1.2.3 Coefficients Cepstraux de Fréquence Mel . . . . . . . . . . 11
1.3 TâchesdeMIR............................ 12
1.3.1 Estimation de la hauteur du son . . . . . . . . . . . . . . 12
1.3.2 Détection de pulsation rythmique . . . . . . . . . . . . . . 13
1.3.3 Reconnaissance de genre . . . . . . . . . . . . . . . . . . . 13
1.3.4 Étiquetage automatique . . . . . . . . . . . . . . . . . . . 14
1.3.5 Reconnaissance d’instrument . . . . . . . . . . . . . . . . 14
1.3.6 Composition automatique . . . . . . . . . . . . . . . . . . 15
1.4 Difficultés généralement rencontrées avec l’analyse de la musique 15
1.4.1 Interférence.......................... 15
1.4.2 Effetperceptuel........................ 16
1.4.3 Sac de caractéristiques . . . . . . . . . . . . . . . . . . . . 16
2 L’apprentissage machine 18
2.1 Cadres d’apprentissage . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.1 Apprentissage supervisé . . . . . . . . . . . . . . . . . . . 18
2.1.2 Apprentissage non-supervisé . . . . . . . . . . . . . . . . . 18
2.1.3 Apprentissage semi-supervisé . . . . . . . . . . . . . . . . 19
2.2 La généralisation et la minimisation de l’erreur empirique . . . . 19
2.3 Quelques modèles d’apprentissage machine . . . . . . . . . . . . . 20
2.3.1 Classifieurs .......................... 20
2.3.2 Partitionnement non-supervisé . . . . . . . . . . . . . . . 22
2.4 Données à haute dimension et réduction de dimensionalité . . . . 22
2.4.1 Analyse en composantes principales . . . . . . . . . . . . 23
2.4.2 Échelonnage Multi-Dimensionnel . . . . . . . . . . . . . . 23
2.4.3 t-SNE ............................. 24
2.5 Apprentissage profond . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5.1 Réseaux de neurones convolutionnels . . . . . . . . . . . . 25
2.5.2 DBN.............................. 25
2.5.3 DBN convolutionnels . . . . . . . . . . . . . . . . . . . . . 26
3 Recherche effectuée 28
3.1 Reconnaissance d’instruments . . . . . . . . . . . . . . . . . . . . 28
3.2 Apprentissage de représentation de l’audio musical . . . . . . . . 29
3.3 Encodage parcimonieux de la musique . . . . . . . . . . . . . . . 32
3.4 Jeuxvidéos .............................. 34
3.5 Apprentissage de structure répétitives . . . . . . . . . . . . . . . 34
2