RÉSUMÉ
Il est avant-tout question, dans ce mémoire, de la modélisation du timbre grâce à des al-
gorithmes d’apprentissage machine. Plus précisément, nous avons essayé de construire
un espace de timbre en extrayant des caractéristiques du son à l’aide de machines de
Boltzmann convolutionnelles profondes.
Nous présentons d’abord un survol de l’apprentissage machine, avec emphase sur
les machines de Boltzmann convolutionelles ainsi que les modèles dont elles sont déri-
vées. Nous présentons aussi un aperçu de la littérature concernant les espaces de timbre,
et mettons en évidence quelque-unes de leurs limitations, dont le nombre limité de sons
utilisés pour les construire. Pour pallier à ce problème, nous avons mis en place un outil
nous permettant de générer des sons à volonté. Le système utilise à sa base des plug-ins
qu’on peut combiner et dont on peut changer les paramètres pour créer une gamme vir-
tuellement infinie de sons. Nous l’utilisons pour créer une gigantesque base de donnée
de timbres générés aléatoirement constituée de vrais instruments et d’instruments syn-
thétiques. Nous entrainons ensuite les machines de Boltzmann convolutionnelles pro-
fondes de façon non-supervisée sur ces timbres, et utilisons l’espace des caractéristiques
produites comme espace de timbre.
L’espace de timbre ainsi obtenu est meilleur qu’un espace semblable construit à
l’aide de MFCC. Il est meilleur dans le sens où la distance entre deux timbres dans
cet espace est plus semblable à celle perçue par un humain. Cependant, nous sommes
encore loin d’atteindre les mêmes capacités qu’un humain. Nous proposons d’ailleurs
quelques pistes d’amélioration pour s’en approcher.
Mots clés: espace de timbre, machine de Boltzmann convolutionnelle, apprentis-
sage machine, génération automatique de timbres, architectures profondes, extraction
de caractéristiques.