Tester les performances de l`algorithme MIR (Music

publicité
Institut Jean d’Alembert – UMR 7190
UPMC CNRS UMR 7190
Lutheries Acoustique Musicale
Année 2015-2016
Projet/stage de Recherche en Mathématiques statistiques appliquées à l’analyse musicale
Tester les performances de l’algorithme MIR (Music Information
Retrieval) « Shazam » sur un corpus de musiques traditionnelles
d’Afrique.
Description stage
Description et contexte : Ce projet de recherche s’intéresse à l’algorithme « Shazam ». Shazam est en
fait un logiciel propriétaire de reconnaissance musicale dédié aux chansons développé par une
entreprise basée à Londres. Il fonctionne sur le même principe que le logiciel lui aussi propriétaire
Tunatic. Ce logiciel utilise le microphone du téléphone pour capturer un échantillon de musique jouée.
Une empreinte acoustique est créée à partir de cet échantillon, elle est comparée à la base de donnée
centrale de la société pour comparaison. En cas de correspondance, les informations de la base de
données comme le nom de l'artiste, le titre de la chanson, et l'album sont retournées à l'utilisateur. Des
liens vers des services partenaires comme iTunes, YouTube, Spotify ou Zune sont également diffusés
par Shazam.
Nous souhaitons au sein de ce projet tester les performances de cet algorithme au répertoire musical de
différentes cultures Africaines, dont celles de Madagascar et du Cameroun. Ce répertoire de musique
du monde possède des caractéristiques intéressantes contrastant avec le répertoire occidental des
musiques actuelles : diversification du timbre des instruments, redondance et répétition des lignes
mélodiques, complexité de rythmes polyphoniques (on parle de polyrythmie). L’intérêt de ce projet est
d’évaluer comment ces différences musicales inter-culturelles peuvent impacter les performances d’un
des algorithmes les plus efficaces pour l’extraction d’informations musicales utiles à la classification
automatique de pièces de musique.
Travail demandé : les tâches sur lesquelles pourra intervenir le stagiaire sont multiples et
diversifiées, répondant chacune à des problématique et besoins sous-jacents au projet global. Une
grande flexibilité sera ainsi laissée au stagiaire sur les tâches réalisées, selon ses préférences. Nous
donnons maintenant un aperçu rapide de chacune d’entre elles :


Prise en main et compréhension théorique de l’algorithme « Shazam » écrit par Dan Ellis en
Matlab (http://www.ee.columbia.edu/ln/rosa/matlab/) ;
Constituer une base de données de séquences musicales traditionnelles de différentes cultures
d’Afrique, mettant en exergue différentes spécificités musicales précédemment citées. Ces sousgroupes musicaux devront permettre d’isoler différents paramètres d’influence dans l’évaluation


des performances de l’algorithme. Différentes sources de collecte d’informations seront fournies
au stagiaire ;
Evaluer les performances de l’algorithme dans une tâche classique de classification multiclasse intégrant les sous-groupes précédemment cités ;
Proposer des adaptations de l’algorithme (par exemple, représentation autre que le spectrogramme,
qui pourrait faire ressortir les caractéristiques rythmiques) pour améliorer les performances de
classification ;
Mots clés scientifiques : MIR, ethnomusicologie
Compétences requises : Matlab, traitement du signal audio, classification automatique
Modalités stage
Temps de travail : la période du stage est laissée à la discrétion du stagiaire, à temps plein ou partiel
selon ses disponibilités ;
Rémunération : aucune
Descriptif du lieu : voir http://www.dalembert.upmc.fr/lam/.
Adresse du lieu : LAM, 11 rue de Lourmel, 75015 Paris, http://www.lam.jussieu.fr
Responsables : Dorian Cazau (Doctorant au LAM), [email protected] et Olivier Adam
(Professeur des Universités, rattaché à l’Université Pierre et Marie Curie, Paris 6),
[email protected]
Téléchargement