Titre : Implémentation d`un algorithme de fouille de données

publicité
Titre : Implémentation d'un algorithme de fouille de données pour l'extraction automatique de règles d'association temporelles (comportant des contraintes numériques sur intervalles)
Mots cles : Fouille de données, contraintes temporelles sur intervalle, IHM, application médicale
Contacts : René Quiniou ([email protected]), Thomas Guyet ([email protected])
Description : Le volume des données enregistrées et stockées a explosé ces dernières années, ce qui a motivé particulièrement l'intérêt des recherches sur l'extraction automatique de connaissances à partir de données. Beaucoup de ces données contiennent des informations où la dimension temporelle revêt une importance particulière. C'est le cas, par exemple, de données recueillies lors de la surveillance de patients. La simple adaptation des méthodes de fouille de données classiques ne suffit pas, en général, pour extraire les relations temporelles efficacement ou avec suffisamment de précision. C'est le champ de recherche de la fouille de données temporelles. Dans ce domaine, nous nous intéressons à l'extraction de séquences "intéressantes" d'évènements, appelées motifs temporels, à partir de données enregistrées lors de la surveillance d'un système ou d'un patient. Pour aller au delà de la simple contrainte de précédence, nous avons proposé deux algorithmes :
– un algorithme pour l'extraction de motifs comportant des contraintes numériques, éventuellement imprécises, sur les intervalles temporels associés aux occurrences des événements,
– un algorithme pour extraire des règles composées d'une prémisse et d'une conclusion exprimant des liens observés entre deux successions d'évènements dénotés par des motifs (séquentiels?).
L'objectif de ce projet est d'implémenter un nouvel algorithme de fouille de données temporelles pour l'extraction de règles quantitatives en s'appuyant sur les deux algorithmes existants.
Le travail proposé pour ce projet consiste à :
– implémenter l'algorithme de fouille de motifs comportant des contraintes numériques (actuellement en Matlab) en C++ et l'intégrer à l'algorithme d'extraction de règles,
– créer une interface graphique pour, d'une part, paramétrer et lancer l'exécution des algorithmes et, d'autre part, visualiser et explorer les résultats,
– tester les algorithmes sur des jeux de données simulés et réels (électrocardiogrammes caractéristiques d'arythmies cardiaques).
Bibliographie : [1] M. Campos, J. Palma and R. Marín. Temporal data mining with temporal constraints, Artificial Intelligence In Medicine, LNAI 4594, 2007
[2] M.­O Cordier, E. Fromont et R. Quiniou, Learning rules from multisource data for cardiac monitoring, International Journal of Biomedical Engineering and Technology (IJBET), 2010, Vol 3 (1/2), pp. 133­155
[3] T. Guyet and R. Quiniou, Mining temporal patterns with quantitative intervals, in 4th International Workshop on Mining Complex Data, 2008.
[4] T. Guyet et R. Quiniou, Extraction de motifs temporels à partir de séquences d'événements avec intervalles temporels. Extraction et Gestion de Connaissances EGC'11, p. 23–34. 2011. 
Téléchargement