Développement de nouvelles méthodes de classification de données • Des travaux à la fois : – théoriques (étude des méthodes existantes, proposition de nouveaux critères, optimisation des critères proposés, élaboration et développement de nouvelles approches). – pratiques (implémentation des algorithmes proposés et des outils d’évaluation adaptés, validation expérimentale des méthodes proposées sur des données simulées et réelles). • Contact et responsable : Hani HAMDAN ([email protected]) Développement de nouvelles méthodes de classification de données Cadre : Modèles de mélange et algorithme EM, méthodes géométriques, méthodes graphiques, réseaux de neurones, etc. Données standards en deux dimensions Classification par l’algorithme CEM Développement de nouvelles méthodes de classification de données de type intervalle (Modèles de mélange) Le formalisme de données de type intervalle se trouve tout à fait naturel dans beaucoup d’applications où les intervalles représentent l’incertitude de mesure ou la variabilité. Données imprécises (vecteurs d’intervalles) Classification par l’algorithme interval-EM Développement de nouvelles méthodes de classification de données de type intervalle (Modèles de mélange) Le formalisme de données de type intervalle se trouve tout à fait naturel dans beaucoup d’applications où les intervalles représentent l’incertitude de mesure ou la variabilité. Données imprécises (vecteurs d’intervalles) Classification par l’algorithme interval-CEM Développement de nouvelles méthodes de classification de données de type intervalle (Approches neuronales) Le formalisme de données de type intervalle se trouve tout à fait naturel dans beaucoup d’applications où les intervalles représentent 42 l’incertitude de mesure ou la variabilité. 23 57 58 35 28 96 32 90 14 68 87 23 26 28 35 41 42 57 61 92 24 43 77 89 106 49 1 5 10 14 32 45 58 87 90 96 26 56 67 70 92 61 88 76 16 16 49 50 52 19 20 22 30 39 84 7 46 51 55 76 80 88 95 101 2 4 9 17 27 37 71 72 21 33 34 66 82 93 105 12 15 38 44 53 62 68 75 100 11 25 36 64 83 86 104 45 41 7 83 5 33 55 82 21 104 18 40 48 59 60 69 94 86 40 106 36 59 48 56 29 54 73 79 81 98 103 8 63 91 6 31 47 19 71 6 94 63 67 8 70 69 79 74 46 39 60 64 10 17 2 72 9 84 101 4 103 29 95 30 15 12 18 27 22 38 77 20 3 13 65 74 78 85 97 99 102 53 62 34 80 52 37 100 44 11 25 51 105 89 50 75 93 66 1 85 73 81 31 24 47 43 91 98 54 78 97 65 102 13 3 99 Cartes auto-organisatrices (16 neurones) Classification par l’algorithme interval-SOM Développement de nouvelles méthodes de classification de données discrétisées (Binned data) 8 Traitement plus rapide avec une précision satisfaisante. 6 4 8 (Bins) 2 6 0 4 −2 2 −4 −15 0 −10 −5 0 5 10 15 20 25 8 6 −2 4 −4 −15 −10 −5 0 5 10 Données brutes 15 20 2 25 (Fréquences) 0 40 35 30 25 20 15 10 5 0 5 10 15 20 25 30 35 40 45 Développement de nouvelles méthodes de classification de données discrétisées (Choix de modèles) Un bon modèle ?! Modèle non adapté Comparaison Développement de nouvelles méthodes de classification de données discrétisées (Choix de modèles) 40 30 20 10 Un bon modèle ?! Modèle non adapté 0 −10 −20 −30 −30 −20 −10 0 10 20 40 40 30 30 30 20 20 Comparaison 10 10 0 0 −10 −10 −20 −20 −30 −30 −20 −10 0 10 20 30 −30 −30 −20 −10 0 10 20 30 Développement de méthodes de classification pour les données séquentielles Contexte : Dans certaines applications, les données observées ne sont pas toutes disponibles en même temps, mais arrivent séquentiellement au cours du temps. • Exemple de classification séquentielle : 8 8 8 6 6 6 4 4 4 2 2 2 0 0 0 −2 −2 −2 −4 −4 −4 −6 −6 −6 −8 −8 −8 −10 −6 −4 −2 0 2 4 6 8 10 12 Données à t = 5s (2 classes) 14 −10 −6 −4 −2 0 2 4 6 8 10 12 Données à t = 10s (2 classes) 14 −10 −6 −4 −2 0 2 4 6 8 10 12 Données à t = 15s (3 classes) 14 Développement de méthodes de classification pour les données séquentielles de type intervalle Contexte : Dans certaines applications, les données observées sont de type intervalle et ne sont pas toutes disponibles en même temps, mais arrivent séquentiellement au cours du temps. • Exemple de classification séquentielle : 8 8 8 6 6 6 4 4 4 2 2 2 0 0 0 −2 −2 −2 −4 −4 −4 −6 −6 −6 −8 −8 −8 −10 −10 −5 0 5 10 15 Données à t = 5s (2 classes) −10 −5 0 5 10 Données à t = 10s (2 classes) 15 −5 0 5 10 Données à t = 15s (3 classes) 15