PROPOSITION DE SUJET DE THESE Sujet : Classification de données par sélection multi-modèles Proposé par : Charrier Christophe, [email protected] Contexte/objectifs : La modélisation de systèmes complexes conduit généralement à l’obtention de modèles nonlinéaires dont la dynamique est influencée à la fois par des évènements discrets et des évènements continus. Les approches multi-modèles ont prouvé leur efficacité quant à la représentation de tels processus. Les approches multi-modèles partent du principe qu’il est toujours possible de modéliser un système complexe par des modèles plus simples, souvent des modèles linéaires, en affectant chaque modèle à un sous ensemble du processus global. Cela revient à définir des modèles locaux valables sur ces sous-ensembles et qui sont reliés les uns aux autres par processus d’interpolation . Ainsi il est possible de modéliser le comportement global du système en essayant de l’approcher par une multitude de modélisation locale qu’il sera nécessaire de combiner pour aboutir au schéma général. Dans cette thèse, l’étude et le développement d’un tel processus est envisagé. Deux axes de recherche sont possibles et complémentaires : 1. Dans un premier temps la définition et la mise en place de modèles locaux seront simultanément étudiés. Les modèles locaux pourront être de nature différentes (SVM, réseaux de neurones) ou non. On veillera notamment à leur indépendance statistique. Généralement, les schémas retenus sont soit d’ordre un-contre-un soit un-contre-tous et sont systématiquement utilisés indépendamment les uns des autres. Dans le cas d’un modèle un-contre-un, le modèle local doit nécessairement affecter un exemple à une des deux classes, même si cet exemple n’appartient à aucune des deux classes. Afin de pallier cette problématique, on pourra envisager, en fonction d’une fonction de confiance/plausibilité pertinente, d’avoir recours à un schéma un contre tous pour prendre la décision et avoir ainsi un degré de confiance sur la pertinence du modèle local impliqué. 2. Dans un deuxième temps le développement d’un processus de combinaison (probabiliste ou non) sera réalisé selon la modélisation des sorties des processus locaux dans le cadre, par exemple, de la théorie des fonctions de croyances. Diverses interprétations de la sortie d’un classifieur peuvent, dans ce cas, être envisagées : plausibilité, valeur de la fonction noyaux impliquée dans la combinaison, raffinement, grossissement du cadre de discernement, etc. Le cadre applicatif pourra être la mesure de la qualité des images dégradées selon un schéma de catégorisation ou la classification de données issues d’images biomédicales. Le candidat devra posséder un bon niveau de programmation en C++. Des notions solides en mathématiques ainsi qu’en apprentissage constituent un atout supplémentaire.