P
ROPOSITION DE SUJET DE THESE
Sujet : Classification de données par sélection multi-modèles
Contexte/objectifs :
La modélisation de systèmes complexes conduit généralement à l’obtention de modèles non-
linéaires dont la dynamique est influencée à la fois par des évènements discrets et des
évènements continus. Les approches multi-modèles ont prouvé leur efficacité quant à la
représentation de tels processus. Les approches multi-modèles partent du principe qu’il est
toujours possible de modéliser un système complexe par des modèles plus simples, souvent
des modèles linéaires, en affectant chaque modèle à un sous ensemble du processus global.
Cela revient à définir des modèles locaux valables sur ces sous-ensembles et qui sont reliés les
uns aux autres par processus d’interpolation . Ainsi il est possible de modéliser le
comportement global du système en essayant de l’approcher par une multitude de
modélisation locale qu’il sera nécessaire de combiner pour aboutir au schéma général.
Dans cette thèse, l’étude et le développement d’un tel processus est envisagé. Deux axes de
recherche sont possibles et complémentaires :
1. Dans un premier temps la définition et la mise en place de modèles locaux seront
simultanément étudiés. Les modèles locaux pourront être de nature différentes
(SVM, réseaux de neurones) ou non. On veillera notamment à leur indépendance
statistique. Généralement, les schémas retenus sont soit d’ordre un-contre-un soit
un-contre-tous et sont systématiquement utilisés indépendamment les uns des
autres. Dans le cas d’un modèle un-contre-un, le modèle local doit nécessairement
affecter un exemple à une des deux classes, même si cet exemple n’appartient à
aucune des deux classes. Afin de pallier cette problématique, on pourra envisager,
en fonction d’une fonction de confiance/plausibilité pertinente, d’avoir recours à
un schéma un contre tous pour prendre la décision et avoir ainsi un degré de
confiance sur la pertinence du modèle local impliqué.
2. Dans un deuxième temps le développement d’un processus de combinaison
(probabiliste ou non) sera réalisé selon la modélisation des sorties des processus
locaux dans le cadre, par exemple, de la théorie des fonctions de croyances.
Diverses interprétations de la sortie d’un classifieur peuvent, dans ce cas, être
envisagées : plausibilité, valeur de la fonction noyaux impliquée dans la
combinaison, raffinement, grossissement du cadre de discernement, etc.
Le cadre applicatif pourra être la mesure de la qualité des images dégradées selon un schéma
de catégorisation ou la classification de données issues d’images biomédicales.
Le candidat devra posséder un bon niveau de programmation en C++. Des notions solides en
mathématiques ainsi qu’en apprentissage constituent un atout supplémentaire.