exposé - Université de Valenciennes

publicité
Application de réseaux bayésiens à la
détection de fumées polluantes
David Gacquer
LAMIH, Université de Valenciennes et du
Hainaut-Cambrésis
Equipe Raisonnement Automatique et Interfaces Homme Machine
Illustration du problème :
Sommaire
 Présentation du système DETECT
 Comparaison entre le réseau naïf et
l’algorithme des K plus proches voisins
 Analyse des résultats
 Amélioration du réseau par apprentissage
de la structure
 Conclusion et perspectives de recherches
Problème et solution actuelle
 Enregistrement des émissions
de fumées par caméra
 Calcul de signaux par
traitement d’image (densité,
surface …)
 Attribution d’un niveau de
pollution [0..3] à l’aide d’un
système de règles
L’objectif
 Affecter automatiquement une classe à un panache de
fumée.
 Approche supervisée : les classes et leur nombre sont
déjà connus, l’objectif est d’affecter une classe à tout
panache non encore classé, à partir d’une base
d’apprentissage.
 Modélisation : chaque nœud correspond à un des signaux
mesurés, un nœud supplémentaire est utilisé pour
représenter la variable de classe.
Première approche : le réseau naïf
 Nœuds périphériques = signaux
 Nœud central (variable de classe) =
niveau de pollution
 Apprentissage = estimation des tables de
probabilité
Comparaison avec les k plus
proches voisins
Principe de l’algorithme :
 Exemple simple où trois variables sont
utilisées.
 Deux nuages de points sont considérés,
ceux de niveau 1 et 3.
 Le panache N non encore classé, plus
proche des points de niveau 3, se verra
attribuer le même niveau de gravité que
ses plus proches voisins.
Implémentations, tests et
analyses
Modélisation des prédictions :
 Matrice de confusion
Niveau attribué par l’algorithme utilisé
Fausses alarmes
Niveau attribué par
l’expert
Non détections
Critères d’évaluation :
 Taux d’erreur global.
 Taux de satisfaction client (non détections et fausses alarmes).
Résultats obtenus
Réseau bayésien naïf
Erreur globale : 12,97%
Satisfaction client : 86,1%
K plus proches voisins
Erreur globale : 9,45%
Satisfaction client : 95,08%
Analyse des résultats
 Réseau bayésien moins efficace que les K
plus proches voisins.
 Améliorer le réseau bayésien naïf par
apprentissage de la structure.
 Utiliser la BNT Matlab de Murphy et le
Structure Learning Package de P. Leray et
son équipe.
Apprentissage de la structure
 Réseau naïf = variables supposées
indépendantes entre elles lorsque la
variable de classe est connue.
 Autoriser les arcs entre les nœuds pour
lever cette restriction.
 Difficulté : espace des graphes candidats
trop complexe pour être entièrement
parcouru
méthodes heuristiques.
Apprentissage de la structure
 Tree Augmented Naive (TAN) :
- le nœud classe est toujours la racine du
réseau
- liens entre les nœuds périphériques
respectant une structure d’arbre
 Greedy Search (recherche gloutonne)
- recherche d’une structure par
ajouts/retraits successifs d’arcs.
Apprentissage de la structure
Algorithme Greedy Search
Erreur globale : 15,56%
Satisfaction client : 91,79%
Tree Augmented Naive (TAN)
Erreur globale : 16,46%
Satisfaction client : 89%
Récapitulatif des résultats
Erreur globale Satisfaction client
Réseau bayésien naïf
12,97%
86,1%
Tree Augmented Naive (TAN)
16,46%
89%
Algorithme Greedy Search
15,56%
91,79%
K plus proches voisins
9,45%
95,08%
Conclusions
 Réseau naïf satisfaisant mais trop restrictif
par rapport à d’autres méthodes.
 Apprentissage de structure complexe :
- méthodes basées sur des scores ne
donnent pas toujours les résultats
attendus en classification
- méthodes heuristiques peuvent s’arrêter
sur des optimum locaux
Perspectives de recherche
 Autres algorithmes :
- arbre de poids maximal
- algorithme K2 …
 Approche Multi Net et Similarity Networks :
- un réseau par valeur de la variable de
classe
- dépendances entre variables différentes
selon la classe
Merci
Téléchargement