CAP 2001
Algorithmes pour l’apprentissage
de règles à partir de
données multi-instance
Yann Chevaleyre et Jean-Daniel Zucker
Université de Paris VI LIP6 - CNRS
CAP 2001
Motivations
Représentation
Att/Val Représentation
relationelle
-peu expressif
+algorithmes
performants
+très expressif
-difficilement
apprenable,
nécessite
des biais forts
Représentation
MI
La plupart des algorithmes d ’apprentissage MI utilisent des données
numériques, et génèrent des hypothèses difficilement interprétables
Notre but: concevoir des algorithmes efficaces, utilisant des données
symboliques et numériques, et générant des hypothèses
compréhensibles comme des listes de décision
Le choix du langage de représentation des données a un effet
déterminant sur l ’apprentissage
CAP 2001
Plan
1) L ’apprentissage multi-instances
La représentation multi-instances, sources de données multi-instances,
le problème d ’apprentissage multi-instances
2) Extension d ’un algorithme d ’apprentissage propositionnel
Méthode, extension de l ’algorithme Ripper
3) Analyse de l ’extension multi-instances de Ripper
Les littéraux contradictoires, les littéraux non significatifs, les littéraux
indiscernables
Conclusion et perspectives
CAP 2001
La représentation multi-instances: définition
labi {0,1}
est représenté par Vecteur A/V xi
exemple iest représenté par
Vecteur A/V xi,1
Vecteur A/V xi,2
Vecteur A/V xi,r
+
exemplei+
instances sac
labi {0,1}
Représentation Att/Val classique:
Représentation multi-instance:
CAP 2001
Sources de données multi-instances
Les objets complexes (images, molécules, …) sont facilement
représentables sous forme de sacs d ’instances
Atom Type Charge
c 1 1.18
h 3 -1,2
h 2 2.78
… … …
Les Bases de données relationelles peuvent l ’être aussi
id name age sex
1 Laura 43 f
2 Joe 12 m
3 Marry 24 f
… …
id year balance
1 1997 234
1 1998 803
1 1999 1200
2 1999 932
… …
id name age sex year balance
1 Laura 43 f 1997 234
1 Laura 43 f 1998 803
1 Laura 43 f 1999 1200
id name age sex year balance
2 Joe 12 m 1999 932
… …
Des langages de représentations plus complexes (faits datalog,
clauses prolog,…) peuvent être MI-propositionalisés [zucker98],
[Alphonse et Rouveirol 2000]
0,n
1
1 / 21 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !