Acquisition de connaissances
linguistiques en corpus par
apprentissage symbolique
ou quand l’apprentissage perd son aspect
boîte noire
Pascale Sébillot
Équipe TexMex, IRISA, Rennes
Plan
Acquisition numérique
versus
symbolique
Principes de la programmation logique
inductive (PLI)
Expérience d’acquisition de relations
sémantiques nomino-verbales par PLI
Acquisition numérique
versus
symbolique
Pas opposition numérique
vs
linguistique
Approche numérique
exploite l’aspect fréquentiel des données
utilise des techniques statistiques
indices statistiques, analyse distributionnelle…
Approche symbolique
exploite l’aspect structurel des données
utilise des informations structurelles ou symboliques
expertise linguistique ou apprentissage symbolique
Indices statistiques (app. num.)
Cooccurrences dans une fenêtre
Mots apparaissant ensemble de manière statistiquement
significative
Coefficients d’association
table de contingence
coefficient d’information mutuelle IM=
log2(a/(a+b)(a+c))
test du 2 (Church-Gale 91) =
(ad-bc)2/((a+b)(a+c)(b+c)(b+d))
Segments répétés (Lebart et Salem 94)
m2mk≠m2
m1a b
ml≠m1c d
Analyse distributionnelle (app. num.)
Linguistique Harrissienne (Harris
et al.
89)
Approches en 3 étapes
extraction des cooccurrents d'un mot
mise en évidence de la proximité/distance des
mots 2 à 2 selon leurs cooccurrents
regroupement en classes
Classes sémantiques… Grefenstette 94, Bouaud
et
al.
97…
Limites : interprétabilité, détection au niveau du
corpus… mais portabilité
1 / 27 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !