Les applications évoluées (traduction automatique) nécessitent
beaucoup d'informations lexicales : délimitation des mots
composés, lemmes...
Cela fait augmenter la quantité d'ambiguïté lexicale
Jeu de 15 étiquettes (catégories grammaticales) :
1,6 étiquette par mot simple
Jeu de 1000 étiquettes (catégories grammaticales, traits
flexionnels, délimitation des mots composés, lemmes) :
2,0 étiquettes par mot simple
Systèmes de levée d'ambiguïté lexicale
Levée d'ambiguïtés
Systèmes de levée d'ambiguïtés lexicales
Etiquetage d'un texte par dictionnaire, puis application
d'une grammaire de levée d'ambiguïtés lexicales
Grammaire
n
règles
Texte
étiqueté
m
analyses
Texte
m'
analyses
Système
de levée
d'ambiguïtés
lexicales
Systèmes de levée d'ambiguïtés lexicales
Grammaire de levée d'ambiguïtés :
n
règles
Texte : ensemble de
m
analyses
ambResol(gramm, texte) texte
Rappel : nb d'analyses retenues parmi les analyses
correctes
Précision : nb d'analyses correctes parmi les analyses
retenues
Construction et maintenance manuelles
Lisibilité
règles simples, lisibles et compréhensibles
Cumulativité
impossibilité de perturber le fonctionnement des règles
existantes quand on ajoute de nouvelles règles
Dépendances entre règles (1/2)
Exemples non linguistiques pour commencer
Exemple avec hiérarchie entre règles
Les dépendances entre règles compliquent l’interprétation et
la mise à jour du système
r
1: supprimer les analyses qui comportent la
séquence
a b
r
2: ne pas supprimer les analyses qui
comportent la séquence
ab c
Si
r
2s’applique,
r
1ne s’applique pas
1 / 21 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !