1
LINGVATA
Claude Roux
Parsing and Semantics Group
Le problème
Il existe une branche qui étudie les langues: la linguistique
Elle se heurte à un ennemi insidieux: l’ambiguïté
Exemple
Le monsieur parle à la dame de la maison…
Phrase simple, pourtant:
Le monsieur [parle [à la dame] [de la maison]]
Le monsieur [parle [à la dame de la maison]]
Le monsieur [parle à la dame] de la maison
Page 2
Ambiguïté
L’ambiguïté est partout…
Dans la syntaxe, dans la sémantique, dans le moindre énoncé. Il est très
difficile d’obtenir des analyses fiables.
Pire, les erreurs s’accumulent à chaque étape:
Erreur dans la segmentation en mots
Erreur dans lanalyse morphologique
Erreur dans la constitution des syntagmes
Erreur dans lextraction des dépendances
Erreur dans la transformation sémantique
Pas
Pas Pas
Pas é
éé
étonnant que les traductions automatiques restent aussi
tonnant que les traductions automatiques restent aussi tonnant que les traductions automatiques restent aussi
tonnant que les traductions automatiques restent aussi
mauvaises.
mauvaises.mauvaises.
mauvaises.
Page 3
Modèles statistiques / Modèles symboliques
Soyons clair, c’est une opposition
fondamentale en linguistique mais:
Page 4
Bonnet blanc et blanc bonnet
SYMBOLIQUE:
Le linguiste fournit une grammaire explicite mais organise ses règles
selon des probabilités implicites
STATISTIQUE
Le système extrait une grammaire implicite à partir des annotations
et les organise selon des probabilités explicites.
En fait… Les deux approches donnent souvent des résultats
similaires…
Page 5
1 / 47 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !