Cours 2 1ère partie : La compréhension automatique de la langue

publicité
Cours 2
Introduction (1)
Supposez que vous vouliez corriger la faute dans :
1ère partie :
La compréhension automatique de la langue
la fille est joli
Que devez-vous savoir ?
Définition
Et pour traduire :
Les systèmes minimalistes
mon avocat me manque
Les systèmes maximalistes
Introduction (2)
Introduction (3)
Correcteur de grammaire
Traduction automatique
*la fille est joli
Mon avocat me manque
sujet = *la-fille* (fém-sing)
sujet = *mon-avocat*(humain)
verbe = *être*
objet = *je*
attribut = *joli* (masc-sing)
verbe = *manquer*
temps = present-continu
Comprendre un texte automatiquement (1)
Requiert de l'ordinateur différents types de capacités :
•
Reconnaître les mots et leur associer les informations
lexicales (analyse morphologique)
L'arbre porte des avocats
Comprendre un texte automatiquement (2)
•
Structurer la phrase avec une grammaire (analyse
syntaxique)
Marie a mangé des avocats avec des amis
Mais: quel est le problème si on ne va pas plus loin dans la
compréhension ?
Le problème : la plupart des mots sont ambigus et de différentes
manières. Quelle est la différence entre l' et avocat.
Comprendre un texte automatiquement (3)
•
Comprendre avec des règles sémantiques (analyse
sémantique)
Comprendre un texte automatiquement (4)
Contextualiser (analyse pragmatique)
Les jumelles de l'opticien grossissent
Les jumelles de l'opticien grossissent. Elles n'arrêtent pas de
manger !
Mais : quel est le problème ici ?
Quel raisonnement l'ordinateur pourrait-il faire ?
Comprendre un texte automatiquement (5)
Limites de l'analyse pragmatique
Le problème en deux mots:
Certains raisonnements sont possibles :
•
Comprendre implique de lever toutes les ambiguïtés des mots
(lexicales) et des structures (structurales)
•
Pour les lever, il faut passer par différents niveaux de
compréhension : lexical, syntaxique, sémantique,
pragmatique
•
Tous les niveaux sont liés : pour comprendre les mots, il faut
souvent faire une analyse pragmatique
•
Or l'analyse pragmatique n'est possible que pour des
domaines très limités.
I saw the soldiers aim at the women and I saw several of them fall
Mais:
The policemen refused the women a permit because they
advocated violence
Comment va procéder une machine ?
Les systèmes minimalistes (1)
Deux types de système :
•
minimaliste
Evitent la compréhension complète et se limitent à une
désambiguïsation syntaxique du texte, sans faire une analyse
complète, par exemple :
•
maximaliste
L'
arbre
porte des
avocats
Det
N
V
N
Det
Avantages : on fait ce qu'on sait faire aujourd'hui ;
Désavantages : très peu d'informations pour traduire ou corriger
un texte !!!
Exemple de traduction automatique avec un système
minimaliste
je mange un avocat => I eat a lawyer
Les systèmes maximalistes
Vont essayer d'aller plus loin, mais est-ce possible actuellement
d'encoder toutes les connaissances nécessaires pour comprendre
automatiquement un texte ?
mon avocat me manque => my lawyer misses me.
le pilote ferme la porte => the pilot closes the door
Exercice
Le pilote ferme le voile
Mettez le cube dans la boîte sur la table
Jean le lui fait porter
Etc
On verra qu'un bon correcteur comme Cordial va au moins faire
une analyse syntaxique, voire sémantique...
Téléchargement