Document

publicité
Cours 11
Référence
Contraintes sur les expressions coréférentes
Préférences entre référents possibles
Algorithmes de résolution des références
Référence
Jean est allé chez un concessionnaire voir une Mazda
Bouddha. Il l’a regardée pendant à peu près une heure.
Jean et Il dénotent une même personne
Jean et Il sont des expressions
La personne en question est le référent
Jean et Il réfèrent à cette personne
Jean et Il sont coréférents
Jean est un antécédent de Il
Il est une anaphore
Référence
Quand il l’a achetée, Jean a regardé la voiture avec soin
Jean et Il sont coréférents
Le pronom (Il) est placé avant le groupe nominal (Jean), ce
qui est beaucoup plus rare que l'inverse
Jean est un conséquent de Il
Il est une cataphore
Expressions référant à une
nouvelle entité
J'ai vu une Mazda Bouddha aujourd'hui
Ils ont livré des Mazda Bouddha au concessionnaire
auhourd'hui
Déterminants : un, deux, plusieurs, des, certains, du, un peu
de, beaucoup de...
La rue la plus longue de Paris est la rue de Vaugirard
La jeune femme que vous venez de voir est Françoise
Déterminants : le, son, ce...
Référence lexicale
J'ai vu une Mazda Bouddha aujourd'hui à Prague et mon
voisin en a une à Paris
J'ai vu une Mazda Bouddha aujourd'hui à Prague mais celle
de mon voisin à Paris est plus belle
Pas de coréférence entre le groupe nominal et le pronom (ce
sont deux voitures différentes)
Pronoms : en, celui...
Expressions référant à une entité
déjà mentionnée
Deux ans plus tard, dans un hôtel à Prague, Luc retrouve
Marie. L'hôtel était d'ailleurs celui que tu connais.
Deux ans plus tard, dans un hôtel à Prague, Luc retrouve
Marie. Cet établissement était peu élégant.
Déterminants : le, ce...
Luc a vu une Mazda Bouddha aujourd'hui. Il a eu envie de
l'acheter, mais sa femme n'est pas d'accord.
Pronoms : il, le, lui, en, se, ce dernier, celui-ci, cela...
Possessifs : son
Référence implicite
Luc a acheté une Mazda Bouddha mais la carrosserie a des
défauts.
(la carrosserie de la Mazda)
Luc a promis à Marie de revenir
(le sujet implicite de revenir est Luc)
Luc a permis à Marie de revenir
(le sujet implicite de revenir est Marie)
Contraintes
Accord en personne, en genre et en nombre entre groupe
nominal et pronom coréférents
Luc a acheté une voiture mais elle ne lui plaît pas
≠ Luc a acheté une voiture mais je ne lui plais pas
≠ Luc a acheté une voiture mais il ne lui plaît pas
≠ Luc a acheté une voiture mais elle ne leur plaît pas
mais
L'imprimante est encore en panne. Je déteste cet appareil.
Contraintes
Contraintes de coréférence internes à la phrase
Il a acheté une voiture à Luc Il et Luc jamais coréférents
Il lui a acheté une voiture
Il et lui jamais coréférents
Il s'est acheté une voiture
Il et se toujours coréférents
Il a dit que Luc vient
Il et Luc jamais coréférents
Contraintes
Compatibilité entre prédicats et arguments
Le jour où Luc est tombé malade était proche d'une échéance
professionnelle importante. Mais il va mieux.
Le jour où Luc est tombé malade et il ne peuvent pas être
coréférents
Le prédicat va mieux ne peut pas prendre comme sujet Le jour
où Luc est tombé malade
Préférences
Un pronom, plusieurs antécédents possibles
Pour une entité mentionnée plus récemment qu'une autre
Luc est sorti mais Marc est ici. Il va mieux.
Il réfère à Marc plutôt qu'à Luc
Pour le sujet plutôt qu'un complément, pour un complément
direct plutôt qu'indirect...
Marie est au téléphone avec Anne. Luc la cherche partout.
Luc a raccompagné sa voisine chez Marie. Elle va mieux.
Préférences
Pour une expression qui occupe la même position que le
pronom dans une structure syntaxique parallèle
Luc s'est rapproché de Max. Au contraire, Guy s'est éloigné
de lui.
Préférences pragmatiques (on comprend la situation)
Luc a offert trois bandes dessinées à Max. Il adore ça.
Luc a emprunté trois bandes dessinées à Max. Il adore ça.
Luc admire Max. Il est jongleur.
Luc a impressionné Max. Il est jongleur.
Deux algorithmes de résolution de
références
Principe
Le référent le plus plausible pour un pronom est l'entité qui a le plus de
"poids"
Algorithme 1 (Lappin & Leass, 1994)
Poids initial d'une expression
Poids initial d'une entité en un point du texte : dépend des poids initiaux
des expressions référant à l'entité déjà rencontrées
Poids total d'une entité par rapport à un pronom : dépend du pronom et
du poids initial de l'entité
Algorithme 2 (Brennan, Friedman & Pollard, 1987)
(pas vu en 2006-2007)
Liste des référents mentionnés dans une phrase, par ordre de poids
décroissant
Algorithme 1
Facteurs de poids initiaux
Poids
Pour chaque occurrence
Sujet
Après There is
Autre argument d’un verbe, sans préposition
Autre argument d’un verbe, avec préposition
Non séparé par une ponctuation
Non complément d’un autre groupe nominal
100
80
70
50
40
50
80
Algorithme 1
mettre à jour le poids initial du référent R d'une expression E :
si E réfère à une nouvelle entité
créer une nouvelle entité
ajouter E aux expressions référant à R
R.poids_initial = R.poids_contextuel
pour chaque facteur de poids initial F
calculer E.poids_initial(F)
P = maximum des ER.poids_initial(F) pour toutes les expressions
ER de la même phrase référant à R et déjà rencontrées
R.poids_initial = R.poids_initial + P
Exemple
John saw a beautiful Mazda Buddha at the dealership
John
M.B. dealership
Pour chaque occurrence
Sujet
Après There is
Compl. direct
Compl. indirect
Non séparé
Non compl. d’un GN
100
80
100
50
80
50
80
50
80
Poids initial
310
280
230
100
50
Algorithme 1
À chaque expression pouvant référer à une entité
mettre à jour le poids initial de l'entité
À chaque fin de phrase
pour chaque entité mentionnée dans la phrase
entité.poids_contextuel = entité.poids_initial
diviser les poids contextuels de toutes les entités par 2
À chaque pronom de la 3e personne non réfléchi
déterminer le référent du pronom
mettre à jour le poids initial du référent
Exemple
John saw a beautiful Mazda Buddha at the dealership. He showed it to Bob.
John
He
Mazda dealership
it
Bob
Bob
Poids contextuel
Pour chaque occurrence
Sujet
Après There is
Compl. direct
Compl. indirect
Non séparé
Non compl. d’un GN
155
100
80
140
100
100
50
80
50
80
Poids initial
465
420
115
50
40
50
80
115
270
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to
Bob. He2 bought it2.
John
Mazda dealership
Bob
He2
it2
Poids contextuel
232,5 210
57,5
135
Pour chaque occurrence 100
100
Sujet
80
Après There is
Compl. direct
50
Compl. indirect
Non séparé
50
50
Non compl. d’un GN
80
80
Poids initial
542,5 490
57,5
135
Algorithme 1
Facteurs de poids finaux
Poids
Parallélisme des positions syntaxiques
Cataphore
35
- 175
Algorithme 1
Déterminer le référent d'un pronom :
lister les candidats référents jusqu’à la 4e phrase avant
pour chaque candidat
si (il concorde en genre et en nombre avec le pronom
et satisfait les contraintes de coréférence internes à la
phrase)
candidat.poids_total =
candidat.poids_initial +
les facteurs de poids finaux applicables
référent = le candidat dont le poids total est maximal, et s’il y en
a plusieurs, le plus proche
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it1...
John
Mazda dealership
He1
Poids contextuel
Poids initial
Accord
Contraintes
Parallélisme
Cataphore
Poids total
155
465
-
140
140
+
+
35
115
115
+
+
175
115
Résultat : le référent de it1 est Mazda
Algorithme 2
(pas vu en 2006-2007)
Pour chaque phrase Pi :
For(Pi) est la liste des entités mentionnées dans Pi, par
ordre de poids décroissant (sujet, groupe nominal après
There is, complément de verbe sans préposition,
complément de verbe avec préposition, complément
séparé par une virgule)
Pref(Pi) est l'entité de poids maximal dans For(Pi)
Back(Pi+1) est l'entité de poids maximal parmi celles de
For(Pi) mentionnées dans Pi+1
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to
Bob. He2 bought it2.
For(P1) = ( John, Mazda, dealership )
Back(P1) non défini
For(P2) = ( John, Mazda, Bob )
Back(P2) = John
For(P3) = ( John, Mazda )
Back(P3) = John
Algorithme 2
pour chaque phrase Pi
lister les pronoms et les candidats référents
lister les couples pronom/référent possibles
pour chaque façon A d’assigner un référent à chaque pronom
si (A viole une contrainte de coréférence interne à la phrase)
éliminer A
calculer Back(Pi), For(Pi), Pref(Pi)
si (Back(Pi) n'est pas un pronom dans Pi et
un autre élément de For(Pi-1) est un pronom dans Pi)
éliminer A
calculer A.score(Back(Pi-1), Pref(Pi), Back(Pi))
choisir un A qui a le score maximal
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to
Bob. He2 bought it2.
PronomsRéférents
A1
He2
John
it2
Mazda
Back(P3) = John
For(P3) = ( John, Mazda )
A2
He2
Bob
it2
Mazda
Back(P3) = Mazda
For(P3) = ( Bob, Mazda )
A3, A4
it2
dealership
Algorithme 2
A.score(Back_precedent, Pref, Back) :
si Back_precedent = Back ou Back_precedent indéfini
si Pref = Back score = 3
sinon
score = 2
sinon
si Pref = Back score = 1
sinon
score = 0
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to
Bob. He2 bought it2.
Back(P2) = John
A1
He2
John
it2
Mazda
Back(P3) = John
For(P3) = ( John, Mazda )
A1.score = 3
A2
He2
Bob
it2
Mazda
Back(P3) = Mazda
For(P3) = ( Bob, Mazda )
A2.score = 0
A3.score = 3
A4.score = 1
Résultat : le référent de He2 est John
Exemple avec résultat faux
Bob opened up a new dealership last week. John took a look at the
Mazdas in his lot. He ended up buying one.
Back(P2) = Bob
A1
A2
He
John
Back(P3) = John
A1.score = 1
For(P3) = ( John )
He
Bob
Back(P3) = Bob
A2.score = 3
For(P3) = ( Bob )
Le résultat est Bob au lieu de John comme référent de He
Téléchargement