Document

publicité
Représentation des connaissances
Cours 5. Référence
Référence
Contraintes sur les expressions coréférentes
Préférences entre référents possibles
Algorithmes de résolution des références
Référence
Sortez la boule de la boîte et jetez-la
Référence
Jean est allé chez un concessionnaire voir une Mazda
Bouddha. Il l’a regardée pendant à peu près une heure.
Référence
Jean est allé chez un concessionnaire voir une Mazda
Bouddha. Il l’a regardée pendant à peu près une heure.
Jean et Il dénotent une même personne
Jean et Il sont des expressions
La personne en question est le référent
Jean et Il réfèrent à cette personne
Jean et Il sont coréférents
Jean est un antécédent de Il
Il est une anaphore
Référence
Quand il l’a achetée, Jean a regardé la voiture avec soin
Référence
Quand il l’a achetée, Jean a regardé la voiture avec soin
Jean et Il sont coréférents
Le pronom (Il) est placé avant le groupe nominal (Jean), ce
qui est beaucoup plus rare que l'inverse
Jean est un conséquent de Il
Il est une cataphore
Expressions référant à une
nouvelle entité
J'ai vu une Mazda Bouddha aujourd'hui
Ils ont livré des Mazda Bouddha au concessionnaire
auhourd'hui
Déterminants : un, deux, plusieurs, des, certains, du, un peu
de, beaucoup de...
La rue la plus longue de Paris est la rue de Vaugirard
La jeune femme que vous venez de voir est Françoise
Déterminants : le, son, ce...
Référence lexicale
J'ai vu une Mazda Bouddha aujourd'hui à Prague et mon
voisin en a une à Paris
J'ai vu une Mazda Bouddha aujourd'hui à Prague mais celle
de mon voisin à Paris est plus belle
Pas de coréférence entre le groupe nominal et le pronom (ce
sont deux voitures différentes)
Pronoms : en, celui...
Expressions référant à une entité
déjà mentionnée
Deux ans plus tard, dans un hôtel à Prague, Luc retrouve
Marie. L'hôtel était d'ailleurs celui que tu connais.
Deux ans plus tard, dans un hôtel à Prague, Luc retrouve
Marie. Cet établissement était peu élégant.
Déterminants : le, ce...
Luc a vu une Mazda Bouddha aujourd'hui. Il a eu envie de
l'acheter, mais sa femme n'est pas d'accord.
Pronoms : il, le, lui, en, se, ce dernier, celui-ci, cela...
Possessifs : son
Référence implicite
Luc a acheté une Mazda Bouddha mais la carrosserie a des
défauts.
(la carrosserie de la Mazda)
Luc a promis à Marie de revenir
(le sujet implicite de revenir est Luc)
Luc a permis à Marie de revenir
(le sujet implicite de revenir est Marie)
Contraintes
Accord en personne, en genre et en nombre entre groupe
nominal et pronom coréférents
Luc a acheté une voiture mais elle ne lui plaît pas
≠ Luc a acheté une voiture mais je ne lui plais pas
≠ Luc a acheté une voiture mais il ne lui plaît pas
≠ Luc a acheté une voiture mais elle ne leur plaît pas
mais
L'imprimante est encore en panne. Je déteste cet appareil.
Contraintes
Contraintes de coréférence internes à la phrase
Il a acheté une voiture à Luc Il et Luc jamais coréférents
Il lui a acheté une voiture
Il et lui jamais coréférents
Il s'est acheté une voiture
Il et se toujours coréférents
Il a dit que Luc vient
Il et Luc jamais coréférents
Contraintes
Compatibilité entre prédicats et arguments
Le jour où Luc est tombé malade était proche d'une échéance
professionnelle importante. Mais il va mieux.
Le jour où Luc est tombé malade et il ne peuvent pas être
coréférents
Le prédicat va mieux ne peut pas prendre comme sujet Le jour
où Luc est tombé malade
Préférences
Un pronom, plusieurs antécédents possibles
Pour une entité mentionnée plus récemment qu'une autre
Luc est sorti mais Marc est ici. Il va mieux.
Il réfère à Marc plutôt qu'à Luc
Pour le sujet plutôt qu'un complément, pour un complément
direct plutôt qu'indirect...
Marie est au téléphone avec Anne. Luc la cherche partout.
Luc a raccompagné sa voisine chez Marie. Elle va mieux.
Préférences
Pour une expression qui occupe la même position que le
pronom dans une structure syntaxique parallèle
Luc s'est rapproché de Max. Au contraire, Guy s'est éloigné
de lui.
Préférences pragmatiques (on comprend la situation)
Luc a offert trois bandes dessinées à Max. Il adore ça.
Luc a emprunté trois bandes dessinées à Max. Il adore ça.
Luc admire Max. Il est jongleur.
Luc a impressionné Max. Il est jongleur.
Deux algorithmes de résolution de
références
Principe
Le référent le plus plausible pour un pronom est l'entité qui a le plus de
"poids"
Algorithme 1 (Lappin & Leass, 1994)
Poids initial d'une expression
Poids initial d'une expression dans une autre phrase : dépend du poids
initial de l'expression et de la distance en nombre de phrases
Poids total d'une expression par rapport à un pronom : dépend de la
position du pronom et du poids initial de l'expression dans la phrase
Algorithme 2 (Brennan, Friedman & Pollard, 1987)
Liste des référents mentionnés dans une phrase, par ordre de poids
décroissant
Algorithme 1
Poids initial d'une expression
Poids
Pour chaque occurrence
Sujet
Après There is
Autre argument d’un verbe, sans préposition
Autre argument d’un verbe, avec préposition
Non séparé par une ponctuation
Non complément d’un autre groupe nominal
100
80
70
50
40
50
80
Exemple
John saw a beautiful Mazda Buddha at the dealership
John
M.B. dealership
Pour chaque occurrence
Sujet
Après There is
Compl. direct
Compl. indirect
Non séparé
Non compl. d’un GN
100
80
100
50
80
50
80
50
80
Poids initial
310
280
230
100
50
Algorithme 1
À chaque expression pouvant référer à une entité
calculer le poids initial de l'expression
À chaque fin de phrase
pour chaque expression déjà rencontrée
diviser le poids initial de l'expression par 2
À chaque pronom de la 3e personne non réfléchi
déterminer le référent du pronom
Exemple
John saw a beautiful Mazda Buddha at the dealership. He showed it to
Bob. He bought it.
John
M.B.
dealership
Pour chaque occurrence
Sujet
Après There is
Compl. direct
Compl. indirect
Non séparé
Non compl. d’un GN
100
80
100
100
50
80
50
80
50
80
Dans la 1e phrase
Dans la 2e phrase
Dans la 3e phrase
310
155
74,5
280
140
70
230
115
57,5
50
Exemple
John saw a beautiful Mazda Buddha at the dealership. He showed it to Bob.
John
(Mazda) (dealership)
(Bob)
Pour chaque occurrence
Sujet
Après There is
Compl. direct
Compl. indirect
Non séparé
Non compl. d’un GN
100
80
(100)
(100)
(100)
50
80
(50)
(80)
(50)
(80)
(40)
(50)
(80)
Poids initial
155
(140)
(115)
(270)
(50)
Algorithme 1
Déterminer le référent d'un pronom :
lister les candidats référents jusqu’à la 4e phrase avant
pour chaque candidat
si (il concorde en genre et en nombre avec le pronom
et satisfait les contraintes de coréférence internes à la
phrase)
candidat.poids_total =
candidat.poids_initial +
les facteurs de poids finaux applicables
référent = le candidat dont le poids total est maximal, et s’il y en
a plusieurs, le plus proche
Algorithme 1
Facteurs de poids finaux
Poids
Parallélisme des positions syntaxiques
Cataphore
35
- 175
Exemple
John saw a beautiful Mazda Buddha at the dealership. He showed it to Bob.
John
(Mazda) (dealership)
(Bob)
Pour chaque occurrence
Sujet
Après There is
Compl. direct
Compl. indirect
Non séparé
Non compl. d’un GN
100
80
(100)
(100)
(100)
50
80
(50)
(80)
(50)
(80)
(40)
(50)
(80)
Poids initial
Poids final
Poids total
155
35
190
(140)
(115)
(140)
(115)
(50)
(270)
(-175)
(95)
Exemple
John saw a beautiful Mazda Buddha at the dealership. He showed it to Bob.
(He)
Mazda dealership
(Bob)
Pour chaque occurrence
Sujet
Après There is
Compl. direct
Compl. indirect
Non séparé
Non compl. d’un GN
(100)
(80)
100
100
(100)
(50)
(80)
50
80
50
80
(40)
(50)
(80)
Poids initial
Poids final
Poids total
(230)
140
35
175
115
50
(230)
115
(270)
(-175)
(95)
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it to
Bob. He bought it.
He1
(it)
(dealership)
Bob
Pour chaque occurrence 100
(100) (100)
100
Sujet
80
Après There is
Compl. direct
(50)
Compl. indirect
40
Non séparé
50
(50)
(50)
50
Non compl. d’un GN
80
(80)
(80)
80
Poids initial
155
(140) (57,5)
135
Poids final
35
Poids total
190
(140) (57,5)
135
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to
Bob. He2 bought it.
(He2) it1
dealership
(Bob)
Pour chaque occurrence (100) 100
100
(100)
Sujet
(80)
Après There is
Compl. direct
50
Compl. indirect
(40)
Non séparé
(50)
50
50
(50)
Non compl. d’un GN
(80)
80
80
(80)
Poids initial
(310) 140
57,5
(135)
Poids final
35
Poids total
(310) 175
57,5
(135)
Algorithme 2
Pour chaque phrase Pi :
For(Pi) est la liste des entités mentionnées dans Pi, par
ordre de poids décroissant (sujet, groupe nominal après
There is, complément de verbe sans préposition,
complément de verbe avec préposition, complément
séparé par une virgule)
Pref(Pi) est l'entité de poids maximal dans For(Pi)
Back(Pi+1) est l'entité de poids maximal parmi celles de
For(Pi) mentionnées dans Pi+1
Cette définition dépend des liens entité/expression
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to
Bob. He2 bought it2.
For(P1) = ( John, Mazda, dealership )
Back(P1) non défini
For(P2) = ( John, Mazda, Bob )
Back(P2) = John
For(P3) = ( John, Mazda )
Back(P3) = John
Algorithme 2
pour chaque phrase Pi
lister les pronoms et les candidats référents
lister les couples pronom/référent possibles
pour chaque façon A d’assigner un référent à chaque pronom
si (A viole une contrainte de coréférence interne à la phrase)
éliminer A
calculer Back(Pi), For(Pi), Pref(Pi)
si (Back(Pi) n'est pas un pronom dans Pi et
un autre élément de For(Pi-1) est un pronom dans Pi)
éliminer A
calculer A.score(Back(Pi-1), Pref(Pi), Back(Pi))
choisir un A qui a le score maximal
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to
Bob. He2 bought it2.
PronomsRéférents
A1
A2
A3, A4
He2
John
it2
Mazda
For(P3) = ( John, Mazda )
Back(P3) = John
He2
Bob
it2
Mazda
For(P3) = ( Bob, Mazda )
Back(P3) = Mazda
it2
dealership
Algorithme 2
A.score(Back_precedent, Pref, Back) :
si Back_precedent = Back ou Back_precedent indéfini
si Pref = Back score = 3
sinon
score = 2
sinon
si Pref = Back score = 1
sinon
score = 0
Exemple
John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to
Bob. He2 bought it2.
Back(P2) = John
A1
A2
He2
John
it2
Mazda
For(P3) = ( John, Mazda )
A1.score = 3
He2
Bob
it2
Mazda
For(P3) = ( Bob, Mazda )
A2.score = 0
A3.score = 3
A4.score = 1
Back(P3) = John
Back(P3) = Mazda
Résultat : le référent de He2 est John
Exemple avec résultat faux
Bob opened up a new dealership last week. John took a look at the
Mazdas in his lot. He ended up buying one.
Back(P2) = Bob
A1
A2
He
John
For(P3) = ( John )
A1.score = 1
Back(P3) = John
He
Bob
For(P3) = ( Bob )
A2.score = 3
Back(P3) = Bob
Le résultat est Bob au lieu de John comme référent de He
Téléchargement