Cours 11 Référence Contraintes sur les expressions coréférentes Préférences entre référents possibles Algorithmes de résolution des références Référence Jean est allé chez un concessionnaire voir une Mazda Bouddha. Il l’a regardée pendant à peu près une heure. Jean et Il dénotent une même personne Jean et Il sont des expressions La personne en question est le référent Jean et Il réfèrent à cette personne Jean et Il sont coréférents Jean est un antécédent de Il Il est une anaphore Référence Quand il l’a achetée, Jean a regardé la voiture avec soin Jean et Il sont coréférents Le pronom (Il) est placé avant le groupe nominal (Jean), ce qui est beaucoup plus rare que l'inverse Jean est un conséquent de Il Il est une cataphore Expressions référant à une nouvelle entité J'ai vu une Mazda Bouddha aujourd'hui Ils ont livré des Mazda Bouddha au concessionnaire auhourd'hui Déterminants : un, deux, plusieurs, des, certains, du, un peu de, beaucoup de... La rue la plus longue de Paris est la rue de Vaugirard La jeune femme que vous venez de voir est Françoise Déterminants : le, son, ce... Référence lexicale J'ai vu une Mazda Bouddha aujourd'hui à Prague et mon voisin en a une à Paris J'ai vu une Mazda Bouddha aujourd'hui à Prague mais celle de mon voisin à Paris est plus belle Pas de coréférence entre le groupe nominal et le pronom (ce sont deux voitures différentes) Pronoms : en, celui... Expressions référant à une entité déjà mentionnée Deux ans plus tard, dans un hôtel à Prague, Luc retrouve Marie. L'hôtel était d'ailleurs celui que tu connais. Deux ans plus tard, dans un hôtel à Prague, Luc retrouve Marie. Cet établissement était peu élégant. Déterminants : le, ce... Luc a vu une Mazda Bouddha aujourd'hui. Il a eu envie de l'acheter, mais sa femme n'est pas d'accord. Pronoms : il, le, lui, en, se, ce dernier, celui-ci, cela... Possessifs : son Référence implicite Luc a acheté une Mazda Bouddha mais la carrosserie a des défauts. (la carrosserie de la Mazda) Luc a promis à Marie de revenir (le sujet implicite de revenir est Luc) Luc a permis à Marie de revenir (le sujet implicite de revenir est Marie) Contraintes Accord en personne, en genre et en nombre entre groupe nominal et pronom coréférents Luc a acheté une voiture mais elle ne lui plaît pas ≠ Luc a acheté une voiture mais je ne lui plais pas ≠ Luc a acheté une voiture mais il ne lui plaît pas ≠ Luc a acheté une voiture mais elle ne leur plaît pas mais L'imprimante est encore en panne. Je déteste cet appareil. Contraintes Contraintes de coréférence internes à la phrase Il a acheté une voiture à Luc Il et Luc jamais coréférents Il lui a acheté une voiture Il et lui jamais coréférents Il s'est acheté une voiture Il et se toujours coréférents Il a dit que Luc vient Il et Luc jamais coréférents Contraintes Compatibilité entre prédicats et arguments Le jour où Luc est tombé malade était proche d'une échéance professionnelle importante. Mais il va mieux. Le jour où Luc est tombé malade et il ne peuvent pas être coréférents Le prédicat va mieux ne peut pas prendre comme sujet Le jour où Luc est tombé malade Préférences Un pronom, plusieurs antécédents possibles Pour une entité mentionnée plus récemment qu'une autre Luc est sorti mais Marc est ici. Il va mieux. Il réfère à Marc plutôt qu'à Luc Pour le sujet plutôt qu'un complément, pour un complément direct plutôt qu'indirect... Marie est au téléphone avec Anne. Luc la cherche partout. Luc a raccompagné sa voisine chez Marie. Elle va mieux. Préférences Pour une expression qui occupe la même position que le pronom dans une structure syntaxique parallèle Luc s'est rapproché de Max. Au contraire, Guy s'est éloigné de lui. Préférences pragmatiques (on comprend la situation) Luc a offert trois bandes dessinées à Max. Il adore ça. Luc a emprunté trois bandes dessinées à Max. Il adore ça. Luc admire Max. Il est jongleur. Luc a impressionné Max. Il est jongleur. Deux algorithmes de résolution de références Principe Le référent le plus plausible pour un pronom est l'entité qui a le plus de "poids" Algorithme 1 (Lappin & Leass, 1994) Poids initial d'une expression Poids initial d'une entité en un point du texte : dépend des poids initiaux des expressions référant à l'entité déjà rencontrées Poids total d'une entité par rapport à un pronom : dépend du pronom et du poids initial de l'entité Algorithme 2 (Brennan, Friedman & Pollard, 1987) (pas vu en 2006-2007) Liste des référents mentionnés dans une phrase, par ordre de poids décroissant Algorithme 1 Facteurs de poids initiaux Poids Pour chaque occurrence Sujet Après There is Autre argument d’un verbe, sans préposition Autre argument d’un verbe, avec préposition Non séparé par une ponctuation Non complément d’un autre groupe nominal 100 80 70 50 40 50 80 Algorithme 1 mettre à jour le poids initial du référent R d'une expression E : si E réfère à une nouvelle entité créer une nouvelle entité ajouter E aux expressions référant à R R.poids_initial = R.poids_contextuel pour chaque facteur de poids initial F calculer E.poids_initial(F) P = maximum des ER.poids_initial(F) pour toutes les expressions ER de la même phrase référant à R et déjà rencontrées R.poids_initial = R.poids_initial + P Exemple John saw a beautiful Mazda Buddha at the dealership John M.B. dealership Pour chaque occurrence Sujet Après There is Compl. direct Compl. indirect Non séparé Non compl. d’un GN 100 80 100 50 80 50 80 50 80 Poids initial 310 280 230 100 50 Algorithme 1 À chaque expression pouvant référer à une entité mettre à jour le poids initial de l'entité À chaque fin de phrase pour chaque entité mentionnée dans la phrase entité.poids_contextuel = entité.poids_initial diviser les poids contextuels de toutes les entités par 2 À chaque pronom de la 3e personne non réfléchi déterminer le référent du pronom mettre à jour le poids initial du référent Exemple John saw a beautiful Mazda Buddha at the dealership. He showed it to Bob. John He Mazda dealership it Bob Bob Poids contextuel Pour chaque occurrence Sujet Après There is Compl. direct Compl. indirect Non séparé Non compl. d’un GN 155 100 80 140 100 100 50 80 50 80 Poids initial 465 420 115 50 40 50 80 115 270 Exemple John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to Bob. He2 bought it2. John Mazda dealership Bob He2 it2 Poids contextuel 232,5 210 57,5 135 Pour chaque occurrence 100 100 Sujet 80 Après There is Compl. direct 50 Compl. indirect Non séparé 50 50 Non compl. d’un GN 80 80 Poids initial 542,5 490 57,5 135 Algorithme 1 Facteurs de poids finaux Poids Parallélisme des positions syntaxiques Cataphore 35 - 175 Algorithme 1 Déterminer le référent d'un pronom : lister les candidats référents jusqu’à la 4e phrase avant pour chaque candidat si (il concorde en genre et en nombre avec le pronom et satisfait les contraintes de coréférence internes à la phrase) candidat.poids_total = candidat.poids_initial + les facteurs de poids finaux applicables référent = le candidat dont le poids total est maximal, et s’il y en a plusieurs, le plus proche Exemple John saw a beautiful Mazda Buddha at the dealership. He1 showed it1... John Mazda dealership He1 Poids contextuel Poids initial Accord Contraintes Parallélisme Cataphore Poids total 155 465 - 140 140 + + 35 115 115 + + 175 115 Résultat : le référent de it1 est Mazda Algorithme 2 (pas vu en 2006-2007) Pour chaque phrase Pi : For(Pi) est la liste des entités mentionnées dans Pi, par ordre de poids décroissant (sujet, groupe nominal après There is, complément de verbe sans préposition, complément de verbe avec préposition, complément séparé par une virgule) Pref(Pi) est l'entité de poids maximal dans For(Pi) Back(Pi+1) est l'entité de poids maximal parmi celles de For(Pi) mentionnées dans Pi+1 Exemple John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to Bob. He2 bought it2. For(P1) = ( John, Mazda, dealership ) Back(P1) non défini For(P2) = ( John, Mazda, Bob ) Back(P2) = John For(P3) = ( John, Mazda ) Back(P3) = John Algorithme 2 pour chaque phrase Pi lister les pronoms et les candidats référents lister les couples pronom/référent possibles pour chaque façon A d’assigner un référent à chaque pronom si (A viole une contrainte de coréférence interne à la phrase) éliminer A calculer Back(Pi), For(Pi), Pref(Pi) si (Back(Pi) n'est pas un pronom dans Pi et un autre élément de For(Pi-1) est un pronom dans Pi) éliminer A calculer A.score(Back(Pi-1), Pref(Pi), Back(Pi)) choisir un A qui a le score maximal Exemple John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to Bob. He2 bought it2. PronomsRéférents A1 He2 John it2 Mazda Back(P3) = John For(P3) = ( John, Mazda ) A2 He2 Bob it2 Mazda Back(P3) = Mazda For(P3) = ( Bob, Mazda ) A3, A4 it2 dealership Algorithme 2 A.score(Back_precedent, Pref, Back) : si Back_precedent = Back ou Back_precedent indéfini si Pref = Back score = 3 sinon score = 2 sinon si Pref = Back score = 1 sinon score = 0 Exemple John saw a beautiful Mazda Buddha at the dealership. He1 showed it1 to Bob. He2 bought it2. Back(P2) = John A1 He2 John it2 Mazda Back(P3) = John For(P3) = ( John, Mazda ) A1.score = 3 A2 He2 Bob it2 Mazda Back(P3) = Mazda For(P3) = ( Bob, Mazda ) A2.score = 0 A3.score = 3 A4.score = 1 Résultat : le référent de He2 est John Exemple avec résultat faux Bob opened up a new dealership last week. John took a look at the Mazdas in his lot. He ended up buying one. Back(P2) = Bob A1 A2 He John Back(P3) = John A1.score = 1 For(P3) = ( John ) He Bob Back(P3) = Bob A2.score = 3 For(P3) = ( Bob ) Le résultat est Bob au lieu de John comme référent de He