Réaliser et exploiter l’annotation syntaxique de textes médiévaux Méthodes et outils du Syntactic Reference Corpus of Medieval French Nicolas Mazziotta Université de Liège/Universität Stuttgart, ILR COST Workshop, Cracovie, 25-26 avril 2013 Plan Exposé en deux parties : 1. SRCMF Le projet en quelques mots Principes généraux de l’analyse Structures particulières 2. Mise en pratique Démonstration Le projet en quelques mots Principes généraux de l’analyse Structures particulières 1re partie : Syntactic Reference Corpus of Medieval French Le projet en quelques mots Principes généraux de l’analyse Structures particulières Le projet en quelques mots Principes généraux de l’analyse Le projet en quelques mots Objectif et matériaux Principes généraux de l’analyse Un modèle dépendanciel Principes généraux Délimiter l’unité maximale de traitement Structures particulières Prépositions, conjonctions de subordination Amalgames Pronom relatif Coordinations Structures particulières Le projet en quelques mots Principes généraux de l’analyse Structures particulières Objectif et matériaux Objectif I Enrichir les principaux corpus d’afr. avec une annotation syntaxique Le projet en quelques mots Principes généraux de l’analyse Structures particulières Objectif et matériaux Objectif I Enrichir les principaux corpus d’afr. avec une annotation syntaxique I ⇒ Rend possible l’examen des interactions syntaxe/autres domaines de la grammaire Le projet en quelques mots Principes généraux de l’analyse Structures particulières Objectif et matériaux Objectif I Enrichir les principaux corpus d’afr. avec une annotation syntaxique I ⇒ Rend possible l’examen des interactions syntaxe/autres domaines de la grammaire Matériaux I Base de Français Médiéval (BFM, Lyon, dir. Céline Guillot) ; I Nouveau Corpus d’Amsterdam (NCA, Stuttgart, dir. Achim Stein). Le projet en quelques mots Principes généraux de l’analyse Structures particulières Objectif et matériaux Objectif I Enrichir les principaux corpus d’afr. avec une annotation syntaxique I ⇒ Rend possible l’examen des interactions syntaxe/autres domaines de la grammaire Matériaux I Base de Français Médiéval (BFM, Lyon, dir. Céline Guillot) ; I Nouveau Corpus d’Amsterdam (NCA, Stuttgart, dir. Achim Stein). Annotations présentes : I Métadonnées I Morphosyntaxe I Lemmatisation automatique (NCA) I Identification de l’oral représenté (BFM) Le projet en quelques mots Principes généraux de l’analyse Objectif et matériaux Une annotation à plusieurs niveaux I Compléments relevant du verbe (syntaxe propositionnelle) I Compléments ne relevant pas d’un verbe Structures particulières Le projet en quelques mots Principes généraux de l’analyse Objectif et matériaux Une annotation à plusieurs niveaux I Compléments relevant du verbe (syntaxe propositionnelle) I Compléments ne relevant pas d’un verbe Compléments relevant du verbe I Permet l’étude lexicale et syntaxique des verbes I Tous les textes Structures particulières Le projet en quelques mots Principes généraux de l’analyse Objectif et matériaux Une annotation à plusieurs niveaux I Compléments relevant du verbe (syntaxe propositionnelle) I Compléments ne relevant pas d’un verbe Compléments relevant du verbe I Permet l’étude lexicale et syntaxique des verbes I Tous les textes Compléments ne relevant pas d’un verbe I Description approfondie du SN, p. ex. I Certains textes Structures particulières Le projet en quelques mots Principes généraux de l’analyse Le projet en quelques mots Objectif et matériaux Principes généraux de l’analyse Un modèle dépendanciel Principes généraux Délimiter l’unité maximale de traitement Structures particulières Prépositions, conjonctions de subordination Amalgames Pronom relatif Coordinations Structures particulières Le projet en quelques mots Principes généraux de l’analyse Structures particulières Un modèle dépendanciel Positionnement I Suivant Tesnière et Mel’čuk I Un modèle relativement souple, fondé sur les relations unissant les unités lexicales Le projet en quelques mots Principes généraux de l’analyse Structures particulières Un modèle dépendanciel Positionnement I Suivant Tesnière et Mel’čuk I Un modèle relativement souple, fondé sur les relations unissant les unités lexicales Approche concrète Le projet en quelques mots Principes généraux de l’analyse Structures particulières Un modèle dépendanciel Positionnement I Suivant Tesnière et Mel’čuk I Un modèle relativement souple, fondé sur les relations unissant les unités lexicales Approche concrète Le projet en quelques mots Principes généraux de l’analyse Structures particulières Un modèle dépendanciel Positionnement I Suivant Tesnière et Mel’čuk I Un modèle relativement souple, fondé sur les relations unissant les unités lexicales Approche concrète I Une phrase (Snt), unité maximale de traitement Le projet en quelques mots Principes généraux de l’analyse Structures particulières Un modèle dépendanciel Positionnement I Suivant Tesnière et Mel’čuk I Un modèle relativement souple, fondé sur les relations unissant les unités lexicales Approche concrète I Mots, unité minimale de traitement Le projet en quelques mots Principes généraux de l’analyse Structures particulières Un modèle dépendanciel Positionnement I Suivant Tesnière et Mel’čuk I Un modèle relativement souple, fondé sur les relations unissant les unités lexicales Approche concrète I Fonctions et des structures grammaticales (ellipses), reliant et groupant les mots Le projet en quelques mots Principes généraux de l’analyse Structures particulières Un modèle dépendanciel Positionnement I Suivant Tesnière et Mel’čuk I Un modèle relativement souple, fondé sur les relations unissant les unités lexicales Approche concrète I Relations de dépendance [D] entre les mots et les structures Le projet en quelques mots Principes généraux de l’analyse Structures particulières Un modèle dépendanciel Positionnement I Suivant Tesnière et Mel’čuk I Un modèle relativement souple, fondé sur les relations unissant les unités lexicales Approche concrète I Réalisation lexicale [L] des structures Le projet en quelques mots Un modèle dépendanciel Principes généraux de l’analyse Structures particulières Le projet en quelques mots Principes généraux de l’analyse Principes généraux Le verbe dit « fini » est le nœud principal Structures particulières Le projet en quelques mots Principes généraux de l’analyse Principes généraux Le verbe dit « fini » est le nœud principal Structures particulières Le projet en quelques mots Principes généraux de l’analyse Principes généraux Le verbe dit « fini » est le nœud principal I Il réalise lexicalement [L] la phrase (Snt) I Il en est le nœud principal (ou la « tête ») Structures particulières Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Les autres structures qui constituent Snt dépendent de ce verbe Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Les autres structures qui constituent Snt dépendent de ce verbe Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Les autres structures qui constituent Snt dépendent de ce verbe Chaque structure de même niveau a une fonction par rapport au verbe : Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Les autres structures qui constituent Snt dépendent de ce verbe Chaque structure de même niveau a une fonction par rapport au verbe : I dans sa valence (SjPer, Obj) Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Les autres structures qui constituent Snt dépendent de ce verbe Chaque structure de même niveau a une fonction par rapport au verbe : I dans sa valence (SjPer, Obj) I hors de sa valence (Circ) Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Les autres structures qui constituent Snt dépendent de ce verbe Chaque structure de même niveau a une fonction par rapport au verbe : I dans sa valence (SjPer, Obj) I hors de sa valence (Circ) liée à sa morphologie et modifiant éventuellement la valence (AuxA) I Le projet en quelques mots Principes généraux de l’analyse Principes généraux Les dépendants du verbe sont rélalisés lexicalement Structures particulières Le projet en quelques mots Principes généraux de l’analyse Principes généraux Les dépendants du verbe sont rélalisés lexicalement Structures particulières Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Les dépendants du verbe sont rélalisés lexicalement I . . . Ou bien ils constituent une structure propositionnelle (récursivité) Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Les dépendants du verbe sont rélalisés lexicalement I . . . Ou bien ils constituent une structure propositionnelle (récursivité) I Si l’annotation n’est pas complète (ici), plusieurs mots réalisent simultanément la structure Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Fonctions principales des dépendants du verbe (hiérarchisées) I Actant Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Fonctions principales des dépendants du verbe (hiérarchisées) I Actant I Sujet (SjPer/SjImp) Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Fonctions principales des dépendants du verbe (hiérarchisées) I Actant I I Sujet (SjPer/SjImp) Régime (Regim) I I Objet (Obj) Complément (Cmpl) Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Fonctions principales des dépendants du verbe (hiérarchisées) I Actant I I Sujet (SjPer/SjImp) Régime (Regim) I I I Objet (Obj) Complément (Cmpl) Attribut I I Attribut du sujet (AtSj) Attribut de l’objet (AtObj) Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Fonctions principales des dépendants du verbe (hiérarchisées) I Actant I I Sujet (SjPer/SjImp) Régime (Regim) I I I Attribut I I I Objet (Obj) Complément (Cmpl) Attribut du sujet (AtSj) Attribut de l’objet (AtObj) Auxilié (Aux) I I Auxilié actif (AuxA) Auxilié passif (AuxP) Le projet en quelques mots Principes généraux de l’analyse Structures particulières Principes généraux Fonctions principales des dépendants du verbe (hiérarchisées) I Actant I I Sujet (SjPer/SjImp) Régime (Regim) I I I Attribut I I I Attribut du sujet (AtSj) Attribut de l’objet (AtObj) Auxilié (Aux) I I I Objet (Obj) Complément (Cmpl) Auxilié actif (AuxA) Auxilié passif (AuxP) Circonstant (Circ) Le projet en quelques mots Principes généraux de l’analyse Délimiter l’unité maximale de traitement Difficulté Structures particulières Le projet en quelques mots Principes généraux de l’analyse Structures particulières Délimiter l’unité maximale de traitement Difficulté I Le terme phrase est tributaire d’une longue tradition grammaticale Le projet en quelques mots Principes généraux de l’analyse Structures particulières Délimiter l’unité maximale de traitement Difficulté I Le terme phrase est tributaire d’une longue tradition grammaticale I La distinction entre phrase et énoncé est loin d’être consensuelle Le projet en quelques mots Principes généraux de l’analyse Structures particulières Délimiter l’unité maximale de traitement Difficulté I Le terme phrase est tributaire d’une longue tradition grammaticale I La distinction entre phrase et énoncé est loin d’être consensuelle I Certaines relations de coordination de phrase sont difficile à démêler Le projet en quelques mots Principes généraux de l’analyse Structures particulières Délimiter l’unité maximale de traitement Difficulté I Le terme phrase est tributaire d’une longue tradition grammaticale I La distinction entre phrase et énoncé est loin d’être consensuelle I Certaines relations de coordination de phrase sont difficile à démêler Une série de règles Le projet en quelques mots Principes généraux de l’analyse Structures particulières Délimiter l’unité maximale de traitement Difficulté I Le terme phrase est tributaire d’une longue tradition grammaticale I La distinction entre phrase et énoncé est loin d’être consensuelle I Certaines relations de coordination de phrase sont difficile à démêler Une série de règles I 1 verbe fini indépendant = 1 phrase Le projet en quelques mots Principes généraux de l’analyse Structures particulières Délimiter l’unité maximale de traitement Difficulté I Le terme phrase est tributaire d’une longue tradition grammaticale I La distinction entre phrase et énoncé est loin d’être consensuelle I Certaines relations de coordination de phrase sont difficile à démêler Une série de règles I I 1 verbe fini indépendant = 1 phrase Pas de coordination de phrases Le projet en quelques mots Principes généraux de l’analyse Structures particulières Délimiter l’unité maximale de traitement Difficulté I Le terme phrase est tributaire d’une longue tradition grammaticale I La distinction entre phrase et énoncé est loin d’être consensuelle I Certaines relations de coordination de phrase sont difficile à démêler Une série de règles I I I 1 verbe fini indépendant = 1 phrase Pas de coordination de phrases Pas de partage de compléments entre les verbes (ratachement au plus proche) Le projet en quelques mots Principes généraux de l’analyse Structures particulières Délimiter l’unité maximale de traitement Difficulté I Le terme phrase est tributaire d’une longue tradition grammaticale I La distinction entre phrase et énoncé est loin d’être consensuelle I Certaines relations de coordination de phrase sont difficile à démêler Une série de règles I I I 1 verbe fini indépendant = 1 phrase Pas de coordination de phrases Pas de partage de compléments entre les verbes (ratachement au plus proche) Conséquences I Des postulats qui affectent toute l’analyse et refusent toute exception I Une analyse limitée Le projet en quelques mots Principes généraux de l’analyse Le projet en quelques mots Objectif et matériaux Principes généraux de l’analyse Un modèle dépendanciel Principes généraux Délimiter l’unité maximale de traitement Structures particulières Prépositions, conjonctions de subordination Amalgames Pronom relatif Coordinations Structures particulières Le projet en quelques mots Principes généraux de l’analyse Prépositions, conjonctions de subordination Unités de relation nommées relateurs I Relateurs coordonnants (RelC, cf. infra) I Relateurs non coordonnants (RelNC) Structures particulières Le projet en quelques mots Principes généraux de l’analyse Prépositions, conjonctions de subordination Unités de relation nommées relateurs I Relateurs coordonnants (RelC, cf. infra) I Relateurs non coordonnants (RelNC) Structures particulières Le projet en quelques mots Principes généraux de l’analyse Structures particulières Prépositions, conjonctions de subordination Unités de relation nommées relateurs I Relateurs coordonnants (RelC, cf. infra) I Relateurs non coordonnants (RelNC) I Le RelNC « subordonnant » dépend du verbe comme les compléments (pas de « translation » ou de rection) Le projet en quelques mots Principes généraux de l’analyse Structures particulières Prépositions, conjonctions de subordination Unités de relation nommées relateurs I Relateurs coordonnants (RelC, cf. infra) I Relateurs non coordonnants (RelNC) I Le RelNC « subordonnant » dépend du verbe comme les compléments (pas de « translation » ou de rection) I Le RelNC entretient une relation particulière [R] Le projet en quelques mots Principes généraux de l’analyse Structures particulières Prépositions, conjonctions de subordination Unités de relation nommées relateurs I Relateurs coordonnants (RelC, cf. infra) I Relateurs non coordonnants (RelNC) I Le RelNC « subordonnant » dépend du verbe comme les compléments (pas de « translation » ou de rection) I Le RelNC entretient une relation particulière [R] Le RelNC peut introduire une phrase I Le projet en quelques mots Principes généraux de l’analyse Amalgames Fusion de deux fonctions I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation Structures particulières Le projet en quelques mots Principes généraux de l’analyse Amalgames Fusion de deux fonctions I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation Structures particulières Le projet en quelques mots Principes généraux de l’analyse Amalgames Fusion de deux fonctions I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation I nel contient l’expression de la négation Structures particulières Le projet en quelques mots Principes généraux de l’analyse Amalgames Fusion de deux fonctions I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation I nel contient l’expression de la négation et l’expression de l’objet Structures particulières Le projet en quelques mots Principes généraux de l’analyse Amalgames Fusion de deux fonctions I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation I nel contient l’expression de la négation et l’expression de l’objet I La relation de duplication [dupl] est explicite Structures particulières Le projet en quelques mots Principes généraux de l’analyse Pronom relatif Traitement similaire aux amalgames I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation Structures particulières Le projet en quelques mots Principes généraux de l’analyse Pronom relatif Traitement similaire aux amalgames I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation Structures particulières Le projet en quelques mots Principes généraux de l’analyse Pronom relatif Traitement similaire aux amalgames I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation I La relative modifie un nom (ModA) En tant que proposition, sa structure est analysée I Structures particulières Le projet en quelques mots Principes généraux de l’analyse Pronom relatif Traitement similaire aux amalgames I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation I La relative modifie un nom (ModA) En tant que proposition, sa structure est analysée qui fonctionne comme un RelNC I I Structures particulières Le projet en quelques mots Principes généraux de l’analyse Pronom relatif Traitement similaire aux amalgames I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation I La relative modifie un nom (ModA) En tant que proposition, sa structure est analysée qui fonctionne comme un RelNC et comme un SjPer I I Structures particulières Le projet en quelques mots Principes généraux de l’analyse Pronom relatif Traitement similaire aux amalgames I Une seule forme indécomposable graphiquement I Plusieurs fonctions I L’unité est dupliquée dans la représentation I La relative modifie un nom (ModA) En tant que proposition, sa structure est analysée qui fonctionne comme un RelNC et comme un SjPer La relation de duplication [dupl] est explicite I I I Structures particulières Le projet en quelques mots Principes généraux de l’analyse Coordinations Spécificité de la relation I Sur un autre plan que la dépendance (orthogonal) I Lie deux unités qui dépendent d’une même autre Structures particulières Le projet en quelques mots Principes généraux de l’analyse Coordinations Spécificité de la relation I Sur un autre plan que la dépendance (orthogonal) I Lie deux unités qui dépendent d’une même autre Structures particulières Le projet en quelques mots Principes généraux de l’analyse Structures particulières Coordinations Spécificité de la relation I Sur un autre plan que la dépendance (orthogonal) I Lie deux unités qui dépendent d’une même autre I La coordination est une structure parallèle qui n’est pas dans le réseau de dépendance de Snt. Elle n’a pas de réalisation lexicale Le projet en quelques mots Principes généraux de l’analyse Structures particulières Coordinations Spécificité de la relation I Sur un autre plan que la dépendance (orthogonal) I Lie deux unités qui dépendent d’une même autre I La coordination est une structure parallèle qui n’est pas dans le réseau de dépendance de Snt. Elle n’a pas de réalisation lexicale I Les termes coordonnés ne sont pas dépendants de la coordination Le projet en quelques mots Principes généraux de l’analyse Structures particulières Coordinations Spécificité de la relation I Sur un autre plan que la dépendance (orthogonal) I Lie deux unités qui dépendent d’une même autre I La coordination est une structure parallèle qui n’est pas dans le réseau de dépendance de Snt. Elle n’a pas de réalisation lexicale I Les termes coordonnés ne sont pas dépendants de la coordination I Le relateur coordonnant dépend du terme suivant Le projet en quelques mots Principes généraux de l’analyse Structures particulières Coordinations Spécificité de la relation I Sur un autre plan que la dépendance (orthogonal) I Lie deux unités qui dépendent d’une même autre I La coordination est une structure parallèle qui n’est pas dans le réseau de dépendance de Snt. Elle n’a pas de réalisation lexicale I Les termes coordonnés ne sont pas dépendants de la coordination I Le relateur coordonnant dépend du terme suivant I La relation de coordination [dupl] est explicite Format des textes en deux mots NotaBene 2e partie : Démonstration Format des textes en deux mots NotaBene Exportation TigerSearch Exportation TigerSearch Format des textes en deux mots NotaBene Format des textes en deux mots NotaBene Exportation TigerSearch Exportation TigerSearch Format des textes en deux mots NotaBene Format des textes en deux mots NotaBene Exportation TigerSearch Exportation TigerSearch Format des textes en deux mots NotaBene Format des textes en deux mots NotaBene Exportation TigerSearch Exportation TigerSearch Format des textes en deux mots NotaBene Format des textes en deux mots NotaBene Exportation TigerSearch Exportation TigerSearch