Réaliser et exploiter l’annotation syntaxique de textes médiévaux

publicité
Réaliser et exploiter l’annotation syntaxique de
textes médiévaux
Méthodes et outils du Syntactic Reference Corpus
of Medieval French
Nicolas Mazziotta
Université de Liège/Universität Stuttgart, ILR
COST Workshop, Cracovie, 25-26 avril 2013
Plan
Exposé en deux parties :
1. SRCMF
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
2. Mise en pratique
Démonstration
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
1re partie : Syntactic Reference Corpus of Medieval French
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Le projet en quelques mots
Objectif et matériaux
Principes généraux de l’analyse
Un modèle dépendanciel
Principes généraux
Délimiter l’unité maximale de traitement
Structures particulières
Prépositions, conjonctions de subordination
Amalgames
Pronom relatif
Coordinations
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Objectif et matériaux
Objectif
I
Enrichir les principaux corpus d’afr. avec une annotation syntaxique
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Objectif et matériaux
Objectif
I
Enrichir les principaux corpus d’afr. avec une annotation syntaxique
I
⇒ Rend possible l’examen des interactions syntaxe/autres domaines de
la grammaire
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Objectif et matériaux
Objectif
I
Enrichir les principaux corpus d’afr. avec une annotation syntaxique
I
⇒ Rend possible l’examen des interactions syntaxe/autres domaines de
la grammaire
Matériaux
I
Base de Français Médiéval (BFM, Lyon, dir. Céline Guillot) ;
I
Nouveau Corpus d’Amsterdam (NCA, Stuttgart, dir. Achim Stein).
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Objectif et matériaux
Objectif
I
Enrichir les principaux corpus d’afr. avec une annotation syntaxique
I
⇒ Rend possible l’examen des interactions syntaxe/autres domaines de
la grammaire
Matériaux
I
Base de Français Médiéval (BFM, Lyon, dir. Céline Guillot) ;
I
Nouveau Corpus d’Amsterdam (NCA, Stuttgart, dir. Achim Stein).
Annotations présentes :
I
Métadonnées
I
Morphosyntaxe
I
Lemmatisation automatique (NCA)
I
Identification de l’oral représenté (BFM)
Le projet en quelques mots
Principes généraux de l’analyse
Objectif et matériaux
Une annotation à plusieurs niveaux
I
Compléments relevant du verbe (syntaxe propositionnelle)
I
Compléments ne relevant pas d’un verbe
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Objectif et matériaux
Une annotation à plusieurs niveaux
I
Compléments relevant du verbe (syntaxe propositionnelle)
I
Compléments ne relevant pas d’un verbe
Compléments relevant du verbe
I
Permet l’étude lexicale et syntaxique des verbes
I
Tous les textes
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Objectif et matériaux
Une annotation à plusieurs niveaux
I
Compléments relevant du verbe (syntaxe propositionnelle)
I
Compléments ne relevant pas d’un verbe
Compléments relevant du verbe
I
Permet l’étude lexicale et syntaxique des verbes
I
Tous les textes
Compléments ne relevant pas d’un verbe
I
Description approfondie du SN, p. ex.
I
Certains textes
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Le projet en quelques mots
Objectif et matériaux
Principes généraux de l’analyse
Un modèle dépendanciel
Principes généraux
Délimiter l’unité maximale de traitement
Structures particulières
Prépositions, conjonctions de subordination
Amalgames
Pronom relatif
Coordinations
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Un modèle dépendanciel
Positionnement
I
Suivant Tesnière et Mel’čuk
I
Un modèle relativement souple, fondé sur les relations unissant les
unités lexicales
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Un modèle dépendanciel
Positionnement
I
Suivant Tesnière et Mel’čuk
I
Un modèle relativement souple, fondé sur les relations unissant les
unités lexicales
Approche concrète
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Un modèle dépendanciel
Positionnement
I
Suivant Tesnière et Mel’čuk
I
Un modèle relativement souple, fondé sur les relations unissant les
unités lexicales
Approche concrète
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Un modèle dépendanciel
Positionnement
I
Suivant Tesnière et Mel’čuk
I
Un modèle relativement souple, fondé sur les relations unissant les
unités lexicales
Approche concrète
I
Une phrase (Snt), unité maximale de traitement
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Un modèle dépendanciel
Positionnement
I
Suivant Tesnière et Mel’čuk
I
Un modèle relativement souple, fondé sur les relations unissant les
unités lexicales
Approche concrète
I
Mots, unité minimale de traitement
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Un modèle dépendanciel
Positionnement
I
Suivant Tesnière et Mel’čuk
I
Un modèle relativement souple, fondé sur les relations unissant les
unités lexicales
Approche concrète
I
Fonctions et des structures grammaticales (ellipses), reliant et groupant les
mots
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Un modèle dépendanciel
Positionnement
I
Suivant Tesnière et Mel’čuk
I
Un modèle relativement souple, fondé sur les relations unissant les
unités lexicales
Approche concrète
I
Relations de dépendance [D] entre les mots et les structures
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Un modèle dépendanciel
Positionnement
I
Suivant Tesnière et Mel’čuk
I
Un modèle relativement souple, fondé sur les relations unissant les
unités lexicales
Approche concrète
I
Réalisation lexicale [L] des structures
Le projet en quelques mots
Un modèle dépendanciel
Principes généraux de l’analyse
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Principes généraux
Le verbe dit « fini » est le nœud principal
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Principes généraux
Le verbe dit « fini » est le nœud principal
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Principes généraux
Le verbe dit « fini » est le nœud principal
I
Il réalise lexicalement [L] la phrase (Snt)
I
Il en est le nœud principal (ou la « tête »)
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Les autres structures qui constituent Snt dépendent de ce verbe
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Les autres structures qui constituent Snt dépendent de ce verbe
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Les autres structures qui constituent Snt dépendent de ce verbe
Chaque structure de même niveau a une fonction par rapport au verbe :
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Les autres structures qui constituent Snt dépendent de ce verbe
Chaque structure de même niveau a une fonction par rapport au verbe :
I
dans sa valence (SjPer, Obj)
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Les autres structures qui constituent Snt dépendent de ce verbe
Chaque structure de même niveau a une fonction par rapport au verbe :
I
dans sa valence (SjPer, Obj)
I
hors de sa valence (Circ)
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Les autres structures qui constituent Snt dépendent de ce verbe
Chaque structure de même niveau a une fonction par rapport au verbe :
I
dans sa valence (SjPer, Obj)
I
hors de sa valence (Circ)
liée à sa morphologie et modifiant éventuellement la valence (AuxA)
I
Le projet en quelques mots
Principes généraux de l’analyse
Principes généraux
Les dépendants du verbe sont rélalisés lexicalement
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Principes généraux
Les dépendants du verbe sont rélalisés lexicalement
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Les dépendants du verbe sont rélalisés lexicalement
I
. . . Ou bien ils constituent une structure propositionnelle (récursivité)
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Les dépendants du verbe sont rélalisés lexicalement
I
. . . Ou bien ils constituent une structure propositionnelle (récursivité)
I
Si l’annotation n’est pas complète (ici), plusieurs mots réalisent
simultanément la structure
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Fonctions principales des dépendants du verbe (hiérarchisées)
I
Actant
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Fonctions principales des dépendants du verbe (hiérarchisées)
I
Actant
I
Sujet (SjPer/SjImp)
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Fonctions principales des dépendants du verbe (hiérarchisées)
I
Actant
I
I
Sujet (SjPer/SjImp)
Régime (Regim)
I
I
Objet (Obj)
Complément (Cmpl)
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Fonctions principales des dépendants du verbe (hiérarchisées)
I
Actant
I
I
Sujet (SjPer/SjImp)
Régime (Regim)
I
I
I
Objet (Obj)
Complément (Cmpl)
Attribut
I
I
Attribut du sujet (AtSj)
Attribut de l’objet (AtObj)
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Fonctions principales des dépendants du verbe (hiérarchisées)
I
Actant
I
I
Sujet (SjPer/SjImp)
Régime (Regim)
I
I
I
Attribut
I
I
I
Objet (Obj)
Complément (Cmpl)
Attribut du sujet (AtSj)
Attribut de l’objet (AtObj)
Auxilié (Aux)
I
I
Auxilié actif (AuxA)
Auxilié passif (AuxP)
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Principes généraux
Fonctions principales des dépendants du verbe (hiérarchisées)
I
Actant
I
I
Sujet (SjPer/SjImp)
Régime (Regim)
I
I
I
Attribut
I
I
I
Attribut du sujet (AtSj)
Attribut de l’objet (AtObj)
Auxilié (Aux)
I
I
I
Objet (Obj)
Complément (Cmpl)
Auxilié actif (AuxA)
Auxilié passif (AuxP)
Circonstant (Circ)
Le projet en quelques mots
Principes généraux de l’analyse
Délimiter l’unité maximale de traitement
Difficulté
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Délimiter l’unité maximale de traitement
Difficulté
I
Le terme phrase est tributaire d’une longue tradition grammaticale
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Délimiter l’unité maximale de traitement
Difficulté
I
Le terme phrase est tributaire d’une longue tradition grammaticale
I
La distinction entre phrase et énoncé est loin d’être consensuelle
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Délimiter l’unité maximale de traitement
Difficulté
I
Le terme phrase est tributaire d’une longue tradition grammaticale
I
La distinction entre phrase et énoncé est loin d’être consensuelle
I
Certaines relations de coordination de phrase sont difficile à démêler
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Délimiter l’unité maximale de traitement
Difficulté
I
Le terme phrase est tributaire d’une longue tradition grammaticale
I
La distinction entre phrase et énoncé est loin d’être consensuelle
I
Certaines relations de coordination de phrase sont difficile à démêler
Une série de règles
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Délimiter l’unité maximale de traitement
Difficulté
I
Le terme phrase est tributaire d’une longue tradition grammaticale
I
La distinction entre phrase et énoncé est loin d’être consensuelle
I
Certaines relations de coordination de phrase sont difficile à démêler
Une série de règles
I
1 verbe fini indépendant = 1 phrase
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Délimiter l’unité maximale de traitement
Difficulté
I
Le terme phrase est tributaire d’une longue tradition grammaticale
I
La distinction entre phrase et énoncé est loin d’être consensuelle
I
Certaines relations de coordination de phrase sont difficile à démêler
Une série de règles
I
I
1 verbe fini indépendant = 1 phrase
Pas de coordination de phrases
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Délimiter l’unité maximale de traitement
Difficulté
I
Le terme phrase est tributaire d’une longue tradition grammaticale
I
La distinction entre phrase et énoncé est loin d’être consensuelle
I
Certaines relations de coordination de phrase sont difficile à démêler
Une série de règles
I
I
I
1 verbe fini indépendant = 1 phrase
Pas de coordination de phrases
Pas de partage de compléments entre les verbes (ratachement au plus
proche)
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Délimiter l’unité maximale de traitement
Difficulté
I
Le terme phrase est tributaire d’une longue tradition grammaticale
I
La distinction entre phrase et énoncé est loin d’être consensuelle
I
Certaines relations de coordination de phrase sont difficile à démêler
Une série de règles
I
I
I
1 verbe fini indépendant = 1 phrase
Pas de coordination de phrases
Pas de partage de compléments entre les verbes (ratachement au plus
proche)
Conséquences
I
Des postulats qui affectent toute l’analyse et refusent toute exception
I
Une analyse limitée
Le projet en quelques mots
Principes généraux de l’analyse
Le projet en quelques mots
Objectif et matériaux
Principes généraux de l’analyse
Un modèle dépendanciel
Principes généraux
Délimiter l’unité maximale de traitement
Structures particulières
Prépositions, conjonctions de subordination
Amalgames
Pronom relatif
Coordinations
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Prépositions, conjonctions de subordination
Unités de relation nommées relateurs
I
Relateurs coordonnants (RelC, cf. infra)
I
Relateurs non coordonnants (RelNC)
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Prépositions, conjonctions de subordination
Unités de relation nommées relateurs
I
Relateurs coordonnants (RelC, cf. infra)
I
Relateurs non coordonnants (RelNC)
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Prépositions, conjonctions de subordination
Unités de relation nommées relateurs
I
Relateurs coordonnants (RelC, cf. infra)
I
Relateurs non coordonnants (RelNC)
I
Le RelNC « subordonnant » dépend du verbe comme les compléments
(pas de « translation » ou de rection)
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Prépositions, conjonctions de subordination
Unités de relation nommées relateurs
I
Relateurs coordonnants (RelC, cf. infra)
I
Relateurs non coordonnants (RelNC)
I
Le RelNC « subordonnant » dépend du verbe comme les compléments
(pas de « translation » ou de rection)
I
Le RelNC entretient une relation particulière [R]
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Prépositions, conjonctions de subordination
Unités de relation nommées relateurs
I
Relateurs coordonnants (RelC, cf. infra)
I
Relateurs non coordonnants (RelNC)
I
Le RelNC « subordonnant » dépend du verbe comme les compléments
(pas de « translation » ou de rection)
I
Le RelNC entretient une relation particulière [R]
Le RelNC peut introduire une phrase
I
Le projet en quelques mots
Principes généraux de l’analyse
Amalgames
Fusion de deux fonctions
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Amalgames
Fusion de deux fonctions
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Amalgames
Fusion de deux fonctions
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
I
nel contient l’expression de la négation
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Amalgames
Fusion de deux fonctions
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
I
nel contient l’expression de la négation et l’expression de l’objet
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Amalgames
Fusion de deux fonctions
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
I
nel contient l’expression de la négation et l’expression de l’objet
I
La relation de duplication [dupl] est explicite
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Pronom relatif
Traitement similaire aux amalgames
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Pronom relatif
Traitement similaire aux amalgames
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Pronom relatif
Traitement similaire aux amalgames
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
I
La relative modifie un nom (ModA)
En tant que proposition, sa structure est analysée
I
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Pronom relatif
Traitement similaire aux amalgames
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
I
La relative modifie un nom (ModA)
En tant que proposition, sa structure est analysée
qui fonctionne comme un RelNC
I
I
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Pronom relatif
Traitement similaire aux amalgames
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
I
La relative modifie un nom (ModA)
En tant que proposition, sa structure est analysée
qui fonctionne comme un RelNC et comme un SjPer
I
I
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Pronom relatif
Traitement similaire aux amalgames
I
Une seule forme indécomposable graphiquement
I
Plusieurs fonctions
I
L’unité est dupliquée dans la représentation
I
La relative modifie un nom (ModA)
En tant que proposition, sa structure est analysée
qui fonctionne comme un RelNC et comme un SjPer
La relation de duplication [dupl] est explicite
I
I
I
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Coordinations
Spécificité de la relation
I
Sur un autre plan que la dépendance (orthogonal)
I
Lie deux unités qui dépendent d’une même autre
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Coordinations
Spécificité de la relation
I
Sur un autre plan que la dépendance (orthogonal)
I
Lie deux unités qui dépendent d’une même autre
Structures particulières
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Coordinations
Spécificité de la relation
I
Sur un autre plan que la dépendance (orthogonal)
I
Lie deux unités qui dépendent d’une même autre
I
La coordination est une structure parallèle qui n’est pas dans le réseau
de dépendance de Snt. Elle n’a pas de réalisation lexicale
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Coordinations
Spécificité de la relation
I
Sur un autre plan que la dépendance (orthogonal)
I
Lie deux unités qui dépendent d’une même autre
I
La coordination est une structure parallèle qui n’est pas dans le réseau
de dépendance de Snt. Elle n’a pas de réalisation lexicale
I
Les termes coordonnés ne sont pas dépendants de la coordination
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Coordinations
Spécificité de la relation
I
Sur un autre plan que la dépendance (orthogonal)
I
Lie deux unités qui dépendent d’une même autre
I
La coordination est une structure parallèle qui n’est pas dans le réseau
de dépendance de Snt. Elle n’a pas de réalisation lexicale
I
Les termes coordonnés ne sont pas dépendants de la coordination
I
Le relateur coordonnant dépend du terme suivant
Le projet en quelques mots
Principes généraux de l’analyse
Structures particulières
Coordinations
Spécificité de la relation
I
Sur un autre plan que la dépendance (orthogonal)
I
Lie deux unités qui dépendent d’une même autre
I
La coordination est une structure parallèle qui n’est pas dans le réseau
de dépendance de Snt. Elle n’a pas de réalisation lexicale
I
Les termes coordonnés ne sont pas dépendants de la coordination
I
Le relateur coordonnant dépend du terme suivant
I
La relation de coordination [dupl] est explicite
Format des textes en deux mots
NotaBene
2e partie : Démonstration
Format des textes en deux mots
NotaBene
Exportation
TigerSearch
Exportation
TigerSearch
Format des textes en deux mots
NotaBene
Format des textes en deux mots
NotaBene
Exportation
TigerSearch
Exportation
TigerSearch
Format des textes en deux mots
NotaBene
Format des textes en deux mots
NotaBene
Exportation
TigerSearch
Exportation
TigerSearch
Format des textes en deux mots
NotaBene
Format des textes en deux mots
NotaBene
Exportation
TigerSearch
Exportation
TigerSearch
Format des textes en deux mots
NotaBene
Format des textes en deux mots
NotaBene
Exportation
TigerSearch
Exportation
TigerSearch
Téléchargement