Le Syntactic Reference Corpus of Medieval French et l`ordre des

publicité
SRCMF et l’ordre des compléments en ancien français
Le Syntactic Reference Corpus of Medieval French
et l’ordre des compléments du verbe
en ancien français
Sophie Prévost
[email protected]
Achim Stein
[email protected]
CNRS Lattice–UMR 8094/ENS Paris, France
Institut für Linguistik/Romanistik, Universität Stuttgart, Allemagne
Université de Paris 7, 16.3.2012
1
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Le projet SRCMF
Sommaire
Procédure d’annotation
Annotation dépendancielle
Le modèle syntaxique
Annotation outils et procédures
Perspectives
L’ordre des objets an ancien français
Facteurs pertinents
L’ordre des compléments en allemand
Corpus
Analyses globales et quantitatives
Analyse détaillée
2
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Sommaire
SRCMF: équipe et financement
I
Titre: Syntactic Reference Corpus of Medieval French
I
Financement: Agence nationale de la recherche (ANR); Deutsche
Forschungsgemeinschaft (DFG), 1.3.2009-29.2.2012
I
Équipe: directeurs**, chercheurs* et collaborateurs
CNRS Lattice Paris (F): Sophie Prévost**, Julie Glikman*
ENS Lyon (F): Céline Guillot, Serge Heiden, Alexei Lavrentiev*,
Christiane Marchello-Nizia (émérite), Tom Rainsford*
ILR Universität Stuttgart (D): Achim Stein**, Beatrice-Barbara
Bischof*, Nicolas Mazziotta*
3
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Sommaire
Corpus: ressources initiales
I
Base de Français Médiéval (BFM)
I
I
I
I
cf. Guillot et al. (2007) and http://bfm.ens-lyon.fr/
∼80 textes intégraux, AF et MF (> 3 millions de mots)
étiquetage morphologique Cattex
Nouveau Corpus d’Amsterdam (NCA)
I
cf. Stein et al. (2006) and
http://www.uni-stuttgart.de/lingrom/stein/corpus/
I
I
I
I
compilé par Anthonij Dees (Amsterdam)
edité par Pierre Kunstmann (Ottawa), Achim Stein (Stuttgart) et
Martin-Dietrich Glessgen (Zurich, bibliographie).
300 textes et extraits AF (> 3 millions de mots)
étiquetage morphologique (Dees, ILR), lemmatisé (70%)
4
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Sommaire
Objectifs
I
Annotation syntaxique manuelle d’une partie des textes BFM/NCA
I
I
I
Développement d’une grammaire dépendancielle (Tesnière, 1965;
Polguère and Mel’čuk, 2009)
Construction d’un corpus de réference pour la recherche syntaxique et l’entraînement des outils (parseurs).
Diffusion:
I
En cours: accès en ligne et téléchargement
http://srcmf.org
I
Notabene outil d’annotation:
http://sourceforge.net/projects/notabene/
5
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Procédure d’annotation
Procédure d’annotation
I
Annotation manuelle en binôme
I
I
I
Comparaison (inter-annotateurs)
I
I
I
I
Texte découpé en extraits (1800 mots)
Deux annotations parallèles aveugles
Via NotaBene: outil de comparaison
Correction des coquilles
Examen des cas de désaccord: si accord, correction; si le désaccord persiste, note
Vérification par les responsables du projet (AS + SP):
I
I
Chacun examine les cas de désaccord de l’un des deux annotateurs
Discussion et décision finale
6
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Procédure d’annotation
Procédure d’annotation
Corpora:
BFM, NCA
dependency model
annotation principles
Forum: discussion
of grammar and
annotation
correction 1:
compare parallel
annotations
manual
annotation with
Notabene
tool
correction 2:
review of compared
versions
queries with
TigerSearch
TigerXML
syntactic structures
(RDF graphs)
7
CoNLL
training of
dependency
parsers
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Le modèle syntaxique
Le modèle syntaxique
I
Suivant les spécifications de NotaBene (Mazziotta, 2010), SRCMF
hiérarchise
I
I
I
les structures: phrase, nœud verbal, groupe (coordination)
les fonctions: sujet, objet, attribut, modifieur etc.
Toute relation dépendancielle est exprimée par un triplet:
nœud mère – nœud fille – relation dépendancielle
I
pour une approche comparable cf Turin University Treebank (TUT;
Bosco, 2004)
8
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Le modèle syntaxique
Le modèle syntaxique
I
La structure maximale de l’analyse syntaxique est la phrase,
définie par la présence d’un verbe conjugué.
I
I
I
Chaque nœud verbal fini définit une nouvelle structure.
Si cette structure n’a pas de fonction, elle est maximale.
Pas de coordination de phrases, on découpe au maximum (1)
deux phrases:
(1) si fisent les portes de le vile fremer et si s’armerent au miex qu’il
peurent, comme pour aus desfendre )
I
Tous les éléments de la phrase dépendent (directement ou non)
du verbe principal.
9
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Le modèle syntaxique
Deux niveaux d’annotation
I
Annotation en surface :
I
I
I
I
I
structures dépendant d’une tête verbale
Annotation en profondeur :
toutes les structures sont annotées
chaque unité a une étiquette syntaxique
Dans les structures non verbales (par exemple un SN), on a :
I
I
I
une tête
on peut avoir des ModA (modifieurs attachés : déterminants,
adjectifs)
on peut avoir un RelC/RelNC (relateur (non) coordonnant : préposition, conjonction de coordination ou de subordination)
10
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Le modèle syntaxique
Un exemple simple
I
Une phrase (Snt), unité maximale de traitement
I
Mots, unité minimale de traitement
I
Fonctions des structures grammaticales, reliant et groupant les
mots
I
Relations de dépendance [D] entre les mots et les structures
I
Réalisation lexicale [L] des structures
11
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Le modèle syntaxique
Fonctions
Fonctions principales des dépendants du verbe
I Actant
I
I
Sujet personnel/impersonnel (SjPer/SjImp)
Régime
I
I
I
Attribut
I
I
I
Attribut du sujet (AtSj)
Attribut de l’objet (AtObj)
Auxilié (Aux)
I
I
Objet (Obj)
Complément (Cmpl)
Auxilié actif/passif (AuxA/AuxP)
Circonstant (Circ)
12
phrase
structure maximale
non-phrase
structure
structure non-maximale
noeud
noeud non-verbal
groupe
coordination
noeud verbal
coordonné
auxilié actif
auxilié
sujet personnel
sujet
auxilié passif
actant
satellite
modifieur
sujet impersonnel
attribut de sujet
attribut
circonstant
fonction
noeud verbal infinitif
noeud verbal participial
unité syntaxique
classe
noeud verbal personnel
attribut d'objet
réfléxif renforcé
forclusif
régime
réfléchi
négation
apostrophe
objet
parenthese
interjection
complément
modifieur attaché
incidente
modifieur détaché
relateur coordonnant
relateur
relateur non-coordonnant
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Le modèle syntaxique
Têtes et éléments fonctionnels
Nœud gouvernants
Toute structure est gouvernée par un nœud lexical (verbe, nom
etc.). Les nœuds fontionnels dépendent des têtes lexciales.
I
Les phrases principales sont gouvernées par le verbe fléchi (ou le
premier élément fléchi du nœud verbal).
I
I
I
Le verbe principal gouverne le verbe de la phrase subordonnée
Le nœud fonctionnel (p.ex. la conjunction) depend du verbe
Les groupes prépositionnels sont gouvernés par le nom. La préposition dépend de ce nom.
14
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Le modèle syntaxique
Têtes et éléments fonctionnels
I
Par rapport aux têtes, la grammaire SRCMF grammar se distingue du modèle TUT, où les nœud fonctionnels gouvernent les
nœuds lexicaux:
TUT (Bosco, 2004, 89):
SRCMF:
a
SjPer AuxA
elle
Obj
juré
entra
RelNC SjPer Ng
qu'
nus
n'
Circ
cuises
RelNC Det
entre
ses
In these days Sudja the gypsy declared the failure
She has sworn that nobody not entered between her
RMOD = restrictive modifier
thighs
15
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Le modèle syntaxique
Nœuds vides et traces
Duplicata
Un duplicata est la copie d’un nœud. Ceci permet d’attacher une
deuxième relation à la copie.
I
Les duplicata sont utilisées dans les relatives, et dans les formes
contractées.
I
I
Dans (2), le pronom relatif qui est un relateur non-coordonnant
relator (RelNC), son duplicate est un sujet personnel (SjPer)
Dans (3), la forme contractée nes (ne+les) est une négation
(Ng), son duplicate est un objet (Obj).
(2) Souffrance si est semblable a esmeraude qui toz jorz est vert.
Sufferance such is like an emerald which all day is green.
(Graal v.17-18)
(3) sovent dit / Qu’or veut morir s’il nes ocit. (TristBérM4 v.1985-1986)
often says / that now wants die if he not+them kills
16
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Annotation outils et procédures
NotaBene: fonctions
NotaBene (Mazziotta, 2010) est un outil d’annotation syntaxique
manuelle. Il permet aux utilisateurs
I
de créer/modifier l’annotation (les graphes) moyennant une interface graphique
I
d’ajouter des commentaires à n’importe quel nœud
I
d’utiliser des scripts pour la correction semi-automatique
I
de créer des annotations spécifiques (aux textes, aux utilisateurs): modification des étiquettes et de leurs noms
I
de comparer deux versions annotées d’un même texte.
17
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Annotation outils et procédures
NotaBene: mode de comparaison
18
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Annotation outils et procédures
NotaBene: représentation
I
I
NotaBene utilise des graphes XML/RDF (resource description
format; Bechhofer et al., 2004) pour la représentation interne de
l’annotation.
NotaBene exporte les formats suvants:
1. dot/GraphViz: images des graphes
2. TigerXML:
I
I
utilisé par le logiciel de requête TigerSearch (IMS, Stuttgart;
Lezius, 2002)
permet de distribuer les corpus SRCMF dans un format permettant des requêtes comfortables
3. CoNLL:
I
I
défini par la Conférence Computational Natural Language Learning (e.g. CoNLL 2009 shared task)
le format standard pour les parseurs dépendanciels
19
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Annotation outils et procédures
nicht terminale Knoten
terminale Knoten
Structures dépendancielles en TigerXML
20
SRCMF et l’ordre des compléments en ancien français
Le projet SRCMF
Perspectives
Perspectives
I
Publication des résultats sur http://srcmf.org
I
Utilisation de l’annotation manuelle comme gold-standard corpus d’entraînement pour les parseurs dépendanciels. Des essais
ont été faits avec mate-tools (Bohnet, 2010; Björkelund et al.,
2010).
21
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Le projet SRCMF
Sommaire
Procédure d’annotation
Annotation dépendancielle
Le modèle syntaxique
Annotation outils et procédures
Perspectives
L’ordre des objets an ancien français
Facteurs pertinents
L’ordre des compléments en allemand
Corpus
Analyses globales et quantitatives
Analyse détaillée
22
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Facteurs pertinents
Facteurs déterminant l’ordre des compléments
I
Facteurs grammaticaux:
I
I
I
I
I
I
Facteurs sémantiques/cognitifs:
I
I
I
I
I
sujet > objet
datif > accusatif
NP > PP
noms propres > noms communs
constituents courts > longs
référent: animé > non-animé
agent > patient
agent, patient > autres rôles
référent défini > indéfini
Facteurs pragmatiques:
I
I
information: donnée > nouvelle
topic > comment
23
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Facteurs pertinents
Le datif
I
I
Datif antéposé: Son compaignon donna un hannap lieement
(DitsSQ, C 233) (sans prép.: Buridant 2000, §56)
Datif dérivé (Buridant, 2000, §58): ne fait pas partie de la valence verbale
I
I
I
I
verbes impersonnels (convenir)
datif d’intérêt
parties du corps
constructions causatives (laisser, faire) etc.
24
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
L’ordre des compléments en allemand
Le GV allemand: analyses et diachronie
I
Analyses:
1. dat>acc (Lenerz 1977, Vogel/Steinbach 1998)
2. acc>dat (Barss/Lasnik 1986, Larson 1988)
3. l’ordre dépend du type verbal (Fortmann/Frey 1997): rôles
I
En diachronie:
I
Ancien haut allemand: les rôles thématiques déterminent l’ordre
I
I
I
I
proto-agent > proto-recipient > proto-patient
cette hiérarchie correspond à nom > dat > acc
la condition ’animé’ est implicite: datif ∼ animé
Ensuite:
I
I
I
L’ordre dat>acc domine jusqu’au 15e
acc>dat augmente après 1500
le facteur ’information donnée’ devient plus important
25
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Corpus
Étude de corpus
I
Corpus avec annotation syntaxique:
I
Syntactic Reference Corpus of Medieval French (SRCMF)
I
I
I
Sous corpus du 12.3.2012
11 textes, 17.260 phrases, 186.798 mots
Extraction et évaluation en utilisant TIGERSearch (IMS, Stuttgart)
et des scripts Perl
26
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Corpus
Quels textes?
I
Corpus SRCMF partiel et provisoire, du 10.3.2012 (17.260 phrases)
27
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Corpus
Spécificités de l’ancien français
I
Existence d’une déclinaison à 2 cas:
I
I
I
Souplesse de l’ordre des mots ⇒ 6 séquences possibles :
I
I
I
I
cas sujet – cas régime
mais ne discrimine pas Objet direct/indirect pour les SN
VOC / VCO
OVC / CVO
OCV / COV
une langue majoritairement V2
28
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Corpus
Quelles structures?
I
L’analyse porte sur les deux catégories SRCMF:
I
I
Obj: l’objet direct
Cmpl: les autres compléments du verbe, à distinguer
I
I
de l’objet direct
des circonstants (Circ)
Par exemple:
I
I
I
objet indirect
complément de lieux
certains compléments de noms (en)
29
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Corpus
Élaboration de la requête
1. Exclure les clitiques: ceci nécessite le recours aux étiquettes
morphologiques.
2. Le phénomène du scrambling est d’ordre typologique (attribué
aux langues germaniques, donc OV).
⇒ Dans cette analyse, nous éliminons le paramètre verbe second,
c’est-à-dire:
I
ne considérer que le verbe lexical
I
I
I
la tête des phrases sans auxilié
l’auxilié (AuxA/AuxP) des groupes verbaux complexes (participe
ou infinitif)
ne pas considérer l’auxiliaire des groupes verbaux complexes
30
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Corpus
TigerSearch
1. Structures avec verbe fini
(VFin)
2. Disjonction: sélectionner
le verbe simple
le verbe lexical du v. complexe
3. Dépendances: Obj et Cmpl
(avec relateur RelNC)
4. déterminer les premiers/derniers
mots des structures
5. exclure les pronoms
6. définir la précédence:
V-Obj-Cmpl / V-Cmpl-Obj
Obj-V-Cmpl / Cmpl-V-Obj
Obj-Cmpl-V / Cmpl-Obj-V
31
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Corpus
Ordre des objets: chiffres absolus
32
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyses globales et quantitatives
Ordre des objets: le facteur longueur (masse)
I
La distinction entre mots et lettres: non pertinente
I
VOC/VCO: longueur pertinente: structures longues en pos. finale
I
OVC/CVO: résultat similaire, un peu moins prononcé
I
OCV/COV: les Cmpl qui précèdent l’Obj sont plus longs.
33
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
Les textes
I
Deux textes ’marginaux’: Roland et Aucassin
I
rien en commun / caractéristiques externes
34
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
I
I
I
VOC > VCO > CVO > OVC > COV > OCV
Postposition de O à V majoritaire: 75% des cas
Antéposition de O à C globalement majoritaire(57%), mais pas
très pertinent de comparer VOC/OVC/OCV:
I
I
séparation par V: la notion d’ordre est-elle encore pertinente?
dans le cas de COV vs OCV, une autre contrainte joue: proximité
avec V ≥ COV majoritaire
35
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
OCV
I
Structure la plus rare (19 occ. = 3.8%) dans 4/10 textes
(4) [Sun grant espietObj ] [par mi le corsCmpl ] li mist (Roland)
(5) [L’ anme de luiObj ] [as vifs diablesCmpl ] dunet (Roland)
(6) Qui [son conseilObj ] [a chascunCmpl ] conte
/ Souvent en a anui et honte (Coinci)
(7) Et [ses amisObj ] [d’ enferCmpl ] jeta (Coinci)
I
Caractéristiques:
I
I
I
I
Pas de sujet exprimé
Objet toujours déterminé, ou NPropre
Formes verbales simples (1 seule forme composée)
Longueur respective (1-4 mots): O ≥ C dans 80% des cas: critère
non pertinent
36
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
COV
I
29 occ. (=5,8%), dans 7 textes (mais rare dans 3 d’entre eux)
(8) [D’ AucassinCmpl ] [rienObj ] ne savons (Aucassin et Nicolete)
(9) Li dyables sanz plus d’ aloigne [En enferCmpl ] [ses lettres
(Coinci)
Obj ]
enporte
(10) [Au chevalierCmpl ] [merciObj ] cria (Coinci)
(11) Et [au roi MarcCmpl ] [gerreObj ] feroient (beroul)
I
Caractéristiques:
I
I
I
I
I
Expression du sujet: 2 / 29 (9)
Objet déterminé dans 25/29 cas
Locutions verbales: 4/29: fere gerre (11), fere forche, crier merci
formes composées: 7/29
longueur respective (1-5 mots): C≥O objets ’courts’: 1 ou 2 mots
dans 26/28 cas
⇒ critère non pertinent (en tout cas pas de principe de masses
croissantes: Position préverbale: inversion du principe? )
37
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
CVO (1)
(12) [De sun osbercCmpl ] li derumpit [les pansObj ] (Roland)
(13) [Desur l’ alter seint SevrinCmpl ] le baron Met [l’ oliphan plein d’ or e de
mangunsObj ] (Roland)
(14) [En tels vassalsCmpl ] deit hom aveir [fïanceObj ]
(15) Et [a ceCmpl ] metrai je [ma paineObj ] Ainz que ja past ceste semaine
(16) [Au forestierCmpl ] dist [qu’ il s’ en fuieObj ] (Beroul)
(17) [A Deu qui est sire du montCmpl ] Cri ge [merciObj ] (Beroul)
(18) Li uns [a l’ autreCmpl ] fait [presenzObj ] (Beroul)
(19) et neporec [de cel tornoiement que vos veïstesCmpl ] vos dirai je [la
senefianceObj ] (Graal)
(20) [Au dyableCmpl ] a fait [tel eschecObj ] Que ce qu’il tenoit en son bec (Co)
(21) Et se aucuns demandoit de quoi il vesqui dedenz icelui terme [. . . ] [a
ceCmpl ] respont li contes [que li hauz sires qui de la manne repeut ou
desert le pueple Israel . . . Obj ]
(22) Quant l’ empereres vait querre sun nevold [De tantes herbes el préCmpl ]
truvat [les flors Ki sunt vermeilles 38
del * sanc de noz baronsObj ]
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
CVO (2)
I
I
88 occurrences (=17.6% de l’ensemble)
Caractéristiques:
I
I
I
I
I
I
Expression du sujet: 16/88
CVSpO: 7/88 (15,19)
SCVO/ CSVO / CVSO: 9/88 (14,18)
Détermination de l’objet: 70/88
(majoritaire, mais moins systématique que pour OCV et COV)
locution verbales: 12/88 (crier merci, fere present/dangier/enui)
Formes composées: 18/88: O tjs postposé au groupe (14,20)
longueur respective:
C: 2-9 mots
O: 1-69 mots (8 occ.>10 mots): complétive (21) ou SN+rel (22)
Pas de tendance signifiante sur l’ordre CO /longueur.
Mais est-ce pertinent quand V médian?
6 objets complétives (16,21)
39
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
OVC: 78 occ. (=15,6%)
(23) [Vostre messageObj ] fesime [a CharlunCmpl ] (Roland)
(24) [Sun grant espietObj ] met [a sun chefCmpl ] li ber (Roland)
(25) [Mult grant malObj ] funt [e cil duc e cil cunte] [A lur seignurCmpl ] ki tel
cunseill li dunent
(26) [CoObj ] dist [al reiCmpl ] (Roland)
(27) [Ki chastement la portedObj ] [ele] defent [de fievre et de ydropeCmpl ]
(Lapidaire)
(28) [CeObj ] ne puet [il] metre [en descortCmpl ] (Beroul)
(29) et [toutObj ] tenroit [on] [de l’ empereurCmpl ] (Clari)
(30) [cele vieille cele abeesse] [tot l’avoir dieuObj ] met [en sa borseCmpl ] (Coinci)
(31) [M’ ame et mon corsObj ] met [en ta gardeCmpl ] (Coinci)
(32) Et [li Franchois] avoient ja [leur gaaingObj ] envoié [a l’ ostCmpl ]
(33) ainz devroit [Nostre SeignorObj ] proier nuit et jor [qu’ il par sa douce pitié
m’ ostast de la male vie ou j’ ai tant demoréCmpl ]
40
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
OVC: 78 occ. (=15,6% de l’ensemble)
I
Caractéristiques:
I
I
I
I
I
Expression du sujet: 14 /78 (18%)
Sp: OVSC (28,29) OSVC (27)
Sn: SOVC (30)/ OVSC (25) / SVOC OSVC
Objet déterminé dans 67/78: majoritaire
Locutions verbales: 3 cas (crier merci, mander salut, avoir doel)
formes composées: 20/78 dont 4 avec: (S)-Vfin-O-Aux-C (32)
longueur respective:
I
I
I
Objet: 1-11 mots / Complément: 2-21 mots
C≥O dans tous les cas sauf 2
7 cas de Complément = complétives (33)
⇒ Pertinence de la longueur même si V médian (vs CVO)
41
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
VCO: 99 occ. (=19,8% de l’ensemble)
(34) et [ele] dunet [a hume ki la portet sur sei] [force et vertutObj ] (Roland)
(35) Et si jurra o sa main destre Sor les corsainz [au roi celestre] [Qu’el’ onques n’ ot amor conmune A ton nevo ....Obj ] (Beroul)
(36) Après si demanderent [li baron] [as messagesCmpl ] [des nouveles de Coustantinoble et que on i faisoitObj ] (Clari)
(37) si respondi [as mesagesCmpl ] [qu’ il s’ en conseilleroit et l’ endemain leur
lairoit savoir qu’ il en vaurroit faireObj ] (Clari)
(38) [Orgiuelz] jeta [dou ciel jadisCmpl ] [Le plus bel angele que Diex fistObj ]
(Coinci)
(39) Et lors dist [a PercevalCmpl ] [qu’ il essait a l’ espeeObj ] (Queste)
(40) et osta [a son chevalCmpl ] [le frain et la seleObj ] (Queste)
(41) et dunet [a humeCmpl ] [graze et dulce parole e sens de desputerObj ] (L)
(42) et moustrerent [as pelerinsCmpl ] [que le bataille estoit droituriereObj ] (Cl)
(43) car chascune dame ou damoisele fust espousee fust amie dist [a son
chevalierCmpl ] [que ele iroit avec lui en la questeObj ] (Queste)
(44) Adont si kemanda [a sen balliu qui
42 molt estoit haïs de tote gent . . . Cmpl ]
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
VCO
I
Caractéristiques:
I
I
Expression du sujet: 23/99 (23%) 10 Sp: SVCO (34) / VSCO 13
Sn: VSCO (36) / SVCO (43)
Objet NON déterminé 11 cas= 11% (41)
dont 1 loc. verbale - crier merci
I
I
I
I
Objet: 46 complétives objet = 46% (42,43)
Verbes de parole: 47/99 = 47 % (demander, dire, respondre,
prier...)
formes verbales composées: 5/99 (5%: faible)
- C et O après Vfin + Aux
longueur respective:
I
I
I
Objet: 1-60 mots (17 cas > 10 mots)
Complément: 2-20 mots (mais plutôt 3-4)
On a O>C , mais aussi C > O (mais biais: 44) (voir calculs)
43
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
VOC: 188occ. (= 37.5% de l’ensemble)
(45) [Li empereres] tent [ses mainsObj ] [vers DeuCmpl ] (Roland)
(46) Si demanderent [li Franchois][leur paiementObj ] [a l’empereurCmpl ] (Clari)
(47) et [ele] art [la mainObj ] [a celui ki le estreintCmpl ] (Lap)
(48) et quant il furent venu au moustier si mena [on] [l’ empereurObj ] [en un
destour du moustier en une cambreCmpl ] (Clari)
(49) si li jete [ses brasObj ] [au colCmpl ] (Aucassin)
(50) et [ele] prent [congiéObj ] [a AucassinCmpl ]
(51) Doner ne puet nus [penitanceObj ] [A pecheor sanz repentanceCmpl ]
(52) et prierent mout [Nostre SeignorObj ] [qu’ il gardast BoortCmpl ] et conduisist en quel leu que il venist (Queste)
44
SRCMF et l’ordre des compléments en ancien français
L’ordre des objets an ancien français
Analyse détaillée
VOC
I
Caractéristiques:
I
I
Expression du sujet: 55/188 (29%)
Sp: SVOC (45) / VSOC (46)
Sn: SVOC (48)/ VSOC (48)
Objet NON déterminé 35 cas = 18.6% (41)
I
I
I
dont 24 loc. verbales (rendre grace, faire damage, avoir soin,
doner congié, faire honor, ...)
Verbes de parole: 40/188 = 21.3% (demander, dire, respondre,
prier...)
formes verbales composées: 9/188 (4.8%: faible)
I
O et C après Vfin + Aux (51)
Complétive Objet: 0
I Complétive Complément: 20 (52) (prier, mander...)
I Longueur respective: Objet: 1-18 (mais slt 5occ> 4 mots)
Complément: 2-22 (20 occ. > 10)
C > O dans 95% des cas
⇒ Pertinence de la longueur
I
45
SRCMF et l’ordre des compléments en ancien français
Réferences
Bechhofer, S., van Harmelen, F., Hendler, J., Horrocks, I., McGuinness, D. L., F., P.-S. P., and
Andrea Stein, L. (2004). OWL Web Ontology Language Reference. W3C Recommendation 10
February 2004. W3C, http://www.w3.org/TR/owl-ref/.
Björkelund, A., Bohnet, B., Hafdell, L., and Nugues, P. (2010). A high-performance syntactic and
semantic dependency parser. In Proceedings of the 23rd International Conference on Computational
Linguistics: Demonstrations, COLING ’10, pages 33–36, Stroudsburg, PA, USA. Association for
Computational Linguistics.
Bohnet, B. (2010). Top accuracy and fast dependency parsing is not a contradiction. In Proceedings of
the 23rd International Conference on Computational Linguistics (Coling 2010), pages 89–97, Beijing,
China. Coling 2010 Organizing Committee.
Bosco, C. (2004). A Grammatical Relation System for Treebank Annotation. PhD Thesis, Università
degli Studi di Turino.
Buridant, C. (2000). Grammaire nouvelle de l’ancien français. Sedes, Paris.
Guillot, C., Marchello-Nizia, C., and Lavrentiev, A. (2007). La base de français médiéval (bfm) : états
et perspectives. In Kunstmann, P. and Stein, A., editors, Le Nouveau Corpus d’Amsterdam. Actes de
l’atelier de Lauterbad, 23-26 février 2006. Steiner, Stuttgart.
Lezius, W. (2002). Ein Suchwerkzeug für syntaktisch annotierte Textkorpora (German). University of
Stuttgart Arbeitspapiere des Instituts für Maschinelle Sprachverarbeitung (AIMS), vol. 8, no. 4.
Institut für Maschinelle Sprachverarbeitung (IMS), Stuttgart.
Martineau, F., editor (2009). Le corpus MCVF. Modéliser le changement: les voies du français.
Université d’Ottawa, Ottawa.
Mazziotta, N. (2010). Building the ’syntactic reference corpus of medieval french’ using notabene rdf
annotation tool. In Proceedings of the 4th Linguistic Annotation Workshop (LAW IV).
Polguère, A. and Mel’čuk, I., editors (2009). Dependency in Linguistic Description. Benjamins,
Amsterdam, Philadelphia.
Stein, A. et al., editors (2006). Nouveau Corpus d’Amsterdam. Corpus informatique de textes littéraires
d’ancien français (ca 1150-1350), établi par Anthonij Dees (Amsterdam 1987), remanié par Achim
Stein, Pierre Kunstmann et Martin-D. Gleßgen. Institut für Linguistik/Romanistik, Stuttgart.
Tesnière, L. (1965). Éléments de syntaxe structurale. Klincksieck, Paris, 2 edition.
46
Téléchargement