SRCMF et l’ordre des compléments en ancien français Le Syntactic Reference Corpus of Medieval French et l’ordre des compléments du verbe en ancien français Sophie Prévost [email protected] Achim Stein [email protected] CNRS Lattice–UMR 8094/ENS Paris, France Institut für Linguistik/Romanistik, Universität Stuttgart, Allemagne Université de Paris 7, 16.3.2012 1 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Le projet SRCMF Sommaire Procédure d’annotation Annotation dépendancielle Le modèle syntaxique Annotation outils et procédures Perspectives L’ordre des objets an ancien français Facteurs pertinents L’ordre des compléments en allemand Corpus Analyses globales et quantitatives Analyse détaillée 2 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Sommaire SRCMF: équipe et financement I Titre: Syntactic Reference Corpus of Medieval French I Financement: Agence nationale de la recherche (ANR); Deutsche Forschungsgemeinschaft (DFG), 1.3.2009-29.2.2012 I Équipe: directeurs**, chercheurs* et collaborateurs CNRS Lattice Paris (F): Sophie Prévost**, Julie Glikman* ENS Lyon (F): Céline Guillot, Serge Heiden, Alexei Lavrentiev*, Christiane Marchello-Nizia (émérite), Tom Rainsford* ILR Universität Stuttgart (D): Achim Stein**, Beatrice-Barbara Bischof*, Nicolas Mazziotta* 3 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Sommaire Corpus: ressources initiales I Base de Français Médiéval (BFM) I I I I cf. Guillot et al. (2007) and http://bfm.ens-lyon.fr/ ∼80 textes intégraux, AF et MF (> 3 millions de mots) étiquetage morphologique Cattex Nouveau Corpus d’Amsterdam (NCA) I cf. Stein et al. (2006) and http://www.uni-stuttgart.de/lingrom/stein/corpus/ I I I I compilé par Anthonij Dees (Amsterdam) edité par Pierre Kunstmann (Ottawa), Achim Stein (Stuttgart) et Martin-Dietrich Glessgen (Zurich, bibliographie). 300 textes et extraits AF (> 3 millions de mots) étiquetage morphologique (Dees, ILR), lemmatisé (70%) 4 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Sommaire Objectifs I Annotation syntaxique manuelle d’une partie des textes BFM/NCA I I I Développement d’une grammaire dépendancielle (Tesnière, 1965; Polguère and Mel’čuk, 2009) Construction d’un corpus de réference pour la recherche syntaxique et l’entraînement des outils (parseurs). Diffusion: I En cours: accès en ligne et téléchargement http://srcmf.org I Notabene outil d’annotation: http://sourceforge.net/projects/notabene/ 5 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Procédure d’annotation Procédure d’annotation I Annotation manuelle en binôme I I I Comparaison (inter-annotateurs) I I I I Texte découpé en extraits (1800 mots) Deux annotations parallèles aveugles Via NotaBene: outil de comparaison Correction des coquilles Examen des cas de désaccord: si accord, correction; si le désaccord persiste, note Vérification par les responsables du projet (AS + SP): I I Chacun examine les cas de désaccord de l’un des deux annotateurs Discussion et décision finale 6 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Procédure d’annotation Procédure d’annotation Corpora: BFM, NCA dependency model annotation principles Forum: discussion of grammar and annotation correction 1: compare parallel annotations manual annotation with Notabene tool correction 2: review of compared versions queries with TigerSearch TigerXML syntactic structures (RDF graphs) 7 CoNLL training of dependency parsers SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Le modèle syntaxique Le modèle syntaxique I Suivant les spécifications de NotaBene (Mazziotta, 2010), SRCMF hiérarchise I I I les structures: phrase, nœud verbal, groupe (coordination) les fonctions: sujet, objet, attribut, modifieur etc. Toute relation dépendancielle est exprimée par un triplet: nœud mère – nœud fille – relation dépendancielle I pour une approche comparable cf Turin University Treebank (TUT; Bosco, 2004) 8 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Le modèle syntaxique Le modèle syntaxique I La structure maximale de l’analyse syntaxique est la phrase, définie par la présence d’un verbe conjugué. I I I Chaque nœud verbal fini définit une nouvelle structure. Si cette structure n’a pas de fonction, elle est maximale. Pas de coordination de phrases, on découpe au maximum (1) deux phrases: (1) si fisent les portes de le vile fremer et si s’armerent au miex qu’il peurent, comme pour aus desfendre ) I Tous les éléments de la phrase dépendent (directement ou non) du verbe principal. 9 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Le modèle syntaxique Deux niveaux d’annotation I Annotation en surface : I I I I I structures dépendant d’une tête verbale Annotation en profondeur : toutes les structures sont annotées chaque unité a une étiquette syntaxique Dans les structures non verbales (par exemple un SN), on a : I I I une tête on peut avoir des ModA (modifieurs attachés : déterminants, adjectifs) on peut avoir un RelC/RelNC (relateur (non) coordonnant : préposition, conjonction de coordination ou de subordination) 10 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Le modèle syntaxique Un exemple simple I Une phrase (Snt), unité maximale de traitement I Mots, unité minimale de traitement I Fonctions des structures grammaticales, reliant et groupant les mots I Relations de dépendance [D] entre les mots et les structures I Réalisation lexicale [L] des structures 11 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Le modèle syntaxique Fonctions Fonctions principales des dépendants du verbe I Actant I I Sujet personnel/impersonnel (SjPer/SjImp) Régime I I I Attribut I I I Attribut du sujet (AtSj) Attribut de l’objet (AtObj) Auxilié (Aux) I I Objet (Obj) Complément (Cmpl) Auxilié actif/passif (AuxA/AuxP) Circonstant (Circ) 12 phrase structure maximale non-phrase structure structure non-maximale noeud noeud non-verbal groupe coordination noeud verbal coordonné auxilié actif auxilié sujet personnel sujet auxilié passif actant satellite modifieur sujet impersonnel attribut de sujet attribut circonstant fonction noeud verbal infinitif noeud verbal participial unité syntaxique classe noeud verbal personnel attribut d'objet réfléxif renforcé forclusif régime réfléchi négation apostrophe objet parenthese interjection complément modifieur attaché incidente modifieur détaché relateur coordonnant relateur relateur non-coordonnant SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Le modèle syntaxique Têtes et éléments fonctionnels Nœud gouvernants Toute structure est gouvernée par un nœud lexical (verbe, nom etc.). Les nœuds fontionnels dépendent des têtes lexciales. I Les phrases principales sont gouvernées par le verbe fléchi (ou le premier élément fléchi du nœud verbal). I I I Le verbe principal gouverne le verbe de la phrase subordonnée Le nœud fonctionnel (p.ex. la conjunction) depend du verbe Les groupes prépositionnels sont gouvernés par le nom. La préposition dépend de ce nom. 14 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Le modèle syntaxique Têtes et éléments fonctionnels I Par rapport aux têtes, la grammaire SRCMF grammar se distingue du modèle TUT, où les nœud fonctionnels gouvernent les nœuds lexicaux: TUT (Bosco, 2004, 89): SRCMF: a SjPer AuxA elle Obj juré entra RelNC SjPer Ng qu' nus n' Circ cuises RelNC Det entre ses In these days Sudja the gypsy declared the failure She has sworn that nobody not entered between her RMOD = restrictive modifier thighs 15 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Le modèle syntaxique Nœuds vides et traces Duplicata Un duplicata est la copie d’un nœud. Ceci permet d’attacher une deuxième relation à la copie. I Les duplicata sont utilisées dans les relatives, et dans les formes contractées. I I Dans (2), le pronom relatif qui est un relateur non-coordonnant relator (RelNC), son duplicate est un sujet personnel (SjPer) Dans (3), la forme contractée nes (ne+les) est une négation (Ng), son duplicate est un objet (Obj). (2) Souffrance si est semblable a esmeraude qui toz jorz est vert. Sufferance such is like an emerald which all day is green. (Graal v.17-18) (3) sovent dit / Qu’or veut morir s’il nes ocit. (TristBérM4 v.1985-1986) often says / that now wants die if he not+them kills 16 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Annotation outils et procédures NotaBene: fonctions NotaBene (Mazziotta, 2010) est un outil d’annotation syntaxique manuelle. Il permet aux utilisateurs I de créer/modifier l’annotation (les graphes) moyennant une interface graphique I d’ajouter des commentaires à n’importe quel nœud I d’utiliser des scripts pour la correction semi-automatique I de créer des annotations spécifiques (aux textes, aux utilisateurs): modification des étiquettes et de leurs noms I de comparer deux versions annotées d’un même texte. 17 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Annotation outils et procédures NotaBene: mode de comparaison 18 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Annotation outils et procédures NotaBene: représentation I I NotaBene utilise des graphes XML/RDF (resource description format; Bechhofer et al., 2004) pour la représentation interne de l’annotation. NotaBene exporte les formats suvants: 1. dot/GraphViz: images des graphes 2. TigerXML: I I utilisé par le logiciel de requête TigerSearch (IMS, Stuttgart; Lezius, 2002) permet de distribuer les corpus SRCMF dans un format permettant des requêtes comfortables 3. CoNLL: I I défini par la Conférence Computational Natural Language Learning (e.g. CoNLL 2009 shared task) le format standard pour les parseurs dépendanciels 19 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Annotation outils et procédures nicht terminale Knoten terminale Knoten Structures dépendancielles en TigerXML 20 SRCMF et l’ordre des compléments en ancien français Le projet SRCMF Perspectives Perspectives I Publication des résultats sur http://srcmf.org I Utilisation de l’annotation manuelle comme gold-standard corpus d’entraînement pour les parseurs dépendanciels. Des essais ont été faits avec mate-tools (Bohnet, 2010; Björkelund et al., 2010). 21 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Le projet SRCMF Sommaire Procédure d’annotation Annotation dépendancielle Le modèle syntaxique Annotation outils et procédures Perspectives L’ordre des objets an ancien français Facteurs pertinents L’ordre des compléments en allemand Corpus Analyses globales et quantitatives Analyse détaillée 22 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Facteurs pertinents Facteurs déterminant l’ordre des compléments I Facteurs grammaticaux: I I I I I I Facteurs sémantiques/cognitifs: I I I I I sujet > objet datif > accusatif NP > PP noms propres > noms communs constituents courts > longs référent: animé > non-animé agent > patient agent, patient > autres rôles référent défini > indéfini Facteurs pragmatiques: I I information: donnée > nouvelle topic > comment 23 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Facteurs pertinents Le datif I I Datif antéposé: Son compaignon donna un hannap lieement (DitsSQ, C 233) (sans prép.: Buridant 2000, §56) Datif dérivé (Buridant, 2000, §58): ne fait pas partie de la valence verbale I I I I verbes impersonnels (convenir) datif d’intérêt parties du corps constructions causatives (laisser, faire) etc. 24 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français L’ordre des compléments en allemand Le GV allemand: analyses et diachronie I Analyses: 1. dat>acc (Lenerz 1977, Vogel/Steinbach 1998) 2. acc>dat (Barss/Lasnik 1986, Larson 1988) 3. l’ordre dépend du type verbal (Fortmann/Frey 1997): rôles I En diachronie: I Ancien haut allemand: les rôles thématiques déterminent l’ordre I I I I proto-agent > proto-recipient > proto-patient cette hiérarchie correspond à nom > dat > acc la condition ’animé’ est implicite: datif ∼ animé Ensuite: I I I L’ordre dat>acc domine jusqu’au 15e acc>dat augmente après 1500 le facteur ’information donnée’ devient plus important 25 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Corpus Étude de corpus I Corpus avec annotation syntaxique: I Syntactic Reference Corpus of Medieval French (SRCMF) I I I Sous corpus du 12.3.2012 11 textes, 17.260 phrases, 186.798 mots Extraction et évaluation en utilisant TIGERSearch (IMS, Stuttgart) et des scripts Perl 26 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Corpus Quels textes? I Corpus SRCMF partiel et provisoire, du 10.3.2012 (17.260 phrases) 27 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Corpus Spécificités de l’ancien français I Existence d’une déclinaison à 2 cas: I I I Souplesse de l’ordre des mots ⇒ 6 séquences possibles : I I I I cas sujet – cas régime mais ne discrimine pas Objet direct/indirect pour les SN VOC / VCO OVC / CVO OCV / COV une langue majoritairement V2 28 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Corpus Quelles structures? I L’analyse porte sur les deux catégories SRCMF: I I Obj: l’objet direct Cmpl: les autres compléments du verbe, à distinguer I I de l’objet direct des circonstants (Circ) Par exemple: I I I objet indirect complément de lieux certains compléments de noms (en) 29 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Corpus Élaboration de la requête 1. Exclure les clitiques: ceci nécessite le recours aux étiquettes morphologiques. 2. Le phénomène du scrambling est d’ordre typologique (attribué aux langues germaniques, donc OV). ⇒ Dans cette analyse, nous éliminons le paramètre verbe second, c’est-à-dire: I ne considérer que le verbe lexical I I I la tête des phrases sans auxilié l’auxilié (AuxA/AuxP) des groupes verbaux complexes (participe ou infinitif) ne pas considérer l’auxiliaire des groupes verbaux complexes 30 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Corpus TigerSearch 1. Structures avec verbe fini (VFin) 2. Disjonction: sélectionner le verbe simple le verbe lexical du v. complexe 3. Dépendances: Obj et Cmpl (avec relateur RelNC) 4. déterminer les premiers/derniers mots des structures 5. exclure les pronoms 6. définir la précédence: V-Obj-Cmpl / V-Cmpl-Obj Obj-V-Cmpl / Cmpl-V-Obj Obj-Cmpl-V / Cmpl-Obj-V 31 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Corpus Ordre des objets: chiffres absolus 32 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyses globales et quantitatives Ordre des objets: le facteur longueur (masse) I La distinction entre mots et lettres: non pertinente I VOC/VCO: longueur pertinente: structures longues en pos. finale I OVC/CVO: résultat similaire, un peu moins prononcé I OCV/COV: les Cmpl qui précèdent l’Obj sont plus longs. 33 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée Les textes I Deux textes ’marginaux’: Roland et Aucassin I rien en commun / caractéristiques externes 34 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée I I I VOC > VCO > CVO > OVC > COV > OCV Postposition de O à V majoritaire: 75% des cas Antéposition de O à C globalement majoritaire(57%), mais pas très pertinent de comparer VOC/OVC/OCV: I I séparation par V: la notion d’ordre est-elle encore pertinente? dans le cas de COV vs OCV, une autre contrainte joue: proximité avec V ≥ COV majoritaire 35 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée OCV I Structure la plus rare (19 occ. = 3.8%) dans 4/10 textes (4) [Sun grant espietObj ] [par mi le corsCmpl ] li mist (Roland) (5) [L’ anme de luiObj ] [as vifs diablesCmpl ] dunet (Roland) (6) Qui [son conseilObj ] [a chascunCmpl ] conte / Souvent en a anui et honte (Coinci) (7) Et [ses amisObj ] [d’ enferCmpl ] jeta (Coinci) I Caractéristiques: I I I I Pas de sujet exprimé Objet toujours déterminé, ou NPropre Formes verbales simples (1 seule forme composée) Longueur respective (1-4 mots): O ≥ C dans 80% des cas: critère non pertinent 36 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée COV I 29 occ. (=5,8%), dans 7 textes (mais rare dans 3 d’entre eux) (8) [D’ AucassinCmpl ] [rienObj ] ne savons (Aucassin et Nicolete) (9) Li dyables sanz plus d’ aloigne [En enferCmpl ] [ses lettres (Coinci) Obj ] enporte (10) [Au chevalierCmpl ] [merciObj ] cria (Coinci) (11) Et [au roi MarcCmpl ] [gerreObj ] feroient (beroul) I Caractéristiques: I I I I I Expression du sujet: 2 / 29 (9) Objet déterminé dans 25/29 cas Locutions verbales: 4/29: fere gerre (11), fere forche, crier merci formes composées: 7/29 longueur respective (1-5 mots): C≥O objets ’courts’: 1 ou 2 mots dans 26/28 cas ⇒ critère non pertinent (en tout cas pas de principe de masses croissantes: Position préverbale: inversion du principe? ) 37 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée CVO (1) (12) [De sun osbercCmpl ] li derumpit [les pansObj ] (Roland) (13) [Desur l’ alter seint SevrinCmpl ] le baron Met [l’ oliphan plein d’ or e de mangunsObj ] (Roland) (14) [En tels vassalsCmpl ] deit hom aveir [fïanceObj ] (15) Et [a ceCmpl ] metrai je [ma paineObj ] Ainz que ja past ceste semaine (16) [Au forestierCmpl ] dist [qu’ il s’ en fuieObj ] (Beroul) (17) [A Deu qui est sire du montCmpl ] Cri ge [merciObj ] (Beroul) (18) Li uns [a l’ autreCmpl ] fait [presenzObj ] (Beroul) (19) et neporec [de cel tornoiement que vos veïstesCmpl ] vos dirai je [la senefianceObj ] (Graal) (20) [Au dyableCmpl ] a fait [tel eschecObj ] Que ce qu’il tenoit en son bec (Co) (21) Et se aucuns demandoit de quoi il vesqui dedenz icelui terme [. . . ] [a ceCmpl ] respont li contes [que li hauz sires qui de la manne repeut ou desert le pueple Israel . . . Obj ] (22) Quant l’ empereres vait querre sun nevold [De tantes herbes el préCmpl ] truvat [les flors Ki sunt vermeilles 38 del * sanc de noz baronsObj ] SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée CVO (2) I I 88 occurrences (=17.6% de l’ensemble) Caractéristiques: I I I I I I Expression du sujet: 16/88 CVSpO: 7/88 (15,19) SCVO/ CSVO / CVSO: 9/88 (14,18) Détermination de l’objet: 70/88 (majoritaire, mais moins systématique que pour OCV et COV) locution verbales: 12/88 (crier merci, fere present/dangier/enui) Formes composées: 18/88: O tjs postposé au groupe (14,20) longueur respective: C: 2-9 mots O: 1-69 mots (8 occ.>10 mots): complétive (21) ou SN+rel (22) Pas de tendance signifiante sur l’ordre CO /longueur. Mais est-ce pertinent quand V médian? 6 objets complétives (16,21) 39 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée OVC: 78 occ. (=15,6%) (23) [Vostre messageObj ] fesime [a CharlunCmpl ] (Roland) (24) [Sun grant espietObj ] met [a sun chefCmpl ] li ber (Roland) (25) [Mult grant malObj ] funt [e cil duc e cil cunte] [A lur seignurCmpl ] ki tel cunseill li dunent (26) [CoObj ] dist [al reiCmpl ] (Roland) (27) [Ki chastement la portedObj ] [ele] defent [de fievre et de ydropeCmpl ] (Lapidaire) (28) [CeObj ] ne puet [il] metre [en descortCmpl ] (Beroul) (29) et [toutObj ] tenroit [on] [de l’ empereurCmpl ] (Clari) (30) [cele vieille cele abeesse] [tot l’avoir dieuObj ] met [en sa borseCmpl ] (Coinci) (31) [M’ ame et mon corsObj ] met [en ta gardeCmpl ] (Coinci) (32) Et [li Franchois] avoient ja [leur gaaingObj ] envoié [a l’ ostCmpl ] (33) ainz devroit [Nostre SeignorObj ] proier nuit et jor [qu’ il par sa douce pitié m’ ostast de la male vie ou j’ ai tant demoréCmpl ] 40 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée OVC: 78 occ. (=15,6% de l’ensemble) I Caractéristiques: I I I I I Expression du sujet: 14 /78 (18%) Sp: OVSC (28,29) OSVC (27) Sn: SOVC (30)/ OVSC (25) / SVOC OSVC Objet déterminé dans 67/78: majoritaire Locutions verbales: 3 cas (crier merci, mander salut, avoir doel) formes composées: 20/78 dont 4 avec: (S)-Vfin-O-Aux-C (32) longueur respective: I I I Objet: 1-11 mots / Complément: 2-21 mots C≥O dans tous les cas sauf 2 7 cas de Complément = complétives (33) ⇒ Pertinence de la longueur même si V médian (vs CVO) 41 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée VCO: 99 occ. (=19,8% de l’ensemble) (34) et [ele] dunet [a hume ki la portet sur sei] [force et vertutObj ] (Roland) (35) Et si jurra o sa main destre Sor les corsainz [au roi celestre] [Qu’el’ onques n’ ot amor conmune A ton nevo ....Obj ] (Beroul) (36) Après si demanderent [li baron] [as messagesCmpl ] [des nouveles de Coustantinoble et que on i faisoitObj ] (Clari) (37) si respondi [as mesagesCmpl ] [qu’ il s’ en conseilleroit et l’ endemain leur lairoit savoir qu’ il en vaurroit faireObj ] (Clari) (38) [Orgiuelz] jeta [dou ciel jadisCmpl ] [Le plus bel angele que Diex fistObj ] (Coinci) (39) Et lors dist [a PercevalCmpl ] [qu’ il essait a l’ espeeObj ] (Queste) (40) et osta [a son chevalCmpl ] [le frain et la seleObj ] (Queste) (41) et dunet [a humeCmpl ] [graze et dulce parole e sens de desputerObj ] (L) (42) et moustrerent [as pelerinsCmpl ] [que le bataille estoit droituriereObj ] (Cl) (43) car chascune dame ou damoisele fust espousee fust amie dist [a son chevalierCmpl ] [que ele iroit avec lui en la questeObj ] (Queste) (44) Adont si kemanda [a sen balliu qui 42 molt estoit haïs de tote gent . . . Cmpl ] SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée VCO I Caractéristiques: I I Expression du sujet: 23/99 (23%) 10 Sp: SVCO (34) / VSCO 13 Sn: VSCO (36) / SVCO (43) Objet NON déterminé 11 cas= 11% (41) dont 1 loc. verbale - crier merci I I I I Objet: 46 complétives objet = 46% (42,43) Verbes de parole: 47/99 = 47 % (demander, dire, respondre, prier...) formes verbales composées: 5/99 (5%: faible) - C et O après Vfin + Aux longueur respective: I I I Objet: 1-60 mots (17 cas > 10 mots) Complément: 2-20 mots (mais plutôt 3-4) On a O>C , mais aussi C > O (mais biais: 44) (voir calculs) 43 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée VOC: 188occ. (= 37.5% de l’ensemble) (45) [Li empereres] tent [ses mainsObj ] [vers DeuCmpl ] (Roland) (46) Si demanderent [li Franchois][leur paiementObj ] [a l’empereurCmpl ] (Clari) (47) et [ele] art [la mainObj ] [a celui ki le estreintCmpl ] (Lap) (48) et quant il furent venu au moustier si mena [on] [l’ empereurObj ] [en un destour du moustier en une cambreCmpl ] (Clari) (49) si li jete [ses brasObj ] [au colCmpl ] (Aucassin) (50) et [ele] prent [congiéObj ] [a AucassinCmpl ] (51) Doner ne puet nus [penitanceObj ] [A pecheor sanz repentanceCmpl ] (52) et prierent mout [Nostre SeignorObj ] [qu’ il gardast BoortCmpl ] et conduisist en quel leu que il venist (Queste) 44 SRCMF et l’ordre des compléments en ancien français L’ordre des objets an ancien français Analyse détaillée VOC I Caractéristiques: I I Expression du sujet: 55/188 (29%) Sp: SVOC (45) / VSOC (46) Sn: SVOC (48)/ VSOC (48) Objet NON déterminé 35 cas = 18.6% (41) I I I dont 24 loc. verbales (rendre grace, faire damage, avoir soin, doner congié, faire honor, ...) Verbes de parole: 40/188 = 21.3% (demander, dire, respondre, prier...) formes verbales composées: 9/188 (4.8%: faible) I O et C après Vfin + Aux (51) Complétive Objet: 0 I Complétive Complément: 20 (52) (prier, mander...) I Longueur respective: Objet: 1-18 (mais slt 5occ> 4 mots) Complément: 2-22 (20 occ. > 10) C > O dans 95% des cas ⇒ Pertinence de la longueur I 45 SRCMF et l’ordre des compléments en ancien français Réferences Bechhofer, S., van Harmelen, F., Hendler, J., Horrocks, I., McGuinness, D. L., F., P.-S. P., and Andrea Stein, L. (2004). OWL Web Ontology Language Reference. W3C Recommendation 10 February 2004. W3C, http://www.w3.org/TR/owl-ref/. Björkelund, A., Bohnet, B., Hafdell, L., and Nugues, P. (2010). A high-performance syntactic and semantic dependency parser. In Proceedings of the 23rd International Conference on Computational Linguistics: Demonstrations, COLING ’10, pages 33–36, Stroudsburg, PA, USA. Association for Computational Linguistics. Bohnet, B. (2010). Top accuracy and fast dependency parsing is not a contradiction. In Proceedings of the 23rd International Conference on Computational Linguistics (Coling 2010), pages 89–97, Beijing, China. Coling 2010 Organizing Committee. Bosco, C. (2004). A Grammatical Relation System for Treebank Annotation. PhD Thesis, Università degli Studi di Turino. Buridant, C. (2000). Grammaire nouvelle de l’ancien français. Sedes, Paris. Guillot, C., Marchello-Nizia, C., and Lavrentiev, A. (2007). La base de français médiéval (bfm) : états et perspectives. In Kunstmann, P. and Stein, A., editors, Le Nouveau Corpus d’Amsterdam. Actes de l’atelier de Lauterbad, 23-26 février 2006. Steiner, Stuttgart. Lezius, W. (2002). Ein Suchwerkzeug für syntaktisch annotierte Textkorpora (German). University of Stuttgart Arbeitspapiere des Instituts für Maschinelle Sprachverarbeitung (AIMS), vol. 8, no. 4. Institut für Maschinelle Sprachverarbeitung (IMS), Stuttgart. Martineau, F., editor (2009). Le corpus MCVF. Modéliser le changement: les voies du français. Université d’Ottawa, Ottawa. Mazziotta, N. (2010). Building the ’syntactic reference corpus of medieval french’ using notabene rdf annotation tool. In Proceedings of the 4th Linguistic Annotation Workshop (LAW IV). Polguère, A. and Mel’čuk, I., editors (2009). Dependency in Linguistic Description. Benjamins, Amsterdam, Philadelphia. Stein, A. et al., editors (2006). Nouveau Corpus d’Amsterdam. Corpus informatique de textes littéraires d’ancien français (ca 1150-1350), établi par Anthonij Dees (Amsterdam 1987), remanié par Achim Stein, Pierre Kunstmann et Martin-D. Gleßgen. Institut für Linguistik/Romanistik, Stuttgart. Tesnière, L. (1965). Éléments de syntaxe structurale. Klincksieck, Paris, 2 edition. 46