La morphosyntaxe du verbe aller en français acadien du N

publicité
Lexique-grammaire évolutif de
l'acadien avec INTEX
Gisèle Chevalier, Sylvia Kasparian,
Laboratoire d’analyse de Données Textuelles (LADT)
Université de Moncton
www.umoncton.ca/fass/def/ladt
Max Silberztein
LASELDI, Université de Franche-Comté
Journées INTEX, Sophia, mai 2003
L’ équipe de recherche
 Sylvia Kasparian, Département d’études françaises, Université de
Moncton,
 Directrice du Laboratoire d’analyse de données textuelles
 spécialiste en description informatisée des phénomènes de contacts de
langues et de description de l’acadien .
 Gisèle Chevalier Département d’études françaises, Université de
Moncton
 Directrice du Centre de recherche en linguistique appliquée.
 Spécialiste de la syntaxe-sémantique des constructions nominales et de
phénomènes liés aux procédés de modalisation en acadien (temps du
futur, procédés expressifs, marqueurs discursifs).
 Max Silberztein, LASELDI, Université de Franche Comté.
 Concepteur du Logiciel INTEX, spécialiste en informatique linguistique
et le traitement automatique des langues naturelles.
 2/4 assistantes de recherches, étudiantes de 2e/ 3e cycles.
L’acadien : les acadiens
 Ensemble de variétés de français en usage dans les Provinces
atlantiques du Canada :Nouveau-Brunswick, Nouvelle-Écosse, Îledu-Prince-Edouard,Terre-Neuve.
 Repères historiques:
 Langue implantée en Amérique du Nord à partir du début du XVIIe;
 Colons venus principalement du Poitou (Nord-ouest de la France)
 Première colonie à Port-Royal (Baie Française) en Nouvelle-Écosse
 Dispersion vers le territoire actuel de Beaubassin (Nouveau-Brunswick),
Ile-Saint-Jean (Ile-du-Prince-Edouard), sous la pression des
Britanniques qui disputent le territoire aux colons français.
 Territoire cédé par la France au début du XVIIIe siècle
 Déportation des Acadiens vers la Nouvelle-Angleterre, l’Angleterre et la
France de 1755-1763 par le Régime britannique (Général Moncton).
Épisode du “ Grand Dérangement ”.
 Retour autorisé après la reddition du Canada à l’Angleterre (Traité
d’Utrecht 1763).
 Vocation : le pêche et l’agriculture
Situation linguistique actuelle des
minorités francophones en Atlantique
 Situation précaire à Terre-Neuve, Nouvelle-Écosse et Ile-du-Prince-Edouard.
 Nouveau-Brunswick : province officiellement bilingue (anglais : 65%;
français : 35%)
 Les variétés de français en usage au Nouveau-Brunswick, très distinctives,
les unes des autres, sont regroupées habituellement en trois zones
géographiques:
 La région du Nord-Ouest
 La région du Nord-Est
 La région du Sud-Est
Les 3 régions
 La région du Nord-Ouest partage une frontière avec le Québec et de
l’État américain du Maine. 95% de la population est francophone dans
le Madawaska, seulement 64,2% dans le Restigouche, région du
centre-nord de la province. Le français du Madawaska est perçu
comme très influencé par le français québécois.
 La région du Nord-Est est bordée par la mer et sa population est
majoritairement francophone (84%). Le français qu’on y parle est
perçu par les Acadiens, comme le “ meilleur français ” de la province, le
“ plus pur ”, le moins influencé par l’anglais.
 La région du Sud-Est est entourée des régions majoritairement
anglophnes et voit sa proportion de francophone réduite à 42,8% dans
le Grand Moncton, malgré la forte population acadienne (78,6%) dans
le comté rural de Kent. Leur langue est très influençée par l ’anglais.
Vernaculaire particulier :le chiac.
Quelques particularités du
chiac
 Langue dont la matrice est française et le lexique
généreusement “enrichi” de l’anglais.
 Emprunte le vocabulaire anglais, même si l’équivalent
français existe et reste disponible, grâce à l’instruction
française.
 Touche la langue à tous les niveaux de structuration :
lexical, phonologique, morphologique et syntaxique.
 Degré d’anglicisation de la langue variable selon les
sujets et la situation de communication.
 Décrit par les locuteurs comme “ moitié anglais-moitié
français ” ou “ un mot français par ci, un mot anglais
par-là ”.
Emprunts lexicaux
( Tirés de tous les champs lexicaux et de
toutes les catégories grammaticales )
 Noms : allowance, babe, babysit, babysitter, bag, basement,
bathroom, bike, blast, booze, contest, contract, credit, doctor,
expense…
 Adjectifs : awsome, baggy, bored, boring, bright, funny, fussy,
good, great, pissed off…
 Verbes : assist, barfé, beaté, behavent, joguer, kicker, minder,
mover, phoner, stander, watcher
 Adverbes : alright, anything, anyway, anyways, anywhere, barely,
everywhere, everywheres (sic!), exactly..., exactly…
 Marqueurs discursifs et interjections : well (ben), but (mais), so (ça
fait que, alors), whatever , anyway(s), cool, O.K., yeah, wow, who
cares
 Jurons : Oh my god! godame! holy mac; holy sheet; fuck/frigs,
shit/shoot, (à l’opposé des jurons québécois tirés de la liturgie)
Emprunts intégrés
(Prononciation anglaise mais incorporés
morphologiquement)
 Dérivations originales
 FREAK : freakant, freaké, freakée , freaker
 BORE : bored, boring
 CHUM : chum, chumer
 Flexions françaises et acadiennes
 je mindais, je minderais
 alle a pas noticé (elle n ’a pas remarqué)
 ils wonderont (3e pers. pluriel en ‘vieil acadien’)
Emprunts intégrés
(emplois conformes et originaux)
 Adverbe d’instensité right (supplante ‘vraiment’ chez les
jeunes)
devant un adverbe :
right through, right there (emploi canonique en anglais)
devant adjectif :
right cool; right cher; j’étais right stressée (anglais rétional)
devant nom ou SN :
j’ai right faim, c’est right la fun (sic!), c’est right pas elle
Emprunt incorporé au français :
Verbe anglais + flexion française
J’ai jamais watché ça ( watch = regarder)
il a fallé in love (fall in love = tomber en
amour)
on a été gone
(go=partir : verbe
irrégulier en français emprunté tel quel)
Restructuration de la structure verbale
Verbe anglais + flexion française + particule
verbale anglaise
j’ai freaké out
(freak out ‘avoir peur’)
du stuff qui va on dans la vie (go on ‘se passer’)
tu peux pas driver up the wall
(drive up smth ‘monter en voiture’)
mes enfants turnont out comme des bums
(turn out ‘devenir’)
Création lexicale
Verbe français+ flexion française +
particule verbale anglaise
il a timbé off la cliff
fall off ‘tomber (en bas) de la falaise’
il est revenu back à la maison
come back
‘revenir’
il est back revenu à la maison
Restructuration du syntagme
nominal
 Matrice française à la source : le déterminant, maintenu,
toujours français.
 Tête nominale ou modificateur adjectival : en français
ou en anglais.
 des bonnes movies intelligentes
 des awsome movies
 de ma whole life
 mon own château à moi,
 l’adjectif anglais est antéposé; l’adjectif français
conserve sa position normale;
 le nom emprunté prend la morphologie française ou
anglaise : [muvi]/[muviz]
Problèmes liés au traitement de
l ’oral.
 La phrase orale ne correspond pas à la phrase écrite: délimitation
de la phrase par les pauses (barres obliques dans les texte) ou par
des marqueurs comme ça fait que; pis, quand, de là, après ?
 Corpus Péronnet-Kasparian : NIC-MO
 ... fait-que j'ai euh travaillé deux ans à la firme comptable après mon
bacc. / pis chuivais ces cours de correspondance-là / quand j'ai vu que
ça marchait pas les cours / j'ai euh / appliqué à l'Université Laval pour
la licence// j'ai faiT un an là pour euh obtenir ta licence pis là ton
coaching de l'été qu(i) est de / juin/ juillet/ août / genre revue de tout
c’que/ que t’as vu / euh de là / on fait note/ j'ai fait mon examen de
comptable agréé // euhm // après mon / ma licence à Québec / là chuis
déménagée à Montréal / pis j'ai travaillé pour une firme
Traitement de l ’oral
 Les transcriptions de productions orales visent à reproduire le plus
fidèlement possible les paroles énoncées, y inclus:
 les hésitations
// euhm //
 les répétitions
tout c’ que/ que t’as vu
 les mots omis
 les élisions
 les ratées
(ça-)fait-que
qu(i)est en juin; t(u)as vu; not(r)e
mon / ma licence
 Les transcriptions visent à reproduire les particularités de
prononciation à travers lesquelles les locuteurs reconnaissent leur
usage, tout en préservant la lisibilité du texte.
 pis chuivais
 là chuis déménagée
je suivais
je suis
Phénomèmes liés à l’oral en
français familier
1. Élision du “ e ” de je devant [s] et
désonorisation
 j + s => ‘ch’
chus
“je suis”
cherais
“je serais”
ché pas
“je sais pas”
chavais
“je savais”
chta habituée “j’étais habituée”
hapax : ju
“je suis”
Phénomèmes liés à l’oral en
français familier
 2. Métathèse de “ re ” en début de mot :
re => er
- chus Erevenue à Edmunston
revenue
- Eretourner sur le marché du travail
retourner
- des belles choses qui Eressortent de tout ça ressortent
Phénomèmes liés à l’oral en
français familier
 3. Élision de consonnes finales
ble => b tre => t
ensemb(l)e
responsab(l)e
formidab(l)e
les artic(l)es
êt(r)e
l’aut(r)e patron
mett(r)e sur pied
touT les aut(r)es
Bathurs(t)
pos(t)e
jus(t)e
st => s
spécialis(t)e
Élision de consonnes
finales
Demonstratif: CE et
cas particuliers
4. Demonstratifs CE
cte,ce.ms
cta,ce.fs
ctés,ce.mp
ctes,ce.mp
cte point là
cta grille là
ctés gens là
ctes matins là
5. v =>m :
- mas
- chuis menu
- je voulais m'emenir
“ j’vas”
“ venu”
“ m'en venir”
Problèmes liés à la transcription :
cas généraux
 Absence de normalisation des conventions pour transcrire
les particularités régionales ou particularités de registre
 avoir => aouèr, awèr, awér





ici => icitte, icite, iciT
chiac => shiaque, shiac, chiak
ces => ctés, ctes, ctès
tout ce que tu as vu => tout c(e) que/ que t(u) as vu; touT c’que t’as vu
notre => not, note, noT, not(r)e
 Usage de caractères typographiques réservés au langage
d’exploitation: parenthèses, accolades, parenthèses
carrées, sensibilité à la case, +, =, -, etc., les annotations
entre parenthèses ...
Objectif
 L’objectif de ce projet de recherche est de développer
l’outil INTEX pour décrire les parlers acadiens et chiac,
en particulier les transferts linguistiques entre le français
acadien et l’anglais d’une part, et d’autre part, les
transferts entre les variétés acadiennes et les variétés
qui lui servent de référence, les français hexagonal et
québécois.
 Notre recherche vise également à faire la synthèse des
travaux existants en description de différentes variétés
de l’acadien et à consigner les résultats des descriptions
anciennes et nouvelles dans INTEX.
Objectifs spécifiques
 Construire un lexique-grammaire informatisé des parlers
acadiens à partir de la recherche existante, de nouveaux
corpus non exploités comme la presse et les œuvres
littéraires, ainsi que de nouvelles descriptions ;
Ce dictionnaire intégré dans INTEX comprendra des
dictionnaires lexico-sémantiques, des dictionnaires de graphes
morphosyntaxiques, de graphes de désambiguïsation de mots,
de graphes orthographiques.
 Intégrer au dictionnaire les résultats des travaux
existants
 Créer les outils qui permettront une reconnaissance
automatique de textes en acadien, notamment pour les
phénomènes transcodiques en chiac.
Les corpus
 Des corpus acadiens informatisés (dictionnaires et textes) du Centre
d’études acadiennes de l’Université de Moncton, dirigé par Maurice
Basque ;
 Des corpus du sud-est du Nouveau-Brunswick sur le vieil acadien et
le chiac déposés au Centre de recherche en linguistique
appliquée (Gauvin et Chevalier 1994; Péronnet 1989; Roy 1979)
 Le corpus sociolinguistique Beaulieu de l’acadien du nord-est du
Nouveau-Brunswick ;
 Le corpus de français standard Péronnet-Kasparian de trois régions
linguistiques du Nouveau-Brunswick : Moncton (Sud-Est) , Bathurst
(Centre-Nord) et Edmundston (Nord-Ouest) ; Corpus chiac
Kasparian H99: Corpus de conversations ou entrevues.
 Les corpus d’œuvres littéraires acadiennes, de discours officiels et
d’enquêtes sociolinguistiques déposés au Laboratoire d’analyse des
données textuelles du Département d’études françaises ;
 Des corpus écrits, des journaux acadiens :
Variantes orthographiques
Présence de transcriptions des formes
orales non conformes au français écrit
standard. Ex:avoir = aouère, awère
Ces formes ne seront pas reconnues par
INTEX.
 exemple du verbe aller: « il faut que j’ialle »
Les transducteurs finis nous permettent
de lui faire reconnaître ces particularités
Transducteur des différentes graphies, du
subjonctif présent du verbe aller, en acadien.
Que j’aille – que j’ialle
Que tu ailles – que tu ialles
Qu’ils aillent – qu’ils iallent
Transducteur des différentes formes
graphiques du verbe aller, en acadien.
Application du delaf + delafc au
corpus NIC.MO : mots inconnus
 alle amagamation assisais astêure aut aute autes
 bacc Brunswick
 capabe ch ché cherais chuis chuivais chum coaching comptabes cte dansS
décembe Dieppe douxième Dover ej enwèye enwèyes Eregarde Eremarque
Eremet Eretourner euhm
 fédérals Fredericton
 générals Gérard
 Halifax hey ieux juse
 Laval lè LeBlanc
 Malenfant Moncton Montreal Montréal
 Nadeau NICOLE Nicole
 octobe ok ouaye prêe provincials
 Québec queque queques
 Riverview Robertson Shediac slash
 St Stephens
 ti tite tou touTzfait
 vesais vesait
Dictionnaire de mots complexes :
delafcAcadien.dic
 nous aut.nous
autres.PRO:P3mp,3fp
 où-ce-que,où est-ce
que.INTER
 quand-ce-que,quand est-ce
que.INTER
 combien-ce-que,combien estce que.INTER
 comment-ce-que,comment
est-ce que.INTER
 ieux-autres,eux.PRO:P3mp,fp
 nous aut.nous
autres.PRO:P3mp,3fp
 nous-aut.nous autres.PRO
 comptable agréé,comptable
agréé.N:ms,fs
 ah well,ah well.INT+eng
 holy mac,holy mac.INT+eng
 oh my god,oh my
god.INT+eng
 young offernders,young
offender.N+eng.Jeune
délinquant
Morphologie : 3e personne pluriel











appelont,appeler.V+prés.:3p
disont,dire.V+prés.:3p
écoutont,écouter.V+prés.
enlevont,enlever.V+prés.
étiont,être.V+prés.:3p
habillont,habiller.V+prés.:3p
jouont,jouer.V+prés.
laisseriont.V+cond.:3p,
metteront,mettre.V+fut:3p
moquont,moquer.V+prés.
prenont,prendre.V+prés.:3p
 tournont out,tourner
out.V+eng.+prés.:3p
 venont,venir.V+prés.
 voulont,vouloir.V+prés.
 voyageont,voyager.V+prés.
Dictionnaire de mots anglais
indépendant ou intégré au delaf?
 Intégrer au dictionnaire Acadien ou constituer un dictionnaire
différent?
 Prendre pour lemme la forme anglaise (kick) ou acadienne (kicker)?














allowance.N, allocations
alright,alright.ADV, d’accord
anyway, anyway.ADV. Peu importe
anyways,anyway.ADV.Peu importe
beaté,beat.V,battre.
behavent,behave.V,se comporter
bored,bore.V :K, ennuyé
boring,boring.A,ennyuant
bouncée,bouncer.V
chumais,chum.V
chumé,chum.V :K
chums,chum.N:mp,fp
dozais,doz.V+imp
dozée,doz.V :K
Dictionnaire des noms propres :
NpropresAcadien.dic














Dieppe,.N+Loc+ville+CDN
Dover,.N+Loc+ville+CDN
Fredericton,.N+Loc+ville+CDN
Gérard,.N+prénom:ms
Halifax,.N+Loc+ville+CDN
Laval,.N+Loc+ville+CDN
LeBlanc,.N+pers:s
Malenfant,.N+famille:s
Moncton,.N+Loc+ville+CDN
Montreal,.N+Loc+ville+CDN+eng
Montréal,.N+Loc+ville+CDN
Nadeau,.N+pers:s
Nicole,.N+prénom:fs
Québec,.N+Loc+province+CDN:s
 Riverview,.N+Loc+ville+CDN+eng:s
 Robertson,.N+pers:s
 Shediac,.N+Loc+ville+CDN:s
Dictionnaire de mots simples
acadiens : DelafAcadie.dic















alle,elle.PRO
amagamation,amalgamation.N+f
assisais,asseoir.V+se+i
astêure,asteur.ADV
bacc,baccalauréat.N:ms
chum,chum.N+eng:ms
coaching,.N+eng:ms
cte,cette.DET+dem:fs
cte,cette.DET+dem:ms
enwèye,envoyer.V+t+i+p:P1s
enwèyes,envoyer.V+t+i+p:P2s
fédérals,fédéral.A:mp
générals,général.A:mp
hey,hey.INT
juse,juste.ADV










ok,ok.INT
ouaye,oui.INT
provincials,provincial.A:mp
queque,quelque.DET:ms
queques,quelques.DET:mp
slash,.N:ms
ti,est-ce que.PartInter
tite,petite.A:fs
vesais,faire.V
vesait,faire.V
Graphe global:
trajets avant le verbe
 sujet de P
 la négation ex:
vous
n’allez pas me dire que on y
met des formes
 le pronominal ex: Je m’en
vas m’émoyer.
 chemin direct ex:
Le
coffre allait devenir un
oratoire
 suivi d’un verbe ex: La
charrette de la Mort pouvait
s’aller embourber dans les
marais »
Graphe « sujet de P »
Transducteur du sous-graphe
« Pronoms sujet de P »
Transducteurs des sous-graphes
inclus dans « Pronoms sujet de P »
Graphe global:
trajets avant le verbe
 chemin direct ex:
Allez-vous-en déterrer les
squelettes des vaches marine
 prépositions
ex: et plus fous que obtus
pour s'en aller en plein jour
éveiller l'ours qui dort
 « se laisser »
ex: Se
laisser aller à sa mort, ce n’est
pas se tuer
Graphe global:
trajets après le verbe
 chemin direct
ex: Fallait point de laisser le temps de nourrir des pressentiments. Allez !
 suivi de GP
ex: par rapport que elle va sus ses vingt ans et sus sa vie de femme
 suivi d'un infinitif
ex: Bon, ça va faire.
Transducteur du sous-graphe « GP »
situé après le verbe
Plan de travail
 Première phase
 la désambiguïsation des lexiques français;
 la construction de graphes pour résoudre la questions des graphies
multiples et de la variation morphologique des formes de conjugaison;
 l’intégration des éléments lexicaux non reconnus par INTEX aux
dictionnaires des mots simples, composés et des expressions figées;
 le recensement des travaux descriptifs sur l’acadien et l’intégration des
données pertinentes.
 Deuxième phase
 Intégration des travaux accomplis et de nouvelles descriptions qui
ressortent de l’application de nouveaux corpus;
 des descriptions qui ressortent à l’application de nouveaux corpus
comme la description de certaines classes de verbes tels les verbes
supports, les verbes pronominaux et les constructions avec particules
verbales (back, out, up) en chiac.
Plan de travail (suite)
 Troisième phase
 la validation de nos travaux par le traitement de nouveaux corpus de
tous genres ;
 vérifications des entrées linguistiques auprès d’informateurs ;
 Évaluation des questions de recherche à prioriser.
Objectif :
Adapter les fonctionalités de l’analyseur
linguistique INTEX pour le traitement
automatique de corpi écrits et oraux en français
régional, les variétés de français acadien parlées
dans les provinces Maritimes.
Intégrer les descriptions des parlers acadiens
disponibles et de décrire les aspects inexplorés.
Particularités des textes en
français acadien
Langue orale
Non standardisée à l’écrit
Archaïsmes
Emprunts à l’anglais et langues
amérindiennes
Langue mixte
Particularités des textes en
français acadien
 Phénomènes orthographiques ou phonétiques
 ex: Tu m'avartiras (avertiras), mon houmme (homme)
 Phénomènes d’élision, ex: c’te (cette), c'ti-là (celui-là)
 Aouère, awère (avoir)
 Phénomènes morphologique
 Flexions du verbe: J’avions (j’avais), Fallit (fallu), l'amenit (l’amène),
 Phénomènes syntaxiques
 Ex: c’était très différent de qu’est-ce que je faisais
 Variantes lexicales
 Ex: garrocha (lança), asteur (maintenant), bécosse (back house)
 Expressions figées: « aller sur ses 20 ans »
Cas particulier du Chiac
État de langue mixte stabilisée avec des règles
et une grammaire.
« toi t’as des owsome parents »
« c’est des cool movies intéressantes que j’ai
watché hier»
« il est back revenu à la maison »
« Je ne veux pas que mes enfants turnont out
comme des bums »
« Anyways, on a été gone comme cinq semaines »
« moi j’étais comme, je minderais pas d’avoir ça dans
ma maison »
Téléchargement