Report
Reference
Un prototype d'analyseur pour le romanche sursilvain
SCHERRER, Yves
SCHERRER, Yves. Un prototype d'analyseur pour le romanche sursilvain. Genève :
2007, 27 p.
Available at:
http://archive-ouverte.unige.ch/unige:22829
Disclaimer: layout of this document may differ from the published version.
1 / 1
Un prototype d’analyseur
pour le romanche sursilvain
Yves Scherrer
DEA de Linguistique
17 octobre 2007
1 Introduction
Ce document décrit les caractéristiques principales du romanche sursilvain, en vue de
l’implémentation d’un analyseur morphologique et syntaxique de cette langue dans le
système Fips.
Je commencerai par décrire la situation linguistique des Grisons (section 2) afin de
mieux comprendre quelques caractéristiques de la variété sursilvaine.
La section 3 sera consacrée à la morphologie et décrira l’implémentation d’un généra-
teur morphologique capable de traiter les substantifs, adjectifs et verbes romanches.
La section 4 présentera l’acquisition automatique d’un petit lexique permettant d’uti-
liser le générateur morphologique.
La section 5 contient quelques éléments de syntaxe romanche. Quelques phénomènes
intéressants sont décrits à l’aide d’un ensemble de règles suivant le formalisme de Fips.
Enfin, la section 6 contiendra quelques remarques conclusives. Notamment, il sera
question de travaux ultérieurs qui pourraient être utiles dans la perspective du trai-
tement automatique du romanche.
2 Les langues rhéto-romanches
La situation linguistique des Grisons est caractérisée par une grande diversité, résultat
de la géographie montagneuse ne favorisant pas les échanges entre les vallées (Liver
1999; Haiman et Beninca 1992).
Le romanche est traditionnellement parlé dans les vallées alpines des Grisons. Depuis
le Moyen-Age, l’allemand le côtoie et le menace. Ce contact linguistique de longue
durée a introduit beaucoup de caractéristiques de l’allemand dans une langue du
groupe roman. L’allemand et les dialectes alémaniques se sont imposés dans les Gri-
sons par deux voies distinctes. D’une part, l’allemand s’est répandu depuis le nord,
en remontant la vallée du Rhin. Au 16ème siècle, la ville de Coire a été reconstruite
1
par des ouvriers germanophones suite à un incendie. Depuis, la capitale des Grisons
est majoritairement germanophone, renforçant ainsi le rayonnement de l’allemand.
D’autre part, les Walser, venus du Haut-Valais, ont occupé les vallées hautes grisonnes
au 14ème siècle. Le romanche est également en contact avec l’italien et les dialectes
lombards, parlés traditionnellement dans les vallées du Sud des Grisons. Toutefois, de-
puis quelques décennies, il n’y a plus de locuteurs adultes romanches monolingues.
Le romanche est essentiellement parlé dans la vallée du Rhin antérieur (Surselva), dans
le centre des Grisons en amont de Coire, ainsi que dans l’Engadine et le Val Müstair. Ces
régions déterminent aussi les variétés du romanche. Le temps de la Réforme a donné
naissance à l’écriture du romanche. Des orthographes et des normes linguistiques ont
été élaborés indépendamment dans chaque région ; les divergences religieuses ont
également donné lieu à des "orthographes protestantes" et des "orthographes catho-
liques" dans la Surselva. Finalement, ces efforts de standardisation ont abouti à cinq
idiomes régionaux (Gross 2004) :
Sursilvan L’idiome sursilvain est le plus important en ce qui concerne le nombre de
locuteurs (17000), et est parlé dans la vallée du Rhin antérieur.
Sutsilvan Cet idiome compte uniquement 1000 locuteurs natifs ; il est le plus menacé
de disparition. Il est parlé dans la vallée du Rhin postérieur, à proximité de la ville
de Coire, et le long de l’axe routier du San Bernardino.
Surmiran Cet idiome, avec 3000 locuteurs natifs, est parlé sur le versant nord des Cols
de l’Albula et du Julier. Avec le Sutsilvan, il forme le groupe central du romanche.
Puter Le puter est parlé en Haute-Engadine, par 5000 locuteurs. Malgré ce nombre
relativement élevé, il est menacé par de nombreux locuteurs de l’allemand et de
l’italien qui affluent dans cette région touristique.
Vallader Cette variété est parlée en Basse-Engadine et dans le Val Müstair. On recense
6000 locuteurs, ce qui fait du Vallader le deuxième idiome du romanche des Gri-
sons.
Ces cinq idiomes représentent des normes écrites régionales. Cependant, certains vil-
lages peuvent utiliser des dialectes qui s’écartent considérablement de la norme régio-
nale – parfois ces dialectes sont même plus proches de la norme d’une région voisine.
En plus, les normes sont assez vagues et admettent beaucoup de variation orthogra-
phique.
En plus de ces cinq idiomes "naturels", une sixième langue a été développée dans les
années 1980 (Schmid 1989), le Rumantsch Grischun (RG). Il a été conçu comme une
langue suprarégionale écrite, pour l’usage administratif et médiatique. Cet idiome a
été compilé à partir des cinq idiomes pour trouver un compromis compréhensible par
tout le monde. A partir de 2005, le RG est enseigné dans les écoles romanches.
L’analyseur morphologique et syntaxique présenté dans les sections suivantes se base
sur la variété sursilvaine (Spescha 1989; Liver 1982). De manière rétrospective, il aurait
peut-être été plus judicieux d’utiliser le Rumantsch Grischun comme point de départ.
Je ne l’ai pas fait parce que je sous-estimais l’importance de cette langue commune, et
que je préférais travailler sur une langue qui s’est développée naturellement. En plus,
des documents sur le Sursilvan m’étaient plus facilement accessibles.
2
3 Morphologie
Dans cette section, je présente la morphologie flexionnelle du romanche sursil-
vain. Les paradigmes flexionnels du romanche ressemblent beaucoup à ceux d’autres
langues romanes, avec un paradigme nominal très réduit, un paradigme adjectival
basé sur l’alternance de genre et de nombre, et un paradigme verbal relativement riche.
Une grande partie des paradigmes irréguliers, dans toutes les parties du discours, sont
caractérisés par une alternance de la voyelle accentuée, à l’instar des phénomènes
dumlaut en allemand ; ces alternances vocaliques sont beaucoup plus fréquenctes en
Sursilvan que dans les autres idiomes.
Ici, il s’agit surtout de mettre en place une classification des différents procédés de
formation. Ces classes sont choisis en fonction des caractéristiques du moteur mor-
phologique de Fips.
3.1 Substantifs
Comme les autres langues romanes, le romanche a une flexion nominale relativement
simple ; le paradigme est constitué uniquement de deux formes, le singulier et le plu-
riel. Il n’y a pas de cas morphologiques. Si la grande majorité des substantifs suivent
une formation régulière, quelques classes de flexion irrégulières sont néanmoins ins-
dispensables.
3.1.1 Réguliers
Les substantifs réguliers, masculins et féminins, forment le pluriel en -s. Si la forme
du singulier finit déjà en -s, les deux formes restent identiques ; il n’y a pas d’ajout
d’un -s supplémentaire. Par contre, si le singulier se termine en -z ou en -x, le suffixe
-s est tout de même ajouté. Ces substantifs forment la classe 1. Un autre ajustement
orthographique concerne les mots en -gl. La plupart de ces mots forment le pluriel en
-ls (en supprimant le -g-). Mais comme certains mots gardent le -g- au pluriel, il fallait
refléter cette distinction par deux classes séparées. Les mots qui conservent -g- sont
attribués à la classe 1, les mots qui perdent le -g- font partie de la classe 6. Le tableau
ci-dessous donne quelques exemples.
Singulier Pluriel Classe Traduction
activitad activitads 1 activité
architect architects 1 architecte
taistais1 blaireau
plazplazs 1 place
heroxheroxs 1 héros
spurtegl spurtegls 1 guichet
cavagl cavals 6 cheval
3
3.1.2 Alternances vocaliques
Une partie importante des substantifs masculins subissent une alternance du radical.
Cette alternance concerne la voyelle accentuée (qui est souvent une diphtongue), mais
elle peut également déclencher une assimilation de la consonne précédente.
La classe 2 rend compte de l’alternance -ie- > -o-. Elle doit tenir compte du change-
ment éventuel de la nature de la consonne précédente dans le cas de -tgie- > -co-, de
la présence possible d’un -s final au singulier (comme dans la classe 1), et du fait que
le -i- est conservé dans le contexte -glie- > -glio-.
La classe 3 reflète l’alternance vocalique -ie- > -ia-. Dans ce cas, le -i- est conservé par
défaut, mais il est supprimé dans les contextes -schie- > -scha-, et -gnie- > -gna-.
Le tableau ci-dessous illustre les alternances vocaliques avec quelques exemples. Si
à première vue, il pourrait sembler judicieux de fusionner les classes 1 à 3, le bas du
tableau montre que ce n’est pas souhaitable : il existe des mots en -ier dans les trois
classes 1, 2 et 3.
Singulier Pluriel Classe Traduction
criec crocs 2 charrue
iert orts 2 jardin
tgiern corns 2 corne
iesos2 os
taglier tagliors 2 assiette
unviern unviarns 3 hiver
tschierv tscharvs 3 cerf
gnierv gnarvs 3 nerf
pumpier pumpiers 1 pompier
taglier tagliors 2 assiette
fier fiars 3 fer
3.1.3 Autres alternances du radical
La classe 4 modélise le traitement du -i final accentué, qui est normalement trans-
formé en -ials au pluriel. Comme dans la classe 3, le -i- est supprimé dans les contextes
-schi > -schals, et -gni > -gnals. En plus, le -l- de la séquence -li est supprimé au pluriel.
Comme quelques mots d’emprunt avec -i final forment le pluriel de manière régulière,
il n’était pas possible de réunir les classes 4 et 1 (cf. tableau ci-dessous).
La classe 5 traite les alternances -iel > -euls et -al > -auls. Pour la première, le -i- est
conservé au pluriel dans le contexte -glieuls.
4
1 / 28 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !