Structures syllabiques et caractéristiques du cycle
mandibulaire : une étude articulatoire des asymétries
Nathalie Vallée1 Thi Thuy Hien Tran1 Solange Rossato2 Paolo Mairano1,3
(1) GIPSA-lab DPC, UMR 5216, CNRS & Universi Grenoble Alpes, BP25 38040 Grenoble cedex 9, France
(2) LIG GETALP, UMR 5217, CNRS & UniversiGrenoble Alpes, BP 53 - 38041 Grenoble cedex 9, France
(3) LFSAG, Universidi Torino. Via Sant'Ottavio 20, 10124, Turin, Italy
[email protected], thi-thuy-hien-tran@gipsa-
lab.grenoble-inp.fr, [email protected], [email protected]
RESUME ___________________________________________________________________
Notre étude tente de définir des éléments de la nature physique de la syllabe, et plus
particulièrement, d’établir un lien entre asymétries phonétique et phonologique capable d’expliquer
le MOP, principe phonologique empirique qui affecte les segments consonantiques à la position
initiale de syllabe plutôt que finale. Les deux cadres théoriques qui s’intéressent à ce lien, Frame,
then Content theory et Articulatory Phonology, laissent quelques interrogations qui nous anent à
le revoir sous l’aspect articulatoire, plus précisément, au niveau des caractéristiques du geste
mandibulaire. Des études antérieures sur l’anglais-aricain ont montré l’existence dasymétries au
niveau des phases du cycle mandibulaire qui pourraient expliquer les grandes tendances des
structures syllabiques. Nous exposons ici des sultats préliminaires sur le français et le vietnamien.
ABSTRACT _________________________________________________________________
Syllabic structures and properties of jaw cycle: An articulatory study of Asymmetries
The present study tries to highlight a link between phonetic and phonological asymmetries which
could account for the MOP which allocates consonantal segments to syllable-initial position rather
than syllable-final. The theoretical frameworks concerned are the Frame, then Content theory and
Articulatory Phonology, but they do not account for this link thoroughly. For this reason, we shall
reconsider it in the light of new articulatory data focusing on the mandibular gesture. Previous
studies on American-English have shown evidence of asymmetries within the jaw cycle that might
explain general trends of syllabic structures. We present first results on French and Vietnamese.
MOTS-CLES: Syllabe, cycle mandibulaire, asymétries phonétique et phonologique, français, vietnamien
KEYWORDS: Syllable, jaw cycle, phonetic and phonological asymmetries, French, Vietnamese
1 Introduction
Établir le lien entre asymétries photique et phonologique au niveau de l'organisation
structurelle de la syllabe devrait permettre dexpliquer un standard sur lequel se base la plupart
des théories sur la syllabation des langues : le Maximum Onset Principle ou MOP (Kahn, 1976 ;
Selkirk, 1982 ; Clements & Keyser, 1983 ; Goldsmith, 1990 ; Blevins, 1995). Principe universel
de syllabation, le MOP postule l'attraction des segments consonantiques dans la position
antéposée au noyau vocalique (attaque) au dépend de la position postposée (coda). À ce jour, le
MOP reste une observation phonétique et phonologique sur laquelle se base bon nombre de
travaux même expérimentaux en linguistique, psycholinguistique, traitement automatique des
langues. Deux cadres toriques sintéressent à la nature du MOP : Frame, then Content theory
(MacNeilage, 1998 ; 2008) et Articulatory Phonology (Browman & Golstein, 1988 ; 1995 ; 2000).
Dans le premier, l'organisation universelle de la parole en successions de consonne et voyelle est
postulée comme étant le produit de l’oscillation de la mandibule, reliant directement la structure
CV universelle au cycle du geste mandibulaire (qui constitue le cadre) : la consonne est produite
lorsque la mandibule est en position haute alors que la voyelle estalisée lorsque la mandibule
est en position basse (le contenu). Cependant, cette théorie napporte pas d’explication à la forte
pdominance de la structure syllabique CV par rapport à la structure inverse VC laquelle
représente moins de 5 % des syllabes des langues du monde (Rousset, 2004) et qui s’inscrit tout
aussi bien dans le cycle mandibulaire. La théorie prédit également des combinaisons sonores CV
favorisées dans les langues qui sont semblables aux productions des enfants au stade du
babillage, et ce quelle que soit la langue de leur environnement (Davis & MacNeilage, 1995 ;
MacNeilage & Davis, 2001). Ces combinaisons favorisées appelées Pure Frame sont produites
avec un cycle d’oscillation mandibulaire, sans mouvement anro- postérieur de la langue entre la
alisation de la consonne et celle de la voyelle, et sont considérées comme des productions
articulatoirement simples leur conférant un avantage qui expliquerait leur surreprésentation.
Rousset (2004), confirmé par Vallée, Rossato & Rousset (2009), montre que les proportions de
Pure Frame parmi les syllabes VC relevées dans 15 langues sont significativement plus
importantes que pour les syllabes CV, indiquant une forte cohésion articulatoire plus fréquente
entre voyelle et consonne lorsque cette dernière est en coda par rapport à l’attaque. Il faut aussi
ajouter comme point faible à cette théorie que le type de syllabe CVC est au deuxme rang des
fréquences des structures syllabiques dans les langues du monde (après CV), et au premier rang
de certaines (ex. les langues du sud-est asiatique : nyakhur, thai, vietnamien, wa...).
Dans le modèle de la phonologie articulatoire, au contraire, la mandibule n’a pas de rôle direct
dans la production de la syllabe, car considée comme support des actions des articulateurs lèvre
inférieure et langue. La prédominance de la structure CV y est expliquée par les caractéristiques
naturelles des segments, consonantiques et vocaliques, qui s’associent en phase (in phase-
coupling) : les gestes articulatoires pour C et V sont très précisément coordonnés, donc
compatibles, sans interférence négative mutuelle sur leur production respective car réalisés gce
à des mécanismes articulatoires indépendants qui permettent, en même temps, un déclenchement
synchronides gestes pour C et V. Le chevauchement des gestes, estimé par la mesure du C-
Center Effect (Browman & Goldstein, 1988) confère à la combinaison CV the most stable
coupling mode et les différentes positions intra-syllabe possibles pour C correspondent alors à
différents modes de configuration des gestes (Browman & Golstein, 1995 ; Byrd, 1995). La
syllabe est ici, à linverse de la démonstration sur laquelle sappuie la théorie Frame, then
Content, le produit de plusieurs gestes individuels correspondant aux segments coarticulés (“a
gestural constellation”). Les combinaisons CV favorisées sont celles pour lesquelles les gestes
sont les plus naturellement en phase donc stables (Goldstein, Byrd & Saltzman, 2006 ; Whalen,
Giulivi, Goldstein, Nam & Levitt, 2011). La structure renversée VC demande une coordination
motrice plus complexe dans la mesure où la production de la consonne, si elle est lancée trop t,
masque la réalisation acoustique de la voyelle. Pour cette raison, les structures VC montrent
beaucoup moins de stabilité dans la coordination des gestes (pas de C-Center Effect) expliquant
la vulnérabilité de la coda sujette à la lénition. Cette explication peut-elle être prolongée à
l’observation de la proportion des Pure-Frame plus importante dans les structures VC par rapport
à CV ?
Une autre piste d’explication de cette co-articulation noyau-coda, qui serait aussi à me de
rendre compte du MOP, pourrait venir des études de Kelso, Vatikiotis-Bateson, Saltsman & Kay
(1985), Gracco (1994), Redford (1999) ou encore Redford & Donkelaar (2008) qui, en cherchant
à évaluer limpact des propriétés biocaniques de la mandibule sur l’articulation des segments,
mettent en évidence l’existence d'une asymétrie entre les deux phases du cycle mandibulaire : la
phase de remontée (fermeture) est observée plus rapide, plus courte, moins ample, plus raide
(stiffness) que la phase dabaissement (ouverture). Si ces asymétries inhérentes aux propriétés du
cycle mandibulaire étaient vérifiées indépendamment des cibles linguistiques, elles pourraient
expliquer plusieurs tendances observées dans les langues du monde dont le MOP (cf. entre autres
Rousset, 2004). Notre étude se situe dans cette problématique, à savoir si le cycle mandibulaire
joue un rôle ou non dans la compréhension de la nature physique de la syllabe. Les travaux
pcédents ayant por essentiellement sur des locuteurs de l’anglais-aricain, notre étude
s’inscrit dans un projet plus vaste multilingue (français, polonais, portugais brésilien, ruwund,
tachelhit, vietnamien). Nous présentons ici les premiers résultats obtenus pour le français et le
vietnamien.
2 Procédure et méthode
2.1 Matériel
Les mouvements des articulateurs choire, langue, lèvres ont été mesurés avec le système
d'articulographie électromagnétique (EMA) AG200 de la société Carstens grâce auquel il a été
procédé à l’acquisition en 2D, à une fréquence de 200 Hz, de 5 bobines collées sur les
articulateurs (choire, lèvre inférieure, lèvre supérieure, apex et dos de la langue) et 2 bobines
collées sur le plan de référence médio-sagittal du sujet. Le signal acoustique de parole a été
enregistré avec un enregistreur numérique stéréo PMD670 de Marantz, micro directionnel
C1000S d'AKG et numérisé à 44.1 KHz.
2.2 Corpus et participants
Les résultats préliminaires présentés ci-après ont été obtenus pour le français à partir de
quences extraites du corpus de logatomes {CV.CVL.CVC, CV.LVC, CLV.CVLC,
CLV.CVCL, CLV.CLVC} avec C=/p b t d s z/, L=/l/, V=/i a/ et le point représentant une
frontière syllabique. Un corpus de 43 phrases contenant chacune des syllabes dans différentes
distributions (ex. Son analyse digitale est utile et suffisamment probable) complète ces données,
ainsi que lapétition dun enchainement des 2 voyelles. Cinq locutrices natives du français (CC,
EB, LV, ML, SB) âgées de 20 à 43 ans ont participé à l’expérience. Les logatomes et phrases ont
été enregistrées dans 2 sessions à part. Cinq répétitions de chaque logatomes, ainsi que les
phrases, ont été présentées dans un ordre aatoire. Les résultats préliminaires exposés ici portent
sur cinq répétitions de 3 logatomes prononcés à un débit normal d’élocution : /aiaiaiaiai/,
/tataltat/, /sasalsas/. Le même protocole a été utilisé pour le vietnamien. Les logatomes sont
monosyllabiques CV et CVC avec Cinitiale=/b t d s z/, Cfinale=/p t/, V=/i a / et ton modal B1-D1.
Cinq locutrices natives du vietnamien âgées de 28 à 35 ans, varié du nord (HOA, LINH, THANH,
HOAI, HUONG) ont participé à lexpérience. Nous psentons ici les premiers sultats obtenus
pour cette langue avec la quence /aiaiaiaiai/.
2.3 Mesures
Pour l’heure, seul le mouvement de la choire a fait l’objet danalyses. À partir de la segmentation
semi-automatique avec EasyAlign et Praat, les séquences ont été extraites et étiquetées avec Trap
v.6, outil développé sous environnement Matlab au GIPSA-lab par C. Savariaux. Les mesures
effectes avec Trap sont les suivantes : (1) durée des phases dabaissement (ouverture) et de
remontée (fermeture) de la mandibule mesues à partir des maxima douverture et de fermeture qui
correspondent aux points de passage par zéro de la courbe de vitesse ; (2) pic de vitesse et vitesse
moyenne de chacune des phases ; (3) amplitude de chaque phase, qui correspond au déplacement
vertical de la mandibule, estimée entre les maxima douverture et de fermeture.
2.4 Analyse statistique
Notre objectif est d’étudier les variations des variables ponses (durée, vitesse et amplitude de
chacune des phases du cycle mandibulaire) et linfluence de deux facteurs sur celles-ci : d’une
part le type syllabique CV, CVL, CVC ainsi que laquence VV ; d’autre part la langue
(français, vietnamien) pour la séquence VV. Notre protocole ayant permis de recueillir plusieurs
valeurs de variable réponse pour un me sujet, il ne nous garantit pas l’indépendance des
observations qui pourraient alors être liées à un ou quelques sujets, comme par exemple la durée
des phases. Notre choix sest porté sur le modèle linéaire à effets mixtes et pour permettre de
respecter lhypothèse selon laquelle les résidus suivent une loi normale (condition d’application
des modèles mixtes), nous avons choisi de transformer la variableponse en son logarithme :
 
         avec :
 : j ième valeur du sujet i prise par la variable réponse pour la modalik du facteur A et l du
facteur B
: effet de la modali k du facteur A sur la variable réponse,
: effet de la modalité l du facteur B sur la variable réponse,
 : effet de linteraction de la modali k du facteur A et de la modalité l du facteur B sur la
variable réponse,
: effet aléatoire du sujet i sur la variable réponse. suit une loi normale 
avec
la
variable réponse entre sujets,
 : représente le terme d’erreur et suit une loi normale, 
.
Pour analyser la différence entre les deux modalités (phases d’ouverture et fermeture), à
l’intérieur de chaque modalité type syllabique et langue, sera appliquée la méthode de Hothorn,
Bertz et Westfall (2008) qui permet de réaliser des comparaisons multiples de moyennes avec le
modèle mixte en garantissant également que le risque de première espèce lié à la prise simultanée
de toutes les décisions ne dépasse pas le seuil fixé à l’avance à 5 % en ajustant les p-values. La
méthode sera appliquée aux données avec la fonction glht du package multcomp du logiciel R
ainsi que la fonction lsmeans du package lsmeans.
3 Résultats
3.1 Durée
Les comparaisons multiples des durées moyennes entre phase d’ouverture et phase de fermeture
pour chacun des trois cycles mandibulaires relevés dans les logatomes CV.CVL.CVC (C= {/t/,
/s/}, V=/a/) et les cinq cycles de la séquence /aiaiaiaiai/ montrent des différences significatives
entre les deux phases, avec une fermeture plus longue que l’ouverture (Table 1, Figures 1 et 2),
sauf pendant la réalisation de la syllabe initiale /ta/.(t) (F-Ota.(t)=-0.06164, SD=0.066, z=-0.932,
p=0.95).
Estimate
Std. Error
z
value Pr(>|z|)
F - O | iai
0.21906
0.04275
5.125
2.09e-06 ***
F - O | sa.(s)
0.22734
0.06759
3.364
0.00537 **
F - O | sal
0.47024
0.06759
6.957
2.43e-11 ***
F - O | sas
0.46185
0.06759
6.833
5.81e-11 ***
F - O | ta.(t)
-0.06164
0.06610
-0.932
0.95156
F - O | tal
0.31084
0.06610
4.702
1.80e-05 ***
F - O | tat
0.50349
0.06610
7.617
1.83e-13 ***
TABLE 1 Estimations ponctuelles des différences de moyennes de due (log) entre phase de fermeture et phase
d’ouverture pour tous les cycles mandibulaires des logatomes /aiaiaiaiai/, /tataltat/ et /sasalsas/ avec écarts-type
des différences, valeur de la statistique et p-value (hypothèse du test : F-O=0).
FIGURE 1 Estimations des durées moyennes (log)
des phases d’ouverture et de fermeture pour chaque
type de cycle mandibulaire. Les fermetures sont en
général plus longues que les ouvertures.
FIGURE 2 Estimations ponctuelles des différences
de moyennes entre due de fermeture et durée
d’ouverture (exprimées en log) et intervalles de
confiance à 95 % pour chaque type de cycle.
La figure 2 comporte les valeurs des comparaisons multiples entre les différents types de cycles
mandibulaires (lignes horizontales), le point représentant l’estimation ponctuelle de la différence
et les parenthèses, les bornes de l’intervalle de confiance à 95 %. Seul lintervalle de confiance
pour /ta/.(t) contient la valeur 0 indiquant une différence non significative. La figure 1 montre
que les remontées de la mandibule sont en moyenne plus longues en psence d’une consonne en
coda (/tal/ et /tat/ vs. /ta/.(s), et /sal/ et /sas/ vs. /sa/.(s)).
FIGURES 3 Durées moyennes des phases d’ouverture et de fermeture des cycles mandibulaires en fonction des
types syllabiques et des locutrices du français pour les deux consonnes /t/ et /s/.
Comparativement aux deux séquences avec consonnes, les durées moyennes des deux phases du
cycle sont plus longues en l’absence de geste consonantique (séquence /aiaiaiaiai/). C’est aussi la
quence dont lintervalle de confiance est le plus réduit (Figure 2), indiquant une variabilité
moindre dans les réalisations. Un effet de la position finale du logatome, position dans laquelle
on pourrait sattendre à un allongement de la durée en français (patron accentuel iambique), est
seulement observé pour la phase de fermeture avec la plosive en coda (Figure 1). Hormis le cas
de /ta/.(t), l’observation des durées moyennes des phases d’ouverture vs. phases de fermeture
montre que le patron avec fermeture plus longue que l’ouverture est assez stable chez les sujets
français, quelles que soient la structure syllabique, la consonne plosive ou fricative, la position
dans le logatome (Figures 3) : on observe une légère tendance au patron inverse (ouverture plus
longue que la fermeture) chez la locutrice ML pour le cycle qui produit la syllabe /tal/ (143 vs.
138 ms). SB et LV montrent des différences moyennes entre fermeture et ouverture de 5 ms
respectivement pour /sa/.(s) et /tal/, alors que chez ces locutrices, pour les autres syllabes, les
-0.2 0.0 0.2 0.4 0.6
Différence
F O |tat F O |tal F O |ta.(t) F O |sas F O |sal F O |sa.(s) F O |iai
0,00
0,05
0,10
0,15
0,20
0,25
CC EB LV ML SB
Durée (s)
ta.(t)
Ouverture Fermeture
0,00
0,05
0,10
0,15
0,20
0,25
CC EB LV ML SB
Durée (s)
tat
Ouverture Fermeture
0,00
0,05
0,10
0,15
0,20
0,25
CC EB LV ML SB
Durée (s)
sa.(s)
Ouverture Fermeture
0,00
0,05
0,10
0,15
0,20
0,25
CC EB LV ML SB
Durée (s)
sal
Ouverture Fermeture
0,00
0,05
0,10
0,15
0,20
0,25
CC EB LV ML SB
Durée (s)
sas
Ouverture Fermeture
1 / 9 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !