1
Installer ADoReVA
L'algorithme de regroupement hiérarchique que nous avons développé porte le nom d'ADoReVA (pour
« Automatic Detection of Register Variations Algorithm »). Il a été spécifiquement conçu pour être implémenté
dans Praat, sous forme de plugin. Un plugin permet l'ajout de nouvelles commandes sans avoir à recourir
directement à la manipulation de scripts. Il doit être installé dans les Préférences de Praat. Dans le répertoire
Praat, copiez donc le dossier plugin_ADoReVA que vous venez de télécharger. Pensez à le dézipper. ADoReVA
est désormais accessible à partir du menu New. S’il n’apparaît pas automatiquement dans le menu New, ouvrez
le script Setup.praat (sauvegardé dans le plugin ADoReVA) et lancez-le à partir de la commande Run. Fermez
Praat et ouvrez-le à nouveau. ADoReVA doit maintenant être disponible à partir du menu New.
Figure 1 : Aperçu du plugin ADoReVA, tel qu’il est implémenté dans PRAAT. Les 5 étapes de l’algorithme
apparaissent sous différents onglets, à droite.
Les différents scripts qui constituent l’algorithme apparaissent sous forme de commandes et peuvent être lancés
directement à partir de ces dernières. La détection automatique des variations de registre se fait selon un
ensemble de 5 scripts, chacun définissant une étape particulière de l'algorithme, que nous décrivons ci-après.
MANUEL D’UTILISATION ADoReVA
2
Etape 1: Calcul des différences de registre entre unités
Calculate register differences...
Que fait l’algorithme ?
La première étape de l’algorithme consiste à calculer (1) le registre de chaque locuteur (i.e. hauteur et étendue
globale), (2) le registre de chaque unité de parole (i.e. hauteur et étendue pour chaque unité) et enfin (3) les
différences de registre, i.e. les différences de hauteur et d'étendue de registre entre deux unités de parole
consécutives.
Les objets en entrée sont, pour chaque locuteur, un objet TextGrid, dans lequel sont annotées les unités de la
parole que vous souhaitez analyser (dans notre exemple, i.e. dans De Looze (2010), les unités sont des groupes
clitiques) et un objet Sound. De l'objet Sound est créé un objet Pitch, à partir duquel sont extraits les échantillons
de la f0. Il est à noter que l'Objet pitch est créé à partir de l'objet Sound selon un ajustement des seuils plancher
et plafond tel qu’il est décrit par De Looze (2010). Les paramètres Pitch Floor et Pitch Ceiling lors de la création
de l’objet Pitch sont ajustés respectivement aux formules suivantes : q25*0.75 et q75*1.75 (où q25 et q75 sont
les 25
ème
et les 75
ème
quantiles de la distribution de la f0). Dans le script, deux autres formules pour ajuster les
seuils plancher et plafond sont aussi proposées : le deuxième ajustement se fait par les formules suivantes :
q15*0.83 et q65*1.92 (où q15 et q65 sont les 15
ème
et 65
ème
quantiles de la distribution de la f0) ; le troisième
ajustement se fait à partir de la médiane par les formules suivantes : q50*2 et q50*0.75. Voir De Looze (2010)
pour plus d’explications.
L'algorithme calcule la hauteur (KEY) et l'étendue (RANGE) du registre global de chaque locuteur ou de chaque
unité de parole selon les formules suivantes :
KEY = médiane de la f0 en Hertz ;
pour RANGE, deux formules sont possibles :
- Formule 1 : RANGE = log2(max/min), i.e. la différence entre la valeur maximale et la valeur minimale de
l’unité en octave.
- Formule 2 : RANGE = 0.161*log2(KEY), élaborée dans De Looze (2010). Dans cette deuxième formule,
l’étendue est donc proportionnelle à la hauteur.
Les différences de hauteur et d'étendue (DIFFKEY et DIFFRANGE) entre deux unités consécutives sont
obtenues par le calcul suivant :
DIFFKEY = |log2 (KEY) - log2 (KEY(n-1))|
DIFFRANGE = |RANGE – RANGE(n-1)|
DISTEUCLY = DIFFKEY^2  DIFFRANGE^2
Dans ces formules, KEY est la hauteur de registre calculée sur l'unité en question et KEY(n-1) la hauteur calculée
sur l'unité précédente. RANGE est l’étendue du registre calculée sur l'unité en question et RANGE(n-1) l’étendue
calculée sur l'unité précédente. Nous avons ajouté à nos calculs celui de la distance euclidienne (DISTEUCLY),
c'est à dire la différence de registre entre deux unités consécutives selon deux paramètres: la hauteur et
l'étendue.
3
Outre le calcul des variations de registre, cette étape de l’algorithme permet de corréler une annotation
fonctionnelle (par exemple, dans De Looze (2010) en termes de changement de topique) aux variations de
registre calculées et ce, en répertoriant, dans les données de sortie de cette étape, les annotations fonctionnelles
sous forme tabulaire.
Quels sont les paramètres à ajuster ?
Figure 2 : Fenêtre des paramètres à ajuster avant de lancer le script
Une fois que vous avez lancé le script en cliquant sur la commande Calculate register differences..., une fenêtre
apparaît. Elle présente les paramètres à ajuster avant de cliquer sur OK.
Unit_tier : Indiquez le numéro de la tier à partir de laquelle les unités de la parole que vous avez choisi
d’analyser ont été annotées.
Correlation : Cochez la case si vous souhaitez corréler les différences de registre calculées à une
annotation fonctionnelle (dans notre cas, i.e. dans De Looze (2010), par exemple, nous avons annoté des
changements de topique et avons cherché à voir s’ils étaient indiqués par des changements de registre).
Function tier : Indiquez le numéro de la tier à partir de laquelle vous avez effectué votre annotation
fonctionnelle. Si la case Correlation est décochée car vous n’avez pas d’annotation fonctionnelle, alors inscrivez
le chiffre 0.
!!! L’annotation fonctionnelle doit être alignée à l’annotation des unités.
4
Tier Type : Indiquez le type de tier (interval/ point) à partir de laquelle vous avez effectué votre annotation
fonctionnelle. Si la case Correlation est décochée car vous n’avez pas d’annotation fonctionnelle, alors écrivez
« none ».
Pause : Indiquez l’étiquette choisie pour annoter les pauses (par défaut : #).
Pitch settings: Indiquez l’ajustement que vous souhaitez utiliser pour les seuils plancher et plafond (1, 2
ou 3)
1
.
Range_formula : Indiquez la formule que vous souhaitez utiliser pour le calcul de RANGE (1 ou 2)
2
.
Input_folder : Indiquez le chemin qui mène à vos fichiers Son et TextGrid
3
.
Output_folder : Indiquez le chemin qui mène au dossier dans lequel vous récupèrerez les données de
sortie de cette première étape
4
.
n characters : Indiquez le nombre de caractères que vous souhaitez voir afficher dans les feuilles de
l’arborescence. Par défaut, 0 indique que l’on souhaite voir apparaître tous les caractères inscrits dans l’unité
traitée.
Quelles sont les données de sortie ?
Les résultats obtenus pour cette première étape sont rendus sous format tabulaire, comme le montre l'extrait ci-
dessous (Figure 3):
Figure 3: Extrait des données de sortie obtenues suite à l'étape 1. La colonne FILENAME donne le nom du
fichier, MIN et MAX les valeurs extrêmes du registre du locuteur, SPEAKERKEY et SPEAKERRANGE la hauteur
et l'étendue du registre global du locuteur, UNITS l'unité en question, INTSTART, INTEND, INTDUR le début, la
fin et la durée de l'unité en question, HERTZ la hauteur de l'unité en Hertz, KEY la hauteur de l'unité en log de
base 2, RANGE l'étendue en log de base 2, DIFFKEY, DIFFRANGE les différences de hauteur et d'étendue
entre l'unité en question et l'unité précédente et EUCLY la distance euclidienne obtenue entre les deux unités
consécutives. Des colonnes en plus qui n’apparaissent pas ici sont à noter : FUNCTION_START et
FUNCTION_END dans le cas la function_tier est une point_tier ; FUNCTION, dans le cas la function_tier
est une interval_tier.
1
Ajustement 1 = q25*0.75 and q75*1.75; Ajustement 2 = q15*0.83 and q65*1.92; Ajustement 3 = q50*2 and q50*0.75.
2
Formule 1 : RANGE = log2(max/min); Formule 2 : RANGE = 0.161*log2(KEY).
3
Dans le plugin, le répertoire par défaut dans lequel se trouvent les fichiers son et TextGrid est
« Sound&TextGrid »
4
Dans le plugin, le répertoire par défaut dans lequel sont enregistrées les données de sortie est « Tables ».
5
Etape 2: Mise en forme des données (optionnel)
Modify data (optional)...
Que fait l’algorithme ?
La deuxième étape de l'algorithme consiste en la mise en forme des données. Parce que l'étape 3 fait appel à un
format particulier (xml), les données tirées du TextGrid (les unités de parole choisies) ne doivent pas contenir
certains symboles de type « < ou > », ou encore « \ ». Si les TextGrids sont susceptibles de contenir ces
symboles, il est préférable de passer par cette seconde étape. Dans le cas contraire, elle n'est pas nécessaire et
l'utilisateur peut directement passer à la troisième étape.
Quels sont les paramètres à ajuster ?
Figure 4 : Fenêtre des paramètres à ajuster avant de lancer le script
Input_folder : Indiquez le chemin qui mène aux données de sortie de la 1
ère
étape (répertoire par défaut
« Tables »).
Output_folder : Indiquez le chemin qui mène au dossier dans lequel vous récupèrerez les données de
sortie de cette deuxième étape (répertoire par défaut « ModifiedTables »).
Quelles sont les données de sortie ?
Les données de sortie sont strictement les mêmes que celles de la première étape, excepté que les symboles
inappropriés des unités traitées dans le TextGrid ont été effacés.
1 / 12 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !