
OBJECTIFS
3
Une annotation compréhensive pour le français parlé:
•Annotation grammaticale (POS, parties du discours)
&
•Annotation des phénomènes discursifs: disfluences, marqueurs discursifs,
segmentation en séquences
Liens entre les différents couches d’annotation pour améliorer la performance
de 4 modules habituellement séparés (POS, Syntaxe, Disfluences, Discours).
Un système hybride:
•Utilisation de ressources lexicales ouvertes et fermées.
•Modèles probabilistes (Conditional Random Fields) et règles linguistiques.
Possibilités ouvertes d’intégration de paramètres acoustiques:
•Temporalité : mesure objective des pauses et durée des tokens.
•Autres perspectives : intonation (f0 ou stylisation)