Côté descriptif Côté formel Proposition Côté informatique Conclusion
Parsing de l’oral : traiter les disfluences
Marie-Laure Guénot - LPL, CNRS / Université de Provence
Parsing de l’oral : traiter les disfluences
Marie-Laure Guénot
LPL - CNRS / Université de Provence
Côté descriptif Côté formel Proposition Côté informatique Conclusion
Parsing de l’oral : traiter les disfluences
Marie-Laure Guénot - LPL, CNRS / Université de Provence
Parsing de l’oral : traiter les disfluences
Traitement automatique des disfluences
Phénomène fréquent en oral spontané
Côté descriptif : études fines de l’organisation interne
Côté formel : pas de statut clair des disfluences au sein d’un système grammatical
Côté informatique : techniques diverses, pas régulières
Proposition
Côté descriptif : réflexion théorique sur la place des disfluences dans une grammaire
Côté formel : représentation formelle issue de cette réflexion
Côté informatique : caractéristiques, limites, quelques suggestions
Côté descriptif Côté formel Proposition Côté informatique Conclusion
Parsing de l’oral : traiter les disfluences
Marie-Laure Guénot - LPL, CNRS / Université de Provence
Caractéristiques générales
Rupture du déroulement syntagmatique, entassement paradigmatique
Absence de fonction sémantique
Pas de contenu sémantique différent d’une forme non disfluente, n’apporte rien à la
sémantique de l’énoncé
Absence de fonction syntaxique
Ni consituants d’un syntagme, ni en relation de dépendance
Deux types possibles
Bribes : reprises à partir de syntagmes inachevés (il il)
Amorces : reprises à partir de morphèmes inachevés (dans la paran- dans la parano)
Côté descriptif
Côté descriptif Côté formel Proposition Côté informatique Conclusion
Parsing de l’oral : traiter les disfluences
Marie-Laure Guénot - LPL, CNRS / Université de Provence
Organisation interne
Trois formes possibles [Pallaud & Henry 03]
Complétées : reprise des premières formulations à l’identique
Modifiées : reprise et modification des premières formulations
Inachevées : abandon des premières formulations
Côté descriptif
Côté descriptif Côté formel Proposition Côté informatique Conclusion
Parsing de l’oral : traiter les disfluences
Marie-Laure Guénot - LPL, CNRS / Université de Provence
Organisation interne (suite)
Espaces internes [Shriberg 94]
Reparandum : lieu de la première production (sont très)
Interruption point : lieu de la (première) rupture syntagmatique ([IP])
Interregnum : lieu où peuvent se produire des marques d’hésitation et/ou des tentatives
de formulation avortées (euh sont doivent être)
Repair : reprise du déroulement syntagmatique (doivent pouvoir être contrôlés)
Côté descriptif
1 / 21 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !