ANNIS pour l’interrogation de corpus annotés
Travaux pratiques sur les corpus oraux du projet
Orfeo
Clément Plancq, LaTTiCe (CNRS, ENS, Paris 3)
CORLI, lundi 14 novembre 2016
ANNIS - Corli - 14/11/2016 2
Plan
Présentation d’Orfeo
Les corpus
Les métadonnées, les annotations
TP 1 : Premiers pas avec ANNIS
Présentation de l’interface et des fonctionnalités
AQL : Annis Query Language
ANNIS et les outils de corpus-tools.org
Modèle de données SALT
Installation et importation de données (outil de conversion
Pepper)
TP 2 : Exploration de corpus avec ANNIS
ANNIS - Corli - 14/11/2016 3
Présentation d’Orfeo
ANNIS - Corli - 14/11/2016 4
Orfeo
Projet ANR (appel corpus) http://www.projet-orfeo.fr/
7 laboratoires partenaires, coord. Jeanne-Marie Debaisieux
(LaTTiCe)
Objectifs :
Constituer un corpus d’étude pour le français contemporain
Rassembler des données secondaires à partir de corpus existants
(méta-données, transcriptions harmonisées, alignement texte / signal,
annotations)
Résultats :
Plate-forme d’interrogation des données
Diffusion des corpus annotés sous licence libre
ANNIS - Corli - 14/11/2016 5
Orfeo : les corpus
Oral : 3 millions de mots Écrit : 15 millions
Focus sur les corpus oraux pendant la
formation
Liste des corpus oraux :
http://www.projet-orfeo.fr/corpus/corpus2
Description :
http://www.projet-orfeo.fr/corpus/le-corpus-d-e
tude-du-francais-contemporain
1 / 29 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !