Présentation du cours Ingénierie
linguistique 1
Matthieu Constant
Université Paris-Est Marne-la-Vallée, LIGM
Ingénierie linguistique 1
Administratif
ICM (6 x 2h = 12h) : Matthieu Constant
ITP (6 x 2h = 12h) : André Bittar (2 groupes)
Evaluation
IExamen
ITP à rendre
Textes
Un texte est une séquence de caractères
Ilettres : abABéàûï
Ichiffres : 1479
Iséparateurs : espace, tabulation, retour à la ligne
Isymboles de ponctuation :., ?
Iautres symboles <()>
Différents encodages
IASCII, ISO-8859, Latin1
Iunicode UTF-8, UTF-16 Little Endian, UTF-16 Big Endian
Analyse linguistique de textes
Différents niveaux d’analyse
1. Segmentation
2. Analyse lexicale
3. Etiquetage morphosyntaxique
4. Analyse syntaxico-sémantique
5. Analyse sémantico-pragmatique
Exemple
Le cours de l’or a baissé de 10 euros lundi dernier. M. Bunton
précise que c’est son plus bas niveau depuis 1998.
Segmentation en phrases
Principe
IUne phrase est délimitée par un symbole de fin de phrases
(ex. symbole de ponctuation, retour à la ligne)
IAttention : c’est pas si simple !
M.Bunton précise que c’est son plus bas niveau depuis
1998.
Exemple
Le cours de l’or a baissé de 10 euros lundi dernier. M. Bunton
précise que c’est son plus bas niveau depuis 1998.
1 / 13 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !