
Table des matières
1. Introduction générale ....................................................................................................... 8
2. État de l’art ..................................................................................................................... 12
2.1. Les expressions polylexicales ................................................................................................12
2.2. Lexiques d’expressions polylexicales .....................................................................................13
2.2.1. DELAC ...................................................................................................................................... 13
2.2.2. LAF ........................................................................................................................................... 13
2.2.3. DC ............................................................................................................................................ 13
2.3. Traitements des expressions polylexicales ............................................................................14
2.3.1. Outils pour l’acquisition des expressions polylexicales .......................................................... 14
2.3.1.1. Le Lexicoscope ................................................................................................................................. 14
2.3.1.2. MWETOOLKIT .................................................................................................................................. 15
2.4. Traduction automatique statistique (TAS) .............................................................................15
2.4.1. Equation fondamentale........................................................................................................... 16
2.4.2. Modèle de langage .................................................................................................................. 16
2.4.3. Modèle de traduction ............................................................................................................. 17
2.4.3.1. Modèles de traduction à base de mots .......................................................................................... 17
2.4.3.2. Modèles de traduction à base de segments ................................................................................... 18
2.4.4. Modèle de distorsion .............................................................................................................. 19
2.4.5. Décodeur ................................................................................................................................. 19
2.4.6. Evaluation automatique .......................................................................................................... 19
2.4.6.1. Score BLEU ...................................................................................................................................... 19
2.4.7. Moses ...................................................................................................................................... 20
2.5. La TAS et les expressions polylexicales ..................................................................................20
2.5.1. Limites ..................................................................................................................................... 20
2.5.1.1. Les phrasal verbs ............................................................................................................................. 21
2.5.1.2. Les expressions totalement figées .................................................................................................. 21
2.5.1.3. Les collocations (semi-figées) ......................................................................................................... 22
2.5.2. Stratégies d’intégrations des EPLs dans un système de TA .................................................... 22
2.5.2.1. Stratégie statique ............................................................................................................................ 22
2.5.2.2. Stratégies dynamique ..................................................................................................................... 23
2.5.3. Travail existant sur l’examination de la TA des Phrasal verbs ................................................ 23
2.6. Notre approche ....................................................................................................................24
2.6.1. Méthode .................................................................................................................................. 24
2.6.2. Pistes pour traiter les expressions idiomatiques .................................................................... 25
2.6.3. Pistes pour traiter les collocations .......................................................................................... 25
3. Préparation des corpus (Enrichissement d'EmoConc) ....................................................... 26
3.1. Présentation des corpus .......................................................................................................26
3.1.1. Europarl ................................................................................................................................... 26
3.1.2. News Commentary .................................................................................................................. 27