Algorithme de Lempel-Ziv et Arbre MESH Leïla Traoré - Vianney Gremmel - Marouane Zehni Nicolas Fournel - Maxime Chambreuil Emmanuel Ohana - Sébastien Le Digabel Mathieu Hautreux - Sébastien Pesquet UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 Déroulement • • • • • • Objectifs L’arbre MESH Lempel-Ziv Problèmes à résoudre Architecture de l’application Bibliographie UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 2 Objectifs • Obtenir le sujet général d’un article médical • Coloriser les mots importants de cet article : – Appartenant à l’arbre MESH – Appartenant à une liste de synonymes • Appliquer l’algorithme de Lempel-Ziv pour créer un dictionnaire de mots MESH UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 3 L’arbre MESH UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 L’arbre MESH • Arbre n-aire stockant des mots du vocabulaire médical • Arbre permettant d’obtenir la corrélation entre 2 mots • Cette corrélation est proportionnelle à la hauteur entre le niveau des mots et le premier nœud commun • On transforme l’arbre en liste UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 5 Exemple simplifié / Traumatologie Plaies et traumatismes Cardiologie Etat stress Appareil Cœur post-traumatique cardiovasculaire artificiel UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 6 Utilisation de l’algorithme de Lempel-Ziv UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 Lempel-Ziv • En entrée : une liste de mots • En sortie : un dictionnaire de mots « radicaux » – « cardio » sera notre radical de cardiologue, cardiologie, cardiovasculaire, cardiofréquencemètre, etc… UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 8 Problèmes à résoudre UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 Problèmes à résoudre • Le dictionnaire est-il statique ? – OUI : Pourquoi garder les lettres dans le dictionnaire ? – NON : le dictionnaire évolue pour ne garder que les radicaux qui apparaissent le plus souvent dans les articles… • L’épuration du dictionnaire : Comment distinguer et éliminer les adresses inutiles ? – Nombre de lettres du mots : éliminer les mots de 2 lettres – Fréquence des mots dans l’article : éliminer les mots apparaissant moins de n fois – L’adresse du mot dans le dictionnaire : éliminer les mots compris entre les adresses 27 et n UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 10 Architecture de l’application UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 Architecture de l’application 1ère phase : MESH Arbre en liste ListeMesh Lempel Ziv DicoMesh 2ème phase : DicoMesh Article (N&B) Parcours & Colorisation Article avec les mots MESH en couleur Article ou les mots Non-MESH sont remplacés par « * » UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 12 Bibliographie UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 Bibliographie • http://www.chu-rouen.fr/ssf/santspe.html • http://www.nlm.nih.gov/mesh/ • http://dicdoc.kb.inserm.fr:2010/basismesh/ mesh.html • http://www.ohsu.edu/cliniweb/ UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002 14 Des questions ??? UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002