Algorithme de Lempel-Ziv et Arbre MESH

publicité
Algorithme de Lempel-Ziv
et Arbre MESH
Leïla Traoré - Vianney Gremmel - Marouane Zehni
Nicolas Fournel - Maxime Chambreuil
Emmanuel Ohana - Sébastien Le Digabel
Mathieu Hautreux - Sébastien Pesquet
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Déroulement
•
•
•
•
•
•
Objectifs
L’arbre MESH
Lempel-Ziv
Problèmes à résoudre
Architecture de l’application
Bibliographie
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
2
Objectifs
• Obtenir le sujet général d’un article médical
• Coloriser les mots importants de cet article :
– Appartenant à l’arbre MESH
– Appartenant à une liste de synonymes
• Appliquer l’algorithme de Lempel-Ziv pour
créer un dictionnaire de mots MESH
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
3
L’arbre MESH
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
L’arbre MESH
• Arbre n-aire stockant des mots du
vocabulaire médical
• Arbre permettant d’obtenir la corrélation
entre 2 mots
• Cette corrélation est proportionnelle à la
hauteur entre le niveau des mots et le
premier nœud commun
• On transforme l’arbre en liste
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
5
Exemple simplifié
/
Traumatologie
Plaies et
traumatismes
Cardiologie
Etat stress
Appareil
Cœur
post-traumatique cardiovasculaire artificiel
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
6
Utilisation de l’algorithme de
Lempel-Ziv
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Lempel-Ziv
• En entrée : une liste de mots
• En sortie : un dictionnaire de mots
« radicaux »
– « cardio » sera notre radical de cardiologue,
cardiologie, cardiovasculaire,
cardiofréquencemètre, etc…
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
8
Problèmes à résoudre
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Problèmes à résoudre
• Le dictionnaire est-il statique ?
– OUI : Pourquoi garder les lettres dans le dictionnaire ?
– NON : le dictionnaire évolue pour ne garder que les
radicaux qui apparaissent le plus souvent dans les
articles…
• L’épuration du dictionnaire : Comment distinguer
et éliminer les adresses inutiles ?
– Nombre de lettres du mots : éliminer les mots de 2 lettres
– Fréquence des mots dans l’article : éliminer les mots
apparaissant moins de n fois
– L’adresse du mot dans le dictionnaire : éliminer les mots
compris entre les adresses 27 et n
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
10
Architecture de l’application
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Architecture de l’application
1ère phase :
MESH
Arbre
en liste
ListeMesh
Lempel
Ziv
DicoMesh
2ème phase :
DicoMesh
Article
(N&B)
Parcours
&
Colorisation
Article avec les mots
MESH en couleur
Article ou les mots
Non-MESH sont
remplacés par « * »
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
12
Bibliographie
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Bibliographie
• http://www.chu-rouen.fr/ssf/santspe.html
• http://www.nlm.nih.gov/mesh/
• http://dicdoc.kb.inserm.fr:2010/basismesh/
mesh.html
• http://www.ohsu.edu/cliniweb/
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
14
Des questions ???
UV Théorie de l’Information – Lempel-Ziv et Arbre MESH – 26 Novembre 2002
Téléchargement