Structure de données en Text Mining

Téléchargement

Structure de donn´ees en Text Mining

Julien Lemoine

29 mai 2008

Julien Lemoine () Structure de donn´ees en Text Mining 29 mai 2008 1 / 110

Plan

1Introduction

2Les structures dynamiques (RAM)

Table de Hashage

Arbres binaires de recherche

Splay Tree

Trie, Suﬃx Tree et Patricia Trie

TST: Ternary Search Tree

Burst Tree

Judy Array

3Les structures dynamiques (Disque)

String B-Tree

4Les structures statiques (RAM)

Trie compil´e

5Les structures statiques (Disque)

String B-Tree statique

6Conclusion / R´ef´erences

Julien Lemoine () Structure de donn´ees en Text Mining 29 mai 2008 2 / 110

Introduction

Usage

Structure de donn´ees: li´ee `a un/des algorithme(s)

Type de structure de donn´ees

Structures g´en´eralistes (Tableaux, Tables de hashages, arbres de

recherches binaires, ...)

Chaque domaine a des structures de donn´ees sp´eciﬁques:

par exemple les transducteurs en NLP

Julien Lemoine () Structure de donn´ees en Text Mining 29 mai 2008 3 / 110

Structures utilis´ees dans notre domaine

Dictionnaires

Dans notre m´etier: 99% des structures sont des dictionnaires

Objectif: associer une valeur Y`a chaque cl´e X

Exemples:

dictionnaire de mots

dictionnaire de n-grams

dictionnaire associant des meta-donn´ees `a une url

dictionnaire associant des co-occurrences `a un mot

· · ·

Julien Lemoine () Structure de donn´ees en Text Mining 29 mai 2008 4 / 110

Structures utilis´ees dans notre domaine

Algorithmes

Les algorithmes appliqu´es sur ces structures de donn´ees sont souvent

plus complexes qu’une simple recherche exacte

Par exemple:

recherche via une expression r´eguli`ere

recherche approximative (trouver l’orthographe la plus proche)

recherche par pr´eﬁxe(trouver toutes les urls d’un site dans un

dictionnaire d’urls)

...

Julien Lemoine () Structure de donn´ees en Text Mining 29 mai 2008 5 / 110

100

101

102

103

104

105

106

107

108

109

110

111

1 / 111 100%

Documents connexes

Sujet de thèse : « Data science appliquée au secteur Banking ».

titre sur 1 ou 2 lignes maximum

Stage en Data Mining - Machine Learning Group

Fiche-UE_CODE_CR_OPT_DM - LIRIS

S`appuyant sur ses nombreux travaux antérieurs et sur des

Glossaire

Racontez l`histoire de la famille Lemoine au passif

Vient de paraître

Marketing, Vente MENTION Responsable

8INF954 : Forage de données -Data mining

Conjugue les verbes entre parenthèses au présent de l`indicatif

Lecture de la première lettre de saint Paul Apôtre aux

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !

GDPR Confidentialité Conditions d'utilisation

Structure de données en Text Mining

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Structure de données en Text Mining

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib