Soutenance de thèse, Décembre 2007
Analyse en ligne (OLAP) de documents
Ronan Tournier
Travaux de thèse
Sous la direction de Gilles Zurfluh
Encadré par : Franck Ravat et Olivier Teste
IRIT, SIG/ED Analyse en ligne (OLAP) de documents
Décembre 2007 2
Plan
Introduction
Modèle conceptuel
Manipulations multidimensionnelles
Intégration de documents
Validation
Conclusion & perspectives
IRIT, SIG/ED Analyse en ligne (OLAP) de documents
Décembre 2007 3
ENTREPÔT
DE DONNEES
SOURCE ET
EXTRACTION MAGASIN DE
DONNEES (BDM) RESTITUTION
ET ANALYSE
Processus ETL
Processus
ETL
Sources
DECIDEUR
Vue unifiée Structuration
multidimensionnelle
Contexte (1/6)
Les systèmes d’aide à la décision
Cadre de la thèse
XML
XML
IRIT, SIG/ED Analyse en ligne (OLAP) de documents
Décembre 2007 4
Contexte (2/6)
Analyse multidimensionnelle
Dell PowerEdge
New-York Nov.05
MAGASIN
DATES
VENTES
Montants, Quantités
Londres
Toulouse
Paris
France
Angleterre
USA
Europe
Amerique N.
IBM SystemX
Alienware Aurora
Sun Ultra
Déc.05
Jan.06
Fév.06
2005
2006
PRODUITS
Station
Serveur
VillePaysContinent
Produit
Type
Mois Année
1131
2200310043501900
2 0 0 4
4400 0 0 7600
2 0 7 6
4400 0 1015011400
7 9 0 1
1540027900 0 1900
1
1900
Quantité
Montant
IRIT, SIG/ED Analyse en ligne (OLAP) de documents
Décembre 2007 5
Contexte (3/6)
Pourquoi se soucier des documents ?
Analyse en ligne sur données transactionnelles
Données transactionnelles: 20% des données d’un
système d’information [Sullivan-01] & [Tseng-06]
80% des données restent hors de portée
Mais
Systèmes OLAP: données numériques
Documents = données textuelles
1 / 60 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !