UNIVERSITE MOHAMMED PREMIER
FACULTE DES SCIENCES OUJDA
DEPARTEMENT DE MATHEMATIQUE & INFORMATIQUE
UFR : ANITS
Mémoire
Réalisé par:
Najlae KORIKACHE
En vue de l‟obtention de Diplôme des Etudes Supérieures Approfondies (DESA)
Discipline : Analyse Numérique, Informatique et Traitement du Signal (ANITS)
Spécialité : INFORMATIQUE - Bases de données
Création d’un opérateur OLAP de prédiction basé
sur une technique de fouille de données
Soutenue le Novembre 2007 devant le jury :
Mr. Mostafa AZIZI : Président du jury
Mme Amina YAHIA : Encadrant
Mr. El Miloud JAARA : Membre du jury
Année Universitaire : 2007/2008
-i-
Remerciements
Déjà deux ans depuis le tout début de ce DESA…
Tout d‟abord, je remercie Mr. Idriss SBIBIH, responsable de l‟UFR ANITS ainsi que
tous les enseignants qui ont été présent pendant ces deux années. Avec eux, j‟ai apprécié une
démarche organisée, une rigueur de travail et surtout un support scientifique inconditionné.
Je tiens à exprimer ma gratitude à mon encadrant de mémoire: Mme Amina YAHIA.
Je la remercie également pour la précieuse confiance qu‟elle m‟a donnée, pour la grande
liberté d‟idées et de travail qu‟elle m‟a accordée et pour le temps qu‟elle m‟a consacré. En
dehors de son apport scientifique, je n‟oublierai pas aussi de la remercier pour ses qualités
humaines et son soutien qui m‟a permis de mener à bien ce mémoire.
Je remercie les collègues du DESA ANITS. Je remercie aussi ceux que j‟ai côtoyés et
qui, de loin ou de près, ont apporté une plus-value à la qualité de mon travail par leurs
conseils, leurs remarques et leurs observations. Je tiens spécialement à remercier, en
particulier, Mounir GRARI, entant que frère, qui m‟a dirigé et m‟a encouragé pour s‟orienter
à l‟informatique.
Merci à mes parents, je leur suis reconnaissante pour les sacrifices qu‟ils ont faire
pendant mes années d‟études. À mon frère et ma sœur qui, malgré l‟éloignement, m‟ont
soutenu.
Merci à mes amis de toujours
-ii-
Résumé
L‟analyse en ligne OLAP (On Line Analytical Processing) est une solution qui a
largement fait ses preuves pour le résumé, l‟exploration et la navigation dans un entrepôt de
données numériques (Data Warehouse). Malheureusement, les opérateurs OLAP classiques
présentent un certain nombre de limites quand il s‟agit de les appliquer dans un entrepôt de
données complexes telles que des images, des documents XML ou des vidéos.
Nous cherchons à concevoir un cadre élargi d‟analyse pour pouvoir explorer,
expliquer et prédire les données complexes entreposées. Dans ce cadre nous proposons de
combiner les techniques d‟analyse en ligne (OLAP) et de fouille de données (DataMining).
Déjà de nouveaux opérateurs OLAP sont proposé, pour ; l‟agrégation des données complexes
basé sur une technique de classification automatique, opérateur OPAC, le réarrangement d‟un
cube par analyse factorielle (ACM), opérateur ORCA et l‟explication par recherche guidée de
règles d‟association dans un cube, opérateur AROX.
A l‟heure actuelle, nous souhaitons mettre en place un opérateur OLAP de prédiction
pour les données complexes.
Mots clés : entrepôt de données, cubes de données, analyse en ligne, fouille de données,
analyse des correspondances multiples, classification ascendante hiérarchique, extraction des
règles d‟association, données complexes, cadre formel général.
-1-
Chapitre1
Introduction générale
« On commence à vieillir quand on finit d'apprendre.. »
1.1 Contexte et problématique
Actuellement, les systèmes d'information sont principalement constitués par les bases
de données utilisées par les services de production tels que le processus de fabrication, la
gestion des approvisionnements, la gestion des ventes. L'exploitation directe des données des
bases de production s'avèrent souvent inadaptés à leurs besoins décisionnels en raison de
temps d'accès importants, de structures de données ésotériques, d'informations réparties dans
plusieurs sites. Face à ce problème, les industriels ont progressivement mis en place des
entrepôts de données, véritables interfaces entre les bases de données et les décideurs.
L'informatique décisionnelle a pour objectif d'élaborer des systèmes d'analyse de données
dédiés au soutien et à l'amélioration des processus décisionnels des organisations. Ces
systèmes OLAP (On- Line Analytic Processing) sont néralement constitués de bases de
données multidimensionnelles, communément appelées entrepôts (data warehouses) et/ou
magasins (data marts) de données. Ces dernières connaissent un important essor en raison de
leur adéquation dans la manipulation et l'exploitation rapide, efficace et performante des
données à des fins décisionnelles. En effet, les bases multidimensionnelles sont l'un des
nouveaux développements remarquables de la conception des bases de données qui étend de
faon considérable les possibilités d'analyse de grands ensembles de données
multidimensionnels.
Beaucoup sont les techniques liées à l'informatique décisionnelle, de l'entrepôt de
données qui définit un support au système d'information décisionnel, aux outils de fouille de
données permettant d'extraire de nouvelles connaissances, de nombreux moyens
informatiques sont aujourd'hui mis en œuvre pour aider les organes de décision des
entreprises.
1 / 114 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !