Le Datamart est un sous-ensemble d`un

publicité
DSCG : UE5 - Management des Systèmes d'Information
Séance 02 : recherche des termes de l'informatique décisionnelle
1. Qu'est ce qu'un Datamart?
Le Datamart est un sous-ensemble d’un Datawarehouse destiné à fournir des données aux
utilisateurs et il est souvent spécialisé vers un groupe ou un type d'affaire.
Le DataMart est donc un ensemble de données ciblées, organisées, regroupées et agrégées
pour répondre à un besoin spécifique,à un métier ou à un profil de l'entreprise (service)
Le Datamart se trouve en toute fin de la chaîne de traitement de l'information (en aval du
DataWarehouse qui l'alimente).
2. Qu'est ce qu'un ETL?
3. Qu'est ce que le datamining?
Le data mining (l'exploration de données en français) a pour objet l’extraction d'un savoir ou
d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques
ou semi-automatiques.
Amazon et Google sont les références mondiales en terme de data mining
4. Qu'est ce qu'OLAP?
OLAP est l’acronyme de On Line Analytical Processing, le traitement analytique en ligne. Le but
de l'OLAP est de permettre une analyse multidimensionnelle sur des bases de données
volumineuses afin de mettre en évidence une analyse particulière des données (il est l'objet
d'un questionnement particulier). La technologie OLAP permet à l’utilisateur final de procéder à
une analyse ad hoc des données dans plusieurs dimensions, et fournit ainsi les
éclaircissements et la compréhension qui lui sont nécessaires pour une meilleure prise de
décisions.
Grâce à l'OLAP, les utilisateurs peuvent créer des représentations multidimensionnelles
(appelées hypercubes ou « cubes OLAP ») selon les critères qu'ils définissent afin de simuler
des situations. Cette structure est prévue à des fins d'analyses interactives par une ou plusieurs
personnes (souvent ni informaticiens ni statisticiens) du métier que ces données sont censées
représenter.
5. Qu'est ce que le BAM?
6. Qu'est ce qu'un Datawarehouse?
Le Data Warehouse, ou entrepôt de données, est une base de données dédiée au stockage de
l'ensemble des données utilisées dans le cadre de la prise de décision et de l'analyse
décisionnelle. Le Data Warehouse est exclusivement réservé à cet usage. Il est alimenté en
données depuis les bases de production grâce notamment aux outils d'ETL Extract Transform
Load.
1/3
02-COURS-MSI_Reponse_questions_recherche
DSCG : UE5 - Management des Systèmes d'Information
Séance 02 : recherche des termes de l'informatique décisionnelle
Orienté sujet
Au coeur du Data warehouse, les données sont organisées par thème. Les données propres à
un thème, les ventes par exemple, seront rapatriées des différentes bases OLTP de production
et regroupées.
Intégré
Les données proviennent de sources hétérogènes utilisant chacune un type de format. Elles
sont intégrées avant d'être proposées à utilisation
Non volatile
Les données ne disparaissent pas et ne changent pas au fil des traitements, au fil du temps
(Read-Only).
Historisé
Les données non volatiles sont aussi horodatées. On peut ainsi visualiser l'évolution dans le
temps d'une valeur donnée.
Le degré de détail de l'archivage est bien entendu relatif à la nature des données. Toutes les
données ne méritent pas d'être archivées.
7. Qu'appelle-t-on Big data?
Les big data, littéralement les grosses données, est une expression anglophone utilisée pour
désigner des ensembles de données qui deviennent tellement volumineux qu'ils en deviennent
difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de
l'information. L'on parle aussi de datamasse[4] en français par similitude avec la biomasse.
Le phénomène big data est considéré comme l'un des grands défis informatiques de la
décennie 2010-2020. Il engendre une dynamique importante tant par l'administration, que par
les spécialistes sur le terrain des technologies ou des usages[.]
Le Big Data couvre trois dimensions : volume, vélocité et variété :
Volume : les entreprises sont submergées de volumes de données croissants de tous types,
qui se comptent en téraoctets, voire en pétaoctets.
Vélocité : parfois, 2 minutes c'est trop. Pour les processus chronosensibles tels que la détection
de fraudes, le Big Data doit être utilisé au fil de l'eau, à mesure que les données sont collectées
par votre entreprise afin d'en tirer le maximum de valeur.
Variété : le Big Data se présente sous la forme de données structurées ou non structurées
(texte, données de capteurs, son, vidéo, données sur le parcours, fichiers journaux, etc.). De
nouvelles connaissances sont issues de l’analyse collective de ces données.
8. Qu'est ce que NoSQL?
NoSQL (Not only SQL en anglais) désigne une catégorie de systèmes de gestion de base de
données (SGBD) qui n'est plus fondée sur l'architecture classique des bases relationnelles.
L'unité logique n'y est plus la table, et les données ne sont en général pas manipulées avec
SQL.
En effet, NoSQL ne vient pas remplacer les BD relationnelles mais proposer une alternative ou
compléter les fonctionnalités des SGBDR pour donner des solutions plus intéressantes dans
certains contextes. Le premier besoin fondamental auquel répond NoSQL est la performance.
En effet, ces dernières années, les géants du Web comme Google et Amazon ont vu leurs
besoins en termes de charge et de volumétrie de données croître de façon exponentielle. Et
c’est pour répondre à ces besoins que ses solutions ont vu le jour. Ce théorème énonce que
tout système distribué peut répondre aux contraintes suivantes:
•
Cohérence : tous les nœuds du système voient exactement les mêmes données au
même moment
•
Haute disponibilité : en cas de panne, les données restent accessibles
•
Tolérance au Partitionnement : le système peut être partitionné
Il est essentiel de garder à l’esprit que NoSQL apporte une réponse à des besoins bien
spécifiques. Il est nécessaire d’avoir identifier au préalable la nécessité d’utiliser cette
technologie avant de la mettre en place,
2/3
02-COURS-MSI_Reponse_questions_recherche
DSCG : UE5 - Management des Systèmes d'Information
Séance 02 : recherche des termes de l'informatique décisionnelle
9. Qu'est ce que HADOOP?
10. Qu'appelle-t-on "Drill-down"?
Le drill down désigne le fait d'organiser une recherche d'information dans une base de données
multi-dimensionnelle allant du général au particulier.
11. Qu'est ce qu'un système expert?
Un système expert est un outil capable de reproduire les mécanismes cognitifs d'un expert,
dans un domaine particulier. Il s'agit de l'une des voies tentant d'aboutir à l'intelligence
artificielle.
Plus précisément, un système expert est un logiciel capable de répondre à des questions, en
effectuant un raisonnement à partir de faits et de règles connus. Il peut servir notamment
comme outil d'aide à la décision. Le premier système expert est DENDRAL . Il permettait
d'identifier les constituants chimiques.
Un système expert se compose de 3 parties :
•
une base de faits,
•
une base de règles et
•
un moteur d'inférence.
Le moteur d'inférence est capable d'utiliser faits et règles pour produire de nouveaux faits,
jusqu'à parvenir à la réponse à la question experte posée.
La plupart des systèmes experts existants reposent sur des mécanismes de logique formelle
(logique aristotélicienne) et utilisent le raisonnement déductif. Pour l'essentiel, ils utilisent la
règle d'inférence suivante (syllogisme) :
•
si P est vrai (fait ou prémisse) et si on sait que P implique Q (règle) alors, Q est vrai
(nouveau fait ou conclusion).
3/3
02-COURS-MSI_Reponse_questions_recherche
Téléchargement