DSCG : UE5 - Management des Systèmes d'Information Séance 02 : recherche des termes de l'informatique décisionnelle 1. Qu'est ce qu'un Datamart? Le Datamart est un sous-ensemble d’un Datawarehouse destiné à fournir des données aux utilisateurs et il est souvent spécialisé vers un groupe ou un type d'affaire. Le DataMart est donc un ensemble de données ciblées, organisées, regroupées et agrégées pour répondre à un besoin spécifique,à un métier ou à un profil de l'entreprise (service) Le Datamart se trouve en toute fin de la chaîne de traitement de l'information (en aval du DataWarehouse qui l'alimente). 2. Qu'est ce qu'un ETL? 3. Qu'est ce que le datamining? Le data mining (l'exploration de données en français) a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques. Amazon et Google sont les références mondiales en terme de data mining 4. Qu'est ce qu'OLAP? OLAP est l’acronyme de On Line Analytical Processing, le traitement analytique en ligne. Le but de l'OLAP est de permettre une analyse multidimensionnelle sur des bases de données volumineuses afin de mettre en évidence une analyse particulière des données (il est l'objet d'un questionnement particulier). La technologie OLAP permet à l’utilisateur final de procéder à une analyse ad hoc des données dans plusieurs dimensions, et fournit ainsi les éclaircissements et la compréhension qui lui sont nécessaires pour une meilleure prise de décisions. Grâce à l'OLAP, les utilisateurs peuvent créer des représentations multidimensionnelles (appelées hypercubes ou « cubes OLAP ») selon les critères qu'ils définissent afin de simuler des situations. Cette structure est prévue à des fins d'analyses interactives par une ou plusieurs personnes (souvent ni informaticiens ni statisticiens) du métier que ces données sont censées représenter. 5. Qu'est ce que le BAM? 6. Qu'est ce qu'un Datawarehouse? Le Data Warehouse, ou entrepôt de données, est une base de données dédiée au stockage de l'ensemble des données utilisées dans le cadre de la prise de décision et de l'analyse décisionnelle. Le Data Warehouse est exclusivement réservé à cet usage. Il est alimenté en données depuis les bases de production grâce notamment aux outils d'ETL Extract Transform Load. 1/3 02-COURS-MSI_Reponse_questions_recherche DSCG : UE5 - Management des Systèmes d'Information Séance 02 : recherche des termes de l'informatique décisionnelle Orienté sujet Au coeur du Data warehouse, les données sont organisées par thème. Les données propres à un thème, les ventes par exemple, seront rapatriées des différentes bases OLTP de production et regroupées. Intégré Les données proviennent de sources hétérogènes utilisant chacune un type de format. Elles sont intégrées avant d'être proposées à utilisation Non volatile Les données ne disparaissent pas et ne changent pas au fil des traitements, au fil du temps (Read-Only). Historisé Les données non volatiles sont aussi horodatées. On peut ainsi visualiser l'évolution dans le temps d'une valeur donnée. Le degré de détail de l'archivage est bien entendu relatif à la nature des données. Toutes les données ne méritent pas d'être archivées. 7. Qu'appelle-t-on Big data? Les big data, littéralement les grosses données, est une expression anglophone utilisée pour désigner des ensembles de données qui deviennent tellement volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l'information. L'on parle aussi de datamasse[4] en français par similitude avec la biomasse. Le phénomène big data est considéré comme l'un des grands défis informatiques de la décennie 2010-2020. Il engendre une dynamique importante tant par l'administration, que par les spécialistes sur le terrain des technologies ou des usages[.] Le Big Data couvre trois dimensions : volume, vélocité et variété : Volume : les entreprises sont submergées de volumes de données croissants de tous types, qui se comptent en téraoctets, voire en pétaoctets. Vélocité : parfois, 2 minutes c'est trop. Pour les processus chronosensibles tels que la détection de fraudes, le Big Data doit être utilisé au fil de l'eau, à mesure que les données sont collectées par votre entreprise afin d'en tirer le maximum de valeur. Variété : le Big Data se présente sous la forme de données structurées ou non structurées (texte, données de capteurs, son, vidéo, données sur le parcours, fichiers journaux, etc.). De nouvelles connaissances sont issues de l’analyse collective de ces données. 8. Qu'est ce que NoSQL? NoSQL (Not only SQL en anglais) désigne une catégorie de systèmes de gestion de base de données (SGBD) qui n'est plus fondée sur l'architecture classique des bases relationnelles. L'unité logique n'y est plus la table, et les données ne sont en général pas manipulées avec SQL. En effet, NoSQL ne vient pas remplacer les BD relationnelles mais proposer une alternative ou compléter les fonctionnalités des SGBDR pour donner des solutions plus intéressantes dans certains contextes. Le premier besoin fondamental auquel répond NoSQL est la performance. En effet, ces dernières années, les géants du Web comme Google et Amazon ont vu leurs besoins en termes de charge et de volumétrie de données croître de façon exponentielle. Et c’est pour répondre à ces besoins que ses solutions ont vu le jour. Ce théorème énonce que tout système distribué peut répondre aux contraintes suivantes: • Cohérence : tous les nœuds du système voient exactement les mêmes données au même moment • Haute disponibilité : en cas de panne, les données restent accessibles • Tolérance au Partitionnement : le système peut être partitionné Il est essentiel de garder à l’esprit que NoSQL apporte une réponse à des besoins bien spécifiques. Il est nécessaire d’avoir identifier au préalable la nécessité d’utiliser cette technologie avant de la mettre en place, 2/3 02-COURS-MSI_Reponse_questions_recherche DSCG : UE5 - Management des Systèmes d'Information Séance 02 : recherche des termes de l'informatique décisionnelle 9. Qu'est ce que HADOOP? 10. Qu'appelle-t-on "Drill-down"? Le drill down désigne le fait d'organiser une recherche d'information dans une base de données multi-dimensionnelle allant du général au particulier. 11. Qu'est ce qu'un système expert? Un système expert est un outil capable de reproduire les mécanismes cognitifs d'un expert, dans un domaine particulier. Il s'agit de l'une des voies tentant d'aboutir à l'intelligence artificielle. Plus précisément, un système expert est un logiciel capable de répondre à des questions, en effectuant un raisonnement à partir de faits et de règles connus. Il peut servir notamment comme outil d'aide à la décision. Le premier système expert est DENDRAL . Il permettait d'identifier les constituants chimiques. Un système expert se compose de 3 parties : • une base de faits, • une base de règles et • un moteur d'inférence. Le moteur d'inférence est capable d'utiliser faits et règles pour produire de nouveaux faits, jusqu'à parvenir à la réponse à la question experte posée. La plupart des systèmes experts existants reposent sur des mécanismes de logique formelle (logique aristotélicienne) et utilisent le raisonnement déductif. Pour l'essentiel, ils utilisent la règle d'inférence suivante (syllogisme) : • si P est vrai (fait ou prémisse) et si on sait que P implique Q (règle) alors, Q est vrai (nouveau fait ou conclusion). 3/3 02-COURS-MSI_Reponse_questions_recherche