Introduction et Généralités

Téléchargement

Fouille de données

•Déroulement

●Supports cours/TP sur le site silico.biotoul.fr

•Objectifs

●Aperçu de la discipline, regard critique

●Utilisation de méthodes existantes

●Implémentation et évaluation de certaines

méthodes

•Evaluation

●Projet par groupes de 4 CC 40% + exam CT 60%

Data Mining = Knowledge Discovery in Databases (KDD) = Fouille de données

•Définition :

Processus ou méthode qui extrait des connaissances

«intéressantes» ou des motifs (patterns) à partir

d’une grande quantité de données.

Nettoyage

Intégration

Bases de

données,

fichiers, etc.

Données pertinentes

Sélection &

transformation

Fouille

Evaluation

Connaissances

Entrepôt de données

Omni-présence du data mining

•Données numériques disponibles

●Monétaires : Comptes bancaires, CB, cartes de

fidélité

●Réseaux sociaux

●Localisation et déplacement : cartes de transports,

géolocalisation GPS

●Santé : Carte vitale, Sécu, génomes

●Scientifique : astrophysique, biologie, …

•Fouille : comment extraire du sens ?

●Profils clients, sécurité du territoire, risque

économique, santé, …

●Météo

●Modèles et hypothèses scientifiques

Tâches et méthodes

•Statistiques (descriptives, inférentielles, …)

•Prétraitement des données

•Caractérisation

•Classification et prédiction

•Clustering

•Règles d’association

•Evaluation des performances

•Optimisation

•Fouille de texte

•Cubes de données et OLAP (On-Line Analytical

Processing)

•Big data

Motivation

•Masses de données

●Outils automatisés de collecte de données

●Maturité des SGBD

●Entrepôts de données (data warehouses et information repositories)

●ex : Génomes (complets), PubMed, données d’expression, spectres de

masse, métabolomique

•Données vs. connaissances

•Solution : entrepôts de données et data mining

●Data warehousing et on-line analytical processing (OLAP)

●Extraction de connaissances (règles, régularités, motifs, contraintes) à partir

de grosses bases de données

1 / 32 100%

Documents connexes

Fiche-UE_CODE_CR_OPT_DM - LIRIS

titre sur 1 ou 2 lignes maximum

Data/Pattern Analysis

Stage en Data Mining - Machine Learning Group

Application bancaire du data mining Prédiction du chiffre d`affaires

Initiation à la science des données-data science

Télécharger le programme de la formation

Glossaire

8INF954 : Forage de données -Data mining

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Introduction et Généralités

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Introduction et Généralités

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib