Antonio Rodrigues (DESS SITN)
II. Présentation générale
II.1. Le datamining
II.1.1. Présentation
Ou exploration de données. C’est un ensemble de méthodes et de techniques qui permet
d'extraire des informations à partir d'une grande masse de données. Son utilisation permet
par exemple d'établir des corrélations entre ces données et de définir des comportements-
type de clients.
Ainsi Le datamining, ou prospection de données, est un ensemble de méthodes et de
techniques d'analyse dont les applications peuvent servir à mieux connaître les clients de
l'entreprise. Ce prolongement des statistiques, qui figure selon le Massachussets Institute of
Technology parmi les dix technologies qui vont changer le monde, sert à extraire des
informations d'une masse de données brutes atteignant souvent plusieurs térabits ! On peut
ainsi repérer des relations systématiques entre différentes variables, comme le fait d'acheter
des chips et de la bière le samedi matin et de regarder le match de football le samedi après-
midi. Les techniques associées au datamining s'appuient sur la théorie de l'information, sur
des méthodes statistiques et également sur celles de l'intelligence artificielle. Les données à
explorer sont stockées dans de gigantesques entrepôts nommés datawarehouse mais
peuvent aussi se trouver dans des infocentres plus traditionnels. Extraire des informations
pertinentes à partir du nombre colossal de combinaisons possibles de ces données requiert
une puissance d'analyse énorme que seuls de grands systèmes peuvent supporter.
II.1.2. Principales applications
Grande distribution et VPC : Analyse des comportements des consommateurs,
recherche des similarités des consommateurs en fonction de critères géographiques
ou sociodémographiques, prédiction des taux de réponse en marketing direct, vente
croisée et activation sélective dans le domaine des cartes de fidélité, optimisation des
réapprovisionnements.
Laboratoires pharmaceutiques : Modélisation comportementale et prédiction de
médications ou de visites, optimisation des plans d’action des visiteurs médicaux
pour le lancement de nouvelles molécules, identification des meilleures thérapies
pour différentes maladies.
Banques : Recherche de formes d’utilisation de cartes caractéristiques d’une fraude,
modélisation prédictive des clients partants, détermination de pré autorisations de
crédit revolving, modèles d‘arbitrage automatique basés sur l’analyse de formes
historiques des cours.
Assurance : Modèles de sélection et de tarification, analyse des sinistres, recherche
des critères explicatifs du risque ou de la fraude, prévision d’appels sur les plates-
formes d’assurance directe.