1
DATA MINING EN ASSURANCE : Quelques Utilisations
Rédha TIR
Inspecteur Central
Direction des Grandes Entreprises (DGE)
Ministères des Finances
Tél. :+213 70 35 53 85
Fax : +213 94 19 43
Résumé / Abstract
Dans un contexte de compétitivité économique fondée sur l’usage de l’information,
les compagnies d’assurances sont de plus en plus fréquemment amenées à entreprendre
une démarche stratégique de traitement de l’information.
Eu égard aux gisements d’informations existants dans ce type d’entreprises,
l’extraction des connaissances à partir de données appelée communément le « Data
Mining » devient un enjeu majeur pour l’ensemble des acteurs (compagnies, autorité de
contrôle, conseils consultatifs et organismes d’intelligence économique en général).
Au moment les modèles statistico- mathématiques ont prouvé leurs limites, le
Data Mining a pris un essor extraordinaire à travers un certain nombre de techniques
empruntées à l’intelligence artificielle et à la biologie.
Le but de cette communication est de fournir quelques éléments clés susceptibles
d’être utiles aux compagnies d’assurances en matière de traitement des données
statistiques disponibles et de leur exploitation à des fins de croissance et de
développement de produits et de services personnalisés.
La première partie de ce travail consiste à examiner les techniques du Data Mining
qui revêtent une importance cruciale pour l’assurance. Ces techniques sont au nombre de
quatre : le réseau neuronal (Neural Network), la logique floue (Fuzzy Logic), l’algorithme
génétique (Genetic Algorithm) et les ensembles approximatifs (Rough Sets).
La deuxième partie concerne les différentes utilisations de ces techniques- simulant
le raisonnement humain- et leur adaptation aux problèmes d’assurance. On pourrait citer,
la classification de la clientèle et des entreprises à des fins de marketing, l’optimisation
du portefeuille et des stratégies commerciales, l’évaluation du risque, la détection des
fraudes, etc.
Quelques pistes de développement de ces systèmes seront discutées tout au long de
cette communication.
Mots-clés :
Intelligence artificielle, Data Mining, produits d’assurance, classification,
optimisation.
2
I- INTRODUCTION
Actuellement, il est de plus en plus clair que l’avantage compétitif réside dans les compétences
des ressources humaines et la capacité à se doter d’une organisation apprenante. De plus, la
connaissance est devenue, plus encore que le capital et les ressources matérielles, l’ingrédient
essentiel de la création de valeur (Manfred, 1995).
Concernant le marché algérien des assurances, le besoin d’implanter des systèmes d’aide à la
décision et d’extraction de connaissance est ressenti de plus en plus avec l’évolution de
l’informatique et de la taille de l’entreprise. Ceci dit, l’informatique dans ces entreprises est
cantonnée à l’aide à la production effective de la compagnie, ainsi qu’à l’administration
traditionnelle (paie, comptabilité, etc.).
Les compagnies d’assurances ont aujourd’hui tout intérêt à se concevoir comme organisation
apprenante en utilisant le volume d’informations existant. En d’autres termes, il y a une
nécessité d’intégrer les services aux spécialités diverses et d’ajouter aux données de production
des informations permettant de les mettre en perspective pour des décisions de l’ordre de la
stratégie d’entreprise.
A cet égard, le data warehouse (entrepôt de données) est considéré comme une reconnaissance
de la valeur et du rôle de l’information. Son opérationnalisation pourrait augmenter la
performance des décideurs en consolidant, convertissant, transformant et intégrant les données
issues de différents sous- systèmes constituant la compagnie d’assurances, et en leur
fournissant une vue dynamique, globale et pertinente de leur entreprise.
Par ailleurs, Peppers et Rogers disaient qu« au lieu de se concentrer sur un produit à la fois,
en essayant de le vendre au plus grand nombre possible, concentrez vous sur un client la
fois et essayez de lui vendre autant de produits que possible ». D’où la connaissance du client
est d’une importance cruciale pour l’entreprise et sa pérennité. Elle constitue également l’un
des facteurs essentiels de la réussite ou de l’échec de la compagnie d’assurances.
Ce processus de connaissance utilise souvent les techniques du Data Mining qui signifie la
fouille de données dans les gisements de l’entreprise. Ses applications en assurance couvrent
l’estimation des risques, gestion de la relation client (CRM), acquisition de nouveaux clients,
élaboration des plans de réassurance et enfin, la détection des fraudes.
Les outils de data mining représentent l’élément de base autour desquels la connaissance du
client et la réalisation de ses applications se construisent. Donc, qu’est-ce que le data mining ?
Comment peut-on le mettre en œuvre en assurance ? Quelles sont ses techniques ?
3
II. DATA MINING : PROCESSUS ET TECHNIQUES
Le terme data mining a pris son essor depuis 1995 ; mais les techniques qu’il utilise ont
plusieurs décennies. Le traitement des données à travers le data mining est un processus de
trois étapes fondamentales. Un ensemble de techniques empruntées à l’intelligence artificielle
pourrait y intervenir.
II-1. Processus de data mining
.
Michel Jambu définie le data mining comme suit : « Le data mining est un processus d’analyse
fine et intelligente des données détaillées, interactif et itératif, permettant aux managers
d’activités utilisant ce processus de prendre des décisions et de mettre en place des actions sur
mesure dans l’intérêt de l’activité dont ils ont la charge et de l’entreprise pour laquelle ils
travaillent ».
Ainsi, le data mining est né de :
l’évolution des systèmes de gestion des bases de données vers l’informatique décisionnelle
avec l’apparition des entrepôts de données (Data Warehouse).
de plus en plus, du recours des entreprises à la constitution de giga bases de données.
Développement de la Gestion de la Relation Client (CRM) qui représente la tendance
actuelle vers un marketing orienté client au lieu de marketing produit.
Progrès réalisés dans le domaine de l’intelligence artificielle en matière d’algorithme
d’apprentissage et de règles d’extraction de connaissances.
Ce processus suit trois étapes : exploration, construction d’un modèle ou définition d’une
structure, et validation / vérification.
En outre, la mise en place d’un projet data mining suppose une très bonne compréhension des
objectifs de l’application. Il s’agit, en fait, de bien décomposer le problème en sous-
problèmes, et de récupérer, éventuellement, des données supplémentaires jugées nécessaires
pour la solution. Cette décomposition du problème permet de connaître sa nature (exploration,
création de modèles, identification de modèles, etc.). Un projet de data mining est une gestion
par les résultats, autrement dit, l’évaluation des résultats obtenus est cruciale pour sa réussite.
Donc, il faudrait choisir la technique convenable pour que le résultat corresponde aux attentes.
Après la fixation des objectifs, la première étape de data mining consistera en l’exploration des
données.
4
II-1-1. Exploration
Cette étape comporte plusieurs opérations. Ces opérations ont trait à la préparation des données
pour qu’elles soient exploitables.
En effet, la recherche des données (collecte) consiste en un inventaire des sources de données
(comment combiner des formats différents). Ensuite, un ensemble d’attributs sera sélectionné
par un expert (ex : souscripteur, risk manager, etc.). De plus, ces données doivent être
nettoyées (suppression, remplacement, contournement des valeurs manquantes) et modifiées
(homogénéisation et normalisation) le cas échéant.
II-1-2. Construction d’un modèle
Le data mining est souvent considéré comme un mélange des statistiques, d’intelligence
artificielle et de recherche de base de données. Il s’appuie sur l’intégration de tests statistiques
et d’algorithmes de choix des meilleures techniques de modélisation en fonction des
caractéristiques de chaque cas. La constitution d’un modèle en data mining repose sur la nature
du problème (discrimination, clustering, etc.). Pour ce faire, des bases de test et
d’apprentissage seront mobilisées pour qu’elles soient utilisées par l’algorithme choisi.
L’apprentissage peut être supervisé (prédictif) ou non supervisé (exploratoire). Cependant, la
data mining ne traite pas d’estimation et de test de modèles préspécifiés, mais la découverte de
structures inconnues jusqu’ici par le biais d’un processus de recherche algorithmique
d’exploration de modèles linéaire et non linéaire, explicite et implicite.
II-1-3. Validation / vérification du modèle
Le modèle doit être évalué et validé qualitativement (présentation graphique ou textuelle des
résultats) et quantitativement (affectation d’un indice de confiance eaux résultats obtenus).
Généralement, ces modèles sont validés par le test, c’est – à dire à l’aide d’un autre
échantillon appelé « échantillon test et / ou validation ».
En résumé, pour mener à bien un projet de data mining dans une entreprise de banque ou
d’assurance, il es nécessaire de :
identifier et analyser les besoins en vue de fixer des objectifs ;
obtenir (collecter et traiter) des données représentatives du problème étudié ;
identifier le contexte de l’apprentissage ;
sélectionner les attributs et réduire leurs dimensions ;
choisir un algorithme et / ou un espace d’hypothèses ;
choisir un modèle résultant et valider les performances de la méthode utilisée.
5
II-2. Méthodes de data mining
Il existe plusieurs méthodes pour effectuer une analyse de type data mining. En fait,
l’extraction de connaissances peut être sous forme d’extraction d’association, de ressemblances
(ou de similitudes), ou sous forme d’apprentissage automatique.
II-2-1. Extraction d’associations
Une association peut se présenter au niveau des valeurs (implication) ou au niveau des attributs
(corrélations, dépendances). Notons que l’implication est une relation très forte entre deux
valeurs, ce qui est rare en réalité. C’est pourquoi la recherche tend vers l’étude des
dépendances qui caractérisent les attributs.
II-2-2. Ressemblance / Similitude
La ressemblance entre deux objets décrits linéairement est l’ensemble des points communs à
leurs descriptions. On parle aussi de similitude entre deux objets qui se ressemblent. Parmi les
méthodes de regroupement par ressemblance : les K- moyennes, le voisinage dense et
l’agglomération.
II-2-3. Apprentissage automatique
Cette méthode constitue un outil efficace permettant de faire face à la croissance exponentielle
du volume de l’information et d’offrir aux utilisateurs des moyens d’accès faciles aux
informations. Ainsi, l’apprentissage automatique apporte un gain important de productivité et
de réactivité dans l’analyse. En effet, il offre la possibilité aux utilisateurs de réaliser leurs
propres modèles de manière autonome. Enfin, les techniques qui se basent sur l’apprentissage
automatique sont relativement nombreuses :
Agents intelligents ;
Arbre de décision ;
Moteur d’association ;
Algorithmes génétiques ;
Réseaux bayésiens ;
Réseaux de neurones ;
Ensembles approximatifs ;
Logique floue.
Nous limiterons notre présentation à celles qui s’appliquent le plus souvent en assurance, tel
qu’il est connu dans la littérature assurantielle, et prouvé dans plusieurs expériences
d’entreprises d’envergure mondiale.
1 / 21 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !