Approche data mining pour la gestion de la relation client

SETIT 2007
4th International Conference: Sciences of Electronic,
Technologies of Information and Telecommunications
March 25-29, 2007 – TUNISIA
Approche data mining pour la gestion de la relation
client : application à la personnalisation d'un site de
e-commerce
h. NECIR *, h. DRIAS **
* Université des Sciences et de la Technologie Houari Boumediene,
Laboratoire de Recherche en Intelligence Artificielle (LRIA), Département d’informatique, Faculté
d’Electronique et d’informatique.
USTHB, El Alia BP 32, Bab Ezzouar, Alger, Algérie
** Université des Sciences et de la Technologie Houari Boumediene,
Laboratoire de Recherche en Intelligence Artificielle (LRIA), Département d’informatique, Faculté
d’Electronique et d’informatique
USTHB, El Alia BP 32, Bab Ezzouar, Alger, Algérie
Abstract: Actuellement, avec les nouvelles contraintes liées au développement important d’Internet, des services en
lignes et de l’intensification de la concurrence, il est économiquement moins cher pour une entreprise de conserver et de
fidéliser sa clientèle que de chercher à élargir ses parts de marché par une politique conquérante.
Cependant, établir une démarche CRM efficace, ne peut être envisagée que sous forme d'un ensemble d'actions
coordonnées au service d’objectifs précis et concrets à atteindre.
Ainsi, face à ce champs de prospection immense, beaucoup de questions restent posées : quelles stratégies doit on
adopter dans notre relation avec le e-client et quelles sources de création de valeur peut-on actionner dans une
démarche CRM?
Dans cet article, on s’intéresse à ces problématiques et en particulier à la personnalisation de la relation client comme
principal facteur de la fidélité à un site e-commerce.
Pour atteindre ces objectif, on adoptera une démarche e-CRM, utilisant des techniques data mining. Ceci sera appliqué à
la personnalisation d'un site e-commerce dont la teneur et la structure sera dynamiquement réorganisée suivant le
comportement d'achat et les centres d’intérêt des différents clients.
Key words: CRM, Data mining, e-commerce, e-CRM, fidélité client, personnalisation.
INTRODUCTION
Actuellement, une bonne gestion d’entreprise ne
peut se faire sans une meilleure compréhension de la
relation client par le biais d’une meilleure
connaissance des comportements de ce dernier.
Pour atteindre cet objectif, deux atouts existent : le
commerce électronique et le Data mining.
Le commerce électronique permet d’utiliser les
transactions électroniques afin de collecter une grande
masse d’informations. Cette dernière sera exploitée et
analysée grâce au data mining afin de y découvrir de
l’information implicite et utile.
Cette capacité permettra à l’entreprise une rapidité
de prise de décision et un véritable pilotage de la
fonction marketing, grâce à une connaissance
beaucoup plus étoffée et fine du comportement du
client.
Dans ce travail, il s’agit d’intégrer, en plus de la
conception du site e-commerce, un module de data
mining qui permet d’extraire des informations
pertinentes à partir de l’ensemble des transactions
effectuées par les clients.
Ces connaissances déduites du gisement de
données vont êtres exploités pour personnaliser
dynamiquement la teneur et la structure du site de
vente qui sera réorganisée suivant le comportement de
des différents types de clients.
- 1 -
SETIT2007
Dans cet objectif, notre travail sera organisé
comme suit :
Après une introduction générale, nous nous
intéresserons à définir le CRM et son importance dans
la fidélisation du client.
Nous établirons, par la suite, les préalables au
succès d'une démarche CRM. Ceci nous permettra
d'aborder des notions importante tel que : le e-
commerce, le data warehouse et le data mining.
Nous définirons les différentes étapes d'une
démarche CRM et ensuite nous expliciterons la
démarche qu'on a adoptée.
Nous présenterons quelques interfaces de notre site
et enfin, une conclusion et des perspectives d'études
clôturent ce travail.
1. CRM et fidélisation du client
La gestion de la relation client connue sous le nom
de CRM (Customer Relationship Management), est
définit [NEW 00] comme "un processus de
modification du comportement du client, cherchant à
apprendre à partir de chaque interaction avec ce
dernier. Le CRM vise également à traiter le client de
manière individualisée et à renforcer le lien existant
entre celui-ci et l'entreprise".
Ce processus interactif a pour objectif de réaliser
l’équilibre optimum entre les investissements de
l’entreprise et la satisfaction des besoins des clients
afin de générer un maximum de profit [ECC 05].
Les revenus de l'entreprise sont améliorés, d’une
part, par une réduction des coûts en utilisant des
médias plus appropriés et moins chers, et d’autre part
par un meilleur ciblage des actions marketing qui
induisent un retour sur investissement supérieur où
encore grâce à la diminution des plaintes des clients
qui sont davantage satisfaits.
Dans cette stratégie, l’entreprise vise à optimiser
ces performances commerciales en se concentrant sur
le long terme. Elle peut ainsi même sacrifier des
avantages de court terme dans l’espoir d’une
permanence sécurisante au sein de la relation [ABI
02].
Le CRM met l’accent sur la fidélisation du client
afin d’augmenter ces parts en s'attachant à satisfaire
ces besoins. Cette fidélité étant conçue comme la plus
importante sinon la seule source de performance de
l’entreprise à long terme [HES 94], [JON 95].
Cette fidélisation du client passe par sa satisfaction
vis-à-vis des attributs des produits ou services et des
informations échangées [SPR 96] et se traduira
toujours par une stratégie de valeur bâtie sur une
confiance mutuelle [REI 00] qui influencera
positivement son engagement pour maintenir une
relation durable [DWY 87] ; [MOO 93] ; [MOR94] ;
[GAR 99].
Par ailleurs, grâce à la communication personnelle
et au dialogue permanent avec le client, la
connaissance qu’a l’entreprise de celui-ci est accru et
les besoins en études de marché sont réduits.
Au-delà de l’augmentation du montant de leurs
achats, les clients fidèles recommandent leur
fournisseur à d’autres clients potentiels, ce qui
représente une nouvelle source de profit. Ce
phénomène est encore amplifié et accéléré sur Internet
grâce aux communautés virtuelles [JAL 97]; [REI 00].
On distingue trois grandes catégories d'outils CRM
[CIN 02] :
Les outils d'automatisation des forces de ventes,
qui permettent le suivi des clients et prospects.
Les outils qui définissent les segmentations et
typologies des clients et orchestrent les
campagnes.
Les outils pour le suivi client après vente.
Actuellement, on voit l'émergence du e-CRM qui
est la gestion de la relation client utilisant le canal
Internet.
Par rapport au CRM classique, cette approche peut
offrir des opportunités bien plus diversifiées, et surtout
à moindre coût, pour améliorer la commercialisation
d'un produit et fidéliser la clientèle.
Grâce à Internet, les informations relatives à la
clientèle sont désormais accessibles à l'ensemble des
structures de l'entreprise avec différents niveaux
d'interaction entre l'entreprise et le client.
Dans cette étude, nous emploierons le mot CRM et
e-CRM de façon indifférente puisqu'on considère que
les deux concepts sont en somme une même démarche
avec seulement des différences relatives aux
possibilités, spécificités et exigences de l’outil
Internet.
2. Les préalables pour un CRM efficace
Les projets CRM ont, actuellement, des
obligations de rentabilité et de pérennité de plus en
plus importantes. Ils doivent s’intégrer le plus possible
au système d’information de l’entreprise.
Un projet CRM ne peut donc s’improviser et doit
toujours justifier le budget qui lui est alloué en
démontrant sa rentabilité et sa capacité à évoluer tout
en gardant sa cohérence.
Face à ces enjeux de taille, la définition d’objectifs
quantifiés précis et étalés dans le temps et auxquels
sont associés des indicateurs de performance
permettra de lever les doutes et les incompréhensions
sur la viabilité et l'utilité de chaque étape de
construction. Ceci passe par le respect des principes et
objectifs financiers de l’entreprise ainsi que par des
choix technologiques adéquat.
Actuellement, le commerce électroniques, les
entrepôts de donnée et le data mining sont les trois
technologies qui ont le rôle le plus fondamental dans
une démarche CRM.
- 2 -
SETIT2007
2.1. Le commerce électronique
Le commerce électronique [KAL 97], [OCD 98],
[OCD 99] permet l’abondance de l'information
concernant les clients, les produits et services. Ceci
permet d'entreprendre une démarche CRM efficace en
agissant sur les fonctionnalités relatives à la forme de
la relation et son contenu [CAD 02] en offrant une
flexibilité sans précédent dans la vente.
Ainsi la fidélisation des clients s'accroît pour les
sites e-commerce où le coût d’acquisition d’un client
est très élevé. « Without the glue of loyalty, even the
best-designed e-business model will collapse. » [REI
00].
2.2. L'entrepôt de données (data warehouse)
Un entrepôt de données permet de recueillir et de
centraliser les données à analyser sous forme d'une
collection orientées sujet, intégrées, non volatiles et
historisées, organisées pour le support d'un processus
d'aide à la décision [INM 92]. Pour cela, les données
qui sont extraites de toutes les sources vont être, au
préalable, transformées pour consolider correctement
l'entrepôt de données.
Les différences qui distinguent un entrepôt de
données d'un système opérationnel sont à la fois
d'ordre conceptuel, car l'objectif est différent et d'ordre
technique, car la structure et les processus sont
différents. Ainsi, le modèle entité/association sur
lequel repose la conception des bases de donnée est
inadapté à la conception d’un entrepôt de données.
[KIM 97]. Ce dernier est typiquement modélisé par
des modèles multidimensionnels (appelés aussi cube
de données).
Il existe deux approches pour construire ces
modèles multidimensionnels. L'approche MOLAP
(Multidimensional MOLAP) et l'approche ROLAP
Relational OLAP) qui utilise un SGBD relationnel
pour stocker le cube de donnée. [BEL 00]
2.3. Le data mining
Le data mining est définit comme “un processus
d’aide à la décision où les utilisateurs cherchent des
modèles d’interprétation dans les données ” [PAR 96].
Il constitue ainsi le meilleur moyen permettant la mise
à jour de nouvelles corrélations, tendances et modèles
significatifs formant les connaissances cachées.
Les analyses qui découlent du data mining, nous
permettent soit de corroborer une analyse prévisible,
par des méthodes d'estimations, classifications ou
prédictions. Soit elles mettent en évidence des liens à
priori sans aucun rapport, en identifiant les formes de
données qui pourraient être significatives (cas des
achats simultanés dans une grande surface).
Dans le cadre de ce travail, on a appliqué deux
grandes fonctions du data mining.
2.3.1. Les règles d'associations
Cette technique appelée aussi panier de la
ménagère, permet d'étudier ce que les clients achètent
de manière à savoir qui ils sont et pourquoi ils font
certains achats et quels produits sont le plus souvent
achetés ensemble
Elle est l'une des techniques data mining les plus
utilisée actuellement, du fait de la généricité de la
structure des transactions auxquelles elle s'applique et
de la grande utilité des règles d'inférence qu'elle
découvre. [CHA 98]
Les règles générées et qui sont de la forme "Si
action1 ou condition alors action2", sont claires et
explicites et sont assorties de deux critères d'intérêt :
Le support et la confiance de l'association.
Le premier critère mesure la représentativité des
cas observés en calculant le nombre de fois où
l'association est respectée par rapport au pourcentage
de la population totale, alors que le second mesure la
vérification de la probabilité conditionnelle dans la
sous-population concernée par la condition de la règle.
Pour la règle par exemple « si les produits 1 et 2
ont été choisis alors achat du produit 3 », ", le niveau
de confiance est le nombre de fois où la règle « les
produits 1 et 2 ont été choisis » est respectée. Le
support est par exemple « 75% des individus ont
choisi les produits 1 et 2 ».
Le but de l'analyse du panier de la ménagère est
d'identifier des règles "vraies" dans la population
considérée. Une règle est déclarée "vraie" si elle
présente à la fois un support et une confiance
supérieure à un seuil déterminé.
Dans le cas où la mesure d'intérêt choisie par
l'utilisateur est la fréquence, relativement à un seuil
fixé à priori, alors les connaissances recherchées dans
la base de données s'appellent les motifs fréquents.
2.3.1.1 Extraction des itemsets
fermés fréquents
L'approche d'extraction itemsets fermés fréquents
[PAS 00], [PAS 99] permet de ne générer qu’un sous
ensemble réduit de règles associatives du point de vue
de la taille tout en évitant toute perte du point de vue
de la connaissance [BAS 00], [STU 01], [BEN 03],
[GOD 89]. Elle peut être définie par les hypothèses
suivantes :
Etant donné un ensemble I d'articles, ou item,
chaque transaction de la base de données est un sous
ensemble de I ou itemset. La structure des transactions
peut également être perçue comme un tableau de
booléens où chaque case correspond à la présence ou
non d'un article dans la transaction.
Si la base de données contient des valeurs réelles
plutôt que booléennes, il est d'ailleurs possible de se
ramener au cas booléen par la détermination
automatique d'intervalles de valeurs pour chaque
produit [SRI 96]. Chaque valeur de la base de données
est associée à un booléen indiquant si la valeur
appartient à l'intervalle ou pas.
Ainsi, les algorithmes d'extraction d'itemsets
fermés cherchent des relations causales entre itemsets.
- 3 -
SETIT2007
Une règle d'inférence qui s'écrit pour les
itemsets I et J, a pour signification que "la plupart des
transactions qui contiennent les articles de I
contiennent également les articles de J". [CHA 98]
JI
On associe généralement à une règle de ce type un
support, correspondant au nombre de transactions qui
vérifient cette règle, (c'est à dire les transactions qui
contiennent ), et une confiance, qui évalue la
probabilité qu'une transaction qui contient I contienne
aussi J. [CHA 98]
JI
{
}
))(
(
)(sup)(sup
tJI
BDtntransactioCard
JIportJIport
==
(1)
)(
(
)sup
sup
)( Iport JIport
JIconfiance
= (2)
Dans cette étude, nous avons utilisé l’algorithme
d'extraction des itemsets fermés fréquents close [PAS
99], [PAS 00].
Le fonctionnement de l’algorithme débute par la
construction d'un contexte d'extraction qui est un
tableau de transaction/produits où nous mettons un 1,
la où le produit figure dans la transaction, sinon un 0.
Figure 1. Contexte d'extraction
L'algorithme commence par initialiser l'ensemble
des 1-générateurs avec la liste des 1-itemsets du
contexte. On calcul le support de chaque 1-
générateurs (la fréquence d’apparition de chaque 1-
générateurs dans le contexte). On supprime les non
fréquents (dont le support est strictement inférieur à
minsup). On calcul ensuite leurs fermés en effectuant
une intersection des « intensions » de toutes les
transactions qui possèdent ce motif.
Si on considère, le contexte d'extraction donné à la
fig1 avec un support minimum minsup=2/7, on
obtiendra :
Figure 2. Tableau des 1-generateurs et leurs fermés
L’algorithme exécute ensuite un ensemble
d'itérations. Durant chaque itération k de l'algorithme,
un ensemble de k-générateurs candidats est considéré.
Chaque élément de cet ensemble est constitué de trois
éléments : le k-générateur candidat, sa fermeture, qui
est un itemset fermé candidat, et leur support.
À la fin de l'itération k, l'algorithme stocke un
ensemble contenant les k-générateurs fréquents, leurs
fermetures, qui sont des itemsets fermés fréquents, et
leurs supports. Durant chaque itération k, la fermeture
de tous les k-générateurs ainsi que leur support sont
calculés. La détermination des fermetures des
générateurs est basée sur la propriété que la fermeture
d'un itemset est égale à l'intersection de tous les objets
du contexte le contenant et dont le décompte fournit le
support du générateur qui est identique au support de
sa fermeture.
Tous les k-générateurs fréquents, dont le support
est supérieur ou égal à minsup, ainsi que leur
fermeture sont sauvegardés, les autres (k-motifs non
fréquents et les k-motifs non générateurs) sont
supprimés (le produit (Webcam) n’est pas pris car son
support est < 2/7). L'itemset fermé (Portable, Souris)
est contenue dans la fermeture de portable alors on
l’élimine.
Ainsi, l'ensemble des (k+1)-générateurs candidats
de l'itération suivante, est construit en joignant les k-
générateurs fréquents de l'ensemble des itemsets
fermés fréquents identifiés durant l'itération k. Les
itérations cessent lorsque aucun nouveau générateur
ne peut être créé et l'algorithme s'arrête alors.
Figure 3. Tableau des 2-generateurs et leurs fermés
Tous les 2-itemsets dans la fig 5 sont fréquents,
donc nous les conservons tous et nous passons à la
génération des 3-itemsets fréquents.
Les deux 3-itemsets Portable, Clavier, souris et
Portable, Clavier, Imprimante sont inclues dans un 2-
itemsets fermé fréquent Portable, clavier, souris,
imprimante trouvé précédemment. Close s’arrête et
l’ensemble des 3-générateurs est vide.
3. Les étapes d'une démarche CRM
La mise en œuvre d'une politique CRM consiste
avant tout à modifier les processus opératoires au sein
de l'entreprise et à mettre le client au premier rang des
priorités.
En général, une approche CRM repose, sur un
processus en 4 étapes [PEP 99} :
3.1. Identification du client
L'identification du client concerne en plus des
informations personnelles (nom, age, adresse,….), les
relations du client et ces désirs.
Ceci englobe l’historique du client et ces
- 4 -
SETIT2007
consommations (les produits et les services achetés)
ainsi que les caractéristiques des produits achetés.
L'identification du client se fait soit de manière
transparente grâce aux données collectées, à l'insu de
l'internaute, de par sa simple navigation par
l'utilisation des informations relatives à l'adresse IP, le
clickstream (séquence de clics), les cookies,
l'identifiant de session,…; ou bien l'identification se
fait de manière explicite et volontaire, et dans se cas il
y a nécessité d'avoir l’apport volontaire de
l’utilisateur. Ceci est possible notamment
par l'utilisation d'un pseudonyme et d'un mot de passe
pour chaque client ainsi que par l'utilisation des
différents formulaires que le client remplis sur le site.
L'identification du client permet de déduire les
centres d’intérêt de ce dernier et surtout d’éviter de lui
proposer des offres inadaptées.
3.2. La différenciation des besoins
La différenciation des besoins des clients permet
d'adapter les produits ou les services et de les
hiérarchiser par ordre de priorité pour chacun d'eux.
Elle consiste à distinguer à partir de critères
objectifs tels que les caractéristiques d'achat,
fréquence de visites sur le site, les préférences
affichées, ….. , les besoins d'une communauté ou
segment de clients qui peuvent être prédéfini ou non.
3.2.1. La segmentation
La segmentation est le découpage d’un ensemble
de clients en un nombre assez réduit de sous-
ensembles homogènes, que l’on appelle segments;
selon un ou plusieurs critères. Chaque critère doit être
pertinent dont le sens où il doit être fortement lié aux
comportements et attitudes des clients à l’égard des
produits auxquels on s’intéresse, facilement
mesurable, avec une valeur opératoire pour
l’entreprise pour orienter ses efforts en ce qui
concerne sa relation avec le client. [LAC 02]
Parmi les critères de segmentation les plus
couramment retenus par les entreprises, on peut citer
le potentiel d’achat, la part de marché, la fidélité et le
comportement et la culture.
Les segments retenus doivent être suffisamment
différents les uns des autres pour justifier des
politiques CRM distinctes.
Ainsi, on distingue traditionnellement les
approches de segmentation suivantes [BRU 02] :
Segmentation a priori. Cette approche consiste à
diviser les clients en groupes homogènes selon leurs
attributs basiques (familles avec enfants, avec
voiture,...).
Segmentation supervisée. Cette approche de
segmentation consiste à déterminer d’abord quels sont
les groupes auxquels on souhaite aboutir avant de
réaliser cette segmentation.
Segmentation non supervisée. Cette
segmentation part de la recherche de caractéristiques
communes entre les clients pour aboutir à des
classifications qui ne se sont pas connues au départ.
3.3. L’interaction avec le client
L'interactivité avec le client est une notion clef
dans une démarche CRM car elle permet au client de
savoir que l'entreprise s'intéresse à lui et à ses
réactions.
L'interactivité est une occasion d'apprendre à
mieux connaître les valeurs, les besoins, les centres
d'intérêts et les priorités du client en établissant un
dialogue avec lui.
Les centres de contact constituent le meilleur et le
plus efficace moyen pour interagir avec le client.
Plusieurs formes de communication peuvent être mise
en oeuvre : e-mail, téléphone, chat,…. En fonction de
l'entreprise, il convient de déterminer lesquelles
privilégier avant et après la vente.
Les newsletters constituent aussi un moyen
efficace pour tenir au courant le client des dernières
nouveautés et possibilités offertes par le site de vente.
Un forum de discussion ouvert à tous ou privé
(connexion par identifiant et mot de passe) peut
rendre le site plus interactif et permet aux visiteurs du
site de communiquer et de débattre en eux directement
sur le site sur des sujets qui doivent apporter une réelle
valeur ajoutée.
La mise en place sur le site de jeux promotionnels
tel que les loteries ou des concours permet aussi
d'augmenter le trafic et d'attirer et de fidéliser les
clients.
Enfin, un site e-commerce peut proposer des
sondages et des enquêtes aux prés de ces visiteurs en
leurs posant des questions liées à leurs satisfactions
vis-à-vis de l'activité du site et des services offerts.
Ceci peut constituer une vraie mine de connaissance
supplémentaire.
3.4. La personnalisation
R. Kimball et R. Merz1 [KIM 00], définissent la
personnalisation pour un site e-commerce comme "la
livraison au visiteur du site d'un contenu façonné
spécifiquement pour tenter cet individu. La
personnalisation désigne aussi la capacité offerte à un
visiteur de site Web de définir explicitement des
préférences de consultation''.
Le Gartner Group définit la personnalisation
comme "toute interaction avec le client dans laquelle
le message, l'offre ou le contenu a été taillé sur mesure
pour un client ou groupe de clients spécifiques".
Ainsi, à partir de ces deux définitions, on peut dire
que la personnalisation d'un site e-commerce
permettra au client d’avoir l'impression qu'il peut
presque toujours trouver et sans difficulté ce qu'il
recherche.
Cette personnalisation et réorganisation dynamique
de la teneur et de la structure du site et de l’offre selon
- 5 -
1 / 12 100%

Approche data mining pour la gestion de la relation client

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !