Approche data mining pour la gestion de la relation client

Téléchargement

SETIT 2007

4th International Conference: Sciences of Electronic,

Technologies of Information and Telecommunications

March 25-29, 2007 – TUNISIA

Approche data mining pour la gestion de la relation

client : application à la personnalisation d'un site de

e-commerce

h. NECIR *, h. DRIAS **

* Université des Sciences et de la Technologie Houari Boumediene,

Laboratoire de Recherche en Intelligence Artificielle (LRIA), Département d’informatique, Faculté

d’Electronique et d’informatique.

USTHB, El Alia BP 32, Bab Ezzouar, Alger, Algérie

[email protected]

** Université des Sciences et de la Technologie Houari Boumediene,

Laboratoire de Recherche en Intelligence Artificielle (LRIA), Département d’informatique, Faculté

d’Electronique et d’informatique

USTHB, El Alia BP 32, Bab Ezzouar, Alger, Algérie

[email protected]

Abstract: Actuellement, avec les nouvelles contraintes liées au développement important d’Internet, des services en

lignes et de l’intensification de la concurrence, il est économiquement moins cher pour une entreprise de conserver et de

fidéliser sa clientèle que de chercher à élargir ses parts de marché par une politique conquérante.

Cependant, établir une démarche CRM efficace, ne peut être envisagée que sous forme d'un ensemble d'actions

coordonnées au service d’objectifs précis et concrets à atteindre.

Ainsi, face à ce champs de prospection immense, beaucoup de questions restent posées : quelles stratégies doit on

adopter dans notre relation avec le e-client et quelles sources de création de valeur peut-on actionner dans une

démarche CRM?

Dans cet article, on s’intéresse à ces problématiques et en particulier à la personnalisation de la relation client comme

principal facteur de la fidélité à un site e-commerce.

Pour atteindre ces objectif, on adoptera une démarche e-CRM, utilisant des techniques data mining. Ceci sera appliqué à

la personnalisation d'un site e-commerce dont la teneur et la structure sera dynamiquement réorganisée suivant le

comportement d'achat et les centres d’intérêt des différents clients.

Key words: CRM, Data mining, e-commerce, e-CRM, fidélité client, personnalisation.

INTRODUCTION

Actuellement, une bonne gestion d’entreprise ne

peut se faire sans une meilleure compréhension de la

relation client par le biais d’une meilleure

connaissance des comportements de ce dernier.

Pour atteindre cet objectif, deux atouts existent : le

commerce électronique et le Data mining.

Le commerce électronique permet d’utiliser les

transactions électroniques afin de collecter une grande

masse d’informations. Cette dernière sera exploitée et

analysée grâce au data mining afin de y découvrir de

l’information implicite et utile.

Cette capacité permettra à l’entreprise une rapidité

de prise de décision et un véritable pilotage de la

fonction marketing, grâce à une connaissance

beaucoup plus étoffée et fine du comportement du

client.

Dans ce travail, il s’agit d’intégrer, en plus de la

conception du site e-commerce, un module de data

mining qui permet d’extraire des informations

pertinentes à partir de l’ensemble des transactions

effectuées par les clients.

Ces connaissances déduites du gisement de

données vont êtres exploités pour personnaliser

dynamiquement la teneur et la structure du site de

vente qui sera réorganisée suivant le comportement de

des différents types de clients.

- 1 -

SETIT2007

Dans cet objectif, notre travail sera organisé

comme suit :

Après une introduction générale, nous nous

intéresserons à définir le CRM et son importance dans

la fidélisation du client.

Nous établirons, par la suite, les préalables au

succès d'une démarche CRM. Ceci nous permettra

d'aborder des notions importante tel que : le e-

commerce, le data warehouse et le data mining.

Nous définirons les différentes étapes d'une

démarche CRM et ensuite nous expliciterons la

démarche qu'on a adoptée.

Nous présenterons quelques interfaces de notre site

et enfin, une conclusion et des perspectives d'études

clôturent ce travail.

1. CRM et fidélisation du client

La gestion de la relation client connue sous le nom

de CRM (Customer Relationship Management), est

définit [NEW 00] comme "un processus de

modification du comportement du client, cherchant à

apprendre à partir de chaque interaction avec ce

dernier. Le CRM vise également à traiter le client de

manière individualisée et à renforcer le lien existant

entre celui-ci et l'entreprise".

Ce processus interactif a pour objectif de réaliser

l’équilibre optimum entre les investissements de

l’entreprise et la satisfaction des besoins des clients

afin de générer un maximum de profit [ECC 05].

Les revenus de l'entreprise sont améliorés, d’une

part, par une réduction des coûts en utilisant des

médias plus appropriés et moins chers, et d’autre part

par un meilleur ciblage des actions marketing qui

induisent un retour sur investissement supérieur où

encore grâce à la diminution des plaintes des clients

qui sont davantage satisfaits.

Dans cette stratégie, l’entreprise vise à optimiser

ces performances commerciales en se concentrant sur

le long terme. Elle peut ainsi même sacrifier des

avantages de court terme dans l’espoir d’une

permanence sécurisante au sein de la relation [ABI

02].

Le CRM met l’accent sur la fidélisation du client

afin d’augmenter ces parts en s'attachant à satisfaire

ces besoins. Cette fidélité étant conçue comme la plus

importante sinon la seule source de performance de

l’entreprise à long terme [HES 94], [JON 95].

Cette fidélisation du client passe par sa satisfaction

vis-à-vis des attributs des produits ou services et des

informations échangées [SPR 96] et se traduira

toujours par une stratégie de valeur bâtie sur une

confiance mutuelle [REI 00] qui influencera

positivement son engagement pour maintenir une

relation durable [DWY 87] ; [MOO 93] ; [MOR94] ;

[GAR 99].

Par ailleurs, grâce à la communication personnelle

et au dialogue permanent avec le client, la

connaissance qu’a l’entreprise de celui-ci est accru et

les besoins en études de marché sont réduits.

Au-delà de l’augmentation du montant de leurs

achats, les clients fidèles recommandent leur

fournisseur à d’autres clients potentiels, ce qui

représente une nouvelle source de profit. Ce

phénomène est encore amplifié et accéléré sur Internet

grâce aux communautés virtuelles [JAL 97]; [REI 00].

On distingue trois grandes catégories d'outils CRM

[CIN 02] :

• Les outils d'automatisation des forces de ventes,

qui permettent le suivi des clients et prospects.

• Les outils qui définissent les segmentations et

typologies des clients et orchestrent les

campagnes.

• Les outils pour le suivi client après vente.

Actuellement, on voit l'émergence du e-CRM qui

est la gestion de la relation client utilisant le canal

Internet.

Par rapport au CRM classique, cette approche peut

offrir des opportunités bien plus diversifiées, et surtout

à moindre coût, pour améliorer la commercialisation

d'un produit et fidéliser la clientèle.

Grâce à Internet, les informations relatives à la

clientèle sont désormais accessibles à l'ensemble des

structures de l'entreprise avec différents niveaux

d'interaction entre l'entreprise et le client.

Dans cette étude, nous emploierons le mot CRM et

e-CRM de façon indifférente puisqu'on considère que

les deux concepts sont en somme une même démarche

avec seulement des différences relatives aux

possibilités, spécificités et exigences de l’outil

Internet.

2. Les préalables pour un CRM efficace

Les projets CRM ont, actuellement, des

obligations de rentabilité et de pérennité de plus en

plus importantes. Ils doivent s’intégrer le plus possible

au système d’information de l’entreprise.

Un projet CRM ne peut donc s’improviser et doit

toujours justifier le budget qui lui est alloué en

démontrant sa rentabilité et sa capacité à évoluer tout

en gardant sa cohérence.

Face à ces enjeux de taille, la définition d’objectifs

quantifiés précis et étalés dans le temps et auxquels

sont associés des indicateurs de performance

permettra de lever les doutes et les incompréhensions

sur la viabilité et l'utilité de chaque étape de

construction. Ceci passe par le respect des principes et

objectifs financiers de l’entreprise ainsi que par des

choix technologiques adéquat.

Actuellement, le commerce électroniques, les

entrepôts de donnée et le data mining sont les trois

technologies qui ont le rôle le plus fondamental dans

une démarche CRM.

- 2 -

SETIT2007

2.1. Le commerce électronique

Le commerce électronique [KAL 97], [OCD 98],

[OCD 99] permet l’abondance de l'information

concernant les clients, les produits et services. Ceci

permet d'entreprendre une démarche CRM efficace en

agissant sur les fonctionnalités relatives à la forme de

la relation et son contenu [CAD 02] en offrant une

flexibilité sans précédent dans la vente.

Ainsi la fidélisation des clients s'accroît pour les

sites e-commerce où le coût d’acquisition d’un client

est très élevé. « Without the glue of loyalty, even the

best-designed e-business model will collapse. » [REI

00].

2.2. L'entrepôt de données (data warehouse)

Un entrepôt de données permet de recueillir et de

centraliser les données à analyser sous forme d'une

collection orientées sujet, intégrées, non volatiles et

historisées, organisées pour le support d'un processus

d'aide à la décision [INM 92]. Pour cela, les données

qui sont extraites de toutes les sources vont être, au

préalable, transformées pour consolider correctement

l'entrepôt de données.

Les différences qui distinguent un entrepôt de

données d'un système opérationnel sont à la fois

d'ordre conceptuel, car l'objectif est différent et d'ordre

technique, car la structure et les processus sont

différents. Ainsi, le modèle entité/association sur

lequel repose la conception des bases de donnée est

inadapté à la conception d’un entrepôt de données.

[KIM 97]. Ce dernier est typiquement modélisé par

des modèles multidimensionnels (appelés aussi cube

de données).

Il existe deux approches pour construire ces

modèles multidimensionnels. L'approche MOLAP

(Multidimensional MOLAP) et l'approche ROLAP

Relational OLAP) qui utilise un SGBD relationnel

pour stocker le cube de donnée. [BEL 00]

2.3. Le data mining

Le data mining est définit comme “un processus

d’aide à la décision où les utilisateurs cherchent des

modèles d’interprétation dans les données ” [PAR 96].

Il constitue ainsi le meilleur moyen permettant la mise

à jour de nouvelles corrélations, tendances et modèles

significatifs formant les connaissances cachées.

Les analyses qui découlent du data mining, nous

permettent soit de corroborer une analyse prévisible,

par des méthodes d'estimations, classifications ou

prédictions. Soit elles mettent en évidence des liens à

priori sans aucun rapport, en identifiant les formes de

données qui pourraient être significatives (cas des

achats simultanés dans une grande surface).

Dans le cadre de ce travail, on a appliqué deux

grandes fonctions du data mining.

2.3.1. Les règles d'associations

Cette technique appelée aussi panier de la

ménagère, permet d'étudier ce que les clients achètent

de manière à savoir qui ils sont et pourquoi ils font

certains achats et quels produits sont le plus souvent

achetés ensemble

Elle est l'une des techniques data mining les plus

utilisée actuellement, du fait de la généricité de la

structure des transactions auxquelles elle s'applique et

de la grande utilité des règles d'inférence qu'elle

découvre. [CHA 98]

Les règles générées et qui sont de la forme "Si

action1 ou condition alors action2", sont claires et

explicites et sont assorties de deux critères d'intérêt :

Le support et la confiance de l'association.

Le premier critère mesure la représentativité des

cas observés en calculant le nombre de fois où

l'association est respectée par rapport au pourcentage

de la population totale, alors que le second mesure la

vérification de la probabilité conditionnelle dans la

sous-population concernée par la condition de la règle.

Pour la règle par exemple « si les produits 1 et 2

ont été choisis alors achat du produit 3 », ", le niveau

de confiance est le nombre de fois où la règle « les

produits 1 et 2 ont été choisis » est respectée. Le

support est par exemple « 75% des individus ont

choisi les produits 1 et 2 ».

Le but de l'analyse du panier de la ménagère est

d'identifier des règles "vraies" dans la population

considérée. Une règle est déclarée "vraie" si elle

présente à la fois un support et une confiance

supérieure à un seuil déterminé.

Dans le cas où la mesure d'intérêt choisie par

l'utilisateur est la fréquence, relativement à un seuil

fixé à priori, alors les connaissances recherchées dans

la base de données s'appellent les motifs fréquents.

2.3.1.1 Extraction des itemsets

fermés fréquents

L'approche d'extraction itemsets fermés fréquents

[PAS 00], [PAS 99] permet de ne générer qu’un sous

ensemble réduit de règles associatives du point de vue

de la taille tout en évitant toute perte du point de vue

de la connaissance [BAS 00], [STU 01], [BEN 03],

[GOD 89]. Elle peut être définie par les hypothèses

suivantes :

Etant donné un ensemble I d'articles, ou item,

chaque transaction de la base de données est un sous

ensemble de I ou itemset. La structure des transactions

peut également être perçue comme un tableau de

booléens où chaque case correspond à la présence ou

non d'un article dans la transaction.

Si la base de données contient des valeurs réelles

plutôt que booléennes, il est d'ailleurs possible de se

ramener au cas booléen par la détermination

automatique d'intervalles de valeurs pour chaque

produit [SRI 96]. Chaque valeur de la base de données

est associée à un booléen indiquant si la valeur

appartient à l'intervalle ou pas.

Ainsi, les algorithmes d'extraction d'itemsets

fermés cherchent des relations causales entre itemsets.

- 3 -

SETIT2007

Une règle d'inférence qui s'écrit pour les

itemsets I et J, a pour signification que "la plupart des

transactions qui contiennent les articles de I

contiennent également les articles de J". [CHA 98]

JI ⇒

On associe généralement à une règle de ce type un

support, correspondant au nombre de transactions qui

vérifient cette règle, (c'est à dire les transactions qui

contiennent ), et une confiance, qui évalue la

probabilité qu'une transaction qui contient I contienne

aussi J. [CHA 98]

JI ∪

{

}

))(

(

)(sup)(sup

tJI

BDtntransactioCard

JIportJIport

⊆∪

∈

=∪=⇒

(1)

)(

(

)sup

sup

)( Iport JIport

JIconfiance ∪

=⇒ (2)

Dans cette étude, nous avons utilisé l’algorithme

d'extraction des itemsets fermés fréquents close [PAS

99], [PAS 00].

Le fonctionnement de l’algorithme débute par la

construction d'un contexte d'extraction qui est un

tableau de transaction/produits où nous mettons un 1,

la où le produit figure dans la transaction, sinon un 0.

Figure 1. Contexte d'extraction

L'algorithme commence par initialiser l'ensemble

des 1-générateurs avec la liste des 1-itemsets du

contexte. On calcul le support de chaque 1-

générateurs (la fréquence d’apparition de chaque 1-

générateurs dans le contexte). On supprime les non

fréquents (dont le support est strictement inférieur à

minsup). On calcul ensuite leurs fermés en effectuant

une intersection des « intensions » de toutes les

transactions qui possèdent ce motif.

Si on considère, le contexte d'extraction donné à la

fig1 avec un support minimum minsup=2/7, on

obtiendra :

Figure 2. Tableau des 1-generateurs et leurs fermés

L’algorithme exécute ensuite un ensemble

d'itérations. Durant chaque itération k de l'algorithme,

un ensemble de k-générateurs candidats est considéré.

Chaque élément de cet ensemble est constitué de trois

éléments : le k-générateur candidat, sa fermeture, qui

est un itemset fermé candidat, et leur support.

À la fin de l'itération k, l'algorithme stocke un

ensemble contenant les k-générateurs fréquents, leurs

fermetures, qui sont des itemsets fermés fréquents, et

leurs supports. Durant chaque itération k, la fermeture

de tous les k-générateurs ainsi que leur support sont

calculés. La détermination des fermetures des

générateurs est basée sur la propriété que la fermeture

d'un itemset est égale à l'intersection de tous les objets

du contexte le contenant et dont le décompte fournit le

support du générateur qui est identique au support de

sa fermeture.

Tous les k-générateurs fréquents, dont le support

est supérieur ou égal à minsup, ainsi que leur

fermeture sont sauvegardés, les autres (k-motifs non

fréquents et les k-motifs non générateurs) sont

supprimés (le produit (Webcam) n’est pas pris car son

support est < 2/7). L'itemset fermé (Portable, Souris)

est contenue dans la fermeture de portable alors on

l’élimine.

Ainsi, l'ensemble des (k+1)-générateurs candidats

de l'itération suivante, est construit en joignant les k-

générateurs fréquents de l'ensemble des itemsets

fermés fréquents identifiés durant l'itération k. Les

itérations cessent lorsque aucun nouveau générateur

ne peut être créé et l'algorithme s'arrête alors.

Figure 3. Tableau des 2-generateurs et leurs fermés

Tous les 2-itemsets dans la fig 5 sont fréquents,

donc nous les conservons tous et nous passons à la

génération des 3-itemsets fréquents.

Les deux 3-itemsets Portable, Clavier, souris et

Portable, Clavier, Imprimante sont inclues dans un 2-

itemsets fermé fréquent Portable, clavier, souris,

imprimante trouvé précédemment. Close s’arrête et

l’ensemble des 3-générateurs est vide.

3. Les étapes d'une démarche CRM

La mise en œuvre d'une politique CRM consiste

avant tout à modifier les processus opératoires au sein

de l'entreprise et à mettre le client au premier rang des

priorités.

En général, une approche CRM repose, sur un

processus en 4 étapes [PEP 99} :

3.1. Identification du client

L'identification du client concerne en plus des

informations personnelles (nom, age, adresse,….), les

relations du client et ces désirs.

Ceci englobe l’historique du client et ces

- 4 -

SETIT2007

consommations (les produits et les services achetés)

ainsi que les caractéristiques des produits achetés.

L'identification du client se fait soit de manière

transparente grâce aux données collectées, à l'insu de

l'internaute, de par sa simple navigation par

l'utilisation des informations relatives à l'adresse IP, le

clickstream (séquence de clics), les cookies,

l'identifiant de session,…; ou bien l'identification se

fait de manière explicite et volontaire, et dans se cas il

y a nécessité d'avoir l’apport volontaire de

l’utilisateur. Ceci est possible notamment

par l'utilisation d'un pseudonyme et d'un mot de passe

pour chaque client ainsi que par l'utilisation des

différents formulaires que le client remplis sur le site.

L'identification du client permet de déduire les

centres d’intérêt de ce dernier et surtout d’éviter de lui

proposer des offres inadaptées.

3.2. La différenciation des besoins

La différenciation des besoins des clients permet

d'adapter les produits ou les services et de les

hiérarchiser par ordre de priorité pour chacun d'eux.

Elle consiste à distinguer à partir de critères

objectifs tels que les caractéristiques d'achat,

fréquence de visites sur le site, les préférences

affichées, ….. , les besoins d'une communauté ou

segment de clients qui peuvent être prédéfini ou non.

3.2.1. La segmentation

La segmentation est le découpage d’un ensemble

de clients en un nombre assez réduit de sous-

ensembles homogènes, que l’on appelle segments;

selon un ou plusieurs critères. Chaque critère doit être

pertinent dont le sens où il doit être fortement lié aux

comportements et attitudes des clients à l’égard des

produits auxquels on s’intéresse, facilement

mesurable, avec une valeur opératoire pour

l’entreprise pour orienter ses efforts en ce qui

concerne sa relation avec le client. [LAC 02]

Parmi les critères de segmentation les plus

couramment retenus par les entreprises, on peut citer

le potentiel d’achat, la part de marché, la fidélité et le

comportement et la culture.

Les segments retenus doivent être suffisamment

différents les uns des autres pour justifier des

politiques CRM distinctes.

Ainsi, on distingue traditionnellement les

approches de segmentation suivantes [BRU 02] :

Segmentation a priori. Cette approche consiste à

diviser les clients en groupes homogènes selon leurs

attributs basiques (familles avec enfants, avec

voiture,...).

Segmentation supervisée. Cette approche de

segmentation consiste à déterminer d’abord quels sont

les groupes auxquels on souhaite aboutir avant de

réaliser cette segmentation.

Segmentation non supervisée. Cette

segmentation part de la recherche de caractéristiques

communes entre les clients pour aboutir à des

classifications qui ne se sont pas connues au départ.

3.3. L’interaction avec le client

L'interactivité avec le client est une notion clef

dans une démarche CRM car elle permet au client de

savoir que l'entreprise s'intéresse à lui et à ses

réactions.

L'interactivité est une occasion d'apprendre à

mieux connaître les valeurs, les besoins, les centres

d'intérêts et les priorités du client en établissant un

dialogue avec lui.

Les centres de contact constituent le meilleur et le

plus efficace moyen pour interagir avec le client.

Plusieurs formes de communication peuvent être mise

en oeuvre : e-mail, téléphone, chat,…. En fonction de

l'entreprise, il convient de déterminer lesquelles

privilégier avant et après la vente.

Les newsletters constituent aussi un moyen

efficace pour tenir au courant le client des dernières

nouveautés et possibilités offertes par le site de vente.

Un forum de discussion ouvert à tous ou privé

(connexion par identifiant et mot de passe) peut

rendre le site plus interactif et permet aux visiteurs du

site de communiquer et de débattre en eux directement

sur le site sur des sujets qui doivent apporter une réelle

valeur ajoutée.

La mise en place sur le site de jeux promotionnels

tel que les loteries ou des concours permet aussi

d'augmenter le trafic et d'attirer et de fidéliser les

clients.

Enfin, un site e-commerce peut proposer des

sondages et des enquêtes aux prés de ces visiteurs en

leurs posant des questions liées à leurs satisfactions

vis-à-vis de l'activité du site et des services offerts.

Ceci peut constituer une vraie mine de connaissance

supplémentaire.

3.4. La personnalisation

R. Kimball et R. Merz1 [KIM 00], définissent la

personnalisation pour un site e-commerce comme "la

livraison au visiteur du site d'un contenu façonné

spécifiquement pour tenter cet individu. La

personnalisation désigne aussi la capacité offerte à un

visiteur de site Web de définir explicitement des

préférences de consultation''.

Le Gartner Group définit la personnalisation

comme "toute interaction avec le client dans laquelle

le message, l'offre ou le contenu a été taillé sur mesure

pour un client ou groupe de clients spécifiques".

Ainsi, à partir de ces deux définitions, on peut dire

que la personnalisation d'un site e-commerce

permettra au client d’avoir l'impression qu'il peut

presque toujours trouver et sans difficulté ce qu'il

recherche.

Cette personnalisation et réorganisation dynamique

de la teneur et de la structure du site et de l’offre selon

- 5 -

1 / 12 100%

Documents connexes

Séminaire CRM analytique et opérationnel

Comparez les logiciels de CRM

statistics seminar

traduction_modules_openerp

E-slamshop - Librairie musulmane

Consultant Marketing Client et CRM

CV en pdf

stage assistant marketing crm -h/f

offre de stage marketing relationnel/crm - toulouse

Stagiaire Data Analyst Popcarte

consultant(e)/chef de projet marketing h/f la mission les

M1 MARKETING ET CRM M2 DATA MINING ET RELATION CLIENT

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Approche data mining pour la gestion de la relation client

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Approche data mining pour la gestion de la relation client

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib