AVINASH KAUSHIK
Web Analytics 2.0
MESURER L’IMPACT DE VOTRE SITE WEB ET DES
RÉSEAUX SOCIAUX POUR OPTIMISER VOTRE ACTIVITÉ
ET RÉPONDRE AUX ATTENTES DE VOS VISITEURS
[ ]
Adapté de l’anglais par Tristan Kottelanne et Paul Durand Degranges
sous la supervision de Julien Coquet
© Groupe Eyrolles, 2011, pour la présente édition,
ISBN : 978-2-212-12801-7
8
Analyse de l’intelligence
concurrentielle
Dans le monde réel, collecter de l’intelligence concurrentielle reviendrait à engager du
personnel pour fouiller les poubelles de vos concurrents (c’est déjà arri!). Dans le monde
virtuel, des montagnes de données sont à portée de main, des sites référents aux destinations,
en passant par les mots-clés de recherche et les profils démographiques et psychographiques.
Et même si c’est trop beau pour être vrai, une bonne proportion de ces données est bel et bien
disponible gratuitement.
Les données d’intelligence concurrentielle peuvent améliorer radicalement votre processus de
prise de décision : vous bénéficiez d’un contexte supplémentaire sur vos propres perfor-
mances, vous pouvez explorer les tendances de l’industrie pour obtenir des éclaircissements
exploitables, et à terme, mieux appréhender vos concurrents dans l’environnement quasiment
exempt de frictions qu’est le Web.
Au sommaire
Sources, types et secrets des données IC
Analyse du trafic d’un site Web
Analyse de la recherche et des mots-clés
Identification du public et analyse de la segmentation
Pour faire simple, l’intelligence concurrentielle (IC) est l’analyse de données relatives à vos
concurrents, aux marchés verticaux ou à l’intégralité de l’écosystème Web. Par exemple,
AMD, le fabricant de microprocesseurs, peut recourir à des données d’intelligence concurren-
tielle pour comprendre le comportement de son concurrent direct Intel. En d’autres termes, il
s’agit de mesurer les taux de croissance des tendances des visiteurs ou d’identifier de bonnes
sources de trafic pour Intel, et d’utiliser ces informations pour nourrir la stratégie AMD. AMD
Web Analytics 2.0
220
peut également accéder aux données IC de toutes les entreprises de l’industrie des semi-
conducteurs, puis indexer les performances de son concurrent sur les siennes et identifier de
nouvelles opportunités.
Pendant longtemps, les seules possibilités pour obtenir des données d’intelligence concurren-
tielle sur le Web étaient des solutions telles qu’Alexa (une barre d’outils), comScore (un
panel) et Hitwise (partenariat avec les FAI). Si les données d’Alexa étaient gratuites, les deux
dernières solutions étaient coûteuses et les données qu’elles généraient n’étaient, par consé-
quent, pas accessibles au plus grand nombre. Ces deux dernières années, pourtant, une
myriade d’outils, tant payants que gratuits, sont arrivés sur le marché. Il s’agit notamment de
Compete, Insights for Search et Ad Planner chez Google, de certaines solutions spécialisées
telles que Wordtracker et Quantcast, ou encore d’autres fondées sur les alertes, notamment
Trackurl.
Sources, types et secrets des données IC
Vous devez comprendre comment les différentes données sont collectées afin de décider de la
meilleure manière de les exploiter. Navigateurs, moteurs de recherche, éditeurs et autres, tous
collectent des données IC sur différents supports. Par ailleurs, les outils IC collectent des
données d’une manière très différente de celle qu’emploie votre outil de Web Analytics.
C’est pour cela que je souhaite aborder un problème essentiel sur lequel pratiquement tout le
monde trébuche. Très enthousiasmé, vous vous jetez sur l’outil IC à l’allure alléchante et
prenez d’assaut l’URL de votre site Web. Lorsque les données reviennent, les chiffres ne
correspondent pas à ceux de votre outil de Web Analytics. Vous êtes troublé. Vous perdez votre
foi et abandonnez. Grave erreur...
À l’inverse des outils de Web Analytics, les outils IC n’ont aucun accès à votre site (ni à celui
de votre concurrent). Cette distinction fondamentale en matière de collecte de données
signifie que les deux sources sont isolées. Si les tendances présentent un aspect similaire, elles
ne sont jamais liées. Et c’est parfaitement normal !
Voici une analogie qui vous aidera à appréhender l’intelligence concurrentielle de façon opti-
male. Prenons un cas de mesure du nombre de clients qui entrent dans le supermarché voisin.
Utiliser des outils de Web Analytics tels que Coremetrics ou Yahoo! Web Analytics revient à
se poster à la porte et à compter le nombre de clients qui entrent. Une mesure assez précise.
Utiliser des outils IC, en revanche, revient à s’installer sur la lune et à compter, au moyen d’un
télescope, le nombre de clients qui franchissent la porte du supermarché. Les données que
vous collectez en vous plaçant à la porte du supermarché sont plus précises. Toutefois, vous
ne pourrez pas faire de même pour vos concurrents ; vous seriez expulsé en quelques
secondes.
Si vous souhaitez mesurer vos performances par rapport à celles de la concurrence, votre seul
choix reste l’outil IC. Et si les données ne sont jamais parfaites, elles sont suffisamment effi-
caces pour vous permettre de comprendre des tendances prépondérantes, d’identifier des
opportunités et de vous assurer que votre stratégie s’appuie sur vos performances et celles de
vos concurrents.
Aussi, avant de procéder à une analyse de l’intelligence concurrentielle, vous devez consacrer
un certain temps à comprendre comment les outils IC collectent des données. Assurez-vous
Analyse de l’intelligence concurrentielle
CHAPITRE 8 221
que les échantillons de données soient le moins biaisés possible et que le biais d’échantillon-
nage soit minimal (nous examinerons cet aspect en détail dans ce chapitre).
À présent, familiarisons-nous avec les méthodes de collecte des données d’intelligence
concurrentielle pour garantir que vous êtes prêt à faire un usage optimal de celles-ci. Dans ce
chapitre, j’aborderai ultérieurement la manière de les exploiter.
Données de barre d’outils
Les barres d’outils sont des modules complémentaires qui ajoutent des fonctions supplémen-
taires aux navigateurs Web, telles qu’un accès facilité aux actualités, des fonctions de
recherche et des éléments de protection et de sécurité. Les principaux moteurs de recherche,
notamment Google, MSN et Yahoo!, en disposent, ainsi que des milliers d’autres sources. Ces
barres d’outils collectent également des informations limitées sur le comportement de naviga-
tion des clients qui les utilisent, notamment les pages qu’ils visitent, les termes de recherche
qu’ils emploient, voire le temps passé sur chaque page. En général, les données sont
anonymes. Il ne s’agit pas de données d’identification personnelle (données PII, Personally
Identifiable Information).
Une fois les données collectées par les barres d’outils, votre outil IC les mouline avant de vous
les présenter à des fins d’analyse. Par exemple, Alexa vous permet de générer un rapport sur
les statistiques de trafic (notamment le classement et les pages consultées), sur les statistiques
en amont (d’où vient votre trafic) et en aval (où les internautes se rendent en quittant votre
site), ainsi que sur les mots-clés qui dirigent un trafic vers un site.
Des millions d’internautes utilisent les barres d’outils largement déployées, essentiellement à
partir de moteurs de recherche. Les données des barres d’outils sont donc une des plus impor-
tantes sources de données IC disponibles, particulièrement efficace surtout pour la macro-
analyse du trafic des sites Web, notamment le nombre de visites, leur durée moyenne et les
référents.
L’utilisation massive des barres d’outils des moteurs de recherche est également la raison pour
laquelle les données issues d’Alexa, une barre d’outils déployée par un nombre d’utilisateurs
plus restreint, sont beaucoup moins utilisées.
Les données de barre d’outils ne sont généralement pas disponibles en soi. Elles constituent en général un compo-
sant clé des outils qui utilisent diverses sources pour fournir des éclaircissements.
Les barres d’outils facilitent la navigation sur le Web. En tant qu’utilisateur, vous devez vous familiariser avec les
données collectées lorsque vous utilisez une barre d’outils, ainsi qu’avec la manière de les exploiter. Avant d’en
installer une, identifiez et lisez la politique de confidentialité. Ce précieux document qui accompagne la majorité des
barres d’outils est difficile à trouver et, souvent, à comprendre. Persistez cependant et traquez-le afin de vous fami-
liariser avec son contenu. Vous souhaitez contrôler la nature des données collectées, vous trouverez la politique de
confidentialité de la barre d’outils Google Toolbar à l’adresse
http://zqi.me/gtpriv
(en anglais).
Données de panel d’utilisateurs
Les données de panel constituent une autre méthode de collecte de données bien établie. Pour
les collecter, l’entreprise recrute un panel de participants. Chacun d’eux installe un logiciel de
surveillance qui collecte alors l’ensemble du comportement de navigation du panel d’inter-
nautes et en fait état à l’entreprise qui met en œuvre l’expérience.
CONSEIL
NOTE
Web Analytics 2.0
222
Différents niveaux de données sont collectés auprès de ce panel d’utilisateurs. À une extré-
mité du spectre, ces données correspondent simplement aux sites Web visités, tandis qu’à
l’autre, le logiciel de surveillance enregistre les cartes de crédit, noms, adresses et autres infor-
mations personnelles saisies dans le navigateur.
Les données de panel sont également collectées lorsque des internautes optent sans le savoir
pour l’envoi de leurs informations. Parmi les exemples répandus se trouve le cas du petit utili-
taire que vous installez sur votre ordinateur pour afficher la météo ou du module additionnel
greffé sur votre navigateur, qui offre une fonction de saisie semi-automatique pour remplir les
formulaires. Dans les conditions du service « écrites en tout petit », vous acceptez que votre
comportement de navigation soit enregistré et fasse l’objet d’un rapport.
Les panels d’internautes peuvent compter plusieurs milliers de membres, voire plusieurs
centaines de milliers. L’un des panels les plus important aux États-Unis est géré par com-
Score ; il compte un million de visiteurs (d’après son site Web http://zqi.me/cs1mil).
Lorsque vous exploitez des données ou des analyses qui reposent sur des panels d’internautes,
vous devez faire attention à trois éléments.
Le caractère biaisé de l’échantillon. Pratiquement tous les établissements, notamment les
entreprises et les universités, interdisent les logiciels de surveillance pour des raisons de
sécurité et de confidentialité. Aussi, la majorité des comportements surveillés ont tendance
à provenir d’utilisateurs naviguant depuis leur domicile. Et étant donné que l’utilisation des
navigateurs sur les heures ouvrées (et donc sur le lieu de travail) constitue une part consi-
dérable de la consommation Web, il est important de bien comprendre que les données
issues des panels d’internautes n’intègrent pas cet aspect du Web.
Caractère biaisé de l’échantillonnage. Les internautes sont incités à installer un logiciel
de surveillance en échange de participations à un tirage au sort, d’économiseurs d’écran à
télécharger et de jeux, voire d’une toute petite somme d’argent (2 par mois, par exemple).
Ce penchant induit un biais dans les données du fait du type des personnes qui participent
au panel. Ce n’est pas en soi un motif de rupture d’accord, mais vous devez prendre en
compte les internautes dont vous souhaitez analyser le comportement par rapport à ceux
qui constituent l’échantillon.
Le défi Web 2.0. Le logiciel de surveillance (explicite ou masqué) a été élaboré lorsque le
Web était statique, lorsqu’il reposait sur des pages. L’avènement des interactions enrichies,
notamment avec la vidéo, les codes Ajax et Flash, implique la fin de la mesure des pages
consultées. De ce fait, les logiciels de surveillance éprouvent des difficultés à capturer des
données avec précision. Certains éditeurs de logiciels de surveillance ont tenté de s’adapter
à cette situation changeante en demandant aux entreprises d’incorporer des balises
spéciales dans l’interaction proposée par leur site Web. Mais comme vous l’imaginez sans
doute, la chose est plus facile à dire qu’à faire.
La méthodologie des panels d’internautes repose sur le modèle de l’audimat pour la télévi-
sion. Dans un univers massivement fragmenté, les panels présentent un défi considérable en
matière de collecte de données précises et complètes (voire représentatives). Voici une règle
empirique que j’ai développée : si un site affiche plus de 5 millions de visiteurs uniques par
mois, les données collectées auprès d’un panel d’internautes sont suffisamment homogènes.
Les données de panel ont constitué une source prépondérante pour l’analyse IC. Mais sachant les limites inhérentes
à la méthodologie, les données de panel sont récemment complétées par d’autres sources avant d’être mises à
disposition pour analyse.
CONSEIL
1 / 30 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!