Josiane Jouet Institut français de presse, université Varis II LA PÊCHE AUX INTERNAUTES Internet a-t-il une audience ? Certains allégueront que non car le réseau des réseaux n'est pas un média de masse et les usagers d'Internet ne constituent en rien une audience comme celle de la radio ou la télévision. La généalogie des études d'audience les lie en effet à l'avènement des médias de masse or Internet ne s'inscrit pas dans une logique de diffusion mais de connexion. Nous ne sommes plus en présence d'une offre construite pour rejoindre simultanément de vastes auditoires car Internet est un pluri-média qui donne accès à une multitude de services d'information, de loisirs, de jeux, de transaction, de commerce ou de communication interpersonnelle et collective. C'est aussi un hyper-média qui assigne à l'utilisateur une posture de communication interactive fort distincte de la posture de réception des médias de masse. De plus la polyvalence d'Internet lui confère un caractère globalisant qui fait éclater les sphères d'activités traditionnelles des médias de masse et s'étend, entre autres, à la sphère du travail et de l'échange communicationnel. Or a-t-on jamais entendu parler de l'audience des outils de travail ou de l'audience du téléphone ? L'architecture technique d'Internet défierait donc en elle-même l'application de la notion d'audience. D'autres rétorqueront que si, l'audience d'Internet existe bien. En effet, depuis 1996, Internet s'est démocratisé et son ouverture vers «le grand public» s'est accompagnée non seulement de l'arrivée des grands médias de masse sur le Web mais de fournisseurs d'accès, de moteurs de recherche et de portails qui se sont largement inspirés du modèle médiatique et, en particulier, du modèle de la presse magazine et de la télévision. « Que cherchent en effet tous les opérateurs du Net qui, quel que soit leur métier de départ, cherchent à se constituer en portails ? Ils prétendent, eux aussi, agréger des publics pour les faire passer par leur point de passage obligé, dans le but essentiel de maximiser, là aussi leurs revenus publicitaires. Le modèle économique calqué à travers les portails est celui de la télévision: l'émergence de la guerre des méthodes de mesure d'audience sur Internet n'est qu'un symptôme mais elle est en même temps la pièce maîtresse de cette opération de compromis HERMÈS 37, 2003 203 Josiane Jouët avec les publicitaires. » (Boullier, 2000). L'art de la conception de site s'apparenterait donc à l'art de la programmation dans la sphère audiovisuelle, à l'art de l'offre éditoriale et de la mise en scène graphique dans la presse écrite, arts qui recourent largement aux études d'audience et au marketing. Si le glissement d'Internet vers le modèle éditorial justifie, du moins en partie, l'emprunt de la notion d'audience, la mesure d'audience d'Internet n'est pas un simple calque des mesures d'audience des médias. Elle se greffe d'emblée sur deux autres logiques: la logique de mesure de trafic des télécommunications et la logique de numérisation de l'informatique. Les filiations techniques du réseau des réseaux contribuent à la genèse de la mesure d'audience d'Internet. En effet, la construction de ce dispositif repose sur un agencement entre d'une part, les outils de la technologie sociale empruntés aux études d'audience classiques et au marketing et, d'autre part, les outils de l'informatique et des télécommunications (numérisation, procédures de capture, suivi et observation des trafics et des flux... ). Ainsi, la mesure de l'audience d'Internet est d'abord et de façon massive une mesure sur Internet. Nous prenons en compte dans cet article, non seulement les travaux de mesure de l'audience mais aussi les travaux d'enquête qui étudient les internautes en recourant soit aux méthodes classiques de questionnaire ou d'entretien, soit aux questionnaires en ligne. L'objectif n'est pas d'exposer l'ensemble de la panoplie des études d'audience d'Internet qui font florès ni d'entrer dans les raffinements en évolution constante des techniques utilisées1 Le texte ne fournit pas non plus de résultats statistiques sur les audiences d'Internet en raison d'une part, de leur obsolescence et, d'autre part, du fait qu'ils sont, du moins pour la partie qui n'est pas confidentielle, aisément accessibles en ligne. La perspective est autre, car il s'agit d'aborder les enjeux des études d'audience, de s'interroger sur les modes de construction des principales méthodologies et de cerner la représentation des internautes qui émerge de ces dispositifs. Un marché fragmenté En moins d'une décennie, le marché des études d'audience d'Internet a explosé sous l'effet de la «bulle Internet». C'est encore un marché ouvert qui a ainsi vu l'apparition de petites sociétés d'études qui rivalisent dans l'élaboration d'outils de mesure ou d'études performants. Il se caractérise par une forte instabilité et concurrence et s'y déploient de grands instituts de sondage, comme Médiamétrie, aux côtés de petites start-ups comme eStat, Weborama ou Atinternet, spécialistes de la mesure de trafic sur réseau dont la 204 HERMÈS 37, 2003 La pêche aux internautes clientèle initiale de petits éditeurs de site s'est élargie à des acteurs plus importants. En outre, des bureaux d'étude et de marketing de taille moyenne, comme Novatris, réalisent aussi des enquêtes sur les internautes. La fragmentation actuelle du marché de l'audience se caractérise de fait par un double phénomène de spécialisation et de partenariat international, dans un climat d'incertitude économique qui renforce les concentrations. Dans cette course aux études, chacun est à la recherche de la killer application et aucune ne s'impose de façon définitive. D'ailleurs la spécificité du média Internet n'appelle pas nécessairement l'imposition à terme d'une mesure d'audience unique, comme cela s'est passé pour la télévision avant l'arrivée des chaînes thématiques, mais peut-être se produirat-il une coexistence de mesures renvoyant à l'hétérogénéité du média Internet et de ses intervenants. Aujourd'hui il est de bonne guerre d'évoquer les écarts de résultats sur l'audience d'Internet obtenus par les différentes méthodes. La mesure d'audience d'Internet repose en effet sur un paradoxe: il est le média qui a priori se prête le mieux à la connaissance de ses publics car l'usager en ligne laisse quantité de traces mais il est à la fois le média le plus complexe à mesurer. De nombreux obstacles surgissent en effet pour obtenir des comptages rigoureux et précis. L'utilisation de serveurs «proxy» et des caches masquant les fichiers logs font que plus une page est demandée moins elle est comptabilisée, le problème étant résolu par la présence de marqueurs sur les pages. Des difficultés techniques surgissent aux niveaux des navigateurs, des fournisseurs d'accès, des types d'ordinateurs des usagers, des lieux de connexion (domicile, entreprise, cybercafé, université... ). De plus, les méthodes de mesure diffèrent et les logiciels de comptage n'enregistrent pas nécessairement les mêmes paramètres. « Ces différences sont un frein à la crédibilité du média, car les chiffres sont souvent comparés entre eux sans que l'on sache comment ils ont été obtenus. » (Brignier et al, 2002). Il existe par ailleurs une forte instabilité de la démographie des internautes qui exige une mise à jour permanente et périodique des enquêtes de calage réalisées par les grands instituts de sondage afin d'ajuster la représentativité des échantillons. De plus, à l'inverse de la télévision par exemple, l'audience d'Internet est par définition internationale même si les études montrent que les sites nationaux sont très majoritairement consultés par les résidents de leur pays. Surtout, le média Internet qui offre une diversité d'applications et de services (information, messagerie interpersonnelle et de groupe, transfert de fichiers, transaction etc. ) rend impossible une mesure d'audience unique et exhaustive y compris dans le seul domaine du Web en raison de la multitude des sites qui se chiffrent par centaines de milliers. La différence avec les médias de masse est donc ici majeure et une vaste partie d'Internet échappe de fait à toute mesure. Si les mesures d'audience d'Internet sont encore loin d'être parfaitement cohérentes et fiables, elles tendent à converger de plus en plus grâce entre autres aux efforts des instances interprofessionnelles qui ont chargé les organismes de contrôle (le Centre d'études des supports HERMÈS 37, 2003 205 Josiane Jouët de publicité et Diffusion contrôle) d'opérer une certification et une labellisation des outils de mesure soumis à un audit régulier. Ainsi, la mise en place par le CESP d'une « Terminologie pour la mesure d'audience d'Internet » a permis d'établir une définition précise des différents indicateurs de mesure reconnus et appliqués par les organismes d'audience2. A l'instar des médias de masse, l'audience d'Internet est désormais mesurée à l'aune de ses propres indicateurs parmi lesquels: le nombre de pages vues, de pages vues avec publicité, de session utilisateur correspondant à la durée totale d'une connexion qui peut elle-même comprendre plusieurs visites, soit un ensemble de pages vues sur un même site au cours d'une même session, de visiteurs (individus consultant un même site au cours d'une période donnée)... De la traque des traces aux enquêtes e n ligne Deux grandes méthodologies permettent d'effectuer des mesures d'audience d'Internet sur Internet: les mesures dites «site centric» qui chiffrent la fréquentation des sites d'une part, et les mesures dites «user centric» qui permettent de connaître le comportement des internautes d'autre part. Du côté des mesures «user centric», les panels d'Internautes sont en quelque sorte le décalque de l'audimétrie télévisuelle et, tout comme pour le Médiamat, ils sont constitués d'individus consentant à l'installation d'un logiciel espion sur leur ordinateur. Ce système d'enregistrement passif est a priori le plus fiable car l'internaute s'identifie dès qu'il se connecte à Internet (les différents membres du foyer ont chacun un code d'accès spécifique) et il est suivi à la trace. Grâce à l'interactivité du média, on peut repérer toute inactivité supérieure à un temps donné, qui est assimilée à une fin de session, et ce dispositif paraît supérieur en précision au Médiamat dont le système de boutons poussoir ne permet pas de cerner l'attention du téléspectateur au petit écran. Les panels reposent sur un échantillon représentatif d'internautes correspondant à des catégories sociales précises et fournissent des renseignements précieux sur les usages d'Internet et leur évolution dans le temps. La tendance à l'internationalisation et à la concentration est remarquable pour ces panels d'Internautes très onéreux qui, conjointement implantés dans plusieurs pays, permettent des mesures comparatives sur plusieurs zones géographiques. Ainsi, les trois panels présents en France au début de l'année 2002, étaient-ils tous les résultats d'alliances entre opérateurs nationaux et multinationaux. Médiamétrie s'est associé à Nielsen, le grand spécialiste américain de l'audience, à travers la société Nielsen-NetRatings; la Start up Netvalue, associée au groupe Taylor Nelson Sofrès, avait développé un partenariat avec le 206 HERMÈS 37, 2003 La pêche aux internautes groupe américain ComScore, avant d'être absorbée par le même NetRatings à l'automne 2002. Le troisième panel, Jupiter Médiametrix Europe, était une joint venture de l'Américain MediaMetrix avec des instituts européens, dont l'Allemand GFK et le Français IPSOS, avant d'être racheté par ComScore et d'être utilisé à d'autres fins. A la fin de l'année 2002, il ne demeure plus sur le marché français de la mesure user centric que le panel de Nielsen-Netratings commercialisé par Médiamétrie. Néanmoins, la connaissance par le biais des panels présente des limites car les données recueillies sont valides pour la fréquentation des gros sites (portails, moteurs etc. ), mais non pour cerner la consultation des petits sites en raison de l'extrême fragmentation du Web. « On touche ici une limite importante de ce type de mesure: comme on compte les visites à l'intérieur d'un échantillon, il faut accumuler des observations dans la durée pour obtenir des chiffres qui puissent être significatifs. C'est une limite frustrante dans le cas d'un média interactif comme Internet. » (Haering, 2002). En effet, les échantillons - même s'ils atteignent, par exemple en France, environ 10 000 panélistes pour le seul panel restant - ne sont pas très extensibles car le coût de recrutement et de gestion des panels est très élevé. Si les panels sont apparus à la fin des années 1990 comme la méthodologie la plus adéquate pour mesurer l'audience d'Internet, cette approche reste aujourd'hui complémentaire des mesures effectuées côté sites. Ainsi, les mesures dites site centric, qui avaient été les premières mesures effectuées sur Internet, connaissent un regain d'intérêt car leurs logiciels deviennent de plus en plus sophistiqués et permettent aujourd'hui, outre la simple quantification, des approches de qualification de l'audience. Les études de fréquentation de sites sont des comptages externes réalisés par des organismes spécialisés qui installent leur propre marqueur sur les pages des sites ce qui garantit la validité et la comparabilité de la mesure. Cette méthodologie présente l'avantage d'enregistrer toutes les connexions sur les sites étudiés, qu'elles proviennent du domicile, de l'entreprise ou d'un lieu d'accès collectif, assurant ainsi la fiabilité des résultats, alors que les panels d'internautes sont encore largement résidentiels et plus difficiles à installer dans le monde professionnel. Le marché du site centric se répartit entre huit sociétés dont les outils ont été labellisés par Diffusion contrôle dont Cybermétrie (dispositif de Médiamétrie), mesure collective et commune de fréquentation de sites, et d'autres sociétés spécialisées moins importantes3. La spécificité du média Internet favorise en effet la construction de dispositifs de mesure innovants qui combinent la technologie de l'informatique, via des logiciels de capture des traces de plus en plus exhaustifs, et la technologie sociale du marketing. Ces sociétés présentent des classements de sites par thématiques et leurs services répondent au montant de la souscription du client, allant de la gratuité pour le comptage de la fréquentation des sites personnels (moyennant un encart publicitaire de la société), à des services de plus en plus onéreux selon les niveaux de statistiques et de conseils marketing demandés. HERMÈS 37, 2003 207 Josiane Jouët Ces dispositifs conjuguent d'une part du tracking avec des logiciels de capture qui fournissent aux sites souscripteurs des données précises sur leur fréquentation, les caractéristiques des visites du site, l'assiduité des internautes et, d'autre part, parfois du profiling qui vise une qualification de l'audience. Les internautes ne sont pas identifiés nommément ni selon leurs caractéristiques socio-démographiques, à l'inverse des panels. La reconnaissance des visiteurs repose sur l'identification du navigateur de l'ordinateur grâce aux cookies. Les techniques de profiling suivent par exemple le parcours des internautes sur la toile pour saisir leurs centres d'intérêt et en déduisent de façon indirecte et probabiliste le profil des utilisateurs des différents sites (leur âge, leur sexe, leurs goûts, leur consommation). Une analyse sémantique des sites consultés est aussi parfois effectuée. Le profiling débouche sur des recommandations qui orientent l'offre éditoriale mais aussi bien sûr l'offre publicitaire. Là encore, Internet se distingue des médias de masse en permettant une insertion dynamique des publicités qui peut varier en fonction de la cible et en fonction de l'exposition préalable de l'internaute aux messages publicitaires. De plus, les annonceurs peuvent a priori connaître l'efficacité de leurs campagnes avec les indicateurs de pages vues avec publicité, les taux de clics sur les publicités voire les clics through (publicité totalement téléchargée). Les serveurs de publicité via la technique du marquage des messages publicitaires disposent donc de statistiques d'audience précises. Si la traque des traces est la poule aux œufs d'or des mesures d'audience d'Internet, d'autres sociétés sont spécialisées dans les études d'audience visant à connaître les publics d'Internet. La méthode la plus utilisée est celle des questionnaires en ligne qui fournissent des renseignements sur les types et les modalités d'usage d'Internet, mais aussi sur la consommation et le mode de vie des internautes. Ces enquêtes en ligne peuvent être effectuées par vague et de façon régulière par certains bureaux d'études, comme Ipsos ou Novatris, qui disposent ainsi de bases de données conséquentes sur plusieurs milliers d'internautes qu'ils qualifient de «panel» dans la mesure où ces derniers peuvent être régulièrement sollicités. Ces grandes études multi-clients se doublent d'enquêtes ad-hoc réalisées à la carte et accompagnées de conseil marketing. L'analyse des données de ces enquêtes devient de plus en plus pointue et ciblée autour de la représentation de l'internaute comme consommateur. Si les enquêtes en ligne présentent les avantages d'un faible coût et d'une rapidité de mise en place, leurs limites résident dans la représentativité des internautes qui acceptent de remplir les questionnaires en ligne car le volontariat des réponses entraîne une sur-représentation des usagers les plus assidus et enthousiastes. De plus, la participation à ces enquêtes ou à des jeux organisés pour la collecte de données auprès des pratiquants d'Internet peut être motivée par des cadeaux... Malgré ces limites, les enquêtes en ligne livrent beaucoup de données sur les usages d'Internet, données d'une autre nature que les mesures d'audience. 208 HERMÈS 31, 2003 La pêche aux internautes Transparence et opacité de l'internaute Traqué sur le réseau des réseaux, suivi, «profilé», l'internaute serait devenu transparent. En se branchant, il tisse lui-même les fils de sa reconnaissance (ses connexions en fréquence et en durée, ses types d'utilisation d'Internet, ses sites favoris, ses trajectoires sur la toile). Aucun média n'a jamais permis d'en savoir tant à l'insu même de son auditoire. Les instruments de mesure nous livrent une avalanche inédite de chiffres pour décrypter les comportements des utilisateurs. La puissance des logiciels de capture, le raffinement des outils de traitement de données, la finesse des modèles d'analyse statistique produisent une évaluationencontinudesactivitéssur une telle mine de données ? Quel éditeur, annonceur ou publicitaire n'a-t-il ainsi désiré accéder au repère et au calcul en temps quasi réel des comportements de son audience ? Cependant ces nébuleuses de traces fournies quotidiennement ne livrent pas d'ellesmêmes les principes de leur interprétation. L'énormité des corpus, la complexité des données et des indicateurs exigent une simplification et une présentation qui puissent être lisibles par les commanditaires. Les éditeurs de site sont ainsi submergés par les représentations statistiques en ligne (principaux indicateurs d'audience, graphes de suivi dans le temps, outils pour connaître la fidélisation de leur public et les liens affluents des internautes venant sur leur site etc. ) et on observe une sous-exploitation des résultats. La gestion de site appelle la formation d'analystes qui puissent lire et interpréter la sophistication des recueils de mesure existants pour optimiser leur offre éditoriale, moyens dont ne disposent que les gros sites. Les études d'audience d'Internet se sont en effet mises en place plus rapidement que pour les médias de masse et elles ont été d'emblée façonnées par le marketing. Certes la gratuité des services offerts sur Internet n'est pas étrangère à cette approche commerciale et publicitaire des études d'audience pouvant conduire à une réactivité immédiate de l'offre. Cette tendance indique sans doute un recul des mesures d'audience globales au profit de mesures de plus en plus sectorisées, qui offrent l'avantage de ciblages précis sur un site, une catégorie de sites ou de thématiques, par exemple, mais qui perdent du coup en regard distancié sur l'évolution d'ensemble du média où se repèrent les grandes tendances sociétales. Ainsi les mesures d'audience ne sont-elles pas tant conçues pour la connaissance des publics que comme outils stratégiques. Elles construisent un modèle de l'internaute client qu'il s'agit d'identifier par son profil, voire par son identité, aux fins de lui adresser des messages publicitaires ou de lui proposer des produits répondant à ses intérêts et à son mode de vie. « La propriété caractéristique d'Internet est d'être un média interactif. Parfaitement adapté au marketing direct, il est l'outil idéal pour identifier et solliciter, non pas des cibles statistiques, mais des individus concrets. » (Chammings, 2002). La visée du HERMÈS 37, 2003 209 Josiane Jouët marketing direct personnalisé, le rêve du Β to C (Business to Consumer) se retrouvent en filigrane de la construction des dispositifs d'audience et n'est pas sans soulever une série de questions déontologiques. Certes, tout internaute peut détruire les cookies qu'il récolte lors de ses visites mais la procédure est contraignante et de fait l'internaute, sans qu'il le sache le plus souvent, alimente les bases de données qui permettront de le repérer à des fins qui lui échappent. Néanmoins, les mesures et enquêtes d'audience d'Internet peuvent être aussi utiles aux sciences sociales. Les dispositifs varient, comme nous l'avons vu, selon les méthodes, selon les outils de collecte, de gestion et de rendu, mais les diverses représentations qu'ils nous livrent cernent dans leur complémentarité diverses figures de l'internaute. La connaissance des modes de construction de ces dispositifs permet de les utiliser et de les interpréter avec les précautions requises. De plus, ces bases de données, une fois rendues accessibles, peuvent faire l'objet de traitements statistiques complexes et d'analyses scientifiques, comme le montre l'étude approfondie du « Suivi d'une cohorte d'internautes du panel Netvalue France en 2000 »4. On ne saurait toutefois oublier que l'internaute mesuré est réduit à un dénombrement d'actes (hits, clics... ), à des parcours sur Internet, mais on ne sait rien de ses motivations, du sens qu'il investit dans ses pratiques, du rôle que remplit Internet dans sa vie sociale. Car que nous offrent ces dispositifs si ce n'est une représentation des internautes construite par un agencement d'outils informatiques, statistiques et marketing qui produit des modèles de quantification et des procédures de catégorisation. Le poisson internaute est donc malgré lui pris dans les filets du Net et - ainsi tatoué, marqué, taggué - devient un produit. Pour autant, l'internaute glisse entre les mailles et sa transparence a pour revers son opacité. Ecrasé sous des lignes de chiffres, il s'évapore. La quantification excessive risque de ne plus produire que des modèles formels, des segmentations de publics, des stéréotypes de comportements, des typologies hâtives qui ne se ressourcent pas dans l'épaisseur du social. Tout comme Dominique Boullier (1987) l'avait si bien analysé à propos de la télévision « l'activité télé déborde largement ce qui se passe sur le petit écran », de même l'activité Internet se déploie aussi largement en dehors des connexions. L'internaute-utilisateur construit par la mesure d'audience n'est pas l'internaute-usager construit par les sciences sociales. Les internautes rangés dans des profils, devenus «qualifiés» par le marketing, perdent de leurs qualités. Étiquetés via leurs connexions, réduits à des enchaînements d'actes, les internautes demeurent opaques. 210 HERMES 37, 2003 La pêche aux internautes NOTES 1. Pour plus de précisions sur les méthodes et techniques d'audience d'Internet voir, partie 6, Internet, in BRIGNIER et al, 2002, et HUSSHERR, F-X., NERON, S., 2002. 2. Pour ces indicateurs, voir le site du Centre d'études des supports de publicité [cesp. org]. 3. Sociétés et outils labellisés par Diffusion Contrôle [ojd. com] en 2002; Stat SAS (eStat), Weborama SA (le Weboscope), Médiamétrie (cybermonitor), At Internet (Xiti), ID. fr (wysistat), WebSideStory (Hit Box enterprise), Nedstats SAS (sitestat), Telmédia (visiostats). 4. BEAUDOUIN, V, HOUSSEM, Α., BEAUVISAGE, T., LELONG, B., LICOPPE, C , ZIEMLICKI, C , (France Telecom), ARBUES, L. (Net Value), LENDREVIE, J. (HEC), « Suivi d'une cohorte d'internautes du panel Net Value France en 2000 », rapport HEC, NetValue, France Telecom R&D, 2002. RÉFÉRENCES BIBLIOGRAPHIQUES BOULLIER, D., La Conversation Télé, rapport du Larès, université Rennes 2, 1987. BOULLIER, D., « Internet et télévision: une convergence tentante et improbable », Les Dossiers de l'Audiovisuel, n° 89, janvier-février 2000. BRIGNIER, J. -M., CHAVENON, H., DUPONT-GHESTEM, F., DUSSAIX, A. -M., HAERING, H., Mesurer l'audience des médias. Du recueil des données au média planning, Paris, Dunod, 2002. CHAMMINGS, L., « Peut-on parler d'audience sur Internet », Les Dossiers de l'Audiovisuel, n° 103, mai-juin 2002. HAERING, H., « Internet: nouveau média, nouvelles mesures », Les Dossiers de l'Audiovisuel, n° 103, mai-juin 2002. HUSSHERR, F-X., NERON, S., Comportement de l'internaute, Paris, Dunod, 2002. HERMÈS 37, 2003 211