FIOLE Vincent M1 MEEF, TICE, 2013-2014 Le modèle économique des moteurs de recherche La recherche sur l’Internet ou la valeur économique des mots Quand on nous dit « moteur de recherche » (MdR), généralement deux choses principales nous viennent en tête : Google et la gratuité de l’information (ou de la requête). Nous allons voir que le lien entre les deux n’est pas du tout évident et qu’il est toujours bon de s’interroger sur ce qu’est un moteur de recherche Internet, la manière dont cela fonctionne, comment cela a été mis en place et surtout sur quel(s) modèle(s) économique(s) repose(nt) la plupart de ces MdR. I/ Historique des moteurs de recherche jusqu’à Google Pour la plupart d’entre nous, l’Internet a vu le jour dans les années 2000, moment où il commençait tout juste à se populariser et à se démocratiser mais en réalité l’Internet comme service a vu le jour bien plus tôt (1990 pour le début du World Wide Web). En 1991, un des premiers MdR, appelé Wandex, a vu le jour. Son fonctionnement se basait sur une simple indexation de mots clefs trouvant un référencement dans le titre. Autrement dit, si une page web « Y » comportait un mot « alpha » dans son titre et que l’on recherchait par l’intermédiaire de Wandex ce mot « alpha », Wandex nous dirigeait vers cette page web « Y ». Dans la lignée de Wandex, Webcrawler fût créé en 1994. Celui-ci, au lieu d’indexer uniquement le titre de la page web « Y », indexait la totalité du texte présent sur cette page web « Y » ; ainsi la classification des résultats trouvés se faisait en fonction du nombre d’occurrences similaires trouvées dans la totalité de la page web « Y ». Durant la même année, à l’université de Stanford, des étudiants ont mis en place Yahoo comme annuaire de sites web. Ici, la pertinence des résultats était le point essentiellement visé par ce MdR. Ainsi le recensement et la sélection des sites web étaient effectués de manière humaine. Enfin, en 1997, toujours à l’université de Stanford, deux étudiants (S. Brin et L. Page) ont mis en place Google en se basant sur le postulat suivant : « Si un site dispose de nombreux liens externes portant vers lui, c’est qu’il est reconnu comme étant une référence dans son domaine ». Ainsi, on observe un changement de paradigme de la recherche sur l’Internet au sens où avant Google c’était le nombre d’occurrences qui décidait de la pertinence d’un résultat alors que depuis l’arrivée de Google c’est à la fois le nombre de liens externes vers la page et le nombre de visites sur la page web. De là, les pages web pouvaient être classées selon leur pertinence, c’est ce que l’on a appelé le référencement et c’est ce qui a rendu Google célèbre. II/ La publicité, modèle économique dominant Nous allons maintenant voir ce qui a rendu Google riche : la publicité. En effet, la célébrité de Google a entrainé une affluence de plus en plus importante. Dès lors, la publicité a senti que ça pouvait être un bon filon que de siéger sur ce nouveau média. Ainsi, deux algorithmes ont été mis en place : Adwords (en 2000) et Adsense (en 2003). Le premier, Adwords, est un système d’enchère, adressé aux entreprises, pour l’achat de mots. Autrement dit, une entreprise peut acheter des mots clefs en lien avec ce qu’elle produit et pourra espérer jouir d’une meilleure visibilité sur le MdR au moment où ces mots là seront utilisés par l’internaute lors de sa recherche. L’affichage de ces publicités peut se faire sous différentes formes (textes, images, liens URL) et apparaît toujours en amont des résultats de recherche. Le second, Adsense, mesure la pertinence des publicités en fonction du nombre de clics sur ces annonces publicitaires. La facturation, pour les entreprises, s’effectue au clic sur un lien et non pas à l’affichage. Depuis, Frédéric Kaplan, dans un article paru sur le monde diplomatique, nous apprend qu’il existe un nouveau système d’enchère se faisant en trois étapes : - le calcul du prix d’un mot : l’entreprise définit un prix maximum qu’elle serait prête à mettre pour un mot clef spécifique - le calcul du score de la publicité : Il va de 1 à 10 et est fonction de trois items, à savoir la pertinence du texte par rapport à la requête ; la qualité de la page mesurée entre autre par le temps de chargement ; et enfin le nombre moyen de clics sur la publicité. - Le calcul du rang : il détermine l’ordre dans lequel la publicité va apparaître sur Google et il est définit par un calcul simple : rang = enchère * score Ainsi, on a pu voir des mots, à l’instar de titres boursiers, qui pouvaient perdre ou prendre de la valeur selon des évènements politiques, des catastrophes naturelles ou simplement des changements de saison ; par exemple en hiver les mots « ski » et « vêtements de montagne » ont une valeur marchande (décidée par l’enchère) plus importante qu’en été, et inversement pour les mots tels que « bikini » ou « crème solaire ». Enfin, Google, depuis peu, a mis en place des « outils » de corrections. Et cela rentre tout à fait dans une dimension économique. Naifs nous serons de penser que ce MdR le fait pour nous rendre service ou nous améliorer en grammaire ou en orthographe. En effet, quand Google, lors d’une faute de frappe ou d’une faute d’orthographe que l’on peut faire dans la barre de recherche, nous propose d’effectuer la recherche avec la correction, c’est simplement qu’il transforme un matériau sans grande valeur en une ressource économique très rentable pour lui et pour l’entreprise qui a fait enchère sur cet ensemble de mots. De même, quand l’internaute commence une phrase dans la barre de recherche et que Google lui « propose » la suite, ce n’est pas pour nous faire gagner du temps mais bel et bien pour nous « proposer » (ici, imposer) de nous ramener dans un chemin économique et linguistique tracé par les entreprises et les autres internautes. Ainsi, F. Kaplan nous dit qu’il ne s’agit pas en premier lieu d’outils de corrections mais avant tout d’outils économiques et linguistiques, voire même d’outils d’économie de la linguistique. Le risque est que cela amène à une uniformisation du langage, de la langue, et donc, par corolaire, de la façon de penser. III/ Des alternatives proposées souvent mort-nées Pour contrer cette manière de faire de Google, certains ont essayé de proposer des alternatives. Il est important de noter que les MdR tels que Bing ou Baidu ne sont en rien des alternatives à ce modèle puisqu’il s’agit en fait que de simples concurrents qui suivent exactement le même modèle économique. Dans la liste des « véritables » alternatives, on peut subdiviser ceux là en deux catégories : les MdR solidaires et les MdR anonymes (ou libres). Ainsi, dans les solidaires on trouve Hooseek qui reverse 0,15 centimes d’euros par recherche effectuée à des associations inscrites sur ce site, et ce selon le choix de l’internaute (il y en a 500 000 en tout). Il existe aussi Doona qui, lui, reverse la totalité de l’argent reçu des publicités à des causes humanitaires (Emmaus, WWF, etc..) qui doivent signer une charte pour y adhérer. Enfin, dans les MdR anonymes, on trouve Ixquick et DuckDuckGo qui eux, se basent sur un autre type d’alternative : la protection de la vie privée des internautes. Ici, les adresses IP, les cookies et les historiques sont invisibles, ce qui empêche la traçabilité de l’internaute.