Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Glossaire Achat de mot clé (keyword buy) Formule de publicité contextuelle dans les moteurs de recherche, qui fait apparaître des annonces en réaction à la saisie en requête d'un mot ou d'une expression clé. Adjacence (adjacency) Condition dans une recherche exigeant que les mots saisis en requête se trouvent accolés ou voisins dans le texte. Adresse IP (IP address) Numéro unique qui identifie chacun des ordinateurs sur Internet. À l'heure actuelle, une adresse IP se compose de quatre nombres (de 0 à 255) séparés par des points, comme 255.195.12.13. Adresse IP dynamique (dynamic IP) Adresse IP qui change chaque fois que le fournisseur d'accès le décide. Adresse IP statique (static IP address) Adresse IP permanente, qui reste la même à chaque connexion de l'internaute. Algorithme (algorithm) Formule mathématique servant à définir la position des pages web dans les résultats de recherche des moteurs de recherche et des annuaires web. Plus précisément, l’algorithme applique une pondération à des suites de mots dans une page web de manière à déterminer la valeur informative ou pertinence de la page par rapport à des mots clés. Chaque moteur de recherche utilise une formule différente pour définir le poids des mots et des expressions dans son index. Annuaire (directory) Site web dont l'activité est de dresser des listes de sites et de pages web classés par catégories. La répartition par rubrique étant faite par des éditeurs humains, les annuaires sont aussi appelés moteurs de recherche humains. Appel de fichier (hit) Requête individuelle faite auprès d'un serveur web pour un élément du site web, qui peut être un fichier HTML, une image ou tout autre élément inséré aux pages web, y compris un fichier audio. Le terme anglais hit est plus répandu que sa traduction française ; on le voit aussi traduit par "coup". Applet Petit programme développé dans le langage de programmation Java, qui s'insère à une page web et s'exécute en général dans le navigateur. Les robots des moteurs de recherche sont incapables à l'heure actuelle d'enregistrer le texte à l'intérieur d'une applet Java. Araignée (spider) Logiciel utilisé par un moteur de recherche pour trouver et recenser des pages web à inclure à son index. 1/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. B2B Abréviation de Business to Business, soit services aux professionnels par opposition à B2C (Business to Consumers) qui désigne les services aux particuliers. Balise de commentaires (comment tag) Balise HTML servant à insérer du contenu qui n'est pas accessible aux navigateurs. Dans le code, les commentaires sont délimités par les symboles <!-- et -->. La majorité des moteurs de recherche ignorent le contenu des balises de commentaires. Balise meta (meta tag) Balise HTML, placée entre les balises <head> et </head>, qui fournit des renseignements sur le contenu de la page web, tels que les spécifications HTML suivies par le code de la page ou une description du contenu de la page. Les balises meta n'ont aucune influence sur l'affichage de la page dans un navigateur. En webmarketing, on utilise surtout les balises meta pour leurs attributs de mots clés, de description et d'exclusion aux robots. Best of the Web Moteur de recherche sélectif. La base de données Inktomi comprend actuellement plus de 115 millions de documents découverts durant la procédure de recensement naturel du Web par Inktomi. Les sites web référencés dans cet index sont les plus fréquentés du Web selon les indices de popularité calculés par Inktomi. Bourrage de mots clés (keyword stacking, keyword stuffing) Accumulation de mots clés dans une page web dans le but d'augmenter artificiellement la densité, la proéminence et la proximité des mots clés. Le bourrage se pratique surtout dans la balise title, dans les balises meta et dans le texte invisible, ainsi que dans les balises d'images et de code CSS. Bouton de navigation (navigation button) Image, généralement de format GIF ou JPEG, qui sert de lien vers une URL à l'intérieur du site. Cadres (frames) Technique HTML qui permet aux webdesigners de diviser l'écran du navigateur en deux sections ou plus. Dans chaque section, ou cadre, s'affiche un document web différent. Camouflage Voir Dissimulation. CGI Initiales de Common Gateway Interface. CGI désigne les programmes servant à produire du contenu à livrer au navigateur. Les programmes CGI sont le plus souvent codés en Perl, C, Java ou Visual Basic. Charabia (gibberish) Texte d'une page web qui n'a pas de signification, et donc aucun intérêt, pour les visiteurs. Classement (ranking) Voir Positionnement. Classification (classification) Répartition logique des informations par rubriques ou catégories, en général selon une structure hiérarchique. Synonyme de catégorisation. 2/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Clic d'accès (click-through ou click-thru) Clic dans une page web qui donne accès à une autre page web. Dans le contexte du webmarketing, le clic d'accès désigne le clic sur un lien dans la page de résultats de recherche conduisant vers une page web particulière. Combinaison idéale (power combination) Désigne les trois premiers mots dans le titre d'une page web, qui tapés dans n'importe quel ordre dans une requête forment une expression clé. Compteur (counter) Programme ou script qui compte le nombre d'appels de fichiers (hits) sur une page web. Peut aussi compter le nombre de pages vues dans un site web. Le compteur sert à établir des statistiques sur la fréquentation des sites web. Consultation de tables DNS (DNS lookup) Opération de conversion d'une adresse IP unique (d'un visiteur du site) en son nom de domaine. Cette consultation est souvent pratiquée par les logiciels de statistiques web dans l'analyse des fichiers journaux d'un serveur. Cookie Message transmis à un navigateur web par un serveur web. Les cookies servent notamment à identifier les visiteurs d'un site web afin de préparer des pages personnalisées à leur intention. Aussi appelé témoin de connexion. Coordonnée Z (Z-index) Définit la position d'un élément en profondeur dans une page mise en forme en CSS, ce qui définit l'ordre d'empilement des couches. Les couches avec une valeur de coordonnée Z supérieure apparaissent devant les couches avec une valeur Z inférieure. Couches (layers) Attribut en CSS qui définit une portion rectangulaire, ou une couche de code HTML, qui peut se positionner dans une page web d'après ses coordonnées X, Y et Z et se mesure en pixels. CPA (CPA - cost per action) Initiales de coût par action. Mode de facturation des publicités selon lequel un site web est rémunéré chaque fois qu'un visiteur effectue une action désirée. On parle aussi de coût par transaction. CPC (CPC - cost per click) Initiales de coût par clic. Mode de facturation des publicités selon lequel un site web est rémunéré chaque fois qu'un visiteur clique sur le lien vers le site web de l'annonceur. CPM Initiales de coût par mille. Mode de facturation selon lequel un site web est rémunéré par tranche de mille impressions d'une publicité. CSS Initiales de Cascading Style Sheet. Langage de programmation web dérivant du HTLM et développé par le consortium W3C. Le langage CSS sert à créer des feuilles de styles qui définissent la présentation des différents éléments de texte (paragraphes, titres, liens, etc.) dans la page web. Les feuilles de styles en cascade servent aussi à définir la position des éléments dans la page. À l'heure actuelle, la mise en forme et la mise en page en CSS ne sont pas interprétées de 3/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. façon uniforme par tous les navigateurs. Densité d'un mot clé (keyword density) Le taux de densité d'un mot clé se calcule en divisant le nombre d'occurrences du mot clé dans le texte par le nombre total de mots du texte. Les moteurs de recherche calculent ce taux par des algorithmes plus complexes. Dissimulation (cloaking, obfuscation) Procédé frauduleux qui consiste à fournir aux robots des moteurs de recherche un contenu sur mesure qui est masqué aux visiteurs du site. Avec la dissimulation, les robots voient une page et les visiteurs en voient une autre présentant un contenu différent. Synonyme de camouflage. DNS Initiales de Domain Name System. Le DNS convertit les adresses textuelles des URL (nomcompagnie.com) en une adresse Internet numérique (201.214.12.6). Domaine satellite (doorway domain) Série de pages satellites dans un site web. La seule raison d'être d'un domaine satellite et d'obtenir un bon classement dans les moteurs de recherche et de rediriger le trafic vers un autre site. Aussi appelé domaine passerelle (gateway domain). Domaine virtuel (virtual domain) Terme utilisé par les services d'hébergement sur le Web quand plusieurs domaines résident sur un même serveur web. Chaque site web hébergé sur le serveur peut avoir un nom de domaine différent, qu'on appelle domaine virtuel. Domaines miroirs (mirror domains) Voir Sites miroirs. Erreur 404 (404 error) Fichier introuvable. Cette erreur se produit quand le serveur hôte ne parvient pas à trouver le fichier demandé par un navigateur ou par un robot d'indexation. Expression clé (keyword phrase) Suite de mots tapée en requête dans un service de recherche. Aussi groupe de mots clés représentatif du contenu d'une page ou d'un site web. FAI (ISP - Internet Service Provider) Initiales de "Fournisseur d'accès à Internet". Un FAI est une société qui permet à ses abonnés de se connecter à Internet par l'intermédiaire de ses serveurs. Ferme de liens (link farm) Groupe hétéroclite de sites web qui pointent les uns vers les autres dans le but d'augmenter artificiellement leur indice de popularité. Voir aussi FFA. FFA (FFA, free for all) Désigne des pages composées de listes de liens, souvent sans rapport entre eux, qui conduisent vers d'autres pages web. Les liens FFA servent à accroître artificiellement l'indice de popularité et sont considérés comme un procédé frauduleux par les principaux moteurs de recherche. On parle aussi de ferme de liens. 4/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Fil d'Ariane (breadcrumbs) Elément de navigation textuel illustrant la structure des liaisons internes verticales dans un site web. La position actuelle dans le site se définit par rapport aux pages de niveau supérieur, comme Accueil > Produits > Vin > Champagne. GIF Initiales de Graphics Interchange Format. Format d'images à pixels (bitmap) couramment utilisé sur le Web. Les images GIF sont limitées à 256 couleurs et peuvent s'afficher dans tous les navigateurs à interface graphique. HTLM dynamique (dynamic HTML) Langage dérivé du HTML qui permet aux pages web de réagir aux conditions ou aux interventions de l'utilisateur, par exemple pour afficher la version d'une page en fonction du type de navigateur ou d'ordinateur utilisé. Le HTML et les CSS recourent à JavaScript pour rendre les pages interactives. HTML Initiales de Hypertext Markup Language. Système de formatage de texte universel, utilisé pour la création de pages web comprenant du texte, des images, du son, des cadres et des animations. http Initiales de Hypertext Transfer Protocol. Système servant à transférer des données entre un serveur web et un navigateur. HTTP 404 Voir Erreur 404. Hyperlien (hyperlink) Voir Lien hypertexte. Image réactive (image map) Image de format GIF ou JPEG contenant plusieurs liens, chacun occupant une zone différente de l'image. Impressions (page views) Dans les outils de statistiques de fréquentation des sites web, nombre total de fois où une page a été vue par les internautes. Ne pas confondre avec "pages vues" qui fait référence au nombre de pages vues sur le site pendant une visite. Incitation à l'action (call to action) Procédé qui doit conduire les visiteurs d'un site web à effectuer une action dans l'intérêt du propriétaire du site pendant leurs visites. L'action voulue peut être commander un produit, s'abonner à un bulletin d'information, télécharger un fichier ou cliquer sur un lien. Index Base de données interrogeable composée de mots pointant vers des documents, créée par les logiciels des moteurs de recherche. Les recherches lancées par les utilisateurs d'un service de recherche s'effectuent sur le contenu de l'index. 5/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Index de texte intégral (full text index) Base de données, ou index, qui contient tous les mots de tous les documents web recensés, y compris les mots vides. Peut aussi désigner un index sans mots vides. Indexeur (indexer) Composant du moteur de recherche qui traite les documents web explorés par les robots pour les intégrer à la base de données. La tâche de l'indexeur est d'éliminer les balises, accoler les liens en une file, supprimer les mots vides et stocker le document dans une base de données interrogeable. Indice de popularité (link popularity) Se réfère au nombre et à la qualité des liens entrants dans un site web à partir d'autres sites. Les liens entrants les plus cotés sont ceux provenant d'annuaires réputés comme Yahoo. Java Langage de programmation mis au point par Sun Microsystems, qui permet à de petites applications de tourner sur différents systèmes d'exploitations. Pour l'instant, les moteurs de recherche n'indexent pas le contenu des applets Java. JavaScript Langage de script open source mis au point par Netscape, qui permet de créer des pages web plus dynamiques avec des effets d'animation exécutés par le navigateur. JavaScript est très similaire au langage Jscript mis au point par Microsoft et ensuite normalisé en ECMA 262. JPEG Initiales de Joint Photographic Experts Group. Format de fichiers graphiques très répandu sur le Web. Les images JPEG peuvent contenir des millions de couleurs et s'affichent dans tous les navigateurs à interface graphique. Lemmatisation (stemming) Possibilité pour un moteur de recherche de trouver les variantes d'un mot d'après sa racine. Par exemple, si la requête porte sur le mot "vinaigre", les moteurs de recherche avec lemmatisation peuvent aussi donner en réponse des documents qui contiennent le mot "vin" Lien absolu (absolute link) Hyperlien précisant l'URL complète (nom de domaine, chemin d'accès et nom du fichier). Par opposition au lien relatif. Lien entrant (inbound link) Lien conduisant à un site web à partir d'un autre nom de domaine, qui engendre du trafic sur le site de destination. Les liens entrants servent à mesurer l'indice de popularité. Lien externe (outbound link) Lien conduisant d'un site web vers un autre site avec un nom de domaine différent. Lien hypertexte (hypertext link) Relie une portion de texte ou une image à un autre fichier qui se trouve dans le même site web ou sur un autre serveur. Le lien peut aussi conduire à une autre portion à l'intérieur du même document. 6/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Lien mort (dead link) Lien vers une page web qui n'existe pas à l'adresse indiquée. Lien profond (deep link) Lien externe fournissant un accès direct à du contenu qui se trouve dans une page interne, sans passer par la page d'accueil du site. Lien relatif (relative link) Hyperlien qui ne précise pas une URL complète (avec nom de domaine et chemin d'accès) parce que sa destination se définit par rapport à l'URL de la page en cours. Lien textuel (text link) Lien matérialisé par une portion de texte présentée dans une mise en forme particulière. On parle de lien textuel par opposition à un lien graphique matérialisé dans la page par une image. Liens réciproques (reciprocal links) Echange mutuel de liens externes entre deux sites web. Livraison personnalisée (IP delivery) Technique frauduleuse qui permet de livrer un contenu personnalisé en fonction de l'adresse IP du visiteur. Puisque les moteurs de recherche ont une adresse IP, le contenu fourni aux moteurs n'est pas le même que celui qui est présenté aux internautes. Mauvaise réponse (false drop) Page web présentée en résultat d'une recherche alors qu'elle ne correspond pas à la requête. Meta revisit Attribut dans une balise meta qui demande aux robots de revenir visiter la page au bout du délai spécifié. Les robots ne respectent pas cette instruction. Mise en valeur dans les annuaires (directory enhancement) Procédé qui consiste à sélectionner la ou les rubriques les plus appropriées dans un annuaire et à rédiger un descriptif concentré en mots clés qui détaille fidèlement le contenu d'un site ou d'une page web. Mot clé (keyword) Mot saisi en requête dans un service de recherche ou mot représentatif du contenu d'une page ou d'un site web. Mot vide (stop word, filter word) Mot d'usage très courant que les moteurs de recherche n'intègrent pas à leur index pour gagner de l'espace sur leur serveur et pour accélérer les recherches. Les mots vides les plus fréquents en français sont un, une, le, la, les, de, des, à, au, aux, en, pour, et, etc. En anglais, ce sont the, a, an, for, and, but, to, etc. Moteur de recherche (search engine) Logiciel qui interroge un index (base de données) et retourne les réponses correspondant au texte tapé en requête. 7/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Navigateur (browser) Logiciel servant à visualiser et à gérer des pages web en interprétant le texte et les hyperliens. Les deux navigateurs les plus courants sont Internet Explorer et FireFox. noframes Balise couramment employée dans les pages divisées en cadres. Le contenu placé entre les balises <noframes> et </noframes> s'affiche quand le navigateur est incompatible avec les cadres ou que cette fonction a été désactivée. Puisque la quasi-totalité des navigateurs sont compatibles avec les cadres, les moteurs de recherche ignorent le contenu placé entre les balises <noframes> ou y attachent peu d'importance. Nom de domaine (domain name) Adresse textuelle qui correspond en général à une ou plusieurs adresses IP numériques. Nom exclusif qui identifie un site web sur le modèle nomcompagnie.com. Nom de domaine avec mots clés (keyword domain name) Nom de domaine contenant au moins un mot clé. noscript Si le navigateur est incompatible avec un langage de script ou si l'utilisateur a désactivé la prise en charge de script dans son navigateur, c'est le contenu placé entre les balises <noscript> et </noscript> qui s'affiche. Cette balise permet de mettre à disposition un contenu de remplacement dans l'éventualité où le script ne s'exécute pas. Optimisation (optimization) Ensemble d'opérations (conception, rédaction, encodage en HTLM et soumission des pages aux moteurs de recherche) visant à augmenter les probabilités que des pages du site optimisé apparaissent en bonne position dans les résultats des requêtes portant sur les mots et groupes de mots clés sélectionnés. Processus d'amélioration des pages web de manière à les rendre aussi parfaites que possible pour les visiteurs et pour les moteurs de recherche. Page de chute (landing page, entry page) Page web sur laquelle arrive un internaute après avoir cliqué sur un lien (naturel ou sponsorisé) dans un moteur de recherche. Synonyme de page d'arrivée et page d'entrée. Page de destination (destination page, entry page) La première page vue par un internaute après avoir cliqué sur un lien vers un autre site web. Page de garde (splash page) Page web, généralement la page d'accueil, qui se compose soit d'une grande image et d'un lien invitant le visiteur à entrer dans le site, soit d'un lien permettant de passer outre l'animation d'introduction et d'une redirection vers une autre page quand l'animation est terminée Page de résultats de recherche (search engine result page, SERP) Liste de réponses à une requête dans un moteur de recherche. Page informative (information page, content page, focus page) Page web statique qui présente un contenu de qualité traitant d'un sujet précis. La page est rédigée à l'attention de la cible du site, mais elle est formatée pour faciliter l'accès aux robots d'indexation. Aussi appelée page de contenu ou page d'intérêt. 8/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Page hallway (hallway page) Plan du site créé spécifiquement pour les pages satellites dans un site web. PageRank Indice de popularité défini par Google. Note représentative de la fréquentation d'une page web et calculée par l'analyse de ses liens entrants. Le nombre et la qualité des liens pointant vers la page entrent en compte dans le calcul du PageRank. Pages miroirs (mirror pages) Exemplaires multiples de pages web, souvent sur différents serveurs, avec un contenu identique ou similaire. Les pages miroirs sont des pages satellites conçues sur mesure pour chaque moteur de recherche. Pages satellites (doorway pages, gateway pages, bridge pages) Pages web créées dans l'unique but d'obtenir les meilleures positions dans les moteurs de recherche sans chercher à satisfaire les visiteurs. Généralement générées par ordinateur, ces pages sont conçues pour obtenir un bon classement dans un moteur de recherche particulier et contiennent souvent du texte dissimulé. Synonyme de pages passerelles. Paiement au clic (PPC - pay per click) Mode de facturation utilisé pour la publicité dans les moteurs de recherche. L'annonceur paie une certaine somme à l'hébergeur chaque fois qu'un internaute clique sur un lien commercial conduisant à son site. PDF Initiales de Portable Document Format. Format universel mis au point par Adobe Systems pour son logiciel Acrobat. Un document PDF exploite les données de mise en forme de différentes applications de PAO telles que QuarkXPress et InDesign. Les fichiers PDF peuvent être téléchargés du Web et visualisés page par page, à condition que l'utilisateur dispose du logiciel gratuit Acrobat Reader. Péremption des liens (link rot ou linkrot) Les liens provenant d'un moteur de recherche, d'un annuaire ou d'un autre site sont dits périmés lorsqu'ils génèrent une erreur 404 du fait que le site de destination a été modifié avec de nouvelles URL ou que des pages web ont été supprimées du serveur. Permutation frauduleuse de pages (bait and switch) Opération qui consiste à soumettre une page web à un moteur de recherche ou à un annuaire web puis à la remplacer par une autre page présentant du spam ou un contenu sans rapport après référencement de la page initiale. Pertinence (relevancy) Mesure numérique faite par le moteur de recherche et indiquant à quel point une URL correspond aux termes saisis en requête. Portion non visible à l'ouverture (below the fold) Contenu d'une page web qui n'apparaît que lorsque l'utilisateur fait défiler la page vers le bas. Position usurpée (fake copy listing) Bonne position dans les moteurs de recherche obtenue en piratant le contenu d'une autre page web bien cotée. 9/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Positionnement (positioning) Dans les moteurs de recherche et les annuaires, classement des URL en fonction de leur pertinence par rapport à la requête. Les URL des pages les plus pertinentes sont présentées en haut de la liste de résultats. Précision (precision) Qualité et degré de pertinence des réponses à une requête. Première hauteur d'écran (above the fold) Désigne la portion de la page web visible à l'ouverture du document. Procédé frauduleux (spam) Techniques abusives servant à obtenir de meilleures positions dans les moteurs de recherche. Le spam se caractérise par l'emploi de mots, de code HTML et de scripts qui ne sont pas destinés à améliorer les pages pour le confort et la satisfaction des internautes. Processeur de requêtes (query processor) Composant du moteur de recherche, dont la fonction est de faire correspondre les mots saisis en requête avec la page web qui a les plus fortes probabilités de contenir l'information recherchée par l'utilisateur. Proéminence d'un mot clé (keyword prominence) Se réfère à la position d'un mot clé dans la hauteur de la page. Les mots qui apparaissent dans la première hauteur d'écran de la page, sans défilement, sont dits avoir une forte proéminence. Protocole d'exclusion aux robots (robots exclusion protocol) Fichier texte placé sur un serveur web pour commander aux robots de ne pas recenser les informations dans certaines zones du site web. La même fonction peut se définir au moyen d'une balise meta robots. Proximité des mots clés (keyword proximity) Se réfère à la distance entre les mots clés dans une page. Recherche approximative (fuzzy search) Recherche qui présente en résultat des correspondances partielles des mots de la requête, même mal orthographiés. La recherche approximative réduit les mots à leur racine pour tenter d'en trouver toutes les formes dérivées. Cette recherche repose sur les principes de la logique floue, qui est une discipline scientifique très pointue. En clair, l'approximation vous permet d'exprimer la notion de "peut-être", "presque" ou "à peu près" en code informatique. Recherche booléenne (boolean search) Recherche dans une base de données informatique (ou index d'un moteur de recherche) de mots qui décrivent au mieux le sujet en utilisant des opérateurs booléens tels que ET, OU et SAUF (AND, OR et NOT). Recherche par opérateurs de proximité (proximity search) Recherche dans laquelle l'utilisateur spécifie que les termes saisis en requête doivent se trouver voisins dans les documents trouvés en réponse. 10/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Recherche sémantique (concept search) Recherche de documents en rapport avec un ou plusieurs mots clés, ce n'est pas la même chose que la recherche de documents contenant les mots clés. Rédaction pour le Web (Web copywriting) Écriture de texte uniquement destiné à s'afficher dans des pages web et éventuellement dans les pages de résultats de recherche. Redirection HTML (meta refresh) Attribut dans une balise meta qui permet de remplacer une URL par une autre au bout du délai spécifié. Cette technique sert à conduire automatiquement les visiteurs d'une URL vers une autre. Référencement payant (pay for inclusion, PFI) En contrepartie d'un paiement, le moteur de recherche garantit que la page web sera intégrée à son index en quelques jours et qu'elle sera de nouveau explorée dans un délai donné. Regroupement (clustering) Présentation sélective d'une ou deux pages seulement par site web dans la page de résultats d'un moteur de recherche ou d'un annuaire web. Renvois internes (cross-linking) Mise en place de liens internes reliant les pages à l'intérieur d'un site web. Requête (query) Demande d'extraction d'une information précise dans une base de données. Robot Logiciel utilisé par les moteurs de recherche, qui visite toutes les URL du Web, suit tous les liens et recense toutes les pages qui contiennent du texte et auxquelles il a accès. Synonyme d'araignée, chenille, spider et crawler. En dehors du contexte des moteurs de recherche, le terme robot désigne un agent automatisé. Serveur (server) Dans le contexte du Web, ordinateur qui livre des pages web aux navigateurs et aux robots des moteurs de recherche. Site web (web site) Ensemble de pages web, résidant habituellement dans un même domaine, généralement formatées en HTML (Hypertext Markup Language) qui contiennent du texte, des images, des fichiers multimédias (son, vidéo ou animations) et du code JavaScript (ECMAScript) ou d'un autre langage de programmation. Sites miroirs (mirror sites) Exemplaires multiples d'un site web, souvent répartis sur différents serveurs, avec un contenu identique ou similaire. Cette technique sert à accroître artificiellement la popularité du site et sa visibilité dans les moteurs de recherche. Spam Voir Procédé frauduleux. 11/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. Substitution de pages (agent name delivery) Livraison nominative de pages web particulières adressées au robot d'un moteur de recherche. Le robot de Google, par exemple, porte le nom d'agent Googlebot. Grâce à cette technique, les robots et les internautes ne reçoivent pas la même page. Voir Dissimulation. Suivi des clics (click tracking, click-through popularity ou click-thru popularity) Dans le contexte du marketing axé sur les moteurs de recherche, comptabilise le nombre de clics sur un lien menant d'un moteur de recherche vers un site web et le temps passé sur le site par les visiteurs après avoir cliqué sur le lien depuis un moteur de recherche. Taux de transformation (conversion rate) Quotient du nombre de réponses positives à une incitation par le nombre total de visiteurs distincts d'une page. Par exemple, si dix visiteurs achètent un produit ou un service alors que cent personnes ont vu la page, celle-ci a un taux de transformation de dix pour cent. Télécharger (download) Récupérer des données d'une source distante vers un poste local. Les navigateurs téléchargent les pages web d'un serveur. Texte d'ancrage (anchor text) En HTML, texte inséré entre les balises <a> et </a>. Ce texte est la portion visible d'un lien textuel, mise en évidence par une mise en forme particulière. Texte de remplacement (alternative text) En HTML, texte ajouté dans la balise d'insertion d'une image. Si l'image ne peut pas s'afficher dans le navigateur, c'est le texte de remplacement qui apparaît. Texte masqué (hidden text) Texte dans une page web que les internautes ne voient pas dans leur navigateur mais qui est visible pour les robots d'indexation. Les principaux moteurs de recherche assimilent le masquage de texte à un procédé frauduleux quand il sert à augmenter artificiellement la densité des mots clés. Titre de la page (title) Texte placé entre les balises <title> et </title> dans une page web, qui apparaît dans la barre de titre du navigateur. Trafic (traffic) Fréquentation d'un site web, évaluée par le nombre de visiteurs uniques. Transférer (upload) Copier un fichier d'un ordinateur vers un autre ordinateur. URL Initiales de Uniform Ressouce Locator. Adresse désignant l'emplacement d'un fichier sur Internet. Dans le contexte du webmarketing, une URL est l'adresse d'un élément d'une page web ou d'un document web sur Internet. Tous les documents web et toutes les images sur le Web ont une URL propre. 12/13 Visibilité sur le Web – Shari Thurow (Pearson Education France, février 2008, 978-2-7440-2177-0) Tous droits réservés. URL dynamique (dynamic URL) URL d'une page web dynamique. Les URL dynamiques contiennent des caractères comme ?, =, %, cgi et cgi-bin. Usurpation d'IP (IP spoofing) Envoi de messages à un ordinateur en utilisant l'adresse IP d'une source de confiance afin d'accéder à l'ordinateur sans autorisation. L'usurpation d'IP est illégale dans de nombreux pays. Visite (visit) Représente un internaute unique qui a visité un site web à un moment donné. Durant la visite, l'internaute peut voir plusieurs pages web. Visite unique (unique visit) Désigne un internaute unique qui a visité un site web une ou plusieurs fois durant une période donnée. Web invisible (invisible Web) Pages ou sites web que les robots d'indexation ne peuvent pas explorer parce que leur contenu est hors d'atteinte dans une base de données. XHTML Initiales de Extensible Hypertext Markup Language. Le langage XHTML est destiné à remplacer le HTML par souci d’uniformisation et de respect des normes XML XML Initiales de Extensible Markup Language. Le code XML permet aux webdesigners de créer des balises personnalisées qui décrivent les données. 13/13