Atelier 2 : « Va donc chercher sur Google » S’informer via les moteurs de recherche Brigitte Simonnot Université de Lorraine, Crem [email protected] Séminaire ESPÉ DANE - Pépinière 4.1 18 octobre 2016 Atelier de réflexion Les moteurs de recherche web sont insérés dans nos pratiques quotidiennes Objectif : réfléchir à la manière dont les moteurs de recherche du web peuvent être « invités » dans les pratiques d’apprentissage en contexte scolaire 2 Sommaire • Point sur les connaissances Qu’est-ce qu’un moteur de recherche web ? Quels moteurs ? • Intégrer une activité de recherche d’information en ligne en formation Questions à se poser, objectifs, compétences développées • Questions/réponses 3 Qu’est-ce qu’un moteur web ? Approche fonctionnelle (comment çà marche) Approche socioéconomique et éthique B. Simonnot - CC by nc sa 4 Fonctionnement d’un moteur web Technologie combinant divers « modules » qui automatisent le repérage des sources, la collecte des pages et documents en ligne, la caractérisation des pages web le traitement des demandes des internautes 5 Web Collecte des pages Mise en mots interprétation Pages en cache Indexation Index ? Moteur - Opérations automatisées Requête Appariement Classement des résultats Analyse des résultats et accès aux pages B. Simonnot - CC by nc sa 6 Un moteur de recherche, c’est au moins 4 composants : • • • • la collecte des documents en ligne l’indexation automatique des pages l’appariement et le classement des résultats pour une requête une interface de recherche (barre d’interrogation, consultation des résultats) 7 La collecte des pages Ensemble initial de pages web Collecte des liens dans ces pages … Collecte des liens dans ces pages Web invisible Web visible Sous ensemble de pages web 8 La collecte des pages • La collecte n’est jamais exhaustive (web invisible = partie du web non accessibles aux moteurs) Chaque moteur a sa « recette » pour la collecte • Fréquence des mises à jour (passage périodique et variable sur les pages déjà visitées) • Conservation des pages collectées (en « cache ») 9 L’indexation automatique = « extraction » des mots de la page mot = suite de caractères entre deux séparateurs comme l’espace ou les signes de ponctuation, sans tenir compte du sens Problème : ambiguïtés du langage (homonymie, synonymie, etc.) Ex : paris 10 Interroger un moteur A chaque moteur sa syntaxe d’interrogation mot1 mot2 pour trouver des pages décrites par mot1 ET mot2 mot1 –mot2 pour les pages contenant mot1 mais pas mot2 "expression exacte" entre guillemets mais pas de standards : +mot1 Bing = la page doit contenir « mot1 » Google = chercher des pages Google+ ou des groupes sanguins 11 Interroger un moteur… pour trouver l’aide Google (sd), Aide recherche web https://support.google.com/websearch/answer/134479?hl=fr 12 L’indispensable classement des résultats Environ 1 710 000 000 résultats B. Simonnot - CC by nc sa 13 Classement des résultats Sont privilégiées les pages dont le titre contient les mots de la requête dont l’adresse (URL) contient le mot où le mot revient souvent, surtout au début du texte … (+ de 500 critères)… + pages souvent citées par d’autres sites (PagerankTM Google) Critères de classement = « secret » des moteurs (enjeux économiques importants) 14 Diversité des moteurs B. Simonnot - CC by nc sa 15 Source : https://fr.wikipedia.org/wiki/Liste_de_moteurs_de_recherche B. Simonnot - CC by nc sa 16 Mais… quid des usages effectifs ? Pour mémoire, en 2009 : B. Simonnot - CC by nc sa 17 Source: Journal du Net (25/07/15) Parts de marché des moteurs de recherche en France http://www.journaldunet.com/ebusiness/le-net/1087481-parts-de-marche-des-moteurs-de-recherche-en-france/ B. Simonnot - CC by nc sa 18 Paradoxe De plus en plus de publications en ligne (le web propose une multitude d’informations hétérogènes) mais des portes d’accès étroites (les moteurs que nous utilisons sont très peu nombreux ) 19 Qu’est-ce qu’un moteur web? Un dispositif technologique qui permet d’accéder à l’information en ligne sur n’importe quel sujet Moteurs commerciaux Utilisation non payante, rémunérée par la publicité Quel impact la publicité a-t-elle sur le classement des résultats « éditoriaux » ? 20 Tous les moteurs ne sont pas équivalents Certains ont un 5ème module : captation des « traces » des internautes Les « traces » permettent de « personnaliser » les annonces publicitaires (l’historique du navigateur ou la géolocalisation aussi) Respect de la vie privée des internautes ? Droit à l’oubli (Cf. arrêt de la Cour de justice de l’Union européenne, 2014 et la CNIL) 21 Traçage des internautes Les requêtes des internautes sont mémorisées et recyclées suggestions lors de la saisie dont suggestions d’orthographe (sans dictionnaire) 22 Des alternatives aux Gafa* Crédit image : O. Ertzscheid (affordance.typepad.com/) *Gafa = Google, Amazon, Facebook, Apple (les multinationales du numérique et du web) B. Simonnot - CC by nc sa 23 https://duckduckgo.com/ B. Simonnot - CC by nc sa 24 http://www.qwant.com B. Simonnot - CC by nc sa 25 http://www.qwantjunior.com B. Simonnot - CC by nc sa 26 Intégrer une activité de recherche d’information en ligne en formation Questions à se poser Objectifs Compétences développées B. Simonnot - CC by nc sa 27 Chercher soi-même l’information est gratifiant Valeurs mises en avant par les usagers des moteurs : • Sensation d’autonomie (vs dépendance vis-à-vis de l’outil) • Réussite perçue, sentiment de performance (vs manque d’évaluation) • Plaisir : variété des informations trouvées, stimulation liée à la découverte de résultats, interface qui plaît • Confiance liée à la réputation du moteur (vs esprit critique et pouvoir) • Sécurité, conformité : à la marge [enquête par questionnaire auprès d’étudiants de 1ère année de licence, Simonnot, 2009] 28 Quelques questions pour penser un scénario d’usage en éducation • Quelles consignes ? Recherche sur un sujet prescrit vs sujet libre • Temporalité : en amont, pendant ou en aval d’une réalisation pendant les cours ou en dehors • Quel accompagnement prévu (en est-il besoin) ? Aspects éthiques : • retour critique sur l’information trouvée (comment trouver mieux ?) • apprendre à citer les sources (éviter le plagiat) 29 Martine Peters, 2015 B. Simonnot - CC by nc sa 30 Les enjeux Acquérir une culture de l’information − Connaître les sources d’information − Savoir reconnaître un besoin d’information choisir l’outil de recherche adapté formuler une requête et affiner repérer et qualifier l’information utiliser l’information et la partager Dans les établissements secondaires, les professeurs documentalistes peuvent aider à organiser des séquences de formation 31 Merci pour votre attention, place aux questions B. Simonnot - CC by nc sa 32 Annexe : consulter l’aide en ligne des moteurs • Comment utiliser de manière plus efficace un moteur web ? − Aide Bing : http://help.bing.microsoft.com/#apex/18/en-us/10002/-1 (en anglais) ou http://www.microsoft.com/france/bing/ - Aide DuckDuckGo : https://duck.co/help/results/syntax (en anglais) - Aide Google : https://support.google.com/websearch/answer/134479?hl=fr - Aide Qwant ? Si vous trouvez l’aide en ligne sur les sites des moteurs, c’est que vous savez déjà chercher… 33