Support - Maison pour la science

publicité
Atelier 2 : « Va donc chercher
sur Google »
S’informer via les moteurs de recherche
Brigitte Simonnot
Université de Lorraine, Crem
[email protected]
Séminaire ESPÉ DANE - Pépinière 4.1
18 octobre 2016
Atelier de réflexion
Les moteurs de recherche web sont insérés dans nos
pratiques quotidiennes
Objectif :
réfléchir à la manière dont les moteurs de recherche du
web peuvent être « invités » dans les pratiques
d’apprentissage en contexte scolaire
2
Sommaire
• Point sur les connaissances
Qu’est-ce qu’un moteur de recherche web ?
Quels moteurs ?
• Intégrer une activité de recherche d’information en ligne en
formation
Questions à se poser, objectifs, compétences développées
• Questions/réponses
3
Qu’est-ce qu’un moteur web ?
Approche fonctionnelle (comment çà marche)
Approche socioéconomique et éthique
B. Simonnot - CC by nc sa
4
Fonctionnement d’un moteur web
Technologie combinant divers « modules » qui automatisent
le repérage des sources,
la collecte des pages et documents en ligne,
la caractérisation des pages web
le traitement des demandes des internautes
5
Web
Collecte des pages
Mise en mots
interprétation
Pages en cache
Indexation
Index
?
Moteur - Opérations automatisées
Requête
Appariement
Classement des
résultats
Analyse des résultats
et accès aux pages
B. Simonnot - CC by nc sa
6
Un moteur de recherche, c’est
au moins 4 composants :
•
•
•
•
la collecte des documents en ligne
l’indexation automatique des pages
l’appariement et le classement des résultats pour une requête
une interface de recherche (barre d’interrogation, consultation des résultats)
7
La collecte des pages
Ensemble initial
de pages web
Collecte des liens
dans ces pages
…
Collecte des liens
dans ces pages
Web invisible
Web visible
Sous ensemble
de pages web
8
La collecte des pages
• La collecte n’est jamais exhaustive (web invisible = partie du web non
accessibles aux moteurs)
Chaque moteur a sa « recette » pour la collecte
• Fréquence des mises à jour (passage périodique et variable sur les
pages déjà visitées)
• Conservation des pages collectées (en « cache »)
9
L’indexation automatique
= « extraction » des mots de la page
mot = suite de caractères entre deux séparateurs comme l’espace ou les signes
de ponctuation, sans tenir compte du sens
Problème : ambiguïtés du langage (homonymie, synonymie, etc.)
Ex : paris
10
Interroger un moteur
A chaque moteur sa syntaxe d’interrogation
mot1 mot2 pour trouver des pages décrites par mot1 ET mot2
mot1 –mot2 pour les pages contenant mot1 mais pas mot2
"expression exacte" entre guillemets
mais pas de standards :
+mot1 Bing = la page doit contenir « mot1 »
Google = chercher des pages Google+ ou des groupes sanguins
11
Interroger un moteur… pour trouver l’aide
Google (sd), Aide recherche web
https://support.google.com/websearch/answer/134479?hl=fr
12
L’indispensable classement des résultats
Environ 1 710 000 000 résultats
B. Simonnot - CC by nc sa
13
Classement des résultats
Sont privilégiées les pages
dont le titre contient les mots de la requête
dont l’adresse (URL) contient le mot
où le mot revient souvent, surtout au début du texte
… (+ de 500 critères)…
+ pages souvent citées par d’autres sites (PagerankTM Google)
Critères de classement = « secret » des moteurs
(enjeux économiques importants)
14
Diversité des moteurs
B. Simonnot - CC by nc sa
15
Source : https://fr.wikipedia.org/wiki/Liste_de_moteurs_de_recherche
B. Simonnot - CC by nc sa
16
Mais…
quid des usages effectifs ?
Pour mémoire, en 2009 :
B. Simonnot - CC by nc sa
17
Source: Journal du Net (25/07/15) Parts de marché des moteurs de recherche en France
http://www.journaldunet.com/ebusiness/le-net/1087481-parts-de-marche-des-moteurs-de-recherche-en-france/
B. Simonnot - CC by nc sa
18
Paradoxe
De plus en plus de publications en ligne
(le web propose une multitude d’informations hétérogènes)
mais
des portes d’accès étroites
(les moteurs que nous utilisons sont très peu nombreux )
19
Qu’est-ce qu’un moteur web?
Un dispositif technologique qui permet d’accéder à
l’information en ligne sur n’importe quel sujet
Moteurs commerciaux
Utilisation non payante, rémunérée par la publicité
Quel impact la publicité a-t-elle sur le classement des résultats
« éditoriaux » ?
20
Tous les moteurs ne sont pas équivalents
Certains ont un 5ème module : captation des « traces » des internautes
Les « traces » permettent de « personnaliser » les annonces
publicitaires (l’historique du navigateur ou la géolocalisation aussi)
Respect de la vie privée des internautes ?
Droit à l’oubli (Cf. arrêt de la Cour de justice de l’Union européenne,
2014 et la CNIL)
21
Traçage des internautes
Les requêtes des internautes sont mémorisées et
recyclées
suggestions lors de la saisie
dont suggestions d’orthographe (sans dictionnaire)
22
Des alternatives aux Gafa*
Crédit image : O. Ertzscheid (affordance.typepad.com/)
*Gafa = Google, Amazon, Facebook, Apple (les multinationales du numérique et du web)
B. Simonnot - CC by nc sa
23
https://duckduckgo.com/
B. Simonnot - CC by nc sa
24
http://www.qwant.com
B. Simonnot - CC by nc sa
25
http://www.qwantjunior.com
B. Simonnot - CC by nc sa
26
Intégrer une activité de recherche
d’information en ligne en formation
Questions à se poser
Objectifs
Compétences développées
B. Simonnot - CC by nc sa
27
Chercher soi-même l’information est gratifiant
Valeurs mises en avant par les usagers des moteurs :
• Sensation d’autonomie (vs dépendance vis-à-vis de l’outil)
• Réussite perçue, sentiment de performance (vs manque d’évaluation)
• Plaisir : variété des informations trouvées, stimulation liée à la
découverte de résultats, interface qui plaît
• Confiance liée à la réputation du moteur (vs esprit critique et pouvoir)
• Sécurité, conformité : à la marge
[enquête par questionnaire auprès d’étudiants de 1ère année de licence, Simonnot, 2009]
28
Quelques questions pour penser un scénario
d’usage en éducation
• Quelles consignes ? Recherche sur un sujet prescrit vs sujet libre
• Temporalité : en amont, pendant ou en aval d’une réalisation
pendant les cours ou en dehors
• Quel accompagnement prévu (en est-il besoin) ?
Aspects éthiques :
• retour critique sur l’information trouvée (comment trouver mieux ?)
• apprendre à citer les sources (éviter le plagiat)
29
Martine Peters, 2015
B. Simonnot - CC by nc sa
30
Les enjeux
Acquérir une culture de l’information
− Connaître les sources d’information
− Savoir
reconnaître un besoin d’information
choisir l’outil de recherche adapté
formuler une requête et affiner
repérer et qualifier l’information
utiliser l’information et la partager
Dans les établissements secondaires, les professeurs documentalistes peuvent
aider à organiser des séquences de formation
31
Merci pour votre attention,
place aux questions
B. Simonnot - CC by nc sa
32
Annexe : consulter l’aide en ligne des moteurs
• Comment utiliser de manière plus efficace un moteur web ?
− Aide Bing : http://help.bing.microsoft.com/#apex/18/en-us/10002/-1 (en anglais)
ou http://www.microsoft.com/france/bing/
- Aide DuckDuckGo : https://duck.co/help/results/syntax (en anglais)
- Aide Google : https://support.google.com/websearch/answer/134479?hl=fr
- Aide Qwant ?
Si vous trouvez l’aide en ligne sur les sites des moteurs,
c’est que vous savez déjà chercher…
33
Téléchargement