exposé d'info

publicité
Université Hassan II
Faculté des Sciences Juridiques Économiques et Sociales de MOHAMMEDIA
*******
Master : Techniques de Modélisation Economiques & Econométrie –TMEE-
TECHNIQUE DE RECHERCHE
MOTEURS DE RECHERCHE
ET ANNUAIRES
INTRODUCTION
PROBLÉMATIQUE
“Comment trouver facilement
et efficacement l’information
sur Internet?”
Plan :
 Introduction
 Sources
d’Informations
 Les opérateurs logiques
 Annuaires de recherche
thématique
 Moteurs de recherche
 Méta moteur
LE CONTEXTE


Internet équivalent à une bibliothèque dans laquelle,
sans l'utilisation de repères et sans aide, il serait
difficile de se retrouver devant le gisement des
informations.
Les premiers systèmes de recherche :
 Veronica (Very Easy Redent Oriented Net-wide
Index to Computerized Archives).

 Recherche dans les titres
 Wais : outil de recherche texte intégral
Réservé au monde clos des Universités
  naissance des services Yahoo!, Infoseek, Altavista.
  Financés par la publicité.

LE CONTEXTE


La concurrence des services oblige l'utilisateur à formuler
sa requête différemment. Importance de l'aide en ligne.
Les utilisateurs oublient cela et ne tapent que 1 ou
2 mots clés. Cela peut entraîner plus de 100.000
documents en réponse.
Ce qui est demandé à un moteur n'est pas de donner
l'exhaustivité sur 1 sujet mais plutôt les documents
intéressants répondant à une problématique


 intelligence artificielle.
Un outil de recherche n'est pas réservé au web, il permet
aussi de rechercher :



email
Forums de discussion
Logiciels, ...
DOCUMENT INTERNET

www.serveur.fr
Une page sur Internet = un document HTML
(HyperText Markup Language
Longueur non définie
 Son nom : document.html ou document.htm
 Adresse (URL)

http://www.serveur.fr/Repertoire/SousRepertoires/Document.html
La page "document.html" se trouve sur une machine dont
le nom est www.serveur.fr et sur cet ordinateur, la page
se trouve dans le dossier sous répertoire lui même dans
le dossier répertoire.

Si le serveur ne trouve pas le document, il renvoie
une erreur 404 : Not found, Page not found,
Document not found.
Ex : http://www.adit.fr/Produits/TF/tf.html
 On peut tenter de la retrouver par le sous
répertoire.

UN CONSTAT SUR LA PRATIQUE DE LA
RECHERCHE
-
-
90 % se contentent des recherches les plus
élémentaires (un ou deux mots clés).
Des services très utiles de FAQ (Foire aux
Questions), listes d'email, forums, sont méconnus
des utilisateurs.
LES SOURCES D’INFORMATIONS



les sites officiels des entreprises/organismes
Sites de références. On les trouve souvent par les moteurs
thématiques
Les pages bénévoles
Inconvénient: vérifier la fiabilité des informations
 Avantage : on peut profiter du travail de recherche effectué
par un passionné



Les laboratoires de recherche/universités
Thèses, travaux des étudiants.
LES SOURCES D’INFORMATIONS




Les bibliothèques :
 Ex : www.bnf.fr (Opale-BN)
 Plus de 200 millions de références
Les sites gouvernementaux et institutionnels
 ex : Ministère des Finances, de l'Industrie, etc…
Les banques de données
Les organismes de presse
 Gratuits. Financés par de la publicité.
 Ex : www.globeonline.fr
LES
OPÉRATEURS
LOGIQUES
LES OPÉRATEURS LOGIQUES
Opérateurs logiques (booléens)
ET (AND)
OU (OR)
SAUF (NOT)
Opérateurs de troncatures
*, ?,…
Opérateurs de proximité
Proche (NEAR)
LOGIQUE BOOLÉENNE 1/6

ET (AND) - + - Intersection - “tous les mots
(all)”
légume ET rond
LOGIQUE BOOLÉENNE 2/6

ET (AND) - Intersection - “tous les mots (all)”
légume ET rond ET rouge
LOGIQUE BOOLÉENNE 3/6

OU (OR) - {espace} - Réunion - “un des mots
(any)”
légume OU rond
LOGIQUE BOOLÉENNE 4/6

OU (OR) - Réunion - “un des mots (any)”
légume OU rond OU rouge
LOGIQUE BOOLÉENNE 5/6

Combinaison de ET et de OU
Légume ET (rond OU rouge)
LOGIQUE BOOLÉENNE 6/6

Combinaison de ET et de OU
(Légume ET rond) OU rouge
LES ANNUAIRES DE
RECHERCHE PAR
THÈMES
PRINCIPE DE L’ANNUAIRE





Nés en 1993
Il propose une recherche :
- géographique
- thématique
- par mots clés
On peut les assimiler à des pages jaunes mises à jour en
permanence.
Il propose un thesaurus interactif. Il va d'un thème le plus
général vers le plus précis pour fournir à la fin une liste de
sites.
Exemple : faisons une recherche dans un annuaire
YAHOO! (YET ANOTHER HIERARCHICAL
OFFICIOUS ORACLE)

Pour la petite histoire :
date de création : avril 1994 par deux étudiants de
l'Université de Stanford
 en 2009 :

1,4 milliards sites
 8 898 millions de requêtes par jour

YAHOO! RECHERCHE PAR MOTS CLÉS

Ces recherches ne s'effectuent pas dans le texte
intégral de la page mais par rapport aux
indications enregistrées par l'auteur du site :
le titre
 l'adresse
 deux lignes de commentaires
 noms des catégories choisies


Lorsqu'il ne trouve pas, Yahoo! propose un résultat
provenant du moteur d'Inktomi.
YAHOO! CLASSEMENT
Une fois les mots clés saisis, Yahoo! recherche les
occurrences des mots indiqués.
 Son classement :

-
Nombre d'occurrences des mots trouvées par Yahoo!
Si les mots sont présents dans la liste
Mieux classés si parmi les 14 grandes catégories
YAHOO! RECHERCHE PLUS AFFINÉE
 Le
« ET » est symbolisé par le signe « + »
Exemple 1 : +veille +technologique
Présence obligatoire des deux mots dans la recherche
 Exemple 2 : veille technologique
Recherche des sites contenant l'un des deux mots

 Important
: veille +technologique est
différent de +veille +technologique
Dans le premier cas, recherche obligatoire
"technologique" et éventuellement "veille"
de
YAHOO! RECHERCHE PLUS AFFINÉE
 Le


« sauf » est symbolisé par le signe « - »
exemple : +ordinateur +multimédia –apple
Recherche sur une chaîne de caractères
exemple : "virus informatique"
Cherche les deux mots placés l'un à côté de
l'autre

YAHOO! RECHERCHE PLUS AFFINÉE
 Le joker est symbolisé par le signe « * »
 Sans joker : recherche exacte du mot
 Avec joker : recherche la correspondance exacte d'un
début de mot suivi de tout ce qui se trouve d'autre
commençant par d'autres lettres
 Exemple :

Recherche avec Cap* :
 Cap
 Capitaine
 Capital
 …
 Important
: Le joker se trouve toujours à
la fin, jamais au début ou au milieu d'un
mot.
YAHOO! RESTREINDRE LA RECHERCHE

Option t :


Option u:


recherche dans le titre uniquement
recherche dans l'URL
exemple 1 :
t:Boulogne

exemple 2 :
u:ports
YAHOO! RESTREINDRE LA RECHERCHE

On peut mixer à loisir les options de recherche.

Exemple : +t:ordinateur +PC –apple
YAHOO! OPTIONS AVANCÉES
AUTRES ANNUAIRES THÉMATIQUES
International
:
Yahoo ! International
 Snap
 Open Directory
 Looksmart

France
Yahoo ! France
 Nomade

MOTEURS DE
RECHERCHE PAR
MOTS CLÉS
PRÉSENTATION
 La
démarche logique d'un internaute qui
recherche l'information est d'entrer une suite
de mots clés.
 Un moteur de recherche indexe le texte
intégral d'un site.
 L'utilisateur entrera une série de mots clés
reliée par des opérateurs logiques. Le moteur
ira chercher les occurrences de ces mots dans
les pages sources et affichera le résultat des
pages qui lui semble les plus pertinentes.
INDEXATION DES PAGES
Il existe deux façons d'indexer les pages
dans un moteur de recherche :


par le responsable du site : déclaration
volontaire
par le robot du moteur (spiders, crawlers,
agents) qui parcourt automatiquement le Web
en naviguant à travers les liens hypertextes.
Important : La page ne sera pas indexée si
d'autres sites Web n'y font pas référence
GOOGLE
GOOGLE
http://www.google.fr
Retour
GOOGLE : UN MOTEUR DE
RECHERCHE INTUITIF
-L’intérêt
de google réside dans le fait que google présente
différentes catégories :
-Recherche
sur le web entier ou restreint aux sites français
-Recherche d’image
-Groupe de discussion par thème
-Répertoires thématiques (médecines, économie …)
--
Option intéressante “J’ai de la chance” qui permet une connexion
directe au premier site qui est censé être le plus approprié
Retour
AUTRES OUTILS
AUTRES OUTILS

Moteurs de recherche géographique
Exemple :
http://www.w3.org/History/19921103hypertext/hypertext/DataSources/WWW/Servers.html
(carte du monde  continent  pays  villes


Les FAQ (Frequently Asked Questions ou Foire
aux Questions ou Forum aux Questions)




Souvent présents dans les forums de discussions
A consulter avant toute contribution à un forum
Ex : http://www.pasteur.fr/infosci/FAQ/
What's New

Exemple :



Yahoo : http://www.yahoo.com/new
UREC : http://web.urec.fr
NCTech : http://nctech.fr/
MÉTAMOTEURS ET AGENTS INTELLIGENTS
L ’idée : Plutôt que de passer du temps à effectuer des
recherches, pourquoi ne pas confier la réalisation de cette
tâche à un logiciel.

Les métachercheurs ou métamoteurs "on-line"

Outil permettant la recherche simultanée sur plusieurs
moteurs de recherche :
-
-
Metacrawler
ProFusion
Sawy Search
MÉTAMOTEURS ET AGENTS INTELLIGENTS

Les métamoteurs/chercheurs "off-line"
Principe : interrogation "off-line" de plusieurs moteurs pour la
même requête.
 Ces outils offrent la possibilité d'utiliser les opérateurs
logiques (ET,OU, NOT…)
 Les plus connus :


Copernic 2000 : existe en version :



gratuite
version "plus" : propose 50 domaines de recherche sur plus de 400
moteurs
version "pro" :



veille automatisée avec envoi d'informations par email sur les nouveaux
documents trouvés
automatisation des tâches
vérificateur d'orthographe
MÉTAMOTEURS ET AGENTS INTELLIGENTS

Autres metamoteurs off line

Strategic Finder
http://www.strategicfinder.com/

Net Attaché Pro
http://www.tympani.com/products/NAPro/NAPro.ht
ml
SERVICES DE RECHERCHE DE LOGICIELS
 Véritables
outils de recherche
fonctionnant sur mots clés et
permettant de rechercher n’importe
quel programme
 Exemple de services :




Shareware.com http://www.shareware.com
Download http://www.download.com
Zdnet http://www.zdnet.com
tucow http://www.tucow.com
MÉTHODOLOGIE DE
RECHERCHE
ADRESSE EMAIL
Hypothèse : on connaît le nom
 Recherche dans un annuaire d’email
 Service Whois
 Contact direct (tel, fax)
 forum soc.net-people (en dernier recours, si tout le
reste a échoué).
ADRESSE EMAIL
Hypothèse : on ne connaît pas l’orthographe
exacte mais on connaît l’entreprise
 Recherche par mot clé sur le nom de l’entreprise puis
écrire à [email protected]
 Contact direct téléphone, fax
RENSEIGNEMENTS SUR UNE PERSONNE
On recherche un spécialiste d’un domaine précis
sans disposer d’un nom en particulier
 Recherche dans un forum. Recherche du
forum adéquat. Lire les messages. Récupérez
l’Email
 Recherche dans les archives des forums
 Recherche dans les FAQ
 Recherche sur le Web
 Contribution dans les forums
RECHERCHE D’UNE ENTREPRISE
On connaît le nom
 Recherche intuitive sur le web par
l ’adresse de l ’entreprise en .com, .fr, .net
 Recherche par un moteur en utilisant
l ’option anchor:nom_de_l ’entreprise
d’AltaVista
 Recherche sur l’url par l’option
url:nom_de_l ’entreprise
 Recherche par mot clé pensez à mettre la
première lettre en majuscule
 Interrogation par thème
 Interrogation par zone géographique
RECHERCHE SUR DES THÈMES PRÉCIS
La recherche est ponctuelle
 Interrogation par mots clés
 Interrogation par thèmes
 Lecture des FAQ
 Interrogation des forums adéquats
RECHERCHE SUR DES THÈMES PRÉCIS
Recherche régulière (veille)
 Inscription à des listes de diffusion
 lecture régulière des forums de discussion
 Services de revues de presse automatisés
 Presse en ligne
 Veille sur page Web
 Automatisation des recherches,
sauvegarde des pages de recherche
 Bibliothèque, laboratoires de recherche
 Recherche dans les What ’s New
RECHERCHE D’UN LOGICIEL
 Recherche sur des services comme shareware,
download, zdnet, etc…
 Recherche sur un moteur de recherche
CONCLUSION
Voici donc un aperçu très rapide des possibilité
qu’offre l’outils « Internet » lors d’une recherche
 Il faut surtout bien garder à l’esprit qu’Internet
est un outils parmi d’autre qu’il faut apprendre à
manipuler efficacement afin d’ouvrir les portes
vers de nouvelles connaissances

BIBLIOGRAPHIE

WEBOGRAPHIE:
www.lesmoteursderecherche.com
www.forum.webrankinfo.com
www.henri-ruch.ch
www.kis.epfl.ch
Téléchargement