Université Hassan II Faculté des Sciences Juridiques Économiques et Sociales de MOHAMMEDIA ******* Master : Techniques de Modélisation Economiques & Econométrie –TMEE- TECHNIQUE DE RECHERCHE MOTEURS DE RECHERCHE ET ANNUAIRES INTRODUCTION PROBLÉMATIQUE “Comment trouver facilement et efficacement l’information sur Internet?” Plan : Introduction Sources d’Informations Les opérateurs logiques Annuaires de recherche thématique Moteurs de recherche Méta moteur LE CONTEXTE Internet équivalent à une bibliothèque dans laquelle, sans l'utilisation de repères et sans aide, il serait difficile de se retrouver devant le gisement des informations. Les premiers systèmes de recherche : Veronica (Very Easy Redent Oriented Net-wide Index to Computerized Archives). Recherche dans les titres Wais : outil de recherche texte intégral Réservé au monde clos des Universités naissance des services Yahoo!, Infoseek, Altavista. Financés par la publicité. LE CONTEXTE La concurrence des services oblige l'utilisateur à formuler sa requête différemment. Importance de l'aide en ligne. Les utilisateurs oublient cela et ne tapent que 1 ou 2 mots clés. Cela peut entraîner plus de 100.000 documents en réponse. Ce qui est demandé à un moteur n'est pas de donner l'exhaustivité sur 1 sujet mais plutôt les documents intéressants répondant à une problématique intelligence artificielle. Un outil de recherche n'est pas réservé au web, il permet aussi de rechercher : email Forums de discussion Logiciels, ... DOCUMENT INTERNET www.serveur.fr Une page sur Internet = un document HTML (HyperText Markup Language Longueur non définie Son nom : document.html ou document.htm Adresse (URL) http://www.serveur.fr/Repertoire/SousRepertoires/Document.html La page "document.html" se trouve sur une machine dont le nom est www.serveur.fr et sur cet ordinateur, la page se trouve dans le dossier sous répertoire lui même dans le dossier répertoire. Si le serveur ne trouve pas le document, il renvoie une erreur 404 : Not found, Page not found, Document not found. Ex : http://www.adit.fr/Produits/TF/tf.html On peut tenter de la retrouver par le sous répertoire. UN CONSTAT SUR LA PRATIQUE DE LA RECHERCHE - - 90 % se contentent des recherches les plus élémentaires (un ou deux mots clés). Des services très utiles de FAQ (Foire aux Questions), listes d'email, forums, sont méconnus des utilisateurs. LES SOURCES D’INFORMATIONS les sites officiels des entreprises/organismes Sites de références. On les trouve souvent par les moteurs thématiques Les pages bénévoles Inconvénient: vérifier la fiabilité des informations Avantage : on peut profiter du travail de recherche effectué par un passionné Les laboratoires de recherche/universités Thèses, travaux des étudiants. LES SOURCES D’INFORMATIONS Les bibliothèques : Ex : www.bnf.fr (Opale-BN) Plus de 200 millions de références Les sites gouvernementaux et institutionnels ex : Ministère des Finances, de l'Industrie, etc… Les banques de données Les organismes de presse Gratuits. Financés par de la publicité. Ex : www.globeonline.fr LES OPÉRATEURS LOGIQUES LES OPÉRATEURS LOGIQUES Opérateurs logiques (booléens) ET (AND) OU (OR) SAUF (NOT) Opérateurs de troncatures *, ?,… Opérateurs de proximité Proche (NEAR) LOGIQUE BOOLÉENNE 1/6 ET (AND) - + - Intersection - “tous les mots (all)” légume ET rond LOGIQUE BOOLÉENNE 2/6 ET (AND) - Intersection - “tous les mots (all)” légume ET rond ET rouge LOGIQUE BOOLÉENNE 3/6 OU (OR) - {espace} - Réunion - “un des mots (any)” légume OU rond LOGIQUE BOOLÉENNE 4/6 OU (OR) - Réunion - “un des mots (any)” légume OU rond OU rouge LOGIQUE BOOLÉENNE 5/6 Combinaison de ET et de OU Légume ET (rond OU rouge) LOGIQUE BOOLÉENNE 6/6 Combinaison de ET et de OU (Légume ET rond) OU rouge LES ANNUAIRES DE RECHERCHE PAR THÈMES PRINCIPE DE L’ANNUAIRE Nés en 1993 Il propose une recherche : - géographique - thématique - par mots clés On peut les assimiler à des pages jaunes mises à jour en permanence. Il propose un thesaurus interactif. Il va d'un thème le plus général vers le plus précis pour fournir à la fin une liste de sites. Exemple : faisons une recherche dans un annuaire YAHOO! (YET ANOTHER HIERARCHICAL OFFICIOUS ORACLE) Pour la petite histoire : date de création : avril 1994 par deux étudiants de l'Université de Stanford en 2009 : 1,4 milliards sites 8 898 millions de requêtes par jour YAHOO! RECHERCHE PAR MOTS CLÉS Ces recherches ne s'effectuent pas dans le texte intégral de la page mais par rapport aux indications enregistrées par l'auteur du site : le titre l'adresse deux lignes de commentaires noms des catégories choisies Lorsqu'il ne trouve pas, Yahoo! propose un résultat provenant du moteur d'Inktomi. YAHOO! CLASSEMENT Une fois les mots clés saisis, Yahoo! recherche les occurrences des mots indiqués. Son classement : - Nombre d'occurrences des mots trouvées par Yahoo! Si les mots sont présents dans la liste Mieux classés si parmi les 14 grandes catégories YAHOO! RECHERCHE PLUS AFFINÉE Le « ET » est symbolisé par le signe « + » Exemple 1 : +veille +technologique Présence obligatoire des deux mots dans la recherche Exemple 2 : veille technologique Recherche des sites contenant l'un des deux mots Important : veille +technologique est différent de +veille +technologique Dans le premier cas, recherche obligatoire "technologique" et éventuellement "veille" de YAHOO! RECHERCHE PLUS AFFINÉE Le « sauf » est symbolisé par le signe « - » exemple : +ordinateur +multimédia –apple Recherche sur une chaîne de caractères exemple : "virus informatique" Cherche les deux mots placés l'un à côté de l'autre YAHOO! RECHERCHE PLUS AFFINÉE Le joker est symbolisé par le signe « * » Sans joker : recherche exacte du mot Avec joker : recherche la correspondance exacte d'un début de mot suivi de tout ce qui se trouve d'autre commençant par d'autres lettres Exemple : Recherche avec Cap* : Cap Capitaine Capital … Important : Le joker se trouve toujours à la fin, jamais au début ou au milieu d'un mot. YAHOO! RESTREINDRE LA RECHERCHE Option t : Option u: recherche dans le titre uniquement recherche dans l'URL exemple 1 : t:Boulogne exemple 2 : u:ports YAHOO! RESTREINDRE LA RECHERCHE On peut mixer à loisir les options de recherche. Exemple : +t:ordinateur +PC –apple YAHOO! OPTIONS AVANCÉES AUTRES ANNUAIRES THÉMATIQUES International : Yahoo ! International Snap Open Directory Looksmart France Yahoo ! France Nomade MOTEURS DE RECHERCHE PAR MOTS CLÉS PRÉSENTATION La démarche logique d'un internaute qui recherche l'information est d'entrer une suite de mots clés. Un moteur de recherche indexe le texte intégral d'un site. L'utilisateur entrera une série de mots clés reliée par des opérateurs logiques. Le moteur ira chercher les occurrences de ces mots dans les pages sources et affichera le résultat des pages qui lui semble les plus pertinentes. INDEXATION DES PAGES Il existe deux façons d'indexer les pages dans un moteur de recherche : par le responsable du site : déclaration volontaire par le robot du moteur (spiders, crawlers, agents) qui parcourt automatiquement le Web en naviguant à travers les liens hypertextes. Important : La page ne sera pas indexée si d'autres sites Web n'y font pas référence GOOGLE GOOGLE http://www.google.fr Retour GOOGLE : UN MOTEUR DE RECHERCHE INTUITIF -L’intérêt de google réside dans le fait que google présente différentes catégories : -Recherche sur le web entier ou restreint aux sites français -Recherche d’image -Groupe de discussion par thème -Répertoires thématiques (médecines, économie …) -- Option intéressante “J’ai de la chance” qui permet une connexion directe au premier site qui est censé être le plus approprié Retour AUTRES OUTILS AUTRES OUTILS Moteurs de recherche géographique Exemple : http://www.w3.org/History/19921103hypertext/hypertext/DataSources/WWW/Servers.html (carte du monde continent pays villes Les FAQ (Frequently Asked Questions ou Foire aux Questions ou Forum aux Questions) Souvent présents dans les forums de discussions A consulter avant toute contribution à un forum Ex : http://www.pasteur.fr/infosci/FAQ/ What's New Exemple : Yahoo : http://www.yahoo.com/new UREC : http://web.urec.fr NCTech : http://nctech.fr/ MÉTAMOTEURS ET AGENTS INTELLIGENTS L ’idée : Plutôt que de passer du temps à effectuer des recherches, pourquoi ne pas confier la réalisation de cette tâche à un logiciel. Les métachercheurs ou métamoteurs "on-line" Outil permettant la recherche simultanée sur plusieurs moteurs de recherche : - - Metacrawler ProFusion Sawy Search MÉTAMOTEURS ET AGENTS INTELLIGENTS Les métamoteurs/chercheurs "off-line" Principe : interrogation "off-line" de plusieurs moteurs pour la même requête. Ces outils offrent la possibilité d'utiliser les opérateurs logiques (ET,OU, NOT…) Les plus connus : Copernic 2000 : existe en version : gratuite version "plus" : propose 50 domaines de recherche sur plus de 400 moteurs version "pro" : veille automatisée avec envoi d'informations par email sur les nouveaux documents trouvés automatisation des tâches vérificateur d'orthographe MÉTAMOTEURS ET AGENTS INTELLIGENTS Autres metamoteurs off line Strategic Finder http://www.strategicfinder.com/ Net Attaché Pro http://www.tympani.com/products/NAPro/NAPro.ht ml SERVICES DE RECHERCHE DE LOGICIELS Véritables outils de recherche fonctionnant sur mots clés et permettant de rechercher n’importe quel programme Exemple de services : Shareware.com http://www.shareware.com Download http://www.download.com Zdnet http://www.zdnet.com tucow http://www.tucow.com MÉTHODOLOGIE DE RECHERCHE ADRESSE EMAIL Hypothèse : on connaît le nom Recherche dans un annuaire d’email Service Whois Contact direct (tel, fax) forum soc.net-people (en dernier recours, si tout le reste a échoué). ADRESSE EMAIL Hypothèse : on ne connaît pas l’orthographe exacte mais on connaît l’entreprise Recherche par mot clé sur le nom de l’entreprise puis écrire à [email protected] Contact direct téléphone, fax RENSEIGNEMENTS SUR UNE PERSONNE On recherche un spécialiste d’un domaine précis sans disposer d’un nom en particulier Recherche dans un forum. Recherche du forum adéquat. Lire les messages. Récupérez l’Email Recherche dans les archives des forums Recherche dans les FAQ Recherche sur le Web Contribution dans les forums RECHERCHE D’UNE ENTREPRISE On connaît le nom Recherche intuitive sur le web par l ’adresse de l ’entreprise en .com, .fr, .net Recherche par un moteur en utilisant l ’option anchor:nom_de_l ’entreprise d’AltaVista Recherche sur l’url par l’option url:nom_de_l ’entreprise Recherche par mot clé pensez à mettre la première lettre en majuscule Interrogation par thème Interrogation par zone géographique RECHERCHE SUR DES THÈMES PRÉCIS La recherche est ponctuelle Interrogation par mots clés Interrogation par thèmes Lecture des FAQ Interrogation des forums adéquats RECHERCHE SUR DES THÈMES PRÉCIS Recherche régulière (veille) Inscription à des listes de diffusion lecture régulière des forums de discussion Services de revues de presse automatisés Presse en ligne Veille sur page Web Automatisation des recherches, sauvegarde des pages de recherche Bibliothèque, laboratoires de recherche Recherche dans les What ’s New RECHERCHE D’UN LOGICIEL Recherche sur des services comme shareware, download, zdnet, etc… Recherche sur un moteur de recherche CONCLUSION Voici donc un aperçu très rapide des possibilité qu’offre l’outils « Internet » lors d’une recherche Il faut surtout bien garder à l’esprit qu’Internet est un outils parmi d’autre qu’il faut apprendre à manipuler efficacement afin d’ouvrir les portes vers de nouvelles connaissances BIBLIOGRAPHIE WEBOGRAPHIE: www.lesmoteursderecherche.com www.forum.webrankinfo.com www.henri-ruch.ch www.kis.epfl.ch