Improving large-scale search engines
with semantic annotations
Damaris Fuentes-Lorenzo, Norberto Fernández, Jesús A. Fisteus, Luis Sánchez
Plan de la présentation
Introduction
Etat de l’art
Lalgorithme proposé
Le système implémenté
Résultats expérimentaux et discussion
Conclusion et travaux à venir
Conclusion personnelle et questions
Introduction
Plus de 25.21 billions de pages web depuis la création du web
(Worldwidewebsize.com, 2012)
Recherche d’information difficile
Utilisation des moteurs de recherche
2 problèmes principaux
Modèles basés sur la recherche de mots clés
Tâche de recherche extrêmement chronophage
Opinions d’autres utilisateurs peuvent améliorer les résultats
Etat de l’art
Exploitation des informations utilisateurs dans le processus de recherche
Méthode de collecte des données
« click through data »
Filtrage et tagging collaboratif
Algorithmes de ranking et systèmes de recherche sémantique existants
Pagerank Google
web search clustering
Sensebot
Moteurs de recherche tirer profit du tagging
3 approches d’indexation (naïve, co-occurrence, adaptative)
Lalgorithme proposé
Tire avantage des approches et fonctionnalités expliquées pour améliorer
le ranking des résultats
4 grands principes
Usage collaboratif des logs et des annotations sémantiques
Désambiguisation
Extension des possibilités des moteurs de recherche traditionnels
Un temps de réponse bas pour l’obtention des résultats
Important à préciser l’algorithme proposé utilise des informations
récoltées pendant tout le processus de recherche
1 / 18 100%