Mineure « Data Science » Frédéric Pennerath
Objectifs
1. Démystifier les moteurs de recherche :
–Problème résolu depuis longtemps (bases documentaires)
–Théorie très simple : recherche linéaire dans des listes
2. Prétexte à introduire des notions connexes
–Modèles IR : modèle booléen, vectoriel, probabiliste
–Algorithmique : indexation, optimisation des requêtes, B-tree, correction
orthographique
–Fouille de texte et traitement automatique du langage naturel (TALN)
–Problématique du Big Data : parallélisme des données (Map Reduce), NoSQL
–Techniques Web : crawling /scraping