Cloud Computing et MapReduce
Parall´elisation de l’algorithme K-means
Parall´elisation de l’algorithme Apriori
Notre approche
Introduction `a MapReduce
MapReduce
MapReduce est un framework de d´eveloppement informatique,
introduit par Google, dans lequel sont effectu´es des calculs
parall`eles, et souvent distribu´es, de donn´ees potentiellement
tr`es volumineuses ( Terabyte et plus).
Les terminologies de Map et Reduce, sont emprunt´ees aux
langages de programmation fonctionnelle utilis´es pour leur
construction.
MapReduce s’articule en deux ´etapes (fonctions) :
Map :
prend en argument un enregistrement,
calcule une liste de couples clef/valeur interm´ediaires.
Reduce :
prend en argument une clef et la liste des valeurs interm´ediaire
g´en´er´ees par les diff´erentes instances de la fonction Map,
effectue un traitement.
s´eminaire de recherche@LARIS Fouille de donn´ees parall`ele et MapReduce