UNIVERSITÉ DE MONTRÉAL
CLASSIFICATION DE MOTS-CLÉS DES CAMPAGNES PUBLICITAIRES
SUR LES MOTEURS DE RECHERCHE ET CALCUL DE PRÉVISIONS
CHAKIR ASSARI
DÉPARTEMENT DE MATHÉMATIQUES ET DE GÉNIE INDUSTRIEL
ÉCOLE POLYTECHNIQUE DE MONTRÉAL
MÉMOIRE PRÉSENTÉ EN VUE DE L’OBTENTION
DU DIPLÔME DE MAÎTRISE ÈS SCIENCES APPLIQUÉES
(GÉNIE INDUSTRIEL)
AOÛT 2014
© Chakir Assari, 2014.
UNIVERSITÉ DE MONTRÉAL
ÉCOLE POLYTECHNIQUE DE MONTRÉAL
Ce mémoire intitulé :
CLASSIFICATION DE MOTS-CLÉS DES CAMPAGNES PUBLICITAIRES SUR LES
MOTEURS DE RECHERCHE ET CALCUL DE PRÉVISIONS
présenté par : ASSARI Chakir
en vue de l’obtention du diplôme de : Maîtrise ès sciences appliquées
a été dûment accepté par le jury d’examen constitué de :
M. AGARD Bruno, Doct., président
M. GAMACHE Michel, Ph.D., membre et directeur de recherche
M. ADJENGUE Luc, Ph.D., membre et codirecteur de recherche
M. PARTOVI NIA Vahid, Doct., membre
iii
DÉDICACE
Je dédie ce mémoire aux deux êtres les plus chers à mon cœur, ma mère et mon père qui sont
l’essence de mon existence.
iv
REMERCIEMENTS
Tout d'abord, je remercie grandement mon directeur de recherche, Michel Gamache, qui m'a
proposé ce thème et qui m'a guidé le long de sa réalisation.
Je ne saurais être reconnaissant envers lui pour sa patience et de son soutien, c’est pourquoi je lui
suis toujours redevable.
Je tiens aussi à remercier mon co-directeur, Luc Adjengue, pour m’avoir accordé son aide, son
expertise, son conseil et sa disponibilité durant mon projet.
Je remercie également mes deux professeurs, Bruno Agard et Vahid Partovi Nia, qui m’ont
enseigné les méthodes et les techniques de Data Mining. Sans oublier leurs rencontres organisées
qui m’ont beaucoup aidé dans ma recherche.
J’exprime pareillement ma gratitude envers Sandrine Paroz de la compagnie d’Acquisio, qui m’a
orienté et fourni les données nécessaires à la réalisation de ce projet. Sans bien sûr oublier
Mohammed et Younes d’Acquisio qui m’ont initié le code nécessaire à l’apprentissage du
langage SQL. Tous mes remerciements à l’équipe d’Acquisio pour m’avoir accordé leur temps
nécessaire à la réalisation de mon projet.
Je remercie mon ami le linguiste Mounir Zaidi et Riad Kechroud, qui m’ont aidé dans la
rédaction de ce mémoire.
Je conclue les expressions de ma profonde gratitude en remerciant ma famille, mon épouse et
mes deux enfants, Imène et Ayoub, qui ont toujours été pour me procurer la joie de vivre et
être ma flamme qui me donne davantage l’énergie suffisante me laissant toujours aller de l’avant.
v
RÉSUMÉ
Les publicités sur le web qui se présentent sous forme de liens textuels s’affichent dans les pages
de résultats des moteurs de recherche, suite aux requêtes des internautes par le biais des mots-
clés achetés par les annonceurs via un système d’enchères. Communément, les premières pages
du moteur de recherche offrent aux annonceurs de promouvoir les produits et services. Quand
une annonce s’affiche et qu’un internaute clique sur le lien correspondant, l’entreprise en
question paie le moteur de recherche. Afin de gérer son budget, une entreprise doit établir des
stratégies d’enchères; sélectionner un ensemble de mots-clés et déterminer un montant pour
chaque mot-clé. Les données historiques de ces mots-clés sont évidemment nécessaires pour
évaluer le comportement des requêtes des internautes sur les moteurs de recherches.
Les travaux présentés dans ce mémoire sont une suite d’un thème de recherche dont lobjectif est
de développer des algorithmes permettant d’améliorer le rendement des campagnes publicitaires
sur les moteurs de recherche. Dans cette optique un algorithme permettant d’affecter des
positions optimales aux mots-clés est développé de sorte que le nombre total de clics par
campagne est maximisé. En outre, une méthode de génération de courbes génériques est
proposée pour chaque mot-clé afin d’effectuer une prédiction à la fois du nombre de clics et du
coût par clic en fonction de sa position. Ces paramètres sont essentiels au programme
d’optimisation.
Nous présentons une approche de classification basée sur les techniques de data mining pour
l’extraction des connaissances cachées dans une base de données de mots-clés. Le but est de
déceler des comportements similaires au niveau des mots-clés et de les classifier par la suite. Si la
classification des mots-clés est optimale, on estime pouvoir obtenir des courbes génériques de
meilleure qualité.
Notre stratégie utilise beaucoup d'échantillons composés de différentes campagnes dans
différents types de marché sur le Web. Cette stratégie nous permet de conclure, lors de la
classification automatique, que le nombre de classes de mots-clés est approprié pour toutes les
campagnes publicitaires.
1 / 117 100%