v
RÉSUMÉ
Les publicités sur le web qui se présentent sous forme de liens textuels s’affichent dans les pages
de résultats des moteurs de recherche, suite aux requêtes des internautes par le biais des mots-
clés achetés par les annonceurs via un système d’enchères. Communément, les premières pages
du moteur de recherche offrent aux annonceurs de promouvoir les produits et services. Quand
une annonce s’affiche et qu’un internaute clique sur le lien correspondant, l’entreprise en
question paie le moteur de recherche. Afin de gérer son budget, une entreprise doit établir des
stratégies d’enchères; sélectionner un ensemble de mots-clés et déterminer un montant pour
chaque mot-clé. Les données historiques de ces mots-clés sont évidemment nécessaires pour
évaluer le comportement des requêtes des internautes sur les moteurs de recherches.
Les travaux présentés dans ce mémoire sont une suite d’un thème de recherche dont l’objectif est
de développer des algorithmes permettant d’améliorer le rendement des campagnes publicitaires
sur les moteurs de recherche. Dans cette optique un algorithme permettant d’affecter des
positions optimales aux mots-clés est développé de sorte que le nombre total de clics par
campagne est maximisé. En outre, une méthode de génération de courbes génériques est
proposée pour chaque mot-clé afin d’effectuer une prédiction à la fois du nombre de clics et du
coût par clic en fonction de sa position. Ces paramètres sont essentiels au programme
d’optimisation.
Nous présentons une approche de classification basée sur les techniques de data mining pour
l’extraction des connaissances cachées dans une base de données de mots-clés. Le but est de
déceler des comportements similaires au niveau des mots-clés et de les classifier par la suite. Si la
classification des mots-clés est optimale, on estime pouvoir obtenir des courbes génériques de
meilleure qualité.
Notre stratégie utilise beaucoup d'échantillons composés de différentes campagnes dans
différents types de marché sur le Web. Cette stratégie nous permet de conclure, lors de la
classification automatique, que le nombre de classes de mots-clés est approprié pour toutes les
campagnes publicitaires.