IMG

UNIVERSITÉ DE MONTRÉAL

CLASSIFICATION DE MOTS-CLÉS DES CAMPAGNES PUBLICITAIRES

SUR LES MOTEURS DE RECHERCHE ET CALCUL DE PRÉVISIONS

CHAKIR ASSARI

DÉPARTEMENT DE MATHÉMATIQUES ET DE GÉNIE INDUSTRIEL

ÉCOLE POLYTECHNIQUE DE MONTRÉAL

MÉMOIRE PRÉSENTÉ EN VUE DE L’OBTENTION

DU DIPLÔME DE MAÎTRISE ÈS SCIENCES APPLIQUÉES

(GÉNIE INDUSTRIEL)

AOÛT 2014

UNIVERSITÉ DE MONTRÉAL

ÉCOLE POLYTECHNIQUE DE MONTRÉAL

Ce mémoire intitulé :

CLASSIFICATION DE MOTS-CLÉS DES CAMPAGNES PUBLICITAIRES SUR LES

MOTEURS DE RECHERCHE ET CALCUL DE PRÉVISIONS

présenté par : ASSARI Chakir

en vue de l’obtention du diplôme de : Maîtrise ès sciences appliquées

a été dûment accepté par le jury d’examen constitué de :

M. AGARD Bruno, Doct., président

M. GAMACHE Michel, Ph.D., membre et directeur de recherche

M. ADJENGUE Luc, Ph.D., membre et codirecteur de recherche

M. PARTOVI NIA Vahid, Doct., membre

iii

DÉDICACE

Je dédie ce mémoire aux deux êtres les plus chers à mon cœur, ma mère et mon père qui sont

l’essence de mon existence.

iv

REMERCIEMENTS

Tout d'abord, je remercie grandement mon directeur de recherche, Michel Gamache, qui m'a

proposé ce thème et qui m'a guidé le long de sa réalisation.

Je ne saurais être reconnaissant envers lui pour sa patience et de son soutien, c’est pourquoi je lui

suis toujours redevable.

Je tiens aussi à remercier mon co-directeur, Luc Adjengue, pour m’avoir accordé son aide, son

expertise, son conseil et sa disponibilité durant mon projet.

Je remercie également mes deux professeurs, Bruno Agard et Vahid Partovi Nia, qui m’ont

enseigné les méthodes et les techniques de Data Mining. Sans oublier leurs rencontres organisées

qui m’ont beaucoup aidé dans ma recherche.

J’exprime pareillement ma gratitude envers Sandrine Paroz de la compagnie d’Acquisio, qui m’a

orienté et fourni les données nécessaires à la réalisation de ce projet. Sans bien sûr oublier

Mohammed et Younes d’Acquisio qui m’ont initié le code nécessaire à l’apprentissage du

langage SQL. Tous mes remerciements à l’équipe d’Acquisio pour m’avoir accordé leur temps

nécessaire à la réalisation de mon projet.

Je remercie mon ami le linguiste Mounir Zaidi et Riad Kechroud, qui m’ont aidé dans la

rédaction de ce mémoire.

Je conclue les expressions de ma profonde gratitude en remerciant ma famille, mon épouse et

mes deux enfants, Imène et Ayoub, qui ont toujours été là pour me procurer la joie de vivre et

être ma flamme qui me donne davantage l’énergie suffisante me laissant toujours aller de l’avant.

v

RÉSUMÉ

Les publicités sur le web qui se présentent sous forme de liens textuels s’affichent dans les pages

de résultats des moteurs de recherche, suite aux requêtes des internautes par le biais des mots-

clés achetés par les annonceurs via un système d’enchères. Communément, les premières pages

du moteur de recherche offrent aux annonceurs de promouvoir les produits et services. Quand

une annonce s’affiche et qu’un internaute clique sur le lien correspondant, l’entreprise en

question paie le moteur de recherche. Afin de gérer son budget, une entreprise doit établir des

stratégies d’enchères; sélectionner un ensemble de mots-clés et déterminer un montant pour

chaque mot-clé. Les données historiques de ces mots-clés sont évidemment nécessaires pour

évaluer le comportement des requêtes des internautes sur les moteurs de recherches.

Les travaux présentés dans ce mémoire sont une suite d’un thème de recherche dont l’objectif est

de développer des algorithmes permettant d’améliorer le rendement des campagnes publicitaires

sur les moteurs de recherche. Dans cette optique un algorithme permettant d’affecter des

positions optimales aux mots-clés est développé de sorte que le nombre total de clics par

campagne est maximisé. En outre, une méthode de génération de courbes génériques est

proposée pour chaque mot-clé afin d’effectuer une prédiction à la fois du nombre de clics et du

coût par clic en fonction de sa position. Ces paramètres sont essentiels au programme

d’optimisation.

Nous présentons une approche de classification basée sur les techniques de data mining pour

l’extraction des connaissances cachées dans une base de données de mots-clés. Le but est de

déceler des comportements similaires au niveau des mots-clés et de les classifier par la suite. Si la

classification des mots-clés est optimale, on estime pouvoir obtenir des courbes génériques de

meilleure qualité.

Notre stratégie utilise beaucoup d'échantillons composés de différentes campagnes dans

différents types de marché sur le Web. Cette stratégie nous permet de conclure, lors de la

classification automatique, que le nombre de classes de mots-clés est approprié pour toutes les

campagnes publicitaires.

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

IMG

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

IMG

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib