2.7 Motifs fréquents séquentiels ........................... 28
2.7.1 Définitions et propriétés ......................... 29
2.7.2 Algorithme GSP ............................. 30
2.8 Exercices ..................................... 31
3 Classification 34
3.1 Concepts de base ................................. 34
3.1.1 Définition ................................. 34
3.1.2 Organisation ............................... 34
3.1.3 Evaluation du modèle .......................... 36
3.2 Combinaison de modèles ............................. 40
3.2.1 Bagging .................................. 40
3.2.2 Boosting .................................. 40
3.3 K plus proche voisins ............................... 40
3.3.1 Fonctionnement .............................. 41
3.4 Classification par analyse des règles d’association ............... 41
3.5 Arbres de décision ................................ 42
3.5.1 Choix de la variable de segmentation : ................. 44
3.5.2 Choix de la bonne taille de l’arbre ................... 45
3.5.3 Algorithmes de construction d’arbres de décision ........... 46
3.6 Machines à vecteur support ........................... 48
3.6.1 SVMs binaires .............................. 48
3.6.2 Utilisation des noyaux .......................... 54
3.6.3 Architecture générale d’une machine à vecteur support ........ 56
3.6.4 SVMs multiclasse ............................. 57
3.6.5 Une-contre-reste (1vsR) ......................... 58
3.6.6 Une-contre-une (1vs1) .......................... 60
3.6.7 SVM monoclasse (Novelty detection) .................. 61
3.6.8 Implémentation des SVMs ........................ 64
3.7 Réseaux de neurones ............................... 66
3.8 Classification bayésienne ............................. 69
3.9 Exercices ..................................... 73
4 Régression 76
4.1 Définition ..................................... 76
2