3
2.5 Analyse du processus d’auto – organisation............................................................49
2.5.1 Convergence.....................................................................................................49
2.5.2 Etat d’équilibre.................................................................................................50
2.5.3 Voisinage..........................................................................................................50
2.5.4 Une variante sur les cartes topologiques..........................................................52
2.6 De la théorie à la pratique ........................................................................................55
2.6.1 Choix des paramètres.......................................................................................55
2.6.2 Mesure de la qualité de quantification .............................................................55
2.6.2.1 Distorsion.....................................................................................................56
2.6.2.2 Contraste.......................................................................................................56
2.7 Choix du nombre de classes.....................................................................................57
2.7.1 Hiérarchie et distance ultramétrique ................................................................57
2.7.2 Les mesures d’agrégation entre les classes......................................................59
2.7.3 Algorithme général de la classification ascendante hiérarchique ....................60
2.7.4 Construction de la hiérarchie indicée...............................................................61
2.7.5 La formule de récurrence de Lance et de Williams .........................................62
2.8 Application : visualisation du site tel que les internautes l’utilisent........................62
2.8.1 Dimensions de la carte .....................................................................................63
2.8.2 Construction de la carte....................................................................................63
2.9 Conclusion................................................................................................................66
3 Typologie de sessions : Profiling...................................................................................67
3.1 Introduction..............................................................................................................68
3.2 Les données..............................................................................................................69
3.2.1 Segmentation....................................................................................................69
3.3 Codage par poids de position (Pdp) .........................................................................70
3.4 Quantification vectorielle.........................................................................................72
3.4.1 Principe général................................................................................................72
3.5 Programmation dynamique......................................................................................74
3.5.1 Principe général................................................................................................74
3.5.2 Distance entre chaînes......................................................................................75
3.6 Application : codage et reconnaissance des sessions de navigations.......................76
3.6.1 Reconnaissance de sessions par programmation dynamique : Résultats et
comparaison .....................................................................................................................78
3.6.2 Données de validation......................................................................................80
3.6.2.1 Génération de sessions artificielles étiquetées .............................................80
3.6.3 Résultats et comparaison avec le calcul de distorsion pour la reconnaissance de
prototypes sur les données artificielles.............................................................................82
3.7 Conclusion................................................................................................................84
4 Modèles de mélanges : Une autre approche pour le profiling....................................85
4.1 Introduction..............................................................................................................86
4.2 Une approche de mélange de vraisemblance pour la classification.........................86
4.3 Identifiabilité............................................................................................................88
4.4 Classification par modèles de mélange de distribution............................................89
4.4.1 Principe général................................................................................................89
4.4.2 Formalisation mathématique............................................................................89
4.4.3 Des distributions bien adaptées aux séquences : les chaînes de Markov.........91
4.4.3.1 Définition générale.......................................................................................92