iv Table des matières
2.8.4 Évaluation de la recherche d’information ............ 25
2.8.5 Moteurs de recherche ....................... 26
2.9 Classification des pages Web ....................... 28
2.9.1 Types des classifications ..................... 28
2.9.2 Domaines d’application de la classifications des pages Web . . 30
2.10 Analyse des liens ............................. 32
2.10.1 Analyse des réseaux sociaux ................... 33
2.10.2 PAGERANK ........................... 37
2.10.3 HITS ............................... 40
2.11 Conclusion ................................. 43
3 Réduction de dimension 44
3.1 Introduction ................................ 44
3.2 Réduction de la dimension ........................ 45
3.3 Sélection de caractéristiques ....................... 46
3.3.1 Méthodes de Filtrage ....................... 47
3.3.2 Méthodes Enveloppes ...................... 48
3.3.3 Méthodes intégrées ........................ 49
3.4 Techniques statistiques de sélection des caractéristiques ........ 50
3.4.1 Sélection à base de Fréquence du document (FD) ....... 50
3.4.2 Sélection en utilisant le Gain d’Information .......... 51
3.4.3 Sélection en utilisant l’Information Mutuelle .......... 51
3.4.4 Sélection par la méthode Relief ................. 52
3.4.5 Sélection par la statistique χ2................. 53
3.4.6 Sélection en utilisant de l’Indice de Gini ............ 53
3.4.7 Sélection à base de score de Fisher ............... 55