Conservatoire National des
Probatoire en Ingénierie des systèmes décisionnels
SOMMAIRE
Page
1 - PREAMBULE ................................................................................................................................................................... 3
2 - INTRODUCTION ............................................................................................................................................................. 3
2.1 - PRESENTATION D'INTERNET ................................................................................................................................. 3
2.1.1 - Internet n'est pas récent ......................................................................................................................................... 3
2.1.2 - Les différentes sphères d'Internet .......................................................................................................................... 3
2.1.3 - Internet est un phénomène à tres forte croissance ................................................................................................ 4
2.1.4 - Internet est riche d'informations ............................................................................................................................ 4
2.2 - PRESENTATION DU DATA MINING ....................................................................................................................... 4
2.2.1 - Présentation générale ............................................................................................................................................ 4
2.2.2 - Définition ............................................................................................................................................................... 6
2.3 - INTERNET ET DATA MINING .................................................................................................................................. 6
3 - LE DATA MINING COTE SERVEUR .......................................................................................................................... 7
3.1 - PRESENTATION GENERALE ................................................................................................................................... 7
3.2 - METHODOLOGIE ...................................................................................................................................................... 8
3.2.1 - Acquérir les données ............................................................................................................................................. 8
3.2.2 - Les cookies ............................................................................................................................................................ 8
3.2.3 - Nettoyer les données .............................................................................................................................................. 9
3.2.4 - Identifier les transactions ...................................................................................................................................... 9
3.2.5 - Intégration et formatage des données.................................................................................................................. 10
3.2.6 - Traitement de data mining ................................................................................................................................... 10
3.2.6.1 - Analyse de chemins .......................................................................................................................................................... 10
3.2.6.2 - Les règles d'associations................................................................................................................................................... 11
3.2.6.3 - Les règles de séquences .................................................................................................................................................... 11
3.2.6.4 - Les règles de classification (clusterisation) ...................................................................................................................... 12
3.2.7 - Synoptique général .............................................................................................................................................. 13
3.3 - EXPLOITATION ET ANALYSE DES RESULTATS ............................................................................................................... 14
3.3.1 - Les outils OLAP ................................................................................................................................................... 14
3.3.2 - Les outils de visualisation et de cartographie ..................................................................................................... 14
4 - LE DATA MINING COTE CLIENT ............................................................................................................................ 15
4.1 - LE DATA WEB .......................................................................................................................................................... 15
4.1.1 - Présentation du data warehouse ......................................................................................................................... 15
4.1.2 - Définition du data web ........................................................................................................................................ 15
4.1.3 - Présentation ......................................................................................................................................................... 16
4.1.4 - Accès à des pages statiques ................................................................................................................................. 17
4.1.5 - Accès à des pages dynamiques ............................................................................................................................ 17
4.1.6 - Conclusion ........................................................................................................................................................... 18
4.2 - LES AGENTS INTELLIGENTS OU KNOWBOT .................................................................................................... 19
4.2.1 - Présentation ......................................................................................................................................................... 19
4.2.2 - Utilisation ............................................................................................................................................................ 19
5 - LE DATA MINING ENTRE LE CLIENT ET LE SERVEUR ................................................................................... 21
5.1 - OPTIMISATION DES TELECOMMUNICATIONS ................................................................................................ 21
5.1.1 - Améliorer le routage ......................................................................................................................................... 21
5.1.2 - Améliorer la conception, la supervision et la maintenance ................................................................................. 21
5.2 - LA RECHERCHE D'INFORMATIONS SUR INTERNET ....................................................................................... 22
5.2.1 - Etudes diverses .................................................................................................................................................... 22
5.2.2 - Le text mining ...................................................................................................................................................... 22
5.2.3 - Le multimédia mining .......................................................................................................................................... 24
5.3 - AUTRES ASPECTS ......................................................................................................................................................... 24
5.3.1 - Paver les autoroutes de l'information .................................................................................................................. 24
5.3.2 - Activités de veille ................................................................................................................................................. 25
6 - L'ETHIQUE .................................................................................................................................................................... 26