16/04/17
Projet d’ingénierie « Méta-calendrier automatique pour portail www »
3
Table des matières
1 CONTEXTE .................................................................................................................................................. 4
1.1 COMPREHENSION DU BESOIN ................................................................................................................... 4
1.1.1 Analyse des sources, détection de l’information utile et extraction des données ................................ 5
1.1.2 Stockage des données .......................................................................................................................... 5
1.1.3 Nettoyage des données ........................................................................................................................ 5
1.1.4 Représentation visuelle des données ................................................................................................... 6
1.1.5 Paramétrage de la collecte / administration ....................................................................................... 6
1.2 ANALYSE FONCTIONNELLE ...................................................................................................................... 6
2 SOLUTIONS TECHNIQUES PROPOSEES ............................................................................................. 8
2.1 ANALYSE DE LA SOURCE, DETECTION DE L’INFORMATION UTILE ET DEFINITION D’UN FORMAT UNIFIE ... 9
2.1.1 Site analysé ......................................................................................................................................... 9
2.1.2 Détection de l’information utile, écriture du fichier de description .................................................... 9
2.1.3 Récupération de l’information utile dans un fichier au format XML ................................................ 11
2.2 LE PARSING ............................................................................................................................................ 12
2.2.1 Les APIs des parseurs ....................................................................................................................... 13
2.2.2 Développement du parseur en Java .................................................................................................. 14
3 CONCLUSION............................................................................................................................................ 16
4 BIBLIOGRAPHIE ...................................................................................................................................... 17
Table des figures
Figure 1 : schéma des principales étapes du projet ................................................................................................ 6
Figure 2 : liste des événements, classés par date, du site http://www.bzh5.com/gouel/degemer.php ................... 10
Figure 3 : Structure du calendrier ........................................................................................................................ 11
Figure 4 : l’information utile est recueillie dans un fichier XML ......................................................................... 12
Figure 5 : rôle d’un parseur XML & API DOM ................................................................................................... 13
Table des annexes
ANNEXE 1 ............................................................................................................................................................ 18
ANNEXE 2 ............................................................................................................................................................ 23
ANNEXE 3 ............................................................................................................................................................ 29