Introduction Le World Wide Web ou WWW, littéralement « toile d'araignée mondiale », est un système d'informations ouvert qui a été conçu spécifiquement pour simplifier l'utilisation et l'échange de documents. Début 1989, Tim Bemers-Lee, du CERN (Centre d'Etudes en Recherche Nucléaire), en Suisse, a présenté le Web comme un moyen permettant aux scientifiques du monde entier de collaborer à l'aide d'un système d'informations global et reposant sur les techniques hypertextes. A l'automne 1990 étaient réalisés les premiers logiciels de navigation ou « browsers », encore limités à du texte, et les membres du CERN pouvaient accéder à des fichiers hypertextes. Cependant, il restait à définir plus précisément la structure des documents hypertextes et la manière de les transférer vers des sites distants. En s'appuyant sur les propositions de Tim Berners-Lee la structure des documents hypertextes à l'aide d'un nouveau langage a été définie : le HyperText Markup Language plus connu sous le sigle HTML, langage de description de documents hypertextes. Un nouveau protocole a été défini : le HyperText Transfer Protocol ou HTTP, protocole de transfert de documents hypertextes. La puissance des hypertextes tient à leur simplicité et à leur immédiateté. Les utilisateurs peuvent naviguer au milieu d'un réseau global de ressources en appuyant simplement sur une touche. Les documents hypertextes sont liés entre eux par des mots-clés ou des zones spécifiques du document. Ces « zones sensibles » peuvent être des icônes graphiques ou faire partie de cartes géographiques. Les Logiciels serveurs et outils d'administration pour le Web lecteurs d'un hypertexte voient les liens comme des mots ou des images mis en évidence, et peuvent accéder à d'autres documents ou à d'autres ressources en sélectionnant ces liens. Au début de l'année 1993, il n'y avait que 50 sites Web dans le monde et le premier logiciel de navigation HTML est apparu. Fin 1996, on recense plusieurs centaines de milliers de sites Web. Le présent document propose une étude des logiciels serveurs pour le W W W et de leurs outils de gestion. 12 Chapitre 1 Quelques généralités 1.1. Architecture d'un serveur Web Le logiciel serveur HTTP et le logiciel client HTTP sont deux processus indépendants parmi d'autres qui s'exécutent sur un ordinateur. Les outils d'administration du logiciel serveur peuvent résider sur la même machine ou sur un autre ordinateur. Le logiciel serveur accède aux documents HTML et aux fichiers sur le disque dur de la machine qui l'héberge. L'ordinateur qui héberge le logiciel client peut être la machine où réside le serveur, une machine du même réseau local que le serveur ou une machine extérieure à ce réseau. L'architecture client/serveur de HTTP est illustrée par la figure 1.1. 1.2. Fonctionnalités d'un serveur WWW Dans un serveur WWW, il faut distinguer les fonctions de base des fonctions d'administration. Logiciels serveurs et outils d'administration pour le Web Machine 1 logiciel serveur HTTP outils d'administration documents HTML fichiers divers réseau local avec TCP/IP Machine 2 modem réseau local avec TCP/IP transmission par RTC ou RNIS Machine 3 Machine 4 avec un logiciel client HTTP réseau local avec TCP/IP Machine 5 avec un logiciel client HTTP Figure 1.1. Architecture client/serveur de HTTP Fonctions de base - proposer des services d'informations hypertextes, multimédias (texte, image, son, vidéo) et interactifs via HTTP ; 14 Quelques généralités - d o n n e r accès à tous les protocoles d'internet autres que HTTP par des références hypertextes : 1 - FTP* (File Transfert Protocol) : transfert de fichier, - Gopher* : système d'information arborescent réparti dans le monde, - Mailto : messagerie, - NNTP* et News* : donne l'accès aux newsgroups* (listes thématiques auxquelles on peut s'abonner), - Telnet : émulation de terminal, permet à l'utilisateur de saisir des instructions grâce à une ligne de commande comme s'il était connecté à l'hôte distant, - WAIS* (Wide Area Information Systems) : système de consultation de bases de données de documents à distance. - assurer la sécurité du site Web et du réseau local qui l'héberge. Principales fonctions qui facilitent l'administration - création de statistiques sur les connexions au serveur, - vérification de l'intégrité des liens hypertextes contenus dans les pages HTML, - maintenance du site Web localement et à distance. 1. La première occurrence d'un terme technique présent dans le glossaire apparaît avec un astérisque (*).