Appel à données CABIN

publicité
Appel à données CABIN
Installation de MySQL et d’Apache
Un des buts de cet appel à la mobilisation de données est de vous initier à la manipulation
d’outils qui permettent la gestion et la publication de données sur Internet.
Cette publication repose sur trois grandes catégories d’outils :
Introduction
-1) La base de données qui contient vos données et vous permettra de les modifier soit
enregistrement individuel (un enregistrement est un individu du monde réel encodé dans
une base de données, il correspond à une ligne de données d’un tableur comme Excel), soit
par groupes d’enregistrement. Dans le cas de la publication des bases de données sur
Internet, les bases de données oncernées sont dans la plupart des cas compatibles avec un
langage appelé SQL (‘Simple Query Language’ en anglais ou ‘Languge d’interrogation
simple en français) . Ce langage est une sorte de protocole universel partagé par plusieurs
marques ou types de bases de données. Dans le cadre de cet appel CABIN vous ne devrez
pas apprendre le SQL en profondeur, mais serez sans doute amenés à manipuler des
instructions élémentaires, et à recevoir une introduction aux rudiments nécessaires pour
accéder aux données en lecture (l’ajout, la modification et l’effacement de données
reposent sur une syntaxe plus compliquée). Ceci rendra place en fin d’activité.
Malheureusement il faut noter quelques restrictions liées au langage SQL :
- bien qu’un peu plus proche de la syntaxe de l’anglais que la plupart des autres langages
informatiques, il n’est malgré son nom pas forcément simple à acquérir, même s’il est très
performant
- les différentes bases de données SQL existantes sont sujettes à des petites variations de
syntaxes dans la manière de manipuler le SQL, ce qui fait que la conversion immédiate des
instructions écrites pour un logiciel SQL vers un autre marche rarement sans travail de
modification manuel
- les outils bureautiques comme Excel ne sont pas compatibles directement
avec SQL (par contre MS Acces oui)
Notons qu’il existe des outils qui permettent de créer du SQL à partir d’éléments visuels sans
connaître le langage, mais ils sont assez fastidieux et ne permettent pas de bénéficier de
toute la complexité et des possibilités de programmation du langage. Ils sont néanmoins
intéressants pour un usage quotidien. Nous utiliserons l’un d’entre eux : phpMyAdmin
-2) Le serveur web, qui est l’outil fondamental pour publier des pages d’information sur
Internet. Cet outil est une sorte de plateforme permettant de traduire du langage HTML
(langage informatique pour la création de pages web) en une page de texte ou des
documents multimédia avec une lise en page qui en facilite la lecture par l’homme.
-l’applicatif web, qui est un ensemble de pages webs et de parties de programmes qui
peuvent créer un site Web ou un service en-ligne scientifique à partir des données issues de
la base de données. Il est lié à la fois au serveur web (qu’il doit techniquement utiliser pour
être visible sur Internet) et à la base de donnée à laquelle il se connecte. Il permet d’afficher
le contenu de la base de données et mais aussi de gérer els critères de sélections dans les
recherches de l’utilisateur sur tel ou tel taxon particulier ou telle ou telle localité.
Précisions ce que nous entendons par service en ligne : il s’agît d’un type de site web bien
particulier, axés plus sur la transmission de données scientifiques ou techniques brutes que
sur leur présentation dans une mise en page pour une lecture immédiate. Ce type de service
fournit des données non seulement pour des hommes, mais aussi pour interagir avec
d’autres logiciels. Par exemple un site web d’une institution fournit des noms scientifiques
dans une page web . Il peut interroger un service offert par une autre institution, qui
renseigne sur les noms communs correspondant à ces noms scientifique. Ce deuxième site
envoie juste une liste de nom sans mise en page (pas de caractères gras, de noms soulignés,
de possibilités de trier le résultat), ce type de site est appelé service. Le premier site web
transforme la liste et l’intègre dans la mise en page de sa page web, à côté des noms
scientifiques, il peut copier les résultats offerts par le servcie et les trier par pertinence.
L’utilisateur ne s’apercevra pas toujours de ce lien entre deux sites, car tous les noms
communs et les noms scientifiques sont affichés en même temps par le premier site web
consulté, mais les scientifiques et techniciens travaillant sur ces sites ont dû travailler pour
établir consciemment une liaison entre deux sites webs différentes.
Revenons sur nos 3 outils principaux (base de données, serveur web, applicatif)
Cet outils peuvent être soit :
-
commerciaux,
-
gratuits mais protégés (il y a toujours un droit de propriété sur le code programmés),
-gratuits et ‘open-source’ (c’est-à-dire que le code de leur langage de programmation
est accessibles à tous).
Une combinaison de ces trois possibilité existe (il existe des modules commerciaux pour
améliorer des logiciels open-source ou étendre leurs fonctionnalités).
Dans notre cas nous allons utiliser 3 logiciels open-source, parmi les plus répandus :
Base de données: mySQL
Le serveur web : Apache
L’applicatif web : le provider BioCASe (provider est un mot anglais qui veut dire dans ce
contexte ‘logiciel fournisseur de données’. Le provider BioCAse est un type de services web
spécialisé dans la publication de données de biodiversité sur des réseaux d’échanges et
d’information internationaux comme le GBIF.
Ces logiciels peuvent être liés à d’autres composants (par exemple Apache est souvent utlisé
avec un langage de programmation appelé PHP, BioCASe demande en lus l’installation d’un
langage appelé Python), mais ils forment l’armature principale de la publicationd e donénes
sur Internet
L’installation d’un WAMP
A titre d’entraînement il est possible d’installer ces logiciels sur un ordinateur individuel,
notamment en utilisant un type d’outil qui permet de les installer en une seul fois, appelé
WAMP (qui veut dire logiciel combinant Windows, Apache, MySQL et PHP). La plupart des
WAMP comportent aussi un logiciel qui permet d’écrire du code SQL et de manipuler MySQL
à partir d’une interface graphique, appelé PHPyMyAdmin. Attention à ne pas confondre: SQL
est le langage avec MySQL est le nom d’un logiciel open source basé sur ce langageK
L’installation de BioCASe aura lieu après : il faut d’abord s’installer que l’on a installé au
moins une base de données SQL, Apache et le langage Python.
Commençons par installer un WAMP afin d’obtenir déjà MySQL , Apache, et PHPMyAdmin
Il existe plusieurs distributions de Wamp gratuites mais rares sont celles qui sont de bonnes
qualité.
A notre connaissance, la plus facile à installer est appelée XAMPP, qui présente l’avantage
d’être gratuite, relativement complète et multi-lingue. Elle est téléchargeable sur Internet,
mais sur un fichier volumineux (100 mega) qui peut être difficile à obtenir si la bande
passante est réduite.
Détaillons son téléchargement et son installation :
1 lien web :
Guide d’installation :
http://www.apachefriends.org/fr/xampp-windows.html#1364
Le lien a télécharger est le suivant (plus bas dans la page):
2 : L’exécuter en mode administrateur (si vous avez un Windows plus vieux que Vista, un
double clic sur le fichier « .exe » suffit, sinon faire un clic droit et « exécuter comme
admininstrateur »
Le logiciel peut vous demander si vous voulez l’installer en anglais ou en allemand, choisissez
« englih » dans la liste (on peut revenir après à une utilisation en français)
Si ce message d’erreur apparaît appuyer sur « OK » :
Appuyer sur Next
Ici le logiciel vous demande où vous voulez l’installer. Je vous conseille de laisser la valeur qu’il
propose : C:\xampp
Cet écran vous demande si vous voulez créer des icones dans le menu Widows (laissez les caches
cochées) que Apache et MySQL tournent en permanence sur votres ordinateur (« as service ») ou
seulement quand vous allumez XAMPP (choix proposé par défaut) . Dans un premier temps je vous
conseille de garder la choix par défaut (car il permet de reprérer plus rapidement les problèmes
éventuels de configuration, et on peut le modifier facilement après l’installation si on change d’avis).
Cliquez sur « Install » puis sur « Finish » à la fin de la progression de la barre verte.
3 : Allumer XAMPP
Cliquez sur ce bouton qui se trouve sur votre bureau ou dans le menu général de Windows en bas à
gauche de votre ordinateur :
4 : Allumer MySQL et Apache
Dans cet écran, cliquer sur les 2 boutons « start » associés à Apache et à MySQL.
Deux barres vertes avec la mention « running » doivent alors apparaître, et les boutons start sont
remplacés par des boutons stop sur lesquels il vous faudra appuyer pour éteindre les services :
5 : Accéder au menu central de XAMPP :
Ouvrez votre navigateur internet et rentrez l’adresse http://localhost.
La page suivante devrait apparaître (où vous pouvez choisir votre langue de travail) :
La page suivante apparaît ensuite :
6 : Accéder à la base de données MySQL via phpMyAdmin :
Entrez juste http://localhost/phpmyadmin dans vote navigateur.
Vous accédez alors à une page similaire à celle-ci :
Si la page de phpMyAdmin apparaît en anglais ou en allemand, cliquez sur le symbole représentant
une maison à gauche de l’écran :
Et changer la langue vers le français dans la liste suivante :
A ce stade si toutes les étapes ont été menées à bout vous venez d’installer 2 des 3
composants principaux parmi ceux nécessaires à la publications de données de biodiversit
sur Internet !
La prochaine étape sera la conversion d’un classeur Excel en base de données MySQL, mais
assurons nous d’abord d’avoir terminé les tâches de nettoyage et de contrôle de al qualité
des données que nous pouvons faire au niveau d’Excel avant de l’aborder.
Téléchargement