Appel à données CABIN Installation de MySQL et d’Apache Un des buts de cet appel à la mobilisation de données est de vous initier à la manipulation d’outils qui permettent la gestion et la publication de données sur Internet. Cette publication repose sur trois grandes catégories d’outils : Introduction -1) La base de données qui contient vos données et vous permettra de les modifier soit enregistrement individuel (un enregistrement est un individu du monde réel encodé dans une base de données, il correspond à une ligne de données d’un tableur comme Excel), soit par groupes d’enregistrement. Dans le cas de la publication des bases de données sur Internet, les bases de données oncernées sont dans la plupart des cas compatibles avec un langage appelé SQL (‘Simple Query Language’ en anglais ou ‘Languge d’interrogation simple en français) . Ce langage est une sorte de protocole universel partagé par plusieurs marques ou types de bases de données. Dans le cadre de cet appel CABIN vous ne devrez pas apprendre le SQL en profondeur, mais serez sans doute amenés à manipuler des instructions élémentaires, et à recevoir une introduction aux rudiments nécessaires pour accéder aux données en lecture (l’ajout, la modification et l’effacement de données reposent sur une syntaxe plus compliquée). Ceci rendra place en fin d’activité. Malheureusement il faut noter quelques restrictions liées au langage SQL : - bien qu’un peu plus proche de la syntaxe de l’anglais que la plupart des autres langages informatiques, il n’est malgré son nom pas forcément simple à acquérir, même s’il est très performant - les différentes bases de données SQL existantes sont sujettes à des petites variations de syntaxes dans la manière de manipuler le SQL, ce qui fait que la conversion immédiate des instructions écrites pour un logiciel SQL vers un autre marche rarement sans travail de modification manuel - les outils bureautiques comme Excel ne sont pas compatibles directement avec SQL (par contre MS Acces oui) Notons qu’il existe des outils qui permettent de créer du SQL à partir d’éléments visuels sans connaître le langage, mais ils sont assez fastidieux et ne permettent pas de bénéficier de toute la complexité et des possibilités de programmation du langage. Ils sont néanmoins intéressants pour un usage quotidien. Nous utiliserons l’un d’entre eux : phpMyAdmin -2) Le serveur web, qui est l’outil fondamental pour publier des pages d’information sur Internet. Cet outil est une sorte de plateforme permettant de traduire du langage HTML (langage informatique pour la création de pages web) en une page de texte ou des documents multimédia avec une lise en page qui en facilite la lecture par l’homme. -l’applicatif web, qui est un ensemble de pages webs et de parties de programmes qui peuvent créer un site Web ou un service en-ligne scientifique à partir des données issues de la base de données. Il est lié à la fois au serveur web (qu’il doit techniquement utiliser pour être visible sur Internet) et à la base de donnée à laquelle il se connecte. Il permet d’afficher le contenu de la base de données et mais aussi de gérer els critères de sélections dans les recherches de l’utilisateur sur tel ou tel taxon particulier ou telle ou telle localité. Précisions ce que nous entendons par service en ligne : il s’agît d’un type de site web bien particulier, axés plus sur la transmission de données scientifiques ou techniques brutes que sur leur présentation dans une mise en page pour une lecture immédiate. Ce type de service fournit des données non seulement pour des hommes, mais aussi pour interagir avec d’autres logiciels. Par exemple un site web d’une institution fournit des noms scientifiques dans une page web . Il peut interroger un service offert par une autre institution, qui renseigne sur les noms communs correspondant à ces noms scientifique. Ce deuxième site envoie juste une liste de nom sans mise en page (pas de caractères gras, de noms soulignés, de possibilités de trier le résultat), ce type de site est appelé service. Le premier site web transforme la liste et l’intègre dans la mise en page de sa page web, à côté des noms scientifiques, il peut copier les résultats offerts par le servcie et les trier par pertinence. L’utilisateur ne s’apercevra pas toujours de ce lien entre deux sites, car tous les noms communs et les noms scientifiques sont affichés en même temps par le premier site web consulté, mais les scientifiques et techniciens travaillant sur ces sites ont dû travailler pour établir consciemment une liaison entre deux sites webs différentes. Revenons sur nos 3 outils principaux (base de données, serveur web, applicatif) Cet outils peuvent être soit : - commerciaux, - gratuits mais protégés (il y a toujours un droit de propriété sur le code programmés), -gratuits et ‘open-source’ (c’est-à-dire que le code de leur langage de programmation est accessibles à tous). Une combinaison de ces trois possibilité existe (il existe des modules commerciaux pour améliorer des logiciels open-source ou étendre leurs fonctionnalités). Dans notre cas nous allons utiliser 3 logiciels open-source, parmi les plus répandus : Base de données: mySQL Le serveur web : Apache L’applicatif web : le provider BioCASe (provider est un mot anglais qui veut dire dans ce contexte ‘logiciel fournisseur de données’. Le provider BioCAse est un type de services web spécialisé dans la publication de données de biodiversité sur des réseaux d’échanges et d’information internationaux comme le GBIF. Ces logiciels peuvent être liés à d’autres composants (par exemple Apache est souvent utlisé avec un langage de programmation appelé PHP, BioCASe demande en lus l’installation d’un langage appelé Python), mais ils forment l’armature principale de la publicationd e donénes sur Internet L’installation d’un WAMP A titre d’entraînement il est possible d’installer ces logiciels sur un ordinateur individuel, notamment en utilisant un type d’outil qui permet de les installer en une seul fois, appelé WAMP (qui veut dire logiciel combinant Windows, Apache, MySQL et PHP). La plupart des WAMP comportent aussi un logiciel qui permet d’écrire du code SQL et de manipuler MySQL à partir d’une interface graphique, appelé PHPyMyAdmin. Attention à ne pas confondre: SQL est le langage avec MySQL est le nom d’un logiciel open source basé sur ce langageK L’installation de BioCASe aura lieu après : il faut d’abord s’installer que l’on a installé au moins une base de données SQL, Apache et le langage Python. Commençons par installer un WAMP afin d’obtenir déjà MySQL , Apache, et PHPMyAdmin Il existe plusieurs distributions de Wamp gratuites mais rares sont celles qui sont de bonnes qualité. A notre connaissance, la plus facile à installer est appelée XAMPP, qui présente l’avantage d’être gratuite, relativement complète et multi-lingue. Elle est téléchargeable sur Internet, mais sur un fichier volumineux (100 mega) qui peut être difficile à obtenir si la bande passante est réduite. Détaillons son téléchargement et son installation : 1 lien web : Guide d’installation : http://www.apachefriends.org/fr/xampp-windows.html#1364 Le lien a télécharger est le suivant (plus bas dans la page): 2 : L’exécuter en mode administrateur (si vous avez un Windows plus vieux que Vista, un double clic sur le fichier « .exe » suffit, sinon faire un clic droit et « exécuter comme admininstrateur » Le logiciel peut vous demander si vous voulez l’installer en anglais ou en allemand, choisissez « englih » dans la liste (on peut revenir après à une utilisation en français) Si ce message d’erreur apparaît appuyer sur « OK » : Appuyer sur Next Ici le logiciel vous demande où vous voulez l’installer. Je vous conseille de laisser la valeur qu’il propose : C:\xampp Cet écran vous demande si vous voulez créer des icones dans le menu Widows (laissez les caches cochées) que Apache et MySQL tournent en permanence sur votres ordinateur (« as service ») ou seulement quand vous allumez XAMPP (choix proposé par défaut) . Dans un premier temps je vous conseille de garder la choix par défaut (car il permet de reprérer plus rapidement les problèmes éventuels de configuration, et on peut le modifier facilement après l’installation si on change d’avis). Cliquez sur « Install » puis sur « Finish » à la fin de la progression de la barre verte. 3 : Allumer XAMPP Cliquez sur ce bouton qui se trouve sur votre bureau ou dans le menu général de Windows en bas à gauche de votre ordinateur : 4 : Allumer MySQL et Apache Dans cet écran, cliquer sur les 2 boutons « start » associés à Apache et à MySQL. Deux barres vertes avec la mention « running » doivent alors apparaître, et les boutons start sont remplacés par des boutons stop sur lesquels il vous faudra appuyer pour éteindre les services : 5 : Accéder au menu central de XAMPP : Ouvrez votre navigateur internet et rentrez l’adresse http://localhost. La page suivante devrait apparaître (où vous pouvez choisir votre langue de travail) : La page suivante apparaît ensuite : 6 : Accéder à la base de données MySQL via phpMyAdmin : Entrez juste http://localhost/phpmyadmin dans vote navigateur. Vous accédez alors à une page similaire à celle-ci : Si la page de phpMyAdmin apparaît en anglais ou en allemand, cliquez sur le symbole représentant une maison à gauche de l’écran : Et changer la langue vers le français dans la liste suivante : A ce stade si toutes les étapes ont été menées à bout vous venez d’installer 2 des 3 composants principaux parmi ceux nécessaires à la publications de données de biodiversit sur Internet ! La prochaine étape sera la conversion d’un classeur Excel en base de données MySQL, mais assurons nous d’abord d’avoir terminé les tâches de nettoyage et de contrôle de al qualité des données que nous pouvons faire au niveau d’Excel avant de l’aborder.