Compte-rendu de la réunion base de données - projet ORE

publicité
UMR CARRTEL INRA – Univ. de Savoie Station d’Hydrobiologie lacustre
BP 511 75 avenue de Corzent 74203 Thonon-les-Bains Cedex
www.thonon.inra.fr
Compte-rendu de la réunion base de données - projet ORE
« Lacs Subalpins »
Vendredi 21 janvier à Thonon-les-Bains
Présents :
Médias-France (Groupement d’Intérêts Publics) : Michel Hoepffner (directeur adjoint) et Fernando
Niño (responsable ore).
INRA CARRTEL : Orlane Anneville (CR,) Stéphan Jacquet (CR), Daniel Gerdeaux (DR, CDA EFPA,
responsable ORE ), Jean Guillard (IR, DU adjoint), Ghislaine Monet (IR), Philippe Quetin (IE)
Absents excusés : JM Dorioz (DR, DU), J. Lazzarotto (AI)
O. Anneville fait une présentation du projet ORE « Lacs subalpins », des questionnements scientifiques
et de l’ensemble des données lacustres (suivi actuel des 3 lacs Léman, Annecy, Bourget). Philippe
Quetin présente l’hétérogénéité des formats de données actuels et l’état d’avancement de la base de
données « badel ». Bien que ce projet ne soit pas actuellement validé par l’appellation « ORE », notre
besoin en base de données structurée existe.
Présentation de Médias-France par Michel Hoepffner dont un résumé pris sur le site internet de
Médias est joint en fin de CR. Plusieurs organismes sont partie prenantes du GIP (CNES, IRD, METEOFrance, Univ. P. Sabatier, CLS, SPOT-IMAGE, CNRS).
A ce jour l’INRA ne fait pas partie du GIP, mais l’équipe Médias-France est prête à nous aider dans
notre démarche de base de données « compatible ORE », en attendant une prise de décision de l’INRA.
D. Gerdeaux est sollicité pour faire passer le message au niveau de la hiérarchie du département EFPA
, de la direction scientifique (P. Stengel) et de la direction générale.
Ce que peut apporter Médias-France :
Tout d’abord une structure composée d’informaticiens compétents en base de données, dont deux
(hormis cdd et stagiaires) travaillant à temps plein sur les bases de données ORE (www.ore.fr).
Médias-France utilise un noyau de schéma relationnel générique commun à toutes les bases de données
ORE, ainsi que l’intégration de métadonnées dans celui-ci, selon le standard des métadonnées du FGDC
(Federal Geographic Data Committee: Content Standard for Digital Geospatial Metadata). Ces
dernières permettent d’avoir le même standard d’information pour les données : coordonnées spatiotemporelles, auteur, mots-clefs, restrictions, qui récolte, qui gère, protocole, qualité etc.
CR réunion du 21.01.2005
G.Monet corrections : J. Guillard et F. Niño
1
En plus du noyau générique (construit autour du concept très général de « mesure »), chaque ORE peut
étoffer sa base de données avec des notions spécifiques à la thématique traitée. Pour optimiser les
performances à la consultation, les bases de données ORE utilisent en réalité deux bases de données :
la première, basée sur le schéma générique plus extensions, comportant obligatoirement les données
brutes, et une deuxième, optimisée pour les consultations (dénormalisée, selon les concepts de
datawarehouse) avec des données synthétisées, graphiques etc. Tous les accès à ces bases se font
avec une gestion fine des droits grâce au protocole LDAP. Les bases sont sous PostgreSQL et la
logique applicative et interface sont écrites en Java.
Point sur l’état d’avancement technique de la base de données ORE « Lacs subalpins »
Un groupe de travail interne au laboratoire réuni plusieurs agents concernés par le projet ORE,
représentant la totalité des équipes du laboratoire, il s’agit de Orlane Anneville (CR,) Stéphan Jacquet
(CR), Jean Guillard (IR, DU adjoint), Ghislaine Monet (IR, responsable informatique), Philippe Quetin
(IE, responsable qualité), Jérôme Lazzarotto (AI, responsable du laboratoire de chimie).
Base de données « BADEL » existante :
Une première analyse de l’existant a été faite auprès des équipes de recherches du laboratoire afin de
faire le tour des données disponibles, de leur format, de leur disponibilité, des besoins des chercheurs,
etc. Cette analyse a conduit à l’élaboration d’une base de données lacs « badel » prenant en compte les
différents compartiments du réseau trophique ; production primaire, phytoplancton, zooplancton,
poissons, données météo, etc.
Cette base de données a été créée sous postgresql 7.3.4, les pages d’interface étant écrites en php
4.2.2. Différentes procédures d’importations des données ont été développées au vu de la grande
hétérogénéité des formats de données. Certaines données ne sont pas encore importées car en cours
de validation, en particulier les données zooplancton.
Base de données « chimie » :
Une base de données propre au laboratoire de chimie est en exploitation. Elle permet au laboratoire de
gérer son stock, ses clients, ses commandes, l’entrée et la fourniture de ses résultats d’analyses. Une
partie des données de cette base doit se retrouver dans la base « badel ».
Base de données « algothèque » :
Une base de données décrivant toutes les souches d’algues disponibles dans l’algothèque du laboratoire
est en cours de développement. Il a été choisi de la développer comme « badel » avec postgresql, et
php.
Points principaux soulevés
Pour l’ensemble des ces bases, le groupe de travail souhaite une certaine homogénéité dans l’écriture
des bases et souhaitent que ces bases soient conformes aux autres bases de données des ORE, les
problèmes et questions sous-jacents étant que :
- Actuellement personne au laboratoire n’a toutes les compétences nécessaires et n’est disponible pour
travailler à 100 % sur cette base de données.
CR réunion du 21.01.2005
G.Monet corrections : J. Guillard et F. Niño
2
audit base de données :
- besoin d’une expertise sur la structure actuelle de notre base (est t-elle bien construite, a-t-on bien
penser à tous les champs, etc..)
-intégration des métadonnées
- les données ne sont pas toutes propriétés de l’INRA, d’où problème des droits d’accès, aux données
brutes en particulier ; intégration de LDAP pour un contrôle d’accès à granularité fine.
Audit interface :
-actuellement écrite en PHP4, modification en interne mais sans maîtrise
-possibilité d’utiliser java …nécessitera une formation interne pour accéder à un minimum de
connaissance pour modifications.
-manque intégration des données : réalisation de pages d’interfaces pour rentrer les données afin d’en
figer le format et éviter les protocoles d’importation à partir de fichier excel.
Autres souhaits :
- Base physico-chimique : La question se pose de faire migrer la base de chimie actuellement sous
access, consultable en DHTML générée? a par des pages ASP pour la rendre compatible et écrite dans
le même langage que « badel ». Cette base ayant écrite par un fournisseur extérieur, il faudra voir avec
Jérôme Lazzarotto dans quelle mesure le laboratoire peut récupérer les sources. La plupart des
données de cette base chimie sont partie intégrante de « badel ».
o
o
o
Traduire en postgresql et java
Migration (ca. 1 consultation /jour)
priorité n° 2
-Base algothèque : éventuellement à intégrer sous le même schéma
-Web : déjà géré en interne. Prévoir intégration à la base
-hébergement : à Thonon (débit 512/128 Ko par ADSL, mais « Renater » possible via Dijon),.
L’administration et la sauvegarde sont de la responsabilité de l’INRA, mais externalisation souhaitable.
-services : modifications mineures pourront être faites en local mais le souhait est que les
modifications majeures et la gestion de la configuration soit faite par Médias
A FAIRE :
•
•
•
Audit interne des fonctionnalités actuelles de Badel (interface complète et suffisante ?)
Description sommaire d’un stage possible : cadre, objectifs, l’encadrement se fera directement
par Médias en collaboration avec le laboratoire. L’étudiant sera basé à Toulouse, encadré par
Médias et viendra en mission sur Thonon..
Fourniture du code Badel : script création de base, dump postgres, fichiers PHP (sur CD,
envoyés par courrier).
CR réunion du 21.01.2005
G.Monet corrections : J. Guillard et F. Niño
3
Pour info interne : Présentation de Médias-France :
Le Groupement d'Intérêt Public Médias-France soutient les actions de recherche sur l'environnement
global et régional, dans une perspective de développement durable, notamment sur le bassin
méditerranéen (MEDI) et l'Afrique sub-tropicale (AS), dans le cadre de programmes nationaux
(Eclipse, GICC, IFB, ORE, RTE, Zones-Ateliers,...) et internationaux (PIGB, PMRC, IHDP, Diversitas,
6ème PCRD,...).
Ce soutien se manifeste sous la forme de services rendus dans la constitution et la gestion de bases de
données, la fourniture de produits biogéophysiques obtenus à partir de données d'observations
spatiales (dans le cadre du projet Postel), la formation et de l'information (écoles d'été, ateliers,
séminaires, Lettre de Médias...), la coordination et consultance (constitution et gestion de sites
Internet, appui administratif, gestion de programmes...).
En France, six organismes (le CNES, l'IRD, METEO-FRANCE, l'Université Paul Sabatier de Toulouse,
CLS et SPOT-IMAGE) ont créé en 1994 le Groupement d'Intérêt Public Médias-France, qui anime le
pôle français du Réseau Médias. Médias-France a été prorogé pour une durée de six ans à compter du
29 Juillet 2000, avec un nouveau membre (le CNRS ) et une extension du domaine géographique, tout
en maintenant une priorité au bassin méditerranéen et au continent africain. Médias-France travaille en
relation étroite avec de nombreux autres partenaires en France et dans la région concernée.
Médias-France apporte un soutien aux recherches nationales et internationales dans le domaine du
changement global, fournit un secrétariat permanent au réseau Médias, édite une Lettre d'information
bilingue annuelle distribuée à tous les membres du réseau Médias, organise en collaboration des
sessions de formation, des colloques, coordonne des projets expérimentaux. Partenaire d' ENRICH
(European Network for Research In global CHange), d'ACMAD (Centre Africain des Applications de la
Météorologie au Développement), de l'Observatoire du Sahara et du Sahel, Médias-France assure aussi
le secrétariat du Comité Medcom de START pour les pays du bassin méditerranéen.
CR réunion du 21.01.2005
G.Monet corrections : J. Guillard et F. Niño
4
Téléchargement