Rappel Structuration des Données et Bases de

publicité
Système d’Information Géographique (SIG):
Application dans le Domaine Marin et Côtier
DAKAR-Sénégal 16-20 Janvier 2017
Rappel structuration des données
et bases de données
par
Mme NOUHA BARRAJ
Introduction
Les données Marines:
– Mesures océanographiques physiques,
– Mesures océanographiques chimiques,
– Plages de valeurs de paramètres marines.
Formats de données marines
• Il existe de nombreux formats de données
marines; nous reconnaissons actuellement 13
groupes.
• Nous allons naviguez à travers les plus
importants pour voir leurs diversités.
Formats de feuille de calcul(1)
• Les tableurs sont l'un des formats les plus
populaires pour décrire les données marines.
• Ocean Data View peut lire à peu près tout
tableur ASCII, en particulier ceux de son
propre format.
Formats de feuille de calcul(2)
• Également appelé «formats de table," ces ensembles
de données peuvent être aussi petit qu'une simple
table XYZ contenant des mesures simples (ou des
estimations calculées) sur la surface XY, ou aussi
complexe (une immense table d’une campagne, des
stations, des identifiants de l'échantillon, des valeurs
mesurées des paramètres, des flags de mesure de
qualité, etc).
• le terme « tableur » est parfois également appliqué, un
peu de manière incorrecte, le programme de logiciel
qui gère les données, par exemple Microsoft Excel.
Formats d’archive
• Sont semblables à des feuilles de calcul, mais
contiennent plus qu’un seul format d’une
ligne.
• Typiquement, ils ont un format qui indique
des informations d’une campagne, une autre
information des stations, et un autre pour des
valeurs mesurées des paramètres réels.
Formats raster et grille
• Sont considérés généralement comme des tableaux de
valeurs rectilignes (lignes et colonnes), souvent, dans les
sciences de la terre, liés uniquement à des zones
spécifiques de la surface de la terre (ou à un certain niveau
au sein de son géosphère, hydrosphère ou de son
atmosphère).
• Ces tableaux de valeurs réguliers sont généralement
calculées à partir de mesures dispersées "monde réel" aux
fins de rendre les données plus faciles à visualiser ou à
analyser.
• Des images graphiques telles que des photographies (où les
emplacements de tableau de valeur sont appelés pixels)
sont inclus dans ce type.
Formats auto-descriptif
• Une classe largement utilisée de formats qui accueille
plusieurs types de contenu, y compris les informations
de type vecteur et de l'information / de type grille
raster.
• Les métadonnées nécessaires pour utiliser les
données, telles que les unités de mesure, la géométrie
de la grille, etc, sont inclus dans le fichier lui-même
(NetCDF, CDL, HDF, formats Envisat)
• Le format NetCDF est le plus largement utilisé dans la
communauté de données marines, car il prend en
charge les données de la station et des données
maillées.
Formats langage de balisage
• Un langage de balisage est une langue
artificielle en utilisant un ensemble
d'annotations au texte qui donnent des
instructions concernant la manière dont le
texte doit être affiché (html, xml…).
Formats Vecteur
• Ce sont les fichiers contenant des
représentations numériques des formes
géométriques, telles que des points, des
lignes, des courbes et des formes ou polygone
(s), qui sont tous basés sur des équations
mathématiques, pour représenter des images
en infographie.
• C’est un apport essentiel aux systèmes
d'information géographiques.
Normes de Métadonnées
• Une norme de métadonnées est un ensemble
commun de termes et définitions qui
décrivent des données.
Formas Papier
• Les données sur papier, y compris tous les
types de revues, les journaux, les périodiques,
etc.
Formats de Document
• Les données sont contenues dans des
formats habituellement en liaison avec les
documents numériques, y compris les formats
propriétaires (par exemple DOC) ou en texte
ASCII richement formatés.
Formats de Compression
• Ces formats sont utilisés pour le stockage ou la
transmission de données en utilisant une
variété d'algorithmes de compression.
• Ce format peuvent être produit par des
logiciels comme winrar, winzip…
Formats auxiliaires
• Ce sont généralement de petits fichiers qui
contiennent des instructions (ou d'autres
informations) qu’un programme exécutable a
besoin pour utiliser le fichier de données.
• Ils sont beaucoup moins complètes que de
véritables fichiers de métadonnées qui
peuvent jouer des rôles similaires.
Formats de base de données
relationnelle (1)
• Ce sont (généralement) binaires, format interne utilisé
par (souvent) des systèmes propriétaires relationnelles
de gestion de base de données (SGBD), tels que
Microsoft Access.
• L’utilisateur n’interagit presque jamais directement
avec ces formats, mais il est généralement bien inclus
dans l'utilisation du système.
• Les développeurs d'applications peuvent intégrer des
paquets de SGBDR existantes dans leurs nouvelles
constructions, ou peuvent écrire leur propre code,
comme dans le cas de Ocean Data View.
Formats de base de données
relationnelle(2)
• Les formats relationnelles tirent leur nom du
principe fondamental que les bases de
données peuvent être analysées dans les
structures de tables "liés" à l'autre par des
liens fixes.
• Un exemple classique est le parsing des
données des stations dans une campagne, des
stations, et des valeurs des échantillonnages.
World Ocean Database(1)
• En 1982, le chercheur américain Syd Levitus a publié
un "Atlas climatologique de l'océan mondial» basé sur
une collection mondiale de données qui est venu à être
appelé le World Ocean Database (WOD).
• Depuis ce temps, un ensemble plus ou moins standard
des analyses climatologiques, basé sur le WOD, a été
développé, appelé l'Atlas Mondiale de l'Océan (AMO).
• Tant le WOD et le AMO (WOA Word Ocean Atlas) sont
mis à jour et réédité régulièrement, nouvelle WOD
/WOA ayant paru en 1994, 1998, 2001, 2005 , 2009 et
2013.
World Ocean Database(2)
• Actuellement, l'activité de production WOD
/WOA est officiellement nommé le projet de
base de données Ocean World.
• Le WOD est la plus grande collection au
monde du profil de l'océan et de données
plancton disponibles sans restriction.
http://www.nodc.noaa.gov/OC5/WOD/pr_wod.html
Système d'observation de l'océan
mondial (GOOS)
• GOOS est la composante marine du Système
mondial d'observation de la Terre, qui
comprend également un système mondial
d'observation du climat (SMOC) et d'un
système mondial d'observation terrestre
(SMOC).
• La base de données GTSPP et Argo sont les
principales composantes du GOOS.
Global Temperature and Salinity Profile
Project (GTSPP)
• GTSPP is a global database of temperature
and salinity data maintained by the US
NODC. Portions of the same data are also
available through the French Coriolis System.
Programme Argo
• Argo est un réseau mondial de 3.000 flotteurs
dérivants de profilage qui mesurent la
température et la salinité.
Integration des données marines
• L’intégration des données marines est un acte
d'équilibrage entre les 3 concepts majeurs:
formats, logiciels et données.
Integration des données marines
• Dans les années passées, les scientifiques
devaient bossez à travers de nombreuses
conversions de format (y compris l'écriture de
code nécessaire) pour faire des liens.
• Mais au cours des dernières années, une
petite famille de formats flexibles, des
programmes informatiques puissants et des
sources de données en ligne flexibles ont
apporté tout ensemble.
Integration des données marines
Normes des métadonnées
• Données sur les données. Informations
structurées, généralement dans les structures de
table comme qui décrivent complètement les
sources, le traitement, la qualité, le format et les
caractéristiques de stockage d'ensembles de
données.
• Les
informations
peuvent
inclure
des
emplacements, temps, personnel, équipement,
des algorithmes, ou de nombreux autres sujets
d'intérêt.
Normes des métadonnées
• Informations de métadonnées peut être
utilisé à la fois pour la «découverte»
d'ensembles de données dans le catalogue
recherches, et pour les données "utiliser"
lorsque les caractéristiques essentielles des
données, telles que les unités de mesure, ne
sont disponibles quelque part dans les
métadonnées. Ce cours va utiliser la norme de
métadonnées ISO 19115.
Flags de la qualité des données
marines(1)
• Tableaux récapitulatifs des indicateurs de
contrôle de la qualité utilisés dans les
ensembles de données pour indiquer les
niveaux de qualité présumés de mesures.
Flags de la qualité des données
marines(2)
• Différents programmes et bureaux de gestion
des données ont développé différents
systèmes, nécessitant des protocoles de
conversion spécifiques (également inclus) à
être développé.
• Les codes peuvent être appliqueés aux
mesures individuelles ou à des stations
entières.
Téléchargement