Les données vectorielles – modèle spaghetti

publicité
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les Systèmes d’Information Géographique
Objet et concepts
Mickaël VASQUEZ
Service DEL/AO
PLAN
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Les SIG, pour quoi faire ?
 Les données : structure et formats
• Les données vectorielles
–
–
–
–
Modèle spaghetti
Modèle topologique
Indexation spatiale
Formats ESRI
• Les données maillées
– Paramètres de géoréférencement
– Formats
Les SIG, pour quoi faire ?
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Faire des cartes ?
Oui, entre autres …
 Assurer la persistance, interroger, créer / modifier,
mettre en forme des objets qui ont une dimension
spatiale (routes, départements, isobathes, couches
géologiques, …) et qui peuvent porter de l’information
(une commune a un nombre d’habitants, à une
isobathe correspond une profondeur, …)
 Outils pour spécialistes : reporting, statistiques,
géostatistiques, traitement d'image, analyse 3D
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les SIG, pour quoi faire ?
 Assurer la persistance des objets
• Stockage de l'information portée par les
objets (modèle relationnel)
• Stockage de la dimension spatiale de ces
objets
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les SIG, pour quoi faire ?
 Interroger
• Le décideur : quelles sont les zones à évacuer en cas de
crue ?
• L’usager : dans tel village, quels sont les terrains qui ne
sont pas en zone inondable et dont le sous-sol n’est pas
meuble ?
• Le restaurateur : dans telle ville, où sont les rues
passantes et dans un rayon d’1 km d’une université ?
• Le benthologue : quels peuplements suis-je susceptible de
rencontrer à tel endroit sachant que le substrat est
meuble, que la profondeur est de 15 m, et que l'eau est
très turbide ?
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les SIG, pour quoi faire ?
 Créer / Modifier
• L’information qui est portée par les objets
-> Masques de saisie
• Les objets eux-même : création d’une nouvelle
route, modification du tracé d’un court d’eau,
suppression d’un banc de sable, …
-> Outils de DAO
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les SIG, pour quoi faire ?
 Mettre en forme
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Éléments d’un SIG
Utilisateurs
Logiciels
Base(s) de données vectorielles ou maillées
et Métadonnées
Fichiers
SGBD
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Principaux logiciels du marché




ArcGIS (ESRI) : ArcInfo ou ArcView
MapInfo (Claritas)
Geomedia (Intergraph)
Geoconcept (Geoconcept)
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Éléments d’un SIG
Utilisateurs
Logiciels
Base(s) de données vectorielles ou maillées
et Métadonnées
Fichiers
SGBD
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les données vectorielles
 Les objets sont représentés par l’intermédiaire de
trois primitives graphiques :
• Points : arbres, épaves, points de mesure, …
• Lignes : routes, cours d’eau, tracés de profils
sismiques, …
• Polygones : parcelles, courbes de niveau,
couches géologiques, …
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les données vectorielles
 Pour une thématique donnée, l'ensemble objets
(entités) géographiques - information portée par
ces objets (attributs) constitue une classe d'entités
(synonymes : couche, thème)
Exemples :
classe d'entités de points Clients
classe d'entités de polygones Bâtiments
classe d'entités de lignes Rues
Extrait Internet Esri France
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les données vectorielles
Le modèle relationnel convient
parfaitement au stockage de
l'information attributaire
ID
Nombre d'habitants
100
101
102
1000000
10000
200000
 Pour le stockage, 2 écoles :
• Le modèle spaghetti
• Le modèle topologique
Mais l'information spatiale ?
Comment la stocker ?
Comment l'indexer ?
Les données vectorielles – modèle spaghetti
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Une classe d'entités est constituée d'entités complètement autonomes
 Une ligne ou un polygone est une simple liste de points (sommets)
 Au sein d'une classe d'entité, les entités peuvent se chevaucher
 Au sein d'une classe d'entité de polygones, les trous sont autorisés
Les données vectorielles – modèle spaghetti
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Structure de stockage des lignes dans une classe d'entités de lignes
Doublon
1
2
4
3
7
6
5
8
II
I
Tableau des lignes
X
Y
1
X1
Y1
2
X2
Y2
Début
Fin
3
…
…
I
1
4
4
…
…
II
5
8
5
…
…
6
…
…
7
…
…
8
X8
Y8
Tableau des
sommets
Les données vectorielles – modèle spaghetti
 Structure de stockage des polygones dans une classe d'entités de
polygones
3 6
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
2
7
I
4
10
II
Doublons
5
1
Tableau des lignes
Début
Fin
I
1
5
II
6
10
X
8
Y
1
X1
Y1
2
X2
Y2
3
…
…
4
…
…
5
…
…
6
…
…
7
…
…
8
…
…
9
…
…
10
X10
Y10
9
Tableau des
sommets
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les données vectorielles – modèle topologique
 Définition de la topologie :
concerne les relations entre objets dans le plan
(l'espace), telles qu'elles soient conservées par
homéomorphisme (déformation sans déchirement)
du dit plan (Signature, 1999)
Les données vectorielles – modèle topologique
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Exemple de déformation sans déchirement : un changement de
projection
Coordonnées sphériques – WGS84
UTM 35 N – WGS84
 La relation d'angle entre 2 objets n'est pas topologique, car elle n'est pas
conservée
 En revanche, la relation d'adjacence est topologique : la France reste
adjacente (connectée) à l'Espagne quelle que soit la projection
Les données vectorielles – modèle topologique
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Le modèle topologique considère une classe d'entités non plus
comme un ensemble d'entités complètement autonomes, mais
comme un graphe, c'est à dire un ensemble d'arcs connectés
 Un arc est constitué de 1 ou 2 sommets (ou noeuds) et de
points annexes
Sommet
Point annexe
 Un polygone (ou domaine) est délimité par des arcs
Les données vectorielles – modèle topologique
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Le modèle topologique ne se contente pas de stocker les
éléments qui constituent les entités, il stocke également les
relations topologiques entre ces entités
 Relations topologiques Arc – Sommets : un arc étant orienté, il a
un sommet initial et un sommet final
2
1 L'arc a pour sommet initial le sommet 1
et pour sommet final le sommet 2
 Relations topologiques Arc – Polygones : un arc étant orienté, il a
un polygone gauche et un polygone droit
A
1
B
L'arc 1 a pour polygone gauche le polygone
B et polygone droit le polygone A
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les données vectorielles – modèle topologique
 Au sein d'une classe d'entité, les entités ne peuvent pas se
chevaucher
 Au sein d'une classe d'entité de polygones, les trous sont interdits
Les données vectorielles – modèle topologique
 Structure de stockage des arcs dans une classe d'entités d'arcs
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Pas de doublon
1
A
3
2
4
5
B
C
II
I
Tableau des arcs
Topologie
Sommet
Initial
Sommet
final
Point annexe Point
début
annexe fin
I
A
B
1
2
II
B
C
3
5
XS
YS
A
XSA
YSA
B
XSB
YSB
C
XSC
YSC
X
Y
1
X1
Y1
2
X2
Y2
3
X3
Y3
4
X4
Y4
5
X5
Y5
Tableau des
sommets
Tableau des
points annexes
Les données vectorielles – modèle topologique
 Structure de stockage des arcs et des polygones dans une classe
d'entités de polygones
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
B
III
C
1
F
2
P1
II
VII
P2
3
IV
VI
4
V
I
A
E
D
Tableau des arcs
Topologie
Polygone
gauche
Polygone Point annexe
droit
début
Point
annexe fin
XS
YS
A
XSA
YSA
B
XSB
YSB
C
XSC
YSC
D
XSD
YSD
Sommet
Initial
Sommet
final
I
D
A
E
XSE
YSE
II
A
B
F
XSF
YSF
III
B
C
X
Y
IV
C
D
V
D
E
VI
E
VII
F
1
1
2
2
1
X1
Y1
3
4
2
X2
Y2
F
3
X3
Y3
C
4
X4
Y4
P2
P1
Tableau des
sommets
Tableau des
points annexes
Les données vectorielles – comparatif des 2
modèles
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Modèle topologique
• Pour
– Pas de redondance
– Accélération très significative des traitements faisant appel aux
relations de voisinage
– Très strict (pas de trous, pas de chevauchements)
– Excellent pour les traitements sur gros volumes de données
• contre
– Très lourd à gérer
 Modèle spaghetti
• Pour
– Très simple à comprendre et à manipuler
• contre
–
–
–
–
Redondance
Pas assez strict
Mises à jour graphiques souvent laborieuses
Très pénalisant pour les traitements sur gros volumes de données
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Les données vectorielles – Indexation spatiale
 Lors d'un zoom, il serait inutile et coûteux en temps machine de charger
en mémoire toutes les entités de la classe d'entités. Il est préférable de
ne charger que les entités concernées par l'étendue du zoom
 Mais il serait également très coûteux de vérifier, pour toutes les entités,
si elles sont contenues par ou si elles intersectent le rectangle d'emprise
du zoom
 L'indexation spatiale, c'est le stockage d’information supplémentaire
qui va permettre d’améliorer les performances lors de filtres spatiaux
(zooms, requêtes spatiales) de telle sorte que seule l’information utile
soit extraite et ce sans lire tout le contenu du fichier.
Les données vectorielles – Exemple d'algorithme
d'indexation : le tuilage
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 On créé une grille virtuelle
 Pour chaque entité, on recense les mailles de la grille qui la
contiennent
P7
7
4
P1
1
P6
P4
8
5
P5
9
6
P2
2
P3
3
Polygone
Maille contenant le polygone
P1
1
P1
2
P1
4
P2
2
P2
3
P2
5
P2
6
P3
3
P3
6
P3
9
…
…
P7
7
Les données vectorielles – Exploitation du tuilage par un
logiciel lors d'un zoom
P7
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
7
4
P1
1
P6
P4
8
5
P5
9
6
P2
2
P3
3
Polygone
Maille contenant le polygone
P1
1
P1
2
P1
4
P2
2
P2
3
P2
5
P2
6
P3
3
P3
6
P3
9
…
…
P7
7
 Récupération des mailles intersectées ou contenues par le rectangle qui
délimite l'étendue du zoom : 1 et 2
 Récupération dans le tableau les identifiants des polygones qui sont
contenues par ces mailles : P1 et P2
 Chargement en mémoire de ces polygones
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données vectorielles
Format Couverture ArcInfo
 Contemporain du logiciel ArcInfo (1982)
 Format topologique
 S'appuie sur le SGBDR INFO pour le stockage de l'information
attributaire
 Structure assez complexe, à base de répertoires et de fichiers :
Workspace : répertoire contenant au moins une couverture
Répertoire Info : répertoire partagé par toutes les
couvertures du workspace. Il contient leur information
attributaire
1 répertoire par classe d'entités (couverture). Ces répertoires
contiennent l'information spatiale de la classe d'entités dont ils
portent le nom
Formats de données vectorielles
Format Couverture ArcInfo
Point de vue de l'utilisateur
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Topologie arcs - sommets
Topologie arcs – polygones
Exemple : Couverture de
polygones states
Attributs de la classe d'entités
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données vectorielles
Format Shapefile (fichier de formes)
 Apparu avec le logiciel ArcView (fin années 80)
 Format public, qui s'est imposé comme le format d'échange de
référence
 Format spaghetti
 S'appuie sur le SGBDR dBase pour le stockage de l'information
attributaire
 Structure : une classe d'entités (shapefile) = 3 fichiers
obligatoirement + 4 fichiers facultatifs
.shp Information spatiale
.dbf
Information attributaire
.shx Index spatiaux
.sbn Index attributaires
.sbx
.prj
Paramètres de projection de la classe d'entités
.xml
Métadonnées (Norme ISO19115 ou FGDC)
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données vectorielles
Format Shapefile
Point de vue de l'utilisateur
Exemple : 3 classes
d'entités au format
shapefile
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données vectorielles
ArcSDE
 A la fin des années 90, Esri sort ArcSDE, technologie
permettant de stocker des classes d'entités non plus
dans des fichiers, mais dans un SGBDR (Oracle,
Informix, Sybase, SQL Server)
 ArcSDE, c'est :
• Un modèle de stockage
• Un serveur d'application, passerelle entre les logiciels
ESRI et le SGBD
Passerelle
ArcSDE
Création
SGBDR
Base de données
SQL
Consultation
•Classes d'entités
Mise à jour
•Tables classiques
Client
Serveur
Formats de données vectorielles
Schéma ArcSDE
Pour permettre de stocker des classes d'entités dans un SGBD, ArcSDE lui "fournit" 4 tables :
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Une table qui liste les classes d'entité de la base de données
 3 tables pour chaque classe d'entités stockée dans la base de données
•Une pour l'information attributaire
•Une pour l'information spatiale (modèle spaghetti)
•Une pour les index spatiaux
Classe d'entités
"Peuplements"
Information attributaire
Liste des classes
d'entités
ID
1
2
…
NAME
Peuplements
Géologie
…
shape substrat
100
meuble
101 rocheux
…
…
ID Geometry
100
101
…
…
Stockage
géométrie
…
…
…
…
ID
100
101
…
…
…
…
…
GX GY
1
1
1
2
…
Stockage index
spatiaux
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données vectorielles
Base de données ArcSDE
Point de vue de l'utilisateur
Exemple : 4 classes d'entités et une table dans une base de
données intitulée Ma_base_de_données
Formats de données vectorielles
Les Geodatabases
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Le format Geodatabase , présenté par Esri au début des années
2000, n'est rien d'autre que ArcSDE agrémenté de nouvelles
possibilités de stockage Geodatabase multi-utilisateur
 Le modèle de données d'ArcSDE s'est de plus ouvert à la
bureautique par sa transposition au SGBDR Access
Geodatabase personnelle
Geodatabase multi-utilisateur
Geodatabase personnelle
Base de données
Passerelle
ArcSDE
Création
SGBDR
SQL
Consultation
•Classes d'entités
•Tables classiques
•Métadonnées
•Classes de Relations
Mise à jour
•Classes de topologie
Client
Serveur
•Jeu de classes d'entités
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données vectorielles
Les Geodatabases – Classes de relations
 Dans une base de données relationnelles, il y a généralement de
nombreuses relations entre les tables
 Exemple : relation entre la table Villes et la table Régions
 Ces relations sont virtuelles : elles ne sont créées qu'au moment
de l'interrogation par SQL
 Le format Geodatabase permet à l'administrateur de stocker ces
relations sous la forme d'une Classe de relations
 Une classe de relations peut lier :
• Une classe d'entités à une autre classe d'entités (exemple
: Communes - Régions)
• Une classe d'entités à une table (exemple Parcelles Propriétaires)
• Une table à une autre table
 Les classes de relations peuvent être de type un à un, un à
plusieurs ou plusieurs à plusieurs
Formats de données vectorielles
Les Geodatabases – Classes de relations
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Exemple : relation entre une classe d'entités Concessions et une table
Propriétaires
Classe d'entités
Concessions
Classe de relation concessions propriétaires
Type : polygones
Bidirectionnelle
Table propriétaires
Cardinalité : N:M
Implémentation dans une Géodatabase
Modèle conceptuel
possède (1,N)
Concession
propriétaire
appartient à
(1,N)
Formats de données vectorielles
Les Geodatabases – Classes de relations
Point de vue de l'utilisateur
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Exemple : relation entre une classe d'entités Concessions et une table
Propriétaires
Click
Click
Liste des
propriétaires de la
concession
Attributs de
Attributs du
la concession
propriétaire 1
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données vectorielles
Les Geodatabases – Classes de topologie
 Le modèle de stockage de l'information spatiale est non
topologique
 Il est néanmoins possible d'établir des règles topologiques pour
chaque classes d'entités, et ce selon 2 modes :
• Intra-classe d'entité (ex. : "il ne doit y avoir aucun trou dans ma
classe d'entités parcelles", ou encore "Aucun polygones de ma
classe d'entité ne doivent se superposer")
• Entre classes d'entités (ex. : "les entités de la classe de
polylignes limites administratives doivent impérativement se
superposer à celles de la classe de polygones zones
administratives" )
 La vérification du respect de ces règles peut se faire à tout
instant via des outils d'ArcView
 Un jeu de 25 règles est ainsi à disposition.
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données vectorielles
Les Geodatabases – Jeu de classes d'entités
 Permet de regrouper dans un répertoire virtuel des
classes d'entités qui répondent à une même
thématique et qui sont dans la même emprise
géographique
 Exemples : Jeu de classes d'entités Données administratives, données
physiques, etc…
 Point de vue de l'utilisateur :
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Éléments d’un SIG
Utilisateurs
Logiciels
Base(s) de données vectorielles ou maillées
et Métadonnées
Fichiers
SGBD
Les données maillées (ou Raster)
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Les données sont représentées par l'intermédiaire d'une matrice
 A chaque cellule (ou maille, ou pixel) de la matrice est associée
un valeur numérique
Extrait Internet Esri France
Les différents types de données maillées
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Photos (aériennes, satellitaires,
sonar, …)
Variables continues (t°,
altitude, …)
Cartes scannées
Les données maillées – Données multi-bandes
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Un raster multi-bandes est un raster composé de plusieurs raster
Bande 1 :
Valeurs de
niveau de rouge
([0-255])
Bande 2 :
Valeurs de
niveau de vert
([0-255])
Bande 3 :
Valeurs de
niveau de bleu
([0-255])
Orthophotographie littorale :
composition colorée RVB issue de la
combinaison des 3 bandes (2563
couleurs possibles)
Les données maillées - Géoréférencement
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Un raster, par exemple une image numérique, est défini par
• ses dimensions : nombre de colonnes (NX) et nombre de
lignes (NY)
• Sa résolution : nombre de pixels par pouce
NY
NX = 5
NY = 4
NX
 Dans un SIG, il faut être capable de placer un raster dans un
repère géographique orthonormé. Un tel raster est dit
géoréférencé
Les données maillées - Géoréférencement
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Pour qu'un raster soit géoréférencé, il faut définir :
• Les coordonnées dans le repère d'un des points de la matrice, le
plus souvent le point situé en haut à gauche : X0, Y0
• Les pas en unité terrain (mètre, degré) de la matrice : DX, DY
X0, Y0
NY
NX = 5
NY = 4
X0 = 90000 m
Y0 = 2300000 m
DX = 15 m
DY
DY = 10 m
DX
NX
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données maillées
Format GRID
 Format ESRI
 Structure complexe, semblable à celle du format
vectoriel Couverture ArcInfo :
Workspace : répertoire contenant au moins une grille
Répertoire Info : répertoire partagé par toutes les grilles du
workspace. Il contient leur information attributaire
1 répertoire par grille. Ces répertoires contiennent toutes les
valeurs de la grille dont ils portent le nom
 Point de vue de l'utilisateur
Formats de données maillées
Formats Orientés SIG
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
 Formats dont les paramètres de géoréférencement
sont écrits au sein du fichier
• Formats non compressés :
– GEOTIFF : le format TIFF contient des balises dédiés
au géoréférencement du fichier
– Imagine (*.img) : format du logiciel ERDAS
– Er Mapper (*.ers) : format du logiciel Er Mapper
• Formats compressés :
– ECW
– MrSid
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Formats de données maillées
Formats grand public
 JPEG, Windows Bitmap, GIF, PNG, …
 Problème : où écrire les paramètres de géoréférencement ?
 Dans un fichier annexe (world file)
• qui porte le même nom que le fichier raster
• dont l'extension est sous la forme
1ère lettre extension fichier raster + dernière lettre + w
Exemple : jgw pour fichier jpg, bpw pour fichier bmp
- DY
Paramètres de rotation (très rarement utilisés)
DX
X0
Y0
SIG "Ifremer"
De plus en plus …
Introduction aux Systèmes Géographiques (SIG) - 06/05/2204
Utilisateurs
Autocad, Adobe Illustrator
Erdas, Er Mapper
ArcView, ArcInfo
Logiciels
Caraïbe, FishView, Adélie,
VideoNav, ModelView
3D, Spatial, Geostatistical
Analyst, ArcScan
Isatis
Base(s) de données vectorielles ou maillées
et Métadonnées
Des milliers de
shapefiles, de
couvertures ArcInfo
et de raster
Geodatabase
SEXTANT : données
de référence
Fichiers
SGBD
Téléchargement