Introduction à la classification des données de télédétection

publicité
Introduction à la classification
des données de télédétection
UMR TETIS Cemagref-CIRAD-ENGREF
5 mars 2007
Plan
• Principes généraux
– Classifications, évaluation, post-classification
• Classification : Approche supervisée
–
–
–
–
•
•
•
•
Extraction de l'information utile
Stratification
L’apprentissage
Classifications supervisées
Classification : Approche non supervisée
Évaluation de la classification
Post-classification
Méthodes récentes
– Approche Orienté-Objet
– Classifications floues
U.M.R. TETIS
Module Extraction de l’information en télédétection
2/€48
Principe général (1/3)
Les éléments de la classification
• Problème général de classification
– Ranger des individus caractérisés par des variables
dans des classes
• En télédétection :
– Individus = pixels
– Variables = canaux spectraux
– Classes = nomenclature
U.M.R. TETIS
Module Extraction de l’information en télédétection
3/€48
Principe général (2/3)
De “l’espace” géographique à “l’espace” radiométrique
Analyse
de l'image
Image de départ
(2 canaux)
Canal n°1
Partition de
l'espace des variables
Classification des pixels
Généralisation
Canal n°2
U.M.R. TETIS
Module Extraction de l’information en télédétection
Image classée
4/€48
Principe général (3/3)
Modes de partition de l'espace des variables
•
Approche non-supervisée (non dirigée) :
partition automatique de l'espace des variables
intervention post-classification
•
Approche supervisée (dirigée) :
partition dirigée de l'espace des variables à l'aide de
données de terrain
intervention du thématicien avant, pendant et après la
classification
U.M.R. TETIS
Module Extraction de l’information en télédétection
5/€48
Approche supervisée
Étapes de la démarche dirigée
Approche supervisée
Sélection des
données utiles
Stratification
Découpage de l’espace en
“ zones d’iso-raisonnement ”
Apprentissage
Définition des règles de décision
à partir des zones de référence
Classification
Application des règles de décision
à l’ensemble des pixels à classer
Évaluation
Restitution
des résultats
U.M.R. TETIS
Choix des variables
(canaux originaux ou néo-canaux)
Confrontation du résultat de la classification
aux connaissances de terrain
Cartes thématiques, statistiques
de l’occupation du sol...
Module Extraction de l’information en télédétection
6/€48
Sélection des données utiles (1/2)
Approche supervisée
Sélection des
données utiles
Stratification
Apprentissage
Objectif :
Choix des variables (canaux)
pour la classification :
ne retenir que l'information utile
compte tenu des objectifs assignés
Classification
Evaluation
Résultats
U.M.R. TETIS
Module Extraction de l’information en télédétection
7/€48
Sélection des données utiles (2/2)
Selon critères
Approche supervisée
• Critères statistiques
– élimination de canaux trop redondants (matrice de corrélation)
– Canaux synthétiques décorrélés (ACP) - mais attention perte de
sens physique
• Critères physiques
– intérêt thématique d'un canal (ex : PIR pour le thème "eau")
– création de nouveaux canaux (ex. indice de végétation)
U.M.R. TETIS
Module Extraction de l’information en télédétection
8/€48
La stratification (1/6)
Sélection des
données utiles
Objectif :
Approche supervisée
Stratification
Apprentissage
segmenter l'image en parties
de même apparence
Classification
Evaluation
définir des zones
d'égale valeur de raisonnement
Résultats
U.M.R. TETIS
Module Extraction de l’information en télédétection
9/€48
La stratification (2/6)
Quand faut-il stratifier ?
Approche supervisée
variabilité géographique
variabilité spectrale
exemple lié à la cible
cas n°1
cas n°2
même réponse pour 2 classes
sur 2 milieux différents
réponse différ. pour même classe
sur 2 situations topo
Milieu en eau Milieu terrestre
Stratification par type de sol
U.M.R. TETIS
Stratification avec MNT
Module Extraction de l’information en télédétection
10/€48
La stratification (3/6)
Approche supervisée
Critères endogènes à l’image
• Stratification manuelle par photo-interprétation des
textures et structures
•
Stratification automatique :
– classification sommaire (seuillage)
– classification automatique
– application de filtres passe-bas afin de faire apparaître les
grandes unités de l'image
•
Difficulté : relier ces segmentations à des
déterminants physiques
U.M.R. TETIS
Module Extraction de l’information en télédétection
11/€48
La stratification (4/6)
exemple de critère endogène
Séparation zone brûlée / zone non brûlée
Approche supervisée
Seuillage
image SPOT (niveau 1B)
limite de la zone incendiée
U.M.R. TETIS
Module Extraction de l’information en télédétection
12/€48
La stratification (5/6)
Approche supervisée
Critères exogènes à l’image
• Recherche du zonage pertinent
–
–
–
–
–
carte pédo-géologique
carte agro-pédologique
carte des petites régions naturelles
carte agro-climatique
modèle numérique de terrain (MNT) ...
• informations à introduire dans la géométrie de l'image
U.M.R. TETIS
Module Extraction de l’information en télédétection
13/€48
La stratification (6/6)
exemple de critère exogène
Approche supervisée
Etude de la reprise végétale en tenant compte de l'antécédent forestier
au travers de la cartographie de l'Inventaire Forestier National (IFN)
Classes
forestières
avant
incendie
= strates pour
analyse du
comportement
radiométrique
Cartographie forestière
avant incendie (IFN)
U.M.R. TETIS
Image SPOT
(normalisation du relief souhaitable)
Module Extraction de l’information en télédétection
14/€48
L’apprentissage (1/8)
Approche supervisée
Sélection des
données utiles
Stratification
Apprentissage
Classification
Objectifs :
1. établir la nomenclature de
la classification
2. fournir les échantillons
permettant d'initialiser et
de valider la classification
Evaluation
Résultats
U.M.R. TETIS
Module Extraction de l’information en télédétection
15/€48
L’apprentissage (2/8)
Approche supervisée
Principes et contraintes
• Localiser, extraire et caractériser les composantes d'un
échantillon représentatif
• La démarche d'échantillonnage dépend du type de paysage
– paysage présentant des limites claires (ex : parcellaire agricole)
– paysage sans limites claires (ex : zone de continuum végétal
ex. maquis)
• Plusieurs types d'apprentissage
U.M.R. TETIS
Module Extraction de l’information en télédétection
16/€48
L’apprentissage (3/8)
éléments de conception
Approche supervisée
Positionnement
Entité géographique enquêtée
Aléatoire
Systématique
Point
Raisonné
Ligne (transect)
Stratification
Surface (Segment)
Globale
Stratifiée
U.M.R. TETIS
Module Extraction de l’information en télédétection
17/€48
L’apprentissage (4/8)
objets support d’apprentissage
Approche supervisée
• Points : méthode par tirage aléatoire ou systématique
• Segments à frontières repérables sur le terrain : méthode de
sondage stratifiée, aléatoire ou systématique
• Segments à forme géométrique (carré) : méthode de sondage
aléatoire ou systématique
• Itinéraire : méthode de sondage raisonnée
observation de parcelles le long d'un itinéraire
• Unité type : méthode de sondage raisonnée et stratifiée
exemple : ensemble des terres d'une exploitation "moyenne"€
U.M.R. TETIS
Module Extraction de l’information en télédétection
18/€48
L’apprentissage (5/8)
Eléments de choix (1)
Approche supervisée
• Tenir compte :
–
–
–
–
de la résolution du capteur
de la taille des objets
des hétérogénéités spatiales
de l’objet d’étude (saison / phénologie / dynamique)
Problème de nomenclature et de niveau d’organisation
U.M.R. TETIS
Module Extraction de l’information en télédétection
19/€48
L’apprentissage (6/8)
Eléments de choix (2)
Approche supervisée
• Si la taille des objets >> à la résolution
– faibles contraintes dans la collecte (enquêtes par point, par transect,
par segment) : cas des régions à "limites nettes".
•
Si la taille des objets << à la résolution
– fortes contraintes dans la collecte (ex. enquêtes par transect) :
cas des régions à "limites floues"
– recherche de motifs paysagers, de structurations spatiales, etc.
•
Si l’objet d’étude varie beaucoup d’une saison à l’autre
– choisir la bonne période en fonction des possibilités d’acquisition
des satellites : cas des régions agricoles, urbaines...
U.M.R. TETIS
Module Extraction de l’information en télédétection
20/€48
L’apprentissage (7/8)
Approche supervisée
Échantillonnage par segments carrés
Positionnement des segments :
- taux de sondage
- superficie des segments
enquête du segment
(souvent avec aide photo aérienne,
même ancienne de qqs années)
• Avantages
– Bon compromis résultats / temps passé (sous réserve représentativité
des segments)
U.M.R. TETIS
Module Extraction de l’information en télédétection
21/€48
L’apprentissage (8/8)
Validation de l’apprentissage
Approche supervisée
• Validation intra-classe
– vérifier l'homogénéité radiométrique de chaque échantillon
et des échantillons appartenant à la même classe
– vérifier les hypothèses à la base des méthodes de classification
ex : hypothèse gaussienne
• Validation inter-classe
U.M.R. TETIS
– comparaison des populations de pixels
– matrice de confusion en pré-classification
(cf. évaluation)
Module Extraction de l’information en télédétection
22/€48
Classifications – Généralités (1/2)
Approche supervisée
Sélection des
données utiles
Trois étapes :
Stratification
1 - Choix d'un modèle de
classification
Apprentissage
2 - Définition des paramètres
de ce modèle
Classification
3 - Application à l'image
Evaluation
Résultats
U.M.R. TETIS
Module Extraction de l’information en télédétection
23/€48
Classifications - Généralités (2/2)
Les méthodes de classification
Type de classification
Méthodes
Métrique
U.M.R. TETIS
Supervisée
Non supervisée
Arithmétique
Statistique
Module Extraction de l’information en télédétection
24/€48
Classifications supervisées (1/7)
Principe général
Approche supervisée
canal XS3
1
100
2
100
3
4
20
canal XS2
20
canal XS3
1
canal XS2
image brute
image classée
U.M.R. TETIS
Module Extraction de l’information en télédétection
25/€48
Classifications supervisées (2/7)
méthodes disponibles
Approche supervisée
• Méthode de classification de type métrique
– exemple : classification par distance minimum
• Méthode de classification de type arithmétique
– exemple : classification par hypercube
• Méthode de classification de type statistique
– exemple : classification par maximum de vraisemblance
sous hypothèse gaussienne
U.M.R. TETIS
Module Extraction de l’information en télédétection
26/€48
Classification supervisée (3/7)
Approche supervisée
de type métrique par distance minimum
exemple :
Distance euclidienne
Pixel classé dans classe
dont il est le plus proche
centres des classes
estimés à partir des
pixels d'apprentissage
(barycentre)
canal 2
Centre
classe 1
Centre
classe 2
Centre
classe 3
Limites de classe :
Médiatrices des segments
reliant les centres de classes
U.M.R. TETIS
Module Extraction de l’information en télédétection
canal 1
27/€48
Classification supervisée (4/7)
Approche supervisée
de type arithmétique par hypercube (ou méthode des bornes)
Cette méthode n'utilise :
- ni la notion de distance,
- ni d'hypothèse sur les propriétés de distribution des valeurs
radiométriques des pixels dans l'espace des variables
canal 1
problème des
recouvrements
entre classes
Forêt
Orge
Blé
Maïs
Vigne
Verger
canal 2
U.M.R. TETIS
Module Extraction de l’information en télédétection
28/€48
Classification supervisée (5/7)
de type arithmétique par seuillage
nb de pixels
blanc
Approche supervisée
extraction de l’eau
cas de 2
classes
noir
0
seuil
U.M.R. TETIS
255
compte numérique (canal XS3)
Module Extraction de l’information en télédétection
29/€48
Classification supervisée (6/7)
Fonction de densité de probabilité
Approche supervisée
de type statistique : maximum de vraisemblance
représentation des fonctions de densités
de probabilités conditionnelles d’un
attribut x pour des points images
provenant de 2 classes C1 et C2
P(x/C2)
P(x/C1)
+∞
∫ p( x / Cq ).dx = 1
−∞
q = 1, 2, ...
X
La règle de Bayes permet de calculer :
p ( x / Cq ). p (Cq )
p (Cq / x) =
avec p ( x) =
p ( x / Cq ). p (Cq )
p( x)
q =1, 2 ,...
∑
U.M.R. TETIS
Module Extraction de l’information en télédétection
30/€48
Classifications supervisées (7/7)
Comparaison des méthodes de classification supervisée
Lignes d'équidensité
de probabilité
Canal 2
Canal 2
Canal 2
Canal 1
classification par
distance minimale
Canal 1
classification par
hypercubes
Canal 1
classification par
maximum de vraisemblance
Le choix de la méthode dépend de la structure des données.
Mais seule l'approche statistique permet d'atteindre un taux d'erreur minimal
U.M.R. TETIS
Module Extraction de l’information en télédétection
31/€48
Approche non supervisée (1/2)
méthode non supervisée : agrégation autour de centres mobiles (nuées dynamiques)
C1
x
Constitution des classes
x
C2
C3
x
C2
x
C1
x
C3
x
départ :
choix du nombre de
classes
critères d’arrêt des
itérations :
Tirage au hasard des centres
C’2x
L’utilisateur
C’1x
Constitution des classes
choix du nombre maximal
des itérations (k)
OU
C’3x
C’’2x
C’’1x
seuil de stabilité des
classes
Calcul des nouveaux centres
C’’3x
K itérations
U.M.R. TETIS
astuce : choisir double du
nbre souhaité de classes
Module Extraction de l’information en télédétection
32/€48
Approche non supervisée (2/2)
méthode non supervisée : agrégation autour de centres mobiles (nuées dynamiques)
exemple : cartographie en 10 classes
à partir de
6 images SPOT (1991 à 1996)
130
Année
Proche Infra Rouge
120
4
5
9
110
94
95
1
2
3
4
5
6
7
8
9
10
90
80
70
60
40
3
6
2
92
96
96
100
93
91 10
91
7
8
1
Numéro de la
classe
50
60
70
80
90
100
110
120
Rouge
U.M.R. TETIS
Module Extraction de l’information en télédétection
33/€48
Évaluation de la classification (1/10)
étape essentielle de la démarche de cartographie
Stratification
Apprentissage
Classification
Evaluation
vérification de la
cohérence des paramètres
de classification
validation du modèle
de classification
Résultats
U.M.R. TETIS
Module Extraction de l’information en télédétection
34/€48
validation
Approche supervisée
parcelles enquêtées
terrain
Sélection des
données utiles
Évaluation de la classification (2/10)
Composantes de l'évaluation
La précision des résultats cartographiques peut être évaluée par :
– la précision géométrique
• précision de la délimitation des limites des objets
– la précision sémantique
• identification du contenu des objets cartographiés
U.M.R. TETIS
Module Extraction de l’information en télédétection
35/€48
Évaluation de la classification (3/10)
Conditions de l'évaluation
• Il existe une limite théorique de la précision :
– fonction du taux de pixels thématiquement "purs",
– lui même relié à la résolution du capteur et à la taille des objets
• L'évaluation de la précision n'a qu'une valeur relative,
– la référence elle-même étant une représentation du terrain
(la ‘vérité-terrain’ existe-t-elle ?)
U.M.R. TETIS
Module Extraction de l’information en télédétection
36/€48
Évaluation de la classification (4/10)
Types d'évaluation
• Évaluation globale :
– évaluation qualitative :
• Comparaison visuelle avec des données exogènes
(photo-aériennes, cartes, etc.)
– évaluation quantitative :
• comparaison des superficies obtenues avec des données
exogènes (statistiques agricoles, etc.)
• comparaison des populations de pixels provenant des
parcelles d'apprentissage avec celles provenant de la
cartographie obtenue
• Évaluation spatialisée
U.M.R. TETIS
Module Extraction de l’information en télédétection
37/€48
Évaluation de la classification (5/10)
Notion de précision statistique et géographique
Précision
A
statistique
géographique
(cartographique)
A
B
100%
100%
A
B
100%
0%
B
vérité terrain
classifications
U.M.R. TETIS
Module Extraction de l’information en télédétection
38/€48
Évaluation de la classification (6/10)
évaluation spatialisée à l’aide de la matrice de confusion
Vérité-terrain
Classification
X1
.
.
.
Xi
.
.
.
X
X.
…
X1j
…
X1n
X1.
…
Xijii
…
Xin
Xi.
…
Xnj
…
Xnn
Xn.
…
X.j
…
X.n
X..
Xij : nb de pixels appartenant sur le terrain à la classe Cj et classés dans Ci
X.j : somme des Xij sur la colonne j
Xi. : somme des Xij sur la ligne i
X.. : somme en ligne et en colonne (nombre total de pixels d€’apprentissage)
U.M.R. TETIS
Module Extraction de l’information en télédétection
39/€48
Évaluation de la classification (7/10)
Précisions et Types d’erreur
• Paramètres par classe dérivés de la matrice de confusion :
• Précision du producteur (producer’s accuracy)
- probabilité pour un pixel de la classe Ck sur le terrain d’être bien
classé en Ck sur la carte : EC = (Xkk/X.k)*100
- Complément à 100% : Erreur de commission
• Précision de l'utilisateur (user’s accuracy)
- probabilité pour un pixel classé en Ck sur la carte d’appartenir à Ck sur
le terrain EO = (Xkk/Xk.)*100
- Complément à 100% : Erreur d’omission
• Erreur statistique
proportion de pixels classés en Ck par rapport au nombre de pixels
réellement en Ck sur le terrain
EA = (Xk./X.k)*100
U.M.R. TETIS
Module Extraction de l’information en télédétection
40/€48
Evaluation de la classification (8/10)
Types d’erreur
• Quelques paramètres globaux dérivés de la matrice de confusion
• Erreur de commission moyenne
moyenne des EC sur les n classes
• Erreur d’omission moyenne
moyenne des EO sur les n classes
• Précision géographique globale
somme de la diagonale
PGG = [(Σ
ΣiXij)/X..]*100
U.M.R. TETIS
Module Extraction de l’information en télédétection
41/€48
Evaluation de la classification (9/10)
matrice de confusion
exemple : 5 classes avec 100 pixels par classe
Classification
Terrain
Classe 1
Classe 1
100
Classe 2
10
Classe 2
Classe 4
Classe 5
Total
100
50
10
5
80
20
20
10
65
5
100
Classe 3
Classe 4
Classe 3
25
100
100
Classe 5
0
15
5
5
75
100
Total
110
85
105
95
105
500
Précision géographique
U.M.R. TETIS
Précision statistique
Module Extraction de l’information en télédétection
42/€48
Evaluation de la classification (10/10)
Emploi de la matrice de confusion
•
Dans le cas de classifications pixel à pixel
– 1 pixel = 1 objet
•
Lors de l'apprentissage (en pré-classification)
– cohérence des paramètres estimés pour le modèle de classification, mais ce
n'est pas une validation !
•
Pour valider le modèle de classification
– à partir de parcelles de validation (non utilisées lors de l'apprentissage)
– ces parcelles doivent constituer un échantillon représentatif et couvrir de
façon homogène le territoire
U.M.R. TETIS
Module Extraction de l’information en télédétection
43/€48
Post-classification (1/2)
Amélioration des images classées
•
Processus itératif «€classification / évaluation€» : amélioration
progressive
•
Amélioration à partir des matrices de confusion
– redécoupages de classes radiométriques en sous-classes avant de relancer
la classification
– regroupements visuels ou numériques des sous-classes d’une même classe
– regroupement des classes thématiques trop confondues
•
Probabilité de correcte affectation (max. de vraisemblance)
– utilisation du plan de probabilité comme plan masque pour retravailler les
pixels classés avec une faible probabilité
– modification du seuil de rejet avant de relancer la classification
U.M.R. TETIS
Module Extraction de l’information en télédétection
44/€48
Post-classification (2/2)
Amélioration des images classées
•
Probabilité à priori (max. de vraisemblance)
– pondération des classes en fonction de leur répartition dans la réalité (selon
données statistiques, expertises …)
– utile pour retravailler les classes qui se confondent
=> amélioration des statistiques
•
Choix de l’algorithme et de l’approche de classification
•
Filtrage des images classées
– ex : filtre d’homogénéisation
•
Introduction de variables exogènes
– comme néocanaux (ex: pente, altitude…)
– comme plans masques (ex: villes et réseaux tirés de BD IGN)
– comme éléments d’homogénéisation (ex: limites du parcellaire)
U.M.R. TETIS
Module Extraction de l’information en télédétection
45/€48
Autres approches de classification
Approche Orienté-Objet (AOO)
• Contexte AOO en télédétection
– Imagerie THR : augmentation hétérogénéité
ex. variabilité intra-parcellaire
ex. forêt -> arbre -> composantes de l'arbre :
(1) partie du houppier au soleil, (2) partie du houppier à l'ombre, (3) ombre portée
• Objet d'intérêt : segment (≠
≠ pixel)
• Méthode
– Segmentation
– Calcul de paramètres par segment
• radiométriques : moyenne, écart-type, texture
• Identification des segments voisins
• Exemple d'intérêt
– Arbre = 3 segments côte à côte, de taille et radiométrie correspondant aux
3 composantes (1) houppier au soleil, (2) houppier à l'ombre, (3) ombre portée
U.M.R. TETIS
Module Extraction de l’information en télédétection
46/€48
Autres approches de classification
Classifications floues (1/2)
• Logique booléenne
– Ex. classification sur 3 classes, variable taille
• frontière franche, étanche à x = x0 :
avant x0 : n'appartient pas, après x0 : appartient
– Logique booléenne dans
• Plus proche voisin, hypercube,
maximum vraisemblance…
• Logique floue (fuzzy logic)
– Frontière floue
• Variation progressive de probabilité
d'appartenance sur intervalle [x0, x1]
x0
U.M.R. TETIS
Module Extraction de l’information en télédétection
x1
47/€48
Autres approches de classification
Classifications floues (2/2)
• Combinaison de fonctions d'appartenance
– Par ex. par pondération des canaux
U.M.R. TETIS
Module Extraction de l’information en télédétection
48/€48
Téléchargement