Introduction à la classification des données de télédétection UMR TETIS Cemagref-CIRAD-ENGREF 5 mars 2007 Plan • Principes généraux – Classifications, évaluation, post-classification • Classification : Approche supervisée – – – – • • • • Extraction de l'information utile Stratification L’apprentissage Classifications supervisées Classification : Approche non supervisée Évaluation de la classification Post-classification Méthodes récentes – Approche Orienté-Objet – Classifications floues U.M.R. TETIS Module Extraction de l’information en télédétection 2/48 Principe général (1/3) Les éléments de la classification • Problème général de classification – Ranger des individus caractérisés par des variables dans des classes • En télédétection : – Individus = pixels – Variables = canaux spectraux – Classes = nomenclature U.M.R. TETIS Module Extraction de l’information en télédétection 3/48 Principe général (2/3) De “l’espace” géographique à “l’espace” radiométrique Analyse de l'image Image de départ (2 canaux) Canal n°1 Partition de l'espace des variables Classification des pixels Généralisation Canal n°2 U.M.R. TETIS Module Extraction de l’information en télédétection Image classée 4/48 Principe général (3/3) Modes de partition de l'espace des variables • Approche non-supervisée (non dirigée) : partition automatique de l'espace des variables intervention post-classification • Approche supervisée (dirigée) : partition dirigée de l'espace des variables à l'aide de données de terrain intervention du thématicien avant, pendant et après la classification U.M.R. TETIS Module Extraction de l’information en télédétection 5/48 Approche supervisée Étapes de la démarche dirigée Approche supervisée Sélection des données utiles Stratification Découpage de l’espace en “ zones d’iso-raisonnement ” Apprentissage Définition des règles de décision à partir des zones de référence Classification Application des règles de décision à l’ensemble des pixels à classer Évaluation Restitution des résultats U.M.R. TETIS Choix des variables (canaux originaux ou néo-canaux) Confrontation du résultat de la classification aux connaissances de terrain Cartes thématiques, statistiques de l’occupation du sol... Module Extraction de l’information en télédétection 6/48 Sélection des données utiles (1/2) Approche supervisée Sélection des données utiles Stratification Apprentissage Objectif : Choix des variables (canaux) pour la classification : ne retenir que l'information utile compte tenu des objectifs assignés Classification Evaluation Résultats U.M.R. TETIS Module Extraction de l’information en télédétection 7/48 Sélection des données utiles (2/2) Selon critères Approche supervisée • Critères statistiques – élimination de canaux trop redondants (matrice de corrélation) – Canaux synthétiques décorrélés (ACP) - mais attention perte de sens physique • Critères physiques – intérêt thématique d'un canal (ex : PIR pour le thème "eau") – création de nouveaux canaux (ex. indice de végétation) U.M.R. TETIS Module Extraction de l’information en télédétection 8/48 La stratification (1/6) Sélection des données utiles Objectif : Approche supervisée Stratification Apprentissage segmenter l'image en parties de même apparence Classification Evaluation définir des zones d'égale valeur de raisonnement Résultats U.M.R. TETIS Module Extraction de l’information en télédétection 9/48 La stratification (2/6) Quand faut-il stratifier ? Approche supervisée variabilité géographique variabilité spectrale exemple lié à la cible cas n°1 cas n°2 même réponse pour 2 classes sur 2 milieux différents réponse différ. pour même classe sur 2 situations topo Milieu en eau Milieu terrestre Stratification par type de sol U.M.R. TETIS Stratification avec MNT Module Extraction de l’information en télédétection 10/48 La stratification (3/6) Approche supervisée Critères endogènes à l’image • Stratification manuelle par photo-interprétation des textures et structures • Stratification automatique : – classification sommaire (seuillage) – classification automatique – application de filtres passe-bas afin de faire apparaître les grandes unités de l'image • Difficulté : relier ces segmentations à des déterminants physiques U.M.R. TETIS Module Extraction de l’information en télédétection 11/48 La stratification (4/6) exemple de critère endogène Séparation zone brûlée / zone non brûlée Approche supervisée Seuillage image SPOT (niveau 1B) limite de la zone incendiée U.M.R. TETIS Module Extraction de l’information en télédétection 12/48 La stratification (5/6) Approche supervisée Critères exogènes à l’image • Recherche du zonage pertinent – – – – – carte pédo-géologique carte agro-pédologique carte des petites régions naturelles carte agro-climatique modèle numérique de terrain (MNT) ... • informations à introduire dans la géométrie de l'image U.M.R. TETIS Module Extraction de l’information en télédétection 13/48 La stratification (6/6) exemple de critère exogène Approche supervisée Etude de la reprise végétale en tenant compte de l'antécédent forestier au travers de la cartographie de l'Inventaire Forestier National (IFN) Classes forestières avant incendie = strates pour analyse du comportement radiométrique Cartographie forestière avant incendie (IFN) U.M.R. TETIS Image SPOT (normalisation du relief souhaitable) Module Extraction de l’information en télédétection 14/48 L’apprentissage (1/8) Approche supervisée Sélection des données utiles Stratification Apprentissage Classification Objectifs : 1. établir la nomenclature de la classification 2. fournir les échantillons permettant d'initialiser et de valider la classification Evaluation Résultats U.M.R. TETIS Module Extraction de l’information en télédétection 15/48 L’apprentissage (2/8) Approche supervisée Principes et contraintes • Localiser, extraire et caractériser les composantes d'un échantillon représentatif • La démarche d'échantillonnage dépend du type de paysage – paysage présentant des limites claires (ex : parcellaire agricole) – paysage sans limites claires (ex : zone de continuum végétal ex. maquis) • Plusieurs types d'apprentissage U.M.R. TETIS Module Extraction de l’information en télédétection 16/48 L’apprentissage (3/8) éléments de conception Approche supervisée Positionnement Entité géographique enquêtée Aléatoire Systématique Point Raisonné Ligne (transect) Stratification Surface (Segment) Globale Stratifiée U.M.R. TETIS Module Extraction de l’information en télédétection 17/48 L’apprentissage (4/8) objets support d’apprentissage Approche supervisée • Points : méthode par tirage aléatoire ou systématique • Segments à frontières repérables sur le terrain : méthode de sondage stratifiée, aléatoire ou systématique • Segments à forme géométrique (carré) : méthode de sondage aléatoire ou systématique • Itinéraire : méthode de sondage raisonnée observation de parcelles le long d'un itinéraire • Unité type : méthode de sondage raisonnée et stratifiée exemple : ensemble des terres d'une exploitation "moyenne" U.M.R. TETIS Module Extraction de l’information en télédétection 18/48 L’apprentissage (5/8) Eléments de choix (1) Approche supervisée • Tenir compte : – – – – de la résolution du capteur de la taille des objets des hétérogénéités spatiales de l’objet d’étude (saison / phénologie / dynamique) Problème de nomenclature et de niveau d’organisation U.M.R. TETIS Module Extraction de l’information en télédétection 19/48 L’apprentissage (6/8) Eléments de choix (2) Approche supervisée • Si la taille des objets >> à la résolution – faibles contraintes dans la collecte (enquêtes par point, par transect, par segment) : cas des régions à "limites nettes". • Si la taille des objets << à la résolution – fortes contraintes dans la collecte (ex. enquêtes par transect) : cas des régions à "limites floues" – recherche de motifs paysagers, de structurations spatiales, etc. • Si l’objet d’étude varie beaucoup d’une saison à l’autre – choisir la bonne période en fonction des possibilités d’acquisition des satellites : cas des régions agricoles, urbaines... U.M.R. TETIS Module Extraction de l’information en télédétection 20/48 L’apprentissage (7/8) Approche supervisée Échantillonnage par segments carrés Positionnement des segments : - taux de sondage - superficie des segments enquête du segment (souvent avec aide photo aérienne, même ancienne de qqs années) • Avantages – Bon compromis résultats / temps passé (sous réserve représentativité des segments) U.M.R. TETIS Module Extraction de l’information en télédétection 21/48 L’apprentissage (8/8) Validation de l’apprentissage Approche supervisée • Validation intra-classe – vérifier l'homogénéité radiométrique de chaque échantillon et des échantillons appartenant à la même classe – vérifier les hypothèses à la base des méthodes de classification ex : hypothèse gaussienne • Validation inter-classe U.M.R. TETIS – comparaison des populations de pixels – matrice de confusion en pré-classification (cf. évaluation) Module Extraction de l’information en télédétection 22/48 Classifications – Généralités (1/2) Approche supervisée Sélection des données utiles Trois étapes : Stratification 1 - Choix d'un modèle de classification Apprentissage 2 - Définition des paramètres de ce modèle Classification 3 - Application à l'image Evaluation Résultats U.M.R. TETIS Module Extraction de l’information en télédétection 23/48 Classifications - Généralités (2/2) Les méthodes de classification Type de classification Méthodes Métrique U.M.R. TETIS Supervisée Non supervisée Arithmétique Statistique Module Extraction de l’information en télédétection 24/48 Classifications supervisées (1/7) Principe général Approche supervisée canal XS3 1 100 2 100 3 4 20 canal XS2 20 canal XS3 1 canal XS2 image brute image classée U.M.R. TETIS Module Extraction de l’information en télédétection 25/48 Classifications supervisées (2/7) méthodes disponibles Approche supervisée • Méthode de classification de type métrique – exemple : classification par distance minimum • Méthode de classification de type arithmétique – exemple : classification par hypercube • Méthode de classification de type statistique – exemple : classification par maximum de vraisemblance sous hypothèse gaussienne U.M.R. TETIS Module Extraction de l’information en télédétection 26/48 Classification supervisée (3/7) Approche supervisée de type métrique par distance minimum exemple : Distance euclidienne Pixel classé dans classe dont il est le plus proche centres des classes estimés à partir des pixels d'apprentissage (barycentre) canal 2 Centre classe 1 Centre classe 2 Centre classe 3 Limites de classe : Médiatrices des segments reliant les centres de classes U.M.R. TETIS Module Extraction de l’information en télédétection canal 1 27/48 Classification supervisée (4/7) Approche supervisée de type arithmétique par hypercube (ou méthode des bornes) Cette méthode n'utilise : - ni la notion de distance, - ni d'hypothèse sur les propriétés de distribution des valeurs radiométriques des pixels dans l'espace des variables canal 1 problème des recouvrements entre classes Forêt Orge Blé Maïs Vigne Verger canal 2 U.M.R. TETIS Module Extraction de l’information en télédétection 28/48 Classification supervisée (5/7) de type arithmétique par seuillage nb de pixels blanc Approche supervisée extraction de l’eau cas de 2 classes noir 0 seuil U.M.R. TETIS 255 compte numérique (canal XS3) Module Extraction de l’information en télédétection 29/48 Classification supervisée (6/7) Fonction de densité de probabilité Approche supervisée de type statistique : maximum de vraisemblance représentation des fonctions de densités de probabilités conditionnelles d’un attribut x pour des points images provenant de 2 classes C1 et C2 P(x/C2) P(x/C1) +∞ ∫ p( x / Cq ).dx = 1 −∞ q = 1, 2, ... X La règle de Bayes permet de calculer : p ( x / Cq ). p (Cq ) p (Cq / x) = avec p ( x) = p ( x / Cq ). p (Cq ) p( x) q =1, 2 ,... ∑ U.M.R. TETIS Module Extraction de l’information en télédétection 30/48 Classifications supervisées (7/7) Comparaison des méthodes de classification supervisée Lignes d'équidensité de probabilité Canal 2 Canal 2 Canal 2 Canal 1 classification par distance minimale Canal 1 classification par hypercubes Canal 1 classification par maximum de vraisemblance Le choix de la méthode dépend de la structure des données. Mais seule l'approche statistique permet d'atteindre un taux d'erreur minimal U.M.R. TETIS Module Extraction de l’information en télédétection 31/48 Approche non supervisée (1/2) méthode non supervisée : agrégation autour de centres mobiles (nuées dynamiques) C1 x Constitution des classes x C2 C3 x C2 x C1 x C3 x départ : choix du nombre de classes critères d’arrêt des itérations : Tirage au hasard des centres C’2x L’utilisateur C’1x Constitution des classes choix du nombre maximal des itérations (k) OU C’3x C’’2x C’’1x seuil de stabilité des classes Calcul des nouveaux centres C’’3x K itérations U.M.R. TETIS astuce : choisir double du nbre souhaité de classes Module Extraction de l’information en télédétection 32/48 Approche non supervisée (2/2) méthode non supervisée : agrégation autour de centres mobiles (nuées dynamiques) exemple : cartographie en 10 classes à partir de 6 images SPOT (1991 à 1996) 130 Année Proche Infra Rouge 120 4 5 9 110 94 95 1 2 3 4 5 6 7 8 9 10 90 80 70 60 40 3 6 2 92 96 96 100 93 91 10 91 7 8 1 Numéro de la classe 50 60 70 80 90 100 110 120 Rouge U.M.R. TETIS Module Extraction de l’information en télédétection 33/48 Évaluation de la classification (1/10) étape essentielle de la démarche de cartographie Stratification Apprentissage Classification Evaluation vérification de la cohérence des paramètres de classification validation du modèle de classification Résultats U.M.R. TETIS Module Extraction de l’information en télédétection 34/48 validation Approche supervisée parcelles enquêtées terrain Sélection des données utiles Évaluation de la classification (2/10) Composantes de l'évaluation La précision des résultats cartographiques peut être évaluée par : – la précision géométrique • précision de la délimitation des limites des objets – la précision sémantique • identification du contenu des objets cartographiés U.M.R. TETIS Module Extraction de l’information en télédétection 35/48 Évaluation de la classification (3/10) Conditions de l'évaluation • Il existe une limite théorique de la précision : – fonction du taux de pixels thématiquement "purs", – lui même relié à la résolution du capteur et à la taille des objets • L'évaluation de la précision n'a qu'une valeur relative, – la référence elle-même étant une représentation du terrain (la ‘vérité-terrain’ existe-t-elle ?) U.M.R. TETIS Module Extraction de l’information en télédétection 36/48 Évaluation de la classification (4/10) Types d'évaluation • Évaluation globale : – évaluation qualitative : • Comparaison visuelle avec des données exogènes (photo-aériennes, cartes, etc.) – évaluation quantitative : • comparaison des superficies obtenues avec des données exogènes (statistiques agricoles, etc.) • comparaison des populations de pixels provenant des parcelles d'apprentissage avec celles provenant de la cartographie obtenue • Évaluation spatialisée U.M.R. TETIS Module Extraction de l’information en télédétection 37/48 Évaluation de la classification (5/10) Notion de précision statistique et géographique Précision A statistique géographique (cartographique) A B 100% 100% A B 100% 0% B vérité terrain classifications U.M.R. TETIS Module Extraction de l’information en télédétection 38/48 Évaluation de la classification (6/10) évaluation spatialisée à l’aide de la matrice de confusion Vérité-terrain Classification X1 . . . Xi . . . X X. … X1j … X1n X1. … Xijii … Xin Xi. … Xnj … Xnn Xn. … X.j … X.n X.. Xij : nb de pixels appartenant sur le terrain à la classe Cj et classés dans Ci X.j : somme des Xij sur la colonne j Xi. : somme des Xij sur la ligne i X.. : somme en ligne et en colonne (nombre total de pixels d’apprentissage) U.M.R. TETIS Module Extraction de l’information en télédétection 39/48 Évaluation de la classification (7/10) Précisions et Types d’erreur • Paramètres par classe dérivés de la matrice de confusion : • Précision du producteur (producer’s accuracy) - probabilité pour un pixel de la classe Ck sur le terrain d’être bien classé en Ck sur la carte : EC = (Xkk/X.k)*100 - Complément à 100% : Erreur de commission • Précision de l'utilisateur (user’s accuracy) - probabilité pour un pixel classé en Ck sur la carte d’appartenir à Ck sur le terrain EO = (Xkk/Xk.)*100 - Complément à 100% : Erreur d’omission • Erreur statistique proportion de pixels classés en Ck par rapport au nombre de pixels réellement en Ck sur le terrain EA = (Xk./X.k)*100 U.M.R. TETIS Module Extraction de l’information en télédétection 40/48 Evaluation de la classification (8/10) Types d’erreur • Quelques paramètres globaux dérivés de la matrice de confusion • Erreur de commission moyenne moyenne des EC sur les n classes • Erreur d’omission moyenne moyenne des EO sur les n classes • Précision géographique globale somme de la diagonale PGG = [(Σ ΣiXij)/X..]*100 U.M.R. TETIS Module Extraction de l’information en télédétection 41/48 Evaluation de la classification (9/10) matrice de confusion exemple : 5 classes avec 100 pixels par classe Classification Terrain Classe 1 Classe 1 100 Classe 2 10 Classe 2 Classe 4 Classe 5 Total 100 50 10 5 80 20 20 10 65 5 100 Classe 3 Classe 4 Classe 3 25 100 100 Classe 5 0 15 5 5 75 100 Total 110 85 105 95 105 500 Précision géographique U.M.R. TETIS Précision statistique Module Extraction de l’information en télédétection 42/48 Evaluation de la classification (10/10) Emploi de la matrice de confusion • Dans le cas de classifications pixel à pixel – 1 pixel = 1 objet • Lors de l'apprentissage (en pré-classification) – cohérence des paramètres estimés pour le modèle de classification, mais ce n'est pas une validation ! • Pour valider le modèle de classification – à partir de parcelles de validation (non utilisées lors de l'apprentissage) – ces parcelles doivent constituer un échantillon représentatif et couvrir de façon homogène le territoire U.M.R. TETIS Module Extraction de l’information en télédétection 43/48 Post-classification (1/2) Amélioration des images classées • Processus itératif «classification / évaluation» : amélioration progressive • Amélioration à partir des matrices de confusion – redécoupages de classes radiométriques en sous-classes avant de relancer la classification – regroupements visuels ou numériques des sous-classes d’une même classe – regroupement des classes thématiques trop confondues • Probabilité de correcte affectation (max. de vraisemblance) – utilisation du plan de probabilité comme plan masque pour retravailler les pixels classés avec une faible probabilité – modification du seuil de rejet avant de relancer la classification U.M.R. TETIS Module Extraction de l’information en télédétection 44/48 Post-classification (2/2) Amélioration des images classées • Probabilité à priori (max. de vraisemblance) – pondération des classes en fonction de leur répartition dans la réalité (selon données statistiques, expertises …) – utile pour retravailler les classes qui se confondent => amélioration des statistiques • Choix de l’algorithme et de l’approche de classification • Filtrage des images classées – ex : filtre d’homogénéisation • Introduction de variables exogènes – comme néocanaux (ex: pente, altitude…) – comme plans masques (ex: villes et réseaux tirés de BD IGN) – comme éléments d’homogénéisation (ex: limites du parcellaire) U.M.R. TETIS Module Extraction de l’information en télédétection 45/48 Autres approches de classification Approche Orienté-Objet (AOO) • Contexte AOO en télédétection – Imagerie THR : augmentation hétérogénéité ex. variabilité intra-parcellaire ex. forêt -> arbre -> composantes de l'arbre : (1) partie du houppier au soleil, (2) partie du houppier à l'ombre, (3) ombre portée • Objet d'intérêt : segment (≠ ≠ pixel) • Méthode – Segmentation – Calcul de paramètres par segment • radiométriques : moyenne, écart-type, texture • Identification des segments voisins • Exemple d'intérêt – Arbre = 3 segments côte à côte, de taille et radiométrie correspondant aux 3 composantes (1) houppier au soleil, (2) houppier à l'ombre, (3) ombre portée U.M.R. TETIS Module Extraction de l’information en télédétection 46/48 Autres approches de classification Classifications floues (1/2) • Logique booléenne – Ex. classification sur 3 classes, variable taille • frontière franche, étanche à x = x0 : avant x0 : n'appartient pas, après x0 : appartient – Logique booléenne dans • Plus proche voisin, hypercube, maximum vraisemblance… • Logique floue (fuzzy logic) – Frontière floue • Variation progressive de probabilité d'appartenance sur intervalle [x0, x1] x0 U.M.R. TETIS Module Extraction de l’information en télédétection x1 47/48 Autres approches de classification Classifications floues (2/2) • Combinaison de fonctions d'appartenance – Par ex. par pondération des canaux U.M.R. TETIS Module Extraction de l’information en télédétection 48/48