وزارة ا ـــ ـــ ــــ ــــ ـــــم ا ــــ ــــــ ــــــ و ا ـــــــ ــــ ــــث ا ــــــ ـــــــ ــــــــ ـــــــ Ministère de l'Enseignement Supérieur et de la Recherche Scientifique ــــــــ ــــ ـــــ ـــــ ــــ ــــــ ـــــــ ــــن ـــــو ـــــ ــــــ – ا ــــ ـــــ ــــــف Université Hassiba Benbouali de Chlef ــــ ــــ ـــــــ ــــــ ــــــوم ا طـــ ـــــ ــــ ـــــ و ا ــــ ــــــ ة Faculté des Sciences de la Nature et de la Vie ـــــ ـــــــم ا ــــــ ــــــ ء و ا ــــ ــــــ ـــــــ ـــــــ و ا ـــــ ـــــ!ــــــ ــــــ ا ـــــ ـــــ ـــــــ ــــــدا ــــــــــ Département d’Eau, Environnement et Développement Durable Notes de cours Master 2, Eau et Environnement Filière : Agronomie Domaine : Sciences de la Nature et de la Vie GÉOSTATISTIQUE APPLIQUÉE )([email protected] Notes de cours ABDELHAMID BRADAÏ INTRODUCTION La géostatistique est une branche de la statistique adaptée à l'estimation spatiale de propriétés du milieu physique. Elle traite les propriétés observées de façon discontinue dans l'espace géographique (en un point, sur une petite surface). Nous allons essayer au cours de ce cours introductif de présenter les principes de mise en œuvre d'une analyse géostatistique. Le TP qui prolonge ce cours, a deux objectifs: d'une part, montrer la mise en œuvre pratique de la géostatistique, d'autre part, montrer que la géostatistique se fonde sur les bases des statistiques classiques mieux connue et maitrisées par les étudiants. Pour un étudiant confronté à un problème de variabilité spatiale, le premier choix qu'il aura à faire concerne le type d'approche qu'il met en œuvre. Deux grandes voies lui sont ouvertes : - Employer une démarche d’interpolation déterministe. C'est le type d'approche utilisée depuis bien longtemps et même encore de nos jours. Les observations sont implantées dès lors que les caractéristiques du paysage changent. Les limites sont tracées en s'appuyant sur les modifications du paysage. Cette technique est souvent économe en moyens et présente des résultats très parlants. Elle ne permet par contre jamais d'obtenir une carte dont on connaît la précision. - Employer une démarche statistique, basée sur les statistiques classiques (recherche de moyennes, de variances au sein d'une population ou de strates) ou sur la géostatistique (obtention de cartes). On reproche souvent à ces techniques leurs exigences élevées en matière d'échantillonnage. Il demeure que ces techniques sont incontournables dès lors que l'on désire obtenir des estimations dont on connaît la précision. Ces techniques sont également les seules que l'on puisse mettre en œuvre dans certains cas: phénomène naturelle, propriété dont la variabilité ne dépend que de l'action de l'homme (pollution) ... Les querelles d'école entre ces deux types d'approches restent nombreuses. On peut proposer une approche pragmatique pour faire le choix. On envisagera l'approche déterministe quand le paysage est très contrasté et que l'on sait que ces contrastes correspondent à des états différents de la propriété étudiée. On préférera l'approche statistique quand il est utile d'avoir des estimations de précision connue ou que le paysage varie peu. C’est dans cet objectif que ce cours est inscrit. Il vise à introduire les concepts de la géostatistique. En raison du public visé, cette présentation part de considérations intuitives pour aboutir à des ébauches de formalisme mathématique. 1 1. Définition Le mot de Géostatistique a fait son apparition en 1962. On peut définir la Géostatistique comme l’étude des variables numériques réparties dans l’espace ou encore la méthode de traitement statistique de données localisées. Il est clair alors que des problèmes essentiellement géostatistiques ont été abordés depuis longtemps : en art des mines certes, mais aussi en météorologie, topographie, hydrologie, hydrogéologie et bien d’autres disciplines. L’innovation ne réside pas non plus dans l’arsenal mathématique requis. L’introduction et l’étude des « Fonctions Aléatoires » dès les années 1930 par les écoles française et russe ; les outils théoriques que nous utilisons en Géostatistique linéaire étaient en place dès les années 1940 ; et les méthodes comme les moindres carrés de Gauss ou les paramètres de Lagrange, sont des plus classiques et font partie du bagage mathématique de base de l’ingénieur. Le déclic, si l’on peut dire, qui a conduit à l’élaboration de ce que nous appelons ici et aujourd’hui la Géostatistique, c’est le rapprochement de ces deux domaines : des problèmes techniques parfois forts terre-à-terre d’une part, et d’autre part un arsenal de méthodes mathématiques. Sans doute d’ailleurs, dans l’espace d’une décennie, la Géostatistique s’est élaborée indépendamment dans le domaine minier, dans le domaine forestier (B. Matéron, en Suède), en météorologie (L.S. Gandin, en URSS). Sans doute une recherche bibliographique approfondie trouverait-elle une évolution semblable dans d’autres disciplines encore 2. Récapitulation de l’historique de la géostatistique La chronologie de l’histoire de la géostatistique peut être résumée comme suit : - 1930 - 1950 Théorème des fonctions aléatoires (Kolmogorov, wiener) - 1955 Daniel Krige (Géologue Sud Africain) : Approche empirique (régression) pour corrigé les problèmes de biais conditionnel observé dans les mines - 1960 – 1970 Matéron (école des mines – Paris), Gandin (Météorologie) développent ensemble la théorie de la variable régionalisée. Le terme géostatistique est né, réponse aux questions de Krige. - Mathéron, pour rendre hommage à Daniel Krige décédé en 1956, donne le nom «Krigeage» à la méthode d'estimation développée. - La fin des années 60 et début des années 70, les chercheurs russes ont utilisé la géostatistique pour estimer la lame d'eau écoulée (précipitation) - Delhomme (1976) est le premier à utiliser la géostatistique en hydrologie de surface et souterraine. - Les années 80, la géostatistique est utilisée en science du sol (pédologie) : Les travaux de Webster pour l’estimation de certaines propriétés du sol sont les plus célèbres - Depuis les années 90 à nos jours, les écologistes (les sciences de l’environnement) utilisent de plus en plus les techniques de géostatistique. D’une manière générale : « La géostatistique peut s'appliquer à toutes les sciences de la nature, et plus généralement, à n'importe quelle discipline manipulant des données localisées dans l'espace et nécessitant des modèles décrivant la dépendance spatiale entre ces données ». 2 3. Objectifs de la géostatistique L’objectif principal de la géostatistique est d’établir des cartes des phénomènes naturels qui soient : - claires, - faciles à comprendre, - fiables. Parmi ces phénomènes étudiés, on peut citer : - contamination des sites, - évaluation de volumes de sols à traiter, - communication autour d’une pollution de nappe, - pollution atmosphérique. - Répartition des rendements des cultures et densité des poissons (Agriculture de précision) Objectifs d’apprentissage A la fin du cours, l'étudiant doit : (i). comprendre les hypothèses sous-jacentes à toute modélisation géostatistique ; (ii). familier avec les notions de variance et saura estimer et modéliser un variogramme ; (iii). comprendre les principales propriétés des estimateurs du krigeage et le lien qu'ils présentent avec le variogramme ; (iv). aura été sensibilisé à diverses applications de ces techniques dans le domaine d’écologie et environnement; (v). saura utiliser la géostatistique pour ses propres recherches de cartographie (rapport, Master ou doctorat) 3 CHAPITRE I : VARIABLES REGIONALISEES CHAPITRE I I. VARIABLES REGIONALISEES I.1. Variable aléatoire et fonction aléatoire I.1.1. Définitions -Définition simple Une variable aléatoire (v.a) est fonction dont les résultats possibles sont connus mais dont le résultat final ne peut être déterminé, à priori, avant d'effectuer la mesure (expérience). Dans la nature il existe de multitude de variables aléatoires, on peut citer : - Lame d’eau précipitée ; - Concentration d’un polluant dans les eaux souterraines ou dans les sols ; - pH de l’eau de pluie. -Définition mathématique Une variable aléatoire est définie en associant un nombre réel à chaque éventualité d’une expérience aléatoire. Une variable aléatoire X est une fonction de l’ensemble fondamental Ω à valeurs dans R, X : Ω → R. Lorsque la variable X ne prend que des valeurs discrètes, on parle de variable aléatoire discrète. On distingue deux types de variables aléatoires : A. Variable aléatoire discrète Une variable aléatoire est dite discrète si elle ne prend que des valeurs discontinues dans un intervalle donné (borné ou non borné). L’ensemble des nombres entiers est discret. En règle générale, toutes les variables qui résultent d’un dénombrement ou d’une numération sont de type discret. On peut citer des exemples : - le nombre de petits par porté pour une espèce animale donnée (chat, chien, etc) : - le nombre de bactéries dans 100 ml de préparation : - le nombre de mutations dans une séquence d’ADN de 10 kb ; B. Variable aléatoire continue Une variable aléatoire est dite continue si elle peut prendre toutes les valeurs dans un intervalle donné (borné ou non borné). En règle générale, toutes les variables qui résultent d’une mesure sont de type continu. On peut citer comme exemples : - la masse corporelle des individus pour une espèce animale donnée ; 4 CHAPITRE I : VARIABLES REGIONALISEES - la variation des nitrates dans une nappe phréatique ; - la concentration d’un polluant dans le sol ; I.1.2. Description d’une variable aléatoire Sans connaître la valeur que prendra le résultat final, on peut parfois connaître la probabilité qu’une v.a prenne chacun des résultats possibles. C’est la description la plus complète que l’on puisse faire de la v.a. La fonction qui décrit ces probabilités est la fonction de densité f pour les v.a. continues et c’est la fonction de masse pour les v.a discrètes. N.B : En géostatistique, la plupart des variables étudiées sont issues de phénomènes naturels, elles sont considérées comme variables quantitatives discrètes. On présentera dans ce chapitre qu’aux propriétés des variables aléatoire discrètes I.1.2.1. Loi de probabilité La loi de probabilité d’une variable aléatoire discrète est entièrement déterminée par la probabilité Pi des évènements {X= xi}, xi parcourant l’univers image X (Ω). La loi de probabilité est donnée par les (xi, Pi)i Remarque 3.1 : Afin de simplifier l’écriture, on considère souvent l’écriture suivante : P{X=xi} équivalent à P(X=xi) ou Pi III.1.2.2. Fonction de répartition On appelle fonction de répartition d’une variable aléatoire X, la fonction Fx telle que : Fx : R R t Fx(t) = P(X < t) Concrètement, la fonction de répartition correspond à la distribution des probabilités cumulées. Le plateau atteint par la fonction de répartition correspond à la valeur de probabilité 1 car : ∑ Pi = 1 i L’importance pratique de la fonction de répartition est qu’elle permet de calculer la probabilité de tout intervalle R. Les propriétés associées aux fonctions de répartitions sont les suivantes : (1) ∀t ∈ R 0 ≤ Fx (t ) ≤ 1 (2) Fx est croissante sur R (3) lim Fx (t ) = 0 t → −∞ (4) Si a ≤ b , et lim Fx (t ) = 1 t → +∞ P (a ≤ X ≤ b) = Fx (b) − Fx (a ) 5 CHAPITRE I : VARIABLES REGIONALISEES Exemple 1 : Imaginons l'expérience suivante pour quantifier la biomasse d’un champ agricole : Nous creusons 10 trous dans un champ agricole, et comptons le nombre de ver de terre dans chacun d'eux (voir figure). - dans quatre (4) des dix trous nous n'en trouvons aucuns (0 vers de terre), - trois (3) autres trous contiennent chacun un ver de terre (1 ver de terre), - nous en comptons deux (2) dans chacun des deux autres trous (2 vers de terre), - le dernier trou donne trois (3) vers de terre (3 vers de terre). Figure 12. Illustration du nombre de vers de terre par trou creusé dans un champ agricole. Solution Les résultats de l’expérience peuvent être représentés dans un tableau en attribuant un numéro pour chaque trou creusé et le nombre de ver de terre trouvé dans chaque trou comme suit : N° Trou 1 2 3 4 5 6 7 8 9 10 Nbr. Ver de terre 0 0 0 0 1 1 1 2 2 3 Si on note le nombre de vers de terres trouvées dans chaque trou comme variable aléatoire X, elle est définie X Ω → R avec Ω ={0, 0, 0, 0, 1, 1, 1, 2, 2, 3} On voit que X (Ω) = {0, 1, 2, 3} et on peut déterminer aussitôt les évènements [X=xi] et P(X=xi) : [X=0] = (0, 0, 0, 0) et P (X=0) = 4/10 = 0.4 [X =1] = (1, 1, 1) et P(X=1) = 3/10 = 0.3 [X=2] = (2, 2) et P(X=2) = 2/10 = 0.2 [X=3] = (3) et P(X=1) = 1/10 = 0.1 Onn peut organiser les résultats de l’expérience l’expérience dans un tableau en représentant P(X=xi) et Fx comme suit : Tableau 2. Répartition des vers de terre par trou creusé dans le champ agricole. agricole X (Nbr. Nbr. Vers de terres/trou ) 0 1 2 3 P(X=x X=xi) 4/10 3/10 2/10 1/10 Fx 4/10 7/10 9/10 1 6 CHAPITRE I : VARIABLES REGIONALISEES Pour une v.a, on utilise un diagramme en bâtons pour visualiser la distribution de probabilités et fonction en escalier pour la fonction de répartition. III.1.2.3. Moment du premier ordre (Esperance mathématique) Si X est une variable aléatoire discrète de loi de probabilité (xi, pi)i définit sur un nombre fini (n) d’évènements élémentaires alors : n E ( X ) = ∑ xi p i = m ( x ) (1) i =1 Où « E(X) » est l’espérance mathématique, elle considérée comme la valeur probable de la variable aléatoire X. Les propriétés de l’espérance sont comme suit : (1). Si X et Y sont deux variables aléatoires définies sur le même univers Ω.admettant une espérance mathématique, alors : E ( X + Y ) = E ( X ) + E (Y ) ; (2). E ( aX ) = aE ( X ) ∀a ∈ R (3). Si X ≥ 0 alors E(X) ≥ 0 (4). Si X est caractère constant tel que : ∀ω ∈ Ω X(ω ) = K alors E(X) = K En un point x donné, m(x) représente la ‘moyenne’ autour de la quelle se distribuent les valeurs prises par multiples réalisation indépendantes de la fonction aléatoire. Il s’agit du paramètre descriptif de base du comportement de F(x) : on établit en effet que l’espérance est la meilleure approximation d’une variable aléatoire par une constante I.1.2.4. Moment du second ordre (Variance mathématique) La variance mathématique d’une variable aléatoire V(X) est l’espérance mathématique de l’écart à l’espérance mathématique. C’est un paramètre de dispersion qui correspond au moment centré d’ordre 2 de la variable aléatoire X. C’est l’équivalent de la variance observée S². En effet, lorsque le nombre d’épreuves « n » est grand ; S² tend vers V(X). Si X est une variable aléatoire ayant une espérance E(X), on appel Variance mathématique de X le réel de : 7 CHAPITRE I : VARIABLES REGIONALISEES V ( X ) = E ([ X − ( E ( X )]²) (2) Comme on peut écrire aussi : V ( X ) = E ( X ²) − [ E ( X )]² (3) Remarque 3.2 : Comme [X-E(X)]² ≥ 0, nécessairement V(X) ≥ 0. Par définition, une variance est toujours positive. Enfin, Si X est une variable aléatoire ayant une variance mathématique V(X), on appelle l’écart- type (σ(x)) de X, le réel de : σ ( X ) = V ( x) (4) -Exemple 2 : On poursuit avec les mêmes données de l’exemple précédent, le nombre de vers de terre par trou comme une variable aléatoire (v.a en abrégé) notée X. Les fréquences précédentes deviennent des probabilités X vaut 0 avec la probabilité 0.4 ("4 chances sur 10"), 1 avec la probabilité 0.3, 2 avec 0.2 et enfin 3 avec 0.1. L’espérance mathématique E(X) de la v.a X vaut : E(X) = 0 x 0.4 + 1 x 0.3 + 2 x 0.2 + 3 x 0.1 =1 (12.) C’est la valeur probable, de X, notée E(X) = 1. On peut calculer de la même façon l'espérance du carré de la variable ou la Variance mathématique V(X): V(X) = 0²x0.4 + 1²x0.3 + 2²x0.2 + 3²x0.1= 2 I.1.2.5. Covariance et corrélogramme La fonction de covariance va permettre de prendre en compte les relations entre l’ensemble des paires de points. Si on prend en compte deux points xi et xj, la covariance peut être définie par l’équation suivante : Cov[ F ( xi ), ( F ( x j )] = E[( F ( xi ) − m) * ( Z ( x j ) − m)] (5) Avec : m = la moyenne Lorsque le processus est stationnaire au second ordre, la covariance ne va plus dépendre quede la distance entre les points xi − x j . Si on note h cette distance, on va définir C(h) calculée pour toutes les valeurs de h en prenant en compte tous les couples de points situés à une distance (h) les uns des autres. Cette fonction de covariance C(h) est définie par : C (h) = Cov[ F ( x + h), ( F ( x)] = E[( F ( x + h) − m) * ( Z ( x) − m)] 8 (6) CHAPITRE I : VARIABLES REGIONALISEES Elle traduit la façon dont évoluent la covariance des observations lorsque leur distance augmente. Lorsque h est égal à 0, la covariance est égale à la variance. C (0) = E[( F ( xi ) − m)²] = σ ² (7) Les propriétés de la fonction de covariance sont les suivantes : C ( − h) = C ( h) ( 8) C (h) ≤ C (0) On définit la fonction d’autocorrélation ρ(h) comme une fonction de h par le rapport C (h) . Sa valeur est comprise entre (-1) et (+1). On peut montrer les relations suivantes C (0 ) lorsque la stationnarité à l’ordre 2 est vérifiée : γ ( h ) = C ( 0) − C ( h ) γ (h) = σ ²(1 − ρ (h)) (9) L’estimation du corrélogramme (fonction de la covariance) est faite à partir de n(h) paires de points i (nombre de points distant de h) comme suit : Pour i variant de i=1 à n(h), on a : 1 n( h) (10) C ( h) = ∑ ( F ( xi ) − m)( F ( xi + h) − m) n(h) i=1 On peut aussi étudier et décrire le comportement simultané de plus d'une variable aléatoire. La fonction de densité conjointe : Fxy (x,y) donne la probabilité que, simultanément X = x et Y = y On a la fonction de densité : +∞+∞ ∫ ∫F xy ( x, y )dxdy = 1, Fxy ( x, y ) (11) − ∞− ∞ P[ x1 < X < x2 , y1 < Y < y2 ] = x2 y 2 ∫ ∫F xy ( x, y )dxdy (12) x1 y1 Pour justifier l’existence de la covariance d’une variable aléatoire, deux cas se présentent : - Si (X, Y)(Ω) est fini, alors le couple (X, Y) admet une covariance - Si X et Y admettent un moment d’ordre 2, alors le couple (X, Y) admet une covariance La covariance est donnée par la formule suivante : cov( X , Y ) = E[( X − E ( X )) − (Y − E (Y ))] (13) Ou par la formule de König-Huygens. cov( X , Y ) = E ( XY ) − E ( X ) E (Y ) 9 (14) CHAPITRE I : VARIABLES REGIONALISEES La covariance mesure la corrélation entre les deux variables aléatoires X et Y : - Lorsque cov (X, Y )> 0, on dit que les variables X et Y sont positivement corrélées. L’interprétation d’une covariance positive est la suivante : plus X est élevé, plus, en moyenne, Y est élevé (et réciproquement). - Lorsque cov (X, Y )< 0, on dit que les variables X et Y sont négativement corrélées. L’interprétation d’une covariance positive est alors la suivante : plus X est élevé, plus, en moyenne, Y est petit (et réciproquement). - Enfin, Lorsque cov (X, Y )= 0, on dit que les variables X et Y ne sont pas corrélées. La covariance est un outil pour mesurer la corrélation linéaire entre deux variables aléatoires. Enfin, le coefficient de corrélation linéaire. Lorsque (X, Y) admet une covariance, on définit le coefficient de corrélation linéaire du couple (X, Y) , et l’on note ρX,Y , le nombre : ρ XY + Propriété de ρX,Y : Cov ( X , Y ) σ ( X )σ (Y ) (15) -1≤ ρX,Y ≤ 1 I.2. Techniques de caractérisation de la loi spatiale En statistique classique, l’inférence des paramètres est rendue possible par la répétition indépendante des données. En statistiques spatiales, on observe très souvent une réalisation unique des données, par exemple un épisode de pollution à l’ozone, une région agricole particulière, une épidémie végétale, … etc. Pour pouvoir réaliser l’inférence statistique pour un évènement unique, il faut donc en quelques sortes remplacer l’hypothèse sur les répétitions indépendantes par une hypothèse sur le champ aléatoire qui considère d’une part que certaines de ses caractéristiques sont identiques d’un point à l’autre de l’espace, et d’autre part que l’espérance de certaines grandeurs sont accessibles par des intégrales sur l’espace. On pose donc des hypothèses de stationnarité et d’intrinsèque. I.2.1. Hypothèses de stationnarité Faire l'hypothèse de la stationnarité revient à compenser l'absence de plusieurs réalisations de la fonction aléatoire par une forme de redondance de l'information au sein d'une seule réalisation. Il convient toutefois de distinguer plusieurs formes de stationnarité d'une fonction aléatoire, on site : I.2.1.1. Stationnarité stricte Une fonction aléatoire est une fonction aléatoire stationnaire (FAST) si pour n fini, et pour tout vecteur inter-support « h », la fonction de répartition conjointe de {Z (xi), i = 1…n} est la même que celle de {Z (xi + h) i = 1…n} 10 CHAPITRE I : VARIABLES REGIONALISEES La stationnarité stricte ne contient aucune hypothèse concernant les espérances, variances ou covariances, qui peuvent éventuellement ne pas être définies I.2.1.2. Stationnarité d'ordre 2 Une fonction aléatoire est dite stationnaire à l'ordre 2 (FAST-2) si la covariance existe et ne dépend que du vecteur inter-support h, ce qui implique que l'espérance et la variance existent et ne dépendent pas de x soit : E(Z(x)) = m (16) Var (Z (x)) = E ((Z (x) - m)²) = C (0) (17) Cov(Z(x),Z(x+h)) = E(Z(x),Z(x+h)) – m² = C(h) (18) I.3.2. Hypothèse intrinsèque Dans le cas des variables régionalisées (VR) qui présentent une variation spatiale qui n'apparaît pas bornée, au moins au sein du domaine d'étude D. Il n'est pas réaliste d'employer une FAST-2 et il convient d'affaiblir encore davantage l'hypothèse de stationnarité. Une fonction aléatoire est intrinsèque à l'ordre 0 (FAI-0) si ses accroissements d'ordre 1 sont stationnaires d'ordre 2, autrement dit, si les espérances et les variances des incréments Z (x+h) - Z (x) existent et ne dépendent pas de x, soit : E (Z(x+h)-Z(x)) = m (19) Var (Z(x+h)-Z(x)) = E((Z(x+h)-Z(x)- m)²) = 2γ(h) (20) avec (h) une fonction nommée demi-variograme (ou semi-variogramme), ou selon l'usage le plus répandu «variogramme». I. 3 Notion de variable régionalisée Une variable est dite « régionalisée » lorsque les valeurs qu’elle prend dépendent de sa position dans l’espace (ces coordonnées géographiques). La géostatistique est l’application de la théorie des variables régionalisées à un phénomène qui se déploie dans l'espace et y manifeste une certaine structure, qu'il est régionalisé. Si F(x) désigne la valeur au point z d'une caractéristique F de ce phénomène, nous dirons que F(x) est une variable régionalisée, en abrégé V.R. C'est là un terme neutre, purement descriptif, antérieur, en particulier, à toute interprétation probabiliste. Du point de vue mathématique, une V.R. est donc simplement une fonction F(z) du point z, mais c'est, en général, une fonction fort irrégulière. La variable régionalisée se présente sous deux aspects contradictoires (ou complémentaires) : (i) un aspect aléatoire (haute irrégularité, et variations imprévisibles d'un point à l'autre). 11 CHAPITRE I : VARIABLES REGIONALISEES (ii) un aspect structuré (elle doit refléter à sa manière les caractéristiques structurales du phénomène régionalisé). La théorie des V.R. se propose donc deux objectifs principaux : - sur le plan théorique, imprimer ces caractéristiques structurales sous une forme mathématique adéquate ; - sur le plan pratique, résoudre le problème de l'estimation d'une V.R. à partir d'un échantillonnage fragmentaire. Exemple 3.3 Revenons aux trous et à leur vers de terre, et supposons que ces trous soient creusés le long de deux lignes (A et B) de telles sorte que le nombre de vers de terre trouvées le long de la ligne soit, dans cet ordre (fig.12). Figure 13. Illustration du nombre de vers de terre par trou creusé dans deux transects dans un champ agricole. Les trous de la séquence A possède une structure symétrique très nette et dans le cas B, si la structure existe, elle est très faible et montre une forte irrégularité ; cependant ces 2 séries de 10 mesures admettent la même moyenne et la même variance. Ceci montre qu'on ne peut donc pas appréhender la distribution d'une variable spatiale uniquement à l'aide de ces notions classiques. Il est donc nécessaire de recourir à une méthode qui analyse à la fois la localisation, la continuité, l'anisotropie et le caractère transitif d'une telle variable. Pour ce faire, on retient pour hypothèse que les valeurs prises par une variable régionalisée sont une réalisation particulière d'une fonction aléatoire stationnaire douée d'une fonction d'auto-corrélation. Cette fonction aléatoire F (x) est définie par : - son espérance mathématique (ou moyenne) : m (x) - E (F(x)), - sa variance V(x) = V (F(x)), - sa covariance C(x1,x2) - E F(x1) F(x2) - m(x1) m(x2), Avec la condition dite de stationnarité : la moyenne, la variance et la covariance sont invariantes par translation : - m(x) = m la moyenne de F(x) est la même en tous points, - V(x) = v la variance de F(x) est la même en tous points, - la covariance de F(x) dépend de la distance h qui les sépare x1 et x2 dans l’espace, - l'accroissement F(x + h) - F(x) ne dépend que de h. 12 CHAPITRE II : LA VARIOGRAPHIE CHAPITRE II II. LA VARIOGRAPHIE II.1. Variogramme théorique et variogramme expérimental II.1.1. Introduction à la notion de variogramme Considérons une propriété notée « Y » connue en « n » points de l'espace géographique, chacun de ces points étant repérés par le vecteur « x » de ses coordonnées géographiques (longitude et latitude). De la sorte, la notation "Y(xi)" représente la valeur observée de la propriété Y au i ème point d'échantillonnage de coordonnées « xi ». Pour simplifier, prenons deux points pour lesquels on connaît des valeurs y(x1) et y(x2) de la propriété Y dans un espace géographique tel que le montre la figure ci-dessous. Pour comparer ces deux valeurs, la façon la plus simple est d'utiliser la variance entre les observations de ces deux sites, notée « S² ». Elle est par définition égale à : __ __ S ² = [(Y ( x1 ) − Y )]² + [(Y ( x 2 ) − Y ]² (21) __ où : Y est la moyenne entre ces deux observations. Cette variance « S² », qui traduit l'importance des écarts à la moyenne, est d'autant plus grande que les observations sont différentes et, au contraire, si elle est faible les observations sont de plus en plus identiques. L'équation 22 peut être développée pour obtenir une autre expression de la valeur S²: 1 S ² = [Y ( x1 ) − Y ( x2 )]² 2 (23) Cette nouvelle équation pour déterminer la variance (eq.23) peut être écrite pour tout couple de sites. Pour cela, considérons deux sites Y(xi) et Y(xi +h) où Y(xi) représente les coordonnées géographiques d'un des sites et « h » est un vecteur caractérisant la distance entre les sites. 13 CHAPITRE II : LA VARIOGRAPHIE L'équation (23) s'écrit alors : 1 S ² = [Y ( xi ) − Y ( xi + h)]² 2 (24) y(x1), y(x2), y(x3), y(x4) chacun Calculons à présent la distance géographique séparant des points d'observation et considérons les « m » couples de point séparés par une même distance géographique h. On peut comme précédemment, calculer la variance des observations pour les sites pris deux à deux. La moyenne S² de ces m variances s'écrit en employant (24) : 1 m S² = ∑ [ y( xi ) − y( xi + h)]² 2m i =1 (25) Où : m est le nombre de couple Pour une distance h séparant deux points d'observation, S² rend compte de la ressemblance et/ou la dissemblance des observations faites en ces deux points: il sera d'autant plus grand que ces observations sont différentes et le contraire signifie une grande ressemblance entre les observations. S² est qualifiée de "semi-variance". De manière intuitive, on conçoit que deux observations soient en général d'autant plus semblables qu'elles sont proches géographiquement l'une de l'autre. Le calcul de S² pour différentes distances h, va permettre de quantifier cette idée: il permet de suivre l'évolution des écarts entre des observations en fonction de la distance qui les sépare. Mathéron (1965) a montré l’intérêt de cette notion simple et les conditions de généralisation ont été définies par la théorie qu’il a appelée « théorie des variables régionalisées ». Cette théorie montre que la généralisation de l’équation (25) suppose deux conditions, regroupées sous le terme d’hypothèse intrinsèque et qui sont : - L’espérance de Y est constante quelle que soit la position géographique x : E [Y(x)] =m (constante) (26) - Pour toute distance h, la différence « [Y(x) -Y(x+h)] » a une variance finie, qui ne dépend que de la distance h séparant les points. 14 CHAPITRE II : LA VARIOGRAPHIE VAR [Y(x+h )-Y(x)] = 2λ (h) (27) = E[Y(x+h) - Y(x)]² Quand ces deux conditions sont vérifiées, la valeur S² définie dans l'équation (25) constitue un estimateur non biaisé de la fonction λ(h) définie en éqution (33). Cette fonction λ(h) est nommée « variogramme ». 1 m(h) λ ( h) = ( y( xi ) − y ( xi + h)) 2 ∑ 2m(h) i = 2 (28) Où : m est le nombre de couple Intérêt du variogramme : En étudiant l'évolution du variogramme λ(h) en fonction de la distance h séparant des couples d'observation, on va analyser la façon dont se détériore l'information acquise en un point au fur et à mesure que l'on s'éloigne de ce point. II.1.2. Le calcul du variogramme On cherche à construire un graphique représentant en abscisse les distances h séparant les points et en ordonnée les semi-variances [λ(h)]. La construction du variogramme est illustrée ci-dessous par des schémas établis à partir de 8 points d'observation répartis à distance égale de 1 mètre le long d'un transect. Figure 1. Illustration du calcul du varriogramme sur un transect de 8 points séparés par une distance h = 1m Le schéma ci-dessus (fig. 1) montre que le nombre de points participant au calcul du variogramme diminue au fur et à mesure que la distance augmente. Les valeurs de semivariance risquent donc d'être moins précises pour les grandes valeurs de h. Exemple de calcul Soit deux exemples (série A et série B) fictifs correspondant à des observations disposées le long d'un transect à des intervalles réguliers de 1 mètre. - Calculez pour chacun des exemples: la moyenne, la variance, γ (1), γ (2), γ (3) et γ(4). - Que peut-on conclure ? 15 CHAPITRE II : LA VARIOGRAPHIE Solution - La moyenne A XA= - La moyenne B XB = - 1 1 X i = [( 4 + 3 + 2 + 1 + 0 + 1 + 2 + 3 + 4)] = 2,22 ∑ n 8 1 1 X i = [(4 + 2 + 1 + 0 + 3 + 1 + 2 + 4 + 3)] = 2,22 ∑ n 8 La variance A 1 1 ( X i − X ) ² = [(4 − 2,22)² + (3 − 2,22)² + (2 − 2,22)² + (1 − 2.22)² + (0 − 2.22)² + (1 − 2.22)² + ( 2 − 2.22) + ∑ n 8 (3 − 2.22)² + ( 4 − 2.22)²] = 1.94 S A2 = - La variance B 1 1 ∑ ( X i − X )² = 8 [(4 − 2,22)² + (2 − 2,22)² + (1 − 2,22)² + (0 − 2.22)² + (3 − 2.22)² + (1 − 2.22)² + (2 − 2.22) + n ( 4 − 2.22)² + (3 − 2.22)²] = 1.94 S B2 = La figure 15 illustre la méthodologie de calcul du variogramme de l’exemple des série A et B. Figure 2. Illustration de calcul des valeurs de γ(h) de la série A et B. 16 CHAPITRE II : LA VARIOGRAPHIE h Le calcul des valeurs de γ(h) des séries A et B est comme suit : Nbr. m 1 γ ( h) = [ y ( xi ) − y ( xi + h)]² Couples ∑ i=2 2 m (m) Série A 1h 8 2h 7 3h 6 4h 5 1 γ (1) = [(4 − 3)² + (3 − 2)² + (2 − 1)² + (1 − 0)² + (0 − 1)² + (1 − 2)² + ( 2 − 3)² + (3 − 4)²] = 0.5 2*8 1 γ (2) = [(4 − 2)² + (3 − 1)² + ( 2 − 0)² + (1 − 1)² + (0 − 2)² + (1 − 3)² + ( 2 − 4)²] = 1.71 2*7 1 γ (3) = [(4 − 1)² + (3 − 0)² + ( 2 − 1)² + (1 − 2)² + (0 − 3)² + (1 − 4)²] = 3.16 2*6 1 γ ( 4) = [(4 − 0)² + (3 − 1)² + ( 2 − 2)² + (1 − 3)² + (0 − 4)² = 4 2*5 Série B 1h 8 1 γ (1) = [(4 − 2)² + (2 − 1)² + (1 − 0)² + (0 − 3)² + (3 − 1)² + (1 − 2)² + ( 2 − 4)² + ( 4 − 3)²] = 1.56 2*8 2h 7 γ ( 2) = 3h 6 4h 5 Conclusions? • Les deux séries ont même moyenne et même variance, toutefois on constate clairement qu’elles n'ont pas le même degré de continuité spatiale, la première série (série A) étant nettement plus continue que la seconde (série B) (voir fig. 16). 4.5 4 Série "A" 3.5 Série "B" 3 γ (h) - 1 [(4 − 2)² + (3 − 1)² + ( 2 − 0)² + (1 − 1)² + (0 − 2)² + (1 − 3)² + ( 2 − 4)²] = 1.92 2*7 1 γ (3) = [(4 − 0)² + ( 2 − 3)² + (1 − 1)² + (0 − 2)² + (3 − 4)² + (1 − 3)² = 3.08 2*6 1 γ ( 4) = [(4 − 3)² + (2 − 1)² + (1 − 2)² + (0 − 4)² + (3 − 3)² = 1.9 2*5 2.5 2 1.5 1 0.5 0 1 2 Distance (m) 3 4 Figure 3. γ (h) vs h des séries A et B Remarque On peut aussi calculer le variogramme selon certaines directions spécifiques ; pour cela le variogramme est définie par son pas de calcul « h » et sa direction déterminée par un angle ( θ ). On parle dans ce cas du variogramme directionnel et l’équation (28) s’écrit : m(h,θ ) 1 λ (h, θ ) = ( y ( xi ) − y( xi + h))2 ∑ 2m(h, θ ) i = 2 17 (29) CHAPITRE II : LA VARIOGRAPHIE Exemple de calcul de variogramme directionel Soit une matrice de données 3 x 3 ayant les valeurs suivantes : la distance horizontale et verticale entre 2 éléments consécutifs est de 1 m et « N » indique une donnée manquante (voir schéma ci-dessous). 1. Le calcul du variogramme dans la direction horizontale : θ =0° h Nbr. Couples (m) γ (h,0°) = 1 4 γ (1,0°) = 2 3 γ (2,0°) = m ( h , 0° ) 1 [ y ( xi ) − y( xi + h)]² ∑ i=2 2m(h,0°) 1 35 [(3 − 6)² + (6 − 5)² + (7 − 2)² + (2 − 2)²] = = 4. 4 ( 2 * 4) 8 1 45 15 [(3 − 5)² + (7 − 2)² + (4 − 0)²] = = = 7.5 (2 * 3) 6 2 illustration de calcul 2. Le calcul du variogramme dans la direction verticale : θ =90° h γ (h,0°) = 1 Nbr. Couples (m) 5 2 3 γ (2,90°) = γ (1,90°) = m ( h , 90° ) 1 [ y ( xi ) − y( xi + h)]² ∑ i =2 2m(h,90°) 1 54 [(4 − 7)² + (7 − 3)² + (2 − 6)² + (0 − 2)² + (2 − 5)²] = = 5.4 (2 * 5) 10 1 26 13 [(4 − 3)² + (0 − 5)²] = = = 6.5 ( 2 * 2) 4 2 illustration de calcul II.1.3. Variogramme expérimental. La figure 17 représente, à titre d'exemple, un variogramme sur des données de mesure du pH du sol d’une parcelle expérimentale de 1,5 hectares1, 150 mesures ont été effectuées suivant un échantillonnage régulier (10m x 10m). Sur cette figure (fig. 15), on représente en abscisse différentes distances séparant des couples de points expérimentaux : ces distances sont nommées "pas" (lag en anglais). En ordonnée, on représente les valeurs des semivariances ou γ(h) calculées suivant l'équation (28). Ce que peut constater sur cette figure : 1 Parcelle de la station expérimentale de la faculté des Sciences de la Nature et de la Vie, Université de Chlef (Douaoui, 1993) 18 CHAPITRE II : LA VARIOGRAPHIE (i) Jusqu’à un pas de 20 mètres, le variogramme est croissant. Les écarts moyens entre les observations augmentent donc quand la distance séparant ces observations augmente. Les observations "se ressemblent donc de moins en moins", ce qui est conforme à l'intuition. On peut dire également que les observations sont spatialement dépendantes ou liées sur cette distance de 20m. Figure 3. Un exemple de variogramme expérimental: variogramme moyen du pH du sol d’une parcelle expérimentale de 1,5 hectare (Douaoui, 1993). (ii) Au-delà de vingt mètres, le variogramme reste quasi-constant. Quelle que soit la distance, les écarts moyens entre les observations sont identiques. On parlera pour cette gamme de distance d'indépendance spatiale entre les observations. (iii) La projection du variogramme à l'origine conduit à une valeur de semi-variance non nulle bien que la distance est nulle (h=0). II.1.4. Des définitions. Un certain nombre de termes sont utilisés pour décrire un variogramme de la figure 3 et qui sont : a. L'effet de pépite (nugget effect) : il s'agit da la valeur de la semi-variance pour une distance nulle. En théorie, on devrait avoir un γ(h)=0 pour un h=0, mais fréquemment, le variogramme présente une ordonnée à l'origine non nulle (fig. 3). Cet écart est qualifié "d'effet de pépite" (nugget effect en anglais). Il est interprété comme le résultat d'erreurs de mesure de la variable étudiée, ou erreur de positionnement ou d'une variabilité spatiale présente à une distance inférieure au pas d’échantillonnage. b. Le palier (Sill) : valeur de la semi-variance à partir de laquelle le variogramme ne croît plus (fig.3). c. La portée (Range): distance à partir de laquelle le palier est atteint (fig.3). La portée est la distance à partir de laquelle les valeurs de la variable entre deux points sont indépendantes (non corrélées) (fig.3). 19 CHAPITRE II : LA VARIOGRAPHIE Figure 4 : Le variogramme expérimental II.2. Les modèles du variogramme II.2.1. Forme du variogramme L'analyse du variogramme cherche une fonction caractéristique de la structure de la variable étudiée. En premier lieu, on étudie quelques caractéristiques du variogramme : II.2.1.1. Comportement au voisinage de l'origine La continuité et la régularité dans l'espace de la fonction aléatoire et donc la variable régionalisée qu'elle présente sont liées au comportement à l'origine du variogramme Delhomme (1976) distingue 04 types 1. Allure parabolique : comportement dérivable à l'origine, ceci est la caractéristique d'une variabilité spatiale hautement régulière (fig.5.a) 2. Allure linéaire : γ(h) reste continue à l'origine mais n'est plus dérivable, donc moins régulière (fig.5.b). 3. Discontinuité à l'origine : γ(h) ne tend pas vers (0) lorsque h tend vers (0), cette discontinuité en h = 0 du variogramme est appelée effet de pépite (fig.5.c) qui est dû : soit à la présence d'une structure dont l'échelle est très inférieure à l'espacement des données et on parle de micro régionalisation des données, soit à la présence d'erreurs de mesures, soit au nombre insuffisant de couples de mesures à faible distance induisant éventuellement une incertitude sur la détermination de l'effet de pépite. 4. Effet de pépite pur (Aléatoire pure) : c'est le cas limite du cas précèdent quand γ (h) ne traduit plus que la seule discontinuité à l'origine (fig.5.d) γ(h) = 0 est (h) = C0 dès que h > 0 20 CHAPITRE II : LA VARIOGRAPHIE Cela indique que Z(x) et Z(x+ h) sont sans corrélation quelle que soit leur distance (h) non nulle, ce type de modèle s'explique généralement par l'absence d'une structure spatiale, plus fréquemment, par l'existence d'une structure marquée par des erreurs expérimentales ou inférieures au plus petit intervalle d'observation. Figure 5 : Comportement à l'origine des différents variogrammes (Delhomme, 1976) IV.2.1.2. Comportement du graphe à l'infini Ces types de variogrammes pourront être borné ou non borné autour d'une valeur du palier, égale à la variance sur l'ensemble des données. Dans ce cas, la stationnarité d'ordre II de la variance est vérifiée. Cette longueur est interprétée comme la distance maximale pour laquelle un point présentera une influence sur son entourage. Cette valeur donne la distance au-delà de la quelle elles sont indépendantes (fig.6a, 6b et 6c) Dans le variogramme non borné (fig. 6d), la stationnarité d'ordre II n'est pas vérifiée et le variogramme continu à croître sans atteindre un palier. Voltz (1986) donne trois interprétations possibles : - Le palier n'a pas atteint la portée à l'échelle de notre travail (l’espace étudié) - La variance infinie représentative d'une variable régionalisée respectant l'hypothèse intrinsèque - La présence d'une dérive pourrait être aussi une explication à ce type de variogramme. 21 CHAPITRE II : LA VARIOGRAPHIE a : Modèle Sphérique b : Modèle exponentiel c : modèle gaussien d : Modèle en hb Figure 6 : Principaux modèles de variogrammes utilisés (d'après Delhomme, 1976) II.3. Modélisation du variogramme Pour tenir compte des caractéristiques du variogramme dans la démarche géostatistique, il est indispensable d'ajuster une fonction au variogramme expérimental, ce qui permet d'en résumer les principales caractéristiques. Ces fonctions doivent présenter deux qualités : - Rendre compte le mieux possible de l'information du variogramme expérimental. - Satisfaire les conditions théoriques : elles doivent être "Semi-Positives" L'ajustement se fait par l'emploi d'un certain nombre de modèles autorisant essentiellement deux types : II.3.1. Modèles croissants non bornés Les modèles non bornés sont montrés par la figure 7 et ils sont définis comme suit : * Modèle linéaire : γ (h) = C0 + bh………………………………………..(30) 22 CHAPITRE II : LA VARIOGRAPHIE Avec : C0 : L'ordre à l'origine b : la pente de la droite h : distance séparant les points - cas particulier du linéaire : γ (h) = C0 ……………………………………………(31) C'est le cas d'un variogramme plat appelé pépidique (effet de pépite pûre) * fonction puissance : γ (h) = C0 + bhα………………………………………(33) 0 < α <2 Avec : b : la pente de la droite α : un coefficient fixant la forme de la courbe IV.3.2. Modèles croissants bornés Les modèles croissants bornés sont montrés par la figure 8 et ils sont définis comme suit : * Modèle Sphérique : γ (h) = C0 + C[3h/2a – 1/2(h/a)3]……….si h < a γ (h) = C0 + C………………………..……...si h > a …………….(34) Avec : C0 : l'ordre à l'origine C : est le palier moins l'ordonnée à l'origine a : la portée * Modèle Exponentiel : γ (h) = C0 + C[1 – exp(-h/r)]………………………………….(35) Avec : C0 : l'ordre à l'origine r : paramètre de la distance égale environ le tier (1/3) de la portée 23 CHAPITRE II : LA VARIOGRAPHIE modèle linéaire semi- variance modèle pépitique fonction puissance 1,8 fonction puissance 0,2 fonction puissance 0,5 0 0,5 1 1,5 2 Distance h semi- variance Figure 7 : Modèles croissants d'ajustement à des variogrammes : linéaire, pépitique et fonction puissance de l'ordre 1.8, 0.5 et 0.2 modèle sphérique modèle exponentiel Distance h Figure 8 : Modèle d'ajustement aux variogrmmes bornés: Modèle expérimental et sphérique II.4. Modélisation de l'anisotropie Le phénomène d'anisotropie se présente quand la variabilité spatiale n'est plus la même dans toutes les directions c'est à dire qu'il y a des directions privilégiées vis à vis du phénomène étudié. L'orientation préférentielle de ces directions incite à rechercher une éventuelle anisotropie dans la variabilité spatiale des propriétés intrinsèques du sol. Le calcul de l'anisotropie nécessite la construction de deux variogrammes directionnels modélisés. Le premier est construit dans la direction principale de l'anisotropie et le second dans la direction perpendiculaire à la première. Le rapport entre les valeurs des deux portées relatives aux deux variogrammes directionnels donne la valeur de l'anisotropie, étape qui permet de passer par la suite, au krigeage et donc à l'interpolation. 24 CHAPITRE II : LA VARIOGRAPHIE Figure 9. Variogrammes directionnels selon les quatre principales directions Certains logiciels tels que le Variowin permettent de déceler la présence d’une anisotropie et sa principale direction par le biais du variogramme surfacique (fig. 24). Ce logiciel permet également de calculer la valeur de l’anisotropie par ajustement simultané des deux vriogrammes directionnels. Direction principale d’anisotropie Figure 10. Exemple d’un variogramme surfacique montrant la présence d’une anisotropie selon une direction principale 25 CHAPITRE II : LA VARIOGRAPHIE Bien que dans la nature il existe une très grande variété d'anisotropies, en géostatistique, on ne peut modéliser aisément que les anisotropies géométriques. IV.4.1. Anisotropie géométrique Les Caractéristiques d’une anisotropie géométrique sont comme suit : - On observe dans diverses directions des paliers et des composantes pépitiques identiques mais des portées différentes (fig. 11b). - Les portées maximales (ag) et minimales (ap) s'observent selon deux directions orthogonales. Ce qui forme une ellipse (fig.11a). Figure 11. (a) ellipse formé par ag et ap ; (b) variation de de la porté du variogramme dans le cas d’une anisotropie géométrique Pour rendre les portées identiques (et égales à ag suivant toutes les directions en multipliant la composante de la portée parallèle à ap par le facteur (ag/ap). Bref, les portées décrivent une ellipse dont l'axe majeur est orienté parallèlement à ag. ( aθ cos θ )² ( aθ sin θ )² + =1 aθ2 a 2p (36) Connaissant ag et ap, on peut trouver aƟ, où Ɵ désigne l'angle mesuré par rapport à la direction où est rencontrée la potée ag (la direction privilégiée). aθ = {a ag a p 2 p cos ²θ + ag2 sin ²θ } 0.5 (37) On peut ainsi évaluer γ (h, Ɵ) soit en utilisant aƟ , soit en corrigeant la distance h pour tenir compte de l'anisotropie et on aura : γ (hƟ, Ɵ) = γ(hg) Avec hg calculé comme suit : 26 CHAPITRE II : LA VARIOGRAPHIE a hg = (hθ cosθ )² + g hϑ sin θ a p 2 (38) Exemple Un gisement 2D est modélisé par un modèle avec anisotropie géométrique. Le modèle est sphérique avec C=17%2 et effet de pépite C0=13%2 et les portées sont de 100m dans la direction de la plus grande continuité (30o) et de 60m dans la direction de la plus petite continuité (120o). - Quelle est la valeur du variogramme entre deux observations situées aux coordonnées (x1,y1)=(10,30) et (x2,y2)=(40,20) Solution On peut résoudre le présent problème par deux méthodes : - Première méthode : On calcul la distance séparent les deux points et la direction qui les définissent : h = ( y2 − y1 )² + ( x2 − x1 )² = (20 − 30)² + (40 − 10)² = (−10)² + (30)² = 31.63m y2 − y1 (−10) = arctan = −18.43° (30) x2 − x1 θ = arctan Cette direction forme un ange de 48.43° (30° -(-18.43°) = 48.43°) avec la direction de la plus grande continuité. On calcul la portée dans cette direction aƟ (éq. 40) aθ = 100 * 60 =70.8m {(60)² * cos ²(48.43) + (100)² * sin ²(48.43)}0.5 On calcule la valeur du variogramme en utilisant l’équation du modèle sphérique (eq.37) pour la distance calculée plus haut (31.63 m) et avec la portée 70.81m : 3 31.63 31.63 γ (31.63) = 13%² + 17%² * 1.5 * − 0.5 = 23.63%² 70.81 70.81 Deuxième méthode Elle consiste à calculer la distance équivalente dans la direction de meilleure continuité avec la formule précédente, où Ɵ représente l’angle entre la direction de meilleure continuité et la direction définie par les deux points (48.43°). On calcul donc hg en employant l’équation (41) : 2 100 hg = [31.63 * cos( 48.43)] + * 31.63 * sin( 48.43) = 44.65m 60 2 27 CHAPITRE II : LA VARIOGRAPHIE Etant donné que : γ (hƟ, Ɵ) = γ(hg), on calcul la valeur du variogramme en utilisant l’équation du modèle sphérique (éq.37) pour la distance 44.65 m et avec la portée ag = 100m : 3 44 . 65 44 . 65 = 23.63%² γ (44.65) = 13%² + 17%² * 1.5 * − 0.5 100 100 II.5. Stratégie pour le calcul de variogrammes et l’ajustement des modèles Pour le calcul et l’ajustement des variogrammes il faut tenir compte des points suivants : - On accorde plus de poids aux points du variogramme expérimental calculés avec beaucoup de paires. - On essaie d’avoir un nombre de couple supérieur à 30 minimum (idéal 50 couples) pour chaque point expérimental du variogramme. Si ce n’est pas possible pour certaines classes, on accorde moins d’importance à ces points. Si le nombre de paires est très faible, on ne considère plus du tout le point. - On accorde plus de poids aux premiers points du variogramme (h petit) car ce sont ces valeurs qui ont le plus d'impact dans les calculs géostatistiques. - Lorsque « h » dépasse environ dmax/2, on ne tient pas compte des valeurs du variogramme. (dmax est la taille du phénomène étudié dans la direction considérée). - On cherche à obtenir des modèles les plus simples possible qui rendent bien compte des valeurs expérimentales. II.6. Exercices 1. On vous donne 2 portions de forage sur lesquelles sont indiquées les teneurs d’un polluants du sol (en ppm) pour des carottes séparées de 3m. les 2 forages sont espacés de 9m de centre à centre (le dessin n’est pas à l’échelle). - Calculez le variogramme expérimental omnidirectionnel à la distance h=9m exactement en prenant soin d’indiquer toutes les paires utilisées. 2. La figure suivante montre les mesures du pH du sol sur une carotte de 20 cm de profondeur en certains points. 28 CHAPITRE II : LA VARIOGRAPHIE - Quelle est la valeur du variogramme expérimental dans la direction 90o (azimut) pour la distance h=20m? Indiquez clairement toutes les paires considérées dans votre calcul. 3. Les variogrammes de la figure ci-dessous sont obtenues dans de différentes directions. a) Décrivez le modèle de variogramme illustré sur ces figures. b) c) Soit deux points espacés de 20m et définissant un azimut de 43°. Quelle est la covariance entre ces deux points? Les données ayant servi au calcul des variogrammes ont été obtenues à partir d’une procédure analytique assurant une bonne précision. Quelle serait la conséquence sur le variogramme d’utiliser une procédure d’analyse moins précise ? 29 CHAPITRE III : ESTIMATION D'UNE TENEUR PONCTUELLE (KRIGEAGE) CHAPITRE III III. ESTIMATION D'UNE TENEUR PONCTUELLE (KRIGEAGE) III.1. Introduction Le krigeage, le deuxième outil de la géostatistique, est une méthode d’interpolation applicable à des données spatiales et qui consiste a estimé la teneur ponctuelle de la variable étudiée en des sites non échantillonnés. La théorie du krigeage a été développée par un mathématicien français G. Matheron, école des Mines de Paris au début des années 1960 (voir chapitre III), à partir des travaux de l’ingénieur minier sud-africain D. G. Krige. En effet, durant les années 50, Krige a développé une série de méthodes statistiques empiriques afin de déterminer la distribution de minerais à partir d’un ensemble de forages. Pour rendre hommage à D. Krige, Mathéron a nommé ce deuxième outil de la géostatistique par le « Krigeage ». Il existe plusieurs types de krigeages, nous allons exposer, dans le cadre de ce chapitre, le krigeage ordinaire (KO) et le krigeage simple (KS) III.2. Le krigeage ordinaire Le krigeage est défini comme un estimateur Y* d'une propriété Y en un point quelconque de l'espace géographique. Cette estimation est faite à partir des observations effectives y(x) de cette propriété. Il fournit ensuite un indicateur de la précision de l'estimation faite à travers une variance d'estimation. III.2.1 Aspects théoriques L’objectif du krigeage est d’estimer la valeur de la variable régionalisée à interpoler Y(.) en un site non échantillonné noté x0. La première étape pour atteindre ce but consiste à déterminer le « voisinage de krigeage ». Ce voisinage se définie par le domaine du champ D contenant x0 ainsi que les sites x1 à xn associés aux observations utilisées dans la prévision de Y(x0). Ces sites doivent former un sous-ensemble de l’ensemble du site d’observation. Le choix du voisinage de krigeage se base sur une certaine connaissance de la structure de dépendance spatiale entre les observations. La taille n de ce voisinage doit cependant être assez grande pour mener à une estimation précise. La forme la plus simple et la plus employée de cette technique est celle du krigeage linéaire. L'estimation y*(x0 ) faite en un point x0 par le krigeage linéaire est telle que: n Y * ( x0 ) = ∑ λiY ( xi ) (37) i =1 Ou : n est le nombre expérimentaux pris en compte dans l’estimation λi est le poids affecté au point expérimental xi 30 Plus simple, pour résoudre le système d’équation induit par la recherche des poids λi , il faut introduire les conditions d’optimisation. Ces conditions sont les suivantes : - non biais E[Y * ( x ) − Y ( x )] = 0 (38) - variance d’estimation minimale VAR[Y * ( x) − Y ( x)]minimale (39) Le problème à résoudre pour estimer la valeur d'une propriété Y consiste donc à calculer le poids λi affecté à chaque point observé. Quand l'hypothèse intrinsèque est vérifiée (Chapitre IV), l'ajustement d'une fonction autorisée au variogramme expérimental permet de résoudre le système défini par les équations 42, 43 et 44. De la sorte, on peut calculer les poids λi de l'équation 42 et donc la valeur de l'estimation Y*(x0). Le calcul du poids affecté à un point observé ne dépend pas du tout de la valeur de la variable étudiée en ce point. Il dépend uniquement: - de la structure spatiale de la variable révélée par le variogramme - de la distance géographique du point observé au point à estimer. V.2.2. Compréhension par l'exemple. La figure 12 illustre sur un cas fictif le calcul des poids λi de l'estimation par krigeage en relation avec des variogrammes différents. On considère dans tous les cas: - que le point à estimer a pour coordonnées (0,0); - qu'on dispose de vingt points observés. On indique, en chaque point observé, le poids qu'il prend dans l'estimation avec trois types de variogrammes différents. - Cas (A), le variogramme est de type pépitique indiquant une distribution aléatoire de la variable dans l'espace. Il n'y a donc pas lieu de privilégier dans l'estimation les points proches par rapport aux points éloignés. Les poids affectés à l'ensemble des points observés sont donc identiques. L'estimation consiste dans ce cas à faire une moyenne locale. - Cas (B), le variogramme est de type linéaire croissant. Les points proches du point à estimer sont donc beaucoup plus corrélés au point à estimer que les points éloignés. De ce fait, les quatre points situés à une distance "1" du point à estimer sont prépondérants dans l'estimation: ils se voient attribuer 88 % du poids total. - Cas (C), le variogramme est de type exponentiel avec une portée de l'ordre de 2. Le poids affecté aux points observés est donc maximal pour les points distants de "1" et minimal 31 pour ceux distants de "3". Mais pour une distance de "1", la valeur de la semi-variance est déjà importante, de l'ordre de 75 % de celle observée au palier. Entre les distances "1" et "3", le niveau de corrélation entre les points observés et le point à estimer varie donc relativement peu. Ceci explique que les poids sont proches les uns des autres dans ce cas de figure. Figure 12. Poids affectés (* 100) aux points observés dans l'estimation par krigeage en un point de coordonnées (0,0). Trois situations sont présentées: A: Le variogramme est de type pépitique: λ (h ) = 0,079 B: Le variogramme est linéaire croissant: C: Le variogramme est exponentiel: 32 λ (h ) = 0.05h λ (h ) = 0.79 (1- exp(-h/0.7)) III.3. Le krigeage simple Si la moyenne "m" du champ D à estimer est connue (ou du moins on en possède un estimé fiable), on peut alors former un estimateur sans biais sans imposer la contrainte que la somme des poids soit égale à 1. n Yv* − m = ∑ λi (Y i−m) (40) i La variance d’estimation est donné par l’équation suivante ; i =n j =n i =n i =1 j =1 i =1 σ = Var (Yv ) + ∑∑ λi λ j Cov(Yi , Y j ) − 2∑∑ λiCov(Yv , Yi ) 2 e (41) Comme pour le krigeage ordinaire, l’idée est de choisir les λi de façon à minimiser la variance d’estimation σ e . Pour cela, il faut trouver le minimum, on dérive chacun des valeurs de λi et l’on pose ces dérivées partielles égales à 0. 2 σ e2 par rapport à Il faut retenir que : Le systeme de krigeage simple (KS) ne peut s’écrire directement en termes de n variogrammes puisqu’on n’a pas ∑λ i =1 i =1 En termes pratiques, les estimés obtenus par krigeage ordinaire (KO) et simple (KS) sont très similaires lorsqu’on effectue le krigeage à courte distance par rapport aux points connus et par rapport à la portée du variogramme et que ce dernier montre une structure importante. N.B : En règle générale, l’estimation par Krigeage ordinaire est préférable au krigeage simple car elle beaucoup plus fiables V.4. Propriétés du krigeage Les principales propriétés et caractéristiques associées au krigeage sont : - Linéaire, sans biais, à variance minimale, par construction. - Interpolateur exact. : si l’on estime un point connu, on retrouve la valeur connue. - Présente un effet d'écran: les points les plus près reçoivent les poids les plus importants. Cet effet d'écran varie selon la configuration et selon le modèle de variogramme utilisé pour le krigeage (voir exemple plus haut). Plus l'effet de pépite est important, moins il y a d'effet d'écran. - Tient compte de la taille du champ à estimer et de la position des points entre eux. - Par l'utilisation du variogramme, le krigeage tient compte de la continuité du phénomène étudié (effet de pépite, anisotropie, etc.). - Effectue généralement un lissage, i.e. les estimations sont moins variables que les teneurs réelles (point ou bloc) que l'on cherche à estimer. - Transitif. Si l’on observe en un point une valeur coïncidant avec la valeur krigée pour ce point, alors les valeurs krigées en d'autres points ne sont pas modifiées par l'inclusion de ce nouveau point dans les krigeages. Par contre les variances de krigeage, elles, sont diminuées. De même, si l’on krige un certain nombre de points et que l’on utilise les valeurs krigées comme si c’étaient de nouvelles 33 V.5. La variance d'estimation Il est indispensable de disposer d'une grandeur indiquant la précision des estimations faites. Cette grandeur est fournie en un point x0 par la variance d'estimation σ e2 ( x0 ) La résolution des équations (42), (43) et (44) conduit à une écriture de la variance d'estimation telle que: n σ = ∑ λiγ ( xi , x0 ) + ψ 2 e où : (42) i =1 x0 est le point à estimer xi sont les points observés λi sont les poids des points observés γ(xi,x0) est la semi-variance entre un point observé et le point à estimer Ψ est un multiplicateur de Lagrange Cette écriture montre que la variance d'estimation dépend: - de la structure spatiale de la variable étudiée, à travers la forme générale du variogramme. La variance d'estimation sera d'autant plus grande que le variogramme présente des valeurs de semi-variance élevées. - de la distance du point à estimer aux points observés. L'estimation en un point proche d'un point observé sera en règle générale plus précise que celle en un point très éloigné de tout point observé. La façon la plus simple pour interpréter la variance d'estimation σ e est la suivante : - Si les erreurs d'estimation sont supposées normales, la connaissance de la variance 2 d'estimation σ e ( x0 ) et donc de l'écart-type d'estimation σ e ( x0 ) permet de définir un intervalle de confiance à 95% de la vraie valeur Y(x0) d'une propriété Y en un point x0 tel que: 2 [y*(x0) - 2 σ e ( x0 ) , y*(x0) + 2 σ e ( x0 ) ] (43) où: y*(x0) est l'estimation par krigeage de Y au point x0. Cet intervalle de confiance est d'abord à comparer à l'étendue générale de la variable sur le domaine d'étude pour savoir si l'estimation effectuée présente un intérêt. Cet intervalle de confiance doit ensuite être confronté aux exigences de précision de l'utilisateur. 34 Exemple : Si l'utilisateur cherche à estimer la Conductivité électrique du sol (CE) avec une précision de ± 0.1 dS/m et que l'intervalle de confiance lui indique une précision de ±0.5 dS/m, ses exigences de précision ne sont pas satisfaites. La solution passe alors en règle générale par un échantillonnage supplémentaire. Cadran 2 : La variance d’estimation En résumé, la variance d'estimation, révélatrice de la précision d'une estimation dépend de deux grands facteurs : - d'une part, de la structure spatiale de la propriété étudiée. La variance d'estimation est d'autant plus faible que le variogramme présente des valeurs faibles. On conçoit en effet intuitivement qu'il est plus facile d'avoir une estimation fiable d'une propriété qui varie peu, que d'une propriété très chaotique. - d'autre part, de l'échantillonnage effectué. Là encore, on conçoit que la précision d'une estimation soit d'autant meilleure que l'échantillonnage est important. III.6. Autres formes de krigeage. - le krigeage-bloc est une simple extension du krigeage ordinaire ponctuel que nous avons présenté. Au lieu de faire une estimation en un point, l'estimation porte sur la valeur moyenne d'une propriété sur une surface. Cette technique est utilisée pour obtenir des cartes plus lissées ou pour estimer des stocks. - le krigeage disjonctif: l'estimation d'un point à estimer se fait par une fonction plus générale qu'une simple combinaison linéaire des valeurs aux points observés. Cette technique permet de tracer des cartes de probabilité qu'une variable dépasse un seuil donné. Elle est donc souvent utilisée dans des problèmes de pollution. - le co-krigeage: il exploite la corrélation pouvant exister entre deux variables. Il est utilisé quand on dispose de deux variables corrélées entre elles, l'une étant difficile à acquérir (par exemple, mesure physique de laboratoire), l'autre étant facile d'accès (par exemple, observation de terrain). Le co-krigeage permet de cartographier une variable peu échantillonnée en utilisant les observations plus nombreuses d'une variable facile d'accès. Un exemple d’emploi est la cartographie d’une propriété du sol en se fondant sur ses corrélations avec la topographie déduite d’un Modèle Numérique de Terrain. - le krigeage d’indicatrices: permet de traiter des variables nominales ou qualitatives ordonnées. Il s’agit d’une approche non paramétrique reposant sur une transformation préalable de la variable étudiée en indicatrices prenant la valeur 0 ou 1 selon des seuils choisis de la variable. Cette approche est bien adaptée au cas où l’on s’intéresse particulièrement aux valeurs extrêmes (par exemple, valeurs élevées en cas de pollution) qui ont tendance à être éliminées par le krigeage ordinaire. 35 III.7. La validation croisée La validation croisée consiste à enlever un nombre de points Parmi les points échantillonnés, pour faire la validation des méthodes de krigeage Ces points ne sont pas introduits dans le calcul des variogrammes et d'estimation par krigeage, mais ils sont, pour toutes les variables confondues, estimés en leurs localisations à partir d'autres points mesurés, ce qui permet de comparer les valeurs de variables mesurées Y(.) à celles estimés Y*(.). Les critères retenus pour cette validation sont : • L'erreur moyenne (EM) : elle doit être proche de zéro pour qu'il n'y ait ni surestimation, ni sous-estimation systématique. Elle est calculée par la formule suivante : 1 n EM = ∑ (Y * ( xi ) − Y ( xi )) (49) n i =1 • La racine quadratique de l'erreur moyenne (RQEM) : elle est calculée par la formule (50), autant sa valeur est faible, autant l'estimation est bonne. RQEM = n 1 n ∑[Y * ( x ) − Y ( x )]² i i =1 i (50) • L'erreur standardisée moyenne (ESM) : qui est le rapport entre l'écart quadratique et la variance d'estimation, elle vérifie la précision de l'estimation de l'écart type d'estimation. Les meilleurs résultats sont obtenus lorsque sa valeur est proche de 1. n 1 ESM = n ∑ [Z * ( x ) − Z ( x )]² i =1 i i (51) σ ( xi ) • La racine de l'erreur standardisée quadratique moyenne (RQESM) : on aura une sousestimation si sa valeur est inférieure à 1, et dans le cas contraire une surestimation. Elle est calculée par la formule suivante : n 1 RQESM = n ∑ [Z * ( x ) − Z ( x )]² i i =1 σ ( xi ) i (52) III.8. Exercices 1. On vous présente les six profils suivants obtenus par krigeage ordinaire avec des modèles différents et en utilisant les observations indiquées par des ∆ . 36 a) Associez à chaque modèle de variogramme le profil de krigeage correspondant (A à F) N Modèle 1 Sphérique C0/C = 0 ; a = 50 2 Sphérique C0/C = 0.1 ; a = 50 3 Sphérique C0/C = 1.0 ; a = 50 Figure b) À la question précédente, seul le ratio C0/C est fourni au lieu des valeurs séparées de C0 et C. Qu’est-ce quichange dans le krigeage si le ratio C0/C=1 est obtenu avec C0=10,C=10 plutôt que C0=5 et C=5? 2. Dans un krigeage ponctuel, a) Est-il possible d’avoir les poids λi , i=1...n, de krigeage simple(KS) tous égaux à zéro? Si oui, indiquez dans quelle situation. Si non, dites pourquoi. b) Est-il possible d’avoir les poids λi , i=1...n, de krigeage ordinaire(KO) tous égaux à zéro? Si oui, indiquez dans quelle situation. Si non, dites pourquoi. 3. Soit les points X0 (0,1), X1 (1,0) , X2(0,0) et X3(3, 0) sur les quelles on a mesuré la propriété Z dont les valeurs sont comme suit : Z1 = 9 ; Z2 = 9 et Z3 = 4 (voir figure cidessous 37 - On cherche à estimer la propriété Z0 sur le point x0 (0,1) On suppose que la variable Z possède un variogramme sphérique avec :effet de pépite C0 =1 ; un pallier C=1 et une portée a = 3. 38 CHAPITRE IV : LE KRIGEAGE D’INDICATRICES CHAPITRE V : RIGEAGE D’INDICATRICES V.1. Introduction Le krigeage d’indicatrices (KI), initié par Journel (1983), a été développé mathématiquement (Davis, 1984 ; Cressie, 1991 ; Bierkens et Burrough, 1993). L'idée de base du krigeage d'indicatrices consiste à effectuer l'analyse spatiale non pas directement de la propriété étudiée, mais des différentes fonctions dites « indicatrices » issues d'un codage binaire de cette propriété. La transformation en une variable indicatrice avec une distribution binaire se fait comme suit: 1 if Z(xi ) ≥ Z c I ( xi , Z c ) = 0 if Z(xi ) < Zc i = 1,......., n (42) Où, I (xi; Zc), est la valeur indicatrice à un emplacement xi ; Z (xi) est la valeur mesurée à un emplacement xi, et Zc est le seuil. La valeur I (xi ; Zc), conditionnelle à n données environnant, peut être exprimée comme suit : E[ I ( xi ; Z c ) = Pr ob{Z ( x) ≤ Z c ] = F ( xi ; Z c ) (43) Où, F (xi; Zc) est la fonction de distribution cumulative conditionnelle (DFCC). La fonction « F. » représente la probabilité pour une valeur inconnue ne dépasse pas un seuil donné Zc. Les DFCCs sont modélisés à l'aide d'une approche non paramétrique qui est le krigeage d’indicatrices (KI). V.2. Procédure et mise en ouvre du krigeage d’indicatrices La procédure de mise en œuvre du krigeage d’indicatrices se fait suivant les quatre étapes suivantes : 1. Le codage des valeurs mesurées par rapport à une valeur seuil choisie. On obtient ainsi des variables qui sont codées soit en 0 soit en 1. Les valeurs seuils dépendent, en général, de la distribution statistique de la variable, mais dans certains cas, les limites de nuisance ou de toxicité (normes de potabilité d’une eau d’irrigation par exemple) seront déterminantes pour le choix de ces seuils. 39 CHAPITRE IV : LE KRIGEAGE D’INDICATRICES 2. Le calcul du variogramme des fonctions indicatrices au seuil donné détermine la structure spatiale. N (h) 1 γ * (h, c) = (h) ∑[I (xi , c) − I (xi + h ± ∆h, c]2 2N i=1 (44) ou : N(h) est le nombre de couples d’observations distants de h ±∆h 3. Après ajustement du variogramme des fonctions indicatrices à un modèle théorique, on effectue le krigeage linéaire en un point (x0), des I (xi,c) par l’équation : n I * (x0 , c) = ∑λi I (xi , c) (45) i=1 n : le nombre de points expérimentaux pris en compte dans l’estimation λ i : le poids affecté aux points expérimentaux Cette dernière formule appliquée donne des valeurs comprises entre 0 et 1 qui est une estimation en un point donné de la probabilité que la valeur Zi soit inférieure ou égale à la valeur seuil «Zc » choisie. En combinant ces estimations, on peut obtenir en tout point la probabilité que la variable soit égale à une valeur seuil déterminée. 4. La dernière étape consiste à estimer la valeur Z(x0) de la propriété Z en un point quelconque x0 connaissant sa fonction de densité. Cela peut se faire par le calcul de l’espérance mathématique de la valeur de la propriété en suivant la procédure suivante : (i) La différence entre les estimations des fonctions indicatrices pour deux valeurs seuil consécutives permet de calculer la probabilité correspondant en tout point. Ces points étant la réalisation d’une variable aléatoire discrète notée X, comme les seuils ont été calculés aux valeurs supérieures, le calcul se fait alors : Probabilité (X=c) = Probabilité (X ≥ Zc) – Probabilité (X ≥ Zc +1) . (46) avec : z c et z c +1 sont les valeurs seuil consécutives (ii) En combinant les valeurs seuils correspondant aux différentes classes, on obtient une version discrétisée de la fonction de répartition qui représente 40 CHAPITRE IV : LE KRIGEAGE D’INDICATRICES l’espérance mathématique du rang du seuil de la variable au point échantillonné. L’espérance mathématique est calculée comme suit : E(Z) = Zc + 2Z c+1 + 3Zc+2 + 4Zc +3 + 5Z c + 4 41 (47) CHAPITRE V : LA GEOSTATISTIQUE MULTIVARIE CHAPITRE V : LA GEOSTATISTIQUE MULTIVARIE V.1. Introduction La géostatistique multipamétrique est une méthode consiste à cartographier les valeurs des coordonnées des individus sur l'axe d'ACP1 ou AFD2 pris en considération, elle permet de dégager un fond régional des mesures, c'est à dire la tendance en grand de la zone d'étude (Goulard & al., 1987 ; Douaoui, 1993). Les valeurs des coordonnées seront considérées comme étant des variables régionalisées dont on détermine leur structure spatiale par l'étude du variogramme. V.2. Structure des données de base La structure des données de base est formée d’un espace géographique et d’un espace factoriel, constituant ensemble les 348 variables régionalisées (Tab. V.1). Tableau n° V.1. Structure des données de base relative aux variables régionalisées Variable régionalisée Espace géographique Coordonnées Lambert (m) (n° du sondage) Longitude (X) Latitude (Y) 294500 324250 294500 324100 323950 294500 323800 294500 . . . . . . 324150 295625 324200 295625 324250 295625 1 2 3 4 . . . 346 347 348 Espace factoriel Coordonnées des poins de sondages sur les 3 premiers axes discriminants 1er axe 2ème axe 3ème axe 0.811 -1.232 -0.366 -0.448 0.076 0.902 0.232 -0.607 0.439 0.894 0.059 -0.208 . . . . . . . . . -0.683 -0.783 -0.259 -0.011 -0.719 -0.789 0.197 -0.058 -0.408 Ainsi, échantillon se retrouve localisé dans ces espaces comme suit : - par ses « coordonnées géographique » dans l’espace géographique. Ces coordonnées permettront par la suite de déterminer les distances (h) entre les points de sondage; 1 2 ACP : Analyse en Composante Principale (voir cours statistique appliquée) AFD : Analyse Factorielle Discriminante (voir cours statistique appliquée) - par sa valeur relative à sa projection dans l’un des axes factoriels issu de l’ACP ou de l’AFD. C’est la variable qui caractérise chacun des sondages du sol. Comme exemple d’une variable régionalisée, celle du premier point de sondage projeté sur le 1er axe discriminant. Elle se calcule pour les variables réduites, de la façon suivante : i = 11 X1 = ∑ ((mi – xi)/σi)) (ai) où, i=1 i : variable initiale, xi : valeur de la variable initiale i, σi : écart type de la variable initiale i, mi : moyenne correspondant à la variable initiale i, ai : vecteur propre de la variable initiale i. X1 : valeur du premier sondage égale à sa valeur de projection sur le premier axe discriminant. X1 = (-0.249) (-1.12) + (-0.062) (-0.623) + ……+ (-0.153) (-0.367) = -0.366 Tableau n° XXVII. Exemple de calcul d’une coordonnée de projection du premier sondage du sol sur le premier axe discriminant. Variables initiales (i) pHeau CE CaCO3 total MO A Lf Lg Sf Sg Io K Variables centrées et réduites (mi – xi)/σi) (7.50 – 7.905) / 0.361 = -1.12 (0.81 – 3.071) / 3.62 = -0.623 (17.25 – 15.911) / 2.56 = 0.522 (2.56 – 2.695) / 0.73 = -0.184 (33.35 – 38.015) / 9.48 = -0.491 (36.00 – 32.783) / 7.39 = 0.434 (17.65 – 21.802) / 8.01 = -0.517 (11.30 – 5.378) / 6.04 = 0.980 (1.70 – 2.149) / 4.19 = -0.107 (4.16 – 4.430) / 1.03 = -0.261 (2.23 – 2.889) / 1.79 = -0.367 Vecteurs propres (ai) -0.249 -0.062 -0.274 0.155 -0.296 -0.359 -0.566 -0.917 -0.331 -0.029 -0.153 V.2. Analyse de la structure spatiale du premier axe discriminant V2.1. Calcul du variogramme expérimental et théorique Voir chapitre II V.2.2. Modélisation du variogramme expérimental Voir chapitre II V.3. Interpolation par krigeage Voir chapitre II Un TP détaillé sera donné sur la méthode - 43 - - 44 - BIBLIOGRAPHIE BIBLIOGRAPHIE ALLARD D. (2012). Statistiques spatiales : introduction à la géostatistique. Cours Université Montpellier II (France). 42P. BAJJALI W.(2018). ArcGIS for Environmentaland Water Issues. Ed. Sringer. 363p https://doi.org/10.1007/978-3-319-61158-7 BOURENNANE H, KING D, CHERY P, BRUAND A (1996) Improving the kriging of a soil variable using slope gradient as external drift. European Journal of Soil Science 47, 473-483. BOURGAULT G, JOURNEL AG, RHOADES LI, CORWIN DL, LESH SM (1997) Geostatistical analysis of a soil salinity data set. Advances in Agronomy 58, 241- 292. BOSSER P. (2012). Interpolation Spatiale. Cours de l’Ecole Nationale Des Sciences Géographiques (ENSG)- France. 53P BURGESS T.M. et WEBSTER R. (1980a) - Optimal interpolation and isarithmic mapping of soil properties. I. The semi-variogram and punctual kriging. J. of Soil Sci., 31: 315-331 BURGESS T.M. et WEBSTER R. (1980b) - Optimal interpolation and isarithmic mapping of soil properties. II.Block kriging. J. of Soil Sci., 31: 333-341 BURGESS T.M., WEBSTER R. et McBRATNEY A.B. (1981) - Optimal interpolation and isarithmic mapping of soil properties. IV. Sampling strategy. J. of Soil Sci., 32: 643-659 BURROUGH P., MCDONNELL R. Oxford University Press, 194 p. (1998) Principles of Geographical Information Systems, CRESSIE N. (1991) - Statistics for spatial data. Wiley Series in Probability and Mathematical Statistics. John Wiley and Sons, 900 p. DELHOMME J.P. 1976. Application de la théorie de la variable régionalisée dans la science de l'eau. Thèse Doc. Ing.. ENSM de Paris. 130P DOUAOUI A., 1993. Variabilité spatiale de quelques propriétés physico-chimiques des sols du moyen Chéliff, incidences cartographique. Thèse Magist., INA Alger. PP 22 – 97 ESRI (2014). Geostatistical Analyst Tutorial. GASCUEL-ODOUX C., BOIVIN P. et WALTER C. (1994) - Eléments de géostatistique. In Laudelout H., Cheverry C. et Calvet R., «Modélisation mathématique des processus pédologiques », Actes Editions, Manuels Scientifiques et Techniques, 217-248. GOOVAERTS P. (1999) Geostatistics in soil science: state-of-the-art and perspectives. Geoderma 89, 1-46. 62 BIBLIOGRAPHIE GOOVAERTS, P. 1997. Geostatistics for natural resources evaluation. Oxford University Press New York, 483 p. JOURNEL A.G., 1977. Géostatistique minière. Centre de géostatistique. Ecole des mines; Fontainebleu. 737 P MARSMAN B.A. et GRUIJTER De J.J (1986) - Quality of soil maps. A comparison of soil survey methods in a sandy area. Soil Survey Papers n° 15, Stiboka, Wageningen MATHERON G. (1965) - Les variables régionalisées et leur estimation. Paris. MASSON 305 p. McBRATNEY A.B. et WEBSTER R. (1981a) - The design of optimal sampling schemes for local estimation and mapping of regionalized variables. I. Theory and method. Computers and Geosciences, Vol.7(4), 331-334. MYERS J. 1997 Geostatistical Error Management (GEM). Quantifying Uncertainty For Environmental Sampling and Mapping. Van Nostrand Reinhold, New York, 571 p. OLEA R. (1999) Geostatistics for Engineers and Earth Scientists. Kluwer, 328 p. OLIVER M.A. et WEBSTER R. (2015). Basic Steps in Geostatistics: The Variogram and Kriging. Ed. Springer. DOI 10.1007/978-3-319-15865-5 ROUSSON V. (2013). Statistique appliquée aux sciences de la vie. Ed.,SBN 978-2-8178-0393-7 Springer Paris Berlin Heidelberg New York. 327P SAMARA D.D. (2002).Geostatistics with Applications In Earth Sciences, Second Edition. Ed. Springer. ISBN 978-1-4020-9380-7 (e-book). 220p WACKERNAGEL H. (1995) ‘Multivariate geostatistics: An introduction with applications’. (Springer Verlag, Berlin), 256 p. WEBSTER R. et OLIVER M.A. (1990) - Statistical methods in soil and land resource survey. Spatial Information Systems, Oxford University Press, 316 p. SITES WEBS DES LOGICIELS ET APPRENTISSAGE - En perpétuel renouvellement, voir le site AI-GEOSTAT : http://www.ai-geostats.org/ SITES INTERNET - du Centre de Géostatistique de l’Ecole des Mines : http://www.cg.ensmp.fr/ - du Stanford Center for Reservoir Forecasting : http://ekofisk.stanford.edu/SCRF.html - de la liste AI-GEOSTAT : http://www.ai-geostats.org/ - de la revue Computer and Geosciences : http://www.iamg.org/candg.html - du Centre d’Agriculture de Précision de l’Université de Sydney : http://www.usyd.edu.au/su/agric/acpa/ 63