Telechargé par Hassan Moulay Omar

cours Geostat Appliquée-M2-Biodiversité

publicité
‫وزارة ا ـــ ـــ ــــ ــــ ـــــم ا ــــ ــــــ ــــــ و ا ـــــــ ــــ ــــث ا ــــــ ـــــــ ــــــــ ـــــــ‬
‫‪Ministère de l'Enseignement Supérieur et de la Recherche Scientifique‬‬
‫ــــــــ ــــ ـــــ‬
‫ـــــ ــــ ــــــ ـــــــ ــــن ـــــو ـــــ ــــــ – ا ــــ ـــــ ــــــف‬
‫‪Université Hassiba Benbouali de Chlef‬‬
‫ــــ ــــ ـــــــ ــــــ ــــــوم ا طـــ ـــــ ــــ ـــــ و ا ــــ ــــــ ة‬
‫‪Faculté des Sciences de la Nature et de la Vie‬‬
‫ـــــ ـــــــم ا ــــــ ــــــ ء و ا ــــ ــــــ ـــــــ ـــــــ و ا ـــــ ـــــ!ــــــ ــــــ ا ـــــ ـــــ ـــــــ ــــــدا ــــــــــ‬
‫‪Département d’Eau, Environnement et Développement Durable‬‬
‫‪Notes de cours‬‬
‫‪Master 2, Eau et Environnement‬‬
‫‪Filière : Agronomie‬‬
‫‪Domaine : Sciences de la Nature et de la Vie‬‬
‫‪GÉOSTATISTIQUE‬‬
‫‪APPLIQUÉE‬‬
‫)‪([email protected]‬‬
‫‪Notes de cours‬‬
‫‪ABDELHAMID BRADAÏ‬‬
INTRODUCTION
La géostatistique est une branche de la statistique adaptée à l'estimation spatiale de propriétés
du milieu physique. Elle traite les propriétés observées de façon discontinue dans l'espace
géographique (en un point, sur une petite surface).
Nous allons essayer au cours de ce cours introductif de présenter les principes de mise en
œuvre d'une analyse géostatistique. Le TP qui prolonge ce cours, a deux objectifs: d'une part,
montrer la mise en œuvre pratique de la géostatistique, d'autre part, montrer que la
géostatistique se fonde sur les bases des statistiques classiques mieux connue et maitrisées par
les étudiants.
Pour un étudiant confronté à un problème de variabilité spatiale, le premier choix qu'il aura à
faire concerne le type d'approche qu'il met en œuvre. Deux grandes voies lui sont ouvertes :
- Employer une démarche d’interpolation déterministe. C'est le type d'approche utilisée
depuis bien longtemps et même encore de nos jours. Les observations sont implantées dès
lors que les caractéristiques du paysage changent. Les limites sont tracées en s'appuyant sur
les modifications du paysage. Cette technique est souvent économe en moyens et présente
des résultats très parlants. Elle ne permet par contre jamais d'obtenir une carte dont on
connaît la précision.
- Employer une démarche statistique, basée sur les statistiques classiques (recherche de
moyennes, de variances au sein d'une population ou de strates) ou sur la géostatistique
(obtention de cartes). On reproche souvent à ces techniques leurs exigences élevées en
matière d'échantillonnage. Il demeure que ces techniques sont incontournables dès lors que
l'on désire obtenir des estimations dont on connaît la précision. Ces techniques sont
également les seules que l'on puisse mettre en œuvre dans certains cas: phénomène
naturelle, propriété dont la variabilité ne dépend que de l'action de l'homme (pollution) ...
Les querelles d'école entre ces deux types d'approches restent nombreuses. On peut proposer
une approche pragmatique pour faire le choix. On envisagera l'approche déterministe quand le
paysage est très contrasté et que l'on sait que ces contrastes correspondent à des états
différents de la propriété étudiée. On préférera l'approche statistique quand il est utile d'avoir
des estimations de précision connue ou que le paysage varie peu.
C’est dans cet objectif que ce cours est inscrit. Il vise à introduire les concepts de la
géostatistique. En raison du public visé, cette présentation part de considérations intuitives
pour aboutir à des ébauches de formalisme mathématique.
1
1. Définition
Le mot de Géostatistique a fait son apparition en 1962. On peut définir la Géostatistique
comme l’étude des variables numériques réparties dans l’espace ou encore la méthode de traitement
statistique de données localisées. Il est clair alors que des problèmes essentiellement géostatistiques
ont été abordés depuis longtemps : en art des mines certes, mais aussi en météorologie, topographie,
hydrologie, hydrogéologie et bien d’autres disciplines.
L’innovation ne réside pas non plus dans l’arsenal mathématique requis. L’introduction et
l’étude des « Fonctions Aléatoires » dès les années 1930 par les écoles française et russe ; les outils
théoriques que nous utilisons en Géostatistique linéaire étaient en place dès les années 1940 ; et les
méthodes comme les moindres carrés de Gauss ou les paramètres de Lagrange, sont des plus
classiques et font partie du bagage mathématique de base de l’ingénieur.
Le déclic, si l’on peut dire, qui a conduit à l’élaboration de ce que nous appelons ici et
aujourd’hui la Géostatistique, c’est le rapprochement de ces deux domaines : des problèmes
techniques parfois forts terre-à-terre d’une part, et d’autre part un arsenal de méthodes mathématiques.
Sans doute d’ailleurs, dans l’espace d’une décennie, la Géostatistique s’est élaborée indépendamment
dans le domaine minier, dans le domaine forestier (B. Matéron, en Suède), en météorologie (L.S.
Gandin, en URSS). Sans doute une recherche bibliographique approfondie trouverait-elle une
évolution semblable dans d’autres disciplines encore
2. Récapitulation de l’historique de la géostatistique
La chronologie de l’histoire de la géostatistique peut être résumée comme suit :
- 1930 - 1950 Théorème des fonctions aléatoires (Kolmogorov, wiener)
- 1955 Daniel Krige (Géologue Sud Africain) : Approche empirique (régression) pour
corrigé les problèmes de biais conditionnel observé dans les mines
- 1960 – 1970 Matéron (école des mines – Paris), Gandin (Météorologie) développent
ensemble la théorie de la variable régionalisée. Le terme géostatistique est né,
réponse aux questions de Krige.
- Mathéron, pour rendre hommage à Daniel Krige décédé en 1956, donne le nom
«Krigeage» à la méthode d'estimation développée.
- La fin des années 60 et début des années 70, les chercheurs russes ont utilisé la
géostatistique pour estimer la lame d'eau écoulée (précipitation)
- Delhomme (1976) est le premier à utiliser la géostatistique en hydrologie de surface
et souterraine.
- Les années 80, la géostatistique est utilisée en science du sol (pédologie) : Les
travaux de Webster pour l’estimation de certaines propriétés du sol sont les plus
célèbres
- Depuis les années 90 à nos jours, les écologistes (les sciences de l’environnement)
utilisent de plus en plus les techniques de géostatistique.
D’une manière générale :
« La géostatistique peut s'appliquer à toutes les sciences de la nature, et plus généralement, à
n'importe quelle discipline manipulant des données localisées dans l'espace et nécessitant des
modèles décrivant la dépendance spatiale entre ces données ».
2
3. Objectifs de la géostatistique
L’objectif principal de la géostatistique est d’établir des cartes des phénomènes naturels qui
soient :
- claires,
- faciles à comprendre,
- fiables.
Parmi ces phénomènes étudiés, on peut citer :
- contamination des sites,
- évaluation de volumes de sols à traiter,
- communication autour d’une pollution de nappe,
- pollution atmosphérique.
- Répartition des rendements des cultures et densité des poissons (Agriculture de
précision)
Objectifs d’apprentissage
A la fin du cours, l'étudiant doit :
(i). comprendre les hypothèses sous-jacentes à toute modélisation géostatistique ;
(ii). familier avec les notions de variance et saura estimer et modéliser un variogramme ;
(iii). comprendre les principales propriétés des estimateurs du krigeage et le lien qu'ils
présentent avec le variogramme ;
(iv). aura été sensibilisé à diverses applications de ces techniques dans le domaine d’écologie
et environnement;
(v). saura utiliser la géostatistique pour ses propres recherches de cartographie (rapport, Master
ou doctorat)
3
CHAPITRE I : VARIABLES REGIONALISEES
CHAPITRE I
I. VARIABLES REGIONALISEES
I.1. Variable aléatoire et fonction aléatoire
I.1.1. Définitions
-Définition simple
Une variable aléatoire (v.a) est fonction dont les résultats possibles sont connus mais
dont le résultat final ne peut être déterminé, à priori, avant d'effectuer la mesure (expérience).
Dans la nature il existe de multitude de variables aléatoires, on peut citer :
- Lame d’eau précipitée ;
- Concentration d’un polluant dans les eaux souterraines ou dans les sols ;
- pH de l’eau de pluie.
-Définition mathématique
Une variable aléatoire est définie en associant un nombre réel à chaque éventualité
d’une expérience aléatoire. Une variable aléatoire X est une fonction de l’ensemble
fondamental Ω à valeurs dans R, X : Ω → R.
Lorsque la variable X ne prend que des valeurs discrètes, on parle de variable aléatoire
discrète.
On distingue deux types de variables aléatoires :
A. Variable aléatoire discrète
Une variable aléatoire est dite discrète si elle ne prend que des valeurs discontinues dans
un intervalle donné (borné ou non borné). L’ensemble des nombres entiers est discret. En
règle générale, toutes les variables qui résultent d’un dénombrement ou d’une numération sont
de type discret. On peut citer des exemples :
- le nombre de petits par porté pour une espèce animale donnée (chat, chien, etc) :
- le nombre de bactéries dans 100 ml de préparation :
- le nombre de mutations dans une séquence d’ADN de 10 kb ;
B. Variable aléatoire continue
Une variable aléatoire est dite continue si elle peut prendre toutes les valeurs dans un
intervalle donné (borné ou non borné). En règle générale, toutes les variables qui résultent
d’une mesure sont de type continu. On peut citer comme exemples :
- la masse corporelle des individus pour une espèce animale donnée ;
4
CHAPITRE I : VARIABLES REGIONALISEES
- la variation des nitrates dans une nappe phréatique ;
- la concentration d’un polluant dans le sol ;
I.1.2. Description d’une variable aléatoire
Sans connaître la valeur que prendra le résultat final, on peut parfois connaître la
probabilité qu’une v.a prenne chacun des résultats possibles. C’est la description la plus
complète que l’on puisse faire de la v.a. La fonction qui décrit ces probabilités est la fonction
de densité f pour les v.a. continues et c’est la fonction de masse pour les v.a discrètes.
N.B : En géostatistique, la plupart des variables étudiées sont issues de phénomènes
naturels, elles sont considérées comme variables quantitatives discrètes. On présentera dans
ce chapitre qu’aux propriétés des variables aléatoire discrètes
I.1.2.1. Loi de probabilité
La loi de probabilité d’une variable aléatoire discrète est entièrement déterminée par la
probabilité Pi des évènements {X= xi}, xi parcourant l’univers image X (Ω). La loi de
probabilité est donnée par les (xi, Pi)i
Remarque 3.1 : Afin de simplifier l’écriture, on considère souvent l’écriture suivante :
P{X=xi} équivalent à P(X=xi) ou Pi
III.1.2.2. Fonction de répartition
On appelle fonction de répartition d’une variable aléatoire X, la fonction Fx telle que :
Fx : R
R
t
Fx(t) = P(X < t)
Concrètement, la fonction de répartition correspond à la distribution des probabilités
cumulées. Le plateau atteint par la fonction de répartition correspond à la valeur de probabilité
1 car : ∑ Pi = 1
i
L’importance pratique de la fonction de répartition est qu’elle permet de calculer la
probabilité de tout intervalle R.
Les propriétés associées aux fonctions de répartitions sont les suivantes :
(1) ∀t ∈ R 0 ≤ Fx (t ) ≤ 1
(2) Fx est croissante sur R
(3) lim Fx (t ) = 0
t → −∞
(4) Si a ≤ b ,
et
lim Fx (t ) = 1
t → +∞
P (a ≤ X ≤ b) = Fx (b) − Fx (a )
5
CHAPITRE I : VARIABLES REGIONALISEES
Exemple 1 :
Imaginons l'expérience suivante pour quantifier la biomasse d’un champ agricole :
Nous creusons 10 trous dans un champ agricole, et comptons le nombre de ver de terre
dans chacun d'eux (voir figure).
- dans quatre (4) des dix trous nous n'en trouvons aucuns (0 vers de terre),
- trois (3) autres trous contiennent chacun un ver de terre (1 ver de terre),
- nous en comptons deux (2) dans chacun des deux autres trous (2 vers de terre),
- le dernier trou donne trois (3) vers de terre (3 vers de terre).
Figure 12. Illustration du nombre de vers de terre par trou creusé dans un champ agricole.
Solution
Les résultats de l’expérience peuvent être représentés dans un tableau en attribuant un
numéro pour chaque trou creusé et le nombre de ver de terre trouvé dans chaque trou comme
suit :
N° Trou
1
2
3
4
5
6
7
8
9
10
Nbr. Ver de
terre
0
0
0
0
1
1
1
2
2
3
Si on note le nombre de vers de terres trouvées dans chaque trou comme variable
aléatoire X, elle est définie X
Ω → R avec Ω ={0, 0, 0, 0, 1, 1, 1, 2, 2, 3}
On voit que X (Ω) = {0, 1, 2, 3} et on peut déterminer aussitôt les évènements [X=xi] et
P(X=xi) :
[X=0] = (0, 0, 0, 0)
et P (X=0) = 4/10 = 0.4
[X =1] = (1, 1, 1)
et P(X=1) = 3/10 = 0.3
[X=2] = (2, 2)
et P(X=2) = 2/10 = 0.2
[X=3] = (3)
et P(X=1) = 1/10 = 0.1
Onn peut organiser les résultats de l’expérience
l’expérience dans un tableau en représentant P(X=xi) et Fx
comme suit :
Tableau 2. Répartition des vers de terre par trou creusé dans le champ agricole.
agricole
X (Nbr.
Nbr. Vers
de terres/trou )
0
1
2
3
P(X=x
X=xi)
4/10
3/10
2/10
1/10
Fx
4/10
7/10
9/10
1
6
CHAPITRE I : VARIABLES REGIONALISEES
Pour une v.a, on utilise un diagramme en bâtons pour visualiser la distribution de
probabilités et fonction en escalier pour la fonction de répartition.
III.1.2.3. Moment du premier ordre (Esperance mathématique)
Si X est une variable aléatoire discrète de loi de probabilité (xi, pi)i définit sur un nombre
fini (n) d’évènements élémentaires alors :
n
E ( X ) = ∑ xi p i = m ( x )
(1)
i =1
Où « E(X) » est l’espérance mathématique, elle considérée comme la valeur probable de
la variable aléatoire X.
Les propriétés de l’espérance sont comme suit :
(1). Si X et Y sont deux variables aléatoires définies sur le même univers Ω.admettant
une espérance mathématique, alors :
E ( X + Y ) = E ( X ) + E (Y ) ;
(2). E ( aX ) = aE ( X )
∀a ∈ R
(3). Si X ≥ 0 alors E(X) ≥ 0
(4). Si X est caractère constant tel que : ∀ω ∈ Ω
X(ω ) = K alors E(X) = K
En un point x donné, m(x) représente la ‘moyenne’ autour de la quelle se distribuent les
valeurs prises par multiples réalisation indépendantes de la fonction aléatoire. Il s’agit du
paramètre descriptif de base du comportement de F(x) : on établit en effet que l’espérance est
la meilleure approximation d’une variable aléatoire par une constante
I.1.2.4. Moment du second ordre (Variance mathématique)
La variance mathématique d’une variable aléatoire V(X) est l’espérance mathématique
de l’écart à l’espérance mathématique. C’est un paramètre de dispersion qui correspond au
moment centré d’ordre 2 de la variable aléatoire X. C’est l’équivalent de la variance observée
S². En effet, lorsque le nombre d’épreuves « n » est grand ; S² tend vers V(X).
Si X est une variable aléatoire ayant une espérance E(X), on appel Variance
mathématique de X le réel de :
7
CHAPITRE I : VARIABLES REGIONALISEES
V ( X ) = E ([ X − ( E ( X )]²)
(2)
Comme on peut écrire aussi :
V ( X ) = E ( X ²) − [ E ( X )]²
(3)
Remarque 3.2 : Comme [X-E(X)]² ≥ 0, nécessairement V(X) ≥ 0. Par définition, une variance
est toujours positive.
Enfin, Si X est une variable aléatoire ayant une variance mathématique V(X), on appelle
l’écart- type (σ(x)) de X, le réel de :
σ ( X ) = V ( x)
(4)
-Exemple 2 :
On poursuit avec les mêmes données de l’exemple précédent, le nombre de vers de
terre par trou comme une variable aléatoire (v.a en abrégé) notée X.
Les fréquences précédentes deviennent des probabilités X vaut 0 avec la probabilité
0.4 ("4 chances sur 10"), 1 avec la probabilité 0.3, 2 avec 0.2 et enfin 3 avec 0.1.
L’espérance mathématique E(X) de la v.a X vaut :
E(X) = 0 x 0.4 + 1 x 0.3 + 2 x 0.2 + 3 x 0.1 =1 (12.)
C’est la valeur probable, de X, notée E(X) = 1.
On peut calculer de la même façon l'espérance du carré de la variable ou la Variance
mathématique V(X):
V(X) = 0²x0.4 + 1²x0.3 + 2²x0.2 + 3²x0.1= 2
I.1.2.5. Covariance et corrélogramme
La fonction de covariance va permettre de prendre en compte les relations entre
l’ensemble des paires de points. Si on prend en compte deux points xi et xj, la covariance peut
être définie par l’équation suivante :
Cov[ F ( xi ), ( F ( x j )] = E[( F ( xi ) − m) * ( Z ( x j ) − m)]
(5)
Avec : m = la moyenne
Lorsque le processus est stationnaire au second ordre, la covariance ne va plus
dépendre quede la distance entre les points xi − x j . Si on note h cette distance, on va définir
C(h) calculée pour toutes les valeurs de h en prenant en compte tous les couples de points
situés à une distance (h) les uns des autres. Cette fonction de covariance C(h) est définie par :
C (h) = Cov[ F ( x + h), ( F ( x)] = E[( F ( x + h) − m) * ( Z ( x) − m)]
8
(6)
CHAPITRE I : VARIABLES REGIONALISEES
Elle traduit la façon dont évoluent la covariance des observations lorsque leur distance
augmente. Lorsque h est égal à 0, la covariance est égale à la variance.
C (0) = E[( F ( xi ) − m)²] = σ ²
(7)
Les propriétés de la fonction de covariance sont les suivantes :
C ( − h) = C ( h)
( 8)
C (h) ≤ C (0)
On définit la fonction d’autocorrélation ρ(h) comme une fonction de h par le rapport
C (h)
. Sa valeur est comprise entre (-1) et (+1). On peut montrer les relations suivantes
C (0 )
lorsque la stationnarité à l’ordre 2 est vérifiée :
γ ( h ) = C ( 0) − C ( h )
γ (h) = σ ²(1 − ρ (h))
(9)
L’estimation du corrélogramme (fonction de la covariance) est faite à partir de n(h)
paires de points i (nombre de points distant de h) comme suit :
Pour i variant de i=1 à n(h), on a :
1 n( h)
(10)
C ( h) =
∑ ( F ( xi ) − m)( F ( xi + h) − m)
n(h) i=1
On peut aussi étudier et décrire le comportement simultané de plus d'une variable
aléatoire. La fonction de densité conjointe : Fxy (x,y) donne la probabilité que, simultanément
X = x et Y = y
On a la fonction de densité :
+∞+∞
∫ ∫F
xy
( x, y )dxdy = 1, Fxy ( x, y )
(11)
− ∞− ∞
P[ x1 < X < x2 , y1 < Y < y2 ] =
x2 y 2
∫ ∫F
xy
( x, y )dxdy
(12)
x1 y1
Pour justifier l’existence de la covariance d’une variable aléatoire, deux cas se présentent :
- Si (X, Y)(Ω) est fini, alors le couple (X, Y) admet une covariance
- Si X et Y admettent un moment d’ordre 2, alors le couple (X, Y) admet une
covariance
La covariance est donnée par la formule suivante :
cov( X , Y ) = E[( X − E ( X )) − (Y − E (Y ))]
(13)
Ou par la formule de König-Huygens.
cov( X , Y ) = E ( XY ) − E ( X ) E (Y )
9
(14)
CHAPITRE I : VARIABLES REGIONALISEES
La covariance mesure la corrélation entre les deux variables aléatoires X et Y :
- Lorsque cov (X, Y )> 0, on dit que les variables X et Y sont positivement corrélées.
L’interprétation d’une covariance positive est la suivante : plus X est élevé, plus, en
moyenne, Y est élevé (et réciproquement).
- Lorsque cov (X, Y )< 0, on dit que les variables X et Y sont négativement corrélées.
L’interprétation d’une covariance positive est alors la suivante : plus X est élevé, plus, en
moyenne, Y est petit (et réciproquement).
- Enfin, Lorsque cov (X, Y )= 0, on dit que les variables X et Y ne sont pas corrélées.
La covariance est un outil pour mesurer la corrélation linéaire entre deux variables
aléatoires.
Enfin, le coefficient de corrélation linéaire. Lorsque (X, Y) admet une covariance, on
définit le coefficient de corrélation linéaire du couple (X, Y) , et l’on note ρX,Y , le nombre :
ρ XY +
Propriété de ρX,Y :
Cov ( X , Y )
σ ( X )σ (Y )
(15)
-1≤ ρX,Y ≤ 1
I.2. Techniques de caractérisation de la loi spatiale
En statistique classique, l’inférence des paramètres est rendue possible par la répétition
indépendante des données. En statistiques spatiales, on observe très souvent une réalisation
unique des données, par exemple un épisode de pollution à l’ozone, une région agricole
particulière, une épidémie végétale, … etc. Pour pouvoir réaliser l’inférence statistique pour
un évènement unique, il faut donc en quelques sortes remplacer l’hypothèse sur les répétitions
indépendantes par une hypothèse sur le champ aléatoire qui considère d’une part que certaines
de ses caractéristiques sont identiques d’un point à l’autre de l’espace, et d’autre part que
l’espérance de certaines grandeurs sont accessibles par des intégrales sur l’espace. On pose
donc des hypothèses de stationnarité et d’intrinsèque.
I.2.1. Hypothèses de stationnarité
Faire l'hypothèse de la stationnarité revient à compenser l'absence de plusieurs
réalisations de la fonction aléatoire par une forme de redondance de l'information au sein
d'une seule réalisation.
Il convient toutefois de distinguer plusieurs formes de stationnarité d'une fonction
aléatoire, on site :
I.2.1.1. Stationnarité stricte
Une fonction aléatoire est une fonction aléatoire stationnaire (FAST) si pour n fini, et
pour tout vecteur inter-support « h », la fonction de répartition conjointe de {Z (xi), i = 1…n}
est la même que celle de {Z (xi + h) i = 1…n}
10
CHAPITRE I : VARIABLES REGIONALISEES
La stationnarité stricte ne contient aucune hypothèse concernant les espérances,
variances ou covariances, qui peuvent éventuellement ne pas être définies
I.2.1.2. Stationnarité d'ordre 2
Une fonction aléatoire est dite stationnaire à l'ordre 2 (FAST-2) si la covariance existe
et ne dépend que du vecteur inter-support h, ce qui implique que l'espérance et la variance
existent et ne dépendent pas de x soit :
E(Z(x)) = m
(16)
Var (Z (x)) = E ((Z (x) - m)²) = C (0)
(17)
Cov(Z(x),Z(x+h)) = E(Z(x),Z(x+h)) – m² = C(h)
(18)
I.3.2. Hypothèse intrinsèque
Dans le cas des variables régionalisées (VR) qui présentent une variation spatiale qui
n'apparaît pas bornée, au moins au sein du domaine d'étude D. Il n'est pas réaliste d'employer
une FAST-2 et il convient d'affaiblir encore davantage l'hypothèse de stationnarité.
Une fonction aléatoire est intrinsèque à l'ordre 0 (FAI-0) si ses accroissements d'ordre
1 sont stationnaires d'ordre 2, autrement dit, si les espérances et les variances des incréments
Z (x+h) - Z (x) existent et ne dépendent pas de x, soit :
E (Z(x+h)-Z(x)) = m
(19)
Var (Z(x+h)-Z(x)) = E((Z(x+h)-Z(x)- m)²) = 2γ(h) (20)
avec (h) une fonction nommée demi-variograme (ou semi-variogramme), ou selon l'usage le
plus répandu «variogramme».
I. 3 Notion de variable régionalisée
Une variable est dite « régionalisée » lorsque les valeurs qu’elle prend dépendent de sa
position dans l’espace (ces coordonnées géographiques). La géostatistique est l’application
de la théorie des variables régionalisées à un phénomène qui se déploie dans l'espace et y
manifeste une certaine structure, qu'il est régionalisé.
Si F(x) désigne la valeur au point z d'une caractéristique F de ce phénomène, nous
dirons que F(x) est une variable régionalisée, en abrégé V.R. C'est là un terme neutre,
purement descriptif, antérieur, en particulier, à toute interprétation probabiliste. Du point de
vue mathématique, une V.R. est donc simplement une fonction F(z) du point z, mais c'est, en
général, une fonction fort irrégulière.
La variable régionalisée se présente sous deux aspects contradictoires (ou
complémentaires) :
(i) un aspect aléatoire (haute irrégularité, et variations imprévisibles d'un point à
l'autre).
11
CHAPITRE I : VARIABLES REGIONALISEES
(ii) un aspect structuré (elle doit refléter à sa manière les caractéristiques structurales
du phénomène régionalisé).
La théorie des V.R. se propose donc deux objectifs principaux :
- sur le plan théorique, imprimer ces caractéristiques structurales sous une forme
mathématique adéquate ;
- sur le plan pratique, résoudre le problème de l'estimation d'une V.R. à partir d'un
échantillonnage fragmentaire.
Exemple 3.3
Revenons aux trous et à leur vers de terre, et supposons que ces trous soient creusés le
long de deux lignes (A et B) de telles sorte que le nombre de vers de terre trouvées le long de
la ligne soit, dans cet ordre (fig.12).
Figure 13. Illustration du nombre de vers de terre par trou creusé dans deux transects dans
un champ agricole.
Les trous de la séquence A possède une structure symétrique très nette et dans le cas B,
si la structure existe, elle est très faible et montre une forte irrégularité ; cependant ces 2 séries
de 10 mesures admettent la même moyenne et la même variance. Ceci montre qu'on ne peut
donc pas appréhender la distribution d'une variable spatiale uniquement à l'aide
de ces notions classiques.
Il est donc nécessaire de recourir à une méthode qui analyse à la fois la localisation, la
continuité, l'anisotropie et le caractère transitif d'une telle variable. Pour ce faire,
on retient pour hypothèse que les valeurs prises par une variable régionalisée sont une
réalisation particulière d'une fonction aléatoire stationnaire douée d'une fonction
d'auto-corrélation. Cette fonction aléatoire F (x) est définie par :
- son espérance mathématique (ou moyenne) : m (x) - E (F(x)),
- sa variance V(x) = V (F(x)),
- sa covariance C(x1,x2) - E F(x1) F(x2) - m(x1) m(x2),
Avec la condition dite de stationnarité : la moyenne, la variance et la covariance sont
invariantes par translation :
- m(x) = m la moyenne de F(x) est la même en tous points,
- V(x) = v la variance de F(x) est la même en tous points,
- la covariance de F(x) dépend de la distance h qui les sépare x1 et x2 dans l’espace,
- l'accroissement F(x + h) - F(x) ne dépend que de h.
12
CHAPITRE II : LA VARIOGRAPHIE
CHAPITRE II
II. LA VARIOGRAPHIE
II.1. Variogramme théorique et variogramme expérimental
II.1.1. Introduction à la notion de variogramme
Considérons une propriété notée « Y » connue en « n » points de l'espace géographique,
chacun de ces points étant repérés par le vecteur « x » de ses coordonnées géographiques
(longitude et latitude). De la sorte, la notation "Y(xi)" représente la valeur observée de la
propriété Y au i ème point d'échantillonnage de coordonnées « xi ».
Pour simplifier, prenons deux points pour lesquels on connaît des valeurs y(x1) et
y(x2) de la propriété Y dans un espace géographique tel que le montre la figure ci-dessous.
Pour comparer ces deux valeurs, la façon la plus simple est d'utiliser la variance entre les
observations de ces deux sites, notée « S² ». Elle est par définition égale à :
__
__
S ² = [(Y ( x1 ) − Y )]² + [(Y ( x 2 ) − Y ]²
(21)
__
où : Y est la moyenne entre ces deux observations.
Cette variance « S² », qui traduit l'importance des écarts à la moyenne, est d'autant plus grande
que les observations sont différentes et, au contraire, si elle est faible les observations sont de
plus en plus identiques. L'équation 22 peut être développée pour obtenir une autre expression
de la valeur S²:
1
S ² = [Y ( x1 ) − Y ( x2 )]²
2
(23)
Cette nouvelle équation pour déterminer la variance (eq.23) peut être écrite pour tout couple
de sites. Pour cela, considérons deux sites Y(xi) et Y(xi +h) où Y(xi) représente les
coordonnées géographiques d'un des sites et « h » est un vecteur caractérisant la distance
entre les sites.
13
CHAPITRE II : LA VARIOGRAPHIE
L'équation (23) s'écrit alors :
1
S ² = [Y ( xi ) − Y ( xi + h)]²
2
(24)
y(x1), y(x2), y(x3), y(x4) chacun
Calculons à présent la distance géographique séparant
des points d'observation et considérons les « m » couples de point séparés par une même
distance géographique h.
On peut comme précédemment, calculer la variance des observations pour les sites pris deux
à deux. La moyenne S² de ces m variances s'écrit en employant (24) :
1 m
S² =
∑ [ y( xi ) − y( xi + h)]²
2m i =1
(25)
Où : m est le nombre de couple
Pour une distance h séparant deux points d'observation, S² rend compte de la
ressemblance et/ou la dissemblance des observations faites en ces deux points: il sera d'autant
plus grand que ces observations sont différentes et le contraire signifie une grande
ressemblance entre les observations. S² est qualifiée de "semi-variance".
De manière intuitive, on conçoit que deux observations soient en général d'autant plus
semblables qu'elles sont proches géographiquement l'une de l'autre. Le calcul de S² pour
différentes distances h, va permettre de quantifier cette idée: il permet de suivre l'évolution
des écarts entre des observations en fonction de la distance qui les sépare.
Mathéron (1965) a montré l’intérêt de cette notion simple et les conditions de
généralisation ont été définies par la théorie qu’il a appelée « théorie des variables
régionalisées ». Cette théorie montre que la généralisation de l’équation (25) suppose deux
conditions, regroupées sous le terme d’hypothèse intrinsèque et qui sont :
-
L’espérance de Y est constante quelle que soit la position géographique x :
E [Y(x)] =m (constante)
(26)
-
Pour toute distance h, la différence « [Y(x) -Y(x+h)] » a une variance finie, qui ne
dépend que de la distance h séparant les points.
14
CHAPITRE II : LA VARIOGRAPHIE
VAR [Y(x+h )-Y(x)]
= 2λ (h)
(27)
= E[Y(x+h) - Y(x)]²
Quand ces deux conditions sont vérifiées, la valeur S² définie dans l'équation (25)
constitue un estimateur non biaisé de la fonction λ(h) définie en éqution (33). Cette fonction
λ(h) est nommée « variogramme ».
1 m(h)
λ ( h) =
( y( xi ) − y ( xi + h)) 2
∑
2m(h) i = 2
(28)
Où : m est le nombre de couple
Intérêt du variogramme :
En étudiant l'évolution du variogramme λ(h) en fonction de la distance h séparant des couples
d'observation, on va analyser la façon dont se détériore l'information acquise en un point au
fur et à mesure que l'on s'éloigne de ce point.
II.1.2. Le calcul du variogramme
On cherche à construire un graphique représentant en abscisse les distances h séparant
les points et en ordonnée les semi-variances [λ(h)].
La construction du variogramme est illustrée ci-dessous par des schémas établis à partir
de 8 points d'observation répartis à distance égale de 1 mètre le long d'un transect.
Figure 1. Illustration du calcul du varriogramme sur un transect de 8 points séparés par une
distance h = 1m
Le schéma ci-dessus (fig. 1) montre que le nombre de points participant au calcul du
variogramme diminue au fur et à mesure que la distance augmente. Les valeurs de semivariance risquent donc d'être moins précises pour les grandes valeurs de h.
Exemple de calcul
Soit deux exemples (série A et série B) fictifs correspondant à des observations disposées
le long d'un transect à des intervalles réguliers de 1 mètre.
- Calculez pour chacun des exemples: la moyenne, la variance, γ (1), γ (2), γ (3) et γ(4).
- Que peut-on conclure ?
15
CHAPITRE II : LA VARIOGRAPHIE
Solution
- La moyenne A
XA=
-
La moyenne B
XB =
-
1
1
X i = [( 4 + 3 + 2 + 1 + 0 + 1 + 2 + 3 + 4)] = 2,22
∑
n
8
1
1
X i = [(4 + 2 + 1 + 0 + 3 + 1 + 2 + 4 + 3)] = 2,22
∑
n
8
La variance A
1
1
( X i − X ) ² = [(4 − 2,22)² + (3 − 2,22)² + (2 − 2,22)² + (1 − 2.22)² + (0 − 2.22)² + (1 − 2.22)² + ( 2 − 2.22) +
∑
n
8
(3 − 2.22)² + ( 4 − 2.22)²] = 1.94
S A2 =
-
La variance B
1
1
∑ ( X i − X )² = 8 [(4 − 2,22)² + (2 − 2,22)² + (1 − 2,22)² + (0 − 2.22)² + (3 − 2.22)² + (1 − 2.22)² + (2 − 2.22) +
n
( 4 − 2.22)² + (3 − 2.22)²] = 1.94
S B2 =
La figure 15 illustre la méthodologie de calcul du variogramme de l’exemple des série A
et B.
Figure 2. Illustration de calcul des valeurs de γ(h) de la série A et B.
16
CHAPITRE II : LA VARIOGRAPHIE
h
Le calcul des valeurs de γ(h) des séries A et B est comme suit :
Nbr.
m
1
γ ( h) =
[ y ( xi ) − y ( xi + h)]²
Couples
∑
i=2
2
m
(m)
Série A
1h
8
2h
7
3h
6
4h
5
1
γ (1) =
[(4 − 3)² + (3 − 2)² + (2 − 1)² + (1 − 0)² + (0 − 1)² + (1 − 2)² + ( 2 − 3)² + (3 − 4)²] = 0.5
2*8
1
γ (2) =
[(4 − 2)² + (3 − 1)² + ( 2 − 0)² + (1 − 1)² + (0 − 2)² + (1 − 3)² + ( 2 − 4)²] = 1.71
2*7
1
γ (3) =
[(4 − 1)² + (3 − 0)² + ( 2 − 1)² + (1 − 2)² + (0 − 3)² + (1 − 4)²] = 3.16
2*6
1
γ ( 4) =
[(4 − 0)² + (3 − 1)² + ( 2 − 2)² + (1 − 3)² + (0 − 4)² = 4
2*5
Série B
1h
8
1
γ (1) =
[(4 − 2)² + (2 − 1)² + (1 − 0)² + (0 − 3)² + (3 − 1)² + (1 − 2)² + ( 2 − 4)² + ( 4 − 3)²] = 1.56
2*8
2h
7
γ ( 2) =
3h
6
4h
5
Conclusions?
•
Les deux séries ont même moyenne et même variance, toutefois on constate
clairement qu’elles n'ont pas le même degré de continuité spatiale, la première série
(série A) étant nettement plus continue que la seconde (série B) (voir fig. 16).
4.5
4
Série "A"
3.5
Série "B"
3
γ (h)
-
1
[(4 − 2)² + (3 − 1)² + ( 2 − 0)² + (1 − 1)² + (0 − 2)² + (1 − 3)² + ( 2 − 4)²] = 1.92
2*7
1
γ (3) =
[(4 − 0)² + ( 2 − 3)² + (1 − 1)² + (0 − 2)² + (3 − 4)² + (1 − 3)² = 3.08
2*6
1
γ ( 4) =
[(4 − 3)² + (2 − 1)² + (1 − 2)² + (0 − 4)² + (3 − 3)² = 1.9
2*5
2.5
2
1.5
1
0.5
0
1
2 Distance (m) 3
4
Figure 3. γ (h) vs h des séries A et B
Remarque
On peut aussi calculer le variogramme selon certaines directions spécifiques ; pour cela le
variogramme est définie par son pas de calcul « h » et sa direction déterminée par un angle
( θ ). On parle dans ce cas du variogramme directionnel et l’équation (28) s’écrit :
m(h,θ )
1
λ (h, θ ) =
( y ( xi ) − y( xi + h))2
∑
2m(h, θ ) i = 2
17
(29)
CHAPITRE II : LA VARIOGRAPHIE
Exemple de calcul de variogramme directionel
Soit une matrice de données 3 x 3 ayant les valeurs suivantes : la distance horizontale
et verticale entre 2 éléments consécutifs est de 1 m et « N » indique une donnée manquante
(voir schéma ci-dessous).
1. Le calcul du variogramme dans la direction horizontale : θ =0°
h
Nbr.
Couples
(m)
γ (h,0°) =
1
4
γ (1,0°) =
2
3
γ (2,0°) =
m ( h , 0° )
1
[ y ( xi ) − y( xi + h)]²
∑
i=2
2m(h,0°)
1
35
[(3 − 6)² + (6 − 5)² + (7 − 2)² + (2 − 2)²] =
= 4. 4
( 2 * 4)
8
1
45 15
[(3 − 5)² + (7 − 2)² + (4 − 0)²] =
= = 7.5
(2 * 3)
6
2
illustration de calcul
2. Le calcul du variogramme dans la direction verticale : θ =90°
h
γ (h,0°) =
1
Nbr.
Couples
(m)
5
2
3
γ (2,90°) =
γ (1,90°) =
m ( h , 90° )
1
[ y ( xi ) − y( xi + h)]²
∑
i =2
2m(h,90°)
1
54
[(4 − 7)² + (7 − 3)² + (2 − 6)² + (0 − 2)² + (2 − 5)²] =
= 5.4
(2 * 5)
10
1
26 13
[(4 − 3)² + (0 − 5)²] =
= = 6.5
( 2 * 2)
4
2
illustration de calcul
II.1.3. Variogramme expérimental.
La figure 17 représente, à titre d'exemple, un variogramme sur des données de mesure
du pH du sol d’une parcelle expérimentale de 1,5 hectares1, 150 mesures ont été effectuées
suivant un échantillonnage régulier (10m x 10m). Sur cette figure (fig. 15), on représente en
abscisse différentes distances séparant des couples de points expérimentaux : ces distances
sont nommées "pas" (lag en anglais). En ordonnée, on représente les valeurs des semivariances ou γ(h) calculées suivant l'équation (28).
Ce que peut constater sur cette figure :
1
Parcelle de la station expérimentale de la faculté des Sciences de la Nature et de la Vie, Université de Chlef (Douaoui, 1993)
18
CHAPITRE II : LA VARIOGRAPHIE
(i) Jusqu’à un pas de 20 mètres, le variogramme est croissant. Les écarts moyens entre les
observations augmentent donc quand la distance séparant ces observations augmente. Les
observations "se ressemblent donc de moins en moins", ce qui est conforme à l'intuition.
On peut dire également que les observations sont spatialement dépendantes ou liées sur
cette distance de 20m.
Figure 3. Un exemple de variogramme expérimental: variogramme moyen du pH du sol
d’une parcelle expérimentale de 1,5 hectare (Douaoui, 1993).
(ii) Au-delà de vingt mètres, le variogramme reste quasi-constant. Quelle que soit la
distance, les écarts moyens entre les observations sont identiques. On parlera pour cette
gamme de distance d'indépendance spatiale entre les observations.
(iii) La projection du variogramme à l'origine conduit à une valeur de semi-variance non
nulle bien que la distance est nulle (h=0).
II.1.4. Des définitions.
Un certain nombre de termes sont utilisés pour décrire un variogramme de la figure 3 et
qui sont :
a. L'effet de pépite (nugget effect) : il s'agit da la valeur de la semi-variance pour une
distance nulle. En théorie, on devrait avoir un γ(h)=0 pour un h=0, mais fréquemment,
le variogramme présente une ordonnée à l'origine non nulle (fig. 3). Cet écart est
qualifié "d'effet de pépite" (nugget effect en anglais). Il est interprété comme le
résultat d'erreurs de mesure de la variable étudiée, ou erreur de positionnement ou
d'une variabilité spatiale présente à une distance inférieure au pas d’échantillonnage.
b. Le palier (Sill) : valeur de la semi-variance à partir de laquelle le variogramme ne
croît plus (fig.3).
c. La portée (Range): distance à partir de laquelle le palier est atteint (fig.3). La portée
est la distance à partir de laquelle les valeurs de la variable entre deux points sont
indépendantes (non corrélées) (fig.3).
19
CHAPITRE II : LA VARIOGRAPHIE
Figure 4 : Le variogramme expérimental
II.2. Les modèles du variogramme
II.2.1. Forme du variogramme
L'analyse du variogramme cherche une fonction caractéristique de la structure de la
variable étudiée. En premier lieu, on étudie quelques caractéristiques du variogramme :
II.2.1.1. Comportement au voisinage de l'origine
La continuité et la régularité dans l'espace de la fonction aléatoire et donc la variable
régionalisée qu'elle présente sont liées au comportement à l'origine du variogramme
Delhomme (1976) distingue 04 types
1. Allure parabolique : comportement dérivable à l'origine, ceci est la caractéristique
d'une variabilité spatiale hautement régulière (fig.5.a)
2. Allure linéaire : γ(h) reste continue à l'origine mais n'est plus dérivable, donc
moins régulière (fig.5.b).
3. Discontinuité à l'origine : γ(h) ne tend pas vers (0) lorsque h tend vers (0), cette
discontinuité en h = 0 du variogramme est appelée effet de pépite (fig.5.c) qui est
dû : soit à la présence d'une structure dont l'échelle est très inférieure à
l'espacement des données et on parle de micro régionalisation des données, soit à
la présence d'erreurs de mesures, soit au nombre insuffisant de couples de mesures
à faible distance induisant éventuellement une incertitude sur la détermination de
l'effet de pépite.
4. Effet de pépite pur (Aléatoire pure) : c'est le cas limite du cas précèdent quand γ
(h) ne traduit plus que la seule discontinuité à l'origine (fig.5.d)
γ(h) = 0 est (h) = C0 dès que h > 0
20
CHAPITRE II : LA VARIOGRAPHIE
Cela indique que Z(x) et Z(x+ h) sont sans corrélation quelle que soit leur distance
(h) non nulle, ce type de modèle s'explique généralement par l'absence d'une
structure spatiale, plus fréquemment, par l'existence d'une structure marquée par
des erreurs expérimentales ou inférieures au plus petit intervalle d'observation.
Figure 5 : Comportement à l'origine des différents variogrammes (Delhomme, 1976)
IV.2.1.2. Comportement du graphe à l'infini
Ces types de variogrammes pourront être borné ou non borné autour d'une valeur du
palier, égale à la variance sur l'ensemble des données.
Dans ce cas, la stationnarité d'ordre II de la variance est vérifiée. Cette longueur est
interprétée comme la distance maximale pour laquelle un point présentera une influence sur
son entourage. Cette valeur donne la distance au-delà de la quelle elles sont indépendantes
(fig.6a, 6b et 6c)
Dans le variogramme non borné (fig. 6d), la stationnarité d'ordre II n'est pas vérifiée et
le variogramme continu à croître sans atteindre un palier. Voltz (1986) donne trois
interprétations possibles :
- Le palier n'a pas atteint la portée à l'échelle de notre travail (l’espace étudié)
- La variance infinie représentative d'une variable régionalisée respectant
l'hypothèse intrinsèque
- La présence d'une dérive pourrait être aussi une explication à ce type de
variogramme.
21
CHAPITRE II : LA VARIOGRAPHIE
a : Modèle Sphérique
b : Modèle exponentiel
c : modèle gaussien
d : Modèle en hb
Figure 6 : Principaux modèles de variogrammes utilisés (d'après Delhomme, 1976)
II.3. Modélisation du variogramme
Pour tenir compte des caractéristiques du variogramme dans la démarche géostatistique,
il est indispensable d'ajuster une fonction au variogramme expérimental, ce qui permet d'en
résumer les principales caractéristiques.
Ces fonctions doivent présenter deux qualités :
- Rendre compte le mieux possible de l'information du variogramme expérimental.
- Satisfaire les conditions théoriques : elles doivent être "Semi-Positives"
L'ajustement se fait par l'emploi d'un certain nombre de modèles autorisant
essentiellement deux types :
II.3.1. Modèles croissants non bornés
Les modèles non bornés sont montrés par la figure 7 et ils sont définis comme suit :
* Modèle linéaire :
γ (h) = C0 + bh………………………………………..(30)
22
CHAPITRE II : LA VARIOGRAPHIE
Avec : C0 : L'ordre à l'origine
b : la pente de la droite
h : distance séparant les points
- cas particulier du linéaire :
γ (h) = C0 ……………………………………………(31)
C'est le cas d'un variogramme plat appelé pépidique (effet de pépite pûre)
* fonction puissance :
γ (h) = C0 + bhα………………………………………(33)
0 < α <2
Avec : b : la pente de la droite
α : un coefficient fixant la forme de la courbe
IV.3.2. Modèles croissants bornés
Les modèles croissants bornés sont montrés par la figure 8 et ils sont définis comme
suit :
* Modèle Sphérique :
γ (h) = C0 + C[3h/2a – 1/2(h/a)3]……….si h < a
γ (h) = C0 + C………………………..……...si h > a …………….(34)
Avec : C0 : l'ordre à l'origine
C : est le palier moins l'ordonnée à l'origine
a : la portée
* Modèle Exponentiel :
γ (h) = C0 + C[1 – exp(-h/r)]………………………………….(35)
Avec : C0 : l'ordre à l'origine
r : paramètre de la distance égale environ le tier (1/3) de la portée
23
CHAPITRE II : LA VARIOGRAPHIE
modèle linéaire
semi- variance
modèle pépitique
fonction puissance
1,8
fonction puissance
0,2
fonction puissance
0,5
0
0,5
1
1,5
2
Distance h
semi- variance
Figure 7 : Modèles croissants d'ajustement à des variogrammes : linéaire, pépitique et
fonction puissance de l'ordre 1.8, 0.5 et 0.2
modèle sphérique
modèle exponentiel
Distance h
Figure 8 : Modèle d'ajustement aux variogrmmes bornés: Modèle expérimental et
sphérique
II.4. Modélisation de l'anisotropie
Le phénomène d'anisotropie se présente quand la variabilité spatiale n'est plus la même
dans toutes les directions c'est à dire qu'il y a des directions privilégiées vis à vis du
phénomène étudié. L'orientation préférentielle de ces directions incite à rechercher une
éventuelle anisotropie dans la variabilité spatiale des propriétés intrinsèques du sol.
Le calcul de l'anisotropie nécessite la construction de deux variogrammes directionnels
modélisés. Le premier est construit dans la direction principale de l'anisotropie et le second
dans la direction perpendiculaire à la première. Le rapport entre les valeurs des deux portées
relatives aux deux variogrammes directionnels donne la valeur de l'anisotropie, étape qui
permet de passer par la suite, au krigeage et donc à l'interpolation.
24
CHAPITRE II : LA VARIOGRAPHIE
Figure 9. Variogrammes directionnels selon les quatre principales directions
Certains logiciels tels que le Variowin permettent de déceler la présence d’une
anisotropie et sa principale direction par le biais du variogramme surfacique (fig. 24). Ce
logiciel permet également de calculer la valeur de l’anisotropie par ajustement simultané des
deux vriogrammes directionnels.
Direction
principale
d’anisotropie
Figure 10. Exemple d’un variogramme surfacique montrant la présence d’une anisotropie
selon une direction principale
25
CHAPITRE II : LA VARIOGRAPHIE
Bien que dans la nature il existe une très grande variété d'anisotropies, en
géostatistique, on ne peut modéliser aisément que les anisotropies géométriques.
IV.4.1. Anisotropie géométrique
Les Caractéristiques d’une anisotropie géométrique sont comme suit :
- On observe dans diverses directions des paliers et des composantes pépitiques
identiques mais des portées différentes (fig. 11b).
- Les portées maximales (ag) et minimales (ap) s'observent selon deux directions
orthogonales. Ce qui forme une ellipse (fig.11a).
Figure 11. (a) ellipse formé par ag et ap ; (b) variation de de la porté du variogramme
dans le cas d’une anisotropie géométrique
Pour rendre les portées identiques (et égales à ag suivant toutes les directions en multipliant la
composante de la portée parallèle à ap par le facteur (ag/ap). Bref, les portées décrivent une
ellipse dont l'axe majeur est orienté parallèlement à ag.
( aθ cos θ )² ( aθ sin θ )²
+
=1
aθ2
a 2p
(36)
Connaissant ag et ap, on peut trouver aƟ, où Ɵ désigne l'angle mesuré par rapport à la direction
où est rencontrée la potée ag (la direction privilégiée).
aθ =
{a
ag a p
2
p
cos ²θ + ag2 sin ²θ
}
0.5
(37)
On peut ainsi évaluer γ (h, Ɵ) soit en utilisant aƟ , soit en corrigeant la distance h pour tenir
compte de l'anisotropie et on aura :
γ (hƟ, Ɵ) = γ(hg)
Avec hg calculé comme suit :
26
CHAPITRE II : LA VARIOGRAPHIE
a

hg = (hθ cosθ )² +  g hϑ sin θ 
a

 p

2
(38)
Exemple
Un gisement 2D est modélisé par un modèle avec anisotropie géométrique. Le modèle est
sphérique avec C=17%2 et effet de pépite C0=13%2 et les portées sont de 100m dans la
direction de la plus grande continuité (30o) et de 60m dans la direction de la plus petite
continuité (120o).
- Quelle est la valeur du variogramme entre deux observations situées aux coordonnées
(x1,y1)=(10,30) et (x2,y2)=(40,20)
Solution
On peut résoudre le présent problème par deux méthodes :
-
Première méthode :
On calcul la distance séparent les deux points et la direction qui les définissent :
h = ( y2 − y1 )² + ( x2 − x1 )² = (20 − 30)² + (40 − 10)² = (−10)² + (30)² = 31.63m
 y2 − y1 
 (−10) 
 = arctan
 = −18.43°
 (30) 
 x2 − x1 
θ = arctan
Cette direction forme un ange de 48.43° (30° -(-18.43°) = 48.43°) avec la direction de la plus
grande continuité. On calcul la portée dans cette direction aƟ (éq. 40)
aθ =
100 * 60
=70.8m
{(60)² * cos ²(48.43) + (100)² * sin ²(48.43)}0.5
On calcule la valeur du variogramme en utilisant l’équation du modèle sphérique (eq.37) pour
la distance calculée plus haut (31.63 m) et avec la portée 70.81m :
3

31.63
 31.63  

γ (31.63) = 13%² + 17%² * 1.5 *
− 0.5
 = 23.63%²

70.81
 70.81  

Deuxième méthode
Elle consiste à calculer la distance équivalente dans la direction de meilleure continuité
avec la formule précédente, où Ɵ représente l’angle entre la direction de meilleure
continuité et la direction définie par les deux points (48.43°).
On calcul donc hg en employant l’équation (41) :
2
 100

hg = [31.63 * cos( 48.43)] + 
* 31.63 * sin( 48.43)  = 44.65m
 60

2
27
CHAPITRE II : LA VARIOGRAPHIE
Etant donné que : γ (hƟ, Ɵ) = γ(hg), on calcul la valeur du variogramme en utilisant l’équation
du modèle sphérique (éq.37) pour la distance 44.65 m et avec la portée ag = 100m :
3


44
.
65
44
.
65


 = 23.63%²
γ (44.65) = 13%² + 17%² * 1.5 *
− 0.5



100
100




II.5. Stratégie pour le calcul de variogrammes et l’ajustement des modèles
Pour le calcul et l’ajustement des variogrammes il faut tenir compte des points suivants :
- On accorde plus de poids aux points du variogramme expérimental calculés avec
beaucoup de paires.
- On essaie d’avoir un nombre de couple supérieur à 30 minimum (idéal 50 couples)
pour chaque point expérimental du variogramme. Si ce n’est pas possible pour
certaines classes, on accorde moins d’importance à ces points. Si le nombre de
paires est très faible, on ne considère plus du tout le point.
- On accorde plus de poids aux premiers points du variogramme (h petit) car ce
sont ces valeurs qui ont le plus d'impact dans les calculs géostatistiques.
- Lorsque « h » dépasse environ dmax/2, on ne tient pas compte des valeurs du
variogramme. (dmax est la taille du phénomène étudié dans la direction considérée).
- On cherche à obtenir des modèles les plus simples possible qui rendent bien compte
des valeurs expérimentales.
II.6. Exercices
1. On vous donne 2 portions de forage sur lesquelles sont indiquées les teneurs d’un
polluants du sol (en ppm) pour des carottes séparées de 3m. les 2 forages sont espacés de 9m
de centre à centre (le dessin n’est pas à l’échelle).
-
Calculez le variogramme expérimental omnidirectionnel à la distance h=9m exactement
en prenant soin d’indiquer toutes les paires utilisées.
2. La figure suivante montre les mesures du pH du sol sur une carotte de 20 cm de profondeur
en certains points.
28
CHAPITRE II : LA VARIOGRAPHIE
-
Quelle est la valeur du variogramme expérimental dans la direction 90o (azimut)
pour la distance h=20m? Indiquez clairement toutes les paires considérées dans
votre calcul.
3. Les variogrammes de la figure ci-dessous sont obtenues dans de différentes directions.
a) Décrivez le modèle de variogramme illustré sur ces figures.
b)
c)
Soit deux points espacés de 20m et définissant un azimut de 43°. Quelle est la
covariance entre ces deux points?
Les données ayant servi au calcul des variogrammes ont été obtenues à partir
d’une procédure analytique assurant une bonne précision. Quelle serait la
conséquence sur le variogramme d’utiliser une procédure d’analyse moins
précise ?
29
CHAPITRE III : ESTIMATION D'UNE TENEUR PONCTUELLE (KRIGEAGE)
CHAPITRE III
III. ESTIMATION D'UNE TENEUR PONCTUELLE (KRIGEAGE)
III.1. Introduction
Le krigeage, le deuxième outil de la géostatistique, est une méthode d’interpolation
applicable à des données spatiales et qui consiste a estimé la teneur ponctuelle de la variable
étudiée en des sites non échantillonnés. La théorie du krigeage a été développée par un
mathématicien français G. Matheron, école des Mines de Paris au début des années 1960 (voir
chapitre III), à partir des travaux de l’ingénieur minier sud-africain D. G. Krige. En effet,
durant les années 50, Krige a développé une série de méthodes statistiques empiriques afin de
déterminer la distribution de minerais à partir d’un ensemble de forages. Pour rendre
hommage à D. Krige, Mathéron a nommé ce deuxième outil de la géostatistique par le
« Krigeage ». Il existe plusieurs types de krigeages, nous allons exposer, dans le cadre de ce
chapitre, le krigeage ordinaire (KO) et le krigeage simple (KS)
III.2. Le krigeage ordinaire
Le krigeage est défini comme un estimateur Y* d'une propriété Y en un point
quelconque de l'espace géographique. Cette estimation est faite à partir des observations
effectives y(x) de cette propriété. Il fournit ensuite un indicateur de la précision de l'estimation
faite à travers une variance d'estimation.
III.2.1 Aspects théoriques
L’objectif du krigeage est d’estimer la valeur de la variable régionalisée à interpoler
Y(.) en un site non échantillonné noté x0. La première étape pour atteindre ce but consiste à
déterminer le « voisinage de krigeage ». Ce voisinage se définie par le domaine du champ D
contenant x0 ainsi que les sites x1 à xn associés aux observations utilisées dans la prévision
de Y(x0). Ces sites doivent former un sous-ensemble de l’ensemble du site d’observation. Le
choix du voisinage de krigeage se base sur une certaine connaissance de la structure de
dépendance spatiale entre les observations. La taille n de ce voisinage doit cependant être
assez grande pour mener à une estimation précise.
La forme la plus simple et la plus employée de cette technique est celle du krigeage
linéaire. L'estimation y*(x0 ) faite en un point x0 par le krigeage linéaire est telle que:
n
Y * ( x0 ) = ∑ λiY ( xi )
(37)
i =1
Ou : n est le nombre expérimentaux pris en compte dans l’estimation
λi est le poids affecté au point expérimental xi
30
Plus simple, pour résoudre le système d’équation induit par la recherche des poids λi , il
faut introduire les conditions d’optimisation. Ces conditions sont les suivantes :
- non biais
E[Y * ( x ) − Y ( x )] = 0
(38)
- variance d’estimation minimale
VAR[Y * ( x) − Y ( x)]minimale
(39)
Le problème à résoudre pour estimer la valeur d'une propriété Y consiste donc à calculer le
poids λi affecté à chaque point observé.
Quand l'hypothèse intrinsèque est vérifiée (Chapitre IV), l'ajustement d'une fonction
autorisée au variogramme expérimental permet de résoudre le système défini par les équations
42, 43 et 44. De la sorte, on peut calculer les poids λi de l'équation 42 et donc la valeur de
l'estimation Y*(x0).
Le calcul du poids affecté à un point observé ne dépend pas du tout de la valeur de la
variable étudiée en ce point. Il dépend uniquement:
- de la structure spatiale de la variable révélée par le variogramme
- de la distance géographique du point observé au point à estimer.
V.2.2. Compréhension par l'exemple.
La figure 12 illustre sur un cas fictif le calcul des poids λi de l'estimation par krigeage
en relation avec des variogrammes différents.
On considère dans tous les cas:
- que le point à estimer a pour coordonnées (0,0);
- qu'on dispose de vingt points observés.
On indique, en chaque point observé, le poids qu'il prend dans l'estimation avec trois
types de variogrammes différents.
- Cas (A), le variogramme est de type pépitique indiquant une distribution aléatoire de la
variable dans l'espace. Il n'y a donc pas lieu de privilégier dans l'estimation les points
proches par rapport aux points éloignés. Les poids affectés à l'ensemble des points
observés sont donc identiques. L'estimation consiste dans ce cas à faire une moyenne
locale.
- Cas (B), le variogramme est de type linéaire croissant. Les points proches du point à
estimer sont donc beaucoup plus corrélés au point à estimer que les points éloignés. De ce
fait, les quatre points situés à une distance "1" du point à estimer sont prépondérants dans
l'estimation: ils se voient attribuer 88 % du poids total.
- Cas (C), le variogramme est de type exponentiel avec une portée de l'ordre de 2. Le poids
affecté aux points observés est donc maximal pour les points distants de "1" et minimal
31
pour ceux distants de "3". Mais pour une distance de "1", la valeur de la semi-variance est
déjà importante, de l'ordre de 75 % de celle observée au palier. Entre les distances "1" et
"3", le niveau de corrélation entre les points observés et le point à estimer varie donc
relativement peu. Ceci explique que les poids sont proches les uns des autres dans ce cas
de figure.
Figure 12. Poids affectés (* 100) aux points observés dans l'estimation par krigeage en un point de
coordonnées (0,0). Trois situations sont présentées:
A: Le variogramme est de type pépitique: λ (h ) = 0,079
B: Le variogramme est linéaire croissant:
C: Le variogramme est exponentiel:
32
λ (h ) = 0.05h
λ (h ) = 0.79 (1- exp(-h/0.7))
III.3. Le krigeage simple
Si la moyenne "m" du champ D à estimer est connue (ou du moins on en possède un
estimé fiable), on peut alors former un estimateur sans biais sans imposer la contrainte que la
somme des poids soit égale à 1.
n
Yv* − m = ∑ λi (Y i−m)
(40)
i
La variance d’estimation est donné par l’équation suivante ;
i =n j =n
i =n
i =1 j =1
i =1
σ = Var (Yv ) + ∑∑ λi λ j Cov(Yi , Y j ) − 2∑∑ λiCov(Yv , Yi )
2
e
(41)
Comme pour le krigeage ordinaire, l’idée est de choisir les λi de façon à minimiser la
variance d’estimation σ e . Pour cela, il faut trouver le minimum, on dérive
chacun des valeurs de λi et l’on pose ces dérivées partielles égales à 0.
2
σ e2
par rapport à
Il faut retenir que :
Le systeme de krigeage simple (KS) ne peut s’écrire directement en termes de
n
variogrammes puisqu’on n’a pas
∑λ
i =1
i
=1
En termes pratiques, les estimés obtenus par krigeage ordinaire (KO)
et simple (KS) sont très similaires lorsqu’on effectue le krigeage à courte
distance par rapport aux points connus et par rapport à la portée du
variogramme et que ce dernier montre une structure importante.
N.B : En règle générale, l’estimation par Krigeage ordinaire est préférable au krigeage simple
car elle beaucoup plus fiables
V.4. Propriétés du krigeage
Les principales propriétés et caractéristiques associées au krigeage sont :
- Linéaire, sans biais, à variance minimale, par construction.
- Interpolateur exact. : si l’on estime un point connu, on retrouve la valeur connue.
- Présente un effet d'écran: les points les plus près reçoivent les poids les plus
importants. Cet effet d'écran varie selon la configuration et selon le modèle de
variogramme utilisé pour le krigeage (voir exemple plus haut). Plus l'effet de pépite
est important, moins il y a d'effet d'écran.
- Tient compte de la taille du champ à estimer et de la position des points entre eux.
- Par l'utilisation du variogramme, le krigeage tient compte de la continuité du
phénomène étudié (effet de pépite, anisotropie, etc.).
- Effectue généralement un lissage, i.e. les estimations sont moins variables que les
teneurs réelles (point ou bloc) que l'on cherche à estimer.
- Transitif. Si l’on observe en un point une valeur coïncidant avec la valeur krigée pour
ce point, alors les valeurs krigées en d'autres points ne sont pas modifiées par
l'inclusion de ce nouveau point dans les krigeages. Par contre les variances de
krigeage, elles, sont diminuées. De même, si l’on krige un certain nombre de points et
que l’on utilise les valeurs krigées comme si c’étaient de nouvelles
33
V.5. La variance d'estimation
Il est indispensable de disposer d'une grandeur indiquant la précision des estimations
faites. Cette grandeur est fournie en un point x0 par la variance d'estimation
σ e2 ( x0 )
La résolution des équations (42), (43) et (44) conduit à une écriture de la variance
d'estimation telle que:
n
σ = ∑ λiγ ( xi , x0 ) + ψ
2
e
où :
(42)
i =1
x0 est le point à estimer
xi sont les points observés
λi sont les poids des points observés
γ(xi,x0) est la semi-variance entre un point observé et le point à estimer
Ψ est un multiplicateur de Lagrange
Cette écriture montre que la variance d'estimation dépend:
-
de la structure spatiale de la variable étudiée, à travers la forme générale du
variogramme. La variance d'estimation sera d'autant plus grande que le variogramme
présente des valeurs de semi-variance élevées.
-
de la distance du point à estimer aux points observés. L'estimation en un point proche
d'un point observé sera en règle générale plus précise que celle en un point très éloigné
de tout point observé.
La façon la plus simple pour interpréter la variance d'estimation σ e est la suivante :
- Si les erreurs d'estimation sont supposées normales, la connaissance de la variance
2
d'estimation σ e ( x0 ) et donc de l'écart-type d'estimation σ e ( x0 ) permet de définir
un intervalle de confiance à 95% de la vraie valeur Y(x0) d'une propriété Y en un
point x0 tel que:
2
[y*(x0) - 2
σ e ( x0 ) , y*(x0) + 2 σ e ( x0 )
]
(43)
où: y*(x0) est l'estimation par krigeage de Y au point x0.
Cet intervalle de confiance est d'abord à comparer à l'étendue générale de la variable
sur le domaine d'étude pour savoir si l'estimation effectuée présente un intérêt. Cet
intervalle de confiance doit ensuite être confronté aux exigences de précision de
l'utilisateur.
34
Exemple :
Si l'utilisateur cherche à estimer la Conductivité électrique du sol (CE) avec une précision de
± 0.1 dS/m et que l'intervalle de confiance lui indique une précision de ±0.5 dS/m, ses
exigences de précision ne sont pas satisfaites. La solution passe alors en règle générale par un
échantillonnage supplémentaire.
Cadran 2 : La variance d’estimation
En résumé, la variance d'estimation, révélatrice de la précision d'une estimation dépend de
deux grands facteurs :
- d'une part, de la structure spatiale de la propriété étudiée. La variance d'estimation est
d'autant plus faible que le variogramme présente des valeurs faibles. On conçoit en effet
intuitivement qu'il est plus facile d'avoir une estimation fiable d'une propriété qui varie peu,
que d'une propriété très chaotique.
- d'autre part, de l'échantillonnage effectué. Là encore, on conçoit que la précision d'une
estimation soit d'autant meilleure que l'échantillonnage est important.
III.6. Autres formes de krigeage.
- le krigeage-bloc est une simple extension du krigeage ordinaire ponctuel que nous avons
présenté. Au lieu de faire une estimation en un point, l'estimation porte sur la valeur moyenne
d'une propriété sur une surface. Cette technique est utilisée pour obtenir des cartes plus lissées
ou pour estimer des stocks.
- le krigeage disjonctif: l'estimation d'un point à estimer se fait par une fonction plus générale
qu'une simple combinaison linéaire des valeurs aux points observés. Cette technique permet
de tracer des cartes de probabilité qu'une variable dépasse un seuil donné. Elle est donc
souvent utilisée dans des problèmes de pollution.
- le co-krigeage: il exploite la corrélation pouvant exister entre deux variables. Il est utilisé
quand on dispose de deux variables corrélées entre elles, l'une étant difficile à acquérir (par
exemple, mesure physique de laboratoire), l'autre étant facile d'accès (par exemple,
observation de terrain). Le co-krigeage permet de cartographier une variable peu
échantillonnée en utilisant les observations plus nombreuses d'une variable facile d'accès. Un
exemple d’emploi est la cartographie d’une propriété du sol en se fondant sur ses corrélations
avec la topographie déduite d’un Modèle Numérique de Terrain.
- le krigeage d’indicatrices: permet de traiter des variables nominales ou qualitatives
ordonnées. Il s’agit d’une approche non paramétrique reposant sur une transformation
préalable de la variable étudiée en indicatrices prenant la valeur 0 ou 1 selon des seuils choisis
de la variable. Cette approche est bien adaptée au cas où l’on s’intéresse particulièrement aux
valeurs extrêmes (par exemple, valeurs élevées en cas de pollution) qui ont tendance à être
éliminées par le krigeage ordinaire.
35
III.7. La validation croisée
La validation croisée consiste à enlever un nombre de points Parmi les points
échantillonnés, pour faire la validation des méthodes de krigeage Ces points ne sont pas
introduits dans le calcul des variogrammes et d'estimation par krigeage, mais ils sont, pour
toutes les variables confondues, estimés en leurs localisations à partir d'autres points mesurés,
ce qui permet de comparer les valeurs de variables mesurées Y(.) à celles estimés Y*(.). Les
critères retenus pour cette validation sont :
• L'erreur moyenne (EM) : elle doit être proche de zéro pour qu'il n'y ait ni surestimation, ni
sous-estimation systématique. Elle est calculée par la formule suivante :
1 n
EM = ∑ (Y * ( xi ) − Y ( xi ))
(49)
n i =1
• La racine quadratique de l'erreur moyenne (RQEM) : elle est calculée par la formule (50),
autant sa valeur est faible, autant l'estimation est bonne.
RQEM =
n
1
n
∑[Y * ( x ) − Y ( x )]²
i
i =1
i
(50)
• L'erreur standardisée moyenne (ESM) : qui est le rapport entre l'écart quadratique et la
variance d'estimation, elle vérifie la précision de l'estimation de l'écart type d'estimation.
Les meilleurs résultats sont obtenus lorsque sa valeur est proche de 1.
n
1
ESM =
n
∑ [Z * ( x ) − Z ( x )]²
i =1
i
i
(51)
σ ( xi )
• La racine de l'erreur standardisée quadratique moyenne (RQESM) : on aura une sousestimation si sa valeur est inférieure à 1, et dans le cas contraire une surestimation. Elle est
calculée par la formule suivante :
n
1
RQESM =
n
∑ [Z * ( x ) − Z ( x )]²
i
i =1
σ ( xi )
i
(52)
III.8. Exercices
1. On vous présente les six profils suivants obtenus par krigeage ordinaire avec des
modèles différents et en utilisant les observations indiquées par des ∆ .
36
a) Associez à chaque modèle de variogramme le profil de krigeage correspondant (A à F)
N
Modèle
1
Sphérique C0/C = 0 ; a = 50
2
Sphérique C0/C = 0.1 ; a = 50
3
Sphérique C0/C = 1.0 ; a = 50
Figure
b) À la question précédente, seul le ratio C0/C est fourni au lieu des valeurs séparées de
C0 et C. Qu’est-ce quichange dans le krigeage si le ratio C0/C=1 est obtenu avec
C0=10,C=10 plutôt que C0=5 et C=5?
2. Dans un krigeage ponctuel,
a) Est-il possible d’avoir les poids λi , i=1...n, de krigeage simple(KS) tous égaux à zéro?
Si oui, indiquez dans quelle situation. Si non, dites pourquoi.
b) Est-il possible d’avoir les poids λi , i=1...n, de krigeage ordinaire(KO) tous égaux à
zéro? Si oui, indiquez dans quelle situation. Si non, dites pourquoi.
3. Soit les points X0 (0,1), X1 (1,0) , X2(0,0) et X3(3, 0) sur les quelles on a mesuré la
propriété Z dont les valeurs sont comme suit : Z1 = 9 ; Z2 = 9 et Z3 = 4 (voir figure cidessous
37
-
On cherche à estimer la propriété Z0 sur le point x0 (0,1)
On suppose que la variable Z possède un variogramme sphérique avec :effet de pépite
C0 =1 ; un pallier C=1 et une portée a = 3.
38
CHAPITRE IV : LE KRIGEAGE D’INDICATRICES
CHAPITRE V : RIGEAGE D’INDICATRICES
V.1. Introduction
Le krigeage d’indicatrices (KI), initié par Journel (1983), a
été développé
mathématiquement (Davis, 1984 ; Cressie, 1991 ; Bierkens et Burrough, 1993). L'idée de base
du krigeage d'indicatrices consiste à effectuer l'analyse spatiale non pas directement de la
propriété étudiée, mais des différentes fonctions dites « indicatrices » issues d'un codage
binaire de cette propriété. La transformation en une variable indicatrice avec une distribution
binaire se fait comme suit:
1 if Z(xi ) ≥ Z c
I ( xi , Z c ) = 
 0 if Z(xi ) < Zc
i = 1,......., n
(42)
Où, I (xi; Zc), est la valeur indicatrice à un emplacement xi ; Z (xi) est la valeur mesurée à un
emplacement xi, et Zc est le seuil. La valeur I (xi ; Zc), conditionnelle à n données environnant,
peut être exprimée comme suit :
E[ I ( xi ; Z c ) = Pr ob{Z ( x) ≤ Z c ] = F ( xi ; Z c )
(43)
Où, F (xi; Zc) est la fonction de distribution cumulative conditionnelle (DFCC).
La fonction « F. » représente la probabilité pour une valeur inconnue ne dépasse pas un seuil
donné Zc. Les DFCCs sont modélisés à l'aide d'une approche non paramétrique qui est le
krigeage d’indicatrices (KI).
V.2. Procédure et mise en ouvre du krigeage d’indicatrices
La procédure de mise en œuvre du krigeage d’indicatrices se fait suivant les quatre
étapes suivantes :
1. Le codage des valeurs mesurées par rapport à une valeur seuil choisie. On obtient
ainsi des variables qui sont codées soit en 0 soit en 1. Les valeurs seuils dépendent, en
général, de la distribution statistique de la variable, mais dans certains cas, les limites
de nuisance ou de toxicité (normes de potabilité d’une eau d’irrigation par exemple)
seront déterminantes pour le choix de ces seuils.
39
CHAPITRE IV : LE KRIGEAGE D’INDICATRICES
2. Le calcul du variogramme des fonctions indicatrices au seuil donné détermine la
structure spatiale.
N (h)
1
γ * (h, c) = (h) ∑[I (xi , c) − I (xi + h ± ∆h, c]2
2N i=1
(44)
ou : N(h) est le nombre de couples d’observations distants de h ±∆h
3. Après ajustement du variogramme des fonctions indicatrices à un modèle théorique,
on effectue le krigeage linéaire en un point (x0), des I (xi,c) par l’équation :
n
I * (x0 , c) = ∑λi I (xi , c)
(45)
i=1
n : le nombre de points expérimentaux pris en compte dans l’estimation
λ i : le poids affecté aux points expérimentaux
Cette dernière formule appliquée donne des valeurs comprises entre 0 et 1 qui est une
estimation en un point donné de la probabilité que la valeur Zi soit inférieure ou égale à
la valeur seuil «Zc » choisie. En combinant ces estimations, on peut obtenir en tout point
la probabilité que la variable soit égale à une valeur seuil déterminée.
4. La dernière étape consiste à estimer la valeur Z(x0) de la propriété Z en un point
quelconque x0 connaissant sa fonction de densité. Cela peut se faire par le calcul de
l’espérance mathématique de la valeur de la propriété en suivant la procédure
suivante :
(i) La différence entre les estimations des fonctions indicatrices pour deux valeurs
seuil consécutives permet de calculer la probabilité correspondant en tout point. Ces
points étant la réalisation d’une variable aléatoire discrète notée X, comme les seuils
ont été calculés aux valeurs supérieures, le calcul se fait alors :
Probabilité (X=c) = Probabilité (X ≥ Zc) – Probabilité (X ≥ Zc +1) .
(46)
avec : z c et z c +1 sont les valeurs seuil consécutives
(ii) En combinant les valeurs seuils correspondant aux différentes classes, on
obtient une version discrétisée de la fonction de répartition qui représente
40
CHAPITRE IV : LE KRIGEAGE D’INDICATRICES
l’espérance mathématique du rang du seuil de la variable au point échantillonné.
L’espérance mathématique est calculée comme suit :
E(Z) = Zc + 2Z c+1 + 3Zc+2 + 4Zc +3 + 5Z c + 4
41
(47)
CHAPITRE V : LA GEOSTATISTIQUE MULTIVARIE
CHAPITRE V : LA GEOSTATISTIQUE MULTIVARIE
V.1. Introduction
La géostatistique multipamétrique est une méthode consiste à cartographier les valeurs des
coordonnées des individus sur l'axe d'ACP1 ou AFD2 pris en considération, elle permet de
dégager un fond régional des mesures, c'est à dire la tendance en grand de la zone d'étude
(Goulard & al., 1987 ; Douaoui, 1993). Les valeurs des coordonnées seront considérées
comme étant des variables régionalisées dont on détermine leur structure spatiale par l'étude
du variogramme.
V.2. Structure des données de base
La structure des données de base est formée d’un espace géographique et d’un espace
factoriel, constituant ensemble les 348 variables régionalisées (Tab. V.1).
Tableau n° V.1. Structure des données de base relative aux variables régionalisées
Variable
régionalisée
Espace géographique
Coordonnées Lambert (m)
(n° du sondage)
Longitude (X) Latitude (Y)
294500
324250
294500
324100
323950
294500
323800
294500
.
.
.
.
.
.
324150
295625
324200
295625
324250
295625
1
2
3
4
.
.
.
346
347
348
Espace factoriel
Coordonnées des poins de sondages sur
les 3 premiers axes discriminants
1er axe
2ème axe
3ème axe
0.811
-1.232
-0.366
-0.448
0.076
0.902
0.232
-0.607
0.439
0.894
0.059
-0.208
.
.
.
.
.
.
.
.
.
-0.683
-0.783
-0.259
-0.011
-0.719
-0.789
0.197
-0.058
-0.408
Ainsi, échantillon se retrouve localisé dans ces espaces comme suit :
- par ses « coordonnées géographique » dans l’espace géographique. Ces
coordonnées permettront par la suite de déterminer les distances (h) entre les
points de sondage;
1
2
ACP : Analyse en Composante Principale (voir cours statistique appliquée)
AFD : Analyse Factorielle Discriminante (voir cours statistique appliquée)
- par sa valeur relative à sa projection dans l’un des axes factoriels issu de
l’ACP ou de l’AFD. C’est la variable qui caractérise chacun des sondages du
sol.
Comme exemple d’une variable régionalisée, celle du premier point de
sondage projeté sur le 1er axe discriminant. Elle se calcule pour les variables
réduites, de la façon suivante :
i = 11
X1 = ∑ ((mi – xi)/σi)) (ai)
où,
i=1
i : variable initiale,
xi : valeur de la variable initiale i,
σi : écart type de la variable initiale i,
mi : moyenne correspondant à la variable initiale i,
ai : vecteur propre de la variable initiale i.
X1 : valeur du premier sondage égale à sa valeur de projection sur le premier axe discriminant.
X1 = (-0.249) (-1.12) + (-0.062) (-0.623) + ……+ (-0.153) (-0.367) = -0.366
Tableau n° XXVII. Exemple de calcul d’une coordonnée de projection du premier sondage
du sol sur le premier axe discriminant.
Variables initiales
(i)
pHeau
CE
CaCO3 total
MO
A
Lf
Lg
Sf
Sg
Io
K
Variables centrées et réduites
(mi – xi)/σi)
(7.50 – 7.905) / 0.361 = -1.12
(0.81 – 3.071) / 3.62 = -0.623
(17.25 – 15.911) / 2.56 = 0.522
(2.56 – 2.695) / 0.73 = -0.184
(33.35 – 38.015) / 9.48 = -0.491
(36.00 – 32.783) / 7.39 = 0.434
(17.65 – 21.802) / 8.01 = -0.517
(11.30 – 5.378) / 6.04 = 0.980
(1.70 – 2.149) / 4.19 = -0.107
(4.16 – 4.430) / 1.03 = -0.261
(2.23 – 2.889) / 1.79 = -0.367
Vecteurs propres
(ai)
-0.249
-0.062
-0.274
0.155
-0.296
-0.359
-0.566
-0.917
-0.331
-0.029
-0.153
V.2. Analyse de la structure spatiale du premier axe discriminant
V2.1. Calcul du variogramme expérimental et théorique
Voir chapitre II
V.2.2. Modélisation du variogramme expérimental
Voir chapitre II
V.3. Interpolation par krigeage
Voir chapitre II
Un TP détaillé sera donné sur la méthode
- 43 -
- 44 -
BIBLIOGRAPHIE
BIBLIOGRAPHIE
ALLARD D. (2012). Statistiques spatiales : introduction à la géostatistique. Cours Université
Montpellier II (France). 42P.
BAJJALI W.(2018). ArcGIS for Environmentaland Water Issues. Ed. Sringer. 363p
https://doi.org/10.1007/978-3-319-61158-7
BOURENNANE H, KING D, CHERY P, BRUAND A (1996) Improving the kriging of a soil
variable using slope gradient as external drift. European Journal of Soil Science 47, 473-483.
BOURGAULT G, JOURNEL AG, RHOADES LI, CORWIN DL, LESH SM (1997)
Geostatistical analysis of a soil salinity data set. Advances in Agronomy 58, 241- 292.
BOSSER P. (2012). Interpolation Spatiale. Cours de l’Ecole Nationale Des Sciences Géographiques
(ENSG)- France. 53P
BURGESS T.M. et WEBSTER R. (1980a) - Optimal interpolation and isarithmic mapping of soil
properties. I. The semi-variogram and punctual kriging. J. of Soil Sci., 31: 315-331
BURGESS T.M. et WEBSTER R. (1980b) - Optimal interpolation and isarithmic mapping of soil
properties. II.Block kriging. J. of Soil Sci., 31: 333-341
BURGESS T.M., WEBSTER R. et McBRATNEY A.B. (1981) - Optimal interpolation and
isarithmic mapping of soil properties. IV. Sampling strategy. J. of Soil Sci., 32: 643-659
BURROUGH P., MCDONNELL R.
Oxford University Press, 194 p.
(1998) Principles of Geographical Information Systems,
CRESSIE N. (1991) - Statistics for spatial data. Wiley Series in Probability and Mathematical
Statistics. John Wiley and Sons, 900 p.
DELHOMME J.P. 1976. Application de la théorie de la variable régionalisée dans la science de l'eau.
Thèse Doc. Ing.. ENSM de Paris. 130P
DOUAOUI A., 1993. Variabilité spatiale de quelques propriétés physico-chimiques des sols du moyen Chéliff,
incidences cartographique. Thèse Magist., INA Alger. PP 22 – 97
ESRI (2014). Geostatistical Analyst Tutorial.
GASCUEL-ODOUX C., BOIVIN P. et WALTER C. (1994) - Eléments de géostatistique. In
Laudelout H., Cheverry C. et Calvet R., «Modélisation mathématique des processus
pédologiques », Actes Editions, Manuels Scientifiques et Techniques, 217-248.
GOOVAERTS P. (1999) Geostatistics in soil science: state-of-the-art and perspectives. Geoderma 89,
1-46.
62
BIBLIOGRAPHIE
GOOVAERTS, P. 1997. Geostatistics for natural resources evaluation. Oxford University Press New
York, 483 p.
JOURNEL A.G., 1977. Géostatistique minière. Centre de géostatistique. Ecole des mines;
Fontainebleu. 737 P
MARSMAN B.A. et GRUIJTER De J.J (1986) - Quality of soil maps. A comparison of soil survey
methods in a sandy area. Soil Survey Papers n° 15, Stiboka, Wageningen
MATHERON G. (1965) - Les variables régionalisées et leur estimation. Paris. MASSON 305 p.
McBRATNEY A.B. et WEBSTER R. (1981a) - The design of optimal sampling schemes for local
estimation and mapping of regionalized variables. I. Theory and method. Computers and
Geosciences, Vol.7(4), 331-334.
MYERS J. 1997 Geostatistical Error Management (GEM). Quantifying Uncertainty For
Environmental Sampling and Mapping. Van Nostrand Reinhold, New York, 571 p.
OLEA R. (1999) Geostatistics for Engineers and Earth Scientists. Kluwer, 328 p.
OLIVER M.A. et WEBSTER R. (2015). Basic Steps in Geostatistics: The Variogram and Kriging.
Ed. Springer. DOI 10.1007/978-3-319-15865-5
ROUSSON V. (2013). Statistique appliquée aux sciences de la vie. Ed.,SBN 978-2-8178-0393-7
Springer Paris Berlin Heidelberg New York. 327P
SAMARA D.D. (2002).Geostatistics with Applications In Earth Sciences, Second Edition. Ed.
Springer. ISBN 978-1-4020-9380-7 (e-book). 220p
WACKERNAGEL H. (1995) ‘Multivariate geostatistics: An introduction with applications’.
(Springer Verlag, Berlin), 256 p.
WEBSTER R. et OLIVER M.A. (1990) - Statistical methods in soil and land resource survey.
Spatial Information Systems, Oxford University Press, 316 p.
SITES WEBS
DES LOGICIELS ET APPRENTISSAGE
- En perpétuel renouvellement, voir le site AI-GEOSTAT : http://www.ai-geostats.org/
SITES INTERNET
- du Centre de Géostatistique de l’Ecole des Mines : http://www.cg.ensmp.fr/
- du Stanford Center for Reservoir Forecasting : http://ekofisk.stanford.edu/SCRF.html
- de la liste AI-GEOSTAT : http://www.ai-geostats.org/
- de la revue Computer and Geosciences : http://www.iamg.org/candg.html
- du
Centre
d’Agriculture
de
Précision
de
l’Université
de
Sydney :
http://www.usyd.edu.au/su/agric/acpa/
63
Téléchargement