- Géostatistique intrinsèque
-
La géostatistique intrinsèque est la branche de la géostatistique qui étudie une variable régionalisée en la considération comme réalisation d'une fonction aléatoire. Ce passage est nommé modèle topo-probabiliste.
Ce passage n'est pas trivial. En effet, le phénomène physique étudié est le plus généralement unique. La géostatistique intrinsèque nécessite de déduire un modèle probabiliste à partir d'une seule de ses réalisations. On parle de randomisation ou d'immersion probabiliste.
Sommaire
- 1 Notations
- 2 Concepts et propriétés utilisés
- 3 Géostatistique linéaire (cas stationnaire ou intrinsèque)
- 4 Géostatistique non-stationnaire
- 5 Notes et références
- 6 Annexes
Notations
Les notations usuelles sont :
- S le champ de la variable régionalisée étudiée
- x le point courant de l'espace de travail
- z la variable régionalisée étudiée
- Z la fonction aléatoire associée
Dans la suite, on travaillera généralement à support borné.
La variable régionalisée z est réalisation de la fonction aléatoire Z pour un événement ω0, soit z(x) = Z(x,ω0). L'usage est de ne pas noter l'événement dans les expressions.
On notera également, pour une fonction aléatoire Z, sa moyenne sur un domaine v (sous-ensemble de S) :
où est la mesure du domaine vConcepts et propriétés utilisés
La stationnarité d'une fonction aléatoire (sous ces deux formes ci-dessous) est une propriété, réalisée ou non. Par contre, la stationnarité de la variable régionalisée est une notion empirique et approximative, qui dépend du domaine et de l'échelle de travail.
On peut également exiger la stationnarité locale, c'est-à-dire que la fonction doit, en tout point, être stationnaire sur un voisinage de ce point (voisinage glissant indépendant du point[Pourquoi ?]).
Stationnarité au sens strict
La stationnarité d'une loi est son invariance par translation. La loi spatiale d'un multiplet quelconque de points (de dimensions et orientation fixées) ne dépend pas de l'implantation de ce multiplet. Cette hypothèse n'est généralement pas faite, et est remplacée par la stationnarité d'ordre 2.
Stationnarité d'ordre 2
La stationnarité est une propriété extrêmement forte. C'est pourquoi on lui préfère souvent la stationnarité d'ordre 2, qui requiert que les espérances des valeurs ponctuelles et des doublets de points de processus existent et soient invariantes par translation. Par rapport à la définition stricte, celle-ci ne concerne que les lois au plus bivariables, cependant elle exige l'existence des moments d'ordre 1 et 2 sur les valeurs ponctuelles.
Par abus de langage, cette propriété est souvent appelée « stationnarité », et la précédente « stationnarité stricte ».
En géostatistique, la stationnarité d'ordre 2 est généralement supposée a priori, le géostatisticien contrôle a posteriori que cette hypothèse est raisonnable.
La stationnarité est utilisée lors de l'écriture de la covariance entre deux points comme fonction de leur différence : .
Problèmes globaux et locaux
Un problème est dit global s'il met en jeu la totalité du champ de la variable régionalisée étudiée. Il dépend à la fois de la structure intrinsèque de la variable régionalisée et de la géométrie du champ d'étude. Un tel problème se traite par la géostatistique transitive. Il est alors demandé l'homogénéité spatiale de l'implantation des données. Dans ce cas, on pourra distinguer le problème d'estimation (qui ne nécessite pas la stationnarité de la variable régionalisée, et se résout à l'aide du comportement à l'origine du coviariogramme transitif), et le problème d'interprétation structurale sur la variable régionalisée (où les effets de la variable régionalisée et du champ d'étude doivent être séparés).
Un problème est dit local s'il se pose dans le voisinage d'un point d'étude. Sous la mème contrainte d'homogénéité de la répartition de l'information, on construira alors des estimateurs linéaires invariants par translations; la stationnarité est celle de l'estimateur, non celle du phénomène physique.
En outre, l'hypothèse de stationnarité peut être prise comme locale : il existe un voisinage glissant V tel que pour x,y∈V, on se trouve dans le cas stationnaire. On distinguera donc local et localisé.
Hypothèse intrinsèque
Une fonction aléatoire Z est dite intrinsèque si ses accroissements Z(x)-Z(y) sont stationnaires d'ordre 2. Il existe alors deux fonctions:
- une dérive, fonction linéaire . Une fonction aléatoire intrinsèque sans dérive est telle que m(h)=0;
- un demi-variogramme, ou variogramme , et dans le cas sans dérive .
Une fonction aléatoire intrinsèque non stationnaire d'ordre 2 est dite strictement intrinsèque.
Ergodicité
La stationnarité n'entraîne pas l'ergodicité.
On demande généralement au processus stationnaire Z de satisfaire l'hypothèse d'ergodicité : L'expression , lorsque les domaines S tendent vers l'infini, tend vers l'espérance mathématique .
avec K(h) le covariogramme géométrique de S et σ(h) la covariance centrée de Z.
En pratique S ne peut tendre vers l'infini. On dira que plus Var[M*] est faible, plus m présente de signification objective. Asymptotiquement, on aura : où est la portée intégrale, qui a la dimension de l'espace (aire dans ℝ2).
Tout se passe comme si l'estimateur M* était obtenu en prenant la moyenne de N=S/A variables indépendantes de variance σ(0). Plus N est grand, plus le paramètre présente de signification objective. Par conséquent, on peut supposer l'hypothèse d'ergodicité si S est grand par rapport à A.
De plus, soit un support s suffisamment grand par rapport à A. On peut écrire . On peut contrôler si le modèle est correct en estimant la validité de la relation .
Il existe également des modèles théoriques de portée intégrale infinie, à éviter.
Échelle de travail
L'échelle de travail est totalement absente du formalisme probabiliste, néanmoins elle détermine la manière dont le géostatisticien contrôlera a posteriori les hypothèses de stationnarité et d'ergodicité.
Géostatistique linéaire (cas stationnaire ou intrinsèque)
La géostatistique linéaire est la partie de la géostatistique intrinsèque qui étudie des combinaisons linéaires de la fonction aléatoire Z considérée, qui sera prise dans la suite comme stationnaire d'ordre 2. Une telle fonction aléatoire est décrite par sa loi spatiale pour tout n-uplet de points :
En pratique, la loi spatiale est trop riche, c'est pourquoi ou se limite à la manipulation des deux premiers moments de la fonction aléatoire :
(covariance centrée)
Les espérances seront utilisées pour définir la valeur des estimateurs qui seront utilisés, et les variances comme critères de qualité de ces estimateurs[1].
Cette restriction impose de n'utiliser que des combinaisons linéaires de la fonction aléatoire étudiée, seules expressions dont on saura fournir une espérance et une variance. Une conséquence est qu'il faudra travailler sur des variables régionalisées additives (c'est-à-dire telles que toute combinaison linéaire de cette variable ait le même sens physique que la variable ponctuelle).
Malgré ces restrictions, la géostatistique linéaire possède les avantages suivants : elle est simple à mettre en œuvre, et c'est souvent la seule approche possible.
Combinaisons linéaires autorisées
Une combinaison linéaire de la fonction aléatoire est . Une mesure sur la fonction aléatoire est .
Une combinaison linéaire (respectivement une mesure) est dite autorisée (en abrégé, CLA) si son espérance et sa variance sont finies.
Cas stationnaire d'ordre 2
Dans le cadre d'une fonction aléatoire stationnaire d'ordre 2, toutes les mesures sont autorisées, toutes les combinaisons linéaires sont autorisées et stationnaires. Dans ce cas, les deux premiers moments s'écrivent :
De plus, dans les hypothèses présentes, on peut simplifier l'écriture des moments : constant dans l'espace</math>
avec h = x − yLa covariance stationnaire a les propriétés de symétrie, d'inégalité de Schwarz, de positivité. De plus, son comportement à l'origine est lié aux caractères de contiuité ou de dérivabilité en moyenne quadratique de la fonction aléatoire. Par contre, à la différence du covariogramme transitif, C(h) peut ne pas être identiquement nul au-delà d'une certaine valeur de h. Son intégrale ∫ C(h)dh n'est non plus pas forcément définie.
Cas intrinsèque
Dans l'hypothèse intrinsèque, les CLA exactement les combinaisons d'accroissement (du type ), c'est-à-dire les mesures de poids total nul : λ(dt) telles que ∫λ(dt)=0. La valeur ponctuelle elle-même n'est pas une CLA.
L'espérance d'une CLA dans le cas intrinsèque sans dérive est nulle. Sa variance s'obtient comme s'il existait une covariance égale à l'opposé du variogramme : . Cela reste vrai si le variogramme n'est pas stationnaire.
Variance d'extension
Cas stationnaire d'ordre 2
Soit un domaine borné v. On posera la variable aléatoire suivante, moyenne spatiale de la fonction aléatoire étudiée :
où [v] est la mesure du domaine vLa variance de Z(v) s'écrit:
, qui est la version continue d'une variance de CLAPosons maintenant deux domaines v et v′. Comme , Z(v′) est un estimateur sans biais de Z(v). On appelle variance d'extension de v à v′ la variance de l'erreur d'estimation :
On écrit alors:
La variance d'extension est invariante par translation identique des deux domaines v et v′ ; c'est donc une caractéristique non-locale du modèle. Dans le cas où v′ est un ensemble fini de points Z(xi), on parle de variance d'estimation de v par les prélèvements Z(xi). Cependant, n'est pas une variance conditionnelle, puisque la quantité à estimer et l'estimateur y jouent un rôle symétrique. De plus, on ne peut pas en déduire d'intervalle de confiance.
Historiquement, la géostatistique s'est développé initialement pour expliquer les comportements de la variance de dispersion, ce que ne faisait pas la statistique classique.
Cas intrinsèque
On vérifie aisément que Z(v)-Z(v′) est une CLA. Alors .
On retrouve en cas particulier : .
Dispersion statistique
Cas stationnaire d'ordre 2
Soit un domaine V de l'espace de travail et une partition de V en N sous-domaines vi identiques entre eux à une translation près. Nous poserons Z et z'i les moyennes respectivement sur V et sur vi de z(x). On généralise le concept de dispersion (ou variance) grâce à la dispersion statistique de v dans V, donnée par :
, où l'on retrouve la variance statistique pour un domaine v = {x} ponctuel.Par immersion probabiliste, on définit une nouvelle variable aléatoire S2(v|V):
On définit la variance de dispersion de v dans V comme l'espérance mathématique de S2(v|V), et on la note σ2(v|V).
La variance de dispersion peut également s'écrire sans contrainte de partition (et même quand v est un sur-ensemble de V, auquel cas elle est négative) :
On définit également la covariance de dispersion de v et v′ dans V :
On a également:
Il existe des phénomènes où s2(v croît indéfiniment lorsque V croît. Cela oblige à proposer le cas échéant un modèle sans variance a priori.
Cas intrinsèque
On a alors : . En particulier,
Formule de Krige
La formule de Krige (également, de manière ambiguë, relation d'additivité), s'écrit :
pour trois ensembles quelconques v, V, W (cas particulier)Représentation glissante
La représentation glissante d'une variable régionalisée z S0 est la fonction aléatoire Z définie par : où u est le point aléatoire uniforme sur S0.
En posant en outre la grandeur régionale suivante, qui est covariance de Z :
avecRégularisation
La régularisation d'une variable aléatoire est sa pondération par une mesure. Soit p(dt) une mesure supposée normée (∫p(dt)=1), on écrit la régularisée:
Zp est une intégrale stochastique, définie, dans le cas stationnaire d'ordre 2, ssi .
En cas d'existence, Zp est stationnaire d'ordre 2 et de covariance .
Cela reste vrai en hypothèse intrinsèque stricte, en remplaçant alors C(·) par γ(∞)−γ(·).
Changement de support
Soit v un support quelconque, vx sont translaté d'un vecteur x : . Le variogramme de Z(vx) vaut : car on reconnaît une variance d'extension (les deux derniers termes sont égaux, le premier indépendant de x)
Dans l'hypothèse stationnaire d'ordre 2, avec des notations similaires,
Géostatistique non-stationnaire
Dans cette partie, nous étudions les modèles locaux de non-stationnarité.
Deux techniques permettent de se rammener à une situation stationnaire:
- Krigeage universel : séparation du phénomène en deux composantes;
- géostatistique intrinsèque par les FAI-k: transformation du phénomène en phénomène stationnaire.
Notes et références
- On aurait pu imaginer des estimateurs fondés sur la médiane, le maximum de vraisemblance, ou des critères basés sur des intervalles de confiance, mais les outils et le modèle dépassent alors le cadre de la géostatistique linéaire. D'autre part, la géostatistique linéaire est d'autant mieux adaptée à une étude que la fonction aléatoire traitée est proche d'une gaussienne
Annexes
Articles connexes
Bibliographie
- (fr) Pierre Chauvet, Aide-mémoire de Géostatistique linéaire, École des Mines de Paris, 1999
- Portail des probabilités et des statistiques
- Portail de l’information géographique
- Portail de la géologie
Wikimedia Foundation. 2010.