Krigeage

Krigeage

Le krigeage est une méthode d’estimation issue de la géostatistique. Le terme krigeage, provient du nom de famille de l'ingénieur minier sud-africain Daniel Gerhardus Krige[1]. Il a été formalisé pour la prospection minière par Georges Matheron[2] (1930-2000) à l'École des Mines de Paris. Depuis, le domaine de ses applications a largement été étendu, touchant notamment la météorologie, les sciences de l’environnement et l’électromagnétisme.

Le krigeage est donc une méthode d'interpolation spatiale, parfois considérée comme la plus juste d'un point de vue statistique, qui permet une estimation linéaire basée sur l'espérance mathématique et aussi sur la variance de la donnée spatialisée. À ce titre, le krigeage se base sur le calcul, l'interprétation et la modélisation du variogramme, qui est une appréciation de la variance en fonction de la distance entre données.

Cette méthode d'interpolation se distingues d'autres méthodes (distance inverse, polygonation de Thiessen, estimation par noyau, etc.) car elle présente deux avantages. Tout d'abord, le krigeage est le meilleur prédicteur linéaire non-biaisé : les moyennes sont identiques et la variance minimale entre Z0 et Z0p. Ensuite, le krigeage se base sur une méthode objective[3].

Plus simplement et pour tout le monde, le krigeage est un outil mathématique permettant d'éliminer dans une série statistique les "aberrations", les valeurs relevées improbables, ou incohérentes, en se basant sur la valeur des données avoisinantes. Cette méthode est utilisé par Météo France par exemple pour éliminer les valeurs de températures absurdes (défaillance matérielle, feu de poubelle à côté, etc.) en comparant les données de la station en question à celles des stations avoisinantes. Mais cela pose bien sûr le problème du nivellement de la donnée pour qu'elle soit cohérente, alors que il y avait réellement à cet endroit là une température exceptionnelle...

Le krigeage s'est décliné sous plusieurs formes (simple, ordinaire, …) qui toutes utilisent les mêmes principes.

Sommaire

Notations utilisées

  • Q une quantité (définie de manière quelconque) à estimer en un point;
  • Q* l'estimateur de krigeage de Q en ce point;
  • Z la fonction aléatoire étudiée;
  • K, m sa covariance et son espérance;
  • n le nombre de points de mesure;
  • x0 le point d'estimation;
  • xi, i=1…n les points de mesure;
  • * l'opérateur d'estimation par krigeage; ainsi Z* est l'estimateur de krigeage de Z;
  • Z*0 la valeur estimée en x0 par le krigeage considéré;
  • Zi, i=1…n les données, connues aux points de mesure xi;
  • λi le poids affecté par le krigeage à la valeur en xi;
  • μ le paramètre de Lagrange utilisé dans le krigeage;
  • γi,j la valeur du variogramme γ pour une distance |xi-xj|;
  • Ki,j la valeur de la covariance K pour une distance |xi-xj|;

Contraintes d'un krigeage

La définition de l'estimateur d'un krigeage est basée sur quatre contraintes successives. Celles-ci sont définies de manière identique dans toutes les variantes de krigeage. La suite détaille les quatre étapes de construction d'un estimateur Q* pour une quantité à estimer Q.

Linéarité

Ce choix provient d'un souci de réalisme. On pose que la quantité à estimer est une fonctionnelle linéaire de la fonction aléatoire étudiée (dans le cas général: \scriptstyle Q=\int Z(x)p(\operatorname dx)); le cas contraire (problèmes de coupure et de sélection, …) relève de la géostatistique non linéaire.

L'estimateur est posé comme combinaison linéaire des données, de poids inconnus pour l'instant : \scriptstyle Q^*=\sum_i \lambda_i Z_i

Autorisation

L'erreur d'estimation doit être une combinaison linéaire autorisée, c'est-à-dire que son espérance et sa variance doivent être définies.

La condition d'autorisation s'écrit différemment selon le modèle sous-jacent supposé (on supposera toujours le support borné).

  • Dans le modèle stationnaire d'ordre 2, toutes les combinaisons linéaires sont autorisées, et il n'y a pas de contrainte.
  • Par contre, dans le modèle intrinsèque, une combinaison linéaire est autorisée si et seulement si son poids total est nul :\scriptstyle\sum_i \lambda_i=0

Universalité

On exige de l'estimateur qu'il ne présente pas de biais statistique par rapport à la quantité à estimer. Cette contrainte peut être nommée contrainte de non-biais ou d'espérance nulle. Elle s'écrit :\scriptstyle\mathbf E \left[ Q^* - Q \right] = 0

Optimalité

On demande à l'erreur d'estimation d'être de variance minimale, sous les contraintes précédentes. Sauf cas particuliers, il y existe une solution unique \scriptstyle \left\{\lambda_i\right\}_{i=1..n} à ce problème d'estimation.

Le résultat de ces quatre contraintes est, dans le cas général, un système de Cramer, qui admet une solution et une seule.

On peut étendre cette démarche dans le cas continu en considérant non des pondérations λi mais des mesures λ(dx).

Krigeages ponctuels

Krigeage stationnaire à moyenne connue (krigeage simple)

Soit Z stationnaire d'ordre 2, K la covariance et m l'espérance de Z, supposées connues. On suppose sans perte m=0. On cherche le krigeage de Z en un point.

  1. Par linéarité, le problème devient la recherche des poids λi, dépendants du point d'estimation, tels que \scriptstyle Z^*_0=\sum_i\lambda_iZ_i;
  2. L'autorisation est assurée dans le cas stationnaire;
  3. L'universalité est assurée par hypothèse : \scriptstyle \mathbf E\left[Z_0\right]=E\left[Z_i\right]=0;
  4. L'optimalité suppose : \scriptstyle \forall i, \sum_j\lambda_jK_{i,j}=K_{i,0}


Le système de krigeage simple s'écrit matriciellement :
\begin{cases}\mathbf K\mathbf\lambda=\mathbf K_0\\ Z^*_0=\mathbf\lambda^{\operatorname T}\,\mathbf Z\end{cases}\mathrm{,~avec~}\mathbf K =\begin{pmatrix} K_{1,1} & \cdots & K_{1,n} \\ \vdots & \ddots & \vdots \\ K_{n,1} & \cdots & K_{n,n} \end{pmatrix}\mathrm{,~} \mathbf\lambda= \begin{pmatrix} \lambda_1 \\ \vdots \\ \lambda_n\end{pmatrix}\mathrm{,~}  \mathbf K_0 =  \begin{pmatrix} K_{1,0} \\ \vdots \\ K_{n,0}\end{pmatrix} \mathrm{,~}\mathbf Z=\begin{pmatrix}Z_1 \\ \vdots \\ Z_n\end{pmatrix}

La variance d'estimation en krigeage simple est
{\sigma_{\mathrm S}}^2= K_{0,0}-\sum_i\lambda_iK_{0,i}

Krigeage stationnaire à moyenne inconnue (krigeage ordinaire, 1)

L'espérance m est supposée inconnue (mais définie).

  1. La linéarité donne \scriptstyle Z^*_0=\sum_i\lambda_iZ_i;
  2. L'autorisation est assurée dans le cas stationnaire;
  3. L'universalité ne permet pas de supposer m=0, et donne \scriptstyle \sum_i \lambda_i=1;
  4. L'optimalité est réalisée par la méthode du multiplicateur de Lagrange. Soit μ ce paramètre, on obtient le système de krigeage :

\begin{cases} \begin{align} \sum_j\lambda_jK_{i,j}+\mu&=K_{i,0}& \forall i\\ \sum_j\lambda_j&=1\end{align}\end{cases}

Le système de krigeage ordinaire s'écrit matriciellement :
\begin{cases}\mathbf { K}\mathbf{\lambda}={\mathbf K}_0\\ {Z}^*_0=\mathbf\lambda^{\operatorname T}\,\mathbf Z\end{cases}\mathrm{,~avec~}\mathbf K =\begin{pmatrix} K_{1,1} & \cdots & K_{1,n} & 1 \\ \vdots & \ddots & \vdots & \vdots \\ K_{n,1} & \cdots & K_{n,n} & 1 \\ 1 & \cdots & 1 & 0 \end{pmatrix}\mathrm{,~} \mathbf\lambda= \begin{pmatrix} \lambda_1 \\ \vdots \\ \lambda_n \\ \mu \end{pmatrix}\mathrm{,~}  \mathbf K_0 =  \begin{pmatrix} K_{1,0} \\ \vdots \\ K_{n,0} \\ 1 \end{pmatrix} \mathrm{,~}\mathbf Z=\begin{pmatrix}Z_1 \\ \vdots \\ Z_n \\ 0\end{pmatrix}


La variance d'estimation en krigeage ordinaire est
{\sigma_{\mathrm O}}^2= K_{0,0}-\sum_i\lambda_iK_{0,i}-\mu

On peut utiliser la même démarche pour évaluer l'espérance inconnue. Soit son estimateur M*.

  1. La linéarité donne \scriptstyle M^*=\sum_i\lambda_iZ_i
  2. L'autorisation est assurée
  3. L'universalité impose \scriptstyle m\left(\sum_i\lambda_i-1\right)=0 \forall m, donc \scriptstyle \sum_i\lambda_i=1
  4. L'optimalité se résout par multiplicateur de Lagrange (noté μM)en le système:

\begin{cases} \begin{align} \sum_j\lambda_jK_{i,j}+\mu_{\mathrm M}&=0& \forall i\\ \sum_j\lambda_j&=1\end{align}\end{cases}

La variance de l'évaluation de la moyenne est donc
{\sigma_{\mathrm M}}^2=-\mu_{\mathrm M}

Krigeage strictement intrinsèque ( krigeage ordinaire, 2)

Soit Z strictement intrinsèque sans dérive.


  1. La linéarité donne \scriptstyle Z^*_0=\sum_i\lambda_iZ_i;
  2. L'autorisation, dans le modèle intrinsèque, donne \scriptstyle \sum_i\lambda_i=1
  3. L'universalité est respectée, car une combinaison linéaire autorisée dans le modèle intrinsèque sans dérive est d'espérance nulle
  4. L'optimalité nécessite \scriptstyle \mathbf{Var}\left[\sum_i\lambda_iZ_i-Z_0\right]=-\sum_{i,j}\lambda_i\gamma_{i,j}\lambda_j+2\sum_i\lambda_i\gamma_{i,j}

Ce cas est identique au précédent, écrit en variogramme:
\begin{cases} \begin{align} -\sum_j\lambda_j\gamma_{i,j}+\mu&=-\gamma_{i,0}& \forall i\\ \sum_j\lambda_j&=1\end{align}\end{cases}

La variance d'estimation en krigeage ordinaire est encore
{\sigma_{\mathrm O}}^2= -\sum_i\lambda_i\gamma_{0,i}-\mu

Krigeage universel

Le modèle supposé est Z(x)=Y(x)+m(x), comportant une dérive m(x) déterministe et un résidu Y(x) voulu stationnaire (résidu vrai), et d'espérance nulle. La difficulté est de séparer les deux composantes m et y dans la variable régionalisée z.Cette dichotomie peut représenter une opposition explicative entre basses et hautes fréquences, entre tendance régionale et anomalies.

La dérive est supposée décomposable selon un nombre connu de fonctions de base \scriptstyle m(x)=\sum_la_lf_l(x), généralement des monômes des coordonnées, avec f0=1 la fonction constante unité. Les coefficients al sont inconnus. Cependant le modèle de dérive fourni par les algorithmes n'est pas forcément une tendance du phénomène, mais une approximation à l'échelle de travail.

Les hypothèses sur le résidu Y sont appelés sous-jacents sur Z.

Krigeage universel à modèle sous-jacent stationnaire d'ordre 2

Ce modèle est interprétable comme ayant une force de rappel autour de la dérive. La covariance est posée \scriptstyle K_{a,b}=\mathbf{Cov}\left[Z(a),Z(b)\right]=\mathbf{Cov}\left[Y(a),Y(b)\right].

On notera \scriptstyle f_{li} la valeur de fl au point xi, pour i=0…n.

  1. La linéarité donne \scriptstyle Z_0^*=\sum_iZ_i
  2. L'autorisation est assurée
  3. L'universalité impose \scriptstyle a_l\left(\sum_i\lambda_if_{li}-f_{l0}\right) avec al inconnus, d'où \scriptstyle \sum_i\lambda_if_{li}-f_{l0}=0, \forall l
  4. L'optimalité introduit les multiplicateurs de Lagrange μl; les conditions d'optimalité s'écrivent : \scriptstyle \sum_j\lambda_jK_{i,j}+\mu_lf_{li}=K_{i,0}, \forall i

Sous forme matricielle, le krigeage universel s'écrit:
\begin{pmatrix} K_{i,j} & f_{li} \\ f_{li} & \mathit{0}\end{pmatrix}\begin{pmatrix}\lambda_j \\ \mu_l\end{pmatrix}=\begin{pmatrix}K_{i,0} \\ f_{l0}\end{pmatrix}

La variance d'estimation est:
{\sigma_{\mathrm U}}^2=K_{0,0}-\sum_i\lambda_iK_{i,0}-\sum_l\mu_lf_{l0}

Krigeage universel à modèle sous-jacent intrinsèque strict

On suppose Y intrinsèque stricte sans dérive (la dérive étant intégrée à m).

  1. La linéarité pose \scriptstyle Z_0^*=\sum_i\lambda_iZ_i
  2. L'autorisation impose \scriptstyle \sum_i\lambda_i=1
  3. L'universalité impose \scriptstyle \sum_i\lambda_if_{li}-f_{l0}=0, \forall l\ne 0
  4. L'optimalité introduit un multiplicateur de Lagrange μ0 pour la contrainte d'autorisation, et d'autres μl,l≠0 pour les contraintes d'universalité

Le système de krigeage s'écrit :
\begin{cases}\begin{align}& -\sum_j\lambda_j\gamma_{i,j}+\mu_0+\sum_{l\ne0}\mu_lf_{li}& =-\gamma_{i0}, &\forall i \\ & \sum_j\lambda_j & =1 \\ & \sum_j\lambda_jf_{lj}& =f_{l0}, &\forall l\ne0\end{align}\end{cases}

Soit matriciellement:

\begin{pmatrix}-\gamma_{i,j} & \mathit{1} & f_{li} \\ \mathit{1} & 0 & \mathit{0} \\ f_{lj} & \mathit{0} & \mathit{0}\end{pmatrix}\begin{pmatrix}\lambda_j \\ \mu_0 \\ \mu_l\end{pmatrix}=\begin{pmatrix}-\gamma_{i,0} \\ 1 \\ f_{l0}\end{pmatrix}


La variance d'estimation est:
{\sigma_{\mathrm U}}^2=\sum_i\lambda_i\gamma_{i,0}-\mu_0-\sum_{l\ne0}\mu_lf_{l0}

Le résultat est identique au cas précédent, cependant la situation physique n'est pas la même : ici, le phénomène peut admettre un variogramme sans palier, c'est-à-dire sans force de rappel.

Évaluation de la dérive

Les calculs précédents ont supposé une dérive m déterministe, connue et régulière.


En modèle sous-jacent stationnaire, posons un estimateur linéaire de la dérive : \scriptstyle M^*(x)=\sum_i\lambda_iZ_i. Les λi sont solutions du système :
\begin{cases}\begin{align}&\sum_j\lambda_jK_{i,j}+\sum_l\mu_lf_{li}&=0, &\forall i \\ &\sum_j\lambda_jf_{lj}&=f_{l0}, &\forall l\end{align}\end{cases}

Et la variance d'estimation en est : \scriptstyle {\sigma_{\mathrm D}}^2=-\sum_l\mu_lf_{l0}

En modèle sous-jacent intrinsèque strict, les contraintes d'autorisation et d'universalité sont incompatibles ; l'estimation optimale de la dérive est impossible.

Évaluation des coefficients de la dérive

Variogramme des résidus

Krigeage intrinsèque (FAI-k)

On suppose ici que Z est une FAI-k, k étant une valeur donnée.

Le système de krigeage intrinsèque s'écrit :
\begin{cases} \begin{align} \sum_j\lambda_jK_{i,j}+\sum_l\mu_lf_{l_i}&=K_{i,0}& \forall i\\ \sum_j\lambda_jf_{l_j}&=f_{l_0} & \forall l\end{align}\end{cases}

La variance d'estimation en krigeage intrinsèque est
{\sigma_{\mathrm I}}^2= K_{0,0}-\sum_i\lambda_iK_{0,i}-\sum_l\mu_lf_{l_0}

On dispose des propriétés suivantes :

  • superposition des figures de krigeage: soit un opérateur linéaire Φ, alors Φ*(Z)=Φ(Z*). On peut écrire \scriptstyle \Phi^*\left(Z\right)=\sum_j\lambda_{\Phi j}Z_j avec \scriptstyle \lambda_{\Phi j}=\int\lambda_j\left(x\right)\Phi\left(\operatorname dx\right)
  • orthogonalité : soit ν une combinaison linéaire autorisée (\scriptstyle \sum_i\nu_if_{l_i}=0), soit Φ une forme linéaire, alors \scriptstyle \mathrm{Cov}\left[\Phi(Z)-\Phi^*(Z)\sum_i\nu_iZ_i\right]=0
  • lissage : la variance de Z* n'est pas définie. Soit Φ une forme linéaire telle que \scriptstyle \int f_l(t)\Phi(\operatorname dt)=0, alors la variance de l'estimateur est inférieure à celle de la forme linéaire (\scriptstyle \mathrm{Var}[\Phi^*(Z)]\le \mathrm{Var}[\Phi(Z)]) ; de plus elle n'est pas stationnaire (pas invariante pour une translation de Φ).

Propriétés du krigeage

  • C'est un interpolateur exact : si le point d'estimation est un point de donnée, le krigeage renvoie la donnée en ce point.
  • C'est une opération linéaire : le krigeage d'une combinaison linéaire est la combinaison linéaire des krigeages, à condition d'utiliser le même jeu de données (théorème de superposition des figures de krigeage).
    • Le krigeage sur deux domaines disjoints est la somme des krigeages sur ces domaines.
    • La moyenne estimée sur un domaine est la moyenne des krigeages ponctuels sur ce domaine.
    • Le krigeage d'une convoluée est la convoluée des krigeages ponctuels \scriptstyle \left[\int p(\mathrm dx)Z(X)\right]^*=\int p(\mathrm dx)Z^*(x).
    • le krigeage d'une dérivée est la dérivée du krigeage.
  • Le krigeage lisse la fonction étudiée.
  • Indépendance linéaire des fonctions de base sur les données : une condition nécessaire de régularité du système de krigeage universel est que les fli n'admettent pas de combinaison linéaire nulle non triviale (\scriptstyle \left(\forall i, \sum_lc_lf_{li}=0\right)  \Rightarrow \left(\forall l, c_l=0\right)).
  • Les pondérateurs sont invariants par multiplication de la fonction structurale : si l'on multiplie la covariance ou le variogramme par ω, les λi restent constants (mais les μl en krigeage universel sont divisés par ω). La variance de krigeage est multipliée par ω.
  • Orthogonalité: rappelons que deux variables aléatoires sont dites orthogonales si leur covariance est nulle
    • L'erreur de krigeage simple ponctuel est orthogonale à toute combinaison linéaire des données.
    • L'erreur de krigeage ordinaire ponctuel est orthogonale à toute combinaison linéaire des données de poids total nul.
    • L'erreur de krigeage universel ponctuel est orthogonale à toute combinaison linéaire des données \scriptstyle \sum_i\phi_if_{li} qui filtre la famille des fonctions de base, c'est-à-dire telle que \scriptstyle \forall l, \sum_i\phi_if_{li}=0.

Notes et références

  1. Krigeage, Gratton Y., Les articles de l'IAG
  2. Matheron G. 1962. Traité de géostatistique appliquée, Tome I. In E. Technip (ed.), Mémoires du Bureau de Recherches Géologiques et Minières, n°14. Paris.
  3. Bogaert P. 2007. Analyse statistique de données spatiales et temporelles. Notes de cours. Université catholique de Louvain.

Voir aussi

Bibliographie

  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Krigeage de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

  • krigeage — ● krigeage nom masculin (de D. G. Krige, nom propre) Technique géostatistique d estimation des caractéristiques d un volume minier (par exemple teneur) prenant en compte des informations intérieures et extérieures à ce volume …   Encyclopédie Universelle

  • Variable régionalisée — La VR comme phénomène physique : topographie de la ville de Binche …   Wikipédia en Français

  • GÉOSTATISTIQUE — Pour des conditions économiques données, les réserves récupérables d’un gisement minier peuvent varier considérablement suivant la plus ou moins grande sélectivité de l’exploitation. Les contraintes géométriques, le support de la sélection, c’est …   Encyclopédie Universelle

  • Glossaire du data mining — Exploration de données Articles principaux Exploration de données Fouille de données spatiales Fouille du web Fouille de flots de données Fouille de textes …   Wikipédia en Français

  • Fouille de données spatiales — Exploration de données Articles principaux Exploration de données Fouille de données spatiales Fouille du web Fouille de flots de données Fouille de textes …   Wikipédia en Français

  • Variogramme — Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Le variogramme est une fonction mathématique utilisée en géostatistique, en particulier pour le krigeage. On parle également de semivariogramme, de …   Wikipédia en Français

  • Kriging — is a group of geostatistical techniques to interpolate the value of a random field (e.g., the elevation, z , of the landscape as a function of the geographic location) at an unobserved location from observations of its value at nearby locations.… …   Wikipedia

  • Georges Matheron — Georges François Paul Marie Matheron (1930 August 7, 2000) was a French mathematician and geologist, known as the founder of geostatistics and a co founder (together with Jean Serra) of mathematical morphology. In 1968 he created the Centre de… …   Wikipedia

  • ArcGIS — Exemple de carte réalisée avec ArcGIS Le système ArcGIS est la plateforme technologique SIG (Système d Information Géographique) développée par la société américaine Esri (Environmental Systems Research Institute, Inc.). Sommaire …   Wikipédia en Français

  • Covariance — Pour le principe physique, voir Principe de covariance générale.  Ne pas confondre avec la covariance d un tenseur en algèbre ou en géométrie différentielle, ou d un foncteur en théorie des catégories. En théorie des probabilités et en… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”