- Krigeage
-
Le krigeage est une méthode d’estimation issue de la géostatistique. Le terme krigeage, provient du nom de famille de l'ingénieur minier sud-africain Daniel Gerhardus Krige[1]. Il a été formalisé pour la prospection minière par Georges Matheron[2] (1930-2000) à l'École des Mines de Paris. Depuis, le domaine de ses applications a largement été étendu, touchant notamment la météorologie, les sciences de l’environnement et l’électromagnétisme.
Le krigeage est donc une méthode d'interpolation spatiale, parfois considérée comme la plus juste d'un point de vue statistique, qui permet une estimation linéaire basée sur l'espérance mathématique et aussi sur la variance de la donnée spatialisée. À ce titre, le krigeage se base sur le calcul, l'interprétation et la modélisation du variogramme, qui est une appréciation de la variance en fonction de la distance entre données.
Cette méthode d'interpolation se distingues d'autres méthodes (distance inverse, polygonation de Thiessen, estimation par noyau, etc.) car elle présente deux avantages. Tout d'abord, le krigeage est le meilleur prédicteur linéaire non-biaisé : les moyennes sont identiques et la variance minimale entre Z0 et Z0p. Ensuite, le krigeage se base sur une méthode objective[3].
Plus simplement et pour tout le monde, le krigeage est un outil mathématique permettant d'éliminer dans une série statistique les "aberrations", les valeurs relevées improbables, ou incohérentes, en se basant sur la valeur des données avoisinantes. Cette méthode est utilisé par Météo France par exemple pour éliminer les valeurs de températures absurdes (défaillance matérielle, feu de poubelle à côté, etc.) en comparant les données de la station en question à celles des stations avoisinantes. Mais cela pose bien sûr le problème du nivellement de la donnée pour qu'elle soit cohérente, alors que il y avait réellement à cet endroit là une température exceptionnelle...
Le krigeage s'est décliné sous plusieurs formes (simple, ordinaire, …) qui toutes utilisent les mêmes principes.
Sommaire
- 1 Notations utilisées
- 2 Contraintes d'un krigeage
- 3 Krigeages ponctuels
- 4 Propriétés du krigeage
- 5 Notes et références
- 6 Voir aussi
Notations utilisées
- Q une quantité (définie de manière quelconque) à estimer en un point;
- Q* l'estimateur de krigeage de Q en ce point;
- Z la fonction aléatoire étudiée;
- K, m sa covariance et son espérance;
- n le nombre de points de mesure;
- x0 le point d'estimation;
- xi, i=1…n les points de mesure;
- * l'opérateur d'estimation par krigeage; ainsi Z* est l'estimateur de krigeage de Z;
- Z*0 la valeur estimée en x0 par le krigeage considéré;
- Zi, i=1…n les données, connues aux points de mesure xi;
- λi le poids affecté par le krigeage à la valeur en xi;
- μ le paramètre de Lagrange utilisé dans le krigeage;
- γi,j la valeur du variogramme γ pour une distance |xi-xj|;
- Ki,j la valeur de la covariance K pour une distance |xi-xj|;
Contraintes d'un krigeage
La définition de l'estimateur d'un krigeage est basée sur quatre contraintes successives. Celles-ci sont définies de manière identique dans toutes les variantes de krigeage. La suite détaille les quatre étapes de construction d'un estimateur Q* pour une quantité à estimer Q.
Linéarité
Ce choix provient d'un souci de réalisme. On pose que la quantité à estimer est une fonctionnelle linéaire de la fonction aléatoire étudiée (dans le cas général: ); le cas contraire (problèmes de coupure et de sélection, …) relève de la géostatistique non linéaire.
L'estimateur est posé comme combinaison linéaire des données, de poids inconnus pour l'instant :
Autorisation
L'erreur d'estimation doit être une combinaison linéaire autorisée, c'est-à-dire que son espérance et sa variance doivent être définies.
La condition d'autorisation s'écrit différemment selon le modèle sous-jacent supposé (on supposera toujours le support borné).
- Dans le modèle stationnaire d'ordre 2, toutes les combinaisons linéaires sont autorisées, et il n'y a pas de contrainte.
- Par contre, dans le modèle intrinsèque, une combinaison linéaire est autorisée si et seulement si son poids total est nul :
Universalité
On exige de l'estimateur qu'il ne présente pas de biais statistique par rapport à la quantité à estimer. Cette contrainte peut être nommée contrainte de non-biais ou d'espérance nulle. Elle s'écrit :
Optimalité
On demande à l'erreur d'estimation d'être de variance minimale, sous les contraintes précédentes. Sauf cas particuliers, il y existe une solution unique à ce problème d'estimation.
Le résultat de ces quatre contraintes est, dans le cas général, un système de Cramer, qui admet une solution et une seule.
On peut étendre cette démarche dans le cas continu en considérant non des pondérations λi mais des mesures λ(dx).
Krigeages ponctuels
Krigeage stationnaire à moyenne connue (krigeage simple)
Soit Z stationnaire d'ordre 2, K la covariance et m l'espérance de Z, supposées connues. On suppose sans perte m=0. On cherche le krigeage de Z en un point.
- Par linéarité, le problème devient la recherche des poids λi, dépendants du point d'estimation, tels que ;
- L'autorisation est assurée dans le cas stationnaire;
- L'universalité est assurée par hypothèse : ;
- L'optimalité suppose :
Le système de krigeage simple s'écrit matriciellement :
La variance d'estimation en krigeage simple est
Krigeage stationnaire à moyenne inconnue (krigeage ordinaire, 1)
L'espérance m est supposée inconnue (mais définie).
- La linéarité donne ;
- L'autorisation est assurée dans le cas stationnaire;
- L'universalité ne permet pas de supposer m=0, et donne ;
- L'optimalité est réalisée par la méthode du multiplicateur de Lagrange. Soit μ ce paramètre, on obtient le système de krigeage :
Le système de krigeage ordinaire s'écrit matriciellement :
La variance d'estimation en krigeage ordinaire est
On peut utiliser la même démarche pour évaluer l'espérance inconnue. Soit son estimateur M*.
- La linéarité donne
- L'autorisation est assurée
- L'universalité impose , donc
- L'optimalité se résout par multiplicateur de Lagrange (noté μM)en le système:
La variance de l'évaluation de la moyenne est donc
Krigeage strictement intrinsèque ( krigeage ordinaire, 2)
Soit Z strictement intrinsèque sans dérive.
- La linéarité donne ;
- L'autorisation, dans le modèle intrinsèque, donne
- L'universalité est respectée, car une combinaison linéaire autorisée dans le modèle intrinsèque sans dérive est d'espérance nulle
- L'optimalité nécessite
Ce cas est identique au précédent, écrit en variogramme:
La variance d'estimation en krigeage ordinaire est encore
Krigeage universel
Le modèle supposé est Z(x)=Y(x)+m(x), comportant une dérive m(x) déterministe et un résidu Y(x) voulu stationnaire (résidu vrai), et d'espérance nulle. La difficulté est de séparer les deux composantes m et y dans la variable régionalisée z.Cette dichotomie peut représenter une opposition explicative entre basses et hautes fréquences, entre tendance régionale et anomalies.
La dérive est supposée décomposable selon un nombre connu de fonctions de base , généralement des monômes des coordonnées, avec f0=1 la fonction constante unité. Les coefficients al sont inconnus. Cependant le modèle de dérive fourni par les algorithmes n'est pas forcément une tendance du phénomène, mais une approximation à l'échelle de travail.
Les hypothèses sur le résidu Y sont appelés sous-jacents sur Z.
Krigeage universel à modèle sous-jacent stationnaire d'ordre 2
Ce modèle est interprétable comme ayant une force de rappel autour de la dérive. La covariance est posée .
On notera la valeur de fl au point xi, pour i=0…n.
- La linéarité donne
- L'autorisation est assurée
- L'universalité impose avec al inconnus, d'où
- L'optimalité introduit les multiplicateurs de Lagrange μl; les conditions d'optimalité s'écrivent :
Sous forme matricielle, le krigeage universel s'écrit:
La variance d'estimation est:
Krigeage universel à modèle sous-jacent intrinsèque strict
On suppose Y intrinsèque stricte sans dérive (la dérive étant intégrée à m).
- La linéarité pose
- L'autorisation impose
- L'universalité impose
- L'optimalité introduit un multiplicateur de Lagrange μ0 pour la contrainte d'autorisation, et d'autres μl,l≠0 pour les contraintes d'universalité
Le système de krigeage s'écrit :
Soit matriciellement:
La variance d'estimation est:
Le résultat est identique au cas précédent, cependant la situation physique n'est pas la même : ici, le phénomène peut admettre un variogramme sans palier, c'est-à-dire sans force de rappel.
Évaluation de la dérive
Les calculs précédents ont supposé une dérive m déterministe, connue et régulière.
En modèle sous-jacent stationnaire, posons un estimateur linéaire de la dérive : . Les λi sont solutions du système :
Et la variance d'estimation en est :
En modèle sous-jacent intrinsèque strict, les contraintes d'autorisation et d'universalité sont incompatibles ; l'estimation optimale de la dérive est impossible.
DémonstrationLa combinaison linéaire doit être autorisée, donc
L'universalité donne , d'où après simplification et avec f0i=1, , ce qui est une condition en λi impossible.
Évaluation des coefficients de la dérive
Variogramme des résidus
Krigeage intrinsèque (FAI-k)
On suppose ici que Z est une FAI-k, k étant une valeur donnée.
écriture du krigeage- La linéarité pose
- L'autorisation à l'ordre k demande . En utilisant la mesure de Dirac δi(dt), on peut écrire :
- L'universalité est assurée puisque toutes les combinaisons linéaires autorisées sont d'espérance nulle.
- L'optimalité demande à minimiser conditionnellement : . Soit les conditions d'optimalité .
Le système de krigeage intrinsèque s'écrit :
La variance d'estimation en krigeage intrinsèque est
On dispose des propriétés suivantes :
- superposition des figures de krigeage: soit un opérateur linéaire Φ, alors Φ*(Z)=Φ(Z*). On peut écrire avec
- orthogonalité : soit ν une combinaison linéaire autorisée (), soit Φ une forme linéaire, alors
- lissage : la variance de Z* n'est pas définie. Soit Φ une forme linéaire telle que , alors la variance de l'estimateur est inférieure à celle de la forme linéaire () ; de plus elle n'est pas stationnaire (pas invariante pour une translation de Φ).
Propriétés du krigeage
- C'est un interpolateur exact : si le point d'estimation est un point de donnée, le krigeage renvoie la donnée en ce point.
- C'est une opération linéaire : le krigeage d'une combinaison linéaire est la combinaison linéaire des krigeages, à condition d'utiliser le même jeu de données (théorème de superposition des figures de krigeage).
- Le krigeage sur deux domaines disjoints est la somme des krigeages sur ces domaines.
- La moyenne estimée sur un domaine est la moyenne des krigeages ponctuels sur ce domaine.
- Le krigeage d'une convoluée est la convoluée des krigeages ponctuels .
- le krigeage d'une dérivée est la dérivée du krigeage.
- Le krigeage lisse la fonction étudiée.
DémonstrationDémonstration pour un krigeage simple:
, d'où il vient
, l'erreur de krigeage simple est orthogonale à chacune des données
, car l'estimateur du krigeage est une combinaison linéaire des données
La variance de la valeur estimée est inférieure à la variance a priori, et strictement hors des points de données. Incidemment, l'estimateur de krigeage simple n'est pas stationnaire d'ordre 2, puisque sa variance dépend de x.
- Indépendance linéaire des fonctions de base sur les données : une condition nécessaire de régularité du système de krigeage universel est que les fli n'admettent pas de combinaison linéaire nulle non triviale ().
- Les pondérateurs sont invariants par multiplication de la fonction structurale : si l'on multiplie la covariance ou le variogramme par ω, les λi restent constants (mais les μl en krigeage universel sont divisés par ω). La variance de krigeage est multipliée par ω.
- Orthogonalité: rappelons que deux variables aléatoires sont dites orthogonales si leur covariance est nulle
- L'erreur de krigeage simple ponctuel est orthogonale à toute combinaison linéaire des données.
- L'erreur de krigeage ordinaire ponctuel est orthogonale à toute combinaison linéaire des données de poids total nul.
- L'erreur de krigeage universel ponctuel est orthogonale à toute combinaison linéaire des données qui filtre la famille des fonctions de base, c'est-à-dire telle que .
DémonstrationPour un krigeage universel:
d'après le système de krigeage
après réordonnement et combinaison
Or :
Donc :Notes et références
- Krigeage, Gratton Y., Les articles de l'IAG
- Matheron G. 1962. Traité de géostatistique appliquée, Tome I. In E. Technip (ed.), Mémoires du Bureau de Recherches Géologiques et Minières, n°14. Paris.
- Bogaert P. 2007. Analyse statistique de données spatiales et temporelles. Notes de cours. Université catholique de Louvain.
Voir aussi
Bibliographie
- Cressie N. 1993. Statistics for Spatial Data. Wiley Series in Probability and Mathematical Statistics: Applied Probability and Statistics. John Wiley & Sons Inc., New York. Revised reprint of the 1991 edition, A Wiley-Interscience Publication.
- Baillargeon S. 2005. Le krigeage : revue de la théorie et application à l’interpolation spatiale de données de précipitations. Mémoire de fin d’études. Université Laval, Québec.
- Portail des probabilités et des statistiques
Catégories :- Géostatistique
- Interpolation spatiale
Wikimedia Foundation. 2010.