- Variogramme
-
Le variogramme est une fonction mathématique utilisée en géostatistique, en particulier pour le krigeage. On parle également de semivariogramme, de par le facteur ½ de sa définition.
L'analyse variographique, variographie, ou analyse structurale est l'estimation et l'étude d'un variogramme sur une variable aléatoire.
Sommaire
Variogramme d'une fonction aléatoire
Considérons une variable aléatoire, Z de la variable d'espace x, et supposons-lastationnaire, c'est-à-dire que la moyenne et la variance de Z(x) sont indépendantes de x. On pose la grandeur:
Comme Z est stationnaire, le membre de droite dépend uniquement de la distance entre les points x et y. Le variogramme à une distance h est alors la demi moyenne des carrés des différences des réalisations de Z sur les points espacés de Z.
Variogramme expérimental
Soit un ensemble de points où sont connus une variable régionalisée z.
Pour être exploitable, la somme doit se faire avec une certaine tolérance, c'est-à-dire que l'on réalisera la somme sur les couples interdistants de h±δh, où souvent on définit la tolérance δh=½h. Alors on peut estimer le variogramme par la formule :
- où n(h) est le nombre de paires de points dont l'interdistance est comprise entre h-δh et h+δh.
Dans un cas plus général, h pourra être un vecteur, et la somme se fera sur tous les points x, y tels que y=x+h. Cela permet de traiter les anisotropies.
Modélisation (ajustement)
Le variogramme estimé n'est pas prédictif et ne respecte le plus souvent pas les contraintes de krigeage. C'est pourquoi les méthodes géostatistiques modélisent le variogramme estimé par une fonction continue soumise à certaines contraintes. Cette étape s'appelle la modélisation ou l''ajustement du variogramme.
Le modèle est une fonction continue reproduisant au mieux l'allure générale du variogramme théorique. Toutes les fonctions ne sont pas possibles. Généralement, on utilise une combinaison linéaire autorisée. Une combinaison linéaire ∑i λiZi est dite autorisée si son espérance et sa variance sont toujours définies (dans le modèle en question).
Les composantes les plus fréquemment utilisées sont :- composantes à palier C, sans portée :
- pépite pure :
- composantes à palier C et portée a :
- gaussien :
- cubique :
- exponentiel :
- sphérique :
- composantes non-stationnaires :
- linéaire : γ(h) = Ch
- puissance : γ(h) = Chboù 0 < h < 2
La modélisation est la partie essentielle du krigeage.
Propriétés
Le variogramme est une fonction paire, à valeurs positives.
Lorsque la covariance C est définie, elle est liée au variogramme par la relation :
γ(h) = C(0) − C(h) où C(η) est la covariance à une distance η (dépendante uniquement de η pour une fonction aléatoire stationnaire)
Le variogramme est souvent une fonction croissante bornée. Dans ce cas, on nomme palier la limite du variogramme à l'infini et portée la distance où le palier est quasiment atteint (généralement, à 95 %). Lorsqu'elle existe, la variance C(0) est ce palier. En pratique, à cause en particulier des effets de bords, le variogramme calculé est croissant jusqu'à un maximum, puis globalement légèrement décroissant ou stable.
Propriétés du variogramme stationnaire
- γ(0)=0
- γ(h)≥0 ∀ h
- symétrie : γ(h)= γ(-h) ∀ h
- -γ est de type positif conditionnel : soit une mesure λ vérifiant ∫λ(dt)=0, alors
- ∀t>0, e-tγ est une covariance
- le rapport γ(h)∕|h|2 est borné pour h⟶∞
- en l'absence de dérive,
- si le variogramme est borné à l'infini, la fonction aléatoire est stationnaire d'ordre 2 ; il existe alors une covariance stationnaire C(h) telle que γ(h)=C(0)-C(h)
- Le variogramme γ(h) est égal à la demie variance d'extension d'un point {x} quelconque au point {x+h}
Le comportement à l'origine du variogramme traduit la régularité de la fonction aléatoire.
Autre présentation du variogramme
On peut définir également le variogramme comme la fonction γ telle que
Cette formule fournit une définition du variogramme à une constante additive près.
Substitution entre variogramme et covariance
Les formules définies dans l'hypothèse stationnaire peuvent être réécrites dans l'hypothèse intrinsèque, à condition qu'elles fassent intervenir des CLA, en remplaçant la covariance C par l'opposé du variogramme −γ
Effet pépite
La formule fournit immédiatement γ(0)=0. Or l'on observe généralement que le variogramme ne tend pas vers 0 pour des petites distances. On appellera pépite la limite du variogramme en zéro. Elle représente la variation entre deux mesures effectuées à des emplacements infiniment proches, et peut donc provenir de trois effets :
- une variabilité naturelle du paramètre mesuré : il pourra par exemple prendre deux valeurs différentes si mesuré à deux instants différents ;
- une variabilité de l'instrument de mesure : la pépite mesure donc en partie l'erreur statistique de l'instrument de mesure ;
- un réel effet pépite : une variation brutale du paramètre mesuré ; le cas historique est le passage sans transition d'une pépite d'or à un sol ne contenant quasiment pas d'or.
Wikimedia Foundation. 2010.