Améliorée de Rao-Blackwell

Théorème de Rao-Blackwell

Le théorème de Rao-Blackwell permet à partir d'un estimateur (statistique) de construire un estimateur plus précis grâce à l'usage d'une statistique exhaustive. L'avantage de ce théorème est que l'estimateur initial n'a pas nécessairement besoin d'être très bon pour que l'estimateur que ce théorème construit fournisse de bons résultats. Il suffit en effet que l'estimateur de départ soit sans biais pour pouvoir construire un nouvel estimateur. L'estimateur de départ n'a entre autres pas besoin d'être convergent ou efficace.

Théorème

Si $δ$ est un estimateur sans biais et S une statistique exhaustive alors l'estimateur augmenté $\mathbb{E}(\delta |S)$ à une variance plus faible que la variance de l'estimateur initial. L'estimateur augmenté est donc toujours plus précis que l'estimateur initial si on l'augmente d'une statistique exhaustive.

Dans le cas multiparamétrique où l'estimateur et le paramètre sont en dimensions plus grands que 1 on remplace la variance par la matrice de variance-covariance. Le théorème de Rao-Blackwell donne alors:

Quel que soit A défini positif l'erreur quadratique en utilisant le produit scalaire défini par A est toujours plus faible pour l'estimateur augmenté que pour l'estimateur initial.

Le fait de pouvoir prendre n'importe quel produit scalaire et non seulement le produit scalaire usuel peut être très utile pour que les différentes composantes ne soit pas normés de la même façon. Ceci peut par exemple être le cas quand si une erreur sur l'une ou l'autre des composantes "coute plus cher" on pourra choisir une matrice de produit scalaire en fonction. L'estimateur augmenté sera toujours préférable même avec ce produit scalaire non usuel.

En fait le théorème de Rao Blackwell donne légèrement plus vu qu'il dit que quelle que soit la fonction de perte convexe L $\mathbb{E}(L((\delta |S),\theta))\leq \mathbb{E}(L(\delta ,\theta))$ . L'estimateur augmenté est donc toujours plus précis et ce quelle que soit la définition (raisonnable) que l'on donne à "précis".

Exemple

On considère donc n variables aléatoires $X i$ iid distribués selon des lois de Poisson de paramètre $λ$ et l'on cherche à estimer $e - λ$ . On peut montrer assez facilement en considérant le critère de factorisation que $S = \sum_{i=1}^n X_{i}$ est une statistique exhaustive. Pour montrer l'intérêt de ce théorème on prend un estimateur grossier de $e - λ$ : $δ 0 = δ (X 1, 0)$ qui vaut 1 si $X 1 = 0$ et 0 sinon. Cet estimateur ne prend en compte qu'une seule valeur de X alors qu'on en dispose de n et il ne donne pour résultat que 0 ou 1 alors que la valeur de $e - λ$ appartient à l'intervalle ]0,1] et ne vaut sans doute pas 1. (si c'était le cas $X i$ vaudrait 0 de façon déterministe et on s'en serai aperçu en regardant les données). Pourtant bien que cet estimateur soit très grossier l'estimateur augmenté obtenu est très bon et on peut même montrer qu'il est optimal. L'estimateur augmenté vaut:

$\delta_1=\mathbb{E}(\delta_0|S).\,\!$

On peut montrer que:

Détails du calcul

$\mathbb{P}(X_1=k| \sum_{i=1}^n X_{i}=S)=\frac{\mathbb{P}(X_1=k \, et\, \sum_{i=1}^n X_{i}=S)}{\mathbb{P}(\sum_{i=1}^n X_{i}=S)}=\frac{\mathbb{P}(X_1=k \, et\, \sum_{i=2}^n X_{i}=S-k)}{\mathbb{P}(\sum_{i=1}^n X_{i}=S)}$

Et avec l'indépendance de $X i$ : $\mathbb{P}(X_1=k| \sum_{i=1}^n X_{i}=S)=\frac{\mathbb{P}(X_1=k )\mathbb{P}( \sum_{i=2}^n X_{i}=S-k)}{\mathbb{P}(\sum_{i=1}^n X_{i}=S)}$

Si $X i$ suit une loi de Poisson de paramètre $λ$ alors la fonction génératrice vaut $\phi_{X_i} (t) =\ e^{\lambda(t-1)}$ . Avec les propriétés de la fonction génératrice on en déduit que la somme de n variables iid suivant des lois de Poisson de paramètre $λ$ est une loi de Poisson de paramètre $n λ$ . On en déduit les probabilités et $\mathbb{P}(X_1=k| \sum_{i=1}^n X_{i}=S)= C^k_S \, \frac{(n-1)^{S-k}}{n^S}$ $X 1$ suis une loi binomiale B(S,1/n). La valeur en k=0 nous donne l'estimateur $δ 1$ . En effet, $\delta_1=\mathbb{E}(\delta_0|S)=1.\mathbb{P}(X_1=0| \sum_{i=1}^n X_{i}=S)+0.\mathbb{P}(X_1\neq 0| \sum_{i=1}^n X_{i}=S)$

$\delta_1=\left(1-{1 \over n}\right)^{S}.\,\!$

δ₁ est tout comme δ₀ un estimateur de $e - λ$ mais a l'avantage d'être beaucoup plus précis grâce à l'application du théorème de Rao–Blackwell.

On peut montrer que $\delta_2=\frac{S}{n}$ est un estimateur optimal de $λ$ (Voir Théorème de Lehman Scheffé) mais que l'estimateur optimal pour $e - λ$ est différent de $e^{-\delta_2}$ .

En fait bien que $e^{-\delta_2}$ soit un estimateur convergent de $e - λ$ c'est un estimateur de relativement mauvaise qualité car il est biaisé et qu'en l'estimant de la sorte on fait une erreur systématique sur l'estimation. De façon général il peut être intéressant pour estimer $f (λ)$ de construire un estimateur spécifique plutôt que de calculer la valeur prise par f par l'estimateur de $λ$ .

voir aussi

Références

A. Montfort Cours de statistique mathématique, 1982, Economica. Paris.

Liens externes

P. Druilhet [1] Cours de statistique interférentielle.

Portail des probabilités et des statistiques

Ce document provient de « Th%C3%A9or%C3%A8me de Rao-Blackwell ».

Catégorie : Estimation (statistique)

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Améliorée de Rao-Blackwell de Wikipédia en français (auteurs)

Игры ⚽ Нужна курсовая?

Dictionnaires et Encyclopédies sur 'Academic'

Améliorée de Rao-Blackwell

Théorème de Rao-Blackwell

Sommaire

Théorème

Exemple

voir aussi

Références

Liens externes

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Améliorée de Rao-Blackwell

Théorème de Rao-Blackwell

Sommaire

Théorème

Exemple

voir aussi

Références

Liens externes

Share the article and excerpts

Direct link