- Théorème de Glivenko-Cantelli
-
Le théorème de Glivenko-Cantelli est parfois appelé « le théorème fondamental de la statistique » car il exprime en quoi une loi de probabilité peut-être révélée par la connaissance d'un (grand) échantillon de ladite loi de probabilité.
Sommaire
Notations
En statistiques, une fonction de répartition empirique est la fonction de répartition de la loi de probabilité discrète μn , qui attribue la probabilité 1/n à chacun des n termes d'un échantillon: soit
un échantillon de variables iid à valeurs dans variables iid dont la loi de probabilité commune, notons la μ , a pour fonction de répartition F(x). La fonction de répartition empirique basée sur l'échantillon est une fonction en escalier définie par
où I(A) est la fonction indicatrice de l'événement A.
Le théorème de Glivenko-Cantelli stipule la convergence uniforme de la fonction de répartition empirique Fn , déduite d'un échantillon d'une loi de probabilité μ, vers la fonction de répartition F de cette loi de probabilité. Or on sait qu'une loi de probabilité est caractérisée par sa fonction de répartition, et, qui plus est, la convergence simple de Fn vers F entraine la convergence en loi de μn vers μ.
Remarque. La loi de probabilité μn définie plus haut comme combinaison linéaire de masses de Dirac :
souvent appelée loi empirique, est une loi de probabilité aléatoire, ou encore une variable aléatoire à valeur mesure. En effet, soit l'espace probabilisé sur lequel les variables aléatoires sont définies. Il faut alors écrire plus précisément, pour chaque
Énoncé
Théorème de Glivenko-Cantelli[1] — Presque sûrement, la convergence uniforme a lieu, ou bien, de manière équivalente :
La loi forte des grands nombres, dans le cas de variables aléatoires de Bernoulli, implique que
mais il n'en découle pas nécessairement que
puisqu'une intersection non dénombrable d'ensembles de probabilité 1 (ensembles presque sûrs) n'est pas nécessairement de probabilité 1. Cette intersection serait-elle de probabilité 1 qu'on n'aurait alors prouvé que la convergence simple, au lieu de la convergence uniforme stipulée par le théorème de Glivenko-Cantelli.
Démonstration
La preuve du théorème de Glivenko-Cantelli s'apparente à celle du deuxième théorème de Dini, bien que les hypothèses du théorème de Glivenko-Cantelli soient parfaitement générales, contrairement à celles du deuxième théorème de Dini : en particulier, ici, F n'est pas supposée continue.
Soit l'espace probabilisé sur lequel les variables aléatoires sont définies. Comme toutes les fonctions de répartition de loi de probabilité, les fonctions et sont croissantes et continues à droite sur tout et par ailleurs elles tendent vers 0 (resp. vers 1) en (resp. en ). Ainsi, pour tout nombre réel x, et pour tout les limites à gauches et sont-elles bien définies. De plus, comme
on en déduit que :
Ainsi, étant la somme de variables de Bernoulli indépendantes et de même loi, (resp. ) suit une loi binomiale de paramètres n et (resp. de paramètres n et ). De plus, en vertu de la loi forte des grands nombres[2], les ensembles
sont presque sûrs.
Notons G la réciproque généralisée de F, définie pour par
et, pour notons
l'image de k/m par G. Par définition de G, en considérant, successivement, une suite strictement croissante de nombre réels convergeant vers x(k,m), puis une autre suite, cette fois strictement décroissante vers x(k,m), et en utilisant la continuité à droite de F, on obtient
et, par conséquent
Ainsi, pour un nombre réel x tel que on a successivement
Si la première inégalité reste inchangée et la deuxième devient Si c'est la deuxième inégalité qui reste inchangée, la première devenant Quoi qu'il en soit, on en déduit que pour tout réel x,
où est le supremum de l'ensemble fini :
En d'autres termes,
Posons
L'ensemble est presque sûr, comme intersection finie d'ensembles presque sûrs. Pour
lim nDn(ω) = 0, donc
Finalement l'ensemble
est presque sûr, comme intersection dénombrable d'ensembles presque sûrs, et pour
ou, de manière équivalente,
À voir
Notes
- p. 232 de Billingsley, Probability and measure.
- variables de Bernoulli : Émile Borel, « Les probabilités dénombrables et leurs applications arithmétiques », dans Rendiconti del Circolo Matematico di Palermo, vol. 27, no 1, décembre 1909, p. 247-271 (ISSN 0009-725X et 1973-4409) [texte intégral, lien DOI]. démontrée en 1909 dans le cas qui nous intéresse ici, i.e. le cas des
Bibliographie
- (en) Galen R. Shorack et Jon A. Wellner, Empirical Processes With Applications to Statistics, Society for Industrial & Applied Mathematics, 4 septembre 2009, 998 p. (ISBN 0-89871-684-5 et 978-0898716849)
- van der Vaart, A.W. and Wellner, J.A. (1996) "Weak Convergence and Empirical Processes", Springer. ISBN 0-387-94640-3.
- Billingsley, Probability and measure, p. 232.
Pages liées
- Fonction de répartition empirique
- Fonction de répartition
- Loi binomiale
- Loi forte des grands nombres
- Théorème de Dini
- Statistiques
- Portail des probabilités et des statistiques
Catégories :- Statistiques
- Théorème de mathématiques
Wikimedia Foundation. 2010.