- Fonction de repartition
-
Fonction de répartition
En théorie des probabilités ou en statistiques, la fonction de répartition d'une variable aléatoire réelle caractérise la loi de probabilité de cette variable aléatoire réelle. La fonction de répartition de la variable aléatoire réelle
est la fonction
qui à tout réel
associe
où le membre de droite réprésente la probabilité que la variable aléatoire réelle
prenne une valeur inférieure ou égale à
La probabilité que
se trouve dans l'intervalle
est donc, si
La fonction de répartition d'une mesure de probabilité
définie sur la tribu borélienne
est la fonction
qui à tout réel
associe
Sommaire
Exemples de calculs de la fonction de répartition
Variables à densité
La fonction de répartition
d'une variable aléatoire
de densité de probabilité
est une des primitives (en un sens un peu relaché, voir ci-dessous) de cette densité
. Plus précisément
est définie par:
Toutefois, ce n'est pas, en toute généralité, une primitive au sens strict du terme : on peut seulement affirmer
- qu'une fonction de répartition
est dérivable presque partout (pour la mesure de Lebesgue),
- que si la variable
est à densité, alors la dérivée de
est presque partout (pour la mesure de Lebesgue) égale à
Mais il y a beaucoup de "contre-exemples" : la fonction de répartition de la loi uniforme sur un intervalle, ou encore celle de la loi exponentielle, ne sont pas dérivables sur tout
et ne sont donc pas, au sens strict, des primitives de densités de probabilités.
Notons que, contrairement aux variables discrètes, une variable à densité X vérifie
pour tout nombre réel a : en conséquence, la fonction de répartition des variables à densité est continue en tout point. En fait une variable aléatoire réelle X possède une densité de probabilité si et seulement si sa fonction de répartition est absolument continue sur chaque intervalle.
Variables discrètes
Une variable aléatoire
est dite discrète s'il existe un ensemble
fini ou dénombrable tel que
La loi de
est déterminée sans ambiguité par la donnée de
, où
ps = P(X = s). Si, par exemple,
est une variable aléatoire réelle, on a
où
est la fonction indicatrice de l'ensemble E.
Pour les variables aléatoires discrètes les plus courantes (par exemple, les lois uniformes, binomiales, de Poisson)
est un ensemble bien ordonné : on peut alors numéroter ses éléments de manière croissante, p.e.
et numéroter les probabilités
en conséquence, p.e. en posant
. On a alors, si
Soit encore, plus généralement :
La fonction de répartition est alors une fonction constante par intervalles et sa représentation graphique est en escalier. Les sauts d'une marche à l'autre de l'escalier se situent aux abscisses
, et l'amplitude du saut d'abscisse
est
En particulier la fonction de répartition d'une variable discrète X est discontinue exactement aux points s tels que
Voir la section Propriétés de la fonction de répartition pour une démonstration.
Miscellanées
L'escalier de Cantor est un exemple de fonction de répartition continue mais dont la dérivée est presque partout nulle. Ainsi, la formule précédente ne vaut pas pour l'escalier de Cantor : bien que la loi de probabilité associée à l'escalier de Cantor soit diffuse (sans atome), cette loi ne possède pas de densité. L'escalier de Cantor est en fait un exemple de fonction de répartition continue mais qui n'est pas absolument continue sur chaque intervalle.
Propriétés de la fonction de répartition
Propriétés caractéristiques
Théorème — La fonction de répartition d'une variable aléatoire
a les propriétés caractéristiques suivantes :
est croissante ;
- Elle est partout continue à droite ;
;
.
DémonstrationLe point 1 découle de la propriété de croissance des mesures de probabilité
Comme
est monotone, le point 2 se réduit à montrer que
ou encore, équivalemment,
Mais les boréliens
forment une suite décroissante, et
donc le point 2 est une conséquence des axiomes des probabilités. Comme
est monotone, le point 3 se réduit à montrer que
Ceci est encore une conséquence des axiomes des probabilités, puisque
Le point 4 découle, de la même manière, de
Comme on l'a dit, les points 1 à 4 sont caractéristiques de la fonction de répartition d'une variable aléatoire réelle
: étant donné une fonction réelle de la variable réelle, notons la
, satisfaisant les points 1 à 4, on peut construire concrètement une variable aléatoire réelle
ayant
pour fonction de répartition, voir ci-dessous le théorème de la réciproque. Notons que cette construction sert à produire, sur ordinateur, des échantillons de taille arbitraire d'une loi de probabilité arbitraire, ce qui est l'ingrédient de base des méthodes de Monte-Carlo.
Autres propriétés
A cause des points 1, 3 et 4,
est bornée, plus précisément
Comme toute fonction monotone bornée,
admet en tout point
une limite à gauche
, limite à gauche égale ou non à
selon que
est continue en
ou non. L'ensemble des points de discontinuité de
est fini ou dénombrable.
La connaissance de la fonction de répartition permet de définir la probabilité de tout intervalle
-
- par passage au complémentaire,
-
- où l'on utilise
pour
et
- où l'on utilise
-
- Cette propriété est la plus délicate et fait intervenir une conséquence des axiomes des probabilités sur la probabilité de l'union d'une suite croissante d'ensembles. On considère une suite
de réels croissante, convergeant vers x. L'intervalle
est alors union dénombrable de la suite croissante d'intervalles
. La probabilité de l'intervalle
est donc la limite des probabilités des intervalles
, i.e. la limite de la suite
Par propriété des fonctions croissantes, cette limite existe et vaut
- Cette propriété est la plus délicate et fait intervenir une conséquence des axiomes des probabilités sur la probabilité de l'union d'une suite croissante d'ensembles. On considère une suite
- En particulier
-
- ces 4 dernières propriétés découlant de
pour différents choix de
et
- ces 4 dernières propriétés découlant de
On appelle atome de la variable aléatoire X tout réel a pour lequel. Ainsi les atomes de la variable aléatoire X sont exactement les points de discontinuité de la fonction de répartition.
La fonction de répartition d'une variable aléatoire
est donc continue si et seulement si X n'a aucun atome, i.e. si et seulement si
On dit alors que la loi de
est diffuse, ou bien sans atome, et, par extension, que la variable aléatoire
elle-même est diffuse ou sans atome. En particulier, les variables aléatoires réelles possédant une densité de probabilité sont diffuses. Il existe cependant des variables aléatoires diffuses mais ne possédant pas pour autant une densité de probabilité, c'est le cas, par exemple, de la variable aléatoire ayant pour fonction de répartition l'escalier de Cantor.
Caractérisation de la loi par la fonction de répartition
Théorème — La loi de probabilité d'une variable aléatoire réelle est caractérisée par sa fonction de répartition.
Ou bien encore : si deux variables aléatoires réelles ont même fonction de répartition, alors elles ont même loi (et réciproquement).
DémonstrationSous l'hypothèse
, on peut démontrer de manière élémentaire que
dès que
est un borélien "simple" (par exemple, si
est un intervalle). Par contre, la démonstration générale (pour tout borélien
) est un cas particulier du lemme d'unicité des probabilités, lui-même corrolaire du lemme de classe monotone, appliqué à la classe
Il faut vérifier que
- la classe
est stable par intersection finie,
- la tribu engendrée par
contient (et en fait est égale à) la tribu borélienne.
Le lemme d'unicité des probabilités permet alors de conclure.
Vérifions 1. Soit
une partie finie de
. Soit
l'élément minimal de
. Alors
Vérifions 2. La tribu engendrée par
est notée
. La tribu borélienne est notée
, comme souvent. Notons
On a
en vertu de la stabilité des tribus par passage au complémentaire, donc
par définition d'une tribu engendrée. On peut interchanger
et
dans ce qui précède, donc, par double inclusion,
Comme
est une partie de l'ensemble des ouverts, on en déduit que
Mais il nous faut surtout démontrer l'inclusion en sens inverse, et, pour cela, démontrer que tout ouvert de
est dans
(ainsi
est une tribu contenant tous les ouverts de
, alors que
est la plus petite tribu contenant tous les ouverts de
). Un argument rapide est de constater que
- tout ouvert de
est réunion dénombrable d'intervalles ouverts, et que
- les intervalles ouverts sont dans
.
Le premier point résulte de ce que
- un ouvert
est réunion disjointe de ses composantes connexes (cela est vrai pour toute partie de
),
- les parties connexes de
(et en particulier les composantes connexes ci-dessus) sont exactement les intervalles de
- comme
est localement connexe, les composantes connexes d'un ouvert sont automatiquement ouvertes.
- dans chaque composante connexe
de notre ouvert
, on peut choisir un nombre rationnel
. Les
sont distincts car les composantes sont disjointes. Ainsi
est une bijection entre la famille des composantes connexes de
et une partie de
La famille des composantes connexes de
est donc finie ou dénombrable.
Le deuxième point tient à ce que
comme on l'a vu plus haut ;
;
CQFD
En d'autres termes, si deux variables aléatoires réelles,
et
, vérifient
alors elles vérifient aussi que pour tout borélien
,
De plus, elles vérifient que pour toute fonction mesurable
,
dès que l'un des deux termes de l'égalite a un sens.
Théorème de la réciproque
Soit
une fonction de
dans
satisfaisant les 4 propriétés caractéristiques. Notons
la fonction définie pour
par
Alors
est une variable aléatoire réelle définie sur l'espace probabilisé
où
et où
désigne la restriction à
de la mesure de Lebesgue sur
. Le théorème stipule que :
Théorème — Sur l'espace
, la fonction de répartition de
est
.
Ainsi toute fonction
de
dans
satisfaisant les 4 propriétés caractéristiques est fonction de répartition d'une variable aléatoire réelle (de
, par exemple), ou encore d'une mesure de probabilité sur
(de la loi de
, par exemple).
DémonstrationDémonstration
Pour
, notons
Donc
. A cause du point 4,
, et à cause du point 3,
est bornée inférieurement, donc
est bien définie.
Commençons par un cas simple à titre d'entrainement:
F est continue strictement croissante
Si
est continue strictement croissante sur
, alors
est une bijection de
dans ]0,1[, et
est la réciproque de
(on peut s'en convaincre en traçant
à l'aide du graphe de
). A ce titre,
est continue et strictement croissante sur ]0,1[, et en particulier
est mesurable (c'est donc une v.a.r.). On a, de plus,
donc
Ainsi
Démonstration dans le cas généralCas général
Dans le cas général, on a également
et on conclut donc exactement de la même manière que précédemment, mais la démonstration de l'équivalence ci-dessus est moins directe. Tout d'abord, pour
,
, et donc
. Du fait que
est monotone, il résulte que
est mesurable.
On a, par définition de
et de
,
La réciproque vient de ce que
, i.e.
ce qui, avec
entraîne, par croissance de
,
et finalement
Supposons en effet que
, et considérons une suite strictement décroissante
d'éléments de
telle que
Par continuité à droite de
,
mais également, par définition de
,
ce qui conduit à
, d'où une contradiction (démonstration largement reprise de Sidney Resnick, A Probability Path).
Remarques.
- Lorsque
est une bijection bicontinue d'un intervalle
dans
(i.e.
est continue strictement croissante),
est tout simplement la réciproque de
(i.e.
et
). Pour cette raison,
est parfois appelée réciproque généralisée de
- L'intérêt pratique de ce Théorème est développé dans l'article Méthode de la transformée inverse, ainsi que dans la section suivante.
Conséquences du théorème de la réciproque
Simulation de variables aléatoires réelles de loi arbitraire
- Si
désigne une variable aléatoire réelle uniforme sur [0,1], alors
a pour fonction de répartition
.
Ainsi dans tout langage de programmation possédant un générateur de nombres aléatoires, on peut simuler une suite de longueur arbitraire de v.a.r. indépendantes de même fonction de répartition
, pourvu que
soit connue : il suffit alors d'appeler ce générateur de manière répétée, et d'appliquer la fonction
aux nombres produits par ces appels répétés.
Exemples
Exemples densité de probabilité fonction de répartition réciproque (généralisée) code Loi de Cauchy Loi exponentielle Loi uniforme sur [a,b] Loi de Bernoulli Loi uniforme sur Loi normale, Loi binomiale comme il n'y a pas de formule suffisamment explicite pour la fonction de répartition, et encore moins de formule explicite pour la réciproque de cette dernière, le théorème est alors inopérant. Autres conséquences du théorème de la réciproque
La réciproque généralisée de
est un exemple de v.a.r. dont la fonction de répartition est
, mais c'est un exemple privilégié. Ses utilisations sont nombreuses, allant de propriétés de l'ordre stochastique, à des propriétés de la distance de Wasserstein [1], en passant par le théorème de représentation de Skorohod, voir section suivante.
Convergence en loi et fonction de répartition
Considérons une suite de variables aléatoires
(resp. une variable aléatoire
) définies sur des espaces probabilisés
(resp.
) éventuellement différents, mais toutes à valeurs dans le même espace métrique
. On dit que
converge en loi vers
ssi, pour toute fonction continue bornée de
dans
,
On a le théorème suivant :
Théorème — Dans le cas de variables aléatoires réelles (
), notons
les fonctions de répartitions de
et de
. Il y a alors équivalence entre les 3 propositions ci-dessous :
converge en loi vers
,
- pour tout réel
en lequel
est continue,
,
- il existe un espace probabilisé
, et, définies sur cet espace, des variables aléatoires réelles
et
telles que, simultanément,
a même loi que
,
- pour chaque
,
a même loi que
,
converge presque sûrement vers
.
L'implication 1.
3. reste vraie lorsque les variables aléatoires réelles sont remplacées par des variables aléatoires à valeurs dans un espace de Lusin
, i.e. un espace métrisable assez général (
et
en sont des exemples). L'implication 1.
3. porte alors le nom de Théorème de représentation de Skorohod.
DémonstrationUne structure possible pour la démonstration est 3.
1.
2.
3.
3. implique 1.
C'est le plus simple. Il faut démontrer que
ou bien, équivalemment,
Mais la continuité de
assure que
converge presque sûrement vers
. De plus,
étant borné, on a que
pour tout
. Le théorème de convergence dominée de Lebesgue peut donc être appliqué ici, et donne la conclusion voulue.
1. implique 2.
On utilise la famille de fonctions continues bornées
définies par le graphe ci-contre. Elles vérifient, pour toute variable aléatoire réelle
,
et en particulier
On remarque alors que, pour tout
,
et
En faisant tendre
vers 0, on obtient
Ainsi, dès que
est un point de continuité de
,
2. implique 3.
Notons
, les réciproques généralisées de
. Pour le triplet
, choisissons
, et prenons pour
la tribu des boréliens et la mesure de Lebesgue correspondantes (i.e. restreintes à
). Le choix de
satisfait à 3.1. et à 3.2. en vertu du théorème de la réciproque. De plus, en conséquence de 2.,
converge presque sûrement vers
(mais cela mériterait d'être développé).
Voir aussi
- Article principal : Variable aléatoire
- Convergence de variables aléatoires
- Convergence en loi
- en:Wasserstein metric
- Inégalité de réarrangement
- Portail des probabilités et des statistiques
Catégorie : Probabilités - qu'une fonction de répartition
Wikimedia Foundation. 2010.