Fonction de repartition

Fonction de répartition

Fonctions de répartition d'une variable discrète, d'une variable diffuse et d'une variable avec atome, mais non discrète.

En théorie des probabilités ou en statistiques, la fonction de répartition d'une variable aléatoire réelle caractérise la loi de probabilité de cette variable aléatoire réelle. La fonction de répartition de la variable aléatoire réelle $\ \scriptstyle X\$ est la fonction $\ \scriptstyle F_X$ qui à tout réel $\scriptstyle x$ associe

$F_X(x) = \mathbb{P}(X\leq x),$

où le membre de droite réprésente la probabilité que la variable aléatoire réelle $\ \scriptstyle X\$ prenne une valeur inférieure ou égale à $\ \scriptstyle x.\$ La probabilité que $\ \scriptstyle X\$ se trouve dans l'intervalle $\ \scriptstyle ]a, b]\$ est donc, si $\ \scriptstyle a<b,\$

$\mathbb{P}(a<X\le b)\ =\ F_X(b)-F_X(a).$

La fonction de répartition d'une mesure de probabilité $\ \scriptstyle \mathbb{P}\$ définie sur la tribu borélienne $\scriptstyle\ \mathcal{B}(\mathbb{R})$ est la fonction $\ \scriptstyle F$ qui à tout réel $\scriptstyle x$ associe

$F(x) = \mathbb{P}(]-\infty, x]).$

Exemples de calculs de la fonction de répartition

Variables à densité

Fonction de répartition de la loi normale centrée réduite

La fonction de répartition $\scriptstyle \ F_X\$ d'une variable aléatoire $\scriptstyle \ X\$ de densité de probabilité $\scriptstyle \ f_X$ est une des primitives (en un sens un peu relaché, voir ci-dessous) de cette densité $\scriptstyle \ f_X$ . Plus précisément $\scriptstyle \ F_X\$ est définie par:

$F_X(x)=\int_{-\infty}^{x} f_X(t)\, dt.$

Toutefois, ce n'est pas, en toute généralité, une primitive au sens strict du terme : on peut seulement affirmer

qu'une fonction de répartition $\scriptstyle \ F_X$ est dérivable presque partout (pour la mesure de Lebesgue),
que si la variable $\scriptstyle \ X\$ est à densité, alors la dérivée de $\scriptstyle \ F_X$ est presque partout (pour la mesure de Lebesgue) égale à $\scriptstyle \ f_X.$

Mais il y a beaucoup de "contre-exemples" : la fonction de répartition de la loi uniforme sur un intervalle, ou encore celle de la loi exponentielle, ne sont pas dérivables sur tout $\scriptstyle \ \mathbb{R},$ et ne sont donc pas, au sens strict, des primitives de densités de probabilités.

Notons que, contrairement aux variables discrètes, une variable à densité X vérifie $\scriptstyle \ P(X=a)=0\$ pour tout nombre réel a : en conséquence, la fonction de répartition des variables à densité est continue en tout point. En fait une variable aléatoire réelle X possède une densité de probabilité si et seulement si sa fonction de répartition est absolument continue sur chaque intervalle.

Variables discrètes

Fonction de répartition de la loi uniforme sur {0.2,0.4,0.6,0.8,1} (pour laquelle $\ \scriptstyle p_i=0.2,\ 1\le i\le 5\$ , en bleu) et de la loi uniforme sur l'intervalle [0,1] (en rouge)

Une variable aléatoire $\ \scriptstyle X\$ est dite discrète s'il existe un ensemble $\ \scriptstyle S\$ fini ou dénombrable tel que

$P(X\in S)=1.$

La loi de $\ \scriptstyle X\$ est déterminée sans ambiguité par la donnée de $\scriptstyle (p_s)_{s\in S}\$ , où

p s = P (X = s).

Si, par exemple, $\ \scriptstyle X\$ est une variable aléatoire réelle, on a

$F_X(x)=\sum_{s\in S}\ p_s\ 1_{[s;+\infty[}(x).$

où $\scriptstyle \ 1_E\$ est la fonction indicatrice de l'ensemble E.

Pour les variables aléatoires discrètes les plus courantes (par exemple, les lois uniformes, binomiales, de Poisson) $\ \scriptstyle S\$ est un ensemble bien ordonné : on peut alors numéroter ses éléments de manière croissante, p.e. $\scriptstyle s_1\le s_2\le s_3\le\dots$ et numéroter les probabilités $\scriptstyle \ p_s\$ en conséquence, p.e. en posant $\scriptstyle \ p_i=p_{s_i},\ i\ge 1$ . On a alors, si $\scriptstyle \ s_i\le x < s_{i+1},$

$F_X(x)= \sum_{1\le j\le i}p_j.$

Soit encore, plus généralement :

$\begin{align} F_X(x)&=\sum_{i\ge 1}\ q_i\ 1_{[s_i,s_{i+1}[}(x), \\ q_i&=\sum_{1\le j\le i}p_j. \end{align}$

La fonction de répartition est alors une fonction constante par intervalles et sa représentation graphique est en escalier. Les sauts d'une marche à l'autre de l'escalier se situent aux abscisses $\ \scriptstyle s_i\$ , et l'amplitude du saut d'abscisse $\ \scriptstyle s\$ est $\ \scriptstyle p_s=F_X(s)-F_X(s_-).$ En particulier la fonction de répartition d'une variable discrète X est discontinue exactement aux points s tels que $\ \scriptstyle P(X=s)><span class=$ 0.\ " style="max-width : 98%; height: auto; width: auto;" src="/pictures/frwiki/54/60f9f6dbd466a173bba4925b57a5e06b.png" border="0"> Voir la section Propriétés de la fonction de répartition pour une démonstration.

Miscellanées

L'escalier de Cantor est un exemple de fonction de répartition continue mais dont la dérivée est presque partout nulle. Ainsi, la formule précédente ne vaut pas pour l'escalier de Cantor : bien que la loi de probabilité associée à l'escalier de Cantor soit diffuse (sans atome), cette loi ne possède pas de densité. L'escalier de Cantor est en fait un exemple de fonction de répartition continue mais qui n'est pas absolument continue sur chaque intervalle.

Propriétés de la fonction de répartition

Propriétés caractéristiques

Théorème — La fonction de répartition d'une variable aléatoire $\scriptstyle \ X\$ a les propriétés caractéristiques suivantes :

$\scriptstyle \ F_X\$ est croissante ;
Elle est partout continue à droite ;
$\lim_{x \to -\infty}F_X(x) = 0$ ;
$\lim_{x \to +\infty}F_X(x)=1$ .

Démonstration

Le point 1 découle de la propriété de croissance des mesures de probabilité

$\{x\le y\}\Rightarrow\{]-\infty, x]\ \subset\ ]-\infty, y]\}\Rightarrow\{\mathbb{P}_{X}(]-\infty, x])\le\mathbb{P}_{X}(]-\infty, y])\}.$

Comme $\scriptstyle \ F_X\$ est monotone, le point 2 se réduit à montrer que

$\lim_{n}F_{X}\left(x+\tfrac1n\right)=F_{X}(x),$

ou encore, équivalemment,

$\lim_{n}\mathbb{P}_{X}\left(\left]-\infty, x+\tfrac{1}{n}\right]\right)=\mathbb{P}_{X}\left(\left]-\infty, x\right]\right).$

Mais les boréliens $\scriptstyle \ \left]-\infty, x+\tfrac{1}{n}\right]\$ forment une suite décroissante, et

$\bigcap_{n\ge 1}\left]-\infty, x+\tfrac1n\right]\ =\ \left]-\infty, x\right],$

donc le point 2 est une conséquence des axiomes des probabilités. Comme $\scriptstyle \ F_X\$ est monotone, le point 3 se réduit à montrer que

$\lim_{n}F_X(-n) = 0.$

Ceci est encore une conséquence des axiomes des probabilités, puisque

$\bigcap_{n\ge 1}\left]-\infty, -n\right]\ =\ \emptyset.$

Le point 4 découle, de la même manière, de

$\bigcup_{n\ge 1}\left]-\infty, n\right]\ =\ \R.$

Comme on l'a dit, les points 1 à 4 sont caractéristiques de la fonction de répartition d'une variable aléatoire réelle $\scriptstyle \ X\$ : étant donné une fonction réelle de la variable réelle, notons la $\scriptstyle F$ , satisfaisant les points 1 à 4, on peut construire concrètement une variable aléatoire réelle $\scriptstyle \ X\$ ayant $\scriptstyle F$ pour fonction de répartition, voir ci-dessous le théorème de la réciproque. Notons que cette construction sert à produire, sur ordinateur, des échantillons de taille arbitraire d'une loi de probabilité arbitraire, ce qui est l'ingrédient de base des méthodes de Monte-Carlo.

Autres propriétés

A cause des points 1, 3 et 4, $\scriptstyle \ F_X\$ est bornée, plus précisément

$\forall x \in \mathbb{R},\ \ \ 0\leq F_X(x)\leq 1.$

Comme toute fonction monotone bornée, $\scriptstyle \ F_X$ admet en tout point $\scriptstyle \ x$ une limite à gauche $\scriptstyle \ F_X(x_-)$ , limite à gauche égale ou non à $\scriptstyle \ F_X(x)\$ selon que $\scriptstyle \ F_X\$ est continue en $\scriptstyle \ x\$ ou non. L'ensemble des points de discontinuité de $\scriptstyle \ F_X\$ est fini ou dénombrable.

La connaissance de la fonction de répartition permet de définir la probabilité de tout intervalle

$P(X \in ]- \infty;x])\,=\,P(X \le x)\,=\,F_X(x),$
$P(X \in ]x; + \infty[)\,=\,P(X ><span class=$ x)\,=\,1-F_X(x)," style="max-width : 98%; height: auto; width: auto;" src="/pictures/frwiki/101/e59ebbcc8b457959cbdb2e7bdb40fa75.png" border="0">

par passage au complémentaire,

$P(X \in ]x;y])\,=\,P(x < X \le y)\,=\,F_X(y) - F_X(x),$

où l'on utilise $\scriptstyle \ \{A \subset B\}\ \Rightarrow\ \{P(B \setminus A) =P(B) - P(A)\},\$ pour $\scriptstyle \ A=]- \infty;x]\$ et $\scriptstyle \ B=]- \infty;y],\$

$P(X \in ]- \infty;x[)\,=\,P(X <x)\,=\,F_X(x_-),$

Cette propriété est la plus délicate et fait intervenir une conséquence des axiomes des probabilités sur la probabilité de l'union d'une suite croissante d'ensembles. On considère une suite $\scriptstyle \ (x_n)\$ de réels croissante, convergeant vers x. L'intervalle $\scriptstyle \ ]- \infty ; x[\$ est alors union dénombrable de la suite croissante d'intervalles $\scriptstyle \ ]- \infty ; x_{n}]$ . La probabilité de l'intervalle $\scriptstyle \ ]- \infty ; x[\$ est donc la limite des probabilités des intervalles $\scriptstyle \ ]- \infty ; x_{n}]$ , i.e. la limite de la suite $\scriptstyle \ F_X(x_{n} ).$ Par propriété des fonctions croissantes, cette limite existe et vaut $\scriptstyle \ F_X(x_-).$

$P(X \in ]x;y[ )\,=\,P(x < X < y)\,=\,= F_X(y_-)-F_X(x),$
$P(X \in [x;y[)\,=\,P(x\le X <y)\,=\,F_X(y_-) - F_X(x_-),$
$P(X \in [x;y])\,=\,P(x \le X \le y)\,=\,F_X(y) - F_X(x_-),$
En particulier $P(X=x) = F_X(x) - F_X(x_-)\,$

ces 4 dernières propriétés découlant de $\scriptstyle \ \{A \subset B\}\ \Rightarrow\ \{P(B \setminus A) =P(B) - P(A)\},\$ pour différents choix de $\scriptstyle \ A\$ et $\scriptstyle \ B.\$

On appelle atome de la variable aléatoire X tout réel a pour lequel $\scriptstyle \ P[X=a]><span class=$ 0" style="max-width : 98%; height: auto; width: auto;" src="/pictures/frwiki/51/351883ce7e7ade6bdd61ed0ef8401650.png" border="0">. Ainsi les atomes de la variable aléatoire X sont exactement les points de discontinuité de la fonction de répartition.

La fonction de répartition d'une variable aléatoire $\scriptstyle \ X\$ est donc continue si et seulement si X n'a aucun atome, i.e. si et seulement si

$\forall x\in\mathbb{R},\ P[X = x]=0.$

On dit alors que la loi de $\scriptstyle \ X\$ est diffuse, ou bien sans atome, et, par extension, que la variable aléatoire $\scriptstyle \ X\$ elle-même est diffuse ou sans atome. En particulier, les variables aléatoires réelles possédant une densité de probabilité sont diffuses. Il existe cependant des variables aléatoires diffuses mais ne possédant pas pour autant une densité de probabilité, c'est le cas, par exemple, de la variable aléatoire ayant pour fonction de répartition l'escalier de Cantor.

Caractérisation de la loi par la fonction de répartition

Théorème — La loi de probabilité d'une variable aléatoire réelle est caractérisée par sa fonction de répartition.

Ou bien encore : si deux variables aléatoires réelles ont même fonction de répartition, alors elles ont même loi (et réciproquement).

Démonstration

Sous l'hypothèse $\scriptstyle \ F_X=F_Y$ , on peut démontrer de manière élémentaire que $\scriptstyle \ \mathbb{P}(X\in A)=\mathbb{P}(Y\in A),$ dès que $\scriptstyle \ A$ est un borélien "simple" (par exemple, si $\scriptstyle \ A$ est un intervalle). Par contre, la démonstration générale (pour tout borélien $\scriptstyle \ A$ ) est un cas particulier du lemme d'unicité des probabilités, lui-même corrolaire du lemme de classe monotone, appliqué à la classe

$\mathcal{C}=\left\{(-\infty,x]\ |\ x\in\mathbb{R}\right\}.$

Il faut vérifier que

la classe $\scriptstyle\ \mathcal{C}\$ est stable par intersection finie,
la tribu engendrée par $\scriptstyle\ \mathcal{C}\$ contient (et en fait est égale à) la tribu borélienne.

Le lemme d'unicité des probabilités permet alors de conclure.

Vérifions 1. Soit $\scriptstyle\ I\$ une partie finie de $\scriptstyle\ \mathbb{R}\$ . Soit $\scriptstyle\ y\$ l'élément minimal de $\scriptstyle\ I$ . Alors

$\bigcap_{x\in I}(-\infty,x]\,=\,(-\infty,y]\ \in\ \mathcal{C}.$

Vérifions 2. La tribu engendrée par $\scriptstyle\ \mathcal{C}\$ est notée $\scriptstyle\sigma (\mathcal{C})$ . La tribu borélienne est notée $\scriptstyle\ \mathcal{B}(\mathbb{R})$ , comme souvent. Notons

$\mathcal{D}=\left\{(x,+\infty)\ |\ x\in\mathbb{R}\right\}.$

On a $\scriptstyle\ \mathcal{D}\subset\sigma (\mathcal{C}),$ en vertu de la stabilité des tribus par passage au complémentaire, donc $\scriptstyle\ \sigma (\mathcal{D})\subset\sigma (\mathcal{C}),$ par définition d'une tribu engendrée. On peut interchanger $\scriptstyle\ \mathcal{C}\$ et $\scriptstyle\ \mathcal{D}\$ dans ce qui précède, donc, par double inclusion,

$\sigma (\mathcal{C})=\sigma (\mathcal{D}).$

Comme $\scriptstyle\ \mathcal{D}\$ est une partie de l'ensemble des ouverts, on en déduit que

$\sigma (\mathcal{C})=\sigma (\mathcal{D})\ \subset \ \mathcal{B}(\mathbb{R}).$

Mais il nous faut surtout démontrer l'inclusion en sens inverse, et, pour cela, démontrer que tout ouvert de $\scriptstyle\ \mathbb{R}$ est dans $\scriptstyle\sigma (\mathcal{C})$ (ainsi $\scriptstyle\sigma (\mathcal{C})$ est une tribu contenant tous les ouverts de $\scriptstyle\ \mathbb{R}$ , alors que $\scriptstyle\ \mathcal{B}(\mathbb{R})$ est la plus petite tribu contenant tous les ouverts de $\scriptstyle\ \mathbb{R}$ ). Un argument rapide est de constater que

tout ouvert de $\scriptstyle\ \mathbb{R}$ est réunion dénombrable d'intervalles ouverts, et que
les intervalles ouverts sont dans $\scriptstyle\sigma (\mathcal{C})$ .

Le premier point résulte de ce que

un ouvert $\scriptstyle\ \mathcal{O}\$ est réunion disjointe de ses composantes connexes (cela est vrai pour toute partie de $\scriptstyle\ \mathbb{R}$ ),
les parties connexes de $\scriptstyle\ \mathbb{R},$ (et en particulier les composantes connexes ci-dessus) sont exactement les intervalles de $\scriptstyle\ \mathbb{R},$
comme $\scriptstyle\ \mathbb{R}$ est localement connexe, les composantes connexes d'un ouvert sont automatiquement ouvertes.
dans chaque composante connexe $\scriptstyle\ A\$ de notre ouvert $\scriptstyle\ \mathcal{O}$ , on peut choisir un nombre rationnel $\scriptstyle\ q_A$ . Les $\scriptstyle\ q_A$ sont distincts car les composantes sont disjointes. Ainsi $\scriptstyle\ A\ \rightarrow\ q_A$ est une bijection entre la famille des composantes connexes de $\scriptstyle\ \mathcal{O}\$ et une partie de $\scriptstyle\ \mathbb{Q}.$ La famille des composantes connexes de $\scriptstyle\ \mathcal{O}\$ est donc finie ou dénombrable.

Le deuxième point tient à ce que

$\scriptstyle\forall x\in\mathbb{R},\qquad(x,+\infty)\ \in\ \sigma (\mathcal{C}),\qquad$ comme on l'a vu plus haut ;
$\scriptstyle\forall y\in\mathbb{R},\qquad(-\infty,y)\ =\ \bigcup_{n\ge 1}\ \left(-\infty,y-\tfrac1n\right]\ \in\ \sigma (\mathcal{C})\$ ;
$\scriptstyle\forall x<y\,\in\ \mathbb{R},\qquad(x,y)\ =\ (-\infty,y)\,\cap\,(x,+\infty)\ \in\ \sigma (\mathcal{C}).$

CQFD

En d'autres termes, si deux variables aléatoires réelles, $\scriptstyle \ X\$ et $\scriptstyle \ Y$ , vérifient

$\forall x\in\mathbb{R},\qquad \mathbb{P}(X\le x)=\mathbb{P}(Y\le x),$

alors elles vérifient aussi que pour tout borélien $\scriptstyle\ A$ ,

$\ \qquad \mathbb{P}(X\in A)=\mathbb{P}(Y\in A).$

De plus, elles vérifient que pour toute fonction mesurable $\scriptstyle\ \varphi$ ,

$\ \qquad \mathbb{E}[\varphi(X)]=\mathbb{E}[\varphi(Y)],$

dès que l'un des deux termes de l'égalite a un sens.

Théorème de la réciproque

Soit $\ \scriptstyle F\$ une fonction de $\ \scriptstyle \mathbb{R}\$ dans $\ \scriptstyle \mathbb{R}\$ satisfaisant les 4 propriétés caractéristiques. Notons $\ \scriptstyle G\$ la fonction définie pour $\ \scriptstyle \omega \in]0,1[\$ par

$G(\omega)=\inf\left\{x\in\mathbb{R}\ |\ F(x)\ge\omega\right\}.$

Alors $\ \scriptstyle G\$ est une variable aléatoire réelle définie sur l'espace probabilisé $\ \scriptstyle \left(\Omega,\mathcal{A},\mathbb{P}\right)\$ où $\ \scriptstyle \left(\Omega,\mathcal{A}\right)=\left(]0,1[,\mathcal{B}(]0,1[)\right)\$ et où $\ \scriptstyle \mathbb{P}\$ désigne la restriction à $\ \scriptstyle \mathcal{B}(]0,1[)\$ de la mesure de Lebesgue sur $\ \scriptstyle \mathbb{R}\$ . Le théorème stipule que :

Théorème — Sur l'espace $\ \scriptstyle \left(\Omega,\mathcal{A},\mathbb{P}\right)\$ , la fonction de répartition de $\ \scriptstyle G\$ est $\ \scriptstyle F\$ .

Ainsi toute fonction $\ \scriptstyle F\$ de $\ \scriptstyle \mathbb{R}\$ dans $\ \scriptstyle \mathbb{R}\$ satisfaisant les 4 propriétés caractéristiques est fonction de répartition d'une variable aléatoire réelle (de $\ \scriptstyle G\$ , par exemple), ou encore d'une mesure de probabilité sur $\ \scriptstyle \left(\mathbb{R},\mathcal{B}(\mathbb{R})\right)\$ (de la loi de $\ \scriptstyle G\$ , par exemple).

Démonstration

Démonstration

Pour $\ \scriptstyle \omega \in \Omega=]0,1[\$ , notons

$A_{\omega}=\left\{x\in\mathbb{R}\ |\ F(x)\ge\omega\right\}.$

Donc $\ \scriptstyle G(\omega)=\inf A_{\omega}\$ . A cause du point 4, $\ \scriptstyle A_{\omega}\neq\emptyset\$ , et à cause du point 3, $\ \scriptstyle A_{\omega}\$ est bornée inférieurement, donc $\ \scriptstyle G\$ est bien définie.

Commençons par un cas simple à titre d'entrainement:

F est continue strictement croissante

Si $\ \scriptstyle F\$ est continue strictement croissante sur $\ \scriptstyle \mathbb{R}\$ , alors $\ \scriptstyle F\$ est une bijection de $\ \scriptstyle \mathbb{R}\$ dans ]0,1[, et $\ \scriptstyle G\$ est la réciproque de $\ \scriptstyle F\$ (on peut s'en convaincre en traçant $\ \scriptstyle A_{\omega}\$ à l'aide du graphe de $\ \scriptstyle F$ ). A ce titre, $\ \scriptstyle G\$ est continue et strictement croissante sur ]0,1[, et en particulier $\ \scriptstyle G\$ est mesurable (c'est donc une v.a.r.). On a, de plus,

$\left\{G(\omega)\le x\right\}\Leftrightarrow\left\{\omega\le F(x)\right\},$

donc

$\begin{align} \left\{\omega\in\Omega\ |\ G(\omega)\le x\right\} &= \left\{\omega\in\Omega\ |\ \omega\le F(x)\right\} \\ &= ]0, F(x)]. \end{align}$

Ainsi

$\mathbb{P}\left(G\le x\right) = \mathbb{P}(]0, F(x)]) =F(x).$

Démonstration dans le cas général

Cas général

Dans le cas général, on a également

$\left\{G(\omega)\le x\right\}\Leftrightarrow\left\{\omega\le F(x)\right\},$

et on conclut donc exactement de la même manière que précédemment, mais la démonstration de l'équivalence ci-dessus est moins directe. Tout d'abord, pour $\ \scriptstyle \omega\le \omega^{\prime}\$ , $\ \scriptstyle A_{\omega}\supset A_{\omega^{\prime}}\$ , et donc $\ \scriptstyle G(\omega)\le G(\omega^{\prime})\$ . Du fait que $\ \scriptstyle G\$ est monotone, il résulte que $\ \scriptstyle G\$ est mesurable.

On a, par définition de $\ \scriptstyle A_{\omega}$ et de $\ \scriptstyle G(\omega)$ ,

$\left\{\omega\le F(x)\right\}\Rightarrow\left\{x\in A_{\omega}\right\}\Rightarrow\left\{G(\omega)\le x\right\}.$

La réciproque vient de ce que $\ \scriptstyle \left\{G(\omega)\in A_{\omega}\right\}\$ , i.e. $\ \scriptstyle \left\{\omega\le F(G(\omega))\right\},\$ ce qui, avec $\ \scriptstyle \left\{G(\omega)\le x\right\}\$ entraîne, par croissance de $\ \scriptstyle F\$ , $\ \scriptstyle \left\{F(G(\omega))\le F(x)\right\},\$ et finalement $\ \scriptstyle \left\{\omega\le F(x)\right\}.$ Supposons en effet que $\ \scriptstyle G(\omega)\notin A_{\omega}$ , et considérons une suite strictement décroissante $\ \scriptstyle (x_{n})_{n\ge 0}$ d'éléments de $\ \scriptstyle A_{\omega}$ telle que

$\lim_{n} x_{n}\ =\ \inf A_{\omega}\ \left(=\ G(\omega)\right).$

Par continuité à droite de $\ \scriptstyle F\$ ,

$\lim_{n} F(x_{n})= F(G(\omega)),$

mais également, par définition de $\ \scriptstyle A_{\omega}$ ,

$\lim_{n} F(x_{n})\ge\omega,$

ce qui conduit à $\ \scriptstyle G(\omega)\in A_{\omega}$ , d'où une contradiction (démonstration largement reprise de Sidney Resnick, A Probability Path).

Remarques.

Lorsque $\ \scriptstyle F\$ est une bijection bicontinue d'un intervalle $\ \scriptstyle I\$ dans $\ \scriptstyle ]0,1[\$ (i.e. $\ \scriptstyle F\$ est continue strictement croissante), $\ \scriptstyle G\$ est tout simplement la réciproque de $\ \scriptstyle F\$ (i.e. $\ \scriptstyle G\circ F=\text{Id}_I\$ et $\ \scriptstyle F\circ G=\text{Id}_{]0,1[}\$ ). Pour cette raison, $\ \scriptstyle G\$ est parfois appelée réciproque généralisée de $\ \scriptstyle F.$
L'intérêt pratique de ce Théorème est développé dans l'article Méthode de la transformée inverse, ainsi que dans la section suivante.

Conséquences du théorème de la réciproque

Simulation de variables aléatoires réelles de loi arbitraire

Si $\ \scriptstyle U\$ désigne une variable aléatoire réelle uniforme sur [0,1], alors $\ \scriptstyle X=G(U)\$ a pour fonction de répartition $\ \scriptstyle F\$ .

Ainsi dans tout langage de programmation possédant un générateur de nombres aléatoires, on peut simuler une suite de longueur arbitraire de v.a.r. indépendantes de même fonction de répartition $\ \scriptstyle F\$ , pourvu que $\ \scriptstyle G\$ soit connue : il suffit alors d'appeler ce générateur de manière répétée, et d'appliquer la fonction $\ \scriptstyle G\$ aux nombres produits par ces appels répétés.

Exemples

Exemples
	densité de probabilité	fonction de répartition	réciproque (généralisée)	code
Loi de Cauchy	$\scriptstyle\frac1{\pi(1+x^2)}$	$\scriptstyle F(x)=\frac1{\pi}\left(\frac{\pi}2+\arctan(x)\right)$	$\scriptstyle G(\omega)=\tan\left(\pi(\omega-\frac12)\right)$	$\scriptstyle x\leftarrow\tan\left(\pi(\mathrm{rand()}-\frac12)\right)$
Loi exponentielle	$\scriptstyle \lambda\,e^{-\lambda x}\ 1_{x\ge 0}$	$\scriptstyle F(x)=\left(1-e^{-\lambda x}\right)\ 1_{x\ge 0}$	$\scriptstyle G(\omega)=-\frac1{\lambda}\ \ln(1-\omega)$	$\scriptstyle x\leftarrow\ -\frac1{\lambda}\ \ln(\mathrm{rand()})$
Loi uniforme sur [a,b]	$\scriptstyle \frac{1}{b-a}\ 1_{[a,b]}(x)$	$\scriptstyle F(x)=\frac{x-a}{b-a}\ 1_{[a,b]}(x)\ +\ 1_{]b,+\infty[}(x)$	$\scriptstyle G(\omega)=a+\omega(b-a)$	$\scriptstyle x\leftarrow a+(b-a)\mathrm{rand()}$
Loi de Bernoulli		$\scriptstyle F(x)=(1-p)\ 1_{[0,1[}(x)\ +\ 1_{[1,+\infty[}(x)$	$\scriptstyle G(\omega)=\lfloor p+\omega\rfloor$	$\scriptstyle x\leftarrow \lfloor p+\ \mathrm{rand()}\rfloor$
Loi uniforme sur $\scriptstyle\{1,2,\dots,n\}$		$\scriptstyle F(x)=\left\lfloor\frac{x}{n}\right\rfloor\ 1_{[0,1]}(x)\ +\ 1_{]1,+\infty[}(x)$	$\scriptstyle G(\omega)=\lceil n\omega\rceil$	$\scriptstyle x\leftarrow \lceil n\ \mathrm{rand()}\rceil$
Loi normale, Loi binomiale	comme il n'y a pas de formule suffisamment explicite pour la fonction de répartition, et encore moins de formule explicite pour la réciproque de cette dernière, le théorème est alors inopérant.

Autres conséquences du théorème de la réciproque

La réciproque généralisée de $\scriptstyle\ F\$ est un exemple de v.a.r. dont la fonction de répartition est $\scriptstyle\ F\$ , mais c'est un exemple privilégié. Ses utilisations sont nombreuses, allant de propriétés de l'ordre stochastique, à des propriétés de la distance de Wasserstein [1], en passant par le théorème de représentation de Skorohod, voir section suivante.

Convergence en loi et fonction de répartition

Considérons une suite de variables aléatoires $\scriptstyle\ (X_n)_{n\ge 0}\$ (resp. une variable aléatoire $\scriptstyle\ X\$ ) définies sur des espaces probabilisés $\scriptstyle\ \left(\Omega_n,\mathcal{A}_n,\mathbb{P}_n\right)\$ (resp. $\scriptstyle\ \left(\Omega,\mathcal{A},\mathbb{P}\right)\$ ) éventuellement différents, mais toutes à valeurs dans le même espace métrique $\scriptstyle\ (S,d)\$ . On dit que $\scriptstyle\ (X_n)_{n\ge 0}\$ converge en loi vers $\scriptstyle\ X\$ ssi, pour toute fonction continue bornée de $\scriptstyle\ (S,d)\$ dans $\scriptstyle\ \mathbb{R}\$ ,

$\lim_{n\rightarrow\infty} \mathbb{E}\left[f(X_n)\right]=\mathbb{E}\left[f(X)\right].$

On a le théorème suivant :

Théorème — Dans le cas de variables aléatoires réelles ( $\scriptstyle\ S=\mathbb{R}\$ ), notons $\scriptstyle\ (F_n)_{n\ge 0}, \ F\$ les fonctions de répartitions de $\scriptstyle\ (X_n)_{n\ge 0}\$ et de $\scriptstyle\ X$ . Il y a alors équivalence entre les 3 propositions ci-dessous :

$\scriptstyle\ (X_n)_{n\ge 0}\$ converge en loi vers $\scriptstyle\ X$ ,
pour tout réel $\scriptstyle\ x\$ en lequel $\scriptstyle\ F\$ est continue, $\scriptstyle\ \lim_{n\rightarrow\infty} F_n(x) = F(x)$ ,
il existe un espace probabilisé , et, définies sur cet espace, des variables aléatoires réelles et telles que, simultanément,
1. $\scriptstyle\ X^{\prime}$ a même loi que $\scriptstyle\ X$ ,
2. pour chaque $\scriptstyle\ n$ , $\scriptstyle\ X^{\prime}_n\$ a même loi que $\scriptstyle\ X_n\$ ,
3. $\scriptstyle\ (X^{\prime}_n)_{n\ge 0}\$ converge presque sûrement vers $\scriptstyle\ X^{\prime}\$ .

L'implication 1. $\scriptstyle\ \Rightarrow\$ 3. reste vraie lorsque les variables aléatoires réelles sont remplacées par des variables aléatoires à valeurs dans un espace de Lusin $\scriptstyle\ (S,d)$ , i.e. un espace métrisable assez général ( $\scriptstyle\ S=\mathbb{R}^d\$ et $\scriptstyle\ S=\mathcal{C}([0,1],\mathbb{R})\$ en sont des exemples). L'implication 1. $\scriptstyle\ \Rightarrow\$ 3. porte alors le nom de Théorème de représentation de Skorohod.

Démonstration

Une structure possible pour la démonstration est 3. $\scriptstyle\ \Rightarrow\$ 1. $\scriptstyle\ \Rightarrow\$ 2. $\scriptstyle\ \Rightarrow\$ 3.

3. implique 1.

C'est le plus simple. Il faut démontrer que

$\lim_{n\rightarrow\infty} \mathbb{E}\left[f(X_n)\right]=\mathbb{E}\left[f(X)\right],$

ou bien, équivalemment,

$\lim_{n\rightarrow\infty} \mathbb{E}\left[f(X^{\prime}_n)\right]=\mathbb{E}\left[f(X^{\prime})\right].$

Mais la continuité de $\scriptstyle\ f\$ assure que $\scriptstyle\ f(X^{\prime}_n)\$ converge presque sûrement vers $\scriptstyle\ f(X^{\prime})\$ . De plus, $\scriptstyle\ |f|\$ étant borné, on a que

$\left|f(X^{\prime}_n)\right|\ \le\Vert f\Vert_{\infty}$

pour tout $\scriptstyle\ n\$ . Le théorème de convergence dominée de Lebesgue peut donc être appliqué ici, et donne la conclusion voulue.

1. implique 2.

Fonction $\scriptstyle\ \varphi_{a,b}$ .

On utilise la famille de fonctions continues bornées $\scriptstyle\ \left(\varphi_{a,b}\right)_{(a,b)\in\mathbb{R}^2,\ a<b}\$ définies par le graphe ci-contre. Elles vérifient, pour toute variable aléatoire réelle $\scriptstyle\ Y$ ,

$\mathbb{P}\left(Y\le a\right) \le \mathbb{E}\left[\varphi_{a,b}(Y)\right] \le \mathbb{P}\left(Y\le b\right),$

et en particulier

$\mathbb{E}\left[\varphi_{x-\varepsilon,x}(X_n)\right] \le F_n(x) \le \mathbb{E}\left[\varphi_{x,x+\varepsilon}(X_n)\right].$

On remarque alors que, pour tout $\scriptstyle\ \varepsilon><span class=$ 0" style="max-width : 98%; height: auto; width: auto;" src="/pictures/frwiki/49/173492210ac388d942717dc205144675.png" border="0">,

$\begin{align} \limsup_n F_n(x) &\le \lim_n\mathbb{E}\left[\varphi_{x,x+\varepsilon}(X_n)\right] \\ &= \mathbb{E}\left[\varphi_{x,x+\varepsilon}(X)\right] \le \mathbb{P}\left(X\le x+\varepsilon\right) = F(x+\varepsilon), \end{align}$

$\begin{align} \liminf_n F_n(x) &\ge \lim_n\mathbb{E}\left[\varphi_{x-\varepsilon,x}(X_n)\right] \\ &= \mathbb{E}\left[\varphi_{x-\varepsilon,x}(X)\right] \ge \mathbb{P}\left(X\le x-\varepsilon\right) = F(x-\varepsilon). \end{align}$

En faisant tendre $\scriptstyle\ \varepsilon\$ vers 0, on obtient

$\ F(x_{-})\le\liminf_{n\rightarrow\infty} F_n(x) \le\limsup_{n\rightarrow\infty} F_n(x) \le F(x).$

Ainsi, dès que $\scriptstyle\ x\$ est un point de continuité de $\scriptstyle\ F\$ ,

$\ \lim_{n\rightarrow\infty} F_n(x) = F(x),\qquad\textrm{CQFD.}$

2. implique 3.

Notons $\scriptstyle\ (G_n)_{n\ge 0}, \ G$ , les réciproques généralisées de $\scriptstyle\ (F_n)_{n\ge 0}, \ F\$ . Pour le triplet $\scriptstyle\ \left(\widehat{\Omega},\widehat{\mathcal{A}},\widehat{\mathbb{P}}\right)\$ , choisissons $\scriptstyle\ \widehat{\Omega}=(0,1)$ , et prenons pour $\scriptstyle\ \left(\widehat{\mathcal{A}},\widehat{\mathbb{P}}\right)\$ la tribu des boréliens et la mesure de Lebesgue correspondantes (i.e. restreintes à $\scriptstyle\ (0,1)$ ). Le choix de $\scriptstyle\ X^{\prime}_n=G_n, \ X^{\prime}=G$ satisfait à 3.1. et à 3.2. en vertu du théorème de la réciproque. De plus, en conséquence de 2., $\scriptstyle\ (G_n)_{n\ge 0}\$ converge presque sûrement vers $\scriptstyle\ G\$ (mais cela mériterait d'être développé).

Voir aussi

Article principal : Variable aléatoire
Convergence de variables aléatoires
Convergence en loi
en:Wasserstein metric
Inégalité de réarrangement

Portail des probabilités et des statistiques

Ce document provient de « Fonction de r%C3%A9partition ».

Catégorie : Probabilités

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Fonction de repartition de Wikipédia en français (auteurs)

Игры ⚽ Нужно сделать НИР?

Regardez d'autres dictionnaires:

Fonction De Répartition — Fonctions de répartition d une variable discrète, d une variable diffuse et d une variable avec atome, mais non discrète. En théorie des probabilités ou en statistiques, la fonction de répartition d une variable aléatoire réelle caractérise la lo … Wikipédia en Français
Fonction de répartition — Fonctions de répartition d une variable discrète, d une variable diffuse et d une variable avec atome, mais non discrète. En théorie des probabilités ou en statistiques, la fonction de répartition d une variable aléatoire réelle caractérise la… … Wikipédia en Français
Fonction de répartition d'une variable aléatoire X — ● Fonction de répartition d une variable aléatoire X fonction F définie pour tout réel x par F(x) = PX<xrcub ; … Encyclopédie Universelle
Fonction de répartition empirique — En Statistiques, une fonction de répartition empirique est une fonction de répartition qui attribue la probabilité 1/n à chacun des n nombres dans un échantillon. Soit un échantillon de variables iid à valeurs dans avec pour fonction de… … Wikipédia en Français
fonction de répartition de probabilité — tikimybės pasiskirstymo funkcija statusas T sritis automatika atitikmenys: angl. probability distribution function vok. Wahrscheinlichkeitsverteilung, f rus. функция распределения вероятности, f pranc. fonction de répartition de probabilité, f … Automatikos terminų žodynas
Fonction de répartition conditionnelle — Probabilité conditionnelle La notion de probabilité conditionnelle permet de tenir compte dans une prévision d une information complémentaire. Par exemple, si je tire au hasard une carte d un jeu, j estime naturellement à une chance sur quatre la … Wikipédia en Français
répartition — [ repartisjɔ̃ ] n. f. • XVIIe; « distribution » 1389; de répartir 1 ♦ Opération qui consiste à répartir qqch. ⇒ distribution, partage. Répartition des vivres en période de pénurie. ⇒ contingentement, rationnement. Répartition des tâches entre… … Encyclopédie Universelle
Fonction D'erreur — Pour les articles homonymes, voir Fonction, Erreur et erf. Construction de la fonction d erreur réelle. En … Wikipédia en Français
Fonction d'erreur de Gauss — Fonction d erreur Pour les articles homonymes, voir Fonction, Erreur et erf. Construction de la fonction d erreur réelle. En … Wikipédia en Français
Fonction de Gauss — Fonction d erreur Pour les articles homonymes, voir Fonction, Erreur et erf. Construction de la fonction d erreur réelle. En … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

Fonction de repartition

Fonction de répartition

Sommaire

Exemples de calculs de la fonction de répartition

Variables à densité

Variables discrètes

Miscellanées

Propriétés de la fonction de répartition

Propriétés caractéristiques

Autres propriétés

Caractérisation de la loi par la fonction de répartition

Théorème de la réciproque

Démonstration

F est continue strictement croissante

Cas général

Conséquences du théorème de la réciproque

Simulation de variables aléatoires réelles de loi arbitraire

Exemples

Autres conséquences du théorème de la réciproque

Convergence en loi et fonction de répartition

3. implique 1.

1. implique 2.

2. implique 3.

Voir aussi

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Fonction de repartition

Fonction de répartition

Sommaire

Exemples de calculs de la fonction de répartition

Variables à densité

Variables discrètes

Miscellanées

Propriétés de la fonction de répartition

Propriétés caractéristiques

Autres propriétés

Caractérisation de la loi par la fonction de répartition

Théorème de la réciproque

Démonstration

F est continue strictement croissante

Cas général

Conséquences du théorème de la réciproque

Simulation de variables aléatoires réelles de loi arbitraire

Exemples

Autres conséquences du théorème de la réciproque

Convergence en loi et fonction de répartition

3. implique 1.

1. implique 2.

2. implique 3.

Voir aussi

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link