- Densité De Probabilité
-
Densité de probabilité
En théorie des probabilités ou en statistiques, une densité de probabilité est une fonction qui permet de représenter une loi de probabilité sous forme d'intégrales.
Formellement, une loi de probabilité possède une densité ƒ, si ƒ est une fonction définie sur
positive ou nulle et Lebesgue-intégrable, telle que la probabilité de l'intervalle [a, b] soit donnée par
pour tous nombres a<b. Par exemple, si la variable X a pour densité de probabilité la fonction ƒ, la probabilité que la variable X soit dans l'intervalle [4,3, 7,8] sera
Cela implique que l'intégrale de ƒ sur tout
donne 1. Réciproquement, pour toute fonction ƒ positive ou nulle et Lebesgue-intégrable, d'intégrale égale à 1 :
il existe une loi de probabilité ayant ƒ pour densité de probabilité.
Intuitivement, si une loi de probabilité a pour densité ƒ, alors l'intervalle infinitésimal [x, x + dx] a pour probabilité ƒ(x) dx.
Informellement, une densité de probabilité peut être vue comme la limite d'un histogramme : si on dispose d'un échantillon suffisamment important de valeurs d'une variable aléatoire à densité, représenté par un histogramme des fréquences relatives des différentes classes de valeurs, alors cet histogramme va ressembler à la densité de probabilité de la variable aléatoire, pourvu que les classes de valeurs soient suffisamment étroites.
Sommaire
Densité de probabilité d'une variable aléatoire réelle
Lien entre la densité, f et la fonction de répartition (haut), et, plus généralement, les probabilités (bas).Définition — En théorie des probabilités ou en statistiques, on dit qu'une fonction
est une densité de probabilité d'une variable aléatoire réelle
si, pour tout réel
La probabilité
se calcule alors par la relation suivante :
En traçant la représentation graphique de la densité de probabilité, la probabilité
se lit comme l'aire sous la courbe sur l'intervalle
En conséquence, la fonction de répartition
de
est continue, et
pour tout nombre réel
En cela, le comportement d'une variable à densité est très différent de celui d'une variable discrète.
Définition informelle de la densité de probabilité
La définition qui suit est une reformulation de la définition intégrale proposée en début d'article. C'est la définition utilisée en général par les physiciens, en particulier ceux issus du domaine de la physique statistique.
Si
est un nombre réel positif infiniment petit, alors la probabilité que
soit inclus dans l'intervalle
est égale à
soit:
Cette « définition » est très utile pour comprendre intuitivement à quoi correspond une densité de probabilité, et est correcte dans beaucoup de cas importants. On peut tracer une analogie avec la notion de densité de masse, ou encore avec la notion de densité de population. Une formulation plus mathématique serait
ce qui permet de comprendre en quoi la définition donnée en physique n'est pas complètement rigoureuse :
et il est alors facile de vérifier que si
possède une limite à droite en
, notons-là
on a alors
ce qui corrobore la définition physique lorsque
est continue à droite en
mais la met en défaut quand
Bien sûr, les densités de probabilités usuelles sont continues à droite sauf éventuellement en un nombre fini (et en un petit nombre) de points.
Notons que ce genre d'interprétation infinitésimale (ou issue de la physique) s'étend aux dimensions
voir la section suivante.
Densité de la médiane de 9 variables i.i.d. :Soit
une suite de 9 v.a. r. i.i.d. de même densité
et de même fonction de répartition
Notons
la médiane de cette suite. Alors :
On peut voir cela comme une suite de 9 expériences aléatoires indépendantes faites dans les mêmes conditions, avec à chaque fois 3 issues : "
", "
" et "
", de probabilités respectives
et
donc la probabilité ci dessus est donnée par la loi multinomiale de paramètres 3, 9 et
Ainsi :
et la densité de
est
Cette méthode est détaillée dans le livre de David[1]. Un résultat plus général se trouve dans Statistique d'ordre.
Critères d'existence d'une densité
En vertu d'un théorème dû à Lebesgue[2], la fonction de répartition d'une variable aléatoire réelle
étant croissante, est dérivable presque partout sur
et la dérivée ainsi obtenue est positive et intégrable sur
d'intégrale inférieure ou égale à 1.
Critère 1 —
possède une densité de probabilité si et seulement si l'intégrale de la dérivée de la fonction de répartition est exactement égale à 1. Cette dérivée est alors une des densités de probabilité de
Critère 2 — Si la fonction de répartition de
est de classe
par morceaux sur
et est, d'autre part, continue sur
alors la dérivée de la fonction de répartition de
est une des densités de probabilité de
Densité de la médiane de 9 variables i.i.d. (bis) :Pour le calcul de la densité de la médiane de 9 variables i.i.d., une solution plus rigoureuse que celle de la section précédente, mais plus lourde, est de calculer la fonction de répartition de la médiane, puis de la dériver. On reconnait un schéma de Bernoulli : le nombre d'indices
tels que
suit une loi binomiale de paramètres 9 et
En dérivant, on trouve :
Après quelques manipulations sur les coefficients binomiaux, tous les termes de cette somme se télescopent, sauf une partie du premier terme, ce qui donne :
puis
donc
satisfait le critère 1. CQFD
On pourra consulter le livre de David[1] (pages 8-13) pour plus de détails.
Densité de probabilité d'un vecteur aléatoire
Définition — On appelle densité de probabilité d'une variable aléatoire
à valeur dans
une fonction
telle que pour toute partie borélienne
Cette définition est en particulier valable pour
et est donc équivalente à la première définition, dans le cas particulier
Théorème — Soit une variable aléatoire
à valeur dans
, de densité
et soit
une fonction borélienne de
dans
Alors, dès qu'un des deux termes de l'égalite suivante
a un sens, alors l'autre aussi, et l'égalité a lieu. Réciproquement, si l'égalité ci-dessus a lieu pour tout
borélien borné, alors
est une densité de
Il existe des variables aléatoires, réelles ou bien à valeurs dans
, qui ne possèdent pas de densité de probabilité, par exemple les variables aléatoires discrètes. Les variables aléatoires qui possèdent une densité de probabilité sont appelées parfois variables à densité, parfois variables continues.
Si une fonction
est la densité de probabilité d'une variable aléatoire à valeur dans
, cette fonction vérifie les propriétés suivantes
est intégrable sur
;
;
est presque sûrement positive ou nulle sur
.
Réciproquement, si une fonction
vérifie les 3 propriétés ci-dessus, on peut construire une variable aléatoire
à valeur dans
ayant
pour densité de probabilité.
Espérance, variance et moments d'une variable aléatoire réelle à densité
Soit
une variable aléatoire réelle ayant une densité de probabilité
. Alors, d'après le théorème de transfert,
possède un moment d'ordre
si et seulement si
on a dans ce cas
En particulier, lorsque le moment d'ordre 2 existe :
et, d'après le théorème de König-Huyghens,
Existence
En vertu du théorème de Radon-Nikodym, le vecteur aléatoire
possède une densité si et seulement si, pour chaque borélien
de
dont la mesure de Lebesgue est nulle, on a
Ce critère est rarement employé dans la pratique pour démontrer que
possède une densité, mais il est en revanche utile pour démontrer que certaines probabilités sont nulles. Par exemple, si le vecteur aléatoire
possède une densité, alors
,
,
,
,
pour des fonctions
et
suffisamment régulières[3], parce que la mesure de Lebesgue (c'est-à-dire la surface) de la 1re bissectrice (resp. du cercle unité, du graphe de la fonction
ou de la courbe d'équation
) sont nulles.
Le critère de Radon-Nikodym peut aussi être utilisé pour démontrer qu'un vecteur aléatoire ne possède pas de densité : par exemple, si
où
désigne une variable aléatoire à valeur dans
(par exemple, si
est tiré au hasard uniformément sur le cercle unité, c'est-à-dire si
suit la loi uniforme sur
), alors
ne possède pas de densité car
Non-unicité de la densité de probabilité
Si
et
sont deux densités de probabilités de la même variable aléatoire
alors
et
sont égales presque partout. Réciproquement, si g est presque partout égale à une densité de probabilité de
alors g est une densité de probabilité de
Ainsi une variable aléatoire à densité possède-t-elle toujours une infinité de densités de probabilité : par exemple, en perturbant l'une des densités de
de manière arbitraire en un nombre fini de points, on obtient encore une densité de
Densité jointe de plusieurs variables aléatoires réelles
La fonction
définie de
dans
est une densité jointe de la suite de variables aléatoires réelles
si
est une densité de probabilité du vecteur aléatoire
à valeurs dans
défini par
On peut alors calculer la probabilité d'événements concernant les variables aléatoires réelles
de la manière suivante :
Exemple :Si
s'écrit
où
désigne le demi-plan sous la première bissectrice
On a alors, par définition de la densité,
Si par exemple
et
sont indépendants et ont même densité de probabilité
alors une densité de
est
, c'est-à-dire une densité de
est
défini par
. En ce cas,
Si par contre
p.s., le vecteur
a les mêmes lois marginales (
et
ont
pour densité de probabilité), mais n'a pas la même loi jointe, puisqu'alors
Ainsi la donnée des densités marginales de
et
seules, ne permet pas de calculer la probabilité d'événements faisant intervenir à la fois
et
comme par exemple l'évènement
Pour effectuer le calcul, on utilise ordinairement la loi jointe de
et
définie dans le cas ci-dessus par leur densité jointe.
Densité marginale
Soit
un vecteur aléatoire à valeurs dans
de densité
et pour
soit
et
les deux coordonnées de
. On notera
Alors
Propriété — Les variables aléatoires réelles
et
possèdent toutes deux des densités, notons les
et
, et ces densités sont données par
Les densités de probabilités
et
sont appelées les densités marginales de
DémonstrationCalculons
où
est une fonction borélienne bornée. Pour cela on peut voir
comme une fonction de
disons
où
et
désigne la projection sur la première coordonnée. Alors
Cela a lieu pour tout
borélien borné, car
est borné donc intégrable, et
est donc bien défini. En comparant le premier et le dernier terme de la série d'égalités ci-dessus, on voit que la marginale
satisfait la condition requise pour être une densité de probabilité de
CQFD
Le cas de
peut être traité de la même manière.
Plus généralement, si
définie de
dans
est une densité jointe de :
on peut calculer une densité
de (par exemple)
de la manière suivante (si
par exemple) :
c'est-à-dire en intégrant par rapport à toutes les coordonnées qui ne figurent pas dans le triplet
La fonction
est elle aussi appelée « densité marginale » ou « marginale » de
Une formulation générale serait lourde. La démonstration générale est calquée sur la démonstration de la propriété ci-dessus.
Densité de la médiane de 9 variables i.i.d. (ter) :La densité jointe des 9 statistiques d'ordre[4], notées ici
de l'échantillon
est donnée par :
Par définition des statistiques d'ordre, la médiane
est aussi la 5-ème statistique d'ordre,
On a donc :
Ainsi, de proche en proche,
Indépendance des variables aléatoires à densité
Soit une suite
de variables aléatoires réelles définies sur le même espace de probabilité
Théorème —
- Si
possède une densité de probabilité
qui s'écrit sous forme « produit » :
- où les fonctions
sont boréliennes et positives ou nulles, alors
est une suite de variables indépendantes. De plus, la fonction
définie par
- est une densité de la composante
- Réciproquement, si
est une suite de variables aléatoires réelles indépendantes de densités de probabilité respectives
alors
possède une densité de probabilité, et la fonction
définie par
- est une densité de probabilité de
Démonstration dans le cas de deux variables- Sens direct
Comme la densité
est sous forme produit, on a
et par suite
Par construction les fonctions
sont d'intégrale 1, donc
Ainsi les fonctions
sont les densités de probabilités marginales des deux composantes de
Par suite, pour tout couple de fonctions
et
tel que le premier terme ci-dessous ait un sens, on a
ce qui entraine l'indépendance des variables
et
- Sens réciproque
Il suffit de montrer que
où
est la loi de
et où
est la mesure ayant pour densité
Or
où
est la classe des pavés boréliens :
En effet
On remarque alors que
est un π-système et que la tribu engendrée par
est
donc, en vertu du lemme d'unicité des mesures de probabilités,
Fonction de variables aléatoires à densité
Dans cette section, on considère la question suivante : étant donnée une variable aléatoire
de densité
et une fonction
quelle est la loi de la variable aléatoire
En particulier, sous quelles conditions
possède-t-elle aussi une densité de probabilité
? Et comment peut-on la calculer ? Une réponse rapide est que, localement, on doit pouvoir appliquer à la fonction g le théorème d'inversion locale sauf sur un ensemble de points de mesure de Lebesgue nulle). Le calcul de
se résume alors à un changement de variable dans une intégrale simple ou multiple, comme cela est illustré dans les quelques exemples ci-dessous.
Somme de variables aléatoires indépendantes
La densité de probabilité de la somme de deux variables aléatoires indépendantes U et V, chacune ayant une densité fU et fV, est donnée par une convolution de ces densités:
Dans cet exemple,
et
DémonstrationDans cet exemple,
et
Alors, pour toute fonction
mesurable bornée,
où
désigne le déterminant jacobien correspondant au changement de variable
c'est-à-dire
Donc, pour toute fonction
mesurable bornée,
CQFD
Pour déterminer la loi de la somme de variables indépendantes, on peut aussi passer par la fonction génératrice des moments ou par la fonction caractéristique d'une variable aléatoire[5] . C'est ainsi qu'est démontré le théorème de la limite centrale.
Fonction d'une variable aléatoire réelle à densité
Notons
la densité de la variable aléatoire réelle
Il est possible de considérer un changement de variable, dépendant de x. La transformation est la suivante: Y = g(X) où la fonction g est strictement monotone et dérivable, de dérivée qui ne s'annule nulle part. La densité fY(y) de la transformée est
Théorème —
où g−1 représente la fonction réciproque de g et g' la dérivée de g.
DémonstrationCe résultat découle du fait que les probabilités sont invariantes par changement de variable. Supposons par exemple que g est décroissante :
En différenciant, on obtient
qui s'écrit encore
Le cas où g est croissante se traite de manière analogue.
Pour une transformation g non monotone, la densité de probabilité de Y est
où n(y) est le nombre de solutions en x de l'équation g(x) = y, et
sont les solutions. La fonction g doit vérifier certaines hypothèses, toutefois : essentiellement on doit pouvoir lui appliquer le théorème d'inversion locale sauf sur un ensemble de points de mesure de Lebesgue nulle. Par exemple un ensemble d'hypothèses peu limitatif mais simple à vérifier serait : g est de classe C1 et l'ensemble des zéros de la dérivée g' est localement fini. Il s'agit d'exclure entre autres (mais pas seulement) le cas où g est constante sur un ensemble de mesure non nulle pour la loi de X, cas où g(X) n'a pas une loi à densité, car la loi de g(X) peut alors avoir une partie discrète.
Exemples :- Prenons l'exemple d'une fonction affine ; si
alors :
En effet, si, par exemple, a est strictement négatif, on obtient, via le changement de variable
- ceci pour toute fonction
mesurable bornée. CQFD
- Prenons l'exemple du carré d'une variable aléatoire ; on sait que, si
0}du,\end{align}" style="max-width : 98%; height: auto; width: auto;" src="/pictures/frwiki/57/97b3bf70bc2085cf9046944027fa9af8.png" border="0">
- ceci pour toute fonction
mesurable bornée. Ainsi, on trouve que
0}" style="max-width : 98%; height: auto; width: auto;" src="/pictures/frwiki/56/8c722d52895b73c91fff912f369494ae.png" border="0">
- ce qui est conforme à la formule.
- Autre solution : on sait que,
- si
:
- si
-
- si
alors FY(y) = 0.
- si
- En dérivant, on trouve à nouveau
0}." style="max-width : 98%; height: auto; width: auto;" src="/pictures/frwiki/97/abeaf0a1897715a264d8b112e3929fdd.png" border="0">
Contre-exemple :Prenons X uniforme sur [0,2] et
Alors
Autrement dit, la loi de Y a une partie à densité, mais aussi un atome en 1.
Notes et références
- ↑ a et b Herbert Aron David, Order Statistics [détail des éditions], pages 8-13
- ↑ E. Hewitt & K. Stromberg, Real and Abstract Analysis [détail des éditions], Théorème 17.12, p. 264 et Théorème 18.16, p. 285.
- ↑ en effet il faut éviter des phénomènes de type "Courbe de Peano".
- ↑ Herbert Aron David, Order Statistics [détail des éditions], Ch. 1.
- ↑ que ces variables aléatoires ait une densité de probabilité, ou qu'elles n'en aient pas. Notons que, si une variable aléatoire possède une densité de probabilité, alors sa fonction caractéristique est la transformée de Fourier de cette densité.
Voir aussi
Articles connexes
- Portail des probabilités et des statistiques
Catégorie : Probabilités
Wikimedia Foundation. 2010.