- Loi de probabilité
-
En théorie des probabilités et en statistique, une loi de probabilité décrit soit les probabilités de chaque valeur d'une variable aléatoire (quand la variable aléatoire est discrète), soit la probabilité que la variable aléatoire appartienne à un intervalle arbitraire (quand la variable est continue)[1]. La loi de probabilité décrit l'ensemble des valeurs qu'une variable aléatoire peut atteindre et la probabilité que la valeur de la variable aléatoire soit dans n'importe quel sous ensemble (mesurable) de cet ensemble.
Quand la variable aléatoire prend ses valeurs dans
la loi de probabilité est complètement déterminée par sa fonction de répartition, dont la valeur en chaque réel x est la probabilité que la variable aléatoire soit inférieure ou égale à x.
Le concept de loi de probabilité (et le concept de variable aléatoire) sont les fondements des disciplines mathématiques appelées théorie des probabilités, et statistique. Il y a de la fluctuation ou de la variabilité dans presque toute valeur qui peut être mesurée dans une population (par exemple la taille des individus, la durabilité d'une pièce de métal, etc.) ; presque toutes les mesures ont une part d'erreur intrinsèque ; en physique, de nombreux processus ont une description probabiliste, de la théorie cinétique des gaz à la description quantique des particules élémentaires. Pour ces raisons en particulier, et pour beaucoup d'autres raisons, de simples nombres sont souvent inadéquats pour décrire une quantité, alors qu'une loi de probabilité est plus appropriée.
Bien des lois de probabilités apparaissent dans les applications. Une des plus importantes est la loi normale, qui est aussi connue sous le nom de distribution gaussienne ou de courbe en cloche et qui approxime de nombreuses lois de probabilités apparaissant dans les applications. Le jet d'une pièce donne lieu à une autre loi de probabilité naturelle, dont les valeurs possibles sont pile ou face, chacune avec probabilité 1/2.
Définition informelle
Une loi de probabilité se caractérise de différentes manières. Le plus souvent, on utilise la fonction de répartition pour caractériser une loi. Cela présente l'avantage d'être valable aussi bien pour les lois discrètes que continues. Dans le cas d'une loi continue, on utilise très souvent la densité, alors que dans le cas discret, la donnée des probabilités élémentaires suffit à caractériser la loi en question.
Exemples de lois discrètes
Une variable aléatoire X est discrète si l'ensemble de ses valeurs possibles est fini ou dénombrable. On dit alors que sa loi est discrète. Pour une définition plus formelle, voir la section "Classification des lois de probabilités sur la droite réelle". Pour la plupart des lois discrètes classiques, les valeurs possibles de X sont des entiers naturels. On définit alors la loi discrète en donnant la probabilité que X prenne chaque valeur entière possible n, soit
ou
Loi uniforme discrète
La loi uniforme discrète correspond à des événements équiprobables (exemple : lancer de dés, n=6 ) :
Loi de Bernoulli
La loi de Bernoulli correspond à une expérience à deux issues (succès - échec), codées resp. par les valeurs 1, 0, et en général non équiprobables :
où p est la probabilité de succès
où q = 1-p est la probabilité d'échec
Loi binomiale
C'est la loi du nombre de succès obtenus à l'issue de n épreuves de Bernoulli indépendantes de paramètre p.
pour tout k de 0 à n, p étant un réel compris entre 0 et 1
où q = 1 − p
Loi hypergéométrique
On tire simultanément n boules dans une urne contenant pA boules gagnantes et qA boules perdantes (avec q = 1 - p, soit un nombre total de boules valant pA + qA = A). On compte alors le nombre de boules gagnantes extraites et on appelle X la variable aléatoire donnant le nombre de boules gagnantes.
où A est un entier, pA et n des entiers inférieurs à A
Loi de Poisson
Loi géométrique
On considère une épreuve de Bernoulli dont la probabilité de succès est p et celle d'échec q = 1 - p.
On renouvelle cette épreuve de manière indépendante jusqu'au premier succès. On appelle X la variable aléatoire donnant le rang du premier succès.
Exemples de lois à densité
Une variable aléatoire réelle
possède une densité de probabilité
, si pour tous nombres réels
on a
On dit aussi alors que la loi
de
possède une densité, ou bien est à densité. D'une manière équivalente, on dit que
est absolument continue par rapport à la mesure de Lebesgue.
En conséquence,
pour tout nombre réel
et la fonction de répartition
de
est continue. On a plus précisément
Les variables aléatoires à densité sont parfois appelées variables continues.
Loi uniforme
Loi uniforme continue sur un intervalle borné [a; b] :
Loi normale
Loi exponentielle
Loi logistique
Loi de Cauchy
La loi de Cauchy n'admet aucun moment (donc ni moyenne ni variance, entre autres).
Loi de Tukey-Lambda
La Loi de Tukey-Lambda est connue de façon implicite par la distribution de ses quantiles :
elle a par la suite été généralisée.
Définition mathématique
En théorie des probabilités, une loi (ou mesure) de probabilité est une mesure positive
sur un espace mesurable
, telle que
. Le triplet
est appelé espace probabilisé.
Définition — Soit une variable aléatoire réelle sur l'espace probabilisé
, c'est-à-dire une fonction mesurable
(l'ensemble
étant muni de sa tribu borélienne
). On appelle loi (de probabilité) de la variable aléatoire
la mesure de probabilité
définie sur l'espace mesurable
par :
pour tout borélien
de
Autrement dit,
est la mesure image de
par
.
Deux variables aléatoires réelles
et
ont même loi si
(égalité de fonctions). Cela se réécrit
ou bien encore
Plus généralement, deux variables aléatoires réelles
et
ont même loi si
pour toute fonction
de
dans
telle qu'au moins un des deux termes de l'égalité ait un sens. Cela est dû au théorème de transfert, d'après lequel
Théorème de transfert — Soit une variable aléatoire réelle
Alors,
pour toute fonction
de
dans
telle qu'au moins un des deux termes de l'égalité ait un sens.
L'intégrale apparaissant dans le deuxième terme est l'intégrale, au sens de la théorie de la mesure, de la fonction φ par rapport à la mesure
Cette intégrale prend la forme d'une somme ou d'une intégrale dans les deux cas classiques où X est discrète et où X est à densité, voir ci-dessous.
Caractérisation de la loi de probabilité d'une variable aléatoire réelle
En probabilité, il est crucial de pouvoir vérifier que deux variables aléatoires (réelles ou pas) ont la même loi de manière la plus économique possible, or les caractérisations ci-dessus exigent de vérifier des familles d'identités beaucoup trop riches (pour tout borélien B, pour toute fonction borélienne φ ...). Une solution plus ergonomique est fournie par les notions de fonction de répartition, ou de fonction caractéristique.
Caractérisation à l'aide de la fonction de répartition
La loi d'une variable aléatoire réelle est caractérisée par sa fonction de répartition : deux variables aléatoires réelles
et
ont même loi si elles ont même fonctions de répartition, i.e. si
Ainsi il suffit de vérifier l'égalité caractéristique pour une famille réduite de boréliens
très particuliers, les boréliens de la forme
pour démontrer les égalités
et
en toute généralité. Ce résultat crucial est une conséquence du Lemme de classe monotone dû à Wacław Sierpiński.
Caractérisation à l'aide de la fonction caractéristique
La loi d'une variable aléatoire réelle est caractérisée par sa fonction caractéristique : deux variables aléatoires réelles
et
ont même loi si elles ont même fonction caractéristique, i.e. si
Ainsi il suffit de vérifier l'égalité caractéristique pour une famille réduite de fonctions
très particulières, les fonctions de la forme
et
pour démontrer que
et
ont même loi.
Caractérisation à l'aide de la transformée de Laplace
La loi d'une variable aléatoire réelle positive ou nulle est caractérisée par sa transformée de Laplace : deux variables aléatoires réelles positives ou nulles
et
ont même loi si elles ont même transformée de Laplace, i.e. si
0,\qquad\mathbb{E}\left[e^{-\lambda X}\right]\ = \mathbb{E}\left[e^{-\lambda Y}\right]." border="0">
Caractérisation à l'aide de la fonction génératrice
La loi d'une variable aléatoire à valeurs entières positives ou nulles est caractérisée par sa fonction génératrice : deux variables aléatoires à valeurs entières positives ou nulles
et
ont même loi si elles ont même fonction génératrice, i.e. si
Classification des lois de probabilité sur la droite réelle
Les lois énumérées dans cet article sont des mesures de probabilités sur
. Ces lois apparaissent en général dans les applications comme les lois de probabilité de certaines variables aléatoires réelles. Les lois énumérées dans cet article sont de deux types :
- lorsque la loi de la variable aléatoire X est portée par un ensemble S
- tel que S est fini ou dénombrable, on parle de loi de probabilité discrète.
- D'un point de vue pratique, les calculs de probabilités ou bien d'espérances liées à
font alors intervenir des calculs de sommes finies ou de séries:
- Pour une variable discrète, on peut choisir comme ensemble
l'ensemble des réels
tels que
0.\ " border="0">
- La deuxième égalité ci-dessus est la spécialisation du théorème de transfert au cas particulier des variables discrètes, puisque dans ce cas particulier, on a
- lorsque la loi de
est absolument continue par rapport à la mesure de Lebesgue sur
, ou bien, d'une manière équivalente, lorsque la fonction de répartition de
est localement absolument continue, on parle de variable ou de loi absolument continue, ou bien de variable ou de loi à densité. Dans ce cas, en vertu du Théorème de Radon-Nikodym, la mesure
(ou la variable
) possède une densité de probabilité (notons-la
) par rapport à la mesure de Lebesgue. D'un point de vue pratique, les calculs de probabilités ou bien d'espérances liées à
font alors intervenir des calculs d'intégrales :
- Là encore, la deuxième égalité ci-dessus est la spécialisation du théorème de transfert, mais cette fois, au cas particulier des variables à densité, puisque dans ce cas particulier, on a
- Une variable à densité
vérifie
pour tout nombre réel
Toutefois, cette dernière propriété, qui oppose les variables à densité aux variables discrètes, n'est pas caractéristique des variables à densité.
Il existe d'autres types de variables aléatoires réelles :
- la loi d'une variable aléatoire
peut très bien n'être ni discrète ni absolument continue. Elle peut, par exemple, être un mélange des deux : si la loi de la durée de vie (avant panne)
d'un composant d'un certain type suit la loi exponentielle d'espérance 1 (an), et si par mesure de sécurité, on décide de remplacer chaque composant en cas de panne, mais aussi dès que le composant atteint l'age d'un an, même s'il n'est pas encore tombé en panne, alors la durée d'utilisation
du composant (
) n'est ni discrète ni absolument continue. En effet les calculs de probabilités ou bien d'espérances liées à
font alors intervenir des calculs d'intégrales et de sommes :
- dans le cas précédent, la fonction de répartition de la durée d'utilisation
est discontinue en 1. C'est une propriété générale : la fonction de répartition d'une variable aléatoire réelle
est discontinue en
si et seulement si
0.\ " border="0"> On voit que les variables à densité ont des fonctions de répartitions localement absolument continues, donc, a fortiori, continues sur
alors que les fonctions de répartition des variables discrètes et du mélange évoqué précédemment possèdent des discontinuités sur la droite réelle. Le tableau est encore compliqué par l'existence de variables aléatoires dont la fonction de répartition est continue sur
mais pas absolument continue, et qui ne sont donc pas à densité. C'est le cas, par exemple, de
- où les
désignent une suite de variables de Bernoulli indépendantes de paramètre 0,5.
est un nombre dont on tire le développement triadique à pile ou face : à chaque pile on ajoute le chiffre 2, et à chaque face le chiffre 0, excluant ainsi le chiffre 1. La fonction de répartition de
est l'escalier de Cantor. Une telle variable doit-elle être appelée continue (sa fonction de répartition l'est), ou pas (elle n'a pas de densité de probabilité) ? Le débat n'est pas très aigu, car ce type de variables apparait rarement dans les applications.
Histoire
L'allure générale des lois de probabilité usuelles fut au début observée empiriquement, puis on en formalisa la définition dans le cadre de la théorie des probabilités en mathématiques.
Maximum d'entropie
Les lois de probabilité usuelles sont souvent classées par familles dépendant d'un paramètre. La loi normale par exemple est paramétrée par sa moyenne et son écart type. La plupart des familles usuelles de lois de probabilités sont celles offrant le maximum d'entropie (l'entropie est une mesure de l'information moyenne d'une source, au sens de Claude Shannon, donc le plus d'information) sous contraintes, par exemple :
- La distribution uniforme est celle d'entropie maximale parmi les lois à support borné.
- La distribution normale est celle d'entropie maximale parmi toutes les lois possibles ayant même moyenne et même écart type.
- La distribution exponentielle est celle d'entropie maximale parmi les lois portées par
et ayant la même moyenne.
- Les lois scalantes comme celle de Zipf ou de Mandelbrot sont d'entropie maximale parmi celles auxquelles on impose la valeur du logarithme d'une moyenne, c'est-à-dire un ordre de grandeur.
En quelque sorte, ces lois ne contiennent pas plus d'information que ce qui est obligatoire. Ce sont les moins prévenues de toutes les lois compatibles avec les observations ou les contraintes, et donc les seules admissibles objectivement comme distributions de probabilités a priori lorsque ces valeurs sont imposées et seules connues. Cette propriété joue un grand rôle dans les méthodes bayésiennes.
Voir aussi
Exemples de distribution
- Distribution de Gauss
- Distribution de Poisson
- Distribution de Lévy
- Distribution de Lévy tronquée
- Distribution de Dirac
- Distribution de Gumbel
- Distribution de Boltzmann
- Distribution de Bose-Einstein
- Distribution de Weibull
- Distribution de Dirichlet
- Distribution de Pareto
- Distribution Zeta
Références
- B.S. Everitt. 2006. The Cambridge Dictionary of Statistics, Third Edition. pp. 313–314. Cambridge University Press, Cambridge. ISBN 0-521-69027-7
Liens connexes
- Portail des probabilités et des statistiques
Wikimedia Foundation. 2010.