- Loi tronquée (probabilités)
-
En probabilité et en statistiques, une loi tronquée est une loi conditionnelle, dérivée d'une autre loi de probabilité. Plus clairement, pour une variable aléatoire X de support réel, dont la fonction de répartition est F, la loi tronquée à l'intervalle réel [a,b] est simplement la loi conditionnelle de . Ce type de situation survient dans la censure statistique. Par exemple, pour l'étude de la durée passée au chômage, durant le temps d'observation, certaines personnes étaient déjà au chômage au début de l'étude mais retrouvent du travail dans ce laps de temps (troncature à gauche) et d'autres perdent leur emploi et restent au chômage au-delà de la fin de l'étude (troncature à droite). L'étude de la loi tronquée permet alors d'évaluer la fonction de vraisemblance.
Sommaire
Densité
Pour une variable aléatoire X, de support réel, et dont la fonction de répartition est F et la densité f, on peut montrer que le conditionnement de X à l'intervalle réel [a;b] donne:
avec . La densité g associée est
pour , 0 sinon. g est une densité, puisque
- .
Il existe d'autres troncatures; pour une troncature du type X > y, la densité devient- ,
pour y < x et g(x) = 0 partout ailleurs.
Pour une troncature du type , la densité est:
pour et 0 sinon.
Espérance d'une variable aléatoire tronquée
L'espérance de X conditionnellement à l'événement X > y est
Soit alors a et b le support de la variable initiale, pour une fonction C1, la fonction (de y) E(u(X) | X > y) présente quelques propriétés:
- ;
- ;
- ;
- ;
- .
On suppose bien sûr que les limites suivantes existent: , et où c représente soit a ou b.
Loi normale tronquée
La loi tronquée la plus utilisée est la loi normale tronquée, obtenue à partir d'une Loi normale. Elle est utilisée en économétrie dans le modèle Tobit et le modèle Probit, afin de modéliser respectivement les données censurées et les probabilités de choix binaire.
Si , et qu'on contraint X à appartenir à l'intervalle [a;b] avec . Alors la densité tronquée est
avec est la densité de la loi normale standard, et sa Fonction de répartition. On impose la convention que si , alors et de même, si , alors .
Les moments pour une double troncature sont
Pour une simple troncature, ces moments deviennent
- E(X | a < X) = μ + σλ(α)
et
- Var(X | X > a) = σ2[1 − δ(α)]
avec
Troncature aléatoire
Considérons la configuration suivante: une valeur de troncature, disons t, est tirée au hasard, depuis une densité de probabilité g(t), non-observable. On observe alors une valeur x tirée dans la densité tronquée f(x | t). On souhaite, à partir de l'observation de x, mieux connaître la densité de t.
Par définition, on a déjà:
et
t doit être plus grand que x, et par conséquent, lorsqu'on intègre sur t, il faut poser x comme borne inférieure.
Par le théorème de Bayes:
qui devient
Exemple: deux variables uniformes
En supposant que t est uniformément distribuée sur [0;T] et que X|t est aussi uniformément distribuée, cette fois-ci sur [0;t]. Soit g(t) et f(x | t) les densités décrivant respectivement t et x. On suppose observer une valeur de x, et la distribution de t sachant x est
pour t > x.
Voir aussi
Références
- Greene, William H. (2003). Econometric Analysis (5th ed.). Prentice Hall. (ISBN 0-13-066189-9)
- Norman L. Johnson and Samuel Kotz (1970). Continuous univariate distributions-1, chap. 13. John Wiley & Sons.
- Portail des probabilités et des statistiques
Wikimedia Foundation. 2010.