- Loi Hypergéométrique
-
Loi hypergéométrique
Hypergéométrique Densité de probabilité / Fonction de masse Fonction de répartition Paramètres Support Densité de probabilité (fonction de masse) Fonction de répartition Espérance np Médiane (centre) Mode Variance Asymétrie (statistique) Kurtosis (non-normalisé) Entropie Fonction génératrice des moments Fonction caractéristique Une loi hypergéométrique de paramètres n, p et A correspond au modèle suivant:
-
- On tire simultanément n boules dans une urne contenant pA boules gagnantes et qA boules perdantes (avec q = 1 - p). On compte alors le nombre de boules gagnantes extraites et on appelle X la variable aléatoire donnant le nombre de boules gagnantes.
L'univers X(Ω) est l'ensemble des entiers de 0 à n. La variable aléatoire suit une loi de probabilité définie par
- .
Cette loi de probabilité s'appelle la loi hypergéométrique de paramètres (n ; p ; A). Il est nécessaire que p soit un réel compris entre 0 et 1, que pA soit entier et que n ≤ A. Lorsque ces conditions ne sont pas imposées, l'ensemble des possibles X(Ω) est l'ensemble des entiers entre max(0;n-qA) et min(pA;n).
Une autre paramétrisation très répandue consiste à considérer une loi Hypergéométrique de paramètres (A, Na, n) avec A le nombre total de boules, Na le nombre de boules à succès (ici pA) et n le nombre de tirages.
Sommaire
Calcul de p(k)
Il s'agit d'un tirage simultané (c'est-à-dire non ordonné et sans remise) de n éléments parmi A. Tirage que l'on considère comme équiprobable.
La combinatoire permet de dire que le cardinal de l'univers est .
Tirage Resté dans l'urne Total succès k pA-k pA échec n-k qA - n + k qA Total n A-n A L'événement « X=k » (voir tableau) signifie que l'on a tiré k boules gagnantes parmi pA et n - k boules perdantes parmi qA. Le cardinal de cet événement est donc .
La probabilité de l'événement est donc
Espérance, variance et écart type
L'espérance d'une variable aléatoire suivant une loi hypergéométrique est la même que dans le cas binômiale. suit une loi hypergéométrique de paramètres , alors son espérance est .
DémonstrationOn se donne:
(si on se rapporte à un modèle d'urnes à tirage simultané, c'est-à-dire non ordonné et sans remise. On a donc : le nombre de boules de type "réussite" et : le nombre de boules de type "échec".)
Numérotons de 1 à les boules de type "réussite" et définissons pour tout compris entre 1 et l'événement:
{ on a tiré parmi les n boules la boule de type "réussite" k }. Comme le nombre total de boules de type "réussite" tirées est
(où 1 est la Fonction indicatrice de ), par linéarité de l'espérance, .
Évaluons maintenant . En passant au complémentaire,
qui est la probabilité de ne jamais tirer une boule donnée.
Donc
On en conclut donc que
En rappelant que qui est exactement la probabilité d'avoir un succès, on a bien .
La variance d'une variable aléatoire suivant une loi hypergéométrique de paramètres n, p, A est
L'écart type est alors .
Convergence
Pour n petit devant A, la loi hypergéométrique est équivalente à une loi binomiale de paramètres n et p. En fait, on considère que, pour A grand, tirer simultanément n boules revient à effectuer n fois une épreuve de Bernoulli dont la probabilité de succès serait p (p est la proportion de boules gagnantes dans l'ensemble des boules), car il est très peu probable de retomber sur la même boule, même si on la replace dans l'urne.
En pratique, on remplace la loi hypergéométrique de paramètres (n ; p ; A) par une loi binomiale de paramètres (n ; p) dès que 10n < A.
Un exemple très classique de ce remplacement concerne le sondage. On considère fréquemment le sondage de n personnes comme n sondages indépendants alors qu'en réalité le sondage est exhaustif (on n'interroge jamais deux fois la même personne). Comme n (nombre de personnes interrogées) < A (population sondée)/10, cette approximation est légitime.
Voir aussi
- probabilité
- probabilité (mathématiques élémentaires)
- Loi de probabilité
- Variables aléatoires élémentaires
Catégorie : Loi de probabilité -
Wikimedia Foundation. 2010.