- Principe d'inclusion-exclusion
-
En combinatoire, le principe d’inclusion-exclusion permet d’exprimer le nombre d’éléments (ou cardinal) d'une réunion finie d'ensembles finis en fonction du nombre d'éléments de ces ensembles et de leurs intersections. Il se traduit directement en termes de probabilités.
Il est attribué au mathématicien Abraham de Moivre, et connu également (lui ou sa version probabiliste) sous le nom de formule du crible de Poincaré, formule de Poincaré, ou formule du crible.
Sommaire
Le cas deux ensembles
Exemple
Parmi 20 étudiants, 10 étudient les mathématiques, 11 étudient la physique, et 4 étudient les deux. Combien y a-t-il d’étudiants qui n’étudient ni les mathématiques ni la physique ?
Pour visualiser nous pouvons construire un diagramme de Venn.
Nous entourons les éléments qui vérifient la même propriété. E représente le groupe entier d’étudiants, M représente ceux qui ont la propriété d'« étudier les mathématiques », P représente ceux qui possède la propriété : d'« étudier la physique ».
Nous plaçons dans chaque partie le nombre d’étudiants. Étant donné que quatre personnes étudient à la fois les mathématiques et la physique, nous reportons un 4 dans l’intersection des deux cercles. Nous devons donc avoir 10-4=6 personnes qui étudient les mathématiques mais pas la physique et 11-4=7 personnes qui étudient la physique mais pas les mathématiques. Il reste donc 20-(6+4+7)=3 personnes qui n’étudient ni les mathématiques ni la physique.
Ce résultat se retrouve facilement en utilisant le principe d’inclusion-exclusion qui donne le nombre d’étudiants ne possédant pas ces deux propriétés 20-10-11+4=3.
Formule pour n = 2
Soient A et B deux ensembles finis, la formule s'écrit
où |A| et |B| représentent les cardinaux respectifs de A et B.
En d’autres termes, nous pouvons compter les éléments de la réunion de deux ensembles A et B en additionnant les cardinaux de ces deux ensembles et en soustrayant le cardinal de leur intersection.
Cas général
Soient A1, ..., An n ensembles finis. Nous avons
où |A| désigne le cardinal d'un ensemble fini A.
Cette formule peut aussi s'écrire de façon plus condensée
- .
Elle peut se démontrer par récurrence sur n, ou en utilisant les fonctions indicatrices.
Soit E un ensemble fini, contenant les ensembles Ai. On déduit par passage au complémentaire le cardinal de l'ensemble des éléments de E qui n'appartiennent à aucun des Ai :
- .
Le principe d’inclusion-exclusion peut se déduire d'une formule d'inversion de Möbius.
Version probabiliste
Soient un espace probabilisé et éléments de la tribu Nous avons
- .
Cette formule peut se démontrer par récurrence sur n, ou en utilisant des fonctions indicatrices, de la même manière que la formule précédente. On peut aussi la formuler de la manière suivante :
- .
Applications
Inégalités de Bonferroni
Les sommes partielles des premiers termes de la formule fournissent alternativement un majorant et un minorant de la somme complète, et peuvent être utilisées comme approximations de celle-ci : ces majorations et minorations sont appelées les inégalités de Bonferroni, du nom de leur auteur, Carlo Emilio Bonferroni.
Dérangements et nombre de points fixes d'une permutation
En combinatoire, la formule du crible permet de déterminer le nombre de dérangements d'un ensemble fini. Un dérangement d'un ensemble A est une bijection de A sur lui-même sans point fixe. Grâce au principe d'inclusion-exclusion de Moivre, nous pouvons prouver que si le cardinal de A est égal à n, alors le nombre de dérangements de A est le nombre entier le plus proche de n!/e (où e désigne la base des logarithmes népériens). Il s'ensuit que si toutes les bijections ont la même probabilité d'être choisies, alors la probabilité pour qu'une bijection prise au hasard soit un dérangement tend rapidement vers 1/e lorsque n tend vers l'infini.
On peut pousser plus loin l'étude statistique des points fixes des permutations. Notons N(ω) le nombre de points fixes d'une permutation ω. On remarque que N(ω)=0 si et seulement si ω est un dérangement. En cela la proposition suivante précise le résultat concernant les dérangements (qui n'est autre que le calcul de ) :
Proposition — Pour tout entier k compris entre 0 et n,
En particulier, la loi de N est très proche de la loi de Poisson de paramètre 1, pour n grand. Cela illustre le paradigme de Poisson[1], selon lequel une somme d'un grand nombre de variables de Bernoulli de petit paramètre, peu corrélées, suit approximativement la loi de Poisson : N peut être vu comme une telle somme. L'écriture de N comme somme de variables de Bernoulli permet un calcul rapide de l'espérance et de la variance de N, ce que l'expression explicite de la loi de N, donnée ci-dessus, ne permet pas.
DémonstrationL'espace probabilisé est ici l'ensemble fini des permutations de muni de la tribu triviale et de la loi uniforme. L'évènement Ak est l'ensemble des permutations laissant l'entier k invariant. Pour une partie S de notons AS l'ensemble des permutations de Ω qui laissent tous les éléments de S invariants. Ainsi
Via l'application qui, à une permutation ω de associe sa restriction au sous-ensemble AS est en bijection avec l'ensemble des permutations de donc le cardinal de AS est (n-#S)!. Par conséquent, la probabilité de AS est (n-#S)!/(n!). La formule d'inclusion-exclusion, sous sa forme probabiliste, s'écrit alors
En regroupant les parties S de même cardinal k, puisque la probabilité de AS ne dépend que du cardinal de S, on obtient
puis
Notons dn cette dernière probabilité, qui est la probabilité qu'une permutation de soit un dérangement : dn est obtenu en tronquant le développement en série de 1/e juste après le terme d'indice n (ce qui, entre parenthèses, est une manière, parmi d'autres, de justifier la convention d0=1 ). Pour une partie S de notons BS l'ensemble des permutations de Ω dont l'ensemble des points fixes est exactement S : BS est en bijection avec l'ensemble des dérangements de donc le cardinal de BS est (n-#S)! dn-#S. Ainsi
Or, par définition, une variable aléatoire X suit la loi de Poisson de paramètre a, si, pour tout k entier positif ou nul,
Le nombre de dérangements de A est le nombre entier le plus proche de n!/e grâce à une majoration (en valeur absolue) du reste d'une série alternée par le premier terme de ce reste, dans le cas où les valeurs absolues des termes d'une série alternée forment une suite décroissante.
Voir aussi
Notes
- (en) A. D. Barbour, L. Holst et S. Janson, Poisson approximation, The Clarendon Press Oxford University Press, 1992 (ISBN 0198522355).
Pages liées
Wikimedia Foundation. 2010.