- Paradoxe des deux enfants
-
En mathématiques, le paradoxe des deux enfants est un problème de théorie des probabilités évaluant le genre sexuel de deux enfants à partir d'une information sur l'un des deux. La qualification de ce problème comme paradoxe vient du fait que des formulations équivalentes en apparence mènent à des résultats différents.
Sommaire
Énoncé original
Formulation
La première occurrence de ce problème est un article de Martin Gardner, paru dans la revue Scientific American en 1959 sous le titre The Two Children Problem[1].
- Mr. Jones has two children. The older child is a girl. What is the probability that both children are girls?
- Mr. Smith has two children. At least one of them is a boy. What is the probability that both children are boys?
- M. Jones a deux enfants. L'ainé est une fille. Quelle est la probabilité que les deux enfants soient des filles ?
- M. Smith a deux enfants. Au moins l'un des deux est un garçon. Quelle est la probabilité que les deux enfants soient des garçons ?
Dans cet article, les probabilités étaient évaluées respectivement à 1/2 et 1/3. Cela signifie que parmi toutes les familles de deux enfants avec une fille en première position, la moitié d'entre elles a en réalité deux filles, tandis que parmi toutes les familles de deux enfants avec au moins un garçon, un tiers d'entre elles a en fait deux garçons.
Mais Martin Gardner a reconnu plus tard que la seconde question était ambigüe[1]. En effet, la manière dont est acquise l'information selon laquelle il y a au moins un garçon influence le résultat qui peut alors varier de 1/3 à 1/2.
De nombreuses variantes de ce problème montrent l'importance de la formulation dans le calcul du résultat.
Hypothèses implicites
D'une part les genres des enfants sont supposés indépendants d'un enfant à l'autre en l'absence d'hypothèse supplémentaire. D'autre part, chaque enfant peut être un garçon ou une fille de façon équiprobable.
Ces hypothèses ne traduisent pas exactement la réalité. D'une part, la possibilité que les enfants soient des jumeaux monozygotes contredit a priori l'indépendance des genres et fait augmenter légèrement les deux probabilités calculées ci-dessus. D'autre part, les proportions des deux genres sont inégales et varient même selon l'âge et le pays[2]. Enfin, la modélisation proposée néglige la possibilité qu'un enfant ne se reconnaisse pas dans l'un des deux genres usuels, comme en cas d'hermaphrodisme.
La correction de ces approximations fait varier les probabilités d'au plus quelques pourcents, ce qui ne change pas le résultat du paradoxe.
Explication par tableaux
On distingue les quatre possibilités pour le genre de deux enfants d'une famille à l'aide d'un tableau à double entrée :
genre du deuxième enfant fille garçon genre
du
premier
enfantfille FF FG garçon GF GG D'après les hypothèses implicites, ces quatre possibilités sont équiprobables. Il suffit alors de déterminer le rapport du nombre de cas favorables par le nombre de cas possibles dans chaque famille.
Dans la famille de M. Jones, les seuls cas possibles sont notés FF et FG et le seul cas favorable est FF. La probabilité que les deux enfants soient des filles vaut donc 1/2.
Dans la famille de M. Smith, les cas possibles sont FG, GF et GG, alors que le seul cas favorable est GG. La probabilité que les deux enfants soient des garçons vaut donc 1/3.
Ces calculs reposent sur l'hypothèse fondamentale que les enfants sont discernables[3] et peuvent donc être ordonnés (par exemple par ordre de naissance). L'absence d'une telle hypothèse empêcherait de distinguer les cas FG et GF, ce qui rendrait les calculs plus difficiles à justifier.
Calcul formel avec probabilités conditionnelles
Le calcul peut être effectué avec les notations d'évènements :
- F1 : « le premier enfant est une fille » ;
- F2 : « le deuxième enfant est une fille ».
- Famille Jones
La probabilité qu'il y ait deux filles dans la famille Jones est alors la probabilité de l'intersection de ces deux évènements, sous la condition du premier évènement :
or, par indépendance de F1 et F2,
Cette probabilité vaut donc 1/2 d'après les hypothèses implicites.
- Famille Smith
La probabilité qu'il y ait deux garçons dans la famille Smith s'écrit :
la dernière égalité se déduisant des propriétés des opérations ensemblistes, notamment d'une loi de De Morgan. Puis par passage au complémentaire et indépendance des évènements F1 et F2,
Critiques
Acquisition de l'information
Le calcul effectué ci-dessus suppose que la famille Smith se retrouve de façon équiprobable de l'une des trois cases du tableau intitulées FG, GF et GG. Or l'information selon laquelle il y a au moins un enfant peut être obtenue de différentes manières :
- À la question « Avez-vous au moins un garçon ? », M. Smith répond « Oui. » (évènement A).
- À la demande « Indiquez-moi le genre de l'un de vos enfants. », M. Smith répond « J'ai (au moins) un garçon. » (évènement B).
Dans le premier cas, la probabilité qu'il y ait deux garçons correspond effectivement à la probabilité conditionnelle calculée plus haut et qui vaut 1/3. Mais dans le deuxième cas, le fait que M. Smith choisisse de mentionner un garçon affaiblit la probabilité qu'il y ait une fille, sauf à supposer qu'un parent choisit toujours de mentionner un garçon lorsqu'il en a un. En supposant qu'un parent d'un garçon et d'une fille mentionne l'un ou l'autre de façon équiprobable, la probabilité que M. Smith ait deux garçons remonte à 1/2.
DémonstrationLa probabilité qu'il ait deux garçons dans le premier cas est la probabilité conditionnelle :
où la probabilité P(A) est donnée par la formule des probabilités totales :
Il en découle le calcul suivant :
Dans le deuxième cas, les probabilités conditionnelles sur B dépendent de la proportion de garçons :
Le résultat s'écrit alors
D'autres manières d'acquérir l'information sur le genre d'un enfant s'apparentent au deuxième cas, comme la rencontre d'un garçon disant être le fils de M. Smith.
Particularisation
Un autre biais de la formulation d'origine pour M. Smith est le recours à l'expression « l'un des deux » qui peut particulariser l'un des enfants de la même manière que le fait l'ordre de naissance. Cette particularisation peut être entérinée par la question « Quelle est la probabilité que l'autre enfant soit un garçon (aussi) ? » qui est parfois utilisée. À partir du moment où l'un et l'autre sont identifiés, le genre de « l'autre » est indépendant de l'information fournie et la probabilité qu'il soit un garçon est bien de 1/2.
Ce problème a été étudié par Fox et Levav[4], qui ont comparé les réponses aux questions suivantes :
- Mr. Smith says: "I have two children and at least one of them is a boy." Given this information, what is the probability that the other child is a boy?
- Mr. Smith says: "I have two children and it is not the case that they are both girls." Given this information, what is the probability that both children are boys?
- M. Smith dit : « J'ai deux enfants et au moins l'un d'entre eux est un garçon. » Étant donnée cette information, quelle est la probabilité que l'autre enfant soit un garçon ?
- M. Smith dit : « J'ai deux enfants et il ne s'agit pas de deux filles. » Étant donnée cette information, quelle est la probabilité que les deux enfants soient des garçons ?
L'étude a montré que 85% des participants donnaient la valeur 1/2 à la première question et seulement 39% répondaient ainsi à la seconde.
Variantes
Les variantes les plus courantes du paradoxe des deux enfants consistent à joindre une autre information au genre.
Prénom
Jean-Paul Delahaye propose de déterminer la probabilité que deux enfants soient des filles, sachant qu'il y a au moins une fille prénommée Sophie parmi eux[5]. L'hypothèse implicite selon laquelle les deux enfants n'ont pas le même prénom revient alors à particulariser Sophie, ce qui entraine que la probabilité cherchée vaut 1/2.
Jour de naissance
Quelle est la probabilité que deux enfants soient des garçons, sachant qu'il y a parmi eux au moins un garçon né un mardi ? Comme dans le problème initial, si ces précisions sont apportées par le parent, la probabilité vaut 1/2. Mais si la précision est posée en question au parent, la probabilité descend à 13/27.
Notes
- (en) Martin Gardner, The Second Scientific American Book of Mathematical Puzzles and Diversions, Simon & Schuster, 1954 (ISBN 978-0226282534.)
- Proportion de garçons et de filles selon les âges et les pays
- discerner sur le Wiktionnaire. Voir la définition de
- Craig R. Fox & Jonathan Levav, « Partition–Edit–Count: Naive Extensional Reasoning in Judgment of Conditional Probability », dans Journal of Experimental Psychology, vol. 133, no 4, 2004, p. 626–642 [lien PMID, lien DOI]
- Jean-Paul Delahaye, « Le trésor et les Sophies », Pour la science n°336, octobre 2005.
Références
Articles connexes
- Portail des probabilités et des statistiques
Wikimedia Foundation. 2010.