- Paradoxe de newcomb
-
Paradoxe de Newcomb
Le paradoxe de Newcomb est une expérience de pensée faisant intervenir un jeu entre deux joueurs, l'un d'entre eux étant supposé capable de prédire l'avenir. La question du statut de ce problème (paradoxe ou non) est aujourd'hui controversée.
Le paradoxe de Newcomb a été inventé par William Newcomb du Laboratoire national de Lawrence Livermore de l'Université de Californie. Toutefois, il a été analysé pour la première fois et publié dans une papier de philosophie diffusé dans la communauté philosophique par Robert Nozick en 1969,[1] et est apparu dans un article de Martin Gardner dans Pour la Science en 1974.
De nos jours, ce problème est beaucoup débattu dans la branche philosophique de la théorie de la décision, mais a reçu peu d'attention du côté mathématique.
Sommaire
Le problème
Voici un des énoncés possibles du paradoxe de Newcomb :
Un joueur joue une partie avec le devin (Sacha et Antoine). Ce devin est une entité qui pour une raison ou une autre est présentée comme étant exceptionnellement douée pour prévoir les actions d'une personne. La nature exacte de ce devin varie suivant les versions du paradoxe. Certains supposent simplement que le personnage a la réputation d'être infaillible et totalement incapable d'erreur. Dans d'autres versions, le devin peut être présenté comme doué de perception extra-sensorielle, comme une créature super-intelligente, comme une divinité, etc. Toutefois, dans la version originale discutée par Nozick, il est seulement dit que les prédictions du devin sont « presque certainement » correctes, et également que « l'explication de la prédiction qu'il a faite ne se fonde pas sur la connaissance de ce que vous décidez de faire ». Cette version originale du problème élimine certaines explications du paradoxe.
Prédiction Choix réel Gain du joueur A et B A et B 1 000 € A et B A uniquement 0 € A uniquement A et B 1 001 000 € A uniquement A uniquement 1 000 000 € Deux boîtes A et B sont présentées au joueur. Ce dernier a le choix entre prendre le contenu de la boîte A et prendre le contenu des boîtes A et B. Au préalable, le devin a rempli les boîtes ainsi : la boîte B contient toujours 1000 €, et le contenu de la boîte A est déterminé ainsi : si le devin a prédit que le joueur prendrait seulement la boîte A, elle contient 1000000 €, mais elle ne contient rien si le devin a prédit que le joueur prendrait les deux boîtes. Le joueur garde après le jeu le contenu des boîtes qu'il a ouvertes.
Au moment où le jeu commence, et le joueur est appelé à décider de ce qu'il va prendre, la prévision a déjà été faite, et le contenu de la boîte A est déterminé. En d'autres termes, la case A contient soit 0 soit 1000000 € avant le match commence, et une fois le jeu commencé, même le devin est impuissant à modifier le contenu des cases.
Avant que le jeu ne commence, le joueur est au courant de toutes les règles du jeu, y compris les deux contenus possibles de la boîte A, le fait que son contenu est fondé sur la prédiction du devin, et que le devin est infaillible. La seule information inconnue du joueur est la prédiction du devin et donc le contenu de la boîte A.
Le paradoxe
Le paradoxe vient de ce que deux raisonnements apparemment logiques conduisent à des résultats contradictoires.
La première stratégie consiste à remarquer que quelle qu'ait été la prédiction du devin, choisir de prendre les deux boîtes rapporte plus d'argent.
- Si la prédiction a été que le joueur ne prendra que A, alors prendre les deux boîtes rapporte 1 001 000 €, alors que ne prendre que A ne rapporte que 1 000 000 €.
- Si la prédiction a été que le joueur prendra les deux boîtes A et B, alors prendre les deux boîtes rapporte 1 000 €, et prendre juste A rapporte 0 €.
Dans tous les cas, décider de prendre les deux boîtes rapporte toujours 1000 € de plus.
La seconde stratégie consiste à remarquer que le devin a une prédiction presque toujours correcte. De ce fait, si l'on écarte les cas où sa prédiction est fausse, c'est à dire les possibilités qui rapportent 0 € et 1 001 000 €, le choix réel est entre gagner 1 000 € (en prenant les deux boîtes) ou 1 000 000 € (en ne prenant que A). Donc ne prendre que la boîte A est mieux. Plus généralement, si le devin ne se trompe que dans p% des cas:
- Si je choisis les deux boîtes, je gagne en moyenne p x 1 001 000 € + (1-p)x1 000 € = 1 000 € + p x 1 000 000 €
- Si je choisis la boîte A, je gagne en moyenne (1-p) x 1 000 000 € + p x 0 €
La différence entre les deux stratégies est nulle quand p= 0,4995, il suffit donc que le devin ait une capacité de prédiction à peine meilleure que le hasard (ici, d'un millième parce que la différence entre les montants est d'un facteur mille) pour qu'il soit statistiquement plus payant de lui faire confiance.[2]
Dans son article de 1969, Robert Nozick note que « Pour presque tout le monde, le choix à faire est parfaitement clair est évident. Le problème est que les gens semblent se répartir à peu près à part égale en deux groupes, chaque groupe faisant un choix différent, le consensus se limitant à penser que l'autre groupe fait preuve d'un rare aveuglement. »
Commentaires
Une première remarque est que le paradoxe est lié à un conflit dans les modèles de prise de décision envisageables.[3] Si l'on suit l'hypothèse de maximisation de l'espérance du profit, cette espérance est maximale lorsqu'on ne prend que la boîte A. En revanche, avec l'approche de la dominance stratégique, le bénéfice est maximal lorsqu'on choisit de prendre les deux boîtes.
Certaines critiques font valoir que le problème de Newcomb est paradoxal, parce qu'il repose en fait sur une contradiction. Le problème repose sur une logique de causalité inverse, ce qui est incompatible avec la notion de libre arbitre ; mais en même temps le problème suppose un libre arbitre, sinon le joueur n'a pas réellement la possibilité de faire un choix.[4]
Des commentateurs philosophes ont proposé de nombreuses solutions, dont certaines éliminent le paradoxe apparent.
Il est possible de simuler un devin similaire à celui qui est décrit, en utilisant une drogue qui bloque la capacité mémorielle, comme le Midazolam. Sous l'influence d'une telle drogue, les sujets sont incapables de fixer de nouveaux souvenirs, il serait donc possible de soumettre un sujet au même problème un grand nombre de fois, ce qui serait suffisant pour prédire statistiquement le comportement d'une majorité de sujets (mais à vrai dire, la réponse du sujet sous drogue risque de ne pas être la même que celle du sujet non drogué). Ceci étant, cette technique ne permettrait pas de prédire le choix des sujets qui se fondent sur le hasard pour établir leur choix.
La rationalité du choix dépend aussi de ce que l'on pense du devin. Si on accepte l'affirmation que le devin se trompe rarement, et si l'on accepte que les sommes d'argent ont été effectivement disposées comme indiqué, alors le choix rationnel est celui de la seule boîte A. En revanche, si l'on nie la possibilité d'une quelconque prédiction (ce qui paraît rationnel), le choix rationnel consiste à ouvrir les deux boîtes. (Mais en même temps, le fait d'agir rationnellement conduit, justement, à avoir un comportement prédictible, ce qui peut finalement justifier la performance du devin : être rationnel, dans ce cas, n'est pas nécessairement rationnel...).
Notes et références
Références
- ↑ Pour la petite histoire, les deux auteurs ont des approches différentes: Newcomb recommande de ne prendre qu'une boîte, alors que Nozick recommande de prendre les deux.
- ↑ Cette discussion suppose pour simplifier que le taux d'erreur est le même quelle que soit la prédiction du devin. Ce n'est pas nécessairement le cas, mais une modélisation plus fine ne change pas qualitativement le résultat.
- ↑ C'est l'analyse qu'en fait Nozick dans sa publication de 1969.
- ↑ C'est l'analyse qu'en fait Jeffrey (The logic of decision) : la dominance n’est pertinente que s’il n'y a pas de corrélation entre le choix effectué et les états du système. Mais d’après l’énoncé du problème, il y a justement une telle dépendance.
Biliographie
- R. Nozick “Newcomb’s problem and two principles of choice”, in Essays in Honor of Carl G. Hempel, 1969.
- D. Lewis “Causal Decision Theory”, Australiasan Journal of Philosophy, 1981.
- Jeffrey, Richard C. The Logic of Decision, 1983.
- Martin Gardner, Knotted Doughnuts and Other Mathematical Entertainments, Freeman and Company, 1986.
Liens externes
Catégorie : Paradoxe
Wikimedia Foundation. 2010.