Meilleure réponse

Meilleure réponse


En théorie des jeux, la meilleure réponse est la stratégie ou l'ensemble de stratégies qui produisent le résultat immédiat le plus favorable au joueur considéré, étant données les stratégies des autres joueurs. Le concept de meilleure réponse est au centre de la notion d'équilibre de Nash (voir aussi John Forbes Nash) qui repose sur la sélection par chaque joueur et à chaque période de sa meilleure réponse.

Sommaire

Fonction de meilleure réponse

Fig. 1 - Fonction de meilleure réponse pour le joueur Y dans le jeu de la chasse au cerf.

La fonction de meilleure réponse (souvent notée b(\cdot)) est employée dans la preuve de l'existence d'équilibres de Nash en stratégies mixtes. Pour chaque joueur, on construit une fonction de l'ensemble des profils de stratégies de l'adversaire vers l'ensemble des stratégies du joueur considéré. Ainsi, pour tout ensemble donné de stratégies σ i de l'adversaire, bii) représente les meilleurs réponses du joueur i à σ i.

Fig. 2 - Fonction de réaction pour le joueur X dans le jeu de la chasse au cerf.

Pour tous les jeux s'exprimant sous forme normale, les fonctions de meilleure réponse peuvent être représentées par une droite dans chaque cellule. Par exemple, dans la Figure 1, la ligne pointillée dénote la probabilité optimale que le joueur Y joue « cerf » (sur l'axe y) en fonction de la probabilité que le joueur X joue « cerf » (sur l'axe x). Dans la Figure 2, la ligne pointillée dénote la probabilité optimale pour le joueur X de jouer « cerf » (axe x) comme une fonction de la probabilité que le joueur Y joue « cerf » (axe y). Remarquez que la figure 2 inverse l'ordre habituel des axes, de manière à pouvoir superposer les figures 1 et 2 afin de déterminer l'équilibre de Nash, lieu où les fonctions de meilleure réponse s'intersectent, et donc les meilleures réponses sont compatibles (Figure 3).

Fig.3 - Fonctions de réactions pour les deux joueurs dans le jeu de la chasse au cerf. L'équilibre de Nash est noté par les points soulignant les lieux où les meilleures réponses sont compatibles.

Jeux de coordination

Dans les jeux où les paiements sont plus élevés quand les deux joueurs adoptent la même stratégie, comme le jeu de la Chasse au cerf ou la Guerre des sexes, les fonctions de réaction auront des formes similaires à celles de la Figure 3, avec trois équilibres de Nash, l'un dans le coin inférieur gauche, l'autre dans le coins inférieur droit et un équilibre en stratégies mixtes le long de la première diagonale, la position exacte de ce dernier équilibre dépendant des paiements du jeu.

Jeux d'anti-coordination

Dans les jeux comme le jeu de la poule ou le jeu des faucons et des colombes les paiments sont les plus élevés quand les joueurs choisissent des stratégies différentes. Leurs fonctions de réaction se croisent alors dans le sens opposé au cas des jeux de coordination. La Figure 4 illustre les fonctions de réaction pour les joueurs dans un jeu d'anti-coordination. Pour ces jeux, il existe en général trois équilibres de Nash, un dans le coin supérieur gauche, un dans le coin inférieur droit, et un sur la diagonale en stratégies mixtes. Si le joueur ignorent le type de l'autre, alors l'équilibre en stratégies mixtes est une stratégie évolutionnairement stable (SES), le jeu se déroulant sur la première diagonale. Sinon, il existe une asymétrie de non-corrélation, et les équilibres dans les coins sont également des SES.

Fig.4 - Fonctions de réaction dans le jeu des faucons et des colombes. Les équilibres de Nash correspondent au lieu d'intersection des fonctions de meilleure réponse.

Jeux avec stratégies dominées

Fig. 5 - Fonction de réaction pour un jeu avec stratégie dominée.

Dans les jeux présentant une stratégie dominée, les fonctions de meilleure réponse auront un unique point d'intersection, dans le coin inférieur gauche ou supérieur droit pour les jeux symétriques. Par exemple, dans le dilemme du prisonnier à un coup, coopérer n'est optimal pour aucune probabilité que l'autre coopère. La figure 5 illustre les fonctions de meilleure réponse pour un tel jeu. Si les axes portent la probabilité de coopérer, l'équilibre de Nash est dans le coin inférieur gauche, où aucun joueur ne coopère. S'il s'agit des probabilités de trahir, les deux courbes se coupent dans le coin supérieur droit.

Autres jeux

Les trois cas envisagés ci-dessus (coordination, anti-coordination, stratégies dominées) sont les seuls types de cas possibles pour des jeux 2x2 symétriques (à l'exception d'un quatrième cas, trivial, où les paiements sont égaux pour toutes les stratégies).

En présence d'asymétries dans les paiements, une plus grande diversité de fonctions de réactions est possible. Pour chaque joueur, il y a ainsi cinq types possibles de forme de meilleure réponse, ainsi qu'illustré par la Figure 6. De gauche à droite : stratégie dominée (toujours jouer 2), stratégie dominée (toujours jouer 1), croissante (jouer 2 si la probabilité que l'autre joueur joue 2 est supérieure à un certain seuil), décroissante (jouer 2 si la probabilité que l'autre joueur que 1 est supérieure à un certain seuil), indifférente (les deux stratégies sont équivalentes quelle que soit la stratégie de l'autre joueur).

Fig. 6 - Les cinq fonctions de meilleure réponse possibles pour un jeu 2x2. Les axes sont orientés selon la probabilité croissante qu'un joueur joue la stratégie 1. De gauche à droite : A) Toujours jouer2, la stratégie 1 est dominée; B) Toujours jouer 2, la stratégie 1 est dominée; C) La stratégie 1 est meilleure quand l'adversaire joue 1 et 2 est meilleure quand l'adversaire joue 2; D) La stratégie 1 est meilleure quand l'adversaire joue 2 et la stratégie 2 est meilleure quand l'adversaire joue 1; E) Les deux stratégies sont équivalentes quelle que soit la stratégie de l'adversaire.

Alors qu'il n'existe que quatre structures de paiement possibles pour un jeu 2x2 symétrique, l'existence de cinq types de meilleures réponses dans le cas des jeux asymétriques permet d'envisager un grand nombre de jeux différents. Toutefois, beaucoup de ceux-ci ne sont pas réellement différents l'un de l'autre, les dimensions pouvant être redéfinies (en échangeant les noms des stratégies) pour produire des jeux symétriques logiquement identiques.

Pair ou impair

Un exemple de référence de jeu avec paiements asymétriques est le jeu Pair ou impair. Dans ce jeu, le joueur Ligne (représenté sur l'axe y) gagne si les deux joueurs choisissent la même parité, alors que le joueur Colonne (représenté sur l'axe des x) gagne s'ils choisissent des parités différentes. La fonction de réaction du joueur Y est celle j'un jeu de coordination, alors que celle du joueur X correspond à un jeu d'anti-coordination. L'équilibre de Nash en stratégies mixtes est alors évolutionnairement stable.

Fig.7 - Fonctions de réaction pour le jeu Pair ou Impair. La fonction de gauche est celle d'un jeu de coordination, celle du milieu d'un jeu d'anti-coordination. L'unique équilibre de Nash est un équilibre en stratégies mixtes, illustré à droite. Il est évolutionnairement stable.

Meilleure réponse dynamique

Dans le cadre des jeux évolutionnistes, la meilleure réponse dynamique désigne une classe de stratégies telles que les stratégies des joueurs au tour suivant sont déterminées par leur meilleure réponse à un certain sous-ensemble de la population. On peut citer par exemple:

  • Dans un modèle à population importante, les joueurs choisissent

probabilistiquement leur prochain coup sur la base des stratégies qui sont meilleure réponse à la population dans son ensemble.

  • Dans un modèle géographique, les joueurs choisissent au coup suivant

l'action qui est la meilleure réponse à celles de leurs voisins (voir Elison 1993). Dans de tels modèles, les joueurs ne sélectionnent à un tour donné que la meilleure réponse pour le prochain tour. Ils ne considèrent pas les conséquences de leurs choix stratégiques sur le déroulement du jeu après le tour suivant. De ce fait, la meilleure réponse dynamique est une meilleure réponse myope'.

Références

  • (en) Ellison, G. (1993) "Learning, Local Interaction, and Coordination" Econometrica 61: 1047-1071
  • (en) Gibbons, R. (1992) "A primer in game theory" (pp. 33-49) Harvester-Wheatsheaf.

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Meilleure réponse de Wikipédia en français (auteurs)

Игры ⚽ Поможем сделать НИР

Regardez d'autres dictionnaires:

  • Meilleure Réponse — En théorie des jeux, la meilleure réponse est la stratégie ou l ensemble de stratégies qui produisent le résultat immédiat le plus favorable au joueur considéré, étant données les stratégies des autres joueurs. Le concept de meilleure réponse est …   Wikipédia en Français

  • Meilleure reponse — Meilleure réponse En théorie des jeux, la meilleure réponse est la stratégie ou l ensemble de stratégies qui produisent le résultat immédiat le plus favorable au joueur considéré, étant données les stratégies des autres joueurs. Le concept de… …   Wikipédia en Français

  • réponse — [ repɔ̃s ] n. f. • response XIIe; respuns n. m. 1050; lat. responsum 1 ♦ Ce qu on dit en retour à la personne qui vous a posé une question, fait une demande, ou s est adressée à vous; ce qui annule une question (complément, confirmation,… …   Encyclopédie Universelle

  • Évolution en réponse aux changements climatiques — Le changement climatique se rapporte à tout changement du climat dans le temps, qu il soit dû à la variabilité naturelle ou à l activité humaine[1]. Au XXIe siècle, les changements climatiques, présumés d origine anthropiques, sont plus… …   Wikipédia en Français

  • Grammy Award de la meilleure performance hard rock — Le Grammy Award de la meilleure performance hard rock (Grammy Award for Best Hard Rock Performance) est une récompense délivrée dans le cadre des Grammy Awards pour un travail (chanson ou album) de qualité dans le domaine musical du hard rock. Le …   Wikipédia en Français

  • Prix Locus de la meilleure nouvelle courte — Les prix Locus sont décernés chaque année, depuis 1971, par les lecteurs du magazine américain mensuel de science fiction Locus lors de la Westercons qui se déroule le quatrième week end de juillet. La catégorie de la meilleure nouvelle courte… …   Wikipédia en Français

  • Règles pour le parc humain : une lettre en réponse à la Lettre sur l'humanisme de Heidegger — Règles pour le parc humain Règles pour le parc humain, sous titré Une lettre en réponse à la Lettre sur l Humanisme de Heidegger, est un court essai philosophique écrit par Peter Sloterdijk. Il est paru en 2000. Il est traduit en français par… …   Wikipédia en Français

  • Paradoxe de Braess — En théorie des jeux le Paradoxe de Braess, du nom du mathématicien Dietrich Braess, stipule que l ajout d une nouvelle capacité à un réseau lorsque les entités se déplaçant choisissent leur route individuellement peut, dans certain cas, réduire… …   Wikipédia en Français

  • Concept De Solution — En théorie des jeux et en théorie économique, un concept de solution est un processus par lequel les équilibres d un jeu sont identifiés. Ils sont donc employés comme des prédictions de jeu, suggérant quel sera le résultat du jeu, c est à dire… …   Wikipédia en Français

  • Concept de solution — Quelques concepts de solution de théorie des jeux. Les flèches vont d un raffinement à un concept plus général (par exemple, tout équilibre à main tremblante est un équilibre parfait en sous jeux). En théorie des jeux et en théorie économique, un …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”