- Equilibre de Nash
-
Équilibre de Nash
John Nash a défini une situation d'interaction comme stable si aucun agent n'a intérêt à changer sa stratégie. La formalisation de ce constat simple a été essentielle pour la théorie des jeux.
Sommaire
Origine de la notion
Un jeu est un cadre formel où plusieurs agents décident d'une stratégie, sachant que leur utilité dépend des choix de tous. Avant Nash, la détermination de situation stable n'avait pas de méthode formelle, même si l'existence d'équilibres pour les jeux à somme nulle était connue depuis 1926, via le théorème du minimax de von Neumann. Même si la traduction courante d'un équilibre de Nash peut paraître simpliste, les considérables possibilités de résolution ouvertes par lui ont mérité le « Prix Nobel » d'économie en 1994, conjointement à Reinhard Selten et John Harsanyi.
Cette définition s'applique à des jeux avec n'importe quel nombre de joueurs. Nash a démontré que tous les résultats trouvés avant lui conduisaient à des équilibres stables dans son sens.
Théorème
Soit un jeu discret où m est le nombre de joueurs et Si est l'ensemble des possibilités pour le joueur i, et soit l'extension de g aux stratégies mixtes. Alors le jeu admet au moins un point d'équilibre.
démonstrationOn applique le théorème du point fixe de Brouwer ou le théorème du point fixe de Kakutani (en) pour une fonction bien choisie (à développer)
Explication
Par exemple, le jeu pierre-papier-ciseaux n'admet pas d'équilibre avec des stratégies pures (si on choisit à toutes les parties "pierre" par exemple, l'autre personne augmentera son gain (la fonction g) en choisissant "feuille". Mais alors le premier joueur choisira ensuite "ciseau". Etc., on n'arrivera jamais à un équilibre). Par contre, si on étend ce jeu aux stratégies mixtes, il y a un point d'équilibre d'après le théorème de Nash (et on peut montrer qu'il est unique). Ce point est donné en choisissant (1/3)"pierre"+(1/3)"ciseau"+(1/3)"papier", c'est-à-dire, du point de vue probabiliste, de jouer avec une probabilité (1/3) chacune des trois possibilités.
Optimalité
Premier exemple
Deux joueurs choisissent simultanément un nombre compris entre 0 et 10. Le joueur qui a annoncé le plus petit nombre remporte ce nombre, l'autre joueur gagne la même chose moins deux. En cas d'égalité, les deux joueurs subissent la pénalité de deux. L'unique équilibre de Nash de ce jeu est quand les deux annoncent zéro. Dans toutes les autres paires de stratégies, le joueur qui annonce plus ou autant peut améliorer son résultat en déclarant moins.
Exemple dit des marchands de glaces
Deux marchands de glace doivent choisir un emplacement sur une plage de longueur donnée. Les prix et les produits étant les mêmes, chaque client ira vers le marchand le plus proche de lui. Il est facile de se rendre compte que le seul équilibre de Nash pour ces deux marchands sera celui où ils sont tous deux côte à côte au centre de la plage, bien que ce soit la position la moins adéquate pour la satisfaction de leur clientèle. Cet exemple est souvent cité comme pendant négatif de la main invisible d'Adam Smith.
Limite de la rationalité
On peut s'attendre à ce que des joueurs rationnels choisissent l'équilibre de Nash. Peut-on dire que des agents qui déclarent ne rien vouloir sont intelligents ? De même, dans le cas du dilemme du prisonnier, l'unique équilibre de Nash est la solution la moins enviable, quand les deux trahissent. Ian Stewart affirmait [citation nécessaire] :
« L'économie expérimentale a montré que sur certaines situations simples, les êtres humains n'avaient pas spontanément un comportement en stratégie optimale selon Nash. »Unicité
Tout jeu peut avoir de nombreux équilibres de Nash ou aucun -- c'est le cas du jeu de la distinction. Néanmoins, Nash est parvenu à démontrer que tout jeu avec un nombre fini de joueurs ayant un nombre fini de stratégies admet au moins un équilibre de Nash en stratégie mixte -- c'est-à-dire si l'on considère comme une stratégie possible de tirer aléatoirement (avec des probabilités fixées) entre plusieurs stratégies.
Dans le cas d'un jeu à somme nulle à deux joueurs, c'est-à-dire où ce que gagne un joueur est nécessairement perdu par l'autre, ce résultat (c’est-à-dire l'utilité induite par tout équilibre) est nécessairement unique. Il a conduit à définir la valeur d'un jeu.
Limites et perspectives
Le cadre formel fourni par Nash ne couvre toutefois pas toutes les situations stables.
Communication et négociation
L'équilibre de Nash définit des situations d'équilibre très stables, mais — comme on l'a vu — non nécessairement optimales. Dans le cas d'agents isolés, ou d'une population trop nombreuse pour se coordonner, cela reste donc une notion très efficace.
Dans le cas d'interactions négociées ou encastrées dans un milieu social qui permettent la communication et l'engagement, il faut corriger, soit en intégrant le cadre au jeu — l'intervention du « Milieu » menaçant dans le dilemme du prisonnier — soit en faisant appel à des modèles d'anticipation ou de confiance des agents en la négociation.
Il reste que l'inertie et la recherche d'intérêt sont les deux principaux moteurs des agents en économie.
Équilibre évolutionnairement stable
Les applications des jeux répétés et en particulier l'isolement d'un comportement altruiste optimal dans des cas particuliers de dilemme du prisonnier ont intéressé les biologistes. Ce résultat a permis de combler un trou conceptuel dans l'évolutionnisme, qui paraissait privilégier l'égoïsme.
Les théoriciens ont donc défini une forme plus exigeante d'équilibre pour des modèles répétés : un équilibre évolutionnairement stable reste stable même en cas de comportement légèrement perturbé. Cette stabilité vise à couvrir les situations d'apparition de nouveaux comportements dans une population, c'est-à-dire de dépasser l'immobilisme présumé par Nash..
Anecdote
Dans l'adaptation au cinéma de la biographie de Nash, Un homme d'exception, la découverte de cet équilibre est mise en scène par une stratégie de séduction.
- Quatre camarades de Nash souhaitent séduire une fille parmi les 5 présentes.
- Nash leur explique que s'ils suivent individuellement leur intérêt, ils tenteront tous les 4 de séduire la plus belle. Ils vont alors se court-circuiter et essaieront, par la suite, de se reporter sur l'une des quatre restantes. Mais « personne n'aime être un second choix », leur stratégie est donc vouée à l'échec.
- La meilleure stratégie serait donc de s'entendre pour séduire chacun l'une des quatre autres filles évitant, de ce fait, tout court-circuit. Ils augmenteront ainsi considérablement leurs chances de succès.
Nash en déduit que la théorie de la main invisible de Smith est lacunaire. Ce à quoi ses camarades rétorquent qu'il ne s'agit là que d'une stratégie destinée à séduire la plus belle.
Cette situation n'est pas un exemple d'équilibre de Nash, puisque chaque individu est tenté de tricher pour avoir la plus belle à lui seul. Donc, il y a ici un point focal (la belle) qui empêche de garder l'équilibre en prétendant aller séduire seulement les autres filles.
Voir aussi
Articles connexes
- Jeu sous forme normale
- Autorégulation
- Équilibre de la terreur
- Jeu à somme non nulle et jeu à somme nulle
- Théorie des jeux
- Optimum de Pareto
- Jeux types
- Le dilemme du prisonnier archétype de l'équilibre de Nash sous-optimal
- Le jeu de la distinction introduit naturellement les stratégies mixtes
- Le problème du Rendez-vous ou l'art de la coordination
- Le jeu des dix pièces ou un cas étonnant de théorie des jeux expérimentale
- L'Algorithme de Lemke est un algorithme qui permet de trouver des équilibres de Nash.
- Extensions de la notion
- Une stratégie évolutionnairement stable supporte les chocs extérieurs
- Le principe de Wardrop étend la notion aux jeux avec trop de joueurs pour assurer une coordination
- Le concept de rationalisabilité étend celui d'équilibre de Nash en imposant aux joueurs des contraintes moins fortes.
Liens externes
- (fr) Murat Yildizoglu, Introduction à la théorie des jeux
- Portail de l’économie
Catégories : Théorie des jeux | Négociation
Wikimedia Foundation. 2010.