Jeux à champ moyen

Jeux à champ moyen

La théorie des jeux à champ moyen a été introduite en 2006 par Jean-Michel Lasry et Pierre-Louis Lions comme limite de jeux non coopératifs à un grand nombre de joueurs. L'attrait principal de la théorie des jeux à champ moyen (Mean Field Games en anglais, noté MFG dans la suite) réside dans la simplification considérable des interactions entre joueurs. Les joueurs déterminent ainsi leur stratégie optimale en considérant l'évolution de la communauté (de la foule de joueurs) dans son ensemble plutôt que l'ensemble des comportements individuels (cest-à-dire de chacun des autres joueurs pris un par un). Les MFG se situent ainsi à la frontière entre la théorie des jeux (jeux différentiels stochastiques pour être plus précis) d'une part, et l'optimisation d'autre part.

Sommaire

Introduction

La théorie des jeux à champ moyen a connu une forte expansion ces dernières années. Tout un corpus de résultats mathématiques, doutils de simulations et dalgorithmes, de concepts économiques relatifs, ont été développés et sont à présent à disposition des spécialistes (économistes en premier lieu, mais aussi sociologues, ingénieurs, etc.). Lutilisation des MFG en modélisation socio-économique sest révélée pertinente à plusieurs reprises. La modélisation de production optimale dune ressource naturelle épuisable (comme le pétrole), la distribution des richesses, et la simulation de foules de piétons comptent parmi les exemples les plus probants. Des phénomènes bien connus des spécialistes ont été naturellement retrouvés via la modélisation MFG, distribution de Pareto des richesses et autoformation de lignes dans les flux de piétons en ce qui concerne les foules). Quelques phénomènes danticipation nouveaux ont par ailleurs été mis en lumière.

Caractéristiques principales

Continuum de joueur

Les MFG conviennent particulièrement pour décrire des situations dans lesquelles les agents (i.e. les joueurs) sont atomisés, cest-à-dire que laction individuelle dun joueur nimpacte pas létat global du système. Létude de tels jeux, dits jeux non-atomiques, a vu le jour avec les travaux pionniers de Robert Aumann. La grande nouveauté quapporte les MFG est le traitement de laspect dynamique de tels jeux.

Les joueurs

Une hypothèse centrale est lanonymat des joueurs (invariance par permutation des joueurs). Autrement dit, les MFG supposent que les joueurs sont symétriques. Les joueurs sont caractérisés par une variable détat, que nous appelons X(t) dont ils contrôlent la dynamique par le choix de leurs actions a(t). Chacun des joueurs cherche ensuite à maximiser son payoff (ou de façon équivalente à minimiser son coût). Ce dernier dépend classiquement de létat et de laction du joueur, mais intègre aussi, et cest le point clé de la modélisation MFG, un critère de champ moyen basé sur létat global (qui doit être compris comme la distribution des états) de lensemble de la population de joueurs. La dynamique peut aussi contenir un terme similaire dinteraction de champ moyen. On comprend bien ici la dénomination « jeu à champ moyen », qui de par les similitudes que présentent ce type dinteractions, sinspire de la terminologie de la Théorie du champ moyen en physique. A ce propos, certaines équations classiques de la physique théorique se retrouvent comme étant des cas particuliers de jeux à champ moyen.

Equilibre Nash-MFG

Les équilibres dans les jeux à champ moyen, dits équilibres Nash-MFG, sont lapproximation déquilibres de Nash dans le jeu source à N joueurs, lorsque le nombre N est grand. Or il est bien connu qu'un équilibre de Nash dans les jeux différentiels avec un grand nombre de joueurs sont numériquement fort coûteux à calculer. La simplification considérable de la calculabilité quoffre, au niveau macroscopique, les MFG, constitue un avantage majeur de cette théorie. Les MFG permettent ainsi une facilité de traitement propre au macroscopique tout en reflétant la microstructure du problème étudié. Une telle approximation déquilibres de Nash sopère en deux temps. Dabord loptimisation dans le jeu à N joueurs, puis le passage à la limite avec  N \rightarrow \infty . Ces deux étapes ne sont pas commutatives.

Anticipations rationnelles

Les jeux à champ moyen font lhypothèseclassique et crucialeque les joueurs ont des anticipations rationnelles, ce qui peut sinterpréter de la façon suivante. Les joueurs anticipent lévolution de létat global du système (i.e. du champ moyen) afin de définir leur stratégie (par le choix des actions). Lensemble des stratégies résultantes aboutit à une évolution statistique du champ moyen qui doit, à léquilibre, coïncider avec le champ moyen anticipé. On a ainsi un équilibre à anticipations rationnelles. Mathématiquement, on dira alors que les MFG sont une approche forward-backward : lévolution du champ moyen est forward, mais la stratégie optimale des joueurs est choisie par raisonnement backward (ce qui est classique en théorie du contrôle optimal, et en théorie des jeux différentiels). Lassociation du forward avec le backward vient du fait que les joueurs intègrent le champ moyen, qui évolue forward, dans leur raisonnement backward, dont la stratégie optimale résulte. Dans la terminologie du contrôle optimal, ceci correspond à un contrôle en boucle fermée.

Stabilité éductive

Les équilibres Nash-MFG sont dans certains cas stables au sens de léductivité[1]. Cette notion de stabilité est à relier aux anticipations rationnelles[2]. La stabilité éductive garantit quaprès déviation, un équilibre sera recouvré par un processus mental (indépendant de tout apprentissage temporel) des joueurs, sil y a dans la population des joueurs un common knowledge dun voisinage de léquilibre en question.

Structure mathématique forward-backward

La structure mathématique générale dun équilibre Nash-MFG est un système déquations aux dérivées partielles (EDPs) forward-backward couplées. Léquation de Fokker-Planck (aussi connue sous le nom de Kolmogorov), décrit lévolution forward en temps du champ moyen (état global du système pour mémoire). Léquation backward est une équation de Hamilton-Jacobi, et donne les actions optimales des joueurs (contrôle en feedback).

Simulations

Si les jeux à champ moyen n'offrent pas souvent une résolution avec des formules analytiques, ils permettent de calculer numériquement les équilibres Nash-MFG à moindre coût computationnel (en comparaison avec le coût de la simulation du jeu à N joueurs). Toutefois, la structure mathématique, à savoir le système d'EDPs couplées évoluant dans des sens différents - forward et backward, a nécessité le développement de méthodes de calcul numérique nouvelles[3],[4].

Bruit

La dynamique de létat des joueurs est soumise à un bruit. Elle est ainsi décrite par un processus stochastique. Les bruits peuvent être indépendants ou couplés. Cependant, les équations caractérisant léquilibre Nash-MFG sont bien plus compliquées lorsque les joueurs sont soumis à un bruit commun (Equation aux Dérivées Partielles en dimension infinie) .

Cas typiques dapplication

Les champs dapplication de la théorie des MFG sont variés.

  • Deux grandes familles de cas se distinguent lorsque les joueurs prennent en compte un critère de type champ moyen. En effet, il est naturel de penser que les joueurs peuvent avoir soit des incitations à « se démarquer » de la communauté (aversion aux autres joueurs), soit au contraire des incitations à « ressembler » à la communauté (phénomènes de mode). Ces deux méta classes dexemples se traduisent au niveau mathématique par la monotonie du critère. En général, le premier cas (aversion) est un problème bien posé en ce sens quil existe un équilibre unique, le second cas (mode) est quant à lui mal poséil nexiste pas toujours déquilibre, qui nest alors pas unique.
  • Lapplication peut-être la plus intuitive des MFG est la modélisation de mouvements de foules[5]. On considère en effet naturellement quune foule est composée dun grand nombre de piétons qui choisissent stratégiquement leur chemin pour aller dun point à un autre en évitant les zones congestionnées (cest-à-dire les zones de forte densité de la foule, le champ moyen est élevé). Considérer lasymptotique dun équilibre de Nash a du sens dans ce contexte.
  • Matières premières : production dune ressource épuisable[6]
  • Modèles de croissance avec hétérogénéité des richesses
  • MFG discrets et réseaux[7]
  • Réseaux sociaux : graphes dynamiques avec placement stratégique sur les nœuds

Les équations des Jeux à Champ Moyen

Le jeu à N joueurs

La dynamique de létat du joueur i est décrite par le processus suivant :

dX^i_t= a^i_t dt+\sigma dW^i_t, \; X^i_0=x^i,

ai désigne laction du joueur i et xi est son état initial. La distribution empirique des états initiaux, connue de tous, est notée m0. Les joueurs cherchent l'action ai qui minimise en horizon fini leur coût : J_i(a)= \mathbb{E} \left[ \int_0^T    f_i(t,X^1_t,\cdots,X_t^N,a_t^1,\cdots,a_t^N)dt+g_i(X^1_T,\cdots,X^N_T)\right].

Certaines hypothèses doivent être faites sur la forme des coûts. Ils doivent typiquement être du type:  f_i(t,x^1,\cdots,x^N,a^1,\cdots,a^N)= f(t, x^i, h(\frac{1}{N-1}\Sigma_{j \neq i} \delta_{x^j} ),a^i), et  g_i(x^1,\cdots,x^N)= g(x^i, l(\frac{1}{N-1}\Sigma_{j \neq i} \delta_{x^j} )), δx désigne la masse de Dirac en x. Autrement dit ils sont fonction de la distribution empirique de l'ensemble des états des joueurs (le champ moyen créé par les autres sera, à la limite en nombre de joueurs grand, la distribution empirique, puisque l'influence d'un individu est négligeable).

Le problème individuel limite

Il est possible de considérer un problème de minimisation limite (à ne pas confondre toutefois avec le problème d'un agent représentatif qui n'aurait pas de sens dans un MFG) dans le but de dériver formellement les équations d'équilibre. Le problème a la forme suivante:  v(o,x) = \min_a J(a)= \mathbb{E} \left[ \int_0^T    f(t,X_t,m(t,X_t),a_t)dt+g(X_T,m(t,X_t))\right], la dynamique du joueur est dX_t= a_t dt+\sigma dW_t, \; X_0=x, , X0 a pour distribution m0(x), et m(t,x) désigne l'évolution anticipée de la distribution des états des joueurs.

Système déquations de léquilibre Nash-MFG

 \partial_tv(t,x)+\frac{\sigma^2}{2}v''(t,x)+min_a\left\{  v'(t,x) \cdot a(t,x) - f(t,x,m(t,x),a) \right\}= 0, \; v|_{t=T}=g(x,m(T,x)),

 \partial_tm(t,x)-\frac{\sigma^2}{2}m''(t,x)+(m(t,x) \;  a^{\star}(t,x))'=0, \; m|_{t=0}=m_0.

 a^{\star}(t,x)) est le minimiseur dans la première équation.


Dans ces équations, les termes faisant intervenir la dérivée seconde proviennent de la diffusion due au bruit. La première des deux équations ci-dessus est une équation de Hamilton-Jacobi-Bellman qui évolue backward en temps (condition de transversalité). La fonction valeur est solution de cette équation. La seconde équation est l'équation de Fokker-Planck qui décrit l'évolution forward de l'état global du système (distribution des états des joueurs). C'est une équation de transport (i.e. d'évolution) par drift et diffusion d'un processus.

Le système d'équilibre Nash-MFG est donc constitué de deux équations classiques et bien connues des spécialistes. En revanche, ce qui fait la richesse des MFG se dévoile, dans ce système, à travers le couplage de ces deux équations. Il est clair que l'évolution du champ moyen m(t,x) intervient dans la première équation. Le couplage a lieu dans la seconde via le contrôle optimal  a^{\star}, qui dépend de la fonction valeur v.

MFG linéaire-quadratique

Dans ce cas standard en théorie des jeux différentiels stochastiques (dynamique linéaire, coûts quadratiques), il est possible de trouver des formules explicites d'équilibres Nash-MFG [8].

Notes et références

  1. Voir l'article de O. Guéant, "A reference case for Mean Field Games Models" en ligne
  2. Voir l'article de R. Guesnerie, An exploration of the eductive justifications of the rational-expectations hypothesis. The American Economic Review 82 (5), 12541278, 1992.
  3. Voir l'article de Y. Achdou, I. Cappuzzo-Dolcetta, "Mean Field Games: Numerical Methods" en ligne
  4. Voir l'article de A. Lachapelle, J. Salomon, G. Turinici, "Computation of Mean Field Equilibria in Economics" en ligne
  5. Voir l'article de A. Lachapelle, M-T Wolfram, "On a mean field game approach modeling congestion and aversion in pedestrian crowds" en ligne
  6. Voir l'article de O. Guéant, J-M Lasry, P-L Lions, "Long-run Oil Production - MFG" en ligne
  7. Voir l'article de D. Gomes, J. Mohr, R. Souza, "Discrete time, finite state space mean field games" en ligne
  8. Voir l'article de Martino Bardi, "Explicit solutions of some Linear-Quadratic Mean Field Games" en ligne

Voir aussi

Articles connexes

Liens externes

Bibliographie



Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Jeux à champ moyen de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

  • Moyen-Age — Moyen Âge La visite d un chantier de bâtisseurs. Le Moyen Âge …   Wikipédia en Français

  • Moyen-age — Moyen Âge La visite d un chantier de bâtisseurs. Le Moyen Âge …   Wikipédia en Français

  • Moyen-Âge — La visite d un chantier de bâtisseurs. Le Moyen Âge …   Wikipédia en Français

  • Moyen-âge — La visite d un chantier de bâtisseurs. Le Moyen Âge …   Wikipédia en Français

  • Moyen Age — Moyen Âge La visite d un chantier de bâtisseurs. Le Moyen Âge …   Wikipédia en Français

  • Moyen age — Moyen Âge La visite d un chantier de bâtisseurs. Le Moyen Âge …   Wikipédia en Français

  • Moyen âge — La visite d un chantier de bâtisseurs. Le Moyen Âge …   Wikipédia en Français

  • Moyen Âge — Le Moyen Âge est une période historique occidentale située entre l’Antiquité et la Renaissance (temps modernes). Elle s’étend sur une durée de près de mille ans que les historiens ont divisée en plusieurs parties. Aucune limite chronologique… …   Wikipédia en Français

  • Théorie des jeux — La théorie des jeux est un ensemble d outils pour analyser les situations dans lesquelles ce qu il est optimal de faire pour un agent (personne physique, entreprise, animal, ...) dépend des anticipations qu il forme sur ce que un ou plusieurs… …   Wikipédia en Français

  • Jeux Olympiques d'ete de 1900 — Jeux olympiques d été de 1900 Jeux olympiques d été de 1900 Ville hôte : Paris Pays hôte  …   Wikipédia en Français

Share the article and excerpts

Direct link
https://fr-academic.com/dic.nsf/frwiki/1985357 Do a right-click on the link above
and select “Copy Link”