- Bluff
-
Pour les articles homonymes, voir Bluff (homonymie).
Le bluff est une technique de jeu consistant à jouer comme si l'on avait un jeu différent de celui détenu en réalité.
Il existe deux types de bluffs :
- Le bluff psychologique joue sur un coup particulier. En affichant une ligne de jeu irrationnelle, il peut induire les adversaires en erreur et les pousse à la faute. Selon les cas, il est parfois intéressant de faire croire à un jeu plus faible qu'il ne l'est réellement (type de bluff appelé slowplay au poker).
- Le bluff rationnel s'insère dans une stratégie globale. En affichant volontairement un comportement parfois erratique, il entretient l'incertitude des adversaires et les empêche d'analyser de manière précise les lignes de jeu suivies.
Le bluff est très utilisé dans de nombreux jeux de cartes, dont principalement le poker. Il est également utilisé dans de nombreux jeux de société. Il s'agit généralement de faire croire aux adversaires que l'on va jouer d'une certaine manière alors que l'intention réelle est tout autre. Le bluff est très présent dans des jeux comme Adel verpflichtet, Vive le roi !, Perudo ou Maka Bana et bien entendu la belote de comptoir.
Sommaire
Au poker
Vous jouez au poker. Vous venez de miser votre voiture et votre maison contre un joueur ayant, pensez-vous, une main meilleure que la vôtre, alors que vous n'avez qu'une paire de deux.
Il ne vous reste plus qu'à bluffer.
Vous devez faire croire à votre adversaire que vous possédez un très bon jeu alors que ce n'est pas le cas. Pour lui faire croire, tous les coups sont permis : les petits clins d'œil amusés, les faux sourires...
Un joueur qui tente un bluff « psychique » doit inciter ses adversaires à relancer, non à venir "pour voir". Il doit donc initialement miser bas, s'il veut inciter à la relance, puis doit augmenter sa mise rapidement, de manière à ce que ses adversaires soient en permanence persuadés qu'ils ont un jeu nettement supérieur (pour relancer) ou nettement inférieur (pour se coucher): si sa mise est insuffisante, il court le risque que son adversaire décide d'aller "pour voir" et que son bluff s'effondre. Si un joueur passe pour un ordinateur qui ne bluffe jamais, ses relances n'affichent qu'un jeu fort, qui dissuadera ses adversaire de venir voir. Inversement, s'il passe pour un fantaisiste susceptible de bluffer fréquemment, sa relance n'aura pas un effet dissuasif sur ses adversaires, qui hésiteront moins à venir voir. Pour jouer des bluffs psychologiques, il faut donner une image de joueur très raisonnable, qui relance rarement et toujours avec raison, ce qui permet de remporter quelques coups de bluff sans être inquiété.
Le bluff sur une main faible n'est nullement une tentative de tromperie, ou un passage en force contre les statistiques, mais simplement un investissement à faire, judicieusement calculé pour augmenter ses gains sur l'ensemble de la partie. L'effet du bluff n'est pas sur les mains faibles (où le résultat est statistiquement indifférent), mais bien sur les mains fortes:
L'intérêt d'une stratégie de bluff optimale est de valoriser statistiquement ses mains gagnantes, en obligeant l'adversaire à venir les voir plus souvent.
Pour qu'un joueur puisse rentabiliser ses mains fortes, il est souhaitable que ses adversaires suivent ses relances, donc de montrer qu'on bluffe régulièrement: cette stratégie de bluff rationnel permettra de rentabiliser un jeu agressif.
La stratégie optimale est discutée ci-dessous.
Mathématiques du bluff optimal
Paire améliorée contre tirage amélioré
On suppose que Alice a ouvert, et a demandé deux cartes (montrant a priori une paire), et Bob a suivi et a demandé une carte (montrant a priori un tirage). Alice ouvre du pot, montrant probablement une double paire et un brelan.
Ceci étant, quand Bob a réalisé son tirage de quinte ou de couleur, il sait qu'il gagne contre Alice tant qu'elle n'a pas de Full ou de Carré, c’est-à-dire dans 94.4% des cas. Son jeu est pratiquement à un contre vingt, et il peut se permettre de relancer, que Alice ait un Brelan ou une double paire. Mais à quel niveau? Tout dépend en fait de la fréquence à laquelle Bob bluffe dans ce cas.
Si Bob décide de relancer, il affiche un jeu "fortement gagnant", qui en principe ne peut pas être une double paire. Le jeu justifiant une relance est un tirage réussi, qui a débouché sur une couleur ou une quinte. Ceci étant, si on imagine qu'il puisse bluffer, il peut aussi bien le faire avec une double paire d'entrée (ce ne serait alors qu'un semi-bluff). Donc le fait qu'il relance ne change pas fondamentalement la nature possible de sa main, qui reste:
1 cartes Rien Paire DP Br Q C F K QF proba 32,9% 15,0% 37,4% 0,0% 3,9% 7,0% 3,5% 0,2% 0,0% cumul 67,1% 52,0% 14,6% 14,6% 10,8% 3,7% 0,3% 0,0% 0,0% La relance de Bob affiche un jeu qui ne devrait se présenter que dans b=14.6% des cas, et Alice doit choisir entre suivre (pour sanctionner un bluff éventuel) ou passer. Si elle a elle-même une main gagnante (Full ou carré, avec une probabilité a=5.6%), elle suivra certainement (ou relancera). Le tableau suivant décrit les choix au moment où Bob décide de bluffer:
(Gains pour Alice) Alice a un Full ou un Carré Fréquence a=5.6%
Alice sanctionne un bluff Fréquence α%
Alice passe sur la relance Fréquence 1-(α+5.6)%
Bob a eu son tirage Fréquence b=14.6%
Alice Gagne le pot et la relance P+R
Alice perd la relance -R
Bob gagne le pot ---
Bob décide de bluffer Fréquence β
Alice gagne le pot et la relance P+R
Alice gagne le pot et la relance P+R
Bob gagne le pot ---
Bob passe Fréquence 1-(β+b).
Alice gagne le pot P
Alice gagne le pot P
Alice gagne le pot P
Point neutre du bluff
Alice peut décider de sanctionner un éventuel bluff (avec une fréquence α), et Bob peut avoir décidé de bluffer (avec une fréquence β).
- Si Bob a une main faible, le choix est entre bluffer ou passer. S'il décide de bluffer un peu, le risque qu'il prend dépend de la stratégie d'Alice: il risque une perte supplémentaire du montant de sa relance R (avec une fréquence de a+ α), mais peut récupérer le pot P tant que Alice ne suit pas (le reste du temps). Le point d'équilibre pour Bob est atteint si R(a+ α) = P(1-(a+ α)), c’est-à-dire (a+α) = P/(P+R), et ce point d'équilibre ne dépend que de la probabilité qu'Alice a d'aller voir. Si Alice sanctionne moins fréquemment, le bluff de Bob peut être plus fréquent, si Alice sanctionne plus fréquemment, le bluff de Bob doit être moins fréquent, et si Alice joue exactement sur ce point neutre, le gain de Bob ne dépend pas de son taux de bluff.
- Face à une relance de Bob, même si Alice a une main potentiellement perdante, elle peut néanmoins décider de sanctionner un éventuel bluff, en "suivant" la mise. Elle perdra sa relance (R-r)[1] dans les b=14.6% de fois où le tirage de Bob s'est réalisé, mais avec une fréquence de β% elle récupère à la fois le pot et la relance de Bob. L'équilibre est atteint quand (R-r).( b)=β.(P+R), ce qui ne dépend que du taux de bluff de Bob (et bien sûr, de son niveau de relance). Si β<b.(R-r)/(P+R), chercher à sanctionner un bluff est une perte d'argent en moyenne, donc il vaut mieux laisser bluffer sans rien faire. Si au contraire β est supérieur à cette limite, la sanction d'un bluff éventuel rapporte en moyenne de l'argent, donc il vaut mieux suivre systématiquement.
Le point neutre est atteint quand Alice vient voir les relances avec une probabilité a+α=P/(P+R), et que Bob bluff avec une probabilité β=b.(R-r)/(P+R). Si Bob conserve exactement ce taux de bluff, il gagnera en moyenne autant, quelle que soit la stratégie de Alice: plus sur le bluff si Alice vient voir moins souvent, plus sur le tirage réussi si Alice vient plus souvent. De même, si Alice conserve rigoureusement ce taux de suivi, elle gagnera autant, quelle que soit la stratégie de Bob.
- Un niveau de relance typique est de deux fois la valeur du pot.
- Au point neutre, une relance à deux fois le pot correspond à un bluff une fois sur trois.
- Au point neutre, une relance à deux fois le pot doit être suivie une fois sur trois.
Il faut souligner que la fréquence optimale du bluff est toujours inférieure à celle de la main gagnante prétendue: quand un bluffeur rationnel affiche une main forte, elle est présente plus d'une fois sur deux. Inversement, donc, si un bluffeur montre sa main forte moins d'une fois sur deux quand on vient le voir, son bluff n'est pas rationnel mais psychologique, et la bonne stratégie consiste à venir le voir beaucoup plus souvent.
Gain apporté par le bluff
Quel est l'intérêt de jouer sur le point neutre ? Le gain peut se calculer simplement en supposant que Alice est sur le point neutre, et Bob ne bluffe jamais (puisqu'il suffit qu'un des deux joueurs y soit pour que le résultat soit neutre):
- Sans bluff, quand son tirage réussit, Bob gagne le pot avec une fréquence (1-a), et perd sa relance avec une fréquence de a=5.6%. Globalement, son gain sans bluff est P(1-a)-R(a).
- Avec bluff, il oblige Alice à venir jouer au point neutre en venant voir avec une fréquence supplémentaire α, ce qui lui fait gagner à présent P(1-a-α)-R(a)+(P+R).α
- La différence entre les deux situations est (P+R)α-Pα = αR: en moyenne, Bob gagne exactement le montant de ses relances que Alice doit accepter de suivre, sur ses tirages réussis.
On voit que l'effet du bluff n'est pas sur les mains faibles (où le résultat est statistiquement indifférent), mais bien sur les mains fortes:
- L'intérêt d'une stratégie de bluff optimale est de valoriser statistiquement ses mains gagnantes, en obligeant l'adversaire à venir les voir plus souvent.
Le bluff sur une main faible n'est donc nullement une tentative de tromperie, ou un passage en force contre les statistiques, mais simplement un investissement à faire, judicieusement calculé pour augmenter ses gains sur l'ensemble de la partie.
L'échange caractéristique avec une relance de Bob signifie alors implicitement :
- (Alice) Ouverture au pot ( j'ai au moins une paire forte).
- (Bob) Suivi ( j'ai au moins ça).
- (Alice) Deux cartes (c'est une paire ou un brelan).
- (Bob) Une carte (c'est un tirage ou une double paire).
- (Alice) Ouverture au pot ( ma paire s'est améliorée).
- (Bob) Je relance de deux fois le pot ( je prétends avoir touché mon tirage, mais bien sûr, je mens deux fois sur cinq... à toi de voir).
- (Alice) Suivi ( tu vas rire, mais j'avais touché mon full..) ou Suivi ( je ne suis pas avec une main gagnante, mais j'assure mes 33% de "pour voir" pour sanctionner un bluffeur comme toi) ou Passe ( Tu as le droit de gagner ce type de relance dans 66% des cas, j'espère que tu avais du jeu, tu n'auras même pas le plaisir de le montrer...).
Raison pour jouer au point neutre
Pour Bob, jouer au point neutre présente un avantage financier direct: en moyenne il gagnera plus d'argent que sans bluff, que ce soit sur ses mains fortes valorisées par les suivis de Alice, ou sur les bluffs non tenus. Le jeu sur le point neutre présente un avantage psychologique et statistique: comme la rentabilité du coup ne dépend plus de facteurs psychologiques, il s'assure un jeu régulier, sans surprise financière. Le seul inconvénient est de s'astreindre à ne bluffer que dans les limites rationnelles, sans se laisser guider par son inspiration. Ceci étant, il peut continuer à le faire de temps en temps: ce sera statistiquement indétectable.
Pour Alice, le jeu sur le point neutre n'est pas financièrement avantageux, parce que c'est statistiquement une perte d'argent contre un joueur qui manifestement ne bluffe jamais, ou qui bluffe avec une fréquence manifestement en dessous de son point neutre. En revanche, c'est une assurance contre les gros bluffeurs ou les joueurs erratiques: en jouant sur le point neutre, elle peut jouer sans avoir à deviner ce que cache la stratégie de son adversaire. L'assurance a un coût, mais en moyenne, c'est le même coût qu'elle gagnera quand elle-même sera en position de bluffer: en moyenne, c'est une stratégie à somme nulle. Ceci ne l'empêche pas de venir voir moins souvent celles des mains dont elle pense que l'adversaire ne peut pas bluffer, bien sûr, si son intuition est solide.
- Contre un joueur qui manifestement ne maîtrise pas le taux optimal de bluff ou de sanction, il ne faut pas jouer sur le point neutre, mais d'une manière qui rentabilise son défaut de jeu systématique. S'il bluffe trop, augmenter le suivi, s'il "colle" trop au suivi, diminuer le bluff, et ainsi de suite. En moyenne, un joueur qui connaît ses points neutres gagne de l'argent contre un débutant qui n'en respecte manifestement jamais l'équilibre - il suffit d'attendre.
- Si l'adversaire joue manifestement sur le point neutre du bluff, il n'y a pas de raison de changer sa stratégie: tant qu'il ne bougera pas du point neutre, le gain moyen sera le même. Tout au plus est-il possible de tenter de s'écarter du point neutre pour voir s'il suit, et jouer au chat et à la souris dès qu'il le fait.
Niveau de relance optimal
On sait que Alice peut calculer son « point neutre » en fonction du taux de relance de Bob. Le gain de Bob par une stratégie de bluff est donc, en remplaçant α par sa valeur:
On voit que en fonction de R (le niveau de relance par rapport au pot), le gain suit une branche d'hyperbole, et est maximal quand sa différentielle s'annule:
-
- c’est-à-dire
Dans le cas présenté, l'optimum serait une relance à trois fois le pot, parce que la probabilité pour Alice de toucher le Full dangereux n'est que de a=5.6%, donc relativement faible. Pour une relance à trois fois le pot:
- Le taux maximal de bluff admissible est de l'ordre de 60% celui de la main prétendue: une enchère forte sera donc fausse dans 37.5% des cas.
- Le taux de vérification à assurer n'est plus que de 1/4 (en comptant les mains gagnantes).
- Le gain de la stratégie est alors 0.58 (au lieu de 0.54 pour une relance de deux fois le pot).
En fait, il n'est pas très important de jouer exactement sur l'optimum, puisque autour de cette valeur le gain moyen ne variera pas beaucoup. On peut retenir globalement que si la probabilité qu'a Alice de gagner sont de l'ordre de 10%, les relances de Bob sont optimales pour à peu près deux fois le pot.
En prenant des relances à deux fois le pot (R=2P), Bob doit bluffer avec une fréquence égale aux deux-tiers de sa probabilité d'avoir la main forte qu'il prétend afficher (b=14.6%), soit à peu près 10%. Quand son tirage est perdant (ce qui arrive avec fréquence relative de 85.4%), pour pouvoir à long terme valoriser ses tirages gagnants, il doit tout de même bluffer dans 10%/85.4%= 11.7% de ses mains perdantes, en relançant agressivement à deux fois le montant du pot.
Le chat et la souris
Le point neutre est stable, dans le sens où si l'un des deux joueurs s'y tient, son gain moyen ne dépend pas de la stratégie de l'autre joueur. Mais c'est une stratégie qui a un coût: en moyenne, il faut venir voir les relances, typiquement une fois sur trois.
Si Alice joue constamment sur son point neutre, Bob peut faire de la provocation sur une série de petits coups, en ne jouant manifestement plus sur le sien: se mettre à bluffer manifestement trop, ou au contraire jamais. Dès que Bob s'écarte manifestement de son point neutre, Alice peut modifier son taux de sanction en conséquence, et faire payer à Bob son inconstance: Si la stratégie de Bob est stable, Alice peut en tirer profit. Mais pour ce faire, elle doit elle-même s'éloigner du point neutre, ce qui l'expose à des retours de griffe de la part de Bob… bob peut tenter un jeu psychologique: faire croire à une stratégie excentrique, et deviner le moment où Alice changera sa stratégie, pour inverser son comportement.
Doubles relances
Une autre manière de voir le bluff est qu'il reflète le principe: il faut payer pour voir une main forte. En appliquant ce principe, face à la relance de Bob, Alice doit relancer pour faire payer à Bob son Full — et donc, doit également bluffer quand elle décide de dénoncer le bluff de Bob, de manière à l'obliger à suivre et rentabiliser en moyenne son Full.
L'échange caractéristique est alors:
- (Alice) Ouverture au pot (j'ai au moins une paire forte) — le pot vaut 2.
- (Bob) Suivi (j'ai au moins ça) — le pot vaut 3.
- (Alice) Deux cartes (c'est une paire ou un brelan).
- (Bob) Une carte (c'est un tirage ou une double paire).
- (Alice) Ouverture au pot, donc trois (j'ai au moins une double paire forte) — le pot vaut 6.
- (Bob) Je relance au double, donc trois plus neuf (je déclare avoir réussi mon tirage, mais je bluffe une fois sur trois…) — le pot vaut 6*3=18, et Alice doit ajouter 9 pour suivre.
- (Alice) Je relance aussi au double du pot (36), donc 9 plus 25 (Moi c'est un full, mais je bluffe aussi une fois sur trois…) — le pot vaut (18)*3=54, et Bob doit ajouter 25 pour suivre.
Arrivé à ce stade, Bob est toujours exposé à ses trois choix fondamentaux: passer, suivre, ou relancer?
Sauf cas particulier, un joueur qui a relancé (pour afficher un jeu fort) n'a pas de raison objective de relancer une seconde fois. S'il le fait, c'est pour des raisons qui se rattachent au jeu psychologique.
Passe ou suivi (Alice joue rationnellement un full)
Alice ayant relancé au double du pot, le point neutre est de venir voir une fois sur trois, indépendamment de la main de Bob. De fait, si Alice joue de manière rationnelle et fait une relance, elle ne bluffe qu'une fois sur trois, et a un jeu gagnant le reste du temps. Venir voir une main gagnante à 66% est statistiquement coûteux, mais c'est le prix à payer, parce qu'Alice bluffe correctement, et pour que le bluff d'Alice reste limité.
Ceci étant, Bob a affiché avoir réussi son tirage, et comme il bluffe rationnellement, le tirage y est deux fois sur trois. Tant qu'à passer, autant ne le faire que sur les mains qui de toute manière étaient perdantes. Alice peut bluffer avec un brelan, et ce serait idiot de venir le voir avec une simple paire quand on peut le faire en moyenne avec une suite… S'il y a une sur-relance de Alice, la stratégie de Bob est donc :
- Si la relance initiale de Bob était un bluff, passer.
- Si la relance initiale de Bob était justifiée par une couleur ou une quinte, venir voir une fois sur deux le full prétendu de Alice.
Relance (affichage d'un carré ou d'une quinte flush)
Une relance rationnelle affiche un jeu nettement plus fort que celui déjà affiché par l'adversaire.
Indépendamment du bluff, la première relance de Bob affiche un tirage réussi — sous forme la plus probable, c’est-à-dire quinte ou couleur. La relance de Alice affiche que sa paire s'est améliorée en full ou carré, ce qui bat la quinte ou la couleur. Une relance supplémentaire de Bob affirme qu'il détient un jeu encore plus fort, qui ne peut qu'être un tirage réussi à la quinte flush.
Quand on demande « une carte », le carré (servi) ou la quinte flush n'arrivent que dans 0.25% des distributions: sur la centaine de coups que représente une soirée, l'amélioration d'un tirage se voit une dizaine de fois, mais un carré servi ou une amélioration à la quinte flush est une main qu'on ne voit qu'une soirée sur quatre. Et il faut que ça tombe juste quand Alice déclare qu'elle améliore sa main au full? La coïncidence est extraordinaire…
Le raisonnement ne peut plus être statistique, mais doit être psychologique, parce qu'un tel jeu ne se présentera certainement pas deux fois à la table.
- Bob peut avoir montré plaisir à monter au bluff, pour le plaisir de la joute psychique. Il suffit de le créditer d'une probabilité de 0.5% de céder au psychique dans un tel cas pour que sa marge de bluff statistiquement autorisée soit dépassée, et que son bluff justifie statistiquement d'être sanctionné. Si Alice détient effectivement un full ou un carré, elle peut venir voir la prétendue quinte flush de Bob sur pratiquement n'importe quelle cote, à plus de cent contre un.
- Bob peut avoir montré un jeu sans faille, digne d'un ordinateur. Sachant qu'aucun système ne lui permettra de ne tenter un bluff au carré qu'à une fréquence crédible de 0.12%, il préfère ne pas tenter du tout ce type de bluff, bien trop aléatoire. Si la quinte flush ou le carré se présentent, il s'amusera des sueurs froides de ses adversaires face à ses relances, mais comme il ne jouera jamais cette scène deux fois devant le même public, il abandonne l'idée de préparer une valorisation de ce type de main par le sacrifice de bluffs préalables. Pour Alice, du coup, ce jeu est suffisamment rare pour qu'elle choisisse de limiter la casse en ne suivant jamais face à un adversaire rationnel: si c'est le mauvais choix, elle ne le saura jamais, parce qu'elle n'aura pas l'occasion d'en refaire un similaire dans la soirée.
- La relance de Bob peut simplement afficher —pour une raison ou pour une autre— qu'il ne croit pas au full d'Alice. Bob a peut-être senti une hésitation trop forte de Alice sur sa relance, donnant lieu à penser que cette relance est elle-même un bluff. Si c'est le cas, Alice peut décider de passer, ce qui ne lui coûte rien (puisque sa relance, n'étant pas justifiée par une main forte, était un investissement de toute manière sacrifié): elle affiche son bluff avec la fréquence statistiquement nécessaire pour rentabiliser le tirage d'un full une autre fois, elle montre que quand elle bluffe ça se voit, … mission accomplie, il lui suffit à présent de reproduire les mêmes hésitations quand elle aura effectivement son full. Elle peut aussi décider de relancer Bob à qui craquera le premier : si ce dernier n'a pas simplement suivi, c'est que lui aussi bluffe.
Références
- La relance complémentaire de Alice n'est que de R-r, parce que dans la relance de Bob, il faut retirer la partie r qu'il devait mettre pour suivre, et que Alice a donc déjà misée à ce stade.
Voir aussi
Lien externe
Catégories :- Vocabulaire du jeu
- Terminologie du poker
Wikimedia Foundation. 2010.