La GTO, ou "stratégie optimale de la théorie des jeux", est une manière de jouer inexploitable. Cela signifie que, même si les autres connaissent cette stratégie, ils ne peuvent pas en tirer profit sur le long terme.
Imaginez un jeu de pierre-papier-ciseaux. Si un joueur répète toujours le même choix, il devient prévisible et perd facilement. En mélangeant les options de manière imprévisible, il devient impossible pour l’adversaire de deviner le prochain coup. En GTO, le principe est similaire : même si un adversaire connaît la façon de jouer de son adversaire, il ne peut pas l'exploiter.
Appliquer cette stratégie est complexe, mais elle aide à être moins vulnérable et à prendre de meilleures décisions sur le long terme.
La théorie des jeux est une branche des mathématiques appliquées qui analyse les situations stratégiques où les choix de chaque participant dépendent des actions des autres. Cette théorie est utilisée pour étudier divers domaines tels que l’économie, la politique, la biologie, et bien sûr, des jeux comme le poker.
L’objectif est de prédire les comportements des joueurs en supposant qu’ils agissent de manière rationnelle pour maximiser leurs gains ou minimiser leurs pertes, selon les règles et les objectifs du jeu.
Dans le poker, la théorie des jeux aide à comprendre les interactions entre joueurs, leurs décisions, et les stratégies qu'ils peuvent choisir pour obtenir les meilleurs résultats. Cela est essentiel car chaque joueur cherche aussi à maximiser ses gains. Un concept clé est celui de l'équilibre de Nash, nommé d’après le mathématicien John Forbes Nash.
Un équilibre de Nash survient lorsqu’aucun joueur ne peut améliorer ses gains en changeant de stratégie, tant que les autres conservent les leurs. Autrement dit, chaque joueur adopte une stratégie optimale qui rend tout ajustement inutile pour les autres.
Pour mieux comprendre, imaginons deux marchands de glaces sur une plage.
Au début, les deux marchands se partagent la plage pour couvrir le plus de clients possible. Le marchand rouge attire autant de clients que le marchand bleu, car chacun couvre la même zone.
Mais ce n’est pas un équilibre de Nash, car chaque marchand peut encore bouger pour gagner plus de clients.
Si l’un se rapproche du centre de la plage, il couvre plus de surface et attire donc plus de clients.
Le marchand bleu se rend compte qu'en avançant un peu vers la gauche, il pourrait encore couvrir plus de clients. Cela lui apporterait plus de ventes.
Pour compenser, le marchand rouge se déplace aussi, mais vers la droite.
Ce mouvement se répète jusqu'à ce que les deux marchands arrivent au centre.
Chaque marchand a trouvé la meilleure stratégie. Ils sont inexploitables et à l’équilibre, car aucun n’a intérêt à bouger.
Bien que cette stratégie limite leurs ventes globales, car les clients aux extrémités de la plage peuvent renoncer à marcher jusqu’au centre, cela reste un équilibre de Nash. Aucun marchand ne peut améliorer sa position sans une stratégie différente et coordonnée.
<span class="inarticle_section">♠️ Au poker, la GTO (Game Theory Optimal) vise ce même équilibre de Nash. Elle consiste à jouer de façon à ce qu’aucun adversaire ne puisse exploiter vos décisions pour un profit constant, comme pour les marchands sur la plage.</span>
La GTO est donc une stratégie inexploitable. En suivant cette stratégie, comme le marchand bleu qui reste au centre, personne ne pourra faire mieux que vous sur le long terme, quelle que soit leur stratégie.
Les tableaux de Push or Fold sont issus de la GTO. Ce nom est bien connu des joueurs de poker, souvent même par les débutants.
Ces tableaux sont conçus pour être inexploitables dans une situation théorique où deux joueurs n'auraient que deux choix possibles : push ou fold.
<span class="inarticle_section">⚠️ Les tableaux couvrent des stacks de 0 à 20 big blinds ou plus, mais au poker, on applique surtout cette stratégie dans les situations où le stack effectif est de 7bb ou moins. En effet, avec un stack plus élevé, une stratégie de push or fold devient moins rentable car il est souvent plus avantageux de limp ou de minraise.</span>
Note sur les variations de 63s, 53s et 43s :
La main 63s se push de façon optimale entre 7.1 et 5.1bb, puis seulement en dessous de 2.3bb. La main 53s est rentable entre 3.8 et 12.9bb, puis encore en dessous de 2.4bb. La main 43s se push bien entre 4.9 et 10bb, puis de nouveau en dessous de 2.2bb.
Ces variations existent car, quand la big blind (BB) call avec beaucoup de mains ayant des 3, 4, 5 ou 6, notre main est souvent dominée, ce qui rend le push EV-. Quand notre stack est très bas, sous 2.4bb, ces mains redeviennent bonnes à push, malgré un risque de domination.
<span class="inarticle_section">ℹ️ À noter que ces variations sont très précises et ne sont pas une priorité pour les débutants.</span>
La GTO au poker est déterminée grâce à des programmes informatiques appelés “solvers”. Ces solvers testent des milliers, voire des millions de situations pour trouver les actions les plus efficaces dans chaque cas. Ils calculent ces actions pour maximiser les gains ou réduire les pertes, sans tenir compte des choix de l’adversaire.
Il est difficile de répondre à cette question de façon simple. La stratégie GTO est très complexe et ne peut pas être totalement résolue par les ordinateurs actuels. En pratique, les solvers ne font donc qu’approximer la GTO. Par exemple, la plupart des solvers utilisent des tailles de mises fixées par l’utilisateur, une contrainte qui peut varier d’un solver à un autre. Malgré ces limites, les solutions proposées par les solvers sont très précises.
Pour les joueurs de poker, les solvers offrent ainsi une stratégie proche de la GTO, ce qui en fait un outil précieux pour jouer de manière quasi-inexploitable.
Comme expliqué précédemment, jouer GTO consiste à adopter une approche de jeu où, même en révélant sa stratégie à l’avance aux autres joueurs, personne ne pourra en tirer avantage pour vous battre sur le long terme. En pratique, cela signifie effectuer des choix stratégiques qui équilibrent parfaitement les mises et les bluffs pour rester indifférent face aux actions des adversaires.
<span class="inarticle_section">ℹ️ Par exemple, si lors d’un coup vous décidez de relancer avec une certaine main et de simplement suivre avec la même main dans d’autres situations, vous créez une stratégie mixte qui rend difficile pour vos adversaires de prévoir vos actions et de les exploiter.</span>
Pour savoir prendre ces bonnes décisions de fréquences et d’actions, un travail hors des tables conséquent est nécessaire en utilisant un solver GTO (comme GTO Wizard).
Dans le poker GTO, maîtriser les bonnes fréquences pour relancer, suivre, ou passer est essentiel. Ces fréquences indiquent comment jouer certaines mains pour rester imprévisible et efficace.
<span class="inarticle_section">ℹ️ Exemple : décider de bluffer avec une main 20% du temps et de jouer en value le reste optimise vos gains et limite vos pertes. Cela rend aussi vos choix difficiles à lire et à exploiter pour vos adversaires.</span>
Suivre une stratégie GTO n’est pas toujours nécessaire et n’est pas toujours le meilleur choix. Cela est surtout vrai contre des joueurs qui font des erreurs prévisibles. Dans ces cas, une approche exploitante, qui tire profit de leurs faiblesses, peut être plus rentable. Cette approche est souvent meilleure pour les joueurs qui jouent à des petites limites où les erreurs sont fréquentes. Mais comprendre les bases de la GTO reste utile pour construire une stratégie solide et améliorer son jeu global.
Jouer parfaitement GTO reste hors de portée pour les joueurs humains. Cela demande une quantité énorme de calculs et de scénarios impossibles à gérer. Comme expliqué, même les solvers de poker n’arrivent qu’à approcher les stratégies GTO. Pour les joueurs, viser une stratégie proche de la GTO est un bon objectif, mais atteindre une GTO parfaite n’est pas réalisable.
Quelques liens si vous souhaitez en savoir plus :