Poker I+D: Juego explotador vs juego óptimo
El poker es un juego en continua evolución y en EducaPoker trabajamos a diario analizando las corrientes teóricas y prácticas que van apareciendo y desarrollándose en las mesas de juego.
Una de las líneas de pensamiento más interesantes que podemos encontrar ahora tiene que ver con el juego explotador y el juego óptimo; o GTO según las siglas inglesas del término “Game Theory Optimal” que se ha popularizado. Nosotros utilizaremos el término en castellano “juego óptimo”.
Actualmente, en EducaPoker, estamos preparando nuevo contenido para el contenido de los niveles Licenciado y Doctorado, en el que nos centramos en el juego explotador. El juego óptimo solo lo abordaremos en los últimos niveles de Doctorado y en Cum Laude, los más altos de la escuela.
El motivo fundamental es que creemos que jugar explotador de forma correcta y adaptarnos rápidamente al juego de nuestros rivales es una herramienta mucho más valiosa para la mayoría de jugadores de poker.
En este artículo explicaremos qué es el juego óptimo, para qué sirve, y qué es el juego explotador, ayudándonos de un juego clásico como el piedra, papel o tijera.
¿Qué es el juego explotador?
Se conoce como juego explotador aquel en el que nuestra estrategia es la estrategia con mayor valor esperado contra nuestro oponente.
Muchas veces, cuando jugamos de forma explotadora, nos convertimos en rivales explotables. Esto significa que el rival puede cambiar de estrategia y jugar una en la que estaremos perdiendo dinero.
Jugamos a piedra, papel, o tijera, y sabemos que nuestro rival saca piedra un 25%, papel un 25%, y tijera un 50% de las veces. Nuestra estrategia explotadora consiste en sacar piedra el 100% de las veces. Al sacar piedra siempre, nuestro rival puede cambiar de estrategia, y pasar a una en la que nos gane siempre sacando papel.
¿Qué es el juego óptimo?
El juego óptimo es una estrategia inexplotable; es decir, cuando jugamos óptimo, estamos jugando de la mejor manera posible contra un rival que también juega de la mejor manera posible.
Estamos jugando a piedra, papel o tijera y sabemos que nuestro rival juega la estrategia de sacar piedra una tercera parte de las veces, papel otra tercera parte y tijera también una tercera parte de las veces. Nuestro oponente está jugando de forma inexplotable.
En el juego de piedra, papel o tijera, si nuestro rival es inexplotable, da igual qué estrategia juguemos nosotros.
Si intentamos calcular una estrategia explotadora contra la estrategia inexplotable, en el juego piedra papel o tijera vemos que todas las estrategias que usamos tienen el mismo valor esperado; es decir, nuestra estrategia es indiferente.
Aunque a nosotros nos es indiferente qué estrategia utilizar, si elegimos una estrategia diferente de la de sacar piedra, papel o tijera con la misma frecuencia, nuestro rival podría pasar a una estrategia explotadora en la que tendría más valor esperado.
Cuando dos rivales juegan inexplotables, están jugando dos estrategias en las que se explotan al máximo mutuamente; es decir, ambas estrategias tienen el máximo valor esperado contra la estrategia de nuestro oponente.
Si los dos rivales jugamos de forma inexplotable, ninguno de los dos puede ganar más dinero variando esta estrategia.
Características del juego óptimo y del juego explotador
Hay varios hechos matemáticos interesantes sobre el juego óptimo y el juego explotador.
Todas las jugadas tienen el máximo valor esperado en una estrategia óptima
Cuando dos rivales están jugando óptimo, ningún rival tiene ningún incentivo para desplazarse de esta estrategia unilateralmente. Es decir, ninguno de los dos tiene formas de mejorar la estrategia.
La estrategia óptima es, por definición, una estrategia explotadora (una estrategia de máximo EV) contra un rival que juega óptimo. Esto significa que en ninguna de las estrategias hay alguna jugada con un valor esperado inferior a otra. No hay ninguna jugada con valor esperado negativo en una estrategia óptima ya que si esto fuese así podríamos abandonar y mejorar el valor de nuestra estrategia de forma unilateral.
Muchos jugadores de poker creen que es equilibrado tener manos con valor esperado negativo en su rango de open raise, defensa o 3bet.
Jugar la misma mano de forma diferente
Es posible que en una estrategia óptima pueda jugar la misma mano de forma diferente.
Por ejemplo, podría resubir con aades">sad un 40% de las veces e igualar una apuesta el 60% restante. Para que esto suceda, por la propia definición de juego óptimo debe ocurrir que las dos líneas tengan exactamente el mismo valor esperado contra la estrategia de nuestro rival.
Si esto no fuese así -es decir, si mis aades">sad tuviesen más valor esperado igualando que resubiendo- yo podría mejorar unilaterlamente mi estrategia igualando con todos mis ases contra la estrategia de mi rival. Si esto fuera cierto, la estrategia en la que resubo Ases no sería óptima.
Estrategia explotadora vs juego óptimo
Si nuestro rival está jugando óptimo y nosotros somos capaces de calcular correctamente el valor esperado de cada una de nuestras acciones, la estrategia explotadora que calculemos tendrá el mismo valor esperado que la estrategia óptima.
Si supiéramos jugar a la perfección de forma explotadora, probablemente estaremos jugando óptimo sin saberlo.
Juego óptimo y juego explotador en el river
En el river es dónde es más sencillo encontrar estrategias óptimas. El motivo es que es muy sencillo calcular el valor esperado de nuestros movimientos, porque no hay rondas futuras que influyan en los cálculos.
En el river sucede, además, que los faroles que intentamos normalmente tienen el mismo valor esperado.
Supongamos que nuestro rival nos paga, por ejemplo, con todas sus manos mejores que una pareja media. Todas las manos peores que apostemos perderán siempre cuando nos paga y el valor esperado de estos faroles será la fold equity que tengamos. Cuando esto sucede, normalmente en la estrategia óptima el valor esperado de los faroles es de 0.
En ese caso, para la estrategia explotadora es indiferente el número de faroles a realizar, ya que el valor esperado es el mismo. Sin embargo, en la estrategia óptima el número de faroles si importa ya que si hacemos de más o de menos nuestro rival se puede adaptar y jugar correctamente contra nosotros.
Es importante resaltar que si nuestro rival juega óptimo, la estrategia explotadora tendrá el mismo EV que la óptima.
¿Qué sucede en calles anteriores?
En las calles previas al river calcular con precisión es mucho más complejo debido a la cantidad de variables que introducen las rondas futuras.
En estas calles, no todos los faroles tienen el mismo valor esperado. Es muy diferente hacer faroles con manos que tienen equity a hacerlo con manos que no lo tienen.
Cuando nuestro rival esté jugando óptimo en el turn, la cantidad de los faroles no dependerá sólo de la fold equity. El equity que tenga la mano es otro factor relevante. Esto hace que normalmente no haya un conjunto de estrategias con el mismo valor esperado, sino sólo una única estrategia tiene el valor esperado máximo, y esta estrategia es tanto la estrategia explotadora como la estrategia óptima.
¿Cuándo debemos jugar óptimo?
Cuando jugamos contra un rival competente y adaptable, aunque creamos que puede cometer alguna debilidad, no deberíamos usar líneas demasiado desequilibradas para explotarlas, para evitar entrar en la guerra de quién está explotando a quién.
Para jugar correctamente contra estos oponentes necesitamos tener una cierta idea sobre el juego óptimo.
Este tipo de jugadores sólo está en los stakes más altos de la red, lo que además convierte estos conocimientos en muy específicos para jugar estos niveles.
La ventaja de tener conocimientos aproximados de juego óptimo es que nos podemos despreocupar un poco de estos oponentes, sabiendo que no van a poder explotarnos, y centrarnos en explotar las debilidades del resto de jugadores.
Todavía no se ha realizado ningún comentario en esta noticia.
¿Quieres participar?
Es fácil y no te costará nada
¡únete a Poker-Red!