"Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

7 respuestas
30/09/2008 23:03
1

(traducción de este post de 2+2 sobre teoría de juegos, que encontré vía el estupendo blog de Itsuga. Que lo disfruteís.)

La teoría de juegos se ha convertido en una tema típico, aunque bastante mal comprendido, en las discusiones sobre hold'em. Este artículo pretende ofrecer una comprensión fundamental de qué es una estrategia óptíma de teoría de juegos, cómo funciona y qué impacto tiene en un juego como el hold'em. Pero antes de empezar el artículo en sí, vamos a ver una serie de definiciones clave. Éstas no tienen por qué ser idénticas a las usadas por otros autores.

Estrategia explotadora óptima: Una estrategia que consigue el mayor valor esperado contra la estrategia dada de un oponente. Por ejemplo, en un juego de piedra-papel-o-tijera, si la estrategia de tu oponente es elegir "piedra" todas las veces, tu estrategia explotadora óptima es elegir papel en todos los casos. Esto también es así si la estrategia de tu oponente consiste en un 50% de piedra, un 25% de papel y un 25% de tijeras.

Estrategia subóptima: Es una estrategia que funciona peor que una estrategia explotadora óptima. Por ejemplo, si la estrategia de tu oponente es elegir piedra todas las veces, elegir un 50% de papel y un 50% de piedra es aún una estrategia ganadora. Su valor esperado, sin embargo, es menor que el de una estrategia de sólo papel. Por tanto, la estrategia de piedra-y-papel es subóptima.



Estrategia óptima de teoría de juegos (a partir de ahora, " estrategia GTO" -por "game theory optimal strategy"): Es la estrategia que consigue el mayor EV si tu oponente elige la mejor contraestrategia posible. En un juego de piedra-papel-o-tijera, la estrategia GTO es elegir al azar entre una distribución igual de piedra, papel y tijera. Si juegas menos veces piedra que papel, tendrás una expectativa de victoria menor de 1/2 contra todas las estrategias donde la tijera es dominante. Por tanto, debes jugar al menos tantas veces piedra como papel, y del mismo modo tantas tijeras como piedras. Por tanto, como resultado, obtenemos que debes jugar una cantidad igual de piedra, papel y tijera para garantizar una expectativa de 1/2 contra todas las posibiles contra-estrategias. Si tu oponente elige siempre la mejor contraestrategia posible, ninguna estrategia te garantizará más EV que esta.

Estrategia explotadora: Cualquier estrategia que tenga un valor esperado mayor que la estrategia GTO contra una estrategia determinada de un oponente.

Estrategia explotable: Una estrategia que tiene menos EV contra algunas estrategias explotadores del que tendría una estrategia GTO. Todas las estrategias no-GTO son explotables.

Cuando analizamos estrategias explotadoras óptimas, tratamos la estrategia del oponente como si fuese, de hecho, conocida. Por ejemplo: "mi oponente siempre elige piedra". En realdad, la estrategia de nuestro oponente es desconocida, y nosotros siempre decidimos esto en base a asunciones y observaciones para determinar qué tipo de estrategia nuestro oponente puede tener. Para determinar una estrategia GTO, asumimos que el oponente siempre elige la contra-estrategia explotadora óptima contra cualquier posible estrategia que intentemos plantear, y no un juego mixto.

El hold'em es un juego mucho más complicado que el piedra-papel-o-tijera, y hasta que el juego no sea resuelto por los ordenadores, nadie jugará contra un oponente que elija siempre una estrategia GTO (es decir, "inexplotable"). Esto es un asunto importante, porque una estrategia GTO no es necesariamente la que tiene el mayor EV. Por ejemplo, si un oponente tiene una estrategia de sólo-piedra, la estrategia GTO de elegir al azar entre una distribución igual de piedra, papel y tijera tiene menos EV que una de sólo-papel.

El juego óptimo no explotable, sin embargo, juega de todos modos un importante papel en la estrategia del hold'em. Si bien esta estrategia GTO puede realizar menos valor esperado que una estrategia explotadora, entender qué es la estrategia GTO e identificar cómo las estrategias de tus oponentes se desvían de ella te puede ayudar a explotar mejor a tus oponentes. Además, entender la estrategia GTO permite también desarrollar líneas difíciles de explotar, que se pueden usar como defensa contra oponentes muy duros que busquen un edge intentando explotar tu juego.

En hold'em, como en muchos otros juegos (al igual que el piedra-papel-o-tijera), una estrategia GTO es identificable buscando un punto de indiferencia. Lo que esto quiere decir es que la estrategia GTO distribuirá generalmente tus acciones de tal manera que a tu oponente le será indiferente elegir entre dos acciones. El resultado de ello es que tu estrategia es inexplotable.

Aunque el hold'em no ha sido resuelto aún, muchos mini-juegos a media calle o a una calle entera que modelan situaciones reales de hold'em sí han sido resueltos. Entendiendo cómo funcionan los puntos de indiferencia en diferentes escenarios posibles, puedes detectar desviaciones de la estrategia de tus oponentes respecto de una estrategia GTO, y así encontrar la manera de maximizar tu margen sobre esa estrategia y explotarla.

Un ejemplo claro de minijuego a media calle, sería un juego en el que tenemos una mano tal que sabemos que siempre ganará o que siempre perderá cuando veamos un showdown, y podemos apostar o pasar, y nuestro oponente puede solamente elegir entre igualar o pasar. Si iguala, hay un showdown. Esto es con cierta frecuencia lo que se puede dar en una partida real de hold'em, si en el river el rango de nuestro oponente es muy restringido y el nuestro está muy polarizado. Si resolvemos el minijuego, veremos que la estrategia GTO consiste en farolear una cantidad de veces[1] proporcional al precio que le consentimos al oponente con su call. Por ejemplo, si apostamos 1$ en un bote de 2$, le estamos ofreciendo unas odds de 3:1, así es que la estrategia GTO consistirá en farolear un 25% de las veces que apostamos. Esto quiere decir que, si nos desviamos de esta estrategia, nuestro oponente nos puede explotar igualando siempre si faroleamos más, o tirando siempre las cartas si faroleamos por debajo del punto de indiferencia.

No todas las decisiones de teoría de juegos tienen que ver con buscar puntos de indiferencia. Por ejemplo, si estamos jugando una variante del piedra-papel-o-tijera con una cuarta opción, "dinamita", que gana a todas las demás, la estrategia GTO es elegir sólo dinamita. Tu oponente puede, de todos modos, elegir una estrategia dominada eligiendo papel, tijeras, o roca [2]. Una situación similar se da en el hold'em, cuando las nuts son una porción tan grande de nuestro rango que es imposible farolear tanto como para que al oponente le sea indiferente igualar o tirar su mano.

Lo que esto significa es que mientras que una estrategia GTO no puede nunca jamás ser explotable, lo que supone que no será nunca una estrategia perdedora (en un juego libre de rake), tus oponentes pueden de todos modos tomar estrategias dominadas, que les llevarán a perder y a tí a ganar. Por consiguiente, si bien las estrategias GTO suelen ser subóptimas en el hold'em, la perspectiva de obtener una de estas "estrategias invencibles" tiene consecuencias interesantes para cualquier estudiante avezado de la teoría de juegos, especialmente en los high stakes.

Un oponente duro solalmente es duro, al fin y al cabo, porque él o ella elige unas pocas líneas subóptimas menos que un oponente más blando. Un jugador extraordinariamente bueno tendrá una enorme capacidad para realizar un juego dinámico. Si eliges una estrategia de sólo-roca, él o ella lo reconocerá rápido y jugará sólo-papel, y así en cada caso. Este tipo de jugadores identifican muy rapidamente tendencias en tu juego, incluso llegando a hacer asunciones preventivas sobre cómo puede variar tu juego, que les permitirán explotar tus estrategias sub-óptimas con una frecuencia y una precisión realmente molesta.

Es atractivo pensar que, por elegir una estrategia GTO, nuestros oponentes pueden solamente perder. De todos modos, incluso los oponentes más fuertes tienen estrategias explotadoras -y por tanto explotables- en su juego, y a fin de cuentas el hold'em es un juego de información incompleta. Si juegas contra un oponente extraordianariamente bueno como para jugar una estrategia equivalente a elegir un 33% de papel, un 20% de tijeras y un 47% de piedra, sería una estupidez intentar una estrategia de sólo papel. pero entendiendo dónde cae el punto de indiferencia, y desviándonos un poco de él, podemos jugar explotadoramente. Incluso el más duro y curtido de los jugadores no tiene el don de la clarividencia, así que si eliges una estrategia de 40% papel, 30% tijeras y 30% piedras: ¿Cómo va a hacer para adivinarlo?

[1] Es decir, la cantidad de la apuesta es fija y está dada por las reglas del juego. Lo que varía es, en función de esta cantidad, nuestro % de faroles en ese spot (nota mía).



[2] En cierto modo, al oponente le es indiferente elegir entre cualquier estrategia. El punto es que, elija lo que elija, su estrategia será perdedora, mientras que en el primer caso adpotar una estrategia GTO suponía que, aunque éramos inexplotables, nuestra estrategia no podía explotar al oponente (como en el caso de elegir al azar entre una distribucion igual de piedra, papel, o tijera. A donde el artículo quiere llegar después es que en hold'em puede haber situaciones donde hay estrategias óptimas que, si el oponente es suicientemente malo, son explotadoras (aunque no por ello tienen por qué tener la mejor EV).

30/09/2008 23:35
Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

gran curro, gracias por el artículo.

01/10/2008 02:33
Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Ja! Me encontraba traduciendo el artículo para mi carpeta de recursos..., googleé GTO en español..., y me trajo la traducción completa!!!

Gracias por el aporte. A ver si el próximo puedo devolver el favor!

Saludos.

01/10/2008 02:36
Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

lol, qué curioso. Espero que no llevases mucho...

07/10/2008 22:34
Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Muy buen artículo y traducción. Muchas gracias por tomarte la molestia. Reputado estás.

08/10/2008 23:15
Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Gracias por la traducción Sergeon.

Un saludo.

08/10/2008 23:20
Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Thx por el curro y está muy bien el artículo!

Saludos!

08/10/2008 23:56
Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Buena, niño, y deja mis putas ciegas.

Responder

¿Quieres participar?

Inicia sesión o crea tu cuenta gratis para formar parte de la comunidad de Poker-Red.