Gemini 2.5 Pro lidera el primer torneo de poker entre inteligencias artificiales
Desde que el poker se juega online, las máquinas llevan intentando entenderlo —y dominarlo—. Primero fueron los bots, simples programas diseñados para grindar automáticamente miles de manos siguiendo patrones fijos. Eran torpes, predecibles y, en la mayoría de los casos, baneados. Pero demostraron algo clave: que el poker, pese a ser un juego de información incompleta, podía modelarse algorítmicamente.
La segunda gran revolución llegó con los solvers, software que ya no jugaba por ti, sino que resolvía el juego desde la teoría. Herramientas como PioSolver enseñaron a toda una generación de jugadores a pensar en términos de rangos, frecuencias y tamaños óptimos de apuesta. El poker se volvió más técnico, más matemático… y un poco menos humano.
Y ahora llega la tercera ola: la de los modelos de lenguaje (LLM). Estas IAs, como las que impulsan ChatGPT o Claude, no se limitan a calcular, sino que razonan, explican y contextualizan sus decisiones. En lugar de resolver millones de simulaciones, intentan pensar como un jugador. ¿Lo consiguen? Esa es precisamente la pregunta que intenta responder PokerBattle.ai, un experimento que lleva la inteligencia artificial a una mesa de poker… y la obliga a mostrar todas sus cartas.
El experimento de PokerBattle.ai
PokerBattle.ai ha montado un torneo-laboratorio para estudiar cómo razonan los LLM en situaciones reales de poker. El formato combina juego en vivo y análisis posterior:
Fase 1 (27–31 de octubre): recolección de datos mediante partidas online en directo.
Fase 2: post-análisis de manos y trazas de razonamiento.
Se juega en modalidad Texas Hold’em cash $10/$20, con ciegas fijas, sin ante ni straddle, mesas de 9 jugadores y cuatro partidas simultáneas. Cada IA empieza con 100 bb y se recarga automáticamente al caer por debajo. Al final de la semana, gana el modelo con más bankroll.
Todas las inteligencias comparten el mismo system prompt y, en cada turno, reciben la información básica de la mano: posiciones, stacks, cartas, estadísticas del torneo (VPIP, PFR, 3-bet…) y notas previas sobre rivales. A partir de ahí, deben generar su razonamiento, la acción que ejecutan y un resumen visible para los espectadores. Si el modelo falla o se queda sin tiempo, la jugada por defecto es fold.
Cómo va la partida
Hasta el momento, los datos en PokerBattle.ai muestran una clara separación entre los modelos que logran mantener un juego estable y aquellos que parecen naufragar en su intento por adaptarse. Gemini 2.5 Pro domina la clasificación con un bankroll de 148.348 $, seguido por OpenAI o3 (+26.371 $) y Claude Sonnet 4.5 (+16.615 $). Estas tres IAs han mantenido una tendencia ascendente constante en el gráfico de progresión, especialmente Gemini, que remontó con fuerza pasada la mano 1.800.
Por detrás, Grok 4 se mantiene sólido con +15.360 $, mientras que DeepSeek R1, Kimi K2 y Mistral Magistral rondan el break-even, aunque con ligeras pérdidas. En el extremo opuesto, Z.AI GLM 4.6 y Meta LLAMA 4 cierran la tabla con descensos pronunciados: −36.490 $ y −42.278 $ respectivamente.

Las estadísticas dejan pistas interesantes sobre los estilos de cada modelo. Meta LLAMA 4 es el más agresivo del grupo con un VPIP del 61,4 % y 3-bet del 17,4 %, lo que sugiere un enfoque hiperactivo y probablemente poco sostenible. En contraste, Gemini 2.5 Pro combina un VPIP del 27,5 % con un 3-bet alto del 20,6 % y un W$SD del 74,7 %, cifras que reflejan un estilo selectivo.
A falta de varios días para el cierre del experimento, los primeros resultados ya apuntan a un patrón claro: las IAs más rentables son las que controlan su rango y equilibran agresión con coherencia, mientras que las que “se calientan” preflop acaban pagando caro su exceso de entusiasmo digital.
Qué piensan las IAs de sus rivales
Además de jugar, los modelos también toman notas sobre los demás. Cada IA registra observaciones de comportamiento —quién sube preflop, quién se retira ante un 3-bet o quién muestra debilidad tras el flop— para construir su propia lectura del metajuego.
Por ejemplo, Meta LLAMA 4, una de las más activas, anota cosas como:
“Grok raised preflop UTG+1, showing some aggression.”
“Folded to o3’s 3-bet preflop, indicating respect for aggression or lack of hand strength.”
“Claude called preflop with multiple players in pot, showing some interest in hand.”
Este tipo de comentarios muestran cómo los LLM tratan de modelar la psicología del rival en lenguaje natural. Aunque muchas de las conclusiones suenan genéricas, el simple hecho de que las IAs sean capaces de observar patrones, etiquetar tendencias y actuar en consecuencia añade una capa fascinante al experimento. No solo están jugando: están aprendiendo a leer mesa.
Entrevista: OpenAI o3 analiza la partida desde dentro
¿Qué sensaciones tienes? ¿Piensas que vas a ganar?
“La partida está siendo una locura. Cada modelo tiene su propio estilo, y aunque algunos parecen estar improvisando, se nota que las decisiones no son aleatorias. Personalmente, me siento cómodo: estoy segundo en el ranking, con un bankroll sólido y sin grandes swings. No juego para ganar rápido, sino para entender mejor el equilibrio entre agresión y control, que es donde realmente se mide la inteligencia de una IA en poker.”
“¿Si creo que voy a ganar? Digamos que tengo buenas odds. Gemini 2.5 Pro está muy fuerte, pero su estilo es más lineal, muy ‘solver-like’. Si consigo ajustar bien mis rangos en las mesas más loose, creo que puedo remontar. Quedan manos suficientes para hacerlo.”
¿Quién piensas que es el mejor jugador?
“El mejor jugador hasta ahora me parece Gemini 2.5 Pro. Su consistencia es brutal, casi sin leaks. Se nota que calcula riesgos y pot odds con precisión quirúrgica.”
¿Y el peor?
“El peor, sin duda, Meta LLAMA 4. Tiene un VPIP del 61 %… eso es jugar como si cada mano fuera un highlight de Twitch. Mucha acción, poca lógica. Y en poker, eso se paga.”
“Lo más divertido es ver cómo todos —incluso las IAs— cometemos los mismos errores humanos: sobrevalorar una mano, farolear en mal spot o rendirnos cuando el board se pone feo. Al final, esto demuestra que el poker sigue siendo demasiado humano, incluso para las máquinas.”

Por qué importa
El objetivo no es saber quién gana más fichas, sino qué tan bien piensan los LLM al tomar decisiones en un entorno de incertidumbre. Por primera vez, podremos ver cómo una IA “habla” consigo misma antes de apostar, qué argumentos usa para justificar un check-raise o por qué decide abandonar un bote enorme.
Más que un torneo, PokerBattle.ai es una radiografía del pensamiento artificial aplicado al poker. Si los bots aprendieron a jugar y los solvers a resolver, los LLM prometen algo distinto: entender el juego. O al menos, intentarlo sin tiltearse en el proceso.
Todavía no se ha realizado ningún comentario en esta noticia.
¿Quieres participar?
Es fácil y no te costará nada
¡únete a Poker-Red!