El problema de la legitimidad de las stats

Anónimo | 26/05/09

http://www.school-clipart.com/_thumbs/0511-0807-0912-2349.jpgLos programas de apoyo como el Poker Tracker o el Hold'em Manager son de una gran ayuda para jugar online, dado que sobreoimpresionan las estadísticas de nuestros oponentes mientras jugamos, mejorando mucho nuestra toma de decisiones. El problema es que sencillamente hay veces que no tenemos suficientes manos de un oponente para saber si sus estadísticas son fiables.

¿Cómo saber si una estadística es fiable en un tramo dado de manos? No es algo fácil de plantear. Sencillamente no tiene sentido decir "1.000" manos son pocas para saber como juega un jugador o "10.000" son muchas. Hay stats como el VPIP y el PFR que requieren muestras relativamente pequeñas para convergir a su valor real (150 manos suelen ser suficientes), mientras que estadísticas muy específicas de turn, river y showdown se dan tan poco que requieren muestras enormes para tener significado (con el problema añadido de que 20.000 manos después lo más probable es que un jugador dado haya cambiado su estilo de juego).

Una aproximación razonable podría ser asumir de alguna manera un número límite de casos para valorar una estadística, asumiendo p.e. que 100 casos son suficientes para fiarnos. Por ejemplo para el VPIP nos conformaremos con un tramo de 120 manos, mientras que para el c-bet necesitaremos un número de manos que englobe 100 casos. El problema es que la varianza de las situaciones preflop no es la misma que la del post-flop, por lo que esta solución es demasiado arbitraria. Además hay correlaciones entre estadísticas que, aunque no se puedan conocer apropiadamente, nos sirven para poder obtener información de muestras pequeñas: por ejemplo yo puedo tener una muestra de casos muy pequeña de apuestas de continuación en botes resubidos preflop de un jugador, pero si tiene un VPIP, un PFR, un 3bet, un C-bet y un Agg% muy elevados puedo estar prácticamente seguro de que esa stat va a ser elevada, incluso si sólo tengo 10 o 12 casos de esa situación de juego.

Otra cosa a tener en cuenta es la distribución de ese dato en toda la población. Si tenemos un jugador que en 20.000 manos tiene un winrate de 0,5 bb/100, y sabemos que en su metajuego el 70% de los jugadores son perdedores, la probabilidad de que ese jugador sea perdedor es muy alta (dadas determinadas condiciones de desviación estándar del winrate y distribución del winrate en la población que dependen de cada caso concreto, claro).

Para el que quiera profundizar un poco más en estos problemas (que se pueden solucionar de una forma 'sencilla', preguntando a jugadores y mirando bases de datos), le recomiendo el Mathematics of poker, donde se da un gran ejemplo de cómo hacer este tipo de cálculos para una stat como es el winrate -el caso más fácil, dado que el HM nos da la desviación estándar del valor-.

Además, en este hilo del foro, algunos foreros dan muy buenas ideas y enlaces sobre cómo realizar los cálculos para sacar conclusiones adecuadas sobre este tipo de problemas... pero ya adelanto que atacar matemáticamente este tipo de cuestiones es algo muy complicado y que seguramente requiere demasiado tiempo.

COMENTARIOS

Todavía no se ha realizado ningún comentario en esta noticia.