Página 1 de 3 123 ÚltimoÚltimo
Resultados 1 al 10 de 25

Tema: Introducción a las estadísticas detrás de la varianza

  1. #1

    Predeterminado Introducción a las estadísticas detrás de la varianza

    Este artículo es la traducción de un mensaje de holdem2000 en este hilo de los foros de 2+2. Su título original es " A primer on the statistics behind variance” y fue publicado el 12 de diciembre de 2007. MonJamon ya hizo una traducción de un artículo en el que se usaba una hoja Excel para calcular el rango de nuestro ratio de ganancias real. Pero he traducido éste porque creo que es un buen comienzo para todos aquellos que estén interesados en las matemáticas y en la estadística pero no se hayan atrevido a echarle un ojo por si resultara demasiado complicado. En el libro “Mathematics of Poker” aparece más o menos toda esta información entre otras muchas cosas. Ya se sabe, en esta vida, todo son numericos…

    La idea para escribir este artículo vino tras un hilo en el que 1p0kerboy nos estábamos explicando de manera atropellada los mismos cálculos el uno al otro... mostrando parte de la información de manera un poco confusa. Aquí expreso todo esto de manera mucho más clara gracias a la discusión con 1p0kerboy.

    En este mensaje voy a cubrir una serie de aplicaciones estadísticas para una mejor comprensión de la muestra de la varianza. Explicaré, asimismo, cómo usar la información obtenida de Poker Tracker para estimar intervalos en los que se encuentra el "verdadero" ratio de ganancias en un nivel dado de confianza. Antes de comenzar, voy a incluir un breve descargo de responsabilidad/rajada que es en realidad más un comentario técnico; puedes saltarte tranquilamente esta sección si no estás familiarizado de alguna forma con la idea de medir la varianza cuantitativamente y con la distribución normal... el resultado de este apartado es que las matemáticas que se mostrarán a continuación son una [probablemente ligera] estimación a la baja de la varianza real.

    \comienzo rajada
    La ganancia o pérdida de una mano de póquer es un valor aleatorio, pero con seguridad no es un valor normalmente distribuido. La distribución de las ganancias de la mano, sin embargo, tiene algún valor promedio. Así, el teorema del límite central nos asegura (siempre que el resultado de cada mano sea independiente e idénticamente distribuido) que, si consideramos muestras de la suma de ganancias de un número grande de manos, cada una de esas muestras es, de hecho, un resultado aleatorio normalmente distribuido.

    Mientras un rango de 30 a 100 eventos tomados en conjunto es considerado normalmente suficiente para aplicar el teorema del límite central, las manos de póquer son un caso un poco más extremo, con eventos grandes (+/- 100 ciegas grandes) ocurriendo con una frecuencia tal que no creo que una muestra de 100 manos esté cercana a ser normalmente distribuida. La desviación estándar de la muestra de 100 manos proporcionada por el PT subestima la varianza verdadera. Por ejemplo, usando los números empleados más adelante en este artículo, la probabilidad de ganar 4 cajas (200PTBB) en 100 manos es 1 entre 5 millones.

    Para concluir me gustaría destacar que, aunque las manos no son ni idénticamente distribuidas del todo (las distribuciones varían con la posición relativa al botón al menos) ni independientes (dependiendo de los rivales que tengamos, nos encontramos con series de manos con expectativa y varianza mayor o menor que la que tendríamos si jugáramos contra otro conjunto de rivales distinto). Estas variaciones de las asunciones del teorema del límite central conducen de nuevo a subestimar ligeramente la varianza total.
    \fin rajada

    Información de base
    Antes de poder aplicar la información de este artículo, necesitas una estimación de tu ratio de ganancias, el número de manos total sobre la que está medido y un cálculo de la desviación estándar o varianza de tu ratio de ganancias para la muestra escogida. En PT, los dos primeros datos se encuentran en la pestaña "General Info.". Para obtener la desviación estándar es preciso seleccionar la pestaña "Session Notes", pulsar en "More detail..." y, en la ventana emergente, el texto en blanco que contiene "Standard Deviation/100 Hands:", que lo lista como una cantidad en $ y en ciegas grandes. Debería estar en un rango de 20 a 200 ciegas grandes, dependiendo del estilo de juego y del tipo de mesas en las que juegues.

    Voy a asumir que ya sabes lo que significa el ratio de ganancias; hay que tener en cuenta que como normalmente se mide es en BB/100, siendo BB el acrónimo para ciegas grandes o apuestas grandes (dos veces la ciega grande). La última es la más estándar (a pesar de que tiene menos sentido para NL/PL) y es la que utilizaré en los cálculos (en adelante, escribiré ptBB/100 para indicar apuestas grandes del PokerTracker). Para cambiar el valor con el que PT muestra las estadísticas de ganancias, basta con ir a la pestaña "Preferences" y en la parte derecha en el centro de la pantalla, marca o desmarca “treat ‘BB’ For NL/PL As Big Blind Amt.” (se encuentra debajo del botón “Custom Levels…”.

    La desviación estándar (SD) proporcionada por PT indica la SD de una muestra de 100 manos. La SD es una medida de la variación sobre el resultado medio -cuanto mayor sea la desviación estándar, más probable es que una muestra aleatoria de 100 manos se desvíe en mayor medida del ratio medio de ganancias-. Para números grandes de manos, asumiremos que las ganancias siguen una distribución normal. Las probabilidades basadas en una distribución normal son bien conocidas, emplearemos una tabla de distribución normal tipificada (aquí hay una) para calcular las probabilidades de varios resultados de variables aleatorias normalmente distribuidas.

    Una introducción rápida a la distribución normal
    Pongamos que las ganancias en cada una de las muestras de 100 manos están normalmente distribuidas con, por ejemplo, un beneficio medio de $15 y una desviación estándar de $100. Esto quiere decir que, cuando se jueguen 100 manos, aproximadamente el 68% de las veces las ganancias serán $15 +/- $100; es decir, entre -$85 y +$115. Del mismo modo, el 95% de las veces las ganancias serán $15 +- 2*($100); o lo que es lo mismo, entre -$185 y +$215. Y el 99,7% de las veces las ganancias serán $15 +/- 3*($100); o sea, entre -$285 y +$315. Conociendo la media y la SD de cada una de las muestras de 100 manos, se puede usar una tabla de distribución normal tipificada para calcular la probabilidad de que las ganancias de una muestra de 100 manos se hallen dentro de un intervalo dado (de aquí vienen los porcentajes 68, 95 y 99.7... más adelante en este artículo explicaré cómo puedes calcular este tipo de cosas tú mismo).

    La cuestión es que no sabemos realmente cuál es nuestro verdadero ratio de ganancias. Si jugamos 100 manos y ganamos $15, podemos suponer que es de $15 cada 100 manos, pero en lugar de hacer una suposición como esta, sería mejor saber cómo es de probable que nuestro ratio real de ganancias se acerque a esta suposición. Si por casualidad conociéramos nuestra SD verdadera, podríamos construir intervalos de confianza... Asumamos que nuestra SD real es $100 cada 100 manos. Entonces un intervalo de confianza del 68% sería (-$85, +$115), un intervalo de confianza del 95% sería -$185, +$215, y así sucesivamente (estos intervalos son tan amplios porque 100 manos es, desgraciadamente, una muestra ridículamente pequeña). Un detalle importante a señalar es que el nivel de confianza (68%, 95%, etc.) NO es la probabilidad de que nuestro verdadero ratio de ganancias se encuentre en el intervalo calculado. Este tipo de probabilidad es imposible de conocer sin hacer asunciones mucho más complicadas y sin incluir un conocimiento más profundo de base. Lo que un 68% de intervalo de confianza de -$85, +$115 nos indica es que, si nuestro ratio real de ganancias fuera menor de -$85 cada 100 manos (o mayor de +$115 cada 100 manos), entonces en cualquier muestra de 100 manos dada, tener un resultado tan bueno como +$15 (o tan malo como -$15) ocurriría menos del 32% de las veces (100% - 68% = 32%).

    Cálculos
    La SD de cada una de nuestras muestras de 100 manos es algo que converge mucho más deprisa que nuestro ratio de ganancias y, tras un número relativamente pequeño de manos (por supuesto, hablamos de al menos miles de manos si queremos un dato fiable), podemos asumir que la SD proporcionada por PT es una muy buena aproximación de nuestra "verdadera" SD cada 100 manos.

    A continuación, nos gustaría conocer la SD de nuestra muestra completa de manos... por ejemplo, vamos a poner que hemos jugado 138.200 manos y el PT nos dice que nuestra SD para cada muestra de 100 manos es de 38,8439 ptBB. Aquellos que no estén interesados en el razonamiento de los cálculos pueden saltar directamente al texto en negrita. Como nuestra muestra de138.200 manos es la suma de 1.382 muestras de 100 manos, la manera intuitiva de obtener el resultado sería coger la SD de 34,8439 y multiplicarla por 1.382... La SD no se calcula de esta manera "aditiva". Pero la varianza de nuestras muestras sí tiene esta propiedad. La varianza es, por definición, el cuadrado de la SD.

    Así, la varianza de una muestra de 100 manos es igual a (38,8439)^2 = 1.508,85 (ptBB^2). La varianza de nuestra muestra completa de 138.200 manos es, entonces, igual a 1.382*1.508,85 = 2.085.230 (ptBB^2). Ahora podemos calcular la raíz cuadrada de este número para hallar la SD de la muestra completa: SD = sqrt(2.085.230) = 1444,03 ptBB.

    Debido al hecho de que el ratio de ganancias se mide en ptBB/100, estaría mucho mejor si calculáramos la SD de la muestra en esa misma unidad. Nuestra SD de 1.444,03 ptBB está calculada sobre 138.200 manos, así que, cambiando la unidad, tenemos: SD = 1.444,03 / 1.382 = 1,045 ptBB/100.

    Como atajo, se puede recordar que la SD (en ptBB) de la muestra de 138.200 manos, es igual a la SD de la muestra de 100 manos sqrt(1.382) veces y, si en lugar de eso, la queremos en ptBB/100, hay que coger la SD de la muestra de 100 manos y dividirla por sqrt(1.382):
    SD = 38,8439 * sqrt(1.382) = 1.444,03 ptBB
    SD = 38,8439 / sqrt(1.382) = 1,045 ptBB/100


    Ahora estamos preparados para medir con precisión el error de la estimación de nuestro ratio de ganancias. Supongamos que en la muestra de 138.200 manos hemos ganado un total de 4.422,4 ptBB o, lo que es lo mismo, un ratio de ganancias de: 4.422,4 / 1.382 = 3,2 ptBB/100. Hemos calculado que la SD de esta muestra de 138.200 manos es 1,045 ptBB/100, así, un intervalo de confianza del 68% para nuestro ratio de ganancias es (3,2 +/- 1,045) ptBB/100, un intervalo de confianza del 95% es (3,2 +/- 2*1,045) ptBB/100, y así sucesivamente. Puedes hacerte una buena idea de tu verdadero ratio de ganancias simplemente recordando que puedes calcular un intervalo de confianza del 95% para tu ratio real de ganancias, sumando o restando a tu ratio de ganancias el doble de la SD (en ptBB/100) calculada.

    El resto del artículo precisa de la utilización de una tabla de distribución normal tipificada. Si queremos encontrar un intervalo de confianza del 98%, debemos mirar cuántas SD nos tenemos que desviar desde la media en cada dirección para incluir el 98 de la distribución normal. Normalmente, cuando encontramos un intervalo de confianza del 98%, querríamos que el 2% de la distribución que no incluimos se dividiera equitativamente - el 1% de los valores más altos y el 1% de los valores más bajos-. De esta forma, deberíamos mirar en la tabla de distribución normal tipificada cuántas SD por encima de la media debemos estar para que quede solamente el 1% de la distribución; por ejemplo, buscamos el valor Z que marca .99 en la tabla. Este valor es 2,33 (y -2,33 es el valor Z con únicamente el 1% de la distribución normal por debajo de él), así que, siguiendo con nuestro ejemplo, un intervalo de confianza del 98% para nuestro verdadero ratio de ganancias es (3,2 +/- 2,33*1,045) ptBB/100.

    Ahora echemos un ojo a un problema similar. Queremos encontrar para qué nivel de confianza podemos estar seguros de que somos un jugador ganador. Básicamente lo que queremos saber es nuestro nivel de confianza en el intervalo (0, infinito). Las cantidades a encontrar son para las que la distribución normal con media 3,2 y SD 1,045 se sitúan por encima del valor 0. Para hacer esto, hay que calcular cuántas SD 0 se aleja de 3,2:
    (3,2 – 0) / 1,045 = 3,062 SD.
    Usando una tabla de distribución normal tipificada, hallamos que la media solo incluye el 0,11% de los datos, así podemos concluir que tenemos un nivel de confianza del 99,89% de que nuestro ratio de ganancias es positivo.

    Si quisiéramos hallar el nivel de confianza en un intervalo arbitrario, pongamos (X, Y), haríamos lo mismo: usaríamos una tabla de distribución normal tipificada para calcular cuánto de la distribución normal está por debajo de X y cuánto por encima de Y; si el 10% está por debajo de X y el 20% por encima de Y, entonces (X, Y) es un intervalo de confianza del 70% (100% - 10% - 20%).

    Para aquellos que tengan previsto hacer cálculos similares de forma habitual, recomiendo familiarizarse con las funciones de Excel, NormInv y NormDist, que evitarán usar una tabla de distribución normal tipificada y permitirá encontrar valores con una mayor precisión.
    _______
    Para el que haya encontrado interesante el artículo, un enlace en el que se discute por qué no es correcto el cálculo que hace PT de la SD y por qué no sigue una distribución normal (principalmente por Pokey). Otro, a raíz del anterior sobre la varianza y si sigue una distribución normal en muestras de 1000 manos.
    Última edición por spainfull; 06/01/2008 a las 11:55 AM

  2. #2
    Banned
    Fecha de Ingreso
    30 Sep, 07
    Mensajes
    67

    Predeterminado Re: Introducción a las estadísticas detrás de la varianza

    Muchas gracias se agradecen aportaciones de este tipo

  3. #3

    Predeterminado Re: Introducción a las estadísticas detrás de la varianza

    Pero si no lo has leido mentiroso :P

  4. #4

    Predeterminado Re: Introducción a las estadísticas detrás de la varianza

    Gran aporte ¡¡

    Yo hace un tiempo hice un tema de como calcular estos datos con hartos graficos en Excel, ahi va: ¿Cuantas manos necesito para saber que soy un ganador en el Poker?. Parte I

    Cuando tenga tiempo para leer el mathematics of Poker, espero hacer otras cosas parecidas.
    hasta luego

  5. #5

    Predeterminado Re: Introducción a las estadísticas detrás de la varianza

    Yo recomendaría jugar con la Distribución Binomial. Ahí puedes ver con todo detalle la varianza para la apuesta que quieras. Yo me fijo especialmente para las de botes gordos, que son las que más bamboleos le dan a los resultados.

  6. #6

    Predeterminado Re: Introducción a las estadísticas detrás de la varianza

    Cita Iniciado por cartapel Ver Mensaje
    Yo recomendaría jugar con la Distribución Binomial. Ahí puedes ver con todo detalle la varianza para la apuesta que quieras. Yo me fijo especialmente para las de botes gordos, que son las que más bamboleos le dan a los resultados.
    no entiendo, ¿podrías explicar un poco más? Yo no soy un experto en estadística, pero entiendo que la probabilidad del éxito no es constante entre sucesos de la muestra, ¿no? (ni los sucesos son independientes uno del otro en realidad).

  7. #7

    Fecha de Ingreso
    06 Feb, 08
    Mensajes
    2,702

    Predeterminado Re: Introducción a las estadísticas detrás de la varianza

    Cita Iniciado por spainfull Ver Mensaje
    no entiendo, ¿podrías explicar un poco más? Yo no soy un experto en estadística, pero entiendo que la probabilidad del éxito no es constante entre sucesos de la muestra, ¿no? (ni los sucesos son independientes uno del otro en realidad).
    Si, son independientes. Pero a ver si tengo un rato, me leo el articulo en profundidad y respondo con mas criterio...

    corp

  8. #8

    Predeterminado Re: Introducción a las estadísticas detrás de la varianza

    Excelente aportación, a ver si después de rellerlo un par de veces lo asimilo bien...

  9. #9

    Predeterminado Re: Introducción a las estadísticas detrás de la varianza

    No me deja editar así que tengo que poner otro post...

    Será una pregunta súper chorra seguramente, pero... ¿para qué sirve saber la SD para saber si soy un ganador en determinado nivel, si tienes un BB/100 positivo? osea, quiero decir, ¿es posible tener un +2BB/100 y perder dinero a largo plazo teniendo la SD que sea?

  10. #10

    Fecha de Ingreso
    06 Feb, 08
    Mensajes
    2,702

    Predeterminado Re: Introducción a las estadísticas detrás de la varianza

    Cita Iniciado por trepaclimb Ver Mensaje
    Será una pregunta súper chorra seguramente, pero... ¿para qué sirve saber la SD para saber si soy un ganador en determinado nivel, si tienes un BB/100 positivo? osea, quiero decir, ¿es posible tener un +2BB/100 y perder dinero a largo plazo teniendo la SD que sea?
    Lo que calculas es tu CONFIANZA como jugador ganador. O de otro modo, la confianza de que tengas ganancias, y no perdidas.

    Un jugador ganador al 68% es un buen jugador, a largo plazo, es dificil que tenga perdidas. De cada 100 veces que el jugador se ponga a jugar, en 68 de ellas tendra ganancias, y el resto, perdidas.

    Un ganador al 90% es muy dificil que tengas saldos negativos. Uno al 50%, pues cada dos veces, tendra perdidas.

    Un individuo puede haber tenido ganancias hasta ahora, pero al tener mucha varianza a largo plazo puede ser que pierda.

    He leido el articulo, y una de dos, o el usuario que ha mencionado la distribucion binomial no se ha leido el articulo entero, o esa distribucion la aplica a cualquier otra cosa que no tiene nada que ver con el mismo.

    Por cierto, el articulo hace algunas afirmaciones que no se realmente de donde las saca, y tengo que ver que es la SD para el Poker Tracker, para asegurar que los calculos estan bien.

    corp

Página 1 de 3 123 ÚltimoÚltimo

Temas Similares

  1. te estoy viendo las cartas
    Por dansoaz en el foro Poker general
    Respuestas: 13
    Último Mensaje: 17/03/2008, 10:39 AM
  2. Mesa larga Shorthand (parte I de III) articulo tremeeeendaaamente largo
    Por kulyn en el foro No Limit - Niveles Medios
    Respuestas: 11
    Último Mensaje: 25/11/2007, 11:52 AM
  3. El BoOom del Poker y sus Secretos!
    Por Jesusitonsky en el foro 2ª Edición
    Respuestas: 7
    Último Mensaje: 23/11/2007, 23:59 PM
  4. Habrá que aceptar las cosas
    Por MonJamon en el foro Otras variantes
    Respuestas: 27
    Último Mensaje: 22/06/2006, 12:11 PM
  5. Las locas aventuras de ibon ¡Mision Peralada!
    Por ibon87 en el foro Torneos
    Respuestas: 18
    Último Mensaje: 05/05/2006, 15:56 PM

Permisos de Publicación

  • No puedes crear nuevos temas
  • No puedes responder temas
  • No puedes subir archivos adjuntos
  • No puedes editar tus mensajes
  •