Inteligencia Artificial

Pluribus: el primer AI robot que vence al ser humano con más de dos jugadores

Anónimo | 15/07/19
Pluribus: el primer AI robot que vence al ser humano con más de dos jugadores
Desarrollado por Noam Brown y Tuomas Sandholm, ‘Pluribus’ logró vencer a 15 de los mejores jugadores en una sesión durante 12 días con más de 10.000 manos jugadas.

Un paso más allá para los robots, eso es lo que se ha logrado para que sea la primera vez que un programa de inteligencia artificial venza a jugadores humanos ‘top’ en NL Texas Hold’em [6 Max].

'Pluribus', así es como se llama el robot, es el primer programa IA que vence al humano en un juego con más de dos jugadores.

‘Pluribus’ es la evolución de otro robot IA, llamado ‘Libratus’, que ya había vencido a los profesionales del poker para dos jugadores. Una actualización del segundo robot que necesita menos poder de cómputo para jugar partidas. 

Desarrollado por Noam Brown y Tuomas Sandholm, ‘Pluribus’ logró vencer a 15 jugadores humanos en una sesión durante 12 días con más de 10.000 manos jugadas. Estos eran:

  • Chris Ferguson
  • Greg Merson
  • Anthony Gregg
  • Darren Elias
  • Nick Petrangelo
  • Jason Les
  • Dong Kim
  • Daniel McAulay
  • Michael Gagliano
  • Jimmy Chou
  • Seth Davies
  • Linus Loeliger
  • Sean Ruane
  • Trevor Savage
  • Jake Toole

Los bots IA ya dominaban los juegos en donde hay dos partes, un vencedor y un vencido; y este paso es una auténtica revolución para nuestro mundo, ya que suman otra disciplina a dominar con múltiples partes en el juego y sin condiciones claras de ganar ó perder.

Al resolver el poker multiplayer, ‘Pluribus’ pone las bases futuras de las IA para enfrentar problemas y escenarios que involucren a múltiples partes con diversas competencias como reflejan la mayoría de los desafíos de la vida real.

Brown y Sandholm revisaron radicalmente el algoritmo de búsqueda de ‘Libratus’ para hacer frente al poker de seis jugadores. Libratus buscaba el final de un juego antes de elegir una acción mientras que la mayoría de IA buscan avances en los árboles de decisión para realizar el movimiento de una situación determinada.

Pero la complejidad introducida por jugadores adicionales en este caso hace que esta táctica sea poco práctica. El avance clave fue el desarrollo de un método que permitiera a Pluribus tomar buenas decisiones después de mirar hacia adelante solo unos pocos movimientos en lugar del final del juego.

El poker requiere un razonamiento con información oculta: los jugadores deben elaborar una estrategia al considerar qué cartas podrían tener sus oponentes y qué podrían adivinar sus oponentes en función de sus apuestas anteriores. Y más jugadores hacen que la elección de una acción en un momento dado sea más difícil, porque implica evaluar un número mayor de posibilidades.

Resultado de imagen de inteligencia artificial

'Pluribus' se enseña a sí mismo desde cero utilizando una forma de aprendizaje por refuerzo similar a la utilizada por otros robots como DeepMind’s Go AI, AlphaZero. 

Comienza jugando al poker al azar y mejora a medida que determina qué acciones ganan más dinero. Después de cada mano, mira cómo jugó y verifica si hubiera ganado más dinero con diferentes acciones, como subir en lugar de apegarse a una apuesta. Si las alternativas conducen a mejores resultados, será más probable que elija aquellas en el futuro.

Al jugar billones de manos de póquer contra sí mismo, 'Pluribus' creó una estrategia básica que utiliza en las partidas. En cada toma de decisión, compara el estado del juego con lo almacenado y busca algunos movimientos para ver cómo se desarrolló la acción para después decidir si puede mejorarlo. 

La IA se basó en algunas estrategias que los jugadores humanos tienden a no usar debido a que se enseñó a jugar sin la intervención humana.

El éxito de 'Pluribus' se debe en gran medida a su eficiencia. Cuando juega contra sí mismo, 'Pluribus' juega una mano en aproximadamente 20 segundos, aproximadamente el doble de rápido que los humanos profesionales.

Estas pruebas en juegos como el poker han demostrado ser una excelente manera de medir el progreso en la IA porque los bots pueden medirse contra los mejores humanos, y objetivamente ser considerados como sobrehumanos si triunfan. 

No obstante. aún queda un montón de territorio sin explorar para los investigadores de IA, un gran desafío para el ser humano en una búsqueda sin cesar parece para batirse a sí mismo.

Podéis encontrar más info sobre este tema y todos los relacionados con la inteligencia artificial en la revista Nature.

COMENTARIOS

Todavía no se ha realizado ningún comentario en esta noticia.