Alphazero: Single AI es el mejor jugador en Go, Ajedrez y Shogi.

Alphazero: Single AI es el mejor jugador en Go, Ajedrez y Shogi.

Los investigadores en Deepmind de Google han desarrollado un sistema de inteligencia artificial que domina muy bien tres juegos de mesa clásicos. Alphazero es el nombre del software que vence a todos los demás campeones del mundo en la disciplina respectiva en Go, Chess y el japonés Schachvariate Shogi. Estos ya no son humanos desde hace algún tiempo, sino también inteligencias artificiales.

Mercado de trabajo

  1. Delta Energy Systems (Alemania) GmbH, Teningen
  2. Hospital de Nuremberg, Nuremberg

Alphazero tuvo que jugar al ajedrez contra Stockfish, Shogi contra Elmo y Go contra el programa interno de Alphago. La característica especial del nuevo sistema es que se enseñó solo las reglas respectivas del juego. Como una red neuronal, el software inicialmente jugó contra sí mismo y acuñó con precisión movimientos generados aleatoriamente y sus mejores respuestas. Este principio de prueba y error también se conoce como aprendizaje de refuerzo. Con la ayuda de 5,000 unidades especializadas de procesamiento de tensor, el entrenamiento de modelo en ajedrez tomó nueve horas, shogi doce horas y 13 días completos.

Prueba y error en lugar de movimientos preprogramados

La diferencia con los programas utilizados anteriormente es que realizan sus propios pasos a partir de muchos movimientos creados manualmente. Para ello, también se consultó a jugadores humanos profesionales. Sin embargo, debido a la enorme capacidad de cálculo, Alphazero pudo calcular considerablemente más movimientos y, por lo tanto, tiene un repertorio táctico más amplio. "Es como descubrir las notas secretas de un gran jugador del pasado", los jugadores profesionales Natasha Regan y Matthew Sadler describen el estilo de juego de Alphazero.

Los resultados de los juegos son bastante claros: dependiendo del color del personaje, Alphazero gana en ajedrez contra Stockfish en el 29 por ciento de los casos y pierde al 0.4 por ciento. Alphazero comienza con las piezas negras, gana solo 2 por ciento y pierde alrededor de 0.8 por ciento. En el ajedrez, la proporción de situaciones de sorteo es muy alta: 70.6 por ciento para el blanco y 97.2 por ciento para el negro.

En Shogi, Alphazero le gana al oponente Elmo muy claramente: en el lado blanco del juego, el software es 84.2 por ciento y el negro 98.2 por ciento. En el ajedrez japonés, el color negro comienza el juego. En Go contra Deepminds Alphago, hay 86.9 por ciento de victorias con el blanco y 53.7 ganador con las lentes negras.

Para el software, los tres juegos de estrategia probados son una tarea muy manejable. Se juega alternativamente de acuerdo a reglas muy estrictas. No hay influencias externas. El método de búsqueda en el árbol de búsqueda de Monte-Carlo (MCTS) es una gran ventaja que los productos de la competencia no tienen, así como muchas características que Deepmind nunca ha visto como jugador profesional y que ha sido evaluado y guardado por millones de pruebas.

Leave a comment

Send a Comment

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.