LIBROS

AlphaZero: Una inteligencia artificial más humana que los humanos

Natasha Regan y Matthew Sadler presentaron en Valencia el libro «Game Changer», que ilustra los logros y el proceso «mental» de AlphaZero, una máquina que aprende por sí sola, es capaz de crear belleza y está llamada a revolucionar la ciencia

Federico Marín Bellón

Esta funcionalidad es sólo para registrados

En Blade Runner , Harrison Ford asumía la ardua tarea de «retirar» a los replicantes, unos robots que Tyrell Corporation promocionaba como «más humanos que los humanos» . La película, de 1982, estaba ambientada en 2019, pero llegados a esa hoja del calendario aún no nos desplazamos en coches voladores y estamos lejos de cumplir las promesas de la ciencia ficción. Los pellejudos ni siquiera podemos considerarnos amenazados. Hay quien niega incluso que exista la verdadera inteligencia artificial.

Algo está cambiando, sin embargo. La empresa británica DeepMind , fundada en 2010 por Demis Hassabis -y comprada cuatro años después por Google-, ha construido una máquina que asusta, porque aprende. Lo hace sin nuestra ayuda, a una velocidad increíble. En unas horas es capaz de realizar las tareas más complejas con una precisión desconocida.

Batty (Rutger Hauer): «¡Si pudieras ver lo que yo he visto con tus ojos!»

La Facultad de Economía de la Universidad de Valencia organizó el mes pasado un taller dedicado al pensamiento estratégico y las lecciones que puede darnos la inteligencia artificial. El catedrático César Camisón, impulsor del evento, trajo como estrellas invitadas a Matthew Sadler y Natasha Regan , dos privilegiados que han estudiado las tripas de AlphaZero (y entrevistado a su creador, Hassabis). De ahí nació Game Changer , una obra brillante que, pese a la abundancia de diagramas y movimientos de ajedrez, puede atraer a quien no sepa ni mover las piezas.

AlphaZero ha dominado los juegos del go y el ajedrez por el «sencillo» método de acumular experiencia, como si fuera un humano con memoria fotográfica, inteligencia voraz y tiempo infinito. Solo hay que explicarle las reglas. Los programadores de DeepMind ni siquiera saben jugar al shogi, pero su criatura también ha alcanzado un nivel magistral en ese campo. Ahora tontea con los videojuegos y «trabaja» en varios campos de la medicina. Sus aplicaciones pueden parecer meras promesas, pero entre sus primeros logros destaca un sistema para refrigerar los centros masivos de datos de Google . Ahorra energía (y dinero) y preserva el medio ambiente. Como dice Hassabis, protagonista del libro en la sombra, en sus páginas «no se habla solo de la belleza del ajedrez, sino del increíble potencial de la inteligencia artificial», porque «AlphaZero es solo el principio».

Garry Kasparov: «No tenía sentido crear una inteligencia artificial que solo cometiera nuestros mismos errores, pero más rápido»

En la programación clásica, los expertos convierten sus conocimientos en instrucciones -unas 15.000 en el caso de Deep Blue- y la máquina aporta su fabulosa velocidad de cálculo. Luego, el programa mejora poco a poco a lo largo del tiempo. Se añaden excepciones, enseñanzas, trucos… Una aplicación gratuita juega ahora mejor que el citado programa de IBM que derrotó a Kasparov en 1997. Causa admiración, pero es difícil extraer enseñanzas de estas máquinas, del mismo modo que no aprendemos matemáticas observando una calculadora.

AlphaZero supone una revolución no solo por sus resultados. Al contrario que el resto de programas, nadie le ha explicado que tres peones equivalen a un alfil o que el rey está inseguro en el centro . El ingenio de DeepMind aprendió todo eso y mucho más por su cuenta, tras jugar 44 millones de partidas contra sí mismo, más de mil por segundo, al principio al azar.

«Game Changer». Natasha Regan y Matthew Sadler. New in Chess, 2019. 416 páginas. 21,15 euros.

Le bastaron nueve horas, gracias a una «red neuronal» enorme (solo al alcance de Google) que imita el trabajo de nuestro cerebro. 1.500 años de experiencia humana fueron replicados en una sola jornada de trabajo, con evidentes ventajas: el programa lo recuerda todo con exactitud, sin desviaciones subjetivas ni prejuicios inculcados y alcanza lo que Kasparov llama «un conocimiento único y superior».

Después de ese cursillo acelerado, la piedra de toque para AlphaZero fue enfrentarse a Stockfish , el programa más avanzado de ajedrez, una bestia inalcanzable incluso para el campeón del mundo, Magnus Carlsen. Ese día supuso un punto de inflexión. Hasta entonces, las evaluaciones de Stockfish eran sagradas. Los grandes maestros recurren a ellas para juzgar sus partidas. Ahora sabemos que ese juicio tampoco es infalible.

¿Estamos aún lejos de la perfección? Según Paco Vallejo , mejor ajedrecista español en la actualidad, AlphaZero confirma que «no estábamos tan cerca». Choca, porque el tablero es un terreno de juego pequeño, de ocho por ocho casillas, con apenas un puñado de piezas. Sus posibilidades son finitas, por tanto, pero como pasa con la leyenda de los granos de trigo, la riqueza exponencial es tan enorme que ni siquiera los superordenadores de Google pueden verlo todo . No sabemos con certeza cuál es la mejor jugada para empezar la partida, por ejemplo. Sadler confirmó en la presentación de su libro en Valencia que «aún estamos lejos de resolver el misterio del ajedrez». Un buen paso sería entender el proceso «mental» de AlphaZero y el propio Hassabis ha confesado que trabaja en herramientas analíticas y visuales para comprender cómo piensa la máquina.

Consejo de David Levy para jugar contra las primeras máquinas, cuando eran débiles: «No hagas nada, pero hazlo bien»

La dificultad del ajedrez radica en que un programa puede anticipar varias jugadas, pero a partir de determinado horizonte se vuelve ciego, no sabe lo que hay detrás, quizá el abismo. Programas como Stockfish, Houdini y Komodo comparan todas las posiciones resultantes y eligen el camino que conduce al mejor destino a su alcance. AlphaZero, en cambio, es consciente de lo inabarcable y se fía de su intuición . Prefiere el arte a las matemáticas, es creativo e incluso romántico, nada materialista. Tener un telescopio más limitado mejora su comprensión del universo. Es una paradoja maravillosa.

Cuando se siente peor, elige jugadas que no son las mejores, pero crean confusión en busca de opciones prácticas. Da a su rival la posibilidad de equivocarse, una triquiñuela psicológica propia de los humanos. Cuando ve cerca la victoria, no busca el camino más rápido, sino el más seguro. Como los replicantes de Blade Runner , es más humana que los humanos. Y al jugar sin libro de aperturas ni de finales, donde se ve en desventaja, opta por atacar como un maniaco, dando lugar a partidas salvajes y divertidas. Lo bueno es que sus jugadas pueden ser pequeñas obras de arte y además tiene un estilo a menudo pedagógico .

El reto actual de DeepMind, según explicaron Sadler y Regan, es usar el «aprendizaje reforzado» en otros ámbitos, como la economía, la ingeniería, la medicina, la meteorología… Lo curioso es que, desde los albores de la IA, un simple juego haya desempeñado un papel tan importante en la búsqueda de una sociedad mejor. El biólogo Diego Rasskin-Gutman explica que «el ajedrez es una reducción de la gran complejidad del mundo» . Desde los 80, se considera que es «la drosophila de la computación, la mosca del vinagre con la que se han hecho multitud de experimentos. El ajedrez permite avanzar sin riesgos y proponer nuevos métodos para resolver los problemas de la sociedad».

Demis Hassabis, tras la victoria contra el campeón mundial de go: «Ganar era el primer objetivo, pero fue más importante cómo lo hizo, con jugadas originales, creativas y hermosas»

De ahí a crear robots con empatía hay un trecho, aunque Rasskin cree que, cuando la tecnología y el hardware lo permitan, podremos emular estos procesos cognitivos en robots que cuiden a personas mayores, por ejemplo. El «aprendizaje profundo» de AlphaZero empieza a abrir esta posibilidad, opina, algo que hace 15 años «era un sueño».

«La revolución está aquí, está cambiando nuestras vidas ya», reflexiona Illescas, ocho veces campeón de España y asesor del equipo de Deep Blue. «Estamos solo al principio de un gran cambio. El ajedrez siempre ha sido un campo de pruebas seguro. Es mejor hacer las pruebas con gaseosa y no con un cirujano que te va a operar. El ajedrez sigue siendo la piedra de toque donde estos sistemas se entrenan para a construir una vida mejor» . Y no solo destaca por la falta de riesgos: «Los resultados se pueden medir de forma objetiva».

Comentarios
0
Comparte esta noticia por correo electrónico

*Campos obligatorios

Algunos campos contienen errores

Tu mensaje se ha enviado con éxito

Reporta un error en esta noticia

*Campos obligatorios

Algunos campos contienen errores

Tu mensaje se ha enviado con éxito

Muchas gracias por tu participación