Google Project Genie: IA crea mundos virtuales interactivos desde imágenes

by Editor de Tecnologia

En 2024, Google presentó Genie, una inteligencia artificial especializada en la creación de videojuegos a partir de una simple imagen. Esta primera versión era extremadamente limitada, capaz únicamente de generar juegos de plataformas. Sin embargo, en un año y medio, la tecnología ha evolucionado significativamente, y Google ha anunciado Project Genie, una herramienta que permite generar mundos interactivos infinitos.

Genie es un modelo de mundo, o world model. A diferencia de los grandes modelos de lenguaje (LLM) utilizados para los chatbots, los modelos de mundo son capaces de simular un entorno físico. Se trata de un enfoque diferente de la IA, y uno en el que cree firmemente Yann LeCun, uno de los padres fundadores de la IA moderna. Recientemente abandonó Meta para concentrarse en los modelos de mundo, que, según él, superarán con creces a los LLM.

Présentation de Project Genie, un word model capable de générer des mondes virtuels interactfs. © Google

Mundos efímeros que solo duran un minuto

Project Genie se basa en Genie 3, revelado el pasado agosto, y también utiliza Nano Banana Pro y Gemini. Solo se necesita proporcionarle una imagen o un texto simple, y genera un mundo. Es posible generar tu propio personaje y elegir la forma de moverse por él, ya sea caminando o volando. La herramienta utiliza Nano Banana Pro para generar una primera vista estática, y ofrece la posibilidad de modificarla antes de generar el mundo y comenzar a explorarlo.

El desplazamiento en el mundo 3D se realiza con el teclado, y el mundo se genera en tiempo real, a medida que se realizan las acciones. El mundo se muestra con una definición HD (1.280 x 720 píxeles) y 24 imágenes por segundo. Uno de los problemas comunes con este tipo de modelos es que no pueden memorizar el mundo por mucho tiempo. Recordamos, por ejemplo, GameNGen de Google en 2024, que era capaz de generar el juego Doom, pero solo tenía una memoria de tres segundos. Pasar por una puerta, darse la vuelta y la puerta ya no existe… Genie 3 es un poco más avanzado y puede mantener el mundo durante varios minutos, pero Google ha limitado Project Genie a 60 segundos para evitar cualquier problema.

leer más  Google IA: Nuevas funciones para optimizar tus viajes y compras

La fonction Remix permet de modifier des mondes virtuels existants. En anglais, activez la traduction automatique des sous-titres. © Google

Mundos virtuales que no respetan el derecho de autor

The Verge pudo probar la herramienta y creó varios mundos basados en videojuegos. El artículo presenta varios videos que imitan Super Mario 64, Metroid Prime o The Legend of Zelda: Breath of the Wild. Por lo tanto, nos encontramos una vez más con una IA entrenada con obras protegidas, capaz de infringir el derecho de autor a gran escala. Ya habíamos visto algo similar con OpenAI y su red social Sora, que generó imágenes de Bob Esponja en un contexto nazi o Pikachu robando una tienda. Sin embargo, Google parece haber intervenido y ha bloqueado la generación de mundos basados en ciertos títulos.

Google precisa que Project Genie se encuentra aún en fase experimental. Aquellos que han podido probarlo señalan que los comandos responden lentamente y que, una vez superado el “efecto sorpresa”, la experiencia es bastante decepcionante. En ocasiones, el personaje es imposible de controlar y surgen numerosos errores aleatorios. No obstante, esta nueva versión demuestra lo rápido que evoluciona la tecnología y podría ser viable en unos pocos años. Por ahora, no esperes probarla pronto. El acceso está limitado a Estados Unidos y requiere una suscripción a Google AI Ultra (a 140 euros al mes).

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.