Todo indica que la Inteligencia Artificial General sigue siendo un sueño remoto. DeepMind opina lo contrario
Publicado el 08/08/2025 por Diario Tecnología Artículo original
El equipo de Google DeepMind ha anunciado su nuevo modelo de IA para generar mundos interactivos. A finales del año pasado nos sorprendíamos con lo que podía hacer Genie 2 y la nueva versión supone un salto importante, uno que para Google supone un avance en la creación de la inteligencia artificial general o AGI, esa que podrá igualar las capacidades del mejor humano.
Genie 3. Es el nuevo world model o modelo de mundos de DeepMind. Permite crear mundos interactivos por los que podemos explorar, todo a partir de un prompt de texto. El modelo anterior estaba muy limitado y solamente se podía usar unos segundos, pero con Genie 3 DeepMind promete que se puede explorar durante “varios minutos”. Además, la resolución ha mejorado a 720p a 24fps. El modelo está basado en Genie 2 y Veo 3.
Tiene memoria. Es la mejora más importante del nuevo modelo. El mundo se va generando mediante IA conforme lo exploramos, pero si nos damos la vuelta y miramos a algo que ya habíamos visto, se mantiene igual. También podemos cambiar algo, como pintar sobre una pared, y que se mantenga tal cual lo dejamos todo el tiempo. Esto no pasaba en versiones anteriores y sus creadores dicen que no lo programaron explícitamente para que hiciera eso. Según explican en un artículo en TechCrunch, Genie 3 es capaz de recordar lo que ya ha generado para entrenarse a sí mismo, de esta forma aprende cómo funciona el mundo y sus físicas.
Interactivo. También destaca que se pueden añadir eventos con prompts adicionales. En su artículo, DeepMind pone varios ejemplos interactivos como una pradera en la que podemos elegir si aparecerá un tractor, un oso, un caballo o globos aerostáticos. Lo llaman “promptable world events” y también permite cambiar aspectos como el clima.
Por qué es importante. Los modelos de mundos son útiles en distintos escenarios como la creación de escenarios para juegos en tiempo real, en educación o en el entrenamiento de agentes IA. Google lo señala en su blog como un paso clave para alcanzar la AGI, esa inteligencia artificial superior que tantas empresas están tratando de conseguir cuanto antes. Estos mundos se pueden usar como campo de entrenamiento para otras IA, incluyendo también robots, casos en los que simular escenarios reales supone un reto.
En la presentación, el equipo de DeepMind explicó cómo metieron a un agente en un escenario que simulaba un almacén y le pedían que se acercara hasta ciertos elementos, como un cubo de basura verde. En todas las pruebas lo consiguió, según el equipo de DeepMind “el hecho de que (el agente) sea capaz de lograrlo es debido a que Genie 3 se mantiene coherente”.
La competencia. La mayor competición de la IA, al menos a nivel de productos para el usuario final, la vemos en los chatbots y, en menor medida, en los generadores de vídeo o audio. Los modelos de mundos son menos populares entre el público y tampoco hay una gran competición. NVIDIA presentó Cosmos a principios de año y hay algunas empresas como World Labs que ofrecen propuestas similares. Nos gustaría acabar este texto con un enlace para que lo podáis probar, pero Genie 3 solamente está disponible en beta para un grupo de académicos muy limitado.
Imagen | DeepMind
utm_campaign=08_Aug_2025"> Amparo Babiloni .