Ya podemos usar Gemini 2.0. En la semana de ChatGPT, la mejora más impresionante la trae la IA más pequeña de Google
Publicado el 11/12/2024 por Diario Tecnología Artículo original
Tras semanas de rumores y expectativas crecientes, Google ha lanzado hoy oficialmente Gemini 2.0, su modelo más avanzado hasta la fecha, en un movimiento que marca un hito en la carrera por la supremacía en el ámbito de la inteligencia artificial.
En una serie de publicaciones realizadas en su cuenta oficial de Twitter, el CEO de Alphabet, Sundar Pichai, compartió los últimos avances y capacidades que marcan el inicio de lo que él mismo denomina la "era Gemini 2.0"...
Gemini 2.0 Flash: El doble de velocidad
El primer anuncio giró en torno Gemini 2.0 Flash, una versión optimizada que, según Pichai, duplica la velocidad de su predecesor, Gemini 1.5 Pro, en indicadores clave. Este avance supone un gran salto en términos de eficiencia, ofreciendo resultados significativamente más rápidos sin comprometer la calidad de las respuestas.
Actualmente, los desarrolladores pueden explorar esta versión experimental a través de AI Studio y Vertex AI, plataformas que integran estas herramientas avanzadas. Para los usuarios generales, la opción de prueba ya está disponible en la aplicación web GeminiApp, con una versión móvil prometida para el futuro cercano.
Nueva funcionalidad: Investigación profunda y capacidades agentivas
Un aspecto destacado de Gemini 2.0 es la introducción de funcionalidades diseñadas para ampliar el alcance de la IA en el análisis y procesamiento de información compleja. Una de las innovaciones más llamativas es Deep Research, una característica disponible en Gemini Advanced que actúa como asistente de investigación.
Según Pichai, esta herramienta puede explorar temas complejos y generar informes detallados, complementados con enlaces a fuentes relevantes, un avance que podría transformar la forma en que los profesionales abordan tareas de análisis e investigación.
Agentes basados en IA
En palabras de Sundar Pichai, Google está "creando un futuro en el que la IA no solo entiende, sino que también razona y actúa de manera proactiva en beneficio de los usuarios". Dotado de multimodalidad, Gemini 2.0 puede procesar texto, imágenes, audio y vídeo de forma simultánea, permitiendo un nivel de interacción y comprensión "nunca antes visto".
Pero uno de sus principales avances reside en que supone un paso adelante hacia la automatización mediante el uso de agentes, entidades capaces de operar de manera autónoma para cumplir con objetivos específicos en diversos entornos. En palabras de Demis Hassabis, CEO de Google DeepMind,
"Vemos 2025 como el verdadero inicio de la era de los agentes basados en IA, y Gemini 2.0 es la base de ese futuro".
En las búsquedas... y más allá
Otro ámbito en el que Gemini 2.0 está marcando la diferencia es en la búsqueda de información online. Según Pichai, las capacidades avanzadas de razonamiento del modelo están siendo probadas mediante las 'AI Overviews' en Google Search, lo que permite respuestas más complejas y matizadas a las consultas de los usuarios. Según Google, estas mejoras impactarán a más de mil millones de personas que utilizan el buscador diariamente.
Google ha dejado claro que su intención es integrar Gemini 2.0 en prácticamente todos sus productos y servicios. Desde su buscador hasta herramientas como Google Workspace, Chrome y Android, Gemini 2.0 se convertirá en una columna vertebral tecnológica para la compañía.
Hassabis enfatiza que este modelo busca ser una solución unificada, eliminando la necesidad de productos fragmentados. La visión de Google es construir una IA que pueda servir como base para aplicaciones diversas y complejas.
Los proyectos estrella de Gemini 2.0
El lanzamiento de Gemini 2.0 viene acompañado de una serie de proyectos que demuestran el potencial del modelo para transformar la interacción entre humanos y máquinas:
- Project Astra: Este agente ofrece capacidades avanzadas de conversación en múltiples idiomas, incluidas combinaciones de idiomas y mejor comprensión de acentos. También cuenta con una memoria extendida capaz de recordar hasta 10 minutos de contexto en una sesión y una mejora significativa en la latencia.
- Project Mariner: Diseñado para realizar tareas complejas de manera autónoma, este agente puede navegar por internet, buscar información y completar formularios, todo de forma precisa y eficiente.
- Jules: Una herramienta para desarrolladores que ayuda a identificar y solucionar errores en el código. Este agente se integra directamente con flujos de trabajo en GitHub, facilitando enormemente la productividad de los programadores.
Los retos de seguridad
Aunque el avance es innegable, el desarrollo de agentes autónomos también plantea preguntas sobre los riesgos de seguridad. Gemini 2.0 ya opera con ciertas precauciones, como la realización de pruebas en entornos controlados ('sandboxes') antes de implementarlos en aplicaciones reales, para evitar posibles problemas asociados con agentes que operen de forma independiente en el mundo real.
El futuro de la IA dependerá de equilibrar la innovación con medidas de seguridad que protejan a los usuarios y sus datos: Google reconoce que aún queda trabajo por hacer para garantizar que estos agentes sean útiles sin comprometer la privacidad ni la seguridad.
11_Dec_2024"> Marcos Merino .