Google lanza Gemini 2.5, su impresionante nueva IA. Gana en todo a sus rivales, pero sigue lejos de la mejor para programar

Publicado el 25/03/2025 por Diario Tecnología
Artículo original

Google lanza Gemini 2.5, su impresionante nueva IA. Gana en todo a sus rivales, pero sigue lejos de la mejor para programar

Desde septiembre de 2024, cuando OpenAI introdujo el primer modelo con capacidades de razonamiento profundo, otras compañías como Anthropic, DeepSeek, xAI y ahora Google han acelerado sus esfuerzos para no quedarse atrás. En la carrera vertiginosa por liderar la IA, Google ha dado un paso de gigante con el lanzamiento de Gemini 2.5, una nueva generación de modelos de IA diseñados específicamente para 'razonar' antes de generar una respuesta.

Esta característica marca una diferencia clave con modelos anteriores basados únicamente en predicciones estadísticas. Y es que el razonamiento en IA no se limita a clasificar o predecir: implica analizar información, considerar contexto, establecer conexiones lógicas y tomar decisiones fundamentadas.

Gemini 2.5 logra esto combinando avances en aprendizaje por refuerzo, técnicas de 'cadena de pensamiento' y una notable mejora en la arquitectura del modelo base.

Poder multimodal y contexto masivo

Uno de los aspectos más destacables de esta IA es su capacidad para procesar 1 millón de tokens, equivalente a unas 750.000 palabras, en una sola entrada. Pronto, se ampliará a 2 millones de tokens, lo que permitirá a la IA analizar libros enteros, bases de datos extensas o incluso repositorios de código completo de una sola vez.

Su naturaleza multimodal le permite interpretar y generar texto, audio, imágenes, video y código, convirtiéndolo en la opción ideal para tareas complejas como la creación de videojuegos desde un simple prompt o el diseño de aplicaciones web visualmente atractivas.

Logros técnicos impresionantes

Gemini Pro Según LMArena, estamos ante el mayor salto entre dos generaciones de un mismo LLM

En pruebas clave, su rendimiento ha sido notable:

  • Liderazgo en LMArena, una plataforma de evaluación basada en preferencias humanas.
  • 68,6% en Aider Polyglot, una métrica para edición de código, superando modelos de OpenAI, Anthropic y DeepSeek.
  • 63,8% en SWE-Bench Verified, que mide capacidades en desarrollo de software, superando a OpenAI y DeepSeek, aunque todavía por detrás del modelo Claude 3.7 de Anthropic (70.3%).

Además, en Humanity’s Last Exam, una prueba multimodal extremadamente compleja que abarca matemáticas, ciencias y humanidades, Gemini 2.5 obtuvo un 18,8%, estableciendo una nueva marca de referencia entre aquellos modelos que no utilizan herramientas externas.

Final 2 5 Blog 1 Original

Gemini 2.5, ya en acción

Google ha puesto este modelo en manos de desarrolladores y empresas a través de plataformas como AI Studio y Vertex AI, para que puedan experimentar y desarrollar soluciones escalables. El objetivo no es solo crear un asistente más inteligente, sino formar la base de agentes autónomos, sistemas capaces de ejecutar tareas sin intervención humana directa.

El primer modelo de esta serie, Gemini 2.5 Pro Experimental, es actualmente el más avanzado de Google y ya está disponible para desarrolladores en Google AI Studio, así como para suscriptores de Gemini Advanced, el plan premium de la compañía.

  • ¿Cuál es el siguiente paso? Gemini 2.5 no es un destino final, sino una etapa intermedia hacia modelos aún más sofisticados. Google ha afirmado que de ahora en adelante, todas sus IAs integrarán capacidades de razonamiento de forma nativa, lo cual sugiere que veremos aplicaciones cada vez más capaces, contextuales y autónomas.

Imagen | Google

En Genbeta | La IA se ha hecho tan lista que el mejor test que había para comprobar su inteligencia ya no sirve. Han tenido que crear uno nuevo 

utm_campaign=25_Mar_2025"> Marcos Merino .