OpenAI acaba de lanzar O3 y O4-mini: sus modelos razonadores por fin hacen lo que hasta ahora era imposible para ellos

Publicado el 16/04/2025 por Diario Tecnología

Artículo original

Desde hace más de medio año, los usuarios de ChatGPT —y también los de la API— tenemos acceso a dos tipos de modelos: los modelos GPT, como GPT-4o, y los modelos orientados al razonamiento, como o1. El problema es que, hasta ahora, nos veíamos obligados a alternar entre unos y otros para tareas que requieren pensamiento complejo, navegación web o interpretación de imágenes. A partir de hoy, eso empieza a cambiar.

Nuevos modelos en escena. Los modelos O3 y O4-mini, presentados este miércoles, acortan distancias con los modelos GPT. Por primera vez, los modelos centrados en razonamiento acceden a herramientas que, hasta ahora, eran exclusivas de los modelos clásicos. A saber:

Analizar imágenes (y pensar con ellas).
Analizar archivos.
Generar imágenes.
Navegar por la web.
Hacer investigaciones.
Usar el modo de voz avanzado.

Las claves del “razonamiento visual”. Lo interesante no es que O3 lea lo que hay en una foto. Es que decide cómo mirarla. Sabe si tiene que girarla, ampliar un detalle o ignorar lo irrelevante. Ese proceso ahora forma parte de su cadena de razonamiento. No describe una imagen, sino que “piensa” sobre ella para darnos una respuesta mejor.

Un salto notable. Estamos ante una serie de mejoras que los usuarios más exigentes sin duda sabrán apreciar. Los modelos razonadores, conviene recordarlo, “piensan” antes de responder. Generan una cadena interna de pensamiento antes de ofrecernos una respuesta.

No son la mejor opción para quienes buscan textos con tintes literarios o respuestas rápidas sobre cualquier tema. Pero son ideales para codificar, razonar científicamente y planificar flujos de trabajo complejos, especialmente en entornos donde intervienen varios pasos y agentes.

Teniendo esto en cuenta, y como era de esperar, OpenAI también ha mejorado las capacidades principales de estos modelos, haciéndolos más capaces y precisos.

OpenAI O3: este modelo logra un rendimiento destacado en SWE-bench verificado (sin personalización), una prueba que mide habilidades de codificación, con una puntuación del 69,1%. Según OpenAI, en evaluaciones realizadas por expertos externos, O3 comete un 20% menos de errores importantes que OpenAI O1 en tareas difíciles del mundo real.
OpenAI O4-mini: ofrece un rendimiento similar, con una puntuación del 68,1%. Para ponerlo en contexto: O3-mini obtuvo un 49,3% en la misma prueba, mientras que Claude 3.7 Sonnet alcanzó un 62,3%. Este modelo está optimizado para un razonamiento rápido y rentable, y rinde especialmente bien en tareas matemáticas, de codificación y visuales.

El modelo que no se iba a lanzar. OpenAI ha cambiado de idea. En febrero, Sam Altman descartó lanzar O3 como producto independiente. Pero hace apenas unas semanas, admitió un “cambio de planes”. Ese giro se materializa hoy con la llegada de O3 y O4-mini, los nuevos modelos que marcan un nuevo capítulo en la estrategia de la compañía.

De camino a ChatGPT. Desde hoy, los usuarios de ChatGPT Plus, Pro y Team ya pueden empezar a usar O3 y O4-mini. En las próximas semanas llegará O3-pro, una versión más potente del modelo de razonamiento, que estará disponible para los suscriptores del plan Pro. Mientras tanto, esos usuarios pueden seguir trabajando con O1-pro.

Imágenes | OpenAI

En Xataka | La hipotética red social de OpenAI no quiere conectar gente. Quiere tus datos para entrenar su IA

utm_campaign=16_Apr_2025"> Javier Marquez .

Descarga la app de Diario Tecnología

Últimos posts

Contacto

info@diariotecnologia.es