OpenAI lanza o1, el nuevo ChatGPT de las matemáticas capaz de razonar como un humano

Publicado el 14/09/2024 por Diario Tecnología
Artículo original

Imagine por un segundo poder tener al alcance de su bolsillo a un experto matemático, científico o programador. Alguien disponible para usted las 24 horas del día , con capacidad de razonar y con experiencia doctoral en los ámbitos más complejos para el ser humano. Todo esto es lo que, en palabras de OpenAI, consigue lograr su primer modelo de inteligencia artificial (IA) con capacidad de razonamiento en tareas complejas, llamado o1. Se trata de un modelo que puede razonar como una persona y, por tanto, puede resolver problemas de mayor dificultad que los modelos lanzados anteriormente en distintas áreas, ya sea ciencia, programación o matemáticas, tal y como ha subrayado la tecnológica en un comunicado en su página web. La gran novedad es que o1 dedica «más tiempo a pensar antes de responder». «Con modelos anteriores como ChatGPT, les hacías una pregunta y ellos comenzaban a responder inmediatamente», ha explicado Jakub Pachocki, científico jefe de OpenAI. «Este modelo puede tomarse su tiempo. Puede analizar el problema (en inglés) e intentar descomponerlo y buscar ángulos en un esfuerzo por brindar la mejor respuesta». Para lograr estas capacidades, la compañía ha señalado que ha entrenado a o1 para actuar más lento, es decir, para que emplee más tiempo para pensar antes de ofrecer una respuesta. Así, a través de este entrenamiento, el modelo es capaz de aprender a refinar su proceso de pensamiento, así como a probar distintas estrategias para resolver un problema, de cara a escoger la mejor respuesta. Todo un entrenamiento «único y diseñado específicamente para él», en palabras de Jerry Tworek, director de investigación de OpenAi. Se ha utilizado un sistema de recompensas y penalizaciones, que ha enseñado al modelo a pensar por sí solo , en lugar de imitar patrones de datos como hacen el resto de inteligencias artificiales. De esta forma, Tworek ha indicado que han conseguido que el modelo «alucine menos» en sus respuestas, aunque ha reconocido que no se ha resuelto el problema del todo. Como resultado a este entrenamiento, según ha apuntado OpenAI, este nuevo modelo se desempeña de manera similar a como trabajan los estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología. Lo mismo ocurre en áreas como las matemáticas y la codificación. Concretamente la serie o1, destaca por generar y depurar código complejo de forma precisa. Así, tal y como pudieron comprobar, al probar a resolver un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), el nuevo modelo o1 obtuvo una puntuación de 84, mientras que el modelo anterior, GPT-4o, presentado en mayo de este año, obtuvo una puntuación de 22. Con todo ello, OpenAI ha indicado que el modelo o1 puede ser útil para resolver problemas complejos en ciencia, codificación, matemáticas y campos similares. Igualmente, también puede utilizarse para llevar a cabo investigaciones sobre el sector sanitario o la física, por ejemplo, para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica. Además del modelo o1, OpenAI también ha lanzado la versión o1-mini, que es un modelo de razonamiento más rápido y económico, «particularmente eficaz en la codificación», tal y como lo describe la compañía. OpenAI reconoce que el modelo tiene deficiencias. Afirma que no está exento de alucinaciones y respuestas erróneas, pese a que el proceso de entrenamiento ha mejorado su precisión. La velocidad de respuesta del recurso es notablemente más lenta en comparación con el resto de los modelos que dan soporte a ChatGPT. OpenAI 1o tarda entre 10 y 30 segundos en entregar resultados. A diferencia de GPT-4o, no está habilitado para navegar por la web. Tampoco puede procesar imágenes, audio o contenidos en video. Además, este modelo no será útil para aquellos usuarios que necesitan respuestas veloces , por ejemplo, para impulsar chatbots de atención al cliente. Sin embargo, puede marcar la diferencia en tareas académicas donde la precisión de los datos es clave y donde la IA mostraba una de sus principales debilidades. Para utilizar o1 y o1-mini, los usuarios deben ser suscriptores de pago de ChatGPT. Aquellos que ya lo sean, bastará con escoger una de estas nuevas opciones desde el selector de modelos para comenzar a probar las capacidades de razonamiento. No obstante, la compañía ha señalado que tienen límites de frecuencia semanales para su uso. Concretamente, de 30 mensajes para la vista previa de o1 y 50 mensajes para o1-mini. OpenAI promete que próximamente se habilitará para los usuarios gratuitos.