El mundo está esperando el nuevo gran modelo de DeepSeek para competir con GPT-5, pero DeepSeek tiene otros planes: la IA agéntica
Publicado el 08/09/2025 por Diario Tecnología Artículo original
A principios de año, la startup china DeepSeek puso patas arriba el mundo de la IA con DeepSeek R1, un modelo gratis y de código abierto que se colocó a la altura de GPT-4 o Claude. Tras el golpe sobre la mesa, en DeepSeek han estado bastante calladitos, pero ahora ya sabemos cuál es su próximo objetivo: la IA agéntica.
Antes de que acabe el año. Hace unos días Bloomberg informaba de que DeepSeek está trabajando en un agente IA avanzado y muy ambicioso. Será capaz de realizar múltiples tareas con intervención mínima del usuario e irá aprendiendo conforme trabaje. Según fuentes cercanas a la compañía, el fundador de la empresa Lian Wenfeng está presionando a su equipo para que el nuevo modelo agéntico esté listo antes de que termine el año.
La empresa ya ha dado un paso en esta dirección con la presentación de DeepSeek v3.1 hace apenas dos semanas. Según detalló la propia compañía en un post en WeChat, su nuevo modelo mejora el rendimiento en tareas de razonamiento y en capacidades agénticas.
Un paso atrás. DeepSeek R2, el esperado sucesor del exitoso modelo con el que DeepSeek revolucionó la industria se está haciendo de rogar. En lugar de eso nos dieron DeepSeek V3.1 y ahora los rumores apuntan a que su próximo gran lanzamiento será un agente IA. ¿Qué está pasando? Hay voces, como la de este periodista chino, que ven este giro hacia la IA agéntica como una forma de dar un paso atrás y alejarse de la costosa y competitiva carrera de los modelos de lenguaje fundacionales.
Que la IA generativa está alcanzando su techo es algo de lo que se lleva hablando desde el año pasado. GPT-5 es la prueba más reciente de que los grandes saltos son cosa del pasado. Si a esto le sumamos que China tiene una forma de proceder más conservadora, con estrategias más centradas en el largo plazo, el giro de DeepSeek hacia una IA agéntica en lugar de lanzar DeepSeek R2 va cobrando sentido.
Restricciones. Aunque hayamos visto formas de lo más ingeniosas para burlarlas, las restricciones de Estados Unidos sobre la exportación de chips a China también están impactando en los planes de muchas empresas chinas y DeepSeek no se libra. Esto también supone una presión extra que les fuerza a nuevas rutas con las que poder comercializar sus productos. De hecho, hay algo llamativo en DeepSeek V3.1 y es que el modelo ha sido diseñado especialmente para los chips de IA chinos, con el objetivo de evitar la dependencia de chips extranjeros.
Generar ingresos. La IA agéntica abre otra vía para DeepSeek, una en la que pueda obtener beneficios más fácilmente. Los grandes modelos de lenguaje tienen un problema: cuestan un dineral y monetizarlos no está siendo tarea sencilla. Ante esto, los agentes IA se alzan como un modelo de negocio más razonable. DeepSeek R1 ya dio toda una lección de eficiencia de recursos, tiene sentido que la empresa quiera optar por el camino más rápido hacia los beneficios.
Una postura más conservadora. Aunque ha recortado posiciones, China va rezagada en IA en cuanto a inversiones y acceso a los chips más avanzados. A pesar de ello, su enfoque en esta carrera de la IA está siendo distinto. Lo vemos en su apuesta por el open-source o la IA "personificada". Pero quizás la mayor diferencia es que, mientras sus competidores en Estados Unidos siguen dilapidando miles de millones, en China están optando por ser más conservadores y no despilfarrar. Este giro hacia los agentes va en esa línea conservadora de lograr una industria más sostenible.
Imagen | Matheus Bertelli, vía Pexels