Los nuevos modelos de voz de OpenAI ya hablan como agentes de atención al cliente. Su próximo destino: los call centers
Publicado el 20/03/2025 por Diario Tecnología Artículo original
Desde principios de año, el objetivo de las grandes tecnológicas ha sido claro: que hablemos con la inteligencia artificial (IA). OpenAI, Microsoft, Google y Meta han ido sumando funciones de voz a sus asistentes. Pero esto parece ser solo el comienzo. La industria avanza a un ritmo frenético y la forma en la que interactuamos con estas herramientas sigue evolucionando.
Dile ‘hola’ a los agentes de voz. La compañía de IA de Sam Altman lleva meses apostando por los agentes de texto con herramientas como Operator o Computer-Using Agents. Sin embargo, OpenAI ya tiene listo si próximo gran movimiento para seguir destacando en la carrera por el desarrollo de la IA: impulsar una nueva y potente generación de agentes de voz.
Nuevos modelos en escena. OpenAI ha anunciado el lanzamiento de nuevos modelos de audio para convertir voz en texto y viceversa. No están en ChatGPT, sino en la API, donde los desarrolladores podrán usarlos para crear agentes de voz. ¿Lo importante? Apuntan a ser mucho más precisos y a llevar la personalización al siguiente nivel.
Los nuevos modelos de OpenAI, construidos sobre GPT-4o y GPT-4o-mini, prometen mejorar a Whisper y a sus anteriores herramientas de texto a voz, que seguirán activas también a través de la API. Pero no es solo cuestión de rendimiento: ahora también pueden modular su tono para sonar, por ejemplo, “como un agente de atención al cliente empático”.

Destino: los call centers. OpenAI deja bien claro hacia donde apuntan con este lanzamiento. Asegura que “por primera vez, los desarrolladores pueden indicarle al modelo no solo qué decir, sino también cómo decirlo, lo que permite experiencias más personalizadas para casos de uso que van desde la atención al cliente hasta la narración creativa”.
Según OpenAI, esta tecnología permitirá crear “experiencias conversacionales” mucho más ricas. Si tenemos en cuenta que ChatGPT, impulsado por GPT-3.5, llegó en noviembre de 2022, es evidente que el avance ha sido vertiginoso. Y todo apunta a que estos modelos acabarán llegando a los call centers.
Podríamos pensar que en un primer momento las interacciones serán algo limitadas, pero muy por encima de los sistemas de voz actuales. Se alejarán de los asistentes automatizados tradicionales y serán mucho más naturales. Con el tiempo, la línea entre una conversación con una persona y una IA podría volverse casi imperceptible.
Imágenes | Charanjeet Dhiman | OpenAI
utm_campaign=20_Mar_2025"> Javier Marquez .