Anthropic da un salto de gigante en su IA: será posible controlar el PC con la voz y de forma muy natural

Publicado el 26/11/2024 por Diario Tecnología
Artículo original

Anthropic da un salto de gigante en su IA: será posible controlar el PC con la voz y de forma muy natural

El mes pasado hablábamos de los grandes avances de Anthropic en lo referente a la automatización de tareas con su IA Claude. Y es que sus responsables introdujeron una funcionalidad que permitía dar a la IA el control de nuestro ordenador. De esta manera, Claude puede llegar a teclear, mover el cursor, entrar en páginas web y hasta tomar capturas de pantalla, entre otras tareas.

Desde Anthropic ahora han ido un paso más allá, y es que pretenden que la IA pueda cumplir nuestras tareas en el PC utilizando únicamente la voz. El resultado acaba siendo sorprendente y hasta tenemos vídeo de cómo funciona su sistema. Bajo estas líneas te contamos todos los detalles.

Una IA que puede controlar el PC por ti

La inteligencia artificial generativa ha avanzado significativamente desde que OpenAI mostró ChatGPT al mundo. Ahora, esta misma IA cuenta hasta con un modo de voz avanzado que sorprende muchísimo por la naturalidad de las respuestas y la rapidez que lo hace mientras conversamos en tiempo real.

Anthropic, una empresa fundada por exmiembros de OpenAI, también se encuentra a la vanguardia de la inteligencia artificial con sus modelos de lenguaje. Su IA Claude ofrece grandes capacidades y no tiene nada que envidiarle a ChatGPT. De hecho, ahora puede hasta controlar nuestro PC con la voz.

La compañía ha unido fuerzas con Hume AI y su ‘Interfaz de Voz Empática’ (EVI) para dotar a Claude de una gran naturalidad y ‘emoción’ en sus respuestas. Este era el ingrediente que faltaba para que, una vez que Claude procese nuestra solicitud, la IA pueda controlar nuestro PC.

En el vídeo que hemos dejado adjunto vemos cómo el usuario interactúa con Claude de una manera muy natural, incluso interrumpiendo la conversación si hacía falta. Aquí EVI y Claude se reparten las tareas. EVI interpreta nuestra solicitud y la lanza a Claude, y éste las ejecuta para luego responder en texto, el cuál es leído por EVI.

La idea de este proyecto es que podamos controlar nuestro PC al completo tan solo dirigiendo a la IA con la voz. De esta manera, agilizaríamos la automatización de tareas mientras conversamos con una IA con voz tan natural como la que nos han mostrado desde Anthropic. En el vídeo vemos cómo el usuario le pide a la IA que abra el navegador para jugar al ajedrez, mientras le iba mandando indicaciones para mover la fichas también.

“Al integrar Claude con EVI, hemos creado algo verdaderamente especial. Las capacidades de lenguaje natural de Claude y su personalidad complementan la comprensión de la expresión y la empatía de EVI, de modo que EVI puede ‘actuar’ las respuestas de Claude y generar conversaciones fluidas y conscientes del contexto que se sienten notablemente humanas”, explicó el fundador de Hume, Alan Cowen, en una publicación del blog oficial de la compañía. “Claude es muy elocuente. Tiene una personalidad realmente buena con la que la gente disfruta hablando”, continuaba.

Que la IA controle nuestro ordenador tiene sus ventajas, pero seguramente al leer este artículo también estabas pensando en todo lo malo que podría acarrear. Es cierto, darle a la IA esta capacidad sería vulnerar completamente nuestra privacidad, ya que si este proyecto avanza aún más, tendría el control de nuestras apps de mensajería o hasta del historial de nuestro navegador, por mencionar un par de ejemplos. A pesar de que se trata de un gran avance, será interesante ver cómo desde Anthropic y Hume AI tratan la privacidad del usuario al interactuar de esta forma con su IA.

Imagen de portada | Anthropic

En Genbeta | Le despidieron con una carta hecha con inteligencia artificial. Para el juez es “impresentable” y lo declaró improcedente

26_Nov_2024"> Antonio Vallejo .