Inteligencia artificial

OpenAI presenta nuevos modelos de voz en tiempo real para desarrollar asistentes más conversacionales

OpenAI ha lanzado tres nuevos modelos de audio orientados a tareas de voz en tiempo real. Las herramientas permiten escuchar, traducir y responder durante conversaciones en directo. La compañía busca impulsar el desarrollo de agentes de inteligencia artificial más naturales y funcionales.

OpenAI ha anunciado el lanzamiento de tres nuevos modelos de audio integrados en su plataforma para desarrolladores. Las nuevas herramientas están diseñadas para mejorar las capacidades conversacionales de los sistemas de inteligencia artificial basados en voz.

Con esta actualización, la compañía amplía el alcance de sus soluciones más allá de la simple transcripción o generación de texto, acercándose al desarrollo de asistentes capaces de interactuar y actuar en tiempo real durante una conversación.

Tres herramientas con funciones diferenciadas

Entre los nuevos modelos presentados se encuentra GPT-Realtime-2, orientado a gestionar conversaciones complejas y mantener el contexto durante sesiones prolongadas. El sistema también está preparado para manejar interrupciones y ejecutar herramientas durante la interacción.

El segundo modelo, GPT-Realtime-Translate, se centra en traducción simultánea y es capaz de trabajar con más de 70 idiomas de entrada y múltiples idiomas de salida, lo que amplía sus posibilidades en entornos internacionales.

Transcripción instantánea y automatización

El tercer modelo, GPT-Realtime-Whisper, permite convertir voz en texto en tiempo real. Esta funcionalidad está pensada para aplicaciones como subtítulos automáticos, generación de notas de reuniones o actualización de flujos de trabajo mientras una persona habla.

La integración de estas capacidades abre nuevas posibilidades para automatizar tareas relacionadas con la comunicación y la gestión de información.

Aplicaciones empresariales y primeros clientes

OpenAI ha señalado que varias compañías ya están probando estas herramientas en distintos sectores. Entre ellas figuran empresas relacionadas con el sector inmobiliario, el turismo y las telecomunicaciones.

El objetivo es facilitar la creación de asistentes virtuales más naturales, capaces de interactuar de forma continua con usuarios y clientes en diferentes contextos profesionales.

El lanzamiento refleja la creciente competencia en el desarrollo de agentes de inteligencia artificial capaces de operar mediante voz. Las compañías tecnológicas están centrando parte de sus esfuerzos en crear sistemas que no solo respondan preguntas, sino que también comprendan el contexto y ejecuten acciones de forma autónoma.

Este avance sitúa la interacción por voz como uno de los principales focos de evolución de la inteligencia artificial aplicada a servicios y plataformas digitales.


Descubre más desde TecnoAp21

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario