Las innovaciones en inteligencia artificial no dejan de sorprender y casi a diario aparece algún avance sorprendente. Una de las últimas novedades es una tecnología capaz de replicar cualquier voz humana en segundos. Una herramienta que conlleva serios riesgos.
Open AI, la empresa dirigida por Sam Altman, acaba de publicar un artículo en el que introduce a Voice Engine, un motor de inteligencia artificial capaz de crear un clon digital de una voz humana partiendo sólo de un pequeño clip de audio de 15 segundos.
Este sistema no es nuevo, ya que viene siendo probado por la propia OpenAI desde 2022 en funciones como el sistema de voz de ChatGPT. Lo novedoso es la capacidad de crear nuevas voces partiendo simplemente de un pequeño archivo de audio de una persona.
Desde OpenAI señalaron que Voice Engine está todavía en desarrollo. Sin embargo, también reconocen que son conscientes del problema de este tipo de herramientas, al ser muy fácil usarlas para crear desinformación a un nivel que muchas personas aún no serían capaces de distinguir.
Con sólo 15 segundos de audio, puede clonar una voz humana. Bloomberg.Desde que se dio a conocer este software, desde OpenAI indican que, hubo muchos casos de estafas que usaron una tecnología similar para replicar las voces de los usuarios o de personas reconocidas.
Fue esta misma razón la que impidió que este servicio se haya liberado masivamente. OpenAI está analizando cómo evitar que se convierta en un problema y hasta que no haya encontrado una solución no será una característica de libre acceso.
Según la compañía, este sistema puede convertir texto a voz para crear voces sintéticas que conservan los acentos nativos de los hablantes, algo en lo que la inteligencia artificial viene dando importantes avances.
Incluso, hay otras firmas, como es el caso de Meta, que ya habían mostrado sus avances en este campo, OpenAI fue capaz de ir un paso más allá y reducir drásticamente la duración del audio de referencia para que la IA copie la voz de una persona.
Su funcionamiento, al menos en teoría, es bastante simple. El interesado deberá proporcionar una grabación de voz de 15 segundos de duración y un texto. La IA será capaz de «clonar» la voz y narrar el contenido del texto de manera «realista y emotiva».
Voice Engine: algunos usos favorables
OpenAI busca dar otro batacazo tecnológico. AFPPero no todas son contraindicaciones. Entre los usos que ha destacado la empresa está el de asistir a personas con algún tipo de discapacidad en la lectura de textos o a la hora de enseñar a niños. La naturalidad de las voces creadas es uno de sus puntos fuertes.
También tiene un gran uso en la traducción y el aprendizaje de nuevos idiomas. Las voces creadas no sólo sirven en el idioma en el que han sido entrenadas, sino que pueden ser usadas para leer o hablar en otros idiomas, pero manteniendo las características de dichas voces.
Por el momento OpenAI está trabajando con ciertas empresas y desarrolladores que proponen diferentes usos y dan feedback. Eso sí, tienen prohibido la creación de herramientas que permita a los usuarios crear sus propias voces. Esto es así solo por una cuestión de seguridad, sobre todo en un año con tantas elecciones como este.
SL