OpenAI, la compañía liderada por Sam Altman y reconocida por sus desarrollos punteros en inteligencia artificial, ha presentado al mundo su última innovación: Voice Engine. Este motor de inteligencia artificial tiene la capacidad de replicar cualquier voz humana con apenas una muestra de 15 segundos.
La introducción de Voice Engine por OpenAI no es solo un paso adelante en la capacidad de generación de voz, sino también un reflejo del compromiso de la compañía en explorar los límites de la inteligencia artificial. Desde finales de 2022, OpenAI ha venido desarrollando esta tecnología, inicialmente utilizada para potenciar la voz de su API de texto a voz y, más recientemente, para dar vida a la voz de ChatGPT en aplicaciones móviles. A lo largo de 2023, un selecto grupo de partners de confianza ha estado experimentando con esta tecnología, explorando una variedad de aplicaciones que van más allá de la mera generación de voz, hacia la creación de experiencias auditivas emotivas y realistas.
El proceso para clonar una voz con Voice Engine es sorprendentemente simple, requiriendo únicamente una muestra de voz de 15 segundos y un poco de texto. A pesar de la brevedad de la muestra requerida, el resultado es una voz clonada convincente, capaz de transmitir emociones y sonar increíblemente realista. Esta capacidad pone de manifiesto el nivel de sofisticación alcanzado por OpenAI en el modelado de inteligencia artificial, aunque la compañía aún no ha revelado detalles específicos sobre el tamaño o la estructura interna del modelo.
La revelación de Voice Engine ha sido recibida con gran expectación, no solo por las impresionantes demostraciones técnicas, sino también por el debate que suscita sobre el uso ético y responsable de la tecnología de voces sintéticas. OpenAI ha expresado su intención de iniciar un diálogo abierto sobre cómo la sociedad puede adaptarse a estas nuevas capacidades y los criterios para un despliegue responsable a mayor escala.