Internet

Nueva herramienta para clonar tu voz: OpenAI sorprende al mundo con Voice Engine... ten cuidado

¿Te imaginas hablando en múltiples idiomas sin realmente aprenderlos?

ARCHIVO - El logotipo de OpenAI, fabricante de ChatGPT, aparece en un teléfono móvil, el 31 de enero de 2023, en Nueva York. (AP Foto/Richard Drew, Archivo) AP (Richard Drew/AP)

Hace 9 años Sam Altman junto a Greg Brockman, Ilya Sutskever, Elon Musk y otros personajes del mundo de la tecnología decidieron crear OpenAI. Y si bien la compañía mantuvo un bajo perfil durante varios años, su ascenso fue meteórico. Tras el lanzamiento de ChatGPT se vivió una nueva revolución en el mundo, y rápidamente las personas empezaron a adoptar la inteligencia artificial para sus tareas del día a día. A la fecha OpenAI continúa trabajando en nuevas innovaciones. Por ejemplo, hace poco anunciaron que trabajan en Sora, una IA especializada en la creación de videos, y ahora volvieron a acaparar la atención internacional con un nuevo lanzamiento: Voice Engine.

PUBLICIDAD

El más reciente desarrollo de OpenAI se relaciona con una inteligencia artificial con capacidad de replicar la voz de una persona escuchándola una sola vez, ofreciendo resultados en apenas 15 segundos. Por supuesto, Voice Engine aún no está disponible para los usuarios, pero ya está generando altas expectativas y aquí te contamos todo lo que sabemos al respecto.

OpenAI anuncia Voice Engine

La nueva IA de la empresa liderada por Sam Altman actualmente se encuentra en fase de preview, según informa la compañía. ”Desarrollamos Voice Engine por primera vez a finales de 2022 y lo hemos utilizado para potenciar las voces preestablecidas disponibles en la API de conversión de texto a voz , así como ChatGPT Voice y Read Aloud”, explicaron en su web oficial.

Agregando que están “adoptando un enfoque cauteloso e informado para una publicación más amplia debido al potencial de uso indebido de la voz sintética. Esperamos iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades”.

Y es que la compañía admite que aún no tiene claro si su lanzamiento oficial será masivo o sólo para unos pocos. Hablamos de una IA que sólo necesita tomar una muestra de audio de 15 segundos para generar una voz que imita con asombro a la original, junto con añadir emociones y tonos realistas a la voz clonada.

Los riesgos de Voice Engine

Sin dudas Voice Engine podría abrir un abanico de posibilidades para los creadores de contenido multimedia, para crear podcasts en minutos o para traducir contenidos a otros idiomas. ¿El problema? También conllevaría riesgos potenciales de suplantación de voz.

“Nuestras políticas de uso prohíben la suplantación de otra persona u organización sin consentimiento o derecho legal. Además, nuestros términos requieren el consentimiento explícito e informado del hablante original y no permitimos que los desarrolladores creen formas para que los usuarios individuales creen sus propias voces. Los socios también deben revelar claramente a su audiencia que las voces que escuchan están generadas por IA. Finalmente, hemos implementado un conjunto de medidas de seguridad, que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como un monitoreo proactivo de cómo se utiliza”, explica OpenAI.

Con todo, aunque el potencial de Voice Engine aún es incalculable, OpenAI prometió avanzar con cautela, por ahora limitando su uso a un pequeño grupo de socios y con todas las restricciones antes mencionadas. Veremos cómo avanza esta historia y si finalmente podremos acceder a esta herramienta que se perfila como revolucionaria.

El logotipo de OpenAI puede apreciarse en un teléfono celular frente a la pantalla de una computadora que muestra los resultados de una búsqueda en Chat GPT, el 21 de marzo de 2023, en Boston. (AP Foto/Michael Dwyer, Archivo) AP (Michael Dwyer/AP)

Tags

Lo Último