Microsoft muestra sistema para traducir con tu voz del inglés al chino mandarín

En una demostración en video de una conferencia dada en Tianjin, China, Rashid habló en inglés, y luego sonó su misma voz, pero hablando en chino mandarín.

Microsoft demostró una tecnología bastante impresionante que traduce lo que uno habla a otro idioma en forma simultánea, reproduciendo la traducción con la propia voz del hablante.

El jefe de investigación de la compañía, Rick Rashid, indicó que la empresa espera tener en el futuro cercano sistemas que "derriben completamente las barreras del lenguaje". En una demostración en video de una conferencia dada en Tianjin, China, Rashid habló en inglés, y luego sonó su misma voz, pero hablando en chino mandarín.

El sistema ha sido llamado "Deep Neural Net" (DNN) y ha sido investigado por varios años.

"El primer paso toma mis palabras y busca equivalentes en chino, y aunque esto no es trivial, es la parte fácil. El segundo paso reordena las palabras para que sean apropiadas para el chino, un paso importante para una traducción correcta entre lenguajes. Por supuesto, es probable que todavía haya errores tanto en el texto en inglés como en la traducción en chino, y el resultado a veces puede ser gracioso. Aún así, la tecnología se ha desarrollado para ser bastante útil", escribió Rashid en uno de los blogs de Microsoft.

Para crear la versión de voz final, Microsoft debió grabar algunas horas de un chino hablando en su idioma, y alrededor de una hora de Rashid hablando en inglés.

Las tecnologías de traducción de voz no son totalmente nuevas y se han ido integrando a nuestra vida cotidiana a través de herramientas en smartphones, televisores y consolas, sin embargo, estos sistemas están basados en una técnica estadística conocida como Modelo Oculto de Márkov y tienden a tener una tasa de error de entre 20% y 25%.

Según Rashid, DNN tiene una tasa de error mucho menor. "Esto significa que en lugar de tener una palabra de cuatro o cinco incorrecta, ahora la tasa de error es de una palabra en siete u ocho", indicó. "Aunque esto todavía está lejos de ser perfecto, es el cambio más dramático en exactitud desde la introducción del modelamiento oculto de Márkov en 1979, y a medida que agregamos más datos al entrenamiento creemos que tendremos todavía mejores resultados", afirmó.

"Quizás no tendremos que esperar al siglo XXII para usar el equivalente al traductor universal de Star Trek", dijo.

Ver en YouTube

Link: Microsoft Research shows a promising new breakthrough in speech translation technology (Microsoft)

powered byDisqus