Home Software Microsoft desarrolla traductor de voz del inglés al chino

Microsoft desarrolla traductor de voz del inglés al chino

microsoft-traductor-chinoMicrosoft realizó la demostración de un software que puede traducir la voz del inglés al chino de forma casi instantánea.

El software conserva la entonación y cadencia de la persona que habla, para que las palabras traducidas sigan sonando con la voz original.

Microsoft dijo que avances en sus investigaciones han minimizado el número de errores del sistema de traducción simultánea.

Y explicó que construyeron el sistema de manera sobre la base del funcionamiento del cerebro para mejorar su precisión.

Los detalles del proyecto los dio el jefe de investigación de Microsoft, Rick Rashid, en un blog, luego de una presentación que hizo en Tianjin, China, a fines de octubre.

Rashid aseguró que el programa ha comenzado a "generar un poco de atención".

En los últimos minutos de la presentación, las palabras de Rashid cambiaron casi inmediatamente al chino, mientras él en realidad le hablaba en inglés al sistema de traducción.

Además, las palabras generadas por la computadora eran bastante similares a su estilo de hablar.

Cambio dramático

Este avance fue posible, dijo Rashid, gracias a los ensayos realizados en los laboratorios de Microsoft se apoyaron en avances previos.

Los primeros modelos se deshicieron del enfoque de los primeros sistemas de traducción, que comparaban patrones, y favorecieron modelos estadísticos que lograron capturar mejor el rango de la voz humana.

Avances en tecnología informática han contribuido a un procesamiento de datos más veloz, lo que ha mejorado aún más el sistema. Sin embargo, todavía el porcentaje de error es de un 20%-25%.

En 2010, Rashid escribió que los investigadores de Microsoft, trabajando conjuntamente con científicos de la Universidad de Toronto, en Canadá, avanzaron aún más en el sistema de traducción usando redes neuronales profundas, las cuales aprenden a reconocer el sonido de la misma manera en la que lo hace el cerebro.

Al aplicar ese tipo de tecnología a la traducción del habla, el porcentaje de error disminuye en un 15%, aseguró Rashid, quien calificó estos avances como un "cambio dramático". Cuando las redes se programaban para reconocer errores más profundos, el porcentaje de fallos descendía aún más, añadió.

Durante su presentación, el jefe de investigación de Microsoft usó el sistema de reconocimiento mejorado. Primero, el audio de su discurso fue traducido en texto al inglés. Después, este se pasó al chino y se reordenaron las palabras para que, juntas, tuvieran sentido. Y finalmente los caracteres chinos se introdujeron en el sistema de texto a voz y salieron sonando como Rashid.

"Por su puesto que todavía hay errores en el texto en inglés y en la traducción al chino, y el resultado a veces puede ser cómico", admitió el experto en el blog. "Sin embargo, la tecnología ha sido bastante exitosa".

Otras compañías de tecnología, entre ellas AT&T y Google, tienen proyectos similares para realizar traducciones simultáneas. NTT Docomo ha presentado una aplicación para teléfonos inteligentes que permite a los japoneses llamar a extranjeros y que cada uno de los interlocutores pueda hablar en su lengua nativa.

Salir de la versión móvil