El euskera y el catalán son lenguas europeas con "alto riesgo" de extinción digital

image

 

El euskera y el catalán se encuentran, junto a otras lenguas como el búlgaro, el griego, el húngaro y el polaco, en una situación de "alto riesgo" de extinción digital, según ha informado en un comunicado la UPV/EHU.

En total, son 21 los idiomas europeos que se encuentran en peligro de extinción digital. Un estudio realizado por expertos en tecnologías lingüísticas advierte de que la mayoría de lenguas de la UE "tiene pocas probabilidades de sobrevivir en la era digital" y se enfrentan a "la extinción digital".

El estudio ha sido realizado por META-NET, una red europea de excelencia que cuenta con 60 centros de investigación en 34 países, entre ellos el grupo de investigación de la UPV/EHU AhoLab Signal Processing Laboratory, un grupo de referencia en el campo de las tecnologías del habla para el euskera.

Después de evaluar el nivel de soporte tecnológico con el que cuentan 30 de las cerca de 80 lenguas europeas, los expertos concluyen que el apoyo digital para 21 de los 30 idiomas investigados es "inexistente o débil, en el mejor de los casos".

El informe, elaborado por más de 200 expertos y publicado en la serie de Libros Blancos META-NET, disponibles tanto en línea como en papel, evalúa el soporte tecnológico para cada idioma en cuatro áreas diferentes: la traducción automática, la interacción con la voz, el análisis textual y la disponibilidad de recursos lingüísticos.

Según los expertos, un total de 21 de los 30 idiomas (el 70 por ciento) se sitúan en la categoría más baja, según la cual el soporte tecnológico es "débil o inexistente", al menos en una de las áreas. Varios idiomas, como el islandés, el letón, el lituano y el maltés, reciben la puntuación más baja en las cuatro áreas.

En el otro extremo del espectro, y aunque no se considera que ninguna lengua goza de un soporte 'excelente', sólo el inglés recibe "un buen soporte", seguido del español que, junto con el francés, el alemán, el neerlandés y el italiano, cuentan con un "apoyo tecnológico moderado".

El euskera y el catalán, junto a otras lenguas como el búlgaro, el griego, el húngaro y el polaco, presentan una situación de soporte "fragmentario", lo cual los sitúa también en el conjunto de lenguas de alto riesgo.

SIN RECURSOS TECNOLÓGICOS

"Los resultados de nuestro estudio son muy alarmantes. La mayoría de las lenguas europeas carecen de los recursos tecnológicos básicos y algunas están abandonadas casi por completo. En este sentido, hay que decir que muchas de nuestras lenguas no están todavía preparadas para el futuro", manifiesta el profesor Hans Uszkoreit, coordinador de META-NET y coeditor del estudio.

Georg Rehm, el otro editor del estudio, añade que "existen grandes diferencias en el soporte tecnológico que reciben las distintas lenguas europeas". "La brecha entre las lenguas 'grandes' y 'pequeñas' es cada vez mayor. Tenemos que asegurarnos de que todas las lenguas cuenten con las tecnologías básicas necesarias, de lo contrario, estas lenguas están condenadas a la extinción digital", asevera.

El estudio destaca que la tecnología lingüística produce software capaz de procesar el lenguaje humano, ya sea hablado o escrito. Los ejemplos más conocidos de software lingüístico incluyen correctores ortográficos y gramaticales, asistentes personales interactivos para smartphones (como Siri en iPhone), sistemas de diálogo telefónico, traductores automáticos, motores de búsqueda web y las voces sintéticas utilizadas por los sistemas de navegación GPS.

TRADUCCIÓN AUTOMÁTICA

Hoy en día, las aplicaciones de tecnología lingüística se basan fundamentalmente en métodos estadísticos, que requieren cantidades muy grandes de datos. El informe apunta que "obtener la cantidad necesaria de datos resulta particularmente difícil para los idiomas pequeños, y eso revierte en la escasa calidad de muchos sistemas estadísticos, como puede verse, por ejemplo, en las traducciones, a menudo absurdas, producidas por los sistemas de traducción automática en línea más populares, como Google translator, para algunas lenguas".

Tras resaltar que Europa "ha conseguido eliminar casi todas las fronteras entre los países", precisa que "existe todavía una frontera que parece impenetrable: las barreras del idioma, que impiden el libre flujo de conocimientos e información".

"Esta frontera también perjudica el objetivo de establecer un mercado digital único, ya que impide la libre circulación de bienes, productos y servicios. Tecnologías como la traducción automática, resultan esenciales para superar las barreras del idioma", señala.

Sin embargo, manifiesta que los resultados del estudio de META-NET muestran "claramente que muchos de los idiomas europeos todavía no están preparados, debido, entre otros factores, a una investigación lingüística poco sistematizada y a la falta de compromiso político y de recursos financieros".

"Hace falta un esfuerzo coordinado a gran escala en Europa para llenar estos huecos y para facilitar la transferencia tecnológica entre las diferentes lenguas. Existen razones de peso para afrontar este inmenso reto de forma colectiva, en un esfuerzo que implique a la Unión Europea, a los Estados miembros y a países asociados, así como a la industria", precisa.

ALTO COSTE

Según apunta, "estas razones incluyen: el alto coste relativo de estas tecnologías para las comunidades lingüísticas más pequeñas, la necesidad de transferencia tecnológica entre las lenguas así como de interoperabilidad entre recursos, herramientas y servicios, así como el hecho de que las fronteras lingüísticas a menudo no coinciden con las fronteras políticas".

"Europa debe tomar medidas para preparar sus lenguas para la era digital. Éstas constituyen un componente valioso de nuestro patrimonio cultural y, como tal, merecen un futuro mejor", señala.

Durante la jornada del 26 de septiembre, el Consejo de Europa celebra el Día Europeo de las Lenguas, "un día en que se reconoce la importancia de fomentar y desarrollar el rico patrimonio lingüístico y cultural de nuestro continente".

El trabajo de META-NET "constituye un claro recordatorio de los desafíos y posibilidades a los que enfrenta nuestro patrimonio lingüístico en esta era de la información".