DUVI

Diario da Universidade de Vigo

No marco do proxecto de investigación BUCEADOR

Deseñan o primeiro sistema multilingüe de busca e tradución de contidos audiovisuais

Permite traducir emisións de radio, televisión e texto en todas as linguas do Estado

Etiquetas
  • Vigo
  • Investigación
D. Besadío DUVI 01/06/2011
Un sistema que permite a busca e tradución de contidos audiovisuais en todas as linguas do Estado español, ademais do inglés, ou, o que é o mesmo, un método que permite que o usuario poida facer unha consulta mediante a súa voz e obter a información cun audio sintético no idioma desexado. Así é o primeiro sistema multilingüe de busca e tradución de contidos audiovisuais que se está a desenvolver no marco de BUCEADOR, un proxecto de investigación que se está a levar a cabo no marco do Plan Nacional de I+D coa participación das universidades Politécnica de Catalunya, País Vasco e Vigo.

O proxecto, liderado pola UPC e coordinado en Vigo polo profesor Eduardo Rodríguez Banga, permite traducir unha emisión de televisión dun idioma a outro en audio e en texto. “Trátase de que partindo dunha serie de contidos audiovisuais en calquera lingua do Estado ou mesmo en inglés, lle poidas facer preguntas a un sistema de recuperación da información relacionada cunha serie de palabras clave e el se encargue da busca”, subliña o profesor Rodríguez Banga, investigador do Grupo de Tecnoloxías Multimedia, equipo cunha longa traxectoria de investigación nas tecnoloxías da fala.

Este verán estará listo o primeiro prototipo

O primeiro prototipo estará listo este verán , se ben a finalización do proxecto non se prevé ata decembro 2012. O obxectivo final é seguir mellorando nas tecnoloxías e sistemas de recoñecemento automático da fala, a tradución e a síntese de voz, aspectos que dende Vigo destacan poden ter múltiples aplicacións prácticas. Desde a axuda de acceso a información a persoas discapacitadas, sobre todo, aquelas que teñen problemas visuais, ata servizos de domótica no fogar e “en xeral, calquera aplicación onde a comunicación vocal teña sentido, como é o caso do acceso a información por vía telefónica ou a maior parte dos sistemas de atención ao cliente”.

Aínda que a aplicación está pensada para ser empregada na industria audiovisual, o sistema nace tamén coma un buscador que pon ao alcance de calquera usuario imaxes en movemento, fotografías e textos asociados a unha palabra e pode traducilos a outro idioma. Ademais, a esta información podería accederse por texto, na lingua na que xa están os contidos, ou directamente por voz, é dicir, que un usuario realizaría unha pregunta falando, e o recoñecedor de voz recoñecería o texto correspondente a esa pregunta, o tradutor traduciría esa pregunta aos idiomas dispoñibles e o usuario recuperaría a información no seu propio idioma. “Si temos gravado un telexornal en galego e, por exemplo, un madrileño quere recuperar algún contido poderá facelo no seu propio idioma, é dicir, en castelán”, explica Rodríguez Banga.

Recoñecemento de fala, tradución e conversión texto-voz

Os arredor de oito investigadores que están a traballar dende Vigo no proxecto, todos eles do Grupo de Tecnoloxías Multimedia, centráronse sobre todo nas tarefas de recoñecemento de fala, tradución e de conversión texto-voz. Para o apartado de tradución están empregando o que se chaman técnicas estatísticas –similares as que empregan portais como google-, sen empregar polo momento coñecemento lingüístico. O punto de partida son pois tradutores estatísticos, nos que se lles dá os contidos nos diferentes idiomas e el é capaz de aprender, tendo en conta parámetros estatísticos, como traducir entre eses dous idiomas, “se ben, por suposto non está libre de erros”, admite o coordinador en Vigo do proxecto. O entrenamento destes tradutores demanda grandes recursos computacionais, polo que parte destas tarefas estanse a realizar en ordenadores do Centro de Supercomputación de Galicia (CESGA).

Respecto a conversión texto-voz, unha das especialidades do grupo, o que están a facer é centrarse na síntese de voz en galego e castelán, unha tarefa para a que contaron coa axuda de lingüistas do Centro Ramón Piñeiro para a investigación en humanidades de Santiago de Compostela.

O proxecto Buceador supón a continuación dun proxecto anterior, chamado AVIVAVOZ, desenvolto polos mesmos equipos de investigación e que supuxo a creación dun sistema de subtitulado automático de arquivos de vídeo para o galego, catalán e castelán.