DUVI

Diario da Universidade de Vigo

O proxecto, dirixido polo Centro Ramón Piñeiro, foi desenvolvido por investigadores de Vigo e Santia

O sintetizador de voz CoToVía permite converter un texto escrito en galego nunha cadea oral

Permite a accesibilidade web a persoas con discapacidades visuais e a automatización das comunicació

Etiquetas
  • Vigo
  • Investigación
DUVI 14/07/2017

Tras máis dunha década de traballo de investigadores do Grupo de Tecnoloxías Multimedia da Universidade de Vigo e do Instituto da Lingua Galega da Universidade de Santiago de Compostela, coordinados polo Centro Ramón Piñeiro, este venres presentouse oficialmente a versión definitiva do sintetizador de voz CoToVía. Trátase dunha ferramenta informática que permite a conversión dun texto escrito en galego nunha cadea oral. Os encargados de presentalo foron o secretario xeral de Política Lingüística, Valentín García e o director científico do Centro Ramón Piñeiro para a Investigación en Humanidades (CRPIH) e coordinador do proxecto, Manuel González.

Valentín García explicou que se trata dunha iniciativa pioneira no eido da tecnoloxía lingüística en galego. “Ademais do seu valor intrínseco para asegurar o funcionamento e utilidade da nosa lingua na actual sociedade da información e no futuro que nos agarda” e puxo en valor o traballo feito polo Centro Ramón Piñeiro, que “abriu camiños seguidos posteriormente por outros equipos de investigadores e mesmo por empresas”.

Froito do traballo dun equipo multidisciplinar de enxeñeiros e lingüistas

No proxecto CoToVía conflúe o traballo do equipo e enxeñeiros e enxeñeiras do Grupo de Tecnoloxías Multimedia da EE de Telecomunicación de Vigo, coordinados primeiro pola catedrática Carmen García Mateo e actualmente polo profesor Eduardo Rodríguez Banga, e de lingüistas da Universidade de Santiago de Compostela, baixo a dirección de Manuel González González. O obxectivo era construír un sistema de conversión automática texto-voz para a lingua galega e para iso, ao longo dos últimos anos foron presentándose distintas versións ata chegar a esta definitiva, construída con unidades pregravadas extraídas da lingua natural.

CoToVía funciona mediante a concatenación de unidades e difonos extraídos da linguaxe natural, emulando voces masculinas e femininas. Isto faise a través de tres módulos destinados a arquivar os recursos lingüísticos, acústicos e prosódicos (entoación, ortografía, duración dun segmento, etc) cos que se interpretará o texto dun xeito intelixible, fiable e cunha gran naturalidade e proximidade ao discurso oral. Isto supón un destacado avance respecto ás primeiras versións do programa que contaban cunha voz máis mecánica. Unha vez obtida a frase textual, o programa normaliza o texto e realiza un preprocesado do mesmo, para despois realizar unha análise morfolóxico e sintáctico. Esta tarefa deriva nunha transcrición fonética, a partir da que se dan ordes para buscar unha secuencia determinada no módulo acústico e un modulado prosódico, coa duración dos segmentos, a súa intensidade e a frecuencia de cada vogal.

De utilidade para persoas con discapacidades visuais

Os sintetizadores de voz serven para garantirlles a accesibilidade web a persoas con discapacidades visuais, pero son tamén fundamentais en todas as linguas no mundo da automatización das comunicacións, da información e das relacións sociais: en postos de información automatizados (servizos de banca, reservas de billetes, lectura de mensaxes por vía telefónica...), no ensino de idiomas, no ensino de lectura a nenos con dislexia, nas alarmas orais, na verificación de texto etc. Así, e segundo explicou González, persoas con minusvalía visual poderían consultar un dicionario, unha web, unha novela ou usar un programa informático sen necesidade de recorrer a recursos 'braille'.

A versión definitiva de CoToVía púxose ao libre dispor de toda a comunidade como Creative Commons, cunha licenza GPL 3.0+, de maneira que pode ser empregada libremente por calquera empresa ou usuario, coa única condición do recoñecemento de que os seus autores son o CRPIH e a Universidade de Vigo. O enderezo para a descarga é ftp.net-snmp.org. A partir de agora, o equipo do proxecto CoToVía seguirá traballando nunha nova dirección máis flexible e diversificada de elaboración de recursos auxiliares para o desenvolvemento deste tipo de tecnoloxías.