DUVI

Diario da Universidade de Vigo

Desenvolto polo Seminario de Lingüística Informática

A Universidade publica o maior dicionario plurilingüe do galego en app

Con traducións e sinónimos para dez linguas: galego, portugués, catalán, vasco, español, inglés, ale

Tags
  • Estudantes
  • PAS
  • PDI
  • Público externo
  • Vigo
  • Divulgación
  • Lingua Galega
  • TIC
  • Investigación
DUVI 07/06/2019

O Seminario de Lingüística Informática da Universidade de Vigo acaba de publicar en Google Play, a tenda de aplicacións móbiles para os dispositivos con sistema operativo Android, o Dicionario Galnet, o maior dicionario plurilingüe do galego, unha obra con traducións e sinónimos para dez linguas: galego, portugués, catalán, vasco, español, inglés, alemán, latín, italiano e chinés. 

“A aplicación móbil para Android que se acaba de presentar no mercado de Google utiliza o repertorio léxico de WordNet, un proxecto internacional no que participa o SLI desde 2010 co obxectivo de  integrar o léxico galego nesta rede semántica interlingüística”, explica o profesor da Facultade de Filoloxía e Tradución Xavier Gómez Guinovart, coordinador do equipo que desenvolveu o dicionario GalNet, unha obra que reúne 725.000 palabras, das que 70.000 corresponden a verbas en galego.

Desde o SLI fan fincapé en que a app para Android do Dicionario Galnet se pode descargar de balde nas tendas de Google e de Amazon e pode ser tamén consultada libremente nunha aplicación web completamente adaptada aos dispositivos móbiles. 

É o recurso que emprega o Google Translate como apoio no seu proceso de tradución

Como xa explicaba o profesor Gómez Guinovart  no Duvi en maio de  2016, o Galnet é unha rede léxico semántica para lingua galega, un recurso léxico-semántica para a lingua galega estándar para todas as aplicacións informáticas que traballan coa linguaxe. “Ten moitas utilidades, pero principalmente é un dicionario electrónico para que os programas que procesan linguaxe sexan capaces de deducir o significado das frases e actuar en consecuencia”. É, por exemplo, o recurso que emprega o Google Translate, como apoio no seu proceso de tradución en calquera das linguas que contan co seu WordNet. 

O director do Seminario de Lingüística Informática subliña neste senso que o tradutor de Google segue un modelo estatístico, de modo que almacena moitas traducións entre dúas linguas e, a partir de aí, deduce as regras que traducen entre unha e outra lingua. “Pero ás veces as inferencias estatísticas non chegan para producir unha tradución aceptable e necesita recorrer a recursos máis precisos como os dicionarios bilingües e, neste caso, o recurso multilingüe seleccionado é o WordNet, porque é o maior dicionario multilingüe tanto en número de linguas como en número de palabras e conceptos”. Ademais, polo formato propio de WordNet, pensado para ser manexado por ordenadores, permite unha utilización moi doada no ámbito da lingüística computacional ou do procesamento da linguaxe natural. Con todo, e a pesar de que está deseñado para ser empregado no eido da intelixencia artificial, “tamén ofrece moitas utilidades para a consulta lexicográfica directa dos seus contidos”.

Desenvolto no marco dun proxecto estatal

Esta ferramenta para a lingua galega desenvolveuse no marco do proxecto Skater (Scenario Knowledge Acquisition by Textual Reading), no que participaron tamén as universidades do País Vasco, Pompeu Fabra, Barcelona e Politécnica de Cataluña, baixo a coordinación desta última. Foi un traballo que contou cun financiamento estatal de tres anos de duración e un orzamento total de 400.000 euros e dentro do cal se desenvolveron tamén os WordNet do catalán, do euskera, do español e do portugués.