DUVI

Diario da Universidade de Vigo

A iniciativa quere recoller, organizar e publicar nun único espazo a información epidemiolóxica

O investigador Daniel González xestiona os datos de Galicia na plataforma colaborativa EsCovid19data

O proxecto ofrece datos actualizados e procesables a todo tipo de colectivos

Etiquetas
  • Estudantes
  • Medios
  • PAS
  • PDI
  • Público externo
  • Ourense
  • Saúde
  • TIC
  • Investigación
DUVI Ourense 17/06/2020

A xestión dos datos referidos a persoas afectadas pola covid-19 ten sido froito de constante polémica ao longo da pandemia. Tendo en conta esta circunstancia, xurdiu a plataforma EsCovid19data, “un proxecto colaborativo de varias persoas voluntarias que tratan de recoller, organizar e publicar nun único lugar a información epidemiolóxica da covid-19 a nivel provincial”. Nela, o profesor da Escola Superior de Enxeñaría Informática do campus de Ourense Daniel González encárgase de xestionar diariamente os datos relativos a Galicia.

Con este proxecto, explica González Peña, “búscase que a información estea nun único punto e sexa facilmente procesable (en formato estruturado, como folla de cálculo), para que calquera persoa, como xornalistas, científicos ou público en xeral, poida coñecelos e utilizalos para facer as súas análises”. Cada administración, lembra o investigador do Grupo Sing (Next Generation Computer Systems), publica os datos referidos á pandemia “dunha forma diferente, moitas veces en formatos non estruturados, como notas de prensa, en formato web ou pdfs, sendo necesario un arduo traballo de recompilación e estruturación diarios”. Neste marco de traballo, comenta, a súa participación nesta iniciativa consiste en estruturar datos para a comunidade autónoma galega. “Publico pola miña conta un repositorio aberto cos datos da covid-19 relativos a Galicia, grazas sobre todo á información que me facilitan dende o Servizo de Comunicación da Área Sanitaria de Ourense, Verín e O Barco de Valdeorras, e dende EsCovid19data recollen os meus datos”, detalla o enxeñeiro informático.

Na actualidade, os datos do repositorio relativos a Galicia teñen como fonte a Consellaría de Sanidade, “que proporciona datos a nivel global da comunidade autónoma de Galicia e unicamente de casos activos por área sanitaria”; da Xerencia da Área Sanitaria de Ourense, Verín e O Barco de Valdeorras (Sergas), que subministra datos detallados de Ourense e do resto de áreas sanitarias, e do Instituto de Salud Carlos III, que ofrece a serie de casos confirmados por PCR por data de inicio de síntomas a nivel provincial. Nos diferentes ficheiros as persoas interesadas poden consultar series históricas e datos actualizados, do conxunto de Galicia, das súas catro provincias e das súas áreas sanitarias, referidos a casos diagnosticados, falecidos e altas, entre outros temas. 

Unha xestión relevante

Apaixonado do tratamento automático de información, sobre todo en temas de saúde, Daniel González sinala como durante a crise “comecei a publicar as miñas análises informais en Twitter. Unha delas tivo certa repercusión, debido a que fixen una especie de predición da seroprevalencia a nivel autonómico antes de que se publicasen os estudos con tests de anticorpos que se axustou moito”. A través do enxeñeiro Kiko Llaneras e o seu equipo,o investigador ourensán coñeceu posteriormente a existencia de EsCovid19data e, ante a falta de datos de Galicia nesta plataforma, comezou a súa colaboración neste proxecto.

Sobre a importancia da xestión de datos, Daniel González lembra como “é fundamental”. Así, recalca, “moitísimas preguntas que temos do virus estanse a responder con análises sobre datos, como: cal é a letalidade do virus?, están a funcionar as medidas que se están a tomar? ou afecta por igual en todos os sitios?". Neste senso, engade, “os datos crús, desagregados na medida do posible, en formato estruturado e de acceso aberto son a materia prima para poder responder a moitas preguntas que nos permiten afrontar mellor esta crise”. 

Durante a crise da covid-19, comenta o profesor da Universidade de Vigo, teñen xurdido “dous problemas fundamentais relativos á xestión de datos”. Por un lado, apunta, está “a propia natureza dos datos que se proporcionan”, lembrando como “foron moi polémicas algunhas roturas de series históricas, como a de casos novos cando se empezaron a incluír os casos diagnosticados cos tests de anticorpos (a maiores de PCR), ou, máis recentemente, a serie de falecidos, que leva varios días sen actualizarse. Xa máis preto de nós, tamén tivo moita repercusión o “desembolsamento” de altas que o Sergas fixo público nun só día”. Estes problemas, detalla Daniel González, “poden ter xustificación na dificultade de obter os datos, de coordinar administracións, de correccións ou de cambios de criterio que fan que agora sexa mellor recoller os datos doutra forma”. Porén, e por outro lado, engade “están os problemas derivados do formato e a apertura dos datos mesmos, que non teñen tanta xustificación”. “Un proxecto como EsCovid19data non debería ter que existir”, indica o investigador sinalando neste senso como desde EsCovid19data promociónase un manifesto en favor dun mellor acceso á información da covid-19.