David Ruano desenvolveu na súa tese de doutoramento un novo sistema de filtrado

Contra o correo lixo, Wirebrush4SPAM

Inspirado no funcionamento da plataforma SpamAssassin

Tags

Ourense
Investigación

Rosa Tedín DUVI 03/09/2015

Grazas aos avances nas redes de comunicación cada día máis é posible dispor dunha forma fácil e rápida de conexión a Internet desde calquera lugar. As estatísticas indican que diariamente se envían unha media de 125 billóns de correos electrónicos no mundo e que arredor do 60% deles son correo lixo ou spam. Para loitar contra estas mensaxes non desexadas de publicidade, virus ou fraudes, no marco da súa tese de doutoramento David Ruano desenvolveu Wirebrush4SPAM, un novo sistema aberto de filtrado capaz de clasificar os correos electrónicos con maior precisión e eficiencia. A ferramenta está dispoñible para a súa descarga e uso de balde.

A tese con mención internacional, titulada Model for optimising the execution of anti-spam filters, foi presentada na Escola Superior de Enxeñaría Informática do campus de Ourense e realizada baixo a dirección do docente José Ramón Méndez Reboredo. Tanto a tese como o sistema desenvolvéronse no marco dun proxecto de investigación levado a cabo desde 2010 polo Sing Group que tivo como obxectivo a creación dun sistema aberto de filtrado capaz de detectar spam en contidos web, proxecto no que participaron ademais do xa doutor e do seu director de tese os investigadores Noemí Pérez e Álvaro Pérez.

Máis velocidade e precisión

Ante a crecente necesidade de dispor de novos mecanismos que permitan paliar o gran problema que supón a recepción masiva de correos electrónicos con contido lixo, o principal obxectivo desta tese foi o desenvolvemento dun novo modelo de filtrado inspirado no funcionamento de SpamAssassin, unha das plataformas antispam máis populares. “A tese consistiu en deseñar novos mecanismos que permitisen mellorar tanto a eficiencia do sistema de filtrado (no que respecta á velocidade de filtrado) como a súa precisión (para conseguir reducir os erros na clasificación dos correos, reducindo os falsos positivos, a clasificación dun correo lexítimo como spam, e os falsos negativos, a clasificación dun correo lixo como lexítimo)”, explica David Ruano.

Este obxectivo foi acadado mediante o refinamento de varios aspectos, como son o deseño e desenvolvemento de pequenas melloras técnicas para incrementar o rendemento global do filtro; a aplicación de algoritmos xenéticos para aumentar a precisión do filtro e, finalmente, o uso de algoritmos de planificación para mellorar a velocidade de filtrado. Froito deste traballo naceu Wirebrush4SPAM, un novo software de filtrado desenvolvido completamente desde cero e que incorpora o concepto de motor de regras previamente incluído en SpamAssassin.

Durante a investigación Ruano Ordás realizou unha revisión das técnicas e aplicacións de filtrado antispam, identificando como os mellores sistemas sacan partido da integración de múltiples técnicas. Tamén levou a cabo unha análise do funcionamento do motor de regras de SpamAssassin, descubrindo algunhas das súas desvantaxes que causan perdas de tempo durante o filtrado de correos electrónicos. Para superar estas limitacións, indica o investigador, “considerouse necesario definir un novo framework capaz de mellorar o rendemento de filtrado mediante o uso de técnicas de análise eficientes capaces de sacar partido das capacidades multifío dos procesadores actuais e o emprego de novas estratexias de execución de regras, que permiten lograr un incremento da velocidade de filtrado”.

Constante evolución

A evolución continua das técnicas para anular ou empeorar a detección de mensaxes lixo e a natureza cambiante do spam, sinala Ruano Ordás, obrigan a que as técnicas na súa contra estean nunha constante evolución co fin de adaptarse ás novas necesidades. “Un dos principais problemas do correo lixo (ademais da súa fácil e rápida difusión) é a súa facilidade para crear contidos spam. Por este motivo, é imprescindible seguir desenvolvendo tanto novos mecanismos que permitan mellorar a eficiencia e eficacia dos sistemas antispam como a creación e/ou mellora de técnicas de detección de mensaxes lixo co fin de adaptarse á natureza cambiante deste fenómeno”, comenta por último o investigador.