viernes 05.06.2020

«Estudiamos métodos automáticos para detectar las 'fake news’»

Su colaboración con el Incibe ha alumbrado hallazgos en la lucha contra la delincuencia de altísimo valor para la policía. Enrique Alegre, director del VARP de la Universidad, explica las líneas maestras de la nueva herramienta que han diseñado para detectar la ciberdelincuencia que opera en la red superficial y explica los proyectos que su equipo ya prepara para hacer de internet un lugar más seguro para todos
JESÚS F. SALVADORES
JESÚS F. SALVADORES

Enrique Alegre explica que el uso de los delincuentes de las redes abiertas supone que pueden llegar fácilmente a cualquier ciudadano, principalmente para engañarles o estafarles de alguna manera o robar sus datos, ya sean personales o bancarios.

—¿Cuál es el objetivo del GVIS?

—El grupo investiga en campos como el aprendizaje automático, la visión artificial, el procesamiento del lenguaje natural, procesamiento de audio, y aprendizaje profundo con el objetivo de resolver diversos tipos de problemas relacionados con la industria, la medicina o la ciberseguridad.

—¿Cuántas investigaciones habéis realizado desde su creación? Pregunta

—El grupo ha publicado un gran número de trabajos en revistas y congresos, principalmente internacionales, y registrado varias patentes. Si se quiere resumir en una cantidad, probablemente más de trescientos artículos publicados, de los cuales, más de sesenta fueron publicados en revistas indexadas de prestigio. Los problemas que hemos tratado o resuelto se pueden englobar en tres líneas principales de investigación: ciberseguridad y cibercrimen, análisis de imágenes médicas y control de calidad en la industria. Dentro de cada una de ellas, hay múltiples líneas menores, destacando las más de 30 líneas de investigación abiertas con Incibe. Hemos trabajado en la aplicación de la visión por computador y el aprendizaje automático a los problemas de análisis de imágenes biomédicas: colaborando con expertos veterinarios para evaluar automáticamente la calidad del semen de jabalí con fines de inseminación artificial, desarrollando sistemas para detectar automáticamente alteraciones y gotas en las colas del esperma de verraco, o mediante la identificación automática de tejidos sanos en el sistema cardiovascular humano. En colaboración con un equipo de ingenieros mecánicos, hemos aplicado técnicas de visión artificial y aprendizaje automático para evaluar con éxito la rugosidad de una superficie sin usar ningún dispositivo de contacto, o estimar la vida útil de las herramientas de corte en procesos de fresado sin necesidad de intervención humana, para predecir cuándo es el mejor momento para reemplazar una herramienta desgastada. Actualmente, estamos tratando de aplicarlo para evaluar la calidad de la superficie de las herramientas construidas utilizando fabricación aditiva con materiales metálicos y cerámicos. En el contexto de la ciberseguridad y la prevención del delito, estamos colaborando con el Instituto Nacional de Ciberseguridad para investigar y desarrollar herramientas basadas en la visión por computadora, el procesamiento del lenguaje natural, el aprendizaje automático y el aprendizaje profundo, entre otros, para luchar contra el cibercrimen (por ejemplo, métodos de estimación de edad, detección y reconocimiento de objetos, clasificación de contenidos visuales y textuales del sitio web, hashing perceptual para la identificación de servicios darknet) y para fines de ciberseguridad (por ejemplo, detección de botnet).

—¿Cómo ha cambiado vuestro trabajo desde la inauguración del Incibe?

—A los pocos años de fundarse Incibe, empezamos a colaborar con ellos en un proyecto europeo. A partir de ese momento, la colaboración se ha ido enriqueciendo y estrechando, de manera que en este momento, la mayor parte de nuestras líneas de investigación están relacionadas con problemas de ciberseguridad o cibercrimen. La colaboración con Incibe también ha supuesto que, si bien seguimos trabajando en el campo de la Inteligencia Artificial, hayamos ampliado los subcampos en los que trabajamos. De esta forma, hemos añadido a las líneas de investigación que teníamos en aprendizaje automático y visión artificial, otras líneas como son el procesamiento del lenguaje natural, el procesamiento del habla y algunas otras relacionadas con la ciberseguridad. Por otro lado, trabajar con Incibe ha supuesto involucrarnos en alguno de los problemas que ellos quieren resolver, por lo que nuestra investigación, que ya era aplicada, se ha vuelto aún más, con la ventaja de tener acceso a mucha información que nos permite investigar mejor y proporcionar mejores soluciones. Todo lo anterior ha supuesto que nuestro grupo ha crecido en tamaño en los últimos años, tanto en investigadores, como en proyectos. En las próximas semanas empezaremos a trabajar en el tercer proyecto europeo relacionado con ciberseguridad, en el que participa Europol como principal usuario final, lo que no hubiera sido posible sin el apoyo de Incibe.

La cantidad de datos que se mueven en la web diariamente es ingente e inabordable por cualquier persona

—¿Por qué es tan importante etiquetar a los malos?

—Lo mismo que gran parte de nuestras actividades se han movido a la red, los delincuentes también se han movido, buscando principalmente el beneficio económico que obtienen al engañar a los ciudadanos. En la actualidad, la cantidad de datos que se mueven en la web diariamente es ingente e inabordable por cualquier persona. Por ese motivo, surge la necesidad de generar herramientas o servicios que permitan gestionar y dar valor a dichos datos y extraer información de interés de los mismos. No todos los datos de la web están relacionados con actividades lícitas, y cada vez es más común no hablar de delincuencia, sino de ciberdelincuencia: los malos, cada vez más, realizan actividades ilícitas a través de la web, por diferentes motivos. De ahí la importancia de desarrollar módulos inteligentes que puedan resolver automáticamente problemas en herramientas y servicios que sean de utilidad a ciudadanos, empresas y FCSE.

—¿Cuáles son ahora los tipos más peligrosos de ciberdelincuencia?

—En la actualidad, Europol hace públicos a través de su web cuales son los tipos más peligrosos de ciberdelincuencia. https://www.europol.europa.eu/crime-areas-and-trends/crime-areas. Si el peligro se considera desde el punto de vista de rechazo social, quizás, una de las más destacadas es el intercambio de material de abuso sexual a menores (CSEM), uno de las áreas prioritarias de Europol entre los años 2018-2021. En esa área trabajamos con Incibe en el proyecto europeo Asasec y ahora también estamos colaborando con Incibe en el proyecto europeo, 4NSEEK, cuya finalidad es desarrollar una herramienta forense que ayude a las FCSE a combatir este tipo de delito.

—¿Qué supone que los cibercriminales operen en redes abiertas?

_Supone que pueden llegar fácilmente a cualquier ciudadano, principalmente para engañarles o estafarles de alguna manera o robar sus datos, ya sean personales o bancarios. La web se divide en dos partes, bien diferenciadas: Superficial y Profunda. El contenido de la Web Superficial está indexado, es decir, podemos llegar a él a través de un buscador web como Google. En cambio, el contenido de la web profunda no está indexado, no podemos acceder a él, como por ejemplo el contenido de nuestras cuentas de Dropbox o GDrive. Hay varios estudios que indican que la Web Superficial podría representar únicamente el 4% de los datos de la Web. No obstante, en la Web Superficial es donde se mueve la inmensa mayoría de la población diariamente, y es el tipo de uso que hace de la Web (buscadores, periódicos online, redes sociales, etc…), con lo que los cibercriminales tienen en la web superficial o redes abiertas un mayor número de potenciales víctimas.

—¿Qué es Pastebin y por qué es importante vuestra investigación?

—Básicamente es un servicio que se utiliza para compartir información. Nuestra investigación desvela que los criminales lo utilizan para compartir información entre ellos, quedando oculta esta actividad por el gran número de notas de texto normales que se comparten diariamente, y entre las que solo unas pocas, muy pocas, pueden tener contenido posiblemente delictivo. Nuestra investigación confirma que debería monitorizarse este contenido para limitar la actividad de los delincuentes. Los blocs de notas en línea son servicios diseñados para guardar notas de texto en la nube, las cuales son accesibles a través de un Localizador Uniforme de Recursos (URL). El texto puede ser de acceso público o protegido con una contraseña. Esta facilidad ha hecho que compartir texto, independientemente de la longitud, sea más conveniente incluso en redes sociales, como Twitter, que limitan las publicaciones a un número máximo de caracteres. Uno de los servicios de bloc de notas en línea (ONS) más populares es Pastebin (2002), que facilitar guardar y compartir fragmentos de código y archivos de configuración entre programadores. No obstante, se permite el uso de Pastebin con otros fines, a priori todos dentro de la legalidad.

—¿Estáis preparando ya una nueva investigación?

—Nuestro grupo tiene unas treinta líneas de investigación activas. La mayoría de ellas terminan en una solución a algún problema alguno de los cuales puede tener mayor interés para el público en general. Además de seguir trabajando en la lucha contra el abuso sexual de menores, utilizando para ello procesamiento de texto y de imagen, estamos trabajando en líneas relacionadas con la lucha contra el spam, el phishing e incluso en desarrollar métodos automáticos para detectar las fake news.

«Estudiamos métodos automáticos para detectar las 'fake news’»
Comentarios