Generación automática de hipótesis vía razonamiento automatizado con aplicación a ciberseguridad

Esta tesis se enfoca en el estudio de sistemas para la generación automatizada de hipótesis contextualizadas en la detección de comportamiento malicioso en plataformas sociales. Como primer aporte de esta tesis, se presenta una aproximación inicial para un sistema como el mencionado anteriormente...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Paredes, José Nicolás
Otros Autores: Falappa, Marcelo Alejandro
Formato: tesis doctoral
Lenguaje:Español
Publicado: 2021
Materias:
Acceso en línea:https://repositoriodigital.uns.edu.ar/xmlui/handle/123456789/5672
Aporte de:
Descripción
Sumario:Esta tesis se enfoca en el estudio de sistemas para la generación automatizada de hipótesis contextualizadas en la detección de comportamiento malicioso en plataformas sociales. Como primer aporte de esta tesis, se presenta una aproximación inicial para un sistema como el mencionado anteriormente y se consideran dos enfoques ligeramente diferentes acotando la detección de comportamiento malicioso a un tipo de problema específi co bautizado como deduplicación adversarial. Para el primer enfoque, se pone mayor énfasis en la generación de hipótesis a partir de la utilización de reglas lógicas bien de finidas, aunque la esencia de su funcionamiento está apoyada en los resultados que puedan ser obtenidos de aplicar técnicas de aprendizaje automatizado con anterioridad. Luego para el segundo enfoque, se realiza mayor hincapié en la utilización de técnicas de aprendizaje automatizado, específi camente clasi ficadores, como estrategia para atacar el problema y la generación de hipótesis es llevada a cabo por reglas más simples que son activadas cuando el resultado de los clasifi cadores supera cierto umbral. Sin embargo, el objetivo general de esta tesis es avanzar hacia el desarrollo de sistemas más robustos que no se encuentran acotados a un solo problema de comportamiento malicioso en plataformas sociales, sino que considere la multiplicidad de los mismos y aproveche la relación que pueda haber entre ellos. Por esta razón, el principal aporte de esta tesis es la presentación de la arquitectura NetDER para razonar sobre comportamiento malicioso en plataformas sociales, la cual en principio, busca servir de guía para la implementación de software en dicho dominio. Asimismo, en esta misma dirección, otro aporte realizado es el estudio de los fundamentos teóricos involucrados en la implementación de una versión particular de NetDER. Más específicamente, la generación de hipótesis está apoyada en un proceso conocido como de respuesta a consultas, por lo cual fue necesario investigar su incidencia en este modelo, y a partir de dicho estudio se llega a un interesante conjunto de resultados que varían de la tratabilidad del tiempo polinomial a la indecidibilidad, dependiendo de las características que estén disponibles. Adicionalmente, se desarrolla un caso de uso para ilustrar cómo el enfoque puede ser aplicado en un dominio de ciberseguridad para razonar sobre productos en riesgo basados en publicaciones de foros de la Darknet. Finalmente, como último aporte se realiza una evaluación experimental de la arquitectura NetDER, considerando las cuestiones de diseño y fundamentos teóricos estudiados a lo largo de esta tesis. Asimismo, debido a la difi cultad de obtener datasets adecuados con ground truth, lo cual es necesario para llevar adelante evaluaciones de desempeño, fue necesario desarrollar un testbed general (dejando disponible públicamente su código) diseñado con el propósito de generar trazas completas de actividades de publicación involucrando potencialmente todo tipo de contenido malicioso como lo pueden ser noticias falsas, actores maliciosos, botnets, enlaces a malware, discursos de odio, etc. Los resultados obtenidos fueron satisfactorios, debido a que en general son estadísticamente signifi cativos y constituyen un paso importante para avanzar al logro del objetivo general que es disponer de sistemas robustos de generación automatizada de hipótesis que puedan utilizarse para resolver problemas de comportamiento malicioso en plataformas sociales.