Aprendizaje automático para la detección de bots en repositorios digitales

La detección de bots es un desafío crítico para los repositorios digitales académicos como SEDICI, con implicaciones para la seguridad cibernética, el análisis de tráfico y las estadísticas de acceso y uso. Este estudio aborda la escasez de datos públicos y la necesidad de métodos eficaces para dis...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Bértoli, Rafael, Estrebou, César Armando, Lira, Ariel Jorge
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2024
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/176999
Aporte de:
id I19-R120-10915-176999
record_format dspace
spelling I19-R120-10915-1769992025-02-27T20:03:57Z http://sedici.unlp.edu.ar/handle/10915/176999 Aprendizaje automático para la detección de bots en repositorios digitales Bértoli, Rafael Estrebou, César Armando Lira, Ariel Jorge 2024-10 2024 2025-02-27T14:17:30Z es Ciencias Informáticas Bots Aprendizaje automático Repositorios La detección de bots es un desafío crítico para los repositorios digitales académicos como SEDICI, con implicaciones para la seguridad cibernética, el análisis de tráfico y las estadísticas de acceso y uso. Este estudio aborda la escasez de datos públicos y la necesidad de métodos eficaces para distinguir entre accesos humanos y automatizados en entornos web. Presentamos un nuevo dataset de logs web derivado de SEDICI y evaluamos diversos algoritmos de aprendizaje automático para la clasificación de accesos. Nuestro análisis comparativo abarca desde métodos clásicos como Regresión Logística hasta técnicas avanzadas de ensemble como XGBoost y Random Forest. Los resultados muestran un rendimiento sobresaliente de los modelos basados en árboles con una efectividad superior al 97%. Además, discutimos las implicaciones prácticas de implementar estos modelos en SEDICI para mejorar la precisión de las estadísticas de acceso y proporcionamos una base para futuras investigaciones en la detección de bots en repositorios digitales. Red de Universidades con Carreras en Informática Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 12-23
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Bots
Aprendizaje automático
Repositorios
spellingShingle Ciencias Informáticas
Bots
Aprendizaje automático
Repositorios
Bértoli, Rafael
Estrebou, César Armando
Lira, Ariel Jorge
Aprendizaje automático para la detección de bots en repositorios digitales
topic_facet Ciencias Informáticas
Bots
Aprendizaje automático
Repositorios
description La detección de bots es un desafío crítico para los repositorios digitales académicos como SEDICI, con implicaciones para la seguridad cibernética, el análisis de tráfico y las estadísticas de acceso y uso. Este estudio aborda la escasez de datos públicos y la necesidad de métodos eficaces para distinguir entre accesos humanos y automatizados en entornos web. Presentamos un nuevo dataset de logs web derivado de SEDICI y evaluamos diversos algoritmos de aprendizaje automático para la clasificación de accesos. Nuestro análisis comparativo abarca desde métodos clásicos como Regresión Logística hasta técnicas avanzadas de ensemble como XGBoost y Random Forest. Los resultados muestran un rendimiento sobresaliente de los modelos basados en árboles con una efectividad superior al 97%. Además, discutimos las implicaciones prácticas de implementar estos modelos en SEDICI para mejorar la precisión de las estadísticas de acceso y proporcionamos una base para futuras investigaciones en la detección de bots en repositorios digitales.
format Objeto de conferencia
Objeto de conferencia
author Bértoli, Rafael
Estrebou, César Armando
Lira, Ariel Jorge
author_facet Bértoli, Rafael
Estrebou, César Armando
Lira, Ariel Jorge
author_sort Bértoli, Rafael
title Aprendizaje automático para la detección de bots en repositorios digitales
title_short Aprendizaje automático para la detección de bots en repositorios digitales
title_full Aprendizaje automático para la detección de bots en repositorios digitales
title_fullStr Aprendizaje automático para la detección de bots en repositorios digitales
title_full_unstemmed Aprendizaje automático para la detección de bots en repositorios digitales
title_sort aprendizaje automático para la detección de bots en repositorios digitales
publishDate 2024
url http://sedici.unlp.edu.ar/handle/10915/176999
work_keys_str_mv AT bertolirafael aprendizajeautomaticoparaladetecciondebotsenrepositoriosdigitales
AT estreboucesararmando aprendizajeautomaticoparaladetecciondebotsenrepositoriosdigitales
AT liraarieljorge aprendizajeautomaticoparaladetecciondebotsenrepositoriosdigitales
_version_ 1845116797012934656