Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada

"Este trabajo aborda el problema del desbalanceo de clases en conjuntos de datos, un desafío crítico en el ámbito del aprendizaje automático que afecta de manera significativa la precisión de los modelos predictivos. El desequilibrio de clases se produce cuando algunas categorías se encuentran...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Leiva, Juan Manuel
Formato: Tesis de maestría
Lenguaje:Español
Publicado: Instituto Tecnológico de Buenos Aires (ITBA) 2025
Materias:
Acceso en línea:https://hdl.handle.net/20.500.14769/5216
Aporte de:
id I32-R138-20.500.14769-5216
record_format dspace
spelling I32-R138-20.500.14769-52162026-01-07T14:06:17Z Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada Leiva, Juan Manuel MUESTREO, SUBMUESTREO, SOBREMUESTREO, MÉTODOS DE ENSAMBLE, APRENDIZAJE DESBALANCEADO, DATASET DESBALANCEADO, MÉTRICA DE EVALUACIÓN, CLASIFICACIÓN DE DATOS "Este trabajo aborda el problema del desbalanceo de clases en conjuntos de datos, un desafío crítico en el ámbito del aprendizaje automático que afecta de manera significativa la precisión de los modelos predictivos. El desequilibrio de clases se produce cuando algunas categorías se encuentran subrepresentadas en comparación con otras que dominan el conjunto de datos, lo que introduce un sesgo distributivo a favor de las clases mayoritarias. Para abordar esta problemática, se han desarrollado numerosos métodos de preprocesamiento de datos, los cuales modifican el conjunto de datos original mediante técnicas de sobremuestreo (oversampling), submuestreo (undersampling) o una combinación de ambas. Asimismo, se emplean métodos de ensamble, que integran múltiples estimadores débiles con el objetivo de construir modelos predictivos más robustos. No obstante, si bien estas técnicas presentan beneficios, su efectividad depende en gran medida del contexto y de las características específicas de los datos. El objetivo de este estudio es comparar una amplia variedad de métodos de balanceo, incluyendo técnicas de oversampling, undersampling, combinaciones de ambas y métodos de ensamble, mediante experimentos realizados sobre diversos conjuntos de datos que difieren en tamaño y grado de desbalance entre clases. El análisis se centra en identificar aquellos métodos que logran mejorar las métricas de evaluación en tareas de clasificación binaria supervisada". 2025-12-17T20:03:25Z 2025-12-17T20:03:25Z 2025-11-19 Tesis de maestría https://hdl.handle.net/20.500.14769/5216 es application/pdf Instituto Tecnológico de Buenos Aires (ITBA)
institution Instituto Tecnológico de Buenos Aires (ITBA)
institution_str I-32
repository_str R-138
collection Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA)
language Español
topic MUESTREO, SUBMUESTREO, SOBREMUESTREO, MÉTODOS DE ENSAMBLE, APRENDIZAJE DESBALANCEADO, DATASET DESBALANCEADO, MÉTRICA DE EVALUACIÓN, CLASIFICACIÓN DE DATOS
spellingShingle MUESTREO, SUBMUESTREO, SOBREMUESTREO, MÉTODOS DE ENSAMBLE, APRENDIZAJE DESBALANCEADO, DATASET DESBALANCEADO, MÉTRICA DE EVALUACIÓN, CLASIFICACIÓN DE DATOS
Leiva, Juan Manuel
Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada
topic_facet MUESTREO, SUBMUESTREO, SOBREMUESTREO, MÉTODOS DE ENSAMBLE, APRENDIZAJE DESBALANCEADO, DATASET DESBALANCEADO, MÉTRICA DE EVALUACIÓN, CLASIFICACIÓN DE DATOS
description "Este trabajo aborda el problema del desbalanceo de clases en conjuntos de datos, un desafío crítico en el ámbito del aprendizaje automático que afecta de manera significativa la precisión de los modelos predictivos. El desequilibrio de clases se produce cuando algunas categorías se encuentran subrepresentadas en comparación con otras que dominan el conjunto de datos, lo que introduce un sesgo distributivo a favor de las clases mayoritarias. Para abordar esta problemática, se han desarrollado numerosos métodos de preprocesamiento de datos, los cuales modifican el conjunto de datos original mediante técnicas de sobremuestreo (oversampling), submuestreo (undersampling) o una combinación de ambas. Asimismo, se emplean métodos de ensamble, que integran múltiples estimadores débiles con el objetivo de construir modelos predictivos más robustos. No obstante, si bien estas técnicas presentan beneficios, su efectividad depende en gran medida del contexto y de las características específicas de los datos. El objetivo de este estudio es comparar una amplia variedad de métodos de balanceo, incluyendo técnicas de oversampling, undersampling, combinaciones de ambas y métodos de ensamble, mediante experimentos realizados sobre diversos conjuntos de datos que difieren en tamaño y grado de desbalance entre clases. El análisis se centra en identificar aquellos métodos que logran mejorar las métricas de evaluación en tareas de clasificación binaria supervisada".
format Tesis de maestría
author Leiva, Juan Manuel
author_facet Leiva, Juan Manuel
author_sort Leiva, Juan Manuel
title Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada
title_short Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada
title_full Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada
title_fullStr Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada
title_full_unstemmed Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada
title_sort impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada
publisher Instituto Tecnológico de Buenos Aires (ITBA)
publishDate 2025
url https://hdl.handle.net/20.500.14769/5216
work_keys_str_mv AT leivajuanmanuel impactodelastecnicasparamanejodeldesbalancedeclasesenlaclasificacionbinariasupervisada
_version_ 1854267362598977536