Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada
"Este trabajo aborda el problema del desbalanceo de clases en conjuntos de datos, un desafío crítico en el ámbito del aprendizaje automático que afecta de manera significativa la precisión de los modelos predictivos. El desequilibrio de clases se produce cuando algunas categorías se encuentran...
Guardado en:
| Autor principal: | |
|---|---|
| Formato: | Tesis de maestría |
| Lenguaje: | Español |
| Publicado: |
Instituto Tecnológico de Buenos Aires (ITBA)
2025
|
| Materias: | |
| Acceso en línea: | https://hdl.handle.net/20.500.14769/5216 |
| Aporte de: |
| id |
I32-R138-20.500.14769-5216 |
|---|---|
| record_format |
dspace |
| spelling |
I32-R138-20.500.14769-52162026-01-07T14:06:17Z Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada Leiva, Juan Manuel MUESTREO, SUBMUESTREO, SOBREMUESTREO, MÉTODOS DE ENSAMBLE, APRENDIZAJE DESBALANCEADO, DATASET DESBALANCEADO, MÉTRICA DE EVALUACIÓN, CLASIFICACIÓN DE DATOS "Este trabajo aborda el problema del desbalanceo de clases en conjuntos de datos, un desafío crítico en el ámbito del aprendizaje automático que afecta de manera significativa la precisión de los modelos predictivos. El desequilibrio de clases se produce cuando algunas categorías se encuentran subrepresentadas en comparación con otras que dominan el conjunto de datos, lo que introduce un sesgo distributivo a favor de las clases mayoritarias. Para abordar esta problemática, se han desarrollado numerosos métodos de preprocesamiento de datos, los cuales modifican el conjunto de datos original mediante técnicas de sobremuestreo (oversampling), submuestreo (undersampling) o una combinación de ambas. Asimismo, se emplean métodos de ensamble, que integran múltiples estimadores débiles con el objetivo de construir modelos predictivos más robustos. No obstante, si bien estas técnicas presentan beneficios, su efectividad depende en gran medida del contexto y de las características específicas de los datos. El objetivo de este estudio es comparar una amplia variedad de métodos de balanceo, incluyendo técnicas de oversampling, undersampling, combinaciones de ambas y métodos de ensamble, mediante experimentos realizados sobre diversos conjuntos de datos que difieren en tamaño y grado de desbalance entre clases. El análisis se centra en identificar aquellos métodos que logran mejorar las métricas de evaluación en tareas de clasificación binaria supervisada". 2025-12-17T20:03:25Z 2025-12-17T20:03:25Z 2025-11-19 Tesis de maestría https://hdl.handle.net/20.500.14769/5216 es application/pdf Instituto Tecnológico de Buenos Aires (ITBA) |
| institution |
Instituto Tecnológico de Buenos Aires (ITBA) |
| institution_str |
I-32 |
| repository_str |
R-138 |
| collection |
Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA) |
| language |
Español |
| topic |
MUESTREO, SUBMUESTREO, SOBREMUESTREO, MÉTODOS DE ENSAMBLE, APRENDIZAJE DESBALANCEADO, DATASET DESBALANCEADO, MÉTRICA DE EVALUACIÓN, CLASIFICACIÓN DE DATOS |
| spellingShingle |
MUESTREO, SUBMUESTREO, SOBREMUESTREO, MÉTODOS DE ENSAMBLE, APRENDIZAJE DESBALANCEADO, DATASET DESBALANCEADO, MÉTRICA DE EVALUACIÓN, CLASIFICACIÓN DE DATOS Leiva, Juan Manuel Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada |
| topic_facet |
MUESTREO, SUBMUESTREO, SOBREMUESTREO, MÉTODOS DE ENSAMBLE, APRENDIZAJE DESBALANCEADO, DATASET DESBALANCEADO, MÉTRICA DE EVALUACIÓN, CLASIFICACIÓN DE DATOS |
| description |
"Este trabajo aborda el problema del desbalanceo de clases en conjuntos de datos, un desafío crítico en el ámbito del aprendizaje automático que afecta de manera significativa la precisión de los modelos predictivos. El desequilibrio de clases se produce cuando algunas categorías se encuentran subrepresentadas en comparación con otras que dominan el conjunto de datos, lo que introduce un sesgo distributivo a favor de las clases mayoritarias.
Para abordar esta problemática, se han desarrollado numerosos métodos de preprocesamiento de datos, los cuales modifican el conjunto de datos original mediante técnicas de sobremuestreo (oversampling), submuestreo (undersampling) o una combinación de ambas. Asimismo, se emplean métodos de ensamble, que integran múltiples estimadores débiles con el objetivo de construir modelos predictivos más robustos. No obstante, si bien estas técnicas presentan beneficios, su efectividad depende en gran medida del contexto y de las características específicas de los datos.
El objetivo de este estudio es comparar una amplia variedad de métodos de balanceo, incluyendo técnicas de oversampling, undersampling, combinaciones de ambas y métodos de ensamble, mediante experimentos realizados sobre diversos conjuntos de datos que difieren en tamaño y grado de desbalance entre clases. El análisis se centra en identificar aquellos métodos que logran mejorar las métricas de evaluación en tareas de clasificación binaria supervisada". |
| format |
Tesis de maestría |
| author |
Leiva, Juan Manuel |
| author_facet |
Leiva, Juan Manuel |
| author_sort |
Leiva, Juan Manuel |
| title |
Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada |
| title_short |
Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada |
| title_full |
Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada |
| title_fullStr |
Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada |
| title_full_unstemmed |
Impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada |
| title_sort |
impacto de las técnicas para manejo del desbalance de clases en la clasificación binaria supervisada |
| publisher |
Instituto Tecnológico de Buenos Aires (ITBA) |
| publishDate |
2025 |
| url |
https://hdl.handle.net/20.500.14769/5216 |
| work_keys_str_mv |
AT leivajuanmanuel impactodelastecnicasparamanejodeldesbalancedeclasesenlaclasificacionbinariasupervisada |
| _version_ |
1854267362598977536 |