Clasificación de datos desbalanceados : Su aplicación en la predicción de bajas de beneficiarios de un servicio de salud privado

El problema de las distribuciones de datos no balanceados entre clases ha recibido una atención considerable en disciplinas como el Aprendizaje Automático y Minería de Datos. En el contexto de problemas de clasificación un conjunto de datos no está balanceado si una de las clases -mayoritaria- está...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Martinelli, Jonatan Emanuel
Otros Autores: Hasperué, Waldo
Formato: Tesis Trabajo de especializacion
Lenguaje:Español
Publicado: 2022
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/147410
Aporte de:
Descripción
Sumario:El problema de las distribuciones de datos no balanceados entre clases ha recibido una atención considerable en disciplinas como el Aprendizaje Automático y Minería de Datos. En el contexto de problemas de clasificación un conjunto de datos no está balanceado si una de las clases -mayoritaria- está sensiblemente más representada que el resto. Por tanto, se puede conducir a aprendizajes sesgados en perjuicio de la clase minoritaria, que usualmente, contiene los casos de mayor interés. Por ello, este trabajo pretende estudiar diversas estrategias de balanceo de clases las cuales se aplicarán a la baja de beneficiarios de un servicio de cobertura médica. Cada estrategia dará lugar a diferentes versiones del conjunto de datos original para la misma representación; luego, para cada variante del set de datos, se aplicarán las mismas técnicas predictivas. De esta forma se obtendrán diversos modelos y se analizarán sus rendimientos mediante las métricas precision, recall, accuracy y F-Measure.