SMOTE, algoritmo para balanceo de clases en un estudio aplicado a la ganadería

En el estudio de los algoritmos de Minería de Datos del tipo supervisados surge el problema del desbalance de clases, que implica que la información no se encuentre distribuida equitativamente entre todas las clases que la componen, por lo que se generan efectos no deseados en el proceso de clasific...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Spositto, Osvaldo Mario, Blanco, Gabriel Esteban, Matteo, Lorena, Levi, Marcelo, Bossero, Julio
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2020
Materias:
DEP
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/114339
Aporte de:
Descripción
Sumario:En el estudio de los algoritmos de Minería de Datos del tipo supervisados surge el problema del desbalance de clases, que implica que la información no se encuentre distribuida equitativamente entre todas las clases que la componen, por lo que se generan efectos no deseados en el proceso de clasificación. Este trabajo considera el caso de conjuntos de datos que solamente tiene dos clases y una de ellas cuenta con una mayor cantidad de ejemplos que la otra. El interés principal del trabajo es la aplicación de la técnica de balanceo de clases SMOTE (Synthetic Minority Oversampling Technique), que con algoritmos de interpolación incrementa en forma “sintética” los ejemplos de la clase minoritaria. Los resultados experimentales muestran que algunas técnicas, en el proceso de entrenamiento, obtienen mejores porcentajes de clasificación, cuando se usan estos datos artificiales. El dataset utilizado registra la Diferencia Esperada entre Progenie de animales de la raza Aberdeen Angus.