SplitGen: algoritmo evolutivo para división de datos en conjuntos pequeños

La decisión comúnmente adoptada en escenarios con abundantes datos, es la división aleatoria de los mismos. Sin embargo, cuando los datos escasean, esta decisión puede no ser la más apropiada. Se introduce SplitGen que es un algoritmo evolutivo diseñado para optimizar la división del conjunto de dat...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Chiarvetto Peralta, Lucila, Brignole, Nélida Beatriz
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2024
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/178458
Aporte de:
id I19-R120-10915-178458
record_format dspace
spelling I19-R120-10915-1784582025-04-25T20:07:34Z http://sedici.unlp.edu.ar/handle/10915/178458 SplitGen: algoritmo evolutivo para división de datos en conjuntos pequeños Chiarvetto Peralta, Lucila Brignole, Nélida Beatriz 2024-08 2024 2025-04-25T13:27:24Z es Ciencias Informáticas Bases de datos pequeñas Algoritmos evolutivos Distancia de Mahalanobis Distancia de Wasserstein Algoritmos genéticos La decisión comúnmente adoptada en escenarios con abundantes datos, es la división aleatoria de los mismos. Sin embargo, cuando los datos escasean, esta decisión puede no ser la más apropiada. Se introduce SplitGen que es un algoritmo evolutivo diseñado para optimizar la división del conjunto de datos basado en un criterio de distancias. Su enfoque busca garantizar que los subconjuntos sean los más representativos posibles del conjunto original, mitigando el riesgo de introducir sesgos en la evaluación del modelo. La implementación se realizó en Python utilizando la librería DEAP. Se comparo su desempeño contra una búsqueda aleatoria, evaluando las soluciones mediante la pseudo distancia de Mahalanobis y la distancia de Wasserstein. Se observó un mejor desempeño del algoritmo gen ético, especialmente cuando el tamaño del conjunto de datos esta entre 1000 y 10000 observaciones, y en distribuciones uniformes comparadas con las normales, sugiriendo una mayor dificultad en presencia de curtosis y valores atípicos. Sociedad Argentina de Informática e Investigación Operativa Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 28-41
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Bases de datos pequeñas
Algoritmos evolutivos
Distancia de Mahalanobis
Distancia de Wasserstein
Algoritmos genéticos
spellingShingle Ciencias Informáticas
Bases de datos pequeñas
Algoritmos evolutivos
Distancia de Mahalanobis
Distancia de Wasserstein
Algoritmos genéticos
Chiarvetto Peralta, Lucila
Brignole, Nélida Beatriz
SplitGen: algoritmo evolutivo para división de datos en conjuntos pequeños
topic_facet Ciencias Informáticas
Bases de datos pequeñas
Algoritmos evolutivos
Distancia de Mahalanobis
Distancia de Wasserstein
Algoritmos genéticos
description La decisión comúnmente adoptada en escenarios con abundantes datos, es la división aleatoria de los mismos. Sin embargo, cuando los datos escasean, esta decisión puede no ser la más apropiada. Se introduce SplitGen que es un algoritmo evolutivo diseñado para optimizar la división del conjunto de datos basado en un criterio de distancias. Su enfoque busca garantizar que los subconjuntos sean los más representativos posibles del conjunto original, mitigando el riesgo de introducir sesgos en la evaluación del modelo. La implementación se realizó en Python utilizando la librería DEAP. Se comparo su desempeño contra una búsqueda aleatoria, evaluando las soluciones mediante la pseudo distancia de Mahalanobis y la distancia de Wasserstein. Se observó un mejor desempeño del algoritmo gen ético, especialmente cuando el tamaño del conjunto de datos esta entre 1000 y 10000 observaciones, y en distribuciones uniformes comparadas con las normales, sugiriendo una mayor dificultad en presencia de curtosis y valores atípicos.
format Objeto de conferencia
Objeto de conferencia
author Chiarvetto Peralta, Lucila
Brignole, Nélida Beatriz
author_facet Chiarvetto Peralta, Lucila
Brignole, Nélida Beatriz
author_sort Chiarvetto Peralta, Lucila
title SplitGen: algoritmo evolutivo para división de datos en conjuntos pequeños
title_short SplitGen: algoritmo evolutivo para división de datos en conjuntos pequeños
title_full SplitGen: algoritmo evolutivo para división de datos en conjuntos pequeños
title_fullStr SplitGen: algoritmo evolutivo para división de datos en conjuntos pequeños
title_full_unstemmed SplitGen: algoritmo evolutivo para división de datos en conjuntos pequeños
title_sort splitgen: algoritmo evolutivo para división de datos en conjuntos pequeños
publishDate 2024
url http://sedici.unlp.edu.ar/handle/10915/178458
work_keys_str_mv AT chiarvettoperaltalucila splitgenalgoritmoevolutivoparadivisiondedatosenconjuntospequenos
AT brignolenelidabeatriz splitgenalgoritmoevolutivoparadivisiondedatosenconjuntospequenos
_version_ 1847925369772965888