Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador

El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Apli...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Srpositto, Osvaldo Mario, Bossero, Julio, Ledesma, Viviana, Matteo, Lorena, Quevedo, Sebastián
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2024
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/176252
Aporte de:
id I19-R120-10915-176252
record_format dspace
spelling I19-R120-10915-1762522025-02-07T20:05:22Z http://sedici.unlp.edu.ar/handle/10915/176252 Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador Srpositto, Osvaldo Mario Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián 2024-04 2024 2025-02-07T13:06:30Z es Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba. Red de Universidades con Carreras en Informática Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 169-174
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Agrupación
Coeficiente Silhouette
Centroides
spellingShingle Ciencias Informáticas
Agrupación
Coeficiente Silhouette
Centroides
Srpositto, Osvaldo Mario
Bossero, Julio
Ledesma, Viviana
Matteo, Lorena
Quevedo, Sebastián
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
topic_facet Ciencias Informáticas
Agrupación
Coeficiente Silhouette
Centroides
description El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba.
format Objeto de conferencia
Objeto de conferencia
author Srpositto, Osvaldo Mario
Bossero, Julio
Ledesma, Viviana
Matteo, Lorena
Quevedo, Sebastián
author_facet Srpositto, Osvaldo Mario
Bossero, Julio
Ledesma, Viviana
Matteo, Lorena
Quevedo, Sebastián
author_sort Srpositto, Osvaldo Mario
title Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title_short Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title_full Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title_fullStr Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title_full_unstemmed Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
title_sort evaluación del algoritmo k-means en la asignación de centroides: desarrollo de un prototipo simulador
publishDate 2024
url http://sedici.unlp.edu.ar/handle/10915/176252
work_keys_str_mv AT srposittoosvaldomario evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador
AT bosserojulio evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador
AT ledesmaviviana evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador
AT matteolorena evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador
AT quevedosebastian evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador
_version_ 1845116774548242432