Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador
El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Apli...
Guardado en:
| Autores principales: | , , , , |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2024
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/176252 |
| Aporte de: |
| id |
I19-R120-10915-176252 |
|---|---|
| record_format |
dspace |
| spelling |
I19-R120-10915-1762522025-02-07T20:05:22Z http://sedici.unlp.edu.ar/handle/10915/176252 Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador Srpositto, Osvaldo Mario Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián 2024-04 2024 2025-02-07T13:06:30Z es Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba. Red de Universidades con Carreras en Informática Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 169-174 |
| institution |
Universidad Nacional de La Plata |
| institution_str |
I-19 |
| repository_str |
R-120 |
| collection |
SEDICI (UNLP) |
| language |
Español |
| topic |
Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides |
| spellingShingle |
Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides Srpositto, Osvaldo Mario Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
| topic_facet |
Ciencias Informáticas Agrupación Coeficiente Silhouette Centroides |
| description |
El presente trabajo de investigación se centra en un estudio comparativo de la calidad del agrupamiento obtenido por el algoritmo K-Means respecto a una extensión de este mismo, conocido como K-Means++. El trabajo se basa en la resolución del problema que implica segmentar un corpus voluminoso. Aplicar este método ayuda a agrupar documentos similares en conjuntos, o clústers, para facilitar la organización y exploración eficiente de los mismos. Para poder comparar los algoritmos, se desarrolló un prototipo simulador en lenguaje C# que, configurando diferentes parámetros, genera un modelo vectorial. Este modelo se basa en matrices que representan la relación entre términos y documentos, donde cada posición de la matriz (i, j), representa el valor de la frecuencia con la que el término j aparece en el documento i. La evaluación de la comparativa entre los métodos se realizó empleado la métrica del “coeficiente de silueta” (Silhouette) y los resultados indican que ambos algoritmos tienen coeficientes positivos, lo que indica una correcta agrupación de los objetos. El método K-Means++ obtuvo un mejor coeficiente para este lote de prueba. |
| format |
Objeto de conferencia Objeto de conferencia |
| author |
Srpositto, Osvaldo Mario Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián |
| author_facet |
Srpositto, Osvaldo Mario Bossero, Julio Ledesma, Viviana Matteo, Lorena Quevedo, Sebastián |
| author_sort |
Srpositto, Osvaldo Mario |
| title |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
| title_short |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
| title_full |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
| title_fullStr |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
| title_full_unstemmed |
Evaluación del algoritmo K-Means en la asignación de centroides: desarrollo de un prototipo simulador |
| title_sort |
evaluación del algoritmo k-means en la asignación de centroides: desarrollo de un prototipo simulador |
| publishDate |
2024 |
| url |
http://sedici.unlp.edu.ar/handle/10915/176252 |
| work_keys_str_mv |
AT srposittoosvaldomario evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador AT bosserojulio evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador AT ledesmaviviana evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador AT matteolorena evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador AT quevedosebastian evaluaciondelalgoritmokmeansenlaasignaciondecentroidesdesarrollodeunprototiposimulador |
| _version_ |
1845116774548242432 |