Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos

Este trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el cont...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Spositto, Osvaldo Mario, Bossero, Julio, Quevedo, Sebastián, Ledesma, Viviana, Matteo, Lorena
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2024
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/176490
Aporte de:
id I19-R120-10915-176490
record_format dspace
spelling I19-R120-10915-1764902025-02-13T20:05:03Z http://sedici.unlp.edu.ar/handle/10915/176490 Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos Spositto, Osvaldo Mario Bossero, Julio Quevedo, Sebastián Ledesma, Viviana Matteo, Lorena 2024-10 2024 2025-02-13T17:36:55Z es Ciencias Informáticas Agrupamiento K-Means Inicialización Coeficiente de Silueta Este trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos. Red de Universidades con Carreras en Informática Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 570-580
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Agrupamiento
K-Means
Inicialización
Coeficiente de Silueta
spellingShingle Ciencias Informáticas
Agrupamiento
K-Means
Inicialización
Coeficiente de Silueta
Spositto, Osvaldo Mario
Bossero, Julio
Quevedo, Sebastián
Ledesma, Viviana
Matteo, Lorena
Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
topic_facet Ciencias Informáticas
Agrupamiento
K-Means
Inicialización
Coeficiente de Silueta
description Este trabajo presenta una evaluación exhaustiva de un método mejorado del algoritmo K-Means, aplicado a un sistema de recuperación de documentos. Los algoritmos de agrupamiento, o clustering, se utilizan para organizar documentos similares en grupos, basándose en características comunes como el contenido textual, la frecuencia de palabras y otros atributos relevantes. El método mejorado evaluado en este estudio introduce optimizaciones que reducen significativamente el tiempo de procesamiento necesario para asignar cada documento a un clúster. Esto se logra mediante una combinación de técnicas de preprocesamiento y ajustes en los criterios de convergencia del algoritmo, resultando en una menor cantidad de iteraciones y operaciones computacionales. Para evaluar el método mejorado, se llevaron a cabo una serie de experimentos utilizando un prototipo propio que construye artificialmente un conjunto de datos de documentos. En la fase de experimentación, se aplicaron tanto el algoritmo KMeans estándar como el método mejorado estudiado. La comparación se realizó en términos de tiempo de procesamiento, número de iteraciones y precisión en la agrupación de documentos. Para evaluar la calidad del agrupamiento, se empleó el coeficiente de silueta o silhouette como métrica. Los resultados mostraron que, además de reducir el tiempo de procesamiento, el método mejorado mantiene una calidad de agrupamiento equivalente a la obtenida con el K-Means clásico. Esto sugiere que las optimizaciones introducidas no comprometen la precisión del agrupamiento, sino que, por el contrario, ofrecen un rendimiento más eficiente sin sacrificar la efectividad en la clasificación de documentos.
format Objeto de conferencia
Objeto de conferencia
author Spositto, Osvaldo Mario
Bossero, Julio
Quevedo, Sebastián
Ledesma, Viviana
Matteo, Lorena
author_facet Spositto, Osvaldo Mario
Bossero, Julio
Quevedo, Sebastián
Ledesma, Viviana
Matteo, Lorena
author_sort Spositto, Osvaldo Mario
title Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title_short Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title_full Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title_fullStr Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title_full_unstemmed Evaluación de un Método Mejorado del Algoritmo K-Means Aplicado en un Sistema de Recuperación de Documentos
title_sort evaluación de un método mejorado del algoritmo k-means aplicado en un sistema de recuperación de documentos
publishDate 2024
url http://sedici.unlp.edu.ar/handle/10915/176490
work_keys_str_mv AT sposittoosvaldomario evaluaciondeunmetodomejoradodelalgoritmokmeansaplicadoenunsistemaderecuperaciondedocumentos
AT bosserojulio evaluaciondeunmetodomejoradodelalgoritmokmeansaplicadoenunsistemaderecuperaciondedocumentos
AT quevedosebastian evaluaciondeunmetodomejoradodelalgoritmokmeansaplicadoenunsistemaderecuperaciondedocumentos
AT ledesmaviviana evaluaciondeunmetodomejoradodelalgoritmokmeansaplicadoenunsistemaderecuperaciondedocumentos
AT matteolorena evaluaciondeunmetodomejoradodelalgoritmokmeansaplicadoenunsistemaderecuperaciondedocumentos
_version_ 1845116788820410368