D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark

En este trabajo se presenta una prueba de concepto de un algoritmo de clustering basado en densidad, denominado D3CAS, el cual fue implementado para ser ejecutado bajo el framework Spark Streaming y que permite el procesamiento de flujos de datos. La principal característica del algoritmo presentado...

Descripción completa

Detalles Bibliográficos
Autores principales: Molina, Roberto, Hasperué, Waldo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2018
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/73223
Aporte de:
id I19-R120-10915-73223
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
clustering
spark
streaming processing
spellingShingle Ciencias Informáticas
clustering
spark
streaming processing
Molina, Roberto
Hasperué, Waldo
D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark
topic_facet Ciencias Informáticas
clustering
spark
streaming processing
description En este trabajo se presenta una prueba de concepto de un algoritmo de clustering basado en densidad, denominado D3CAS, el cual fue implementado para ser ejecutado bajo el framework Spark Streaming y que permite el procesamiento de flujos de datos. La principal característica del algoritmo presentado es que es dinámico, es decir selecciona automáticamente el número de clusters del flujo de datos. El algoritmo fue probado datasets de CLUTO, midiendo la calidad de los clusters obtenidos. Los resultados, obtenidos en un ambiente virtualizado, fueron comparados con otro algoritmo de clustering (CluStream), demostrando que D3CAS arroja mejores resultados.
format Objeto de conferencia
Objeto de conferencia
author Molina, Roberto
Hasperué, Waldo
author_facet Molina, Roberto
Hasperué, Waldo
author_sort Molina, Roberto
title D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark
title_short D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark
title_full D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark
title_fullStr D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark
title_full_unstemmed D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark
title_sort d3cas: un algoritmo de clustering para el procesamiento de flujos de datos en spark
publishDate 2018
url http://sedici.unlp.edu.ar/handle/10915/73223
work_keys_str_mv AT molinaroberto d3casunalgoritmodeclusteringparaelprocesamientodeflujosdedatosenspark
AT hasperuewaldo d3casunalgoritmodeclusteringparaelprocesamientodeflujosdedatosenspark
bdutipo_str Repositorios
_version_ 1764820483723755524