D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark
En este trabajo se presenta una prueba de concepto de un algoritmo de clustering basado en densidad, denominado D3CAS, el cual fue implementado para ser ejecutado bajo el framework Spark Streaming y que permite el procesamiento de flujos de datos. La principal característica del algoritmo presentado...
Autores principales: | , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2018
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/73223 |
Aporte de: |
id |
I19-R120-10915-73223 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas clustering spark streaming processing |
spellingShingle |
Ciencias Informáticas clustering spark streaming processing Molina, Roberto Hasperué, Waldo D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark |
topic_facet |
Ciencias Informáticas clustering spark streaming processing |
description |
En este trabajo se presenta una prueba de concepto de un algoritmo de clustering basado en densidad, denominado D3CAS, el cual fue implementado para ser ejecutado bajo el framework Spark Streaming y que permite el procesamiento de flujos de datos. La principal característica del algoritmo presentado es que es dinámico, es decir selecciona automáticamente el número de clusters del flujo de datos. El algoritmo fue probado datasets de CLUTO, midiendo la calidad de los clusters obtenidos. Los resultados, obtenidos en un ambiente virtualizado, fueron comparados con otro algoritmo de clustering (CluStream), demostrando que D3CAS arroja mejores resultados. |
format |
Objeto de conferencia Objeto de conferencia |
author |
Molina, Roberto Hasperué, Waldo |
author_facet |
Molina, Roberto Hasperué, Waldo |
author_sort |
Molina, Roberto |
title |
D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark |
title_short |
D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark |
title_full |
D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark |
title_fullStr |
D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark |
title_full_unstemmed |
D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark |
title_sort |
d3cas: un algoritmo de clustering para el procesamiento de flujos de datos en spark |
publishDate |
2018 |
url |
http://sedici.unlp.edu.ar/handle/10915/73223 |
work_keys_str_mv |
AT molinaroberto d3casunalgoritmodeclusteringparaelprocesamientodeflujosdedatosenspark AT hasperuewaldo d3casunalgoritmodeclusteringparaelprocesamientodeflujosdedatosenspark |
bdutipo_str |
Repositorios |
_version_ |
1764820483723755524 |