Procesamiento de flujo de datos : Un caso de estudio: análisis en tiempo real usando datos geolocalizados

La sociedad hoy plantea crecientes demandas de soluciones informáticas, cuando estas soluciones requieren el procesamiento de grandes volúmenes de datos, las herramientas tradicionales de procesamiento muestran limitaciones e inconvenientes derivados de la cantidad de datos a procesar o del tiempo n...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Fajardo, Hugo Manuel, Hasperué, Waldo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2022
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/149428
Aporte de:
id I19-R120-10915-149428
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
data streaming
Stream processing
Apache Spark
Apache Flink
coronavirus
Covid19
spellingShingle Ciencias Informáticas
data streaming
Stream processing
Apache Spark
Apache Flink
coronavirus
Covid19
Fajardo, Hugo Manuel
Hasperué, Waldo
Procesamiento de flujo de datos : Un caso de estudio: análisis en tiempo real usando datos geolocalizados
topic_facet Ciencias Informáticas
data streaming
Stream processing
Apache Spark
Apache Flink
coronavirus
Covid19
description La sociedad hoy plantea crecientes demandas de soluciones informáticas, cuando estas soluciones requieren el procesamiento de grandes volúmenes de datos, las herramientas tradicionales de procesamiento muestran limitaciones e inconvenientes derivados de la cantidad de datos a procesar o del tiempo necesario para realizarlo. Surge así, la necesidad de herramientas específicas, llamadas herramientas de Big Data. Dentro de estas existe un grupo concreto para el procesamiento de flujos de datos (stream processing), entendiendo por flujo de datos la recepción y procesamiento continuo de datos ilimitados desde diferentes fuentes. Debido a su naturaleza sin límite, estos flujos no pueden descargarse de manera completa, y deben ser procesados en línea a cuando se reciben. Dos de las principales herramientas para el procesamiento de flujos de datos son Apache Spark y Apache Flink, estas herramientas serán el objeto de estudio del presente trabajo. El caso de estudio a desarrollar tiene por finalidad comparar distintos aspectos de ambas herramientas. Como caso de estudio se propone obtener publicaciones que incluyan las expresiones coronavirus y/o covid (SARSCoV- 2), y agrupar las mismas de acuerdo a su geolocalización, ya que esto permitirá monitorear la evolución de la enfermedad de acuerdo a la localización de los usuarios y su participación en distintos lugares de la web (redes sociales, comentarios en publicaciones, etc.).
format Objeto de conferencia
Objeto de conferencia
author Fajardo, Hugo Manuel
Hasperué, Waldo
author_facet Fajardo, Hugo Manuel
Hasperué, Waldo
author_sort Fajardo, Hugo Manuel
title Procesamiento de flujo de datos : Un caso de estudio: análisis en tiempo real usando datos geolocalizados
title_short Procesamiento de flujo de datos : Un caso de estudio: análisis en tiempo real usando datos geolocalizados
title_full Procesamiento de flujo de datos : Un caso de estudio: análisis en tiempo real usando datos geolocalizados
title_fullStr Procesamiento de flujo de datos : Un caso de estudio: análisis en tiempo real usando datos geolocalizados
title_full_unstemmed Procesamiento de flujo de datos : Un caso de estudio: análisis en tiempo real usando datos geolocalizados
title_sort procesamiento de flujo de datos : un caso de estudio: análisis en tiempo real usando datos geolocalizados
publishDate 2022
url http://sedici.unlp.edu.ar/handle/10915/149428
work_keys_str_mv AT fajardohugomanuel procesamientodeflujodedatosuncasodeestudioanalisisentiemporealusandodatosgeolocalizados
AT hasperuewaldo procesamientodeflujodedatosuncasodeestudioanalisisentiemporealusandodatosgeolocalizados
bdutipo_str Repositorios
_version_ 1764820462779498498