Metaheurísticas en grandes volúmenes de datos combinados con streaming de datos en tiempo real
En los últimos años el procesamiento de corrientes (streams) de datos en tiempo real se ha incorporado definitivamente a los modelos de procesamiento Big Data existentes. Este tipo de procesamiento se da cuando uno o muchos emisores generan una corriente de datos en tiempo real de tal manera que si...
Guardado en:
| Autores principales: | , |
|---|---|
| Formato: | Objeto de conferencia Resumen |
| Lenguaje: | Español |
| Publicado: |
2019
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/89655 |
| Aporte de: |
| id |
I19-R120-10915-89655 |
|---|---|
| record_format |
dspace |
| institution |
Universidad Nacional de La Plata |
| institution_str |
I-19 |
| repository_str |
R-120 |
| collection |
SEDICI (UNLP) |
| language |
Español |
| topic |
Ciencias Informáticas Streaming Big data |
| spellingShingle |
Ciencias Informáticas Streaming Big data Di Pasquale, Ricardo Marenco, Javier Metaheurísticas en grandes volúmenes de datos combinados con streaming de datos en tiempo real |
| topic_facet |
Ciencias Informáticas Streaming Big data |
| description |
En los últimos años el procesamiento de corrientes (streams) de datos en tiempo real se ha incorporado definitivamente a los modelos de procesamiento Big Data existentes. Este tipo de procesamiento se da cuando uno o muchos emisores generan una corriente de datos en tiempo real de tal manera que si un receptor deja de “escuchar” un momento una de las corrientes de datos, la información que se omitió en esa ventana de tiempo se torna irrecuperable.
En este trabajo estamos interesados en estudiar las implicancias de incorporar el modelo Big Data de procesamiento de datos en metaheurísticas aplicadas a grandes volúmentes de datos estáticos.
Particularmente, se ha tomado una aplicación de descubrimiento de reglas en bases de datos (KDD) implementada mediante metaheurísticas distribuidas en plataforma Apache Spark. En dicha aplicación se busca descubrir reglas de asociación en una base de datos grande, por lo que la implementación distribuida se clasifica como un análisis de datos con estilo Big Data.
A la aplicación citada se le agrega la complejidad de procesar streamings de datos, que incorporan hechos a la base de datos de manera compatible con la información existente. Si, adicionalmente, la ponderación que se hace de la información más reciente (en tiempo real) es mayor a la valuación de la información histórica, se evidencia que la naturaleza del problema ha mutado. Muchas de las facilidades y pre-procesamientos posibles quedan invalidados por la incertidumbre generada por los datos a incorporarse.
Se presentarán los resultados obtenidos y las principales diferencias en los modelos de procesamiento. Se discutirá también si los problemas clásicos de optimización, o de data mining, o los que están en las fronteras pueden seguir siendo tratados de la misma manera al considerar el procesamiento de streaming en tiempo real, o si deben cambiarse los mecanismos de procesamiento de manera radical. |
| format |
Objeto de conferencia Resumen |
| author |
Di Pasquale, Ricardo Marenco, Javier |
| author_facet |
Di Pasquale, Ricardo Marenco, Javier |
| author_sort |
Di Pasquale, Ricardo |
| title |
Metaheurísticas en grandes volúmenes de datos combinados con streaming de datos en tiempo real |
| title_short |
Metaheurísticas en grandes volúmenes de datos combinados con streaming de datos en tiempo real |
| title_full |
Metaheurísticas en grandes volúmenes de datos combinados con streaming de datos en tiempo real |
| title_fullStr |
Metaheurísticas en grandes volúmenes de datos combinados con streaming de datos en tiempo real |
| title_full_unstemmed |
Metaheurísticas en grandes volúmenes de datos combinados con streaming de datos en tiempo real |
| title_sort |
metaheurísticas en grandes volúmenes de datos combinados con streaming de datos en tiempo real |
| publishDate |
2019 |
| url |
http://sedici.unlp.edu.ar/handle/10915/89655 |
| work_keys_str_mv |
AT dipasqualericardo metaheuristicasengrandesvolumenesdedatoscombinadosconstreamingdedatosentiemporeal AT marencojavier metaheuristicasengrandesvolumenesdedatoscombinadosconstreamingdedatosentiemporeal |
| bdutipo_str |
Repositorios |
| _version_ |
1764820490138943493 |