Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina

En dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la t...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Prado, Patricia Elizabeth
Otros Autores: Hasperué, Waldo
Formato: Tesis Trabajo de especializacion
Lenguaje:Español
Publicado: 2022
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/145268
Aporte de:
id I19-R120-10915-145268
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Clustering
Spark
K-Means
Bisecting K-Means
Gaussian Mixture Model
spellingShingle Ciencias Informáticas
Clustering
Spark
K-Means
Bisecting K-Means
Gaussian Mixture Model
Prado, Patricia Elizabeth
Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
topic_facet Ciencias Informáticas
Clustering
Spark
K-Means
Bisecting K-Means
Gaussian Mixture Model
description En dominios donde el volumen de los datos crece exponencialmente y la enorme abundancia de estos desborda la capacidad humana para comprenderlos, existe una necesidad apremiante de desarrollar soluciones para aprovechar esta riqueza de datos utilizando métodos estadísticos. El agrupamiento es la tarea descriptiva por excelencia, consiste en obtener grupos naturales a partir de los datos para luego poder describirlos de manera concisa. Ya sea para la comprensión o el resumen, el análisis de agrupamiento ha desempeñado durante mucho tiempo un papel importante en una amplia variedad de campos como psicología, ciencias sociales, biología, estadísticas, reconocimiento de patrones y recuperación de información. El presente estudio pretende analizar diferentes técnicas de agrupamiento en el entorno distribuido Spark, que permitan describir de forma novedosa el seguimiento de casos de COVID-19 en Argentina a partir de la aplicación de modelos de agrupamiento adecuados para el desarrollo de aplicaciones de aprendizaje automático a gran escala.
author2 Hasperué, Waldo
author_facet Hasperué, Waldo
Prado, Patricia Elizabeth
format Tesis
Trabajo de especializacion
author Prado, Patricia Elizabeth
author_sort Prado, Patricia Elizabeth
title Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title_short Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title_full Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title_fullStr Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title_full_unstemmed Estudio de técnicas de agrupamiento en procesos de datos a gran escala : Su aplicación en la descripción de casos de COVID-19 registrados en la República Argentina
title_sort estudio de técnicas de agrupamiento en procesos de datos a gran escala : su aplicación en la descripción de casos de covid-19 registrados en la república argentina
publishDate 2022
url http://sedici.unlp.edu.ar/handle/10915/145268
work_keys_str_mv AT pradopatriciaelizabeth estudiodetecnicasdeagrupamientoenprocesosdedatosagranescalasuaplicacionenladescripciondecasosdecovid19registradosenlarepublicaargentina
bdutipo_str Repositorios
_version_ 1764820460376162305