Data cleansing en entornos big data: mapeo sistemático de la literatura

La tecnología Big Data tiene por objetivo la gestión de grandes volúmenes de datos e información de manera inteligente que ayude a una correcta toma de decisión. Las etapas del trabajo en Big Data incluyen muchas decisiones que deben ser tomadas por el usuario, para garantizar el éxito del objetivo...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Caffetti, Yanina A., Eckert, Karina, Ruidías, Héctor J., Vera Laceiras, María Silvia
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2022
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/149406
Aporte de:
Descripción
Sumario:La tecnología Big Data tiene por objetivo la gestión de grandes volúmenes de datos e información de manera inteligente que ayude a una correcta toma de decisión. Las etapas del trabajo en Big Data incluyen muchas decisiones que deben ser tomadas por el usuario, para garantizar el éxito del objetivo propuesto, entre ellas la limpieza y pre-procesamiento de datos. El presente artículo es un Mapeo Sistemático de la Literatura, que busca identificar las metodologías, técnicas o herramientas utilizadas para el tratamiento de datos basura (dirty data) o limpieza de datos (data cleansing), en entornos Big Data. Existe, en la literatura actual, cierta escasez de publicaciones específicas, aun siendo un tema de suma relevancia para el éxito de este tipo de proyectos, donde se requiere procesamientos que cumplan con las características propias del entorno Big Data.