Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición

El registro sistemático de medidas antropométricas permite evaluar el estado nutricional de poblaciones, siendo un insumo fundamental para diseñar, dirigir y evaluar políticas públicas. Las medidas antropométricas suelen ser recolectadas en un proceso de registro manual por parte de los profesionale...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Dramis, Agustín Nicolás, Fernández, María Soledad, Pérez, Adriana Alicia, Turjanski, Pablo Guillermo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2023
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/165431
Aporte de:
id I19-R120-10915-165431
record_format dspace
spelling I19-R120-10915-1654312024-04-30T04:03:35Z http://sedici.unlp.edu.ar/handle/10915/165431 Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición Analysis of the impact of the data cleaning process on malnutrition indicators Dramis, Agustín Nicolás Fernández, María Soledad Pérez, Adriana Alicia Turjanski, Pablo Guillermo 2023-09 2023 2024-04-29T15:00:36Z es Ciencias Informáticas Calidad de datos Simulación Datos antropométricos El registro sistemático de medidas antropométricas permite evaluar el estado nutricional de poblaciones, siendo un insumo fundamental para diseñar, dirigir y evaluar políticas públicas. Las medidas antropométricas suelen ser recolectadas en un proceso de registro manual por parte de los profesionales de la salud. Este proceso acarrea la aparición de errores de carga pudiendo impactar en la evaluación del estado nutricional de la población. Para remediarlo la OMS introdujo pautas de remoción de datos individualmente no plausibles. Sin embargo, no son consideradas suficientes para la detección de la totalidad de los errores. Existen métodos que detectan inconsistencias longitudinales en registros de un mismo individuo. En este trabajo simulamos una base de datos antropométrica (basados en una real), a la que aplicamos aleatoriamente cuatro tipos de errores descritos en la literatura. Observamos el impacto de los mismos y el del proceso de limpieza (transversal y longitudinal), sobre la prevalencia de un indicador de malnutrición. Se encontró un aumento de la prevalencia luego de introducir cada tipo de error, y un acercamiento a los valores originales de prevalencia luego de los procesos de limpieza, evidenciando la importancia de aplicar estos procesos de data cleaning previo a analizar los indicadores nutricionales. The systematic recording of anthropometric measurements allows the evaluation of the nutritional status of populations, providing a fundamental input for designing, directing, and evaluating public policies. Anthropometric measurements are usually collected through a manual entry process by healthcare professionals. This process can lead to data entry errors, potentially impacting the assessment of the population's nutritional status. To address this issue, the WHO introduced guidelines for the removal of individually implausible data. However, these guidelines are not considered sufficient for detecting all errors. There are methods available that can detect longitudinal inconsistencies within records of the same individual. In this study, we simulated an anthropometric database (based on a real one) and randomly introduced four types of errors described in the literature. We observed the impact of these errors and the effects of the cleaning process (both cross-sectional and longitudinal) on the prevalence of a malnutrition indicator. We found an increase in the prevalence after introducing each type of error, and a convergence towards the original prevalence values after applying the cleaning processes. This highlights the importance of implementing data cleaning procedures before analyzing nutritional indicators. Sociedad Argentina de Informática e Investigación Operativa Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 20-27
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Calidad de datos
Simulación
Datos antropométricos
spellingShingle Ciencias Informáticas
Calidad de datos
Simulación
Datos antropométricos
Dramis, Agustín Nicolás
Fernández, María Soledad
Pérez, Adriana Alicia
Turjanski, Pablo Guillermo
Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición
topic_facet Ciencias Informáticas
Calidad de datos
Simulación
Datos antropométricos
description El registro sistemático de medidas antropométricas permite evaluar el estado nutricional de poblaciones, siendo un insumo fundamental para diseñar, dirigir y evaluar políticas públicas. Las medidas antropométricas suelen ser recolectadas en un proceso de registro manual por parte de los profesionales de la salud. Este proceso acarrea la aparición de errores de carga pudiendo impactar en la evaluación del estado nutricional de la población. Para remediarlo la OMS introdujo pautas de remoción de datos individualmente no plausibles. Sin embargo, no son consideradas suficientes para la detección de la totalidad de los errores. Existen métodos que detectan inconsistencias longitudinales en registros de un mismo individuo. En este trabajo simulamos una base de datos antropométrica (basados en una real), a la que aplicamos aleatoriamente cuatro tipos de errores descritos en la literatura. Observamos el impacto de los mismos y el del proceso de limpieza (transversal y longitudinal), sobre la prevalencia de un indicador de malnutrición. Se encontró un aumento de la prevalencia luego de introducir cada tipo de error, y un acercamiento a los valores originales de prevalencia luego de los procesos de limpieza, evidenciando la importancia de aplicar estos procesos de data cleaning previo a analizar los indicadores nutricionales.
format Objeto de conferencia
Objeto de conferencia
author Dramis, Agustín Nicolás
Fernández, María Soledad
Pérez, Adriana Alicia
Turjanski, Pablo Guillermo
author_facet Dramis, Agustín Nicolás
Fernández, María Soledad
Pérez, Adriana Alicia
Turjanski, Pablo Guillermo
author_sort Dramis, Agustín Nicolás
title Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición
title_short Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición
title_full Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición
title_fullStr Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición
title_full_unstemmed Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición
title_sort análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición
publishDate 2023
url http://sedici.unlp.edu.ar/handle/10915/165431
work_keys_str_mv AT dramisagustinnicolas analisisdelimpactodelprocesodedatacleaningsobreindicadoresdemalnutricion
AT fernandezmariasoledad analisisdelimpactodelprocesodedatacleaningsobreindicadoresdemalnutricion
AT perezadrianaalicia analisisdelimpactodelprocesodedatacleaningsobreindicadoresdemalnutricion
AT turjanskipabloguillermo analisisdelimpactodelprocesodedatacleaningsobreindicadoresdemalnutricion
AT dramisagustinnicolas analysisoftheimpactofthedatacleaningprocessonmalnutritionindicators
AT fernandezmariasoledad analysisoftheimpactofthedatacleaningprocessonmalnutritionindicators
AT perezadrianaalicia analysisoftheimpactofthedatacleaningprocessonmalnutritionindicators
AT turjanskipabloguillermo analysisoftheimpactofthedatacleaningprocessonmalnutritionindicators
_version_ 1807223052318015488