Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición
El registro sistemático de medidas antropométricas permite evaluar el estado nutricional de poblaciones, siendo un insumo fundamental para diseñar, dirigir y evaluar políticas públicas. Las medidas antropométricas suelen ser recolectadas en un proceso de registro manual por parte de los profesionale...
Guardado en:
| Autores principales: | , , , |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2023
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/165431 |
| Aporte de: |
| id |
I19-R120-10915-165431 |
|---|---|
| record_format |
dspace |
| spelling |
I19-R120-10915-1654312024-04-30T04:03:35Z http://sedici.unlp.edu.ar/handle/10915/165431 Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición Analysis of the impact of the data cleaning process on malnutrition indicators Dramis, Agustín Nicolás Fernández, María Soledad Pérez, Adriana Alicia Turjanski, Pablo Guillermo 2023-09 2023 2024-04-29T15:00:36Z es Ciencias Informáticas Calidad de datos Simulación Datos antropométricos El registro sistemático de medidas antropométricas permite evaluar el estado nutricional de poblaciones, siendo un insumo fundamental para diseñar, dirigir y evaluar políticas públicas. Las medidas antropométricas suelen ser recolectadas en un proceso de registro manual por parte de los profesionales de la salud. Este proceso acarrea la aparición de errores de carga pudiendo impactar en la evaluación del estado nutricional de la población. Para remediarlo la OMS introdujo pautas de remoción de datos individualmente no plausibles. Sin embargo, no son consideradas suficientes para la detección de la totalidad de los errores. Existen métodos que detectan inconsistencias longitudinales en registros de un mismo individuo. En este trabajo simulamos una base de datos antropométrica (basados en una real), a la que aplicamos aleatoriamente cuatro tipos de errores descritos en la literatura. Observamos el impacto de los mismos y el del proceso de limpieza (transversal y longitudinal), sobre la prevalencia de un indicador de malnutrición. Se encontró un aumento de la prevalencia luego de introducir cada tipo de error, y un acercamiento a los valores originales de prevalencia luego de los procesos de limpieza, evidenciando la importancia de aplicar estos procesos de data cleaning previo a analizar los indicadores nutricionales. The systematic recording of anthropometric measurements allows the evaluation of the nutritional status of populations, providing a fundamental input for designing, directing, and evaluating public policies. Anthropometric measurements are usually collected through a manual entry process by healthcare professionals. This process can lead to data entry errors, potentially impacting the assessment of the population's nutritional status. To address this issue, the WHO introduced guidelines for the removal of individually implausible data. However, these guidelines are not considered sufficient for detecting all errors. There are methods available that can detect longitudinal inconsistencies within records of the same individual. In this study, we simulated an anthropometric database (based on a real one) and randomly introduced four types of errors described in the literature. We observed the impact of these errors and the effects of the cleaning process (both cross-sectional and longitudinal) on the prevalence of a malnutrition indicator. We found an increase in the prevalence after introducing each type of error, and a convergence towards the original prevalence values after applying the cleaning processes. This highlights the importance of implementing data cleaning procedures before analyzing nutritional indicators. Sociedad Argentina de Informática e Investigación Operativa Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 20-27 |
| institution |
Universidad Nacional de La Plata |
| institution_str |
I-19 |
| repository_str |
R-120 |
| collection |
SEDICI (UNLP) |
| language |
Español |
| topic |
Ciencias Informáticas Calidad de datos Simulación Datos antropométricos |
| spellingShingle |
Ciencias Informáticas Calidad de datos Simulación Datos antropométricos Dramis, Agustín Nicolás Fernández, María Soledad Pérez, Adriana Alicia Turjanski, Pablo Guillermo Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición |
| topic_facet |
Ciencias Informáticas Calidad de datos Simulación Datos antropométricos |
| description |
El registro sistemático de medidas antropométricas permite evaluar el estado nutricional de poblaciones, siendo un insumo fundamental para diseñar, dirigir y evaluar políticas públicas. Las medidas antropométricas suelen ser recolectadas en un proceso de registro manual por parte de los profesionales de la salud. Este proceso acarrea la aparición de errores de carga pudiendo impactar en la evaluación del estado nutricional de la población. Para remediarlo la OMS introdujo pautas de remoción de datos individualmente no plausibles. Sin embargo, no son consideradas suficientes para la detección de la totalidad de los errores. Existen métodos que detectan inconsistencias longitudinales en registros de un mismo individuo. En este trabajo simulamos una base de datos antropométrica (basados en una real), a la que aplicamos aleatoriamente cuatro tipos de errores descritos en la literatura. Observamos el impacto de los mismos y el del proceso de limpieza (transversal y longitudinal), sobre la prevalencia de un indicador de malnutrición. Se encontró un aumento de la prevalencia luego de introducir cada tipo de error, y un acercamiento a los valores originales de prevalencia luego de los procesos de limpieza, evidenciando la importancia de aplicar estos procesos de data cleaning previo a analizar los indicadores nutricionales. |
| format |
Objeto de conferencia Objeto de conferencia |
| author |
Dramis, Agustín Nicolás Fernández, María Soledad Pérez, Adriana Alicia Turjanski, Pablo Guillermo |
| author_facet |
Dramis, Agustín Nicolás Fernández, María Soledad Pérez, Adriana Alicia Turjanski, Pablo Guillermo |
| author_sort |
Dramis, Agustín Nicolás |
| title |
Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición |
| title_short |
Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición |
| title_full |
Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición |
| title_fullStr |
Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición |
| title_full_unstemmed |
Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición |
| title_sort |
análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición |
| publishDate |
2023 |
| url |
http://sedici.unlp.edu.ar/handle/10915/165431 |
| work_keys_str_mv |
AT dramisagustinnicolas analisisdelimpactodelprocesodedatacleaningsobreindicadoresdemalnutricion AT fernandezmariasoledad analisisdelimpactodelprocesodedatacleaningsobreindicadoresdemalnutricion AT perezadrianaalicia analisisdelimpactodelprocesodedatacleaningsobreindicadoresdemalnutricion AT turjanskipabloguillermo analisisdelimpactodelprocesodedatacleaningsobreindicadoresdemalnutricion AT dramisagustinnicolas analysisoftheimpactofthedatacleaningprocessonmalnutritionindicators AT fernandezmariasoledad analysisoftheimpactofthedatacleaningprocessonmalnutritionindicators AT perezadrianaalicia analysisoftheimpactofthedatacleaningprocessonmalnutritionindicators AT turjanskipabloguillermo analysisoftheimpactofthedatacleaningprocessonmalnutritionindicators |
| _version_ |
1807223052318015488 |