Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH)
El presente documento se propone exponer los avances realizados en la construcción de un modelo de imputación de valores perdidos y sin respuesta para las variables de ingreso en encuestas a hogares. Se presentará la propuesta metodológica general y los resultados de las pruebas realizadas. Se evalú...
Guardado en:
Autor principal: | |
---|---|
Formato: | Artículo revista |
Lenguaje: | Español |
Publicado: |
Facultad de Ciencia Económicas y Estadísticaca - Universidad Nacional de Rosario
2017
|
Materias: | |
Acceso en línea: | https://saberes.unr.edu.ar/index.php/revista/article/view/132 |
Aporte de: |
id |
I15-R211-article-132 |
---|---|
record_format |
ojs |
spelling |
I15-R211-article-1322020-12-21T14:12:10Z Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH) Rosati, Germán Federico Regularización LASSO No respuesta El presente documento se propone exponer los avances realizados en la construcción de un modelo de imputación de valores perdidos y sin respuesta para las variables de ingreso en encuestas a hogares. Se presentará la propuesta metodológica general y los resultados de las pruebas realizadas. Se evalúan dos tipos de modelos de imputación de datos perdidos: 1) el método hot-deck (ampliamente utilizado por relevamientos importantes en el Sistema Estadístico Nacional, tales como la Encuesta Permanente de Hogares y la Encuesta Anual de Hogares de la Ciudad de Buenos Aires) y 2) un ensamble de modelos de regresión LASSO (Least Absolute Shrinkage and Selection Operator). El mismo se basa en la generación de múltiples modelos de regresión LASSO a través del algoritmo bagging y de su agregación para la generación de la imputación final. En la primera y segunda parte del documento plantea el problema de forma más específica y se pasa revista a los principales mecanismos de generación de los valores perdidos y las implicancias que los mismos tienen al momento de generar modelos de imputación. En el tercer apartado se reseñan los métodos de imputación más habitualmente utilizados, enfatizando sus ventajas y limitaciones. En la cuarta parte, se desarrollan los fundamentos teóricos y metodológicos de las dos técnicas de imputación propuestas. Finalmente, en la quinta sección, se presentan algunos resultados de la aplicación de los métodos propuestos a datos de la Encuesta Permanente de Hogares. Facultad de Ciencia Económicas y Estadísticaca - Universidad Nacional de Rosario 2017-06-30 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion application/pdf image/tiff image/jpeg image/jpeg image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff https://saberes.unr.edu.ar/index.php/revista/article/view/132 10.35305/s.v9i1.132 SaberEs; Vol. 9 Núm. 1 (2017) 1852-4222 1852-4184 spa https://saberes.unr.edu.ar/index.php/revista/article/view/132/389 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167218 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167219 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167220 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167221 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167222 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167223 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167224 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167225 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167226 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167227 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167228 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167229 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167230 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167231 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167232 Derechos de autor 2017 SaberEs |
institution |
Universidad Nacional de Rosario |
institution_str |
I-15 |
repository_str |
R-211 |
container_title_str |
SaberEs |
language |
Español |
format |
Artículo revista |
topic |
Regularización LASSO No respuesta |
spellingShingle |
Regularización LASSO No respuesta Rosati, Germán Federico Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH) |
topic_facet |
Regularización LASSO No respuesta |
author |
Rosati, Germán Federico |
author_facet |
Rosati, Germán Federico |
author_sort |
Rosati, Germán Federico |
title |
Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH) |
title_short |
Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH) |
title_full |
Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH) |
title_fullStr |
Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH) |
title_full_unstemmed |
Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH) |
title_sort |
construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. aplicación en la encuesta permanente de hogares (eph) |
description |
El presente documento se propone exponer los avances realizados en la construcción de un modelo de imputación de valores perdidos y sin respuesta para las variables de ingreso en encuestas a hogares. Se presentará la propuesta metodológica general y los resultados de las pruebas realizadas. Se evalúan dos tipos de modelos de imputación de datos perdidos: 1) el método hot-deck (ampliamente utilizado por relevamientos importantes en el Sistema Estadístico Nacional, tales como la Encuesta Permanente de Hogares y la Encuesta Anual de Hogares de la Ciudad de Buenos Aires) y 2) un ensamble de modelos de regresión LASSO (Least Absolute Shrinkage and Selection Operator). El mismo se basa en la generación de múltiples modelos de regresión LASSO a través del algoritmo bagging y de su agregación para la generación de la imputación final. En la primera y segunda parte del documento plantea el problema de forma más específica y se pasa revista a los principales mecanismos de generación de los valores perdidos y las implicancias que los mismos tienen al momento de generar modelos de imputación. En el tercer apartado se reseñan los métodos de imputación más habitualmente utilizados, enfatizando sus ventajas y limitaciones. En la cuarta parte, se desarrollan los fundamentos teóricos y metodológicos de las dos técnicas de imputación propuestas. Finalmente, en la quinta sección, se presentan algunos resultados de la aplicación de los métodos propuestos a datos de la Encuesta Permanente de Hogares. |
publisher |
Facultad de Ciencia Económicas y Estadísticaca - Universidad Nacional de Rosario |
publishDate |
2017 |
url |
https://saberes.unr.edu.ar/index.php/revista/article/view/132 |
work_keys_str_mv |
AT rosatigermanfederico construcciondeunmodelodeimputacionparavariablesdeingresoconvaloresperdidosapartirdeensamblelearningaplicacionenlaencuestapermanentedehogareseph |
first_indexed |
2023-05-11T18:32:39Z |
last_indexed |
2023-05-11T18:32:39Z |
_version_ |
1765631368451063808 |