Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH)

El presente documento se propone exponer los avances realizados en la construcción de un modelo de imputación de valores perdidos y sin respuesta para las variables de ingreso en encuestas a hogares. Se presentará la propuesta metodológica general y los resultados de las pruebas realizadas. Se evalú...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Rosati, Germán Federico
Formato: Artículo revista
Lenguaje:Español
Publicado: Facultad de Ciencia Económicas y Estadísticaca - Universidad Nacional de Rosario 2017
Materias:
Acceso en línea:https://saberes.unr.edu.ar/index.php/revista/article/view/132
Aporte de:
id I15-R211-article-132
record_format ojs
spelling I15-R211-article-1322020-12-21T14:12:10Z Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH) Rosati, Germán Federico Regularización LASSO No respuesta El presente documento se propone exponer los avances realizados en la construcción de un modelo de imputación de valores perdidos y sin respuesta para las variables de ingreso en encuestas a hogares. Se presentará la propuesta metodológica general y los resultados de las pruebas realizadas. Se evalúan dos tipos de modelos de imputación de datos perdidos: 1) el método hot-deck (ampliamente utilizado por relevamientos importantes en el Sistema Estadístico Nacional, tales como la Encuesta Permanente de Hogares y la Encuesta Anual de Hogares de la Ciudad de Buenos Aires) y 2) un ensamble de modelos de regresión LASSO (Least Absolute Shrinkage and Selection Operator). El mismo se basa en la generación de múltiples modelos de regresión LASSO a través del algoritmo bagging y de su agregación para la generación de la imputación final. En la primera y segunda parte del documento plantea el problema de forma más específica y se pasa revista a los principales mecanismos de generación de los valores perdidos y las implicancias que los mismos tienen al momento de generar modelos de imputación. En el tercer apartado se reseñan los métodos de imputación más habitualmente utilizados, enfatizando sus ventajas y limitaciones. En la cuarta parte, se desarrollan los fundamentos teóricos y metodológicos de las dos técnicas de imputación propuestas. Finalmente, en la quinta sección, se presentan algunos resultados de la aplicación de los métodos propuestos a datos de la Encuesta Permanente de Hogares. Facultad de Ciencia Económicas y Estadísticaca - Universidad Nacional de Rosario 2017-06-30 info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion application/pdf image/tiff image/jpeg image/jpeg image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff image/tiff https://saberes.unr.edu.ar/index.php/revista/article/view/132 10.35305/s.v9i1.132 SaberEs; Vol. 9 Núm. 1 (2017) 1852-4222 1852-4184 spa https://saberes.unr.edu.ar/index.php/revista/article/view/132/389 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167218 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167219 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167220 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167221 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167222 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167223 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167224 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167225 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167226 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167227 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167228 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167229 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167230 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167231 https://saberes.unr.edu.ar/index.php/revista/article/view/132/167167232 Derechos de autor 2017 SaberEs
institution Universidad Nacional de Rosario
institution_str I-15
repository_str R-211
container_title_str SaberEs
language Español
format Artículo revista
topic Regularización
LASSO
No respuesta
spellingShingle Regularización
LASSO
No respuesta
Rosati, Germán Federico
Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH)
topic_facet Regularización
LASSO
No respuesta
author Rosati, Germán Federico
author_facet Rosati, Germán Federico
author_sort Rosati, Germán Federico
title Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH)
title_short Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH)
title_full Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH)
title_fullStr Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH)
title_full_unstemmed Construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. Aplicación en la Encuesta Permanente de Hogares (EPH)
title_sort construcción de un modelo de imputación para variables de ingreso con valores perdidos a partir de ensamble learning. aplicación en la encuesta permanente de hogares (eph)
description El presente documento se propone exponer los avances realizados en la construcción de un modelo de imputación de valores perdidos y sin respuesta para las variables de ingreso en encuestas a hogares. Se presentará la propuesta metodológica general y los resultados de las pruebas realizadas. Se evalúan dos tipos de modelos de imputación de datos perdidos: 1) el método hot-deck (ampliamente utilizado por relevamientos importantes en el Sistema Estadístico Nacional, tales como la Encuesta Permanente de Hogares y la Encuesta Anual de Hogares de la Ciudad de Buenos Aires) y 2) un ensamble de modelos de regresión LASSO (Least Absolute Shrinkage and Selection Operator). El mismo se basa en la generación de múltiples modelos de regresión LASSO a través del algoritmo bagging y de su agregación para la generación de la imputación final. En la primera y segunda parte del documento plantea el problema de forma más específica y se pasa revista a los principales mecanismos de generación de los valores perdidos y las implicancias que los mismos tienen al momento de generar modelos de imputación. En el tercer apartado se reseñan los métodos de imputación más habitualmente utilizados, enfatizando sus ventajas y limitaciones. En la cuarta parte, se desarrollan los fundamentos teóricos y metodológicos de las dos técnicas de imputación propuestas. Finalmente, en la quinta sección, se presentan algunos resultados de la aplicación de los métodos propuestos a datos de la Encuesta Permanente de Hogares.
publisher Facultad de Ciencia Económicas y Estadísticaca - Universidad Nacional de Rosario
publishDate 2017
url https://saberes.unr.edu.ar/index.php/revista/article/view/132
work_keys_str_mv AT rosatigermanfederico construcciondeunmodelodeimputacionparavariablesdeingresoconvaloresperdidosapartirdeensamblelearningaplicacionenlaencuestapermanentedehogareseph
first_indexed 2023-05-11T18:32:39Z
last_indexed 2023-05-11T18:32:39Z
_version_ 1765631368451063808