Indicadores de calidad de la información en la anonimización de bases de datos de estadísticas oficiales

Los operativos estadísticos tienen por objetivo recolectar datos de unidades de observación que pueden estar constituidas por personas, hogares, empresas u otros objetos. Estos datos proveen información que, para el caso de las estadísticas oficiales, proporcionan elementos importantes para la evalu...

Descripción completa

Detalles Bibliográficos
Autores principales: Bussi, Javier, Marí, Gonzalo Pablo Domingo, Méndez, Fernanda
Otros Autores: Secretaría de Ciencia y Tecnología. Facultad de Ciencias Económicas y Estadística. Universidad Nacional de Rosario
Formato: conferenceObject documento de conferencia publishedVersion
Lenguaje:Español
Publicado: 2021
Materias:
Acceso en línea:http://hdl.handle.net/2133/20823
http://hdl.handle.net/2133/20823
Aporte de:
id I15-R121-2133-20823
record_format dspace
institution Universidad Nacional de Rosario
institution_str I-15
repository_str R-121
collection Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR)
language Español
orig_language_str_mv spa
topic estadísticas oficiales
anonimización
indicadores de calidad
Official statistics
anonymisation
quality indicators
spellingShingle estadísticas oficiales
anonimización
indicadores de calidad
Official statistics
anonymisation
quality indicators
Bussi, Javier
Marí, Gonzalo Pablo Domingo
Méndez, Fernanda
Indicadores de calidad de la información en la anonimización de bases de datos de estadísticas oficiales
topic_facet estadísticas oficiales
anonimización
indicadores de calidad
Official statistics
anonymisation
quality indicators
description Los operativos estadísticos tienen por objetivo recolectar datos de unidades de observación que pueden estar constituidas por personas, hogares, empresas u otros objetos. Estos datos proveen información que, para el caso de las estadísticas oficiales, proporcionan elementos importantes para la evaluación de políticas implementadas y para la toma de decisiones a futuro. Si bien este es el objetivo primario, no puede desconocerse que existe una marcada tendencia en aumento a la difusión de la información a la sociedad para que la misma utilice los datos para analizarlos y poder obtener sus propias conclusiones. De esta forma, en los últimos tiempos, el término datos abiertos tuvo una expansión significativa, al punto tal que existen portales oficiales que contienen datos a los cuales el público en general puede acceder. Por otra parte, la Ley N° 17.622 menciona la obligación de respetar el secreto estadístico en la divulgación de los operativos que se llevan a cabo. De esta forma, existe una contraposición entre ambas posturas, datos abiertos versus secreto estadístico, que es importante a tener en cuenta para buscar soluciones que permitan brindar información sin violar el secreto estadístico. Es por este motivo, que se estudian distintas alternativas que se engloban dentro del término anonimización. Se propone utilizar métodos de anonimización perturbadores, los cuales modifican los datos observados de las unidades para evitar que un intruso pueda detectar, con información secundaria, la identidad de la misma, lo que provocaría que el organismo que difunde la información violase la ley mencionada. Se evalúan las técnicas de perturbación que adicionan un ruido aleatorio a los datos y la de microagregación, que asignan un valor representativo a todas las unidades que forman parte de un grupo de unidades determinado por la cercanía de las mismas. Se comparan los métodos propuestos a través de medidas que dan cuenta de la distorsión que producen en las estimaciones de ciertos parámetros la aplicación de los métodos de perturbación a los datos originales. En el presente trabajo, se evalúan ciertos escenarios de anonimización sobre la base usuario de la ENGHO publicada por el INDEC, utilizando las bases de pesos replicados para la estimación de ciertos parámetros que cuantifican el error muestral. En general, los métodos que adicionan un ruido aleatorio no correlacionado presentan mejores resultados que sus competidores, y más consistentes que los que produce el método de microagregación.
author2 Secretaría de Ciencia y Tecnología. Facultad de Ciencias Económicas y Estadística. Universidad Nacional de Rosario
author_facet Secretaría de Ciencia y Tecnología. Facultad de Ciencias Económicas y Estadística. Universidad Nacional de Rosario
Bussi, Javier
Marí, Gonzalo Pablo Domingo
Méndez, Fernanda
format conferenceObject
documento de conferencia
publishedVersion
author Bussi, Javier
Marí, Gonzalo Pablo Domingo
Méndez, Fernanda
author_sort Bussi, Javier
title Indicadores de calidad de la información en la anonimización de bases de datos de estadísticas oficiales
title_short Indicadores de calidad de la información en la anonimización de bases de datos de estadísticas oficiales
title_full Indicadores de calidad de la información en la anonimización de bases de datos de estadísticas oficiales
title_fullStr Indicadores de calidad de la información en la anonimización de bases de datos de estadísticas oficiales
title_full_unstemmed Indicadores de calidad de la información en la anonimización de bases de datos de estadísticas oficiales
title_sort indicadores de calidad de la información en la anonimización de bases de datos de estadísticas oficiales
publishDate 2021
url http://hdl.handle.net/2133/20823
http://hdl.handle.net/2133/20823
work_keys_str_mv AT bussijavier indicadoresdecalidaddelainformacionenlaanonimizaciondebasesdedatosdeestadisticasoficiales
AT marigonzalopablodomingo indicadoresdecalidaddelainformacionenlaanonimizaciondebasesdedatosdeestadisticasoficiales
AT mendezfernanda indicadoresdecalidaddelainformacionenlaanonimizaciondebasesdedatosdeestadisticasoficiales
bdutipo_str Repositorios
_version_ 1764820411362574340