Método de Anonimización de Bases de Datos en Estadísticas Oficiales

En Argentina, la Ley Nº 17.622 del año 1968, establece que la información que se suministre a los organismos integrantes del Sistema Estadístico Nacional está protegida por el secreto estadístico, el cual asegura que los datos deberán ser publicados de forma tal que no pueda individualizarse a las u...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Bussi, Javier, Marí, Gonzalo Pablo Domingo, Méndez, Fernanda
Otros Autores:	Secretaría de Ciencia y Tecnología. Facultad de Ciencias Económicas y Estadística. Universidad Nacional de Rosario
Formato:	conferenceObject documento de conferencia
Lenguaje:	Español
Publicado:	2019
Materias:	estadísticas oficiales riesgos de divulgación anonimización
Acceso en línea:	http://hdl.handle.net/2133/17405 http://hdl.handle.net/2133/17405
Aporte de:	Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR) de Universidad Nacional de Rosario

id	I15-R121-2133-17405
record_format	dspace
institution	Universidad Nacional de Rosario
institution_str	I-15
repository_str	R-121
collection	Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR)
language	Español
orig_language_str_mv	spa
topic	estadísticas oficiales riesgos de divulgación anonimización
spellingShingle	estadísticas oficiales riesgos de divulgación anonimización Bussi, Javier Marí, Gonzalo Pablo Domingo Méndez, Fernanda Método de Anonimización de Bases de Datos en Estadísticas Oficiales
topic_facet	estadísticas oficiales riesgos de divulgación anonimización
description	En Argentina, la Ley Nº 17.622 del año 1968, establece que la información que se suministre a los organismos integrantes del Sistema Estadístico Nacional está protegida por el secreto estadístico, el cual asegura que los datos deberán ser publicados de forma tal que no pueda individualizarse a las unidades a quienes se refieran los mismos. Es por este motivo, que los organismos oficiales de estadística establecen una serie de medidas tendientes a asegurar el anonimato de los informantes. Estas acciones, en muchos operativos, se reducen a la no publicación de las bases de datos, siendo las estadísticas que se publican la única información disponible para los mismos. De esta forma, no existe la posibilidad que los usuarios desarrollen sus propios análisis sobre los conjuntos de datos. Otra situación se presenta en el caso de las encuestas por muestreo, donde una práctica habitual es la difusión de bases de datos de usuarios, las cuales contienen las variables que fueron medidas durante el operativo, pero carecen de aquellas referidas al diseño muestral, que permitiría, en un hipotético caso, identificar a las unidades a las cuales se refiere la información. Esta decisión posee la desventaja de que sin esa información no es posible llevar a cabo análisis adicionales apropiados sobre las bases de datos debido a que no es posible considerar las características del diseño muestral empleado, que, en la mayoría de los casos, es complejo y no emplear la información del mismo en el análisis de los datos conlleva a que los resultados no sean válidos. En ambas situaciones la anonimización de las unidades de análisis está garantizada, si bien la pérdida de información es demasiado importante, en un caso por la ausencia total de la misma y en el segundo caso por la imposibilidad de poder emplear el diseño muestral en los análisis posteriores. De esta forma, debe existir un balance entre la pérdida o distorsión de la información que se publica y la anonimización de las unidades que brindaron los datos, de tal forma que no exista riesgo de divulgación de la identidad, pero con una mínima perdida de información que permita que la base de datos protegida continúe siendo útil. En el presente trabajo se estudian distintos métodos de anonimización de bases de datos, tanto para variables categóricas como cuantitativas, y se evalúan los mismos considerando medidas relacionadas con el riesgo de divulgación y la pérdida de información que ocasionan las metodologías consideradas.
author2	Secretaría de Ciencia y Tecnología. Facultad de Ciencias Económicas y Estadística. Universidad Nacional de Rosario
author_facet	Secretaría de Ciencia y Tecnología. Facultad de Ciencias Económicas y Estadística. Universidad Nacional de Rosario Bussi, Javier Marí, Gonzalo Pablo Domingo Méndez, Fernanda
format	conferenceObject documento de conferencia
author	Bussi, Javier Marí, Gonzalo Pablo Domingo Méndez, Fernanda
author_sort	Bussi, Javier
title	Método de Anonimización de Bases de Datos en Estadísticas Oficiales
title_short	Método de Anonimización de Bases de Datos en Estadísticas Oficiales
title_full	Método de Anonimización de Bases de Datos en Estadísticas Oficiales
title_fullStr	Método de Anonimización de Bases de Datos en Estadísticas Oficiales
title_full_unstemmed	Método de Anonimización de Bases de Datos en Estadísticas Oficiales
title_sort	método de anonimización de bases de datos en estadísticas oficiales
publishDate	2019
url	http://hdl.handle.net/2133/17405 http://hdl.handle.net/2133/17405
work_keys_str_mv	AT bussijavier metododeanonimizaciondebasesdedatosenestadisticasoficiales AT marigonzalopablodomingo metododeanonimizaciondebasesdedatosenestadisticasoficiales AT mendezfernanda metododeanonimizaciondebasesdedatosenestadisticasoficiales
bdutipo_str	Repositorios
_version_	1764820410777468931

Método de Anonimización de Bases de Datos en Estadísticas Oficiales

Ejemplares similares