Métricas de calidad para validar los conjuntos de datos abiertos públicos gubernamentales

En estos tiempos, los datos son un recurso indispensable para cualquier actividad de gestión pública, por lo que es necesario mantenerlos actualizados, claros y completos. Si bien se puede determinar que cada vez son más los gobiernos que se embarcan en este nuevo paradigma de concepto de datos abie...

Descripción completa

Detalles Bibliográficos
Autor principal: Martínez, María Roxana
Otros Autores: Rodríguez, Rocío Andrea
Formato: Tesis Tesis de doctorado
Lenguaje:Español
Publicado: 2022
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/135556
https://doi.org/10.35537/10915/135556
Aporte de:SEDICI (UNLP) de Universidad Nacional de La Plata Ver origen
Descripción
Sumario:En estos tiempos, los datos son un recurso indispensable para cualquier actividad de gestión pública, por lo que es necesario mantenerlos actualizados, claros y completos. Si bien se puede determinar que cada vez son más los gobiernos que se embarcan en este nuevo paradigma de concepto de datos abiertos, todavía falta un largo camino por recorrer. Varios trabajos relacionados en esta temática se están enfocando en la calidad de los datos abiertos disponibilizados en los portales de entidades gubernamentales, este especial foco en la calidad del dato, permite que se estudien técnicas para que sean mejor utilizados, manipulados y distribuidos a los ciudadanos para varios fines, permitiendo a su vez, una mayor participación ciudadana y transparencia en organismos estatales. Este trabajo se enfoca en el contexto de Gobierno Abierto para colaborar con el cumplimiento, divulgación y mejora de los distintos criterios y principios en aspectos del tratamiento del dato público y abierto que proponen entidades mundialmente reconocidas. Con el fin de identificar mejoras en los aspectos de calidad de los datasets abiertos, esta tesis plantea métricas críticas y no críticas para su análisis y validación de contenido, por lo que, como parte de la propuesta, se presenta un prototipo de desarrollo propio, llamado HEVDA (HErramienta de Validación de Datos Abiertos). A modo de caso de estudio, se extrae una muestra de datasets públicos estatales que son validados con HEVDA, para obtener un análisis sobre las mediciones utilizadas y realizar así, un estudio cuantitativo sobre los resultados arrojados. Esta herramienta de validación permite detectar en forma más sencilla y rápida, las falencias y errores en las fuentes de datos abiertas que podrían complicar la interoperabilidad para su utilización en diversos orígenes de bases de datos y softwares externos de otros organismos. Para evaluar la calidad de datos es necesario tener en cuenta determinadas características en el conjunto de datos analizados, por lo que se realiza un relevamiento detallado de los aspectos más relevantes en cuestiones de calidad de datos sobre criterios estándares de norma ISO/IEC 25012 [ISO08], estándares universales de calidad de datos [CAI15], dimensiones de la calidad de los datos [DIM18], trabajos relevados y estudios realizados [MAR20] en esta temática. La utilización de métricas de calidad favorece al encuadre de indicadores que permitan obtener un dato más limpio para facilitar el análisis final. Con los resultados obtenidos en el estudio realizado de la presente tesis, se puede concluir que sí es posible definir métricas de calidad de datos públicos gubernamentales en un formato abierto para efectuar un análisis cuantitativo a través de una herramienta amigable y sencilla.