Detección de registros académicos duplicados obtenidos desde repositorios digitales

Esta tesina de grado detalla el análisis y la implementación de una herramienta para la detección de registros académicos duplicados basada en un sistema de reglas. La deduplicación de registros es una tarea clave en el proceso de ingesta masiva de documentos a un repositorio puesto que permite el f...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Soloaga, Ignacio
Otros Autores: De Giusti, Marisa Raquel
Formato: Tesis Tesis de grado
Lenguaje:Español
Publicado: 2021
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/115229
Aporte de:
Descripción
Sumario:Esta tesina de grado detalla el análisis y la implementación de una herramienta para la detección de registros académicos duplicados basada en un sistema de reglas. La deduplicación de registros es una tarea clave en el proceso de ingesta masiva de documentos a un repositorio puesto que permite el filtrado de contenido duplicado. Además, permite enriquecer los metadatos de los registros existentes en las distintas fuentes. Adicionalmente se presenta el desarrollo de un módulo de mapeo de metadatos que da soporte al proceso de deduplicación de registros y permite establecer interoperabilidad entre los esquemas utilizados en las distintas fuentes.