Los datos de investigación en las Humanidades – periódicos decimonónicos

Introducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines....

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Galina Russell, Isabel, Peña Pimentel, Miriam, Priani Saisó, Ernesto
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2019
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/86748
Aporte de:
id I19-R120-10915-86748
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Bibliotecología
Ciencias Informáticas
datos de investigación
Humanidades
spellingShingle Bibliotecología
Ciencias Informáticas
datos de investigación
Humanidades
Galina Russell, Isabel
Peña Pimentel, Miriam
Priani Saisó, Ernesto
Los datos de investigación en las Humanidades – periódicos decimonónicos
topic_facet Bibliotecología
Ciencias Informáticas
datos de investigación
Humanidades
description Introducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines. Este trabajo forma parte de los resultados de “Oceanic Exchanges: Tracing Global Information Networks in Historical Newspaper Repositories”, un proyecto de minería de datos en repositorios de periódicos digitalizados. Materiales y metodología: OcEx está compuesto por 6 equipos de investigación en 9 países y busca modelar patrones de flujo de información en periódicos del XIX. México participa con el repositorio Hemeroteca Nacional Digital de México (HNDM) que contiene más de 7 millones de imágenes y sus correspondientes archivos en XML producto del proceso de OCR. A partir de utilizar este repositorio para realizar un proyecto de minería de datos humanístico hacemos una reflexión en cómo pueden ser concebidas las colecciones digitales y sus datos de tal forma que pueden ser utilizados como datos crudos para investigación hemerográfica. Resultados y conclusiones: El uso de repositorios para custodiar colecciones de datos crudos permite compartir y reutilizar esta información. Sin embargo, es necesario una descripción bibliográfica de la digitalización. Para lograr esto es necesario aproximarse a los datos resultantes de una digitalización, desde una perspectiva crítica y no únicamente tecnológica. Este trabajo representa un primer acercamiento y reflexión a cómo este tipo de datos deben de ser almacenados en repositorios para que sean adecuadamente interpretados y utilizados en la investigación. Abstract Introduction: OCR
format Objeto de conferencia
Objeto de conferencia
author Galina Russell, Isabel
Peña Pimentel, Miriam
Priani Saisó, Ernesto
author_facet Galina Russell, Isabel
Peña Pimentel, Miriam
Priani Saisó, Ernesto
author_sort Galina Russell, Isabel
title Los datos de investigación en las Humanidades – periódicos decimonónicos
title_short Los datos de investigación en las Humanidades – periódicos decimonónicos
title_full Los datos de investigación en las Humanidades – periódicos decimonónicos
title_fullStr Los datos de investigación en las Humanidades – periódicos decimonónicos
title_full_unstemmed Los datos de investigación en las Humanidades – periódicos decimonónicos
title_sort los datos de investigación en las humanidades – periódicos decimonónicos
publishDate 2019
url http://sedici.unlp.edu.ar/handle/10915/86748
work_keys_str_mv AT galinarussellisabel losdatosdeinvestigacionenlashumanidadesperiodicosdecimononicos
AT penapimentelmiriam losdatosdeinvestigacionenlashumanidadesperiodicosdecimononicos
AT prianisaisoernesto losdatosdeinvestigacionenlashumanidadesperiodicosdecimononicos
bdutipo_str Repositorios
_version_ 1764820489294839810