Los datos de investigación en las Humanidades – periódicos decimonónicos
Introducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines....
Guardado en:
Autores principales: | , , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2019
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/86748 |
Aporte de: |
id |
I19-R120-10915-86748 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Bibliotecología Ciencias Informáticas datos de investigación Humanidades |
spellingShingle |
Bibliotecología Ciencias Informáticas datos de investigación Humanidades Galina Russell, Isabel Peña Pimentel, Miriam Priani Saisó, Ernesto Los datos de investigación en las Humanidades – periódicos decimonónicos |
topic_facet |
Bibliotecología Ciencias Informáticas datos de investigación Humanidades |
description |
Introducción: El OCR de periódicos digitalizados del siglo XIX pueden entenderse como "datos crudos" para la realización de investigación histórica hemerográfica y ofrecemos una reflexión en torno a cómo deben integrarse estos datos al repositorio para poder ser utilizado para estos fines. Este trabajo forma parte de los resultados de “Oceanic Exchanges: Tracing Global Information Networks in Historical Newspaper Repositories”, un proyecto de minería de datos en repositorios de periódicos digitalizados. Materiales y metodología: OcEx está compuesto por 6 equipos de investigación en 9 países y busca modelar patrones de flujo de información en periódicos del XIX. México participa con el repositorio Hemeroteca Nacional Digital de México (HNDM) que contiene más de 7 millones de imágenes y sus correspondientes archivos en XML producto del proceso de OCR. A partir de utilizar este repositorio para realizar un proyecto de minería de datos humanístico hacemos una reflexión en cómo pueden ser concebidas las colecciones digitales y sus datos de tal forma que pueden ser utilizados como datos crudos para investigación hemerográfica. Resultados y conclusiones: El uso de repositorios para custodiar colecciones de datos crudos permite compartir y reutilizar esta información. Sin embargo, es necesario una descripción bibliográfica de la digitalización. Para lograr esto es necesario aproximarse a los datos resultantes de una digitalización, desde una perspectiva crítica y no únicamente tecnológica. Este trabajo representa un primer acercamiento y reflexión a cómo este tipo de datos deben de ser almacenados en repositorios para que sean adecuadamente interpretados y utilizados en la investigación.
Abstract Introduction: OCR |
format |
Objeto de conferencia Objeto de conferencia |
author |
Galina Russell, Isabel Peña Pimentel, Miriam Priani Saisó, Ernesto |
author_facet |
Galina Russell, Isabel Peña Pimentel, Miriam Priani Saisó, Ernesto |
author_sort |
Galina Russell, Isabel |
title |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title_short |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title_full |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title_fullStr |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title_full_unstemmed |
Los datos de investigación en las Humanidades – periódicos decimonónicos |
title_sort |
los datos de investigación en las humanidades – periódicos decimonónicos |
publishDate |
2019 |
url |
http://sedici.unlp.edu.ar/handle/10915/86748 |
work_keys_str_mv |
AT galinarussellisabel losdatosdeinvestigacionenlashumanidadesperiodicosdecimononicos AT penapimentelmiriam losdatosdeinvestigacionenlashumanidadesperiodicosdecimononicos AT prianisaisoernesto losdatosdeinvestigacionenlashumanidadesperiodicosdecimononicos |
bdutipo_str |
Repositorios |
_version_ |
1764820489294839810 |