Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural

El proceso de reconocimiento de la escritura manuscrita forma parte de las iniciativas que propenden a la preservación de patrimonio cultural resguardado en Bibliotecas y archivos donde existe una gran riqueza de documentos y hasta fichas manuscritas que acompañan libros incunables. Este trabajo es...

Descripción completa

Detalles Bibliográficos
Autores principales: De Giusti, Marisa Raquel, Vila, María Marta, Villarreal, Gonzalo Luján
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2005
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/5534
Aporte de:
id I19-R120-10915-5534
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Bibliotecología
conservación patrimonial; digitalización; adelgazamiento; componentes conexas
Digitalización y captura de imagen
Procesamiento de imagen
Imagen
spellingShingle Ciencias Informáticas
Bibliotecología
conservación patrimonial; digitalización; adelgazamiento; componentes conexas
Digitalización y captura de imagen
Procesamiento de imagen
Imagen
De Giusti, Marisa Raquel
Vila, María Marta
Villarreal, Gonzalo Luján
Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural
topic_facet Ciencias Informáticas
Bibliotecología
conservación patrimonial; digitalización; adelgazamiento; componentes conexas
Digitalización y captura de imagen
Procesamiento de imagen
Imagen
description El proceso de reconocimiento de la escritura manuscrita forma parte de las iniciativas que propenden a la preservación de patrimonio cultural resguardado en Bibliotecas y archivos donde existe una gran riqueza de documentos y hasta fichas manuscritas que acompañan libros incunables. Este trabajo es el punto de partida de un proyecto de investigación y desarrollo orientado a la digitalización y reconocimiento de material manuscrito y la ponencia que aquí se presenta discute diferentes algoritmos utilizados en una primera etapa dedicada a "limpiar" la imagen de ruido para mejorarla antes de comenzar el reconocimiento de caracteres. Dado que PrEBi-SeDiCI forman parte integrante de redes de bibliotecas que intercambian documentos digitalizados vía scanning, el presente desarrollo ha tenido una utilización adicional relacionada al mejoramiento de las imágenes de documentos de intercambio que presentaban problemas comunes en la digitalización: bordes, impurezas, descentrado, etc.., si bien no es esta la finalidad de esta investigación no por ello resulta una utilidad menor en el marco de intercambios de consorcios de bibliotecas. Para que el proceso de digitalización y reconocimiento de textos manuscritos sea eficiente debe estar precedido de una etapa de "preprocesamiento" de la imagen a tratar que incluye umbralización, limpieza de ruido, adelgazamiento, enderezamiento de la línea base y segmentación de la imagen entre otros. Cada uno de estos pasos permitirá reducir la variabilidad nociva al momento de reconocer los textos manuscritos (ruido, niveles aleatorios de grises, inclinación de caracteres, zonas con más y menos tinta), aumentando así la probabilidad de reconocer adecuadamente los textos. En este trabajo se consideran dos métodos de adelgazamiento de imágenes, se realiza la implementación y finalmente se lleva adelante una evaluación obteniendo conclusiones relativas a la eficiencia, velocidad y requerimientos, así como también ideas para futuras implementaciones. En la primera parte del documento, se presentan algunas definiciones relacionadas con los métodos utilizados, luego se muestran los resultados obtenidos sobre un mismo conjunto de imágenes aplicando las teorías propuestas y finalmente, se exponen algunas ideas para optimizar los algoritmos elegidos.
format Objeto de conferencia
Objeto de conferencia
author De Giusti, Marisa Raquel
Vila, María Marta
Villarreal, Gonzalo Luján
author_facet De Giusti, Marisa Raquel
Vila, María Marta
Villarreal, Gonzalo Luján
author_sort De Giusti, Marisa Raquel
title Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural
title_short Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural
title_full Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural
title_fullStr Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural
title_full_unstemmed Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural
title_sort digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural
publishDate 2005
url http://sedici.unlp.edu.ar/handle/10915/5534
work_keys_str_mv AT degiustimarisaraquel digitalizacionyreconocimientodedocumentosmanuscritosparalapreservaciondepatrimoniocultural
AT vilamariamarta digitalizacionyreconocimientodedocumentosmanuscritosparalapreservaciondepatrimoniocultural
AT villarrealgonzalolujan digitalizacionyreconocimientodedocumentosmanuscritosparalapreservaciondepatrimoniocultural
bdutipo_str Repositorios
_version_ 1764820476841951234