Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural
El proceso de reconocimiento de la escritura manuscrita forma parte de las iniciativas que propenden a la preservación de patrimonio cultural resguardado en Bibliotecas y archivos donde existe una gran riqueza de documentos y hasta fichas manuscritas que acompañan libros incunables. Este trabajo es...
Autores principales: | , , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2005
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/5534 |
Aporte de: |
id |
I19-R120-10915-5534 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas Bibliotecología conservación patrimonial; digitalización; adelgazamiento; componentes conexas Digitalización y captura de imagen Procesamiento de imagen Imagen |
spellingShingle |
Ciencias Informáticas Bibliotecología conservación patrimonial; digitalización; adelgazamiento; componentes conexas Digitalización y captura de imagen Procesamiento de imagen Imagen De Giusti, Marisa Raquel Vila, María Marta Villarreal, Gonzalo Luján Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural |
topic_facet |
Ciencias Informáticas Bibliotecología conservación patrimonial; digitalización; adelgazamiento; componentes conexas Digitalización y captura de imagen Procesamiento de imagen Imagen |
description |
El proceso de reconocimiento de la escritura manuscrita forma parte de las iniciativas que propenden a la preservación de patrimonio cultural resguardado en Bibliotecas y archivos donde existe una gran riqueza de documentos y hasta fichas manuscritas que acompañan libros incunables. Este trabajo es el punto de partida de un proyecto de investigación y desarrollo orientado a la digitalización y reconocimiento de material manuscrito y la ponencia que aquí se presenta discute diferentes algoritmos utilizados en una primera etapa dedicada a "limpiar" la imagen de ruido para mejorarla antes de comenzar el reconocimiento de caracteres. Dado que PrEBi-SeDiCI forman parte integrante de redes de bibliotecas que intercambian documentos digitalizados vía scanning, el presente desarrollo ha tenido una utilización adicional relacionada al mejoramiento de las imágenes de documentos de intercambio que presentaban problemas comunes en la digitalización: bordes, impurezas, descentrado, etc.., si bien no es esta la finalidad de esta investigación no por ello resulta una utilidad menor en el marco de intercambios de consorcios de bibliotecas. Para que el proceso de digitalización y reconocimiento de textos manuscritos sea eficiente debe estar precedido de una etapa de "preprocesamiento" de la imagen a tratar que incluye umbralización, limpieza de ruido, adelgazamiento, enderezamiento de la línea base y segmentación de la imagen entre otros. Cada uno de estos pasos permitirá reducir la variabilidad nociva al momento de reconocer los textos manuscritos (ruido, niveles aleatorios de grises, inclinación de caracteres, zonas con más y menos tinta), aumentando así la probabilidad de reconocer adecuadamente los textos. En este trabajo se consideran dos métodos de adelgazamiento de imágenes, se realiza la implementación y finalmente se lleva adelante una evaluación obteniendo conclusiones relativas a la eficiencia, velocidad y requerimientos, así como también ideas para futuras implementaciones. En la primera parte del documento, se presentan algunas definiciones relacionadas con los métodos utilizados, luego se muestran los resultados obtenidos sobre un mismo conjunto de imágenes aplicando las teorías propuestas y finalmente, se exponen algunas ideas para optimizar los algoritmos elegidos. |
format |
Objeto de conferencia Objeto de conferencia |
author |
De Giusti, Marisa Raquel Vila, María Marta Villarreal, Gonzalo Luján |
author_facet |
De Giusti, Marisa Raquel Vila, María Marta Villarreal, Gonzalo Luján |
author_sort |
De Giusti, Marisa Raquel |
title |
Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural |
title_short |
Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural |
title_full |
Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural |
title_fullStr |
Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural |
title_full_unstemmed |
Digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural |
title_sort |
digitalización y reconocimiento de documentos manuscritos para la preservación de patrimonio cultural |
publishDate |
2005 |
url |
http://sedici.unlp.edu.ar/handle/10915/5534 |
work_keys_str_mv |
AT degiustimarisaraquel digitalizacionyreconocimientodedocumentosmanuscritosparalapreservaciondepatrimoniocultural AT vilamariamarta digitalizacionyreconocimientodedocumentosmanuscritosparalapreservaciondepatrimoniocultural AT villarrealgonzalolujan digitalizacionyreconocimientodedocumentosmanuscritosparalapreservaciondepatrimoniocultural |
bdutipo_str |
Repositorios |
_version_ |
1764820476841951234 |