Reconocimiento automático de artículos científicos

En el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de es...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Lavallen, Pablo J., Bordignon, Fernando Raúl Alfredo, Tolosa, Gabriel Hernán
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2005
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/21175
Aporte de:
id I19-R120-10915-21175
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
reconocimiento automático
Graphics recognition and interpretation
Optical character recognition (OCR)
artículos científicos
spellingShingle Ciencias Informáticas
reconocimiento automático
Graphics recognition and interpretation
Optical character recognition (OCR)
artículos científicos
Lavallen, Pablo J.
Bordignon, Fernando Raúl Alfredo
Tolosa, Gabriel Hernán
Reconocimiento automático de artículos científicos
topic_facet Ciencias Informáticas
reconocimiento automático
Graphics recognition and interpretation
Optical character recognition (OCR)
artículos científicos
description En el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de especificidad. Se implementó un prototipo de software a los efectos de validar y ajustar el comportamiento del modelo. Se trabajó con un corpus de formatos heterogéneos de 600 documentos relacionados al área de las ciencias de la computación y la informática, donde el 50% fueron artículos y el resto textos varios sobre el dominio del conocimiento en cuestión. Se realizaron diferentes experimentos con la intención de probar las reglas y ajustar empíricamente el valor umbral. De los experimentos realizados se obtuvieron resultados, medidos en términos de precisión, que oscilan entre 0.85 y 0.94.
format Objeto de conferencia
Objeto de conferencia
author Lavallen, Pablo J.
Bordignon, Fernando Raúl Alfredo
Tolosa, Gabriel Hernán
author_facet Lavallen, Pablo J.
Bordignon, Fernando Raúl Alfredo
Tolosa, Gabriel Hernán
author_sort Lavallen, Pablo J.
title Reconocimiento automático de artículos científicos
title_short Reconocimiento automático de artículos científicos
title_full Reconocimiento automático de artículos científicos
title_fullStr Reconocimiento automático de artículos científicos
title_full_unstemmed Reconocimiento automático de artículos científicos
title_sort reconocimiento automático de artículos científicos
publishDate 2005
url http://sedici.unlp.edu.ar/handle/10915/21175
work_keys_str_mv AT lavallenpabloj reconocimientoautomaticodearticuloscientificos
AT bordignonfernandoraulalfredo reconocimientoautomaticodearticuloscientificos
AT tolosagabrielhernan reconocimientoautomaticodearticuloscientificos
bdutipo_str Repositorios
_version_ 1764820465529913346