Reconocimiento automático de artículos científicos
En el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de es...
Guardado en:
Autores principales: | , , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2005
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/21175 |
Aporte de: |
id |
I19-R120-10915-21175 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas reconocimiento automático Graphics recognition and interpretation Optical character recognition (OCR) artículos científicos |
spellingShingle |
Ciencias Informáticas reconocimiento automático Graphics recognition and interpretation Optical character recognition (OCR) artículos científicos Lavallen, Pablo J. Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán Reconocimiento automático de artículos científicos |
topic_facet |
Ciencias Informáticas reconocimiento automático Graphics recognition and interpretation Optical character recognition (OCR) artículos científicos |
description |
En el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de especificidad.
Se implementó un prototipo de software a los efectos de validar y ajustar el comportamiento del modelo. Se trabajó con un corpus de formatos heterogéneos de 600 documentos relacionados al área de las ciencias de la computación y la informática, donde el 50% fueron artículos y el resto textos varios sobre el dominio del conocimiento en cuestión. Se realizaron diferentes experimentos con la intención de probar las reglas y ajustar empíricamente el valor umbral. De los experimentos realizados se obtuvieron resultados, medidos en términos de precisión, que oscilan entre 0.85 y 0.94. |
format |
Objeto de conferencia Objeto de conferencia |
author |
Lavallen, Pablo J. Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán |
author_facet |
Lavallen, Pablo J. Bordignon, Fernando Raúl Alfredo Tolosa, Gabriel Hernán |
author_sort |
Lavallen, Pablo J. |
title |
Reconocimiento automático de artículos científicos |
title_short |
Reconocimiento automático de artículos científicos |
title_full |
Reconocimiento automático de artículos científicos |
title_fullStr |
Reconocimiento automático de artículos científicos |
title_full_unstemmed |
Reconocimiento automático de artículos científicos |
title_sort |
reconocimiento automático de artículos científicos |
publishDate |
2005 |
url |
http://sedici.unlp.edu.ar/handle/10915/21175 |
work_keys_str_mv |
AT lavallenpabloj reconocimientoautomaticodearticuloscientificos AT bordignonfernandoraulalfredo reconocimientoautomaticodearticuloscientificos AT tolosagabrielhernan reconocimientoautomaticodearticuloscientificos |
bdutipo_str |
Repositorios |
_version_ |
1764820465529913346 |