Reconocimiento automático de artículos científicos

En el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de es...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Lavallen, Pablo J., Bordignon, Fernando Raúl Alfredo, Tolosa, Gabriel Hernán
Formato:	Objeto de conferencia
Lenguaje:	Español
Publicado:	2005
Materias:	Ciencias Informáticas reconocimiento automático Graphics recognition and interpretation Optical character recognition (OCR) artículos científicos
Acceso en línea:	http://sedici.unlp.edu.ar/handle/10915/21175
Aporte de:	SEDICI (UNLP) de Universidad Nacional de La Plata

Descripción
Sumario:	En el presente trabajo se describe un modelo basado en un conjunto de reglas heurísticas que permite la detección automática de documentos de carácter científico a partir del análisis lógico de su estructura. En particular, se definen 4 categorías de reglas que se aplican en diferentes niveles de especificidad. Se implementó un prototipo de software a los efectos de validar y ajustar el comportamiento del modelo. Se trabajó con un corpus de formatos heterogéneos de 600 documentos relacionados al área de las ciencias de la computación y la informática, donde el 50% fueron artículos y el resto textos varios sobre el dominio del conocimiento en cuestión. Se realizaron diferentes experimentos con la intención de probar las reglas y ajustar empíricamente el valor umbral. De los experimentos realizados se obtuvieron resultados, medidos en términos de precisión, que oscilan entre 0.85 y 0.94.

Reconocimiento automático de artículos científicos

Ejemplares similares