Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito
El crecimiento de los datos producto del Acceso Abierto a las publicaciones académicas y científicas han generado estudios que posibilitan la interrelación de áreas como la lingüística y la computación en, por ejemplo, la extracción automática de datos para la creación de modelos teóricos, reconocim...
Guardado en:
Autores principales: | , , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2017
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/63711 |
Aporte de: |
id |
I19-R120-10915-63711 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas reconocimiento de texto retórica RST IMRD Python |
spellingShingle |
Ciencias Informáticas reconocimiento de texto retórica RST IMRD Python Texier, José Zambrano, Jusmeidy Frati, Fernando Emmanuel Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito |
topic_facet |
Ciencias Informáticas reconocimiento de texto retórica RST IMRD Python |
description |
El crecimiento de los datos producto del Acceso Abierto a las publicaciones académicas y científicas han generado estudios que posibilitan la interrelación de áreas como la lingüística y la computación en, por ejemplo, la extracción automática de datos para la creación de modelos teóricos, reconocimiento de estructuras para validación, etc. Este trabajo tiene como objetivo describir un framework elaborado a partir de la Rhetorical Structure Theory (RST) con el lenguaje Python a un corpus de 42 artículos científicos en español de la Universidad Nacional de Chilecito. El análisis se hizo sobre la base de un diseño modular informático y el trabajo manual de un lingüista experto, proceso que sirve para calibrar la propuesta y, luego, ser aplicada a un corpus mayor. Las variables que se consideraron fueron el título, resumen y palabras clave de los 42 artículos y la estructura canónica de un resumen científico (introducción, método, resultados y discusión -IMRD). Los resultados muestran que existen discrepancias en la frecuencia de ciertos elementos en los textos, pero a su vez, denotan coincidencias interesantes para este tipo de análisis textuales. |
format |
Objeto de conferencia Objeto de conferencia |
author |
Texier, José Zambrano, Jusmeidy Frati, Fernando Emmanuel |
author_facet |
Texier, José Zambrano, Jusmeidy Frati, Fernando Emmanuel |
author_sort |
Texier, José |
title |
Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito |
title_short |
Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito |
title_full |
Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito |
title_fullStr |
Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito |
title_full_unstemmed |
Framework para el procesamiento lingüístico de artículos científicos : Caso de estudio: Universidad Nacional de Chilecito |
title_sort |
framework para el procesamiento lingüístico de artículos científicos : caso de estudio: universidad nacional de chilecito |
publishDate |
2017 |
url |
http://sedici.unlp.edu.ar/handle/10915/63711 |
work_keys_str_mv |
AT texierjose frameworkparaelprocesamientolinguisticodearticuloscientificoscasodeestudiouniversidadnacionaldechilecito AT zambranojusmeidy frameworkparaelprocesamientolinguisticodearticuloscientificoscasodeestudiouniversidadnacionaldechilecito AT fratifernandoemmanuel frameworkparaelprocesamientolinguisticodearticuloscientificoscasodeestudiouniversidadnacionaldechilecito |
bdutipo_str |
Repositorios |
_version_ |
1764820479223267328 |