Minería de texto : Generación de resumen automático

La generación automática de resúmenes tiene como finalidad identificar la información más importante dentro de un texto o un conjunto de documentos y presentar los resultados obtenidos a los usuarios. Esta disciplina forma parte de las aplicaciones de la minería de texto donde a través de técnicas d...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Rosas, Víctor Emanuel
Otros Autores: Cardoso, Carolina A.
Formato: acceptedVersion Tesis de grado Trabajo final de grado
Lenguaje:Español
Publicado: Universidad Católica de Salta. Facultad de Ingeniería (Salta) 2019
Materias:
Acceso en línea:https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=66537
Aporte de:
Descripción
Sumario:La generación automática de resúmenes tiene como finalidad identificar la información más importante dentro de un texto o un conjunto de documentos y presentar los resultados obtenidos a los usuarios. Esta disciplina forma parte de las aplicaciones de la minería de texto donde a través de técnicas de aprendizaje automático se busca analizar textos no estructurados, reconocer patrones, comprender y extraer nueva información dentro de los mismos. Este proyecto se basa en analizar textos periodísticos publicados en un portal web informativo, analizando los aspectos generales y centrarse en la generación de resúmenes por extracción utilizando técnicas de aprendizaje automático supervisado. Para lograr esto se estudian las características de los textos, obteniendo los atributos más relevantes para la construcción de un modelo de clasificación, que permite catalogar los fragmentos de los artículos distinguiendo las oraciones más importantes dentro del mismo. El proceso de análisis y clasificación de textos se realiza sobre el software de minería de datos RapidMiner, y se hace uso de tecnologías web para poder presentar a los lectores los resultados obtenidos, a través de una interfaz que permite una fácil visualización de los fragmentos más relevantes de una noticia.