Un enfoque híbrido para la clasificación automática de obras literarias

Al contar cada vez con mayor volumen de datos a analizar y que gran parte de estos sea en formato texto, resulta muy dificultoso para las personas poder entender y aprovechar el valor que ofrecen. La clasificación automática de textos consiste en asignar a un documento de texto una serie de clases u...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Rodríguez, Guillermo Horacio, Litman, Julián, Bolaños, Alejandro, Taboada, Gabriel Hugo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2019
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/87848
Aporte de:
Descripción
Sumario:Al contar cada vez con mayor volumen de datos a analizar y que gran parte de estos sea en formato texto, resulta muy dificultoso para las personas poder entender y aprovechar el valor que ofrecen. La clasificación automática de textos consiste en asignar a un documento de texto una serie de clases utilizando técnicas de Machine Learning basado en su contenido y los temas que lo componen. La clasifi-cación automática tiene importantes aplicaciones en la administración de contenido, la minería de opinión, el análisis de reseñas de un producto, filtros de SPAM y análisis de sentimiento en redes sociales. Este trabajo explica y detalla paso a paso una es-trategia híbrida entre aprendizaje no supervisado y clasificación automática de textos basada en obras clásicas y literatura técnica trabajando sobre textos no estructurados y seleccionando las técnicas apropiadas para llegar a una aplicación concreta. Luego de realizar evaluaciones con conjuntos de libros, los resultados obtenidos permitieron verificar que nuestro enfoque es efectivo para la asignación automática de categorías a obras literarias.