Un enfoque híbrido para la clasificación automática de obras literarias
Al contar cada vez con mayor volumen de datos a analizar y que gran parte de estos sea en formato texto, resulta muy dificultoso para las personas poder entender y aprovechar el valor que ofrecen. La clasificación automática de textos consiste en asignar a un documento de texto una serie de clases u...
Guardado en:
| Autores principales: | , , , |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2019
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/87848 |
| Aporte de: |
| Sumario: | Al contar cada vez con mayor volumen de datos a analizar y que gran parte de estos sea en formato texto, resulta muy dificultoso para las personas poder entender y aprovechar el valor que ofrecen. La clasificación automática de textos consiste en asignar a un documento de texto una serie de clases utilizando técnicas de Machine Learning basado en su contenido y los temas que lo componen. La clasifi-cación automática tiene importantes aplicaciones en la administración de contenido, la minería de opinión, el análisis de reseñas de un producto, filtros de SPAM y análisis de sentimiento en redes sociales. Este trabajo explica y detalla paso a paso una es-trategia híbrida entre aprendizaje no supervisado y clasificación automática de textos basada en obras clásicas y literatura técnica trabajando sobre textos no estructurados y seleccionando las técnicas apropiadas para llegar a una aplicación concreta. Luego de realizar evaluaciones con conjuntos de libros, los resultados obtenidos permitieron verificar que nuestro enfoque es efectivo para la asignación automática de categorías a obras literarias. |
|---|