Experimentos con métodos de extracción de la idea principal de un texto sobre una colección de noticias periodísticas en español

Este trabajo tiene por objetivo evaluar distintas técnicas de selección de la oración que mejor representa la idea principal (gist) de un texto corto (noticia de prensa) en español. Se utilizaron dos métodos clásicos de la literatura y dos propuestas extra, basadas en la estructura de los documentos...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Tolosa, Gabriel Hernán, Peri, Jorge Alberto, Bordignon, Fernando Raúl Alfredo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2005
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/23064
Aporte de:
Descripción
Sumario:Este trabajo tiene por objetivo evaluar distintas técnicas de selección de la oración que mejor representa la idea principal (gist) de un texto corto (noticia de prensa) en español. Se utilizaron dos métodos clásicos de la literatura y dos propuestas extra, basadas en la estructura de los documentos. Para la evaluación se tomó el proceso de clasificación para determinar la capacidad del extracto para “representar” el contenido de la noticia y su categoría. Los métodos evaluados obtienen un buen comportamiento, superando –en algunos casos– el 90% de eficiencia respecto del experimento utilizando la noticia completa. Complementariamente, se realizaron experiencias utilizando combinaciones de los mejores métodos, logrando un incremento de la eficiencia de un 5%.