Uma experiência de utilização da análise semântica latente para o tratamento de documentos

Este artigo relata experimentos realizados para a realização automática de tarefas em Recuperação de Informações: recuperação e agrupamento de documentos. Nesta abordagem é empregada a Análise Semântica Latente (Latent Semantic Analysis - LSA), que emprega um método para a extração e representação d...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Gean, Chu Chia, Kaestner, Celso A. A.
Formato: Objeto de conferencia
Lenguaje:Portugués
Publicado: 2003
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/22603
Aporte de:
Descripción
Sumario:Este artigo relata experimentos realizados para a realização automática de tarefas em Recuperação de Informações: recuperação e agrupamento de documentos. Nesta abordagem é empregada a Análise Semântica Latente (Latent Semantic Analysis - LSA), que emprega um método para a extração e representação da semântica contextual das palavras por meio de computações estatísticas aplicadas em uma coleção de documentos. A técnica LSA tenta explorar as relações semânticas “latentes” ou “implícitas” no texto, que são dadas pelas relações entre os termos, ao invés de considerar a semântica das palavras isoladas. Uma forma corrente de aplicar a LSA utiliza a técnica de decomposição em valores singulares (Singular Value Decomposition - SVD), como forma de redução da dimensionalidade do espaço de termos. A técnica empregada e sua aplicação á tarefas de recuperação e agrupamento são descritas por meio de sua aplicação a base de documentos padrão TREC, e os resultados obtidos são detalhados.