Uma experiência de utilização da análise semântica latente para o tratamento de documentos
Este artigo relata experimentos realizados para a realização automática de tarefas em Recuperação de Informações: recuperação e agrupamento de documentos. Nesta abordagem é empregada a Análise Semântica Latente (Latent Semantic Analysis - LSA), que emprega um método para a extração e representação d...
Guardado en:
| Autores principales: | , |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Portugués |
| Publicado: |
2003
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/22603 |
| Aporte de: |
| Sumario: | Este artigo relata experimentos realizados para a realização automática de tarefas em Recuperação de Informações: recuperação e agrupamento de documentos. Nesta abordagem é empregada a Análise Semântica Latente (Latent Semantic Analysis - LSA), que emprega um método para a extração e representação da semântica contextual das palavras por meio de computações estatísticas aplicadas em uma coleção de documentos. A técnica LSA tenta explorar as relações semânticas “latentes” ou “implícitas” no texto, que são dadas pelas relações entre os termos, ao invés de considerar a semântica das palavras isoladas.
Uma forma corrente de aplicar a LSA utiliza a técnica de decomposição em valores singulares (Singular Value Decomposition - SVD), como forma de redução da dimensionalidade do espaço de termos. A técnica empregada e sua aplicação á tarefas de recuperação e agrupamento são descritas por meio de sua aplicação a base de documentos padrão TREC, e os resultados obtidos são detalhados. |
|---|