Classificação automática de texto buscando similaridade de palavras e significados ocultos
Adotamos o m etodo da indexação da semântica latente (LSI) para classifi car documentos que estejam relacionados por algum meio não restrito apenas aos termos presentes, mas buscando outras formas de similaridades. A redu cão de dimensionalidade da matriz Termo-Documento n~ao e novidade, sendo nor...
Guardado en:
Autores principales: | , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Portugués |
Publicado: |
2012
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/23750 |
Aporte de: |
id |
I19-R120-10915-23750 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Portugués |
topic |
Ciencias Informáticas base de datos Clustering Semantics Data mining information retrieval latent semantic indexing |
spellingShingle |
Ciencias Informáticas base de datos Clustering Semantics Data mining information retrieval latent semantic indexing Rocha, Ricardo Luis de Azevedo da Catae, Fabricio S. Classificação automática de texto buscando similaridade de palavras e significados ocultos |
topic_facet |
Ciencias Informáticas base de datos Clustering Semantics Data mining information retrieval latent semantic indexing |
description |
Adotamos o m etodo da indexação da semântica latente (LSI) para classifi car documentos que estejam relacionados por algum meio não restrito apenas aos termos presentes, mas buscando outras formas de similaridades.
A redu cão de dimensionalidade da matriz Termo-Documento n~ao e novidade, sendo normalmente adotado entre 200 a 300 dimensões.
Nesse trabalho, transformamos o LSI em um algoritmo semi-supervisionado e determinamos o n umero ideal de dimensão durante a fase de treinamento.
O algoritmo utiliza um espa co isom etrico a aquele de nido pela matriz Termo-Documento para acelerar os c alculos. |
format |
Objeto de conferencia Objeto de conferencia |
author |
Rocha, Ricardo Luis de Azevedo da Catae, Fabricio S. |
author_facet |
Rocha, Ricardo Luis de Azevedo da Catae, Fabricio S. |
author_sort |
Rocha, Ricardo Luis de Azevedo da |
title |
Classificação automática de texto buscando similaridade de palavras e significados ocultos |
title_short |
Classificação automática de texto buscando similaridade de palavras e significados ocultos |
title_full |
Classificação automática de texto buscando similaridade de palavras e significados ocultos |
title_fullStr |
Classificação automática de texto buscando similaridade de palavras e significados ocultos |
title_full_unstemmed |
Classificação automática de texto buscando similaridade de palavras e significados ocultos |
title_sort |
classificação automática de texto buscando similaridade de palavras e significados ocultos |
publishDate |
2012 |
url |
http://sedici.unlp.edu.ar/handle/10915/23750 |
work_keys_str_mv |
AT rocharicardoluisdeazevedoda classificacaoautomaticadetextobuscandosimilaridadedepalavrasesignificadosocultos AT cataefabricios classificacaoautomaticadetextobuscandosimilaridadedepalavrasesignificadosocultos |
bdutipo_str |
Repositorios |
_version_ |
1764820466152767491 |