Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores
Atualmente, devido ao volume grande de texto disponível em meios digitais, a classificação automática de documentos se torna uma tarefa importante da área do Tratamento Automatizado de Informações. Neste artigo descreve-se uma nova abordagem para o problema, baseada no modelo vetorial para o tratame...
Guardado en:
| Autor principal: | |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Portugués |
| Publicado: |
2004
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/22507 |
| Aporte de: |
| id |
I19-R120-10915-22507 |
|---|---|
| record_format |
dspace |
| institution |
Universidad Nacional de La Plata |
| institution_str |
I-19 |
| repository_str |
R-120 |
| collection |
SEDICI (UNLP) |
| language |
Portugués |
| topic |
Ciencias Informáticas Intelligent agents ARTIFICIAL INTELLIGENCE Recuperação de Informações Classificação Automática de Documentos Aprendizagem de Máquina Baseada em Instâncias Subespaços Aleatórios Conjuntos de Classificadores Information Retrieval Automatic Text Categorization nstance-Based Machine Learning Random Subspaces Multiple classifiers |
| spellingShingle |
Ciencias Informáticas Intelligent agents ARTIFICIAL INTELLIGENCE Recuperação de Informações Classificação Automática de Documentos Aprendizagem de Máquina Baseada em Instâncias Subespaços Aleatórios Conjuntos de Classificadores Information Retrieval Automatic Text Categorization nstance-Based Machine Learning Random Subspaces Multiple classifiers Gean, Chu Chia Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores |
| topic_facet |
Ciencias Informáticas Intelligent agents ARTIFICIAL INTELLIGENCE Recuperação de Informações Classificação Automática de Documentos Aprendizagem de Máquina Baseada em Instâncias Subespaços Aleatórios Conjuntos de Classificadores Information Retrieval Automatic Text Categorization nstance-Based Machine Learning Random Subspaces Multiple classifiers |
| description |
Atualmente, devido ao volume grande de texto disponível em meios digitais, a classificação automática de documentos se torna uma tarefa importante da área do Tratamento Automatizado de Informações. Neste artigo descreve-se uma nova abordagem para o problema, baseada no modelo vetorial para o tratamento de textos e no uso de técnicas de Reconhecimento de Padrões. Como coleções de textos produzem espaços vetoriais de dimensão bastante elevada, o problema é tratado usando várias técnicas de préprocessamento e um conjunto de classificadores baseados em instâncias – do tipo k-vizinhos mais próximos, cada um dos quais dedicado a um subespaço do espaço original. A classificação final é obtida por uma combinação de resultados dos classificadores individuais. Esta abordagem foi aplicada a documentos oriundos das bases de dados TIPSTER e REUTERS, amplamente utilizadas na área. São apresentados os principais resultados obtidos e algumas conclusões e perspectivas do trabalho. |
| format |
Objeto de conferencia Objeto de conferencia |
| author |
Gean, Chu Chia |
| author_facet |
Gean, Chu Chia |
| author_sort |
Gean, Chu Chia |
| title |
Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores |
| title_short |
Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores |
| title_full |
Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores |
| title_fullStr |
Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores |
| title_full_unstemmed |
Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores |
| title_sort |
classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores |
| publishDate |
2004 |
| url |
http://sedici.unlp.edu.ar/handle/10915/22507 |
| work_keys_str_mv |
AT geanchuchia classificacaoautomaticadedocumentosusandosubespacosaleatorioseconjuntosdeclassificadores |
| bdutipo_str |
Repositorios |
| _version_ |
1764820465883283457 |