Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores

Atualmente, devido ao volume grande de texto disponível em meios digitais, a classificação automática de documentos se torna uma tarefa importante da área do Tratamento Automatizado de Informações. Neste artigo descreve-se uma nova abordagem para o problema, baseada no modelo vetorial para o tratame...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Gean, Chu Chia
Formato: Objeto de conferencia
Lenguaje:Portugués
Publicado: 2004
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/22507
Aporte de:
id I19-R120-10915-22507
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Portugués
topic Ciencias Informáticas
Intelligent agents
ARTIFICIAL INTELLIGENCE
Recuperação de Informações
Classificação Automática de Documentos
Aprendizagem de Máquina Baseada em Instâncias
Subespaços Aleatórios
Conjuntos de Classificadores
Information Retrieval
Automatic Text Categorization
nstance-Based Machine Learning
Random Subspaces
Multiple classifiers
spellingShingle Ciencias Informáticas
Intelligent agents
ARTIFICIAL INTELLIGENCE
Recuperação de Informações
Classificação Automática de Documentos
Aprendizagem de Máquina Baseada em Instâncias
Subespaços Aleatórios
Conjuntos de Classificadores
Information Retrieval
Automatic Text Categorization
nstance-Based Machine Learning
Random Subspaces
Multiple classifiers
Gean, Chu Chia
Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores
topic_facet Ciencias Informáticas
Intelligent agents
ARTIFICIAL INTELLIGENCE
Recuperação de Informações
Classificação Automática de Documentos
Aprendizagem de Máquina Baseada em Instâncias
Subespaços Aleatórios
Conjuntos de Classificadores
Information Retrieval
Automatic Text Categorization
nstance-Based Machine Learning
Random Subspaces
Multiple classifiers
description Atualmente, devido ao volume grande de texto disponível em meios digitais, a classificação automática de documentos se torna uma tarefa importante da área do Tratamento Automatizado de Informações. Neste artigo descreve-se uma nova abordagem para o problema, baseada no modelo vetorial para o tratamento de textos e no uso de técnicas de Reconhecimento de Padrões. Como coleções de textos produzem espaços vetoriais de dimensão bastante elevada, o problema é tratado usando várias técnicas de préprocessamento e um conjunto de classificadores baseados em instâncias – do tipo k-vizinhos mais próximos, cada um dos quais dedicado a um subespaço do espaço original. A classificação final é obtida por uma combinação de resultados dos classificadores individuais. Esta abordagem foi aplicada a documentos oriundos das bases de dados TIPSTER e REUTERS, amplamente utilizadas na área. São apresentados os principais resultados obtidos e algumas conclusões e perspectivas do trabalho.
format Objeto de conferencia
Objeto de conferencia
author Gean, Chu Chia
author_facet Gean, Chu Chia
author_sort Gean, Chu Chia
title Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores
title_short Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores
title_full Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores
title_fullStr Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores
title_full_unstemmed Classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores
title_sort classificação automática de documentos usando subespaços aleatórios e conjuntos de classificadores
publishDate 2004
url http://sedici.unlp.edu.ar/handle/10915/22507
work_keys_str_mv AT geanchuchia classificacaoautomaticadedocumentosusandosubespacosaleatorioseconjuntosdeclassificadores
bdutipo_str Repositorios
_version_ 1764820465883283457