Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano

En este trabajo se comparan dos técnicas multivariadas cuyo objetivo es la clasificación de unidades en categorías definidas previamente. En este caso se evalúan los desempeños del Sistema de Clasificación Bagging (SCB) y el Método del Vecino más Cercano (MVC) para clasificar textos. El criterio de...

Descripción completa

Detalles Bibliográficos
Autor principal: Beltrán, Celina
Formato: article artículo publishedVersion
Lenguaje:Español
Publicado: Grupo IANUS 2019
Materias:
Acceso en línea:http://hdl.handle.net/2133/14288
http://hdl.handle.net/2133/14288
Aporte de:
id I15-R121-2133-14288
record_format dspace
institution Universidad Nacional de Rosario
institution_str I-15
repository_str R-121
collection Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR)
language Español
orig_language_str_mv spa
topic bagging
vecinomascercano
clasificación
spellingShingle bagging
vecinomascercano
clasificación
Beltrán, Celina
Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano
topic_facet bagging
vecinomascercano
clasificación
description En este trabajo se comparan dos técnicas multivariadas cuyo objetivo es la clasificación de unidades en categorías definidas previamente. En este caso se evalúan los desempeños del Sistema de Clasificación Bagging (SCB) y el Método del Vecino más Cercano (MVC) para clasificar textos. El criterio de clasificación es el género al que pertenece el texto (Científico / No Científico) y la caracterización de los textos está basada en la distribución de frecuencias de las categorías morfo-sintácticas. En el SCB se halló una tasa de error global de 26%, siendo 21% para los textos científicos y 33% para los no científicos. Respecto a la precisión y cobertura fueron de 78% y 79% para el género CIENTÍFICO y de 68% y 67% para los textos NO CIENTÍFICOS, respectivamente. Para el MVC el error global en la predicción resultó ser del 13%, correspondiendo un 9% para el género Científico y un 20% para el No Científico y respecto a la precisión y cobertura fueron de 87% y 91% para el género CIENTÍFICO y de 86% y 80% para los textos NO CIENTÍFICOS, respectivamente.
format article
artículo
publishedVersion
author Beltrán, Celina
author_facet Beltrán, Celina
author_sort Beltrán, Celina
title Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano
title_short Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano
title_full Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano
title_fullStr Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano
title_full_unstemmed Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano
title_sort comparación de dos técnicas multivariadas en la categorización de textos: sistema de clasificación bagging y método del vecino más cercano
publisher Grupo IANUS
publishDate 2019
url http://hdl.handle.net/2133/14288
http://hdl.handle.net/2133/14288
work_keys_str_mv AT beltrancelina comparaciondedostecnicasmultivariadasenlacategorizaciondetextossistemadeclasificacionbaggingymetododelvecinomascercano
bdutipo_str Repositorios
_version_ 1764820408356306945