Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano
En este trabajo se comparan dos técnicas multivariadas cuyo objetivo es la clasificación de unidades en categorías definidas previamente. En este caso se evalúan los desempeños del Sistema de Clasificación Bagging (SCB) y el Método del Vecino más Cercano (MVC) para clasificar textos. El criterio de...
Autor principal: | |
---|---|
Formato: | article artículo publishedVersion |
Lenguaje: | Español |
Publicado: |
Grupo IANUS
2019
|
Materias: | |
Acceso en línea: | http://hdl.handle.net/2133/14288 http://hdl.handle.net/2133/14288 |
Aporte de: |
id |
I15-R121-2133-14288 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de Rosario |
institution_str |
I-15 |
repository_str |
R-121 |
collection |
Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR) |
language |
Español |
orig_language_str_mv |
spa |
topic |
bagging vecinomascercano clasificación |
spellingShingle |
bagging vecinomascercano clasificación Beltrán, Celina Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano |
topic_facet |
bagging vecinomascercano clasificación |
description |
En este trabajo se comparan dos técnicas multivariadas cuyo objetivo es la clasificación de unidades en categorías definidas previamente. En este caso se evalúan los desempeños del Sistema de Clasificación Bagging (SCB) y el Método del Vecino más Cercano (MVC) para clasificar textos. El criterio de clasificación es el género al que pertenece el texto (Científico / No Científico) y la caracterización de los textos está basada en la distribución de frecuencias de las categorías morfo-sintácticas.
En el SCB se halló una tasa de error global de 26%, siendo 21% para los textos científicos y 33% para los no científicos. Respecto a la precisión y cobertura fueron de 78% y 79% para el género CIENTÍFICO y de 68% y 67% para los textos NO CIENTÍFICOS, respectivamente.
Para el MVC el error global en la predicción resultó ser del 13%, correspondiendo un 9% para el género Científico y un 20% para el No Científico y respecto a la precisión y cobertura fueron de 87% y 91% para el género CIENTÍFICO y de 86% y 80% para los textos NO CIENTÍFICOS, respectivamente. |
format |
article artículo publishedVersion |
author |
Beltrán, Celina |
author_facet |
Beltrán, Celina |
author_sort |
Beltrán, Celina |
title |
Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano |
title_short |
Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano |
title_full |
Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano |
title_fullStr |
Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano |
title_full_unstemmed |
Comparación de dos técnicas multivariadas en la categorización de textos: Sistema de clasificación Bagging y Método del vecino más cercano |
title_sort |
comparación de dos técnicas multivariadas en la categorización de textos: sistema de clasificación bagging y método del vecino más cercano |
publisher |
Grupo IANUS |
publishDate |
2019 |
url |
http://hdl.handle.net/2133/14288 http://hdl.handle.net/2133/14288 |
work_keys_str_mv |
AT beltrancelina comparaciondedostecnicasmultivariadasenlacategorizaciondetextossistemadeclasificacionbaggingymetododelvecinomascercano |
bdutipo_str |
Repositorios |
_version_ |
1764820408356306945 |