Método de clasificación supervisada support vector machine: una aplicación a la clasificación automática de textos
Support Vector Machine (SVM) es un método de clasificación supervisada que permite determinar la frontera óptima entre dos grupos que pueden ser linealmente separables o no. Mediante la utilización de vectores soporte se encuentra un hiperplano o conjunto de hiperplanos en un espacio de dimensionali...
Autores principales: | , |
---|---|
Formato: | article artículo publishedVersion |
Lenguaje: | Español |
Publicado: |
Grupo IANUS
2019
|
Materias: | |
Acceso en línea: | http://hdl.handle.net/2133/14280 http://hdl.handle.net/2133/14280 |
Aporte de: |
id |
I15-R121-2133-14280 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de Rosario |
institution_str |
I-15 |
repository_str |
R-121 |
collection |
Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR) |
language |
Español |
orig_language_str_mv |
spa |
topic |
support vector machine learning |
spellingShingle |
support vector machine learning Barbona, Ivana Beltrán, Celina Método de clasificación supervisada support vector machine: una aplicación a la clasificación automática de textos |
topic_facet |
support vector machine learning |
description |
Support Vector Machine (SVM) es un método de clasificación supervisada que permite determinar la frontera óptima entre dos grupos que pueden ser linealmente separables o no. Mediante la utilización de vectores soporte se encuentra un hiperplano o conjunto de hiperplanos en un espacio de dimensionalidad que puede llegar a ser infinita. Luego, mediante una trasformación inversa se obtiene la frontera que separa a esos dos grupos en el espacio original.
En el caso de clasificar en 2 categorías, se busca el hiperplano que tenga la máxima distancia o margen con los puntos más cercanos a él. Los puntos pertenecientes a una categoría estarán a un lado del hiperplano mientras que los casos que pertenezcan a la otra categoría estarán al otro lado.
En este trabajo se realiza una aplicación del método SVM para clasificar un conjunto de textos. El criterio de clasificación utilizado fue el género al que pertenece el texto (Científico / No Científico). La caracterización de los textos está basada en la distribución de frecuencias de las categorías morfo-sintácticas. Los resultados finales representan porcentajes de mala clasificación en una grilla para el método SVM variando la constante de penalización C y otros parámetros dentro de varios kernel considerados. El mejor desempeño se obtuvo para SVM con kernel lineal y C= 0.1 y 0.2 (19.33%) |
format |
article artículo publishedVersion |
author |
Barbona, Ivana Beltrán, Celina |
author_facet |
Barbona, Ivana Beltrán, Celina |
author_sort |
Barbona, Ivana |
title |
Método de clasificación supervisada support vector machine: una aplicación a la clasificación automática de textos |
title_short |
Método de clasificación supervisada support vector machine: una aplicación a la clasificación automática de textos |
title_full |
Método de clasificación supervisada support vector machine: una aplicación a la clasificación automática de textos |
title_fullStr |
Método de clasificación supervisada support vector machine: una aplicación a la clasificación automática de textos |
title_full_unstemmed |
Método de clasificación supervisada support vector machine: una aplicación a la clasificación automática de textos |
title_sort |
método de clasificación supervisada support vector machine: una aplicación a la clasificación automática de textos |
publisher |
Grupo IANUS |
publishDate |
2019 |
url |
http://hdl.handle.net/2133/14280 http://hdl.handle.net/2133/14280 |
work_keys_str_mv |
AT barbonaivana metododeclasificacionsupervisadasupportvectormachineunaaplicacionalaclasificacionautomaticadetextos AT beltrancelina metododeclasificacionsupervisadasupportvectormachineunaaplicacionalaclasificacionautomaticadetextos |
bdutipo_str |
Repositorios |
_version_ |
1764820408347918339 |