Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación
En esta investigación se propone el estudio, evaluación y comparación de dos técnicas estadísticas multivariadas de clasificación, Regresión Logística y Árboles de Clasificación, siendo de interés evaluar el desempeño de las mismas cuando son utilizadas en datos simulados bajo distintas situacion...
Guardado en:
Autores principales: | , |
---|---|
Formato: | article artículo publishedVersion |
Lenguaje: | Español |
Publicado: |
Grupo IANUS
2020
|
Materias: | |
Acceso en línea: | http://hdl.handle.net/2133/18921 http://hdl.handle.net/2133/18921 |
Aporte de: |
id |
I15-R121-2133-18921 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de Rosario |
institution_str |
I-15 |
repository_str |
R-121 |
collection |
Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR) |
language |
Español |
orig_language_str_mv |
spa |
topic |
Regresión logística Árboles de clasificación Simulación |
spellingShingle |
Regresión logística Árboles de clasificación Simulación Beltrán, Celina Barbona, Ivana Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación |
topic_facet |
Regresión logística Árboles de clasificación Simulación |
description |
En esta investigación se propone el estudio, evaluación y comparación de dos técnicas
estadísticas multivariadas de clasificación, Regresión Logística y Árboles de
Clasificación, siendo de interés evaluar el desempeño de las mismas cuando son
utilizadas en datos simulados bajo distintas situaciones.
Se simularon datos bajo 4 condiciones diferentes que diferían en la estructura de
correlaciones entre las variables. El escenario 1 corresponde a datos provenientes de una
población en la que los predictores están fuertemente correlacionados con la respuesta
pero no entre ellos. El escenario 2 plantea una simulación a partir de una población con
poca correlación de la respuesta con las variables predictoras pero éstas correlacionadas
entre sí. En el escenario 3, la correlación presente en la población origen de la
simulación es importante tanto entre las predictoras como entre éstas y la respuesta. Por
último, el escenario 4 corresponde a una población original en la que no existe ningún
tipo de correlación de magnitud importante entre las variables, ni de los predictores con
la respuesta ni entre ellos.
Se observó como resultado principal, que en condiciones donde las variables predictoras
están altamente correlacionadas con la respuesta, si bien los AC mostraron un
porcentaje de error significativamente menor en la clasificación, ambas metodologías
funcionan satisfactoriamente. Sin embargo, cuando las condiciones para obtener una
clasificación satisfactoria son desfavorables (predictores poco correlacionados con la
respuesta) los AC logran un porcentaje de clasificación correcta notablemente superior a
la RL, con la desventaja de obtener un árbol con numerosos nodos terminales utilizando
la información de prácticamente todas las variables explicativas. |
format |
article artículo publishedVersion |
author |
Beltrán, Celina Barbona, Ivana |
author_facet |
Beltrán, Celina Barbona, Ivana |
author_sort |
Beltrán, Celina |
title |
Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación |
title_short |
Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación |
title_full |
Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación |
title_fullStr |
Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación |
title_full_unstemmed |
Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación |
title_sort |
comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: regresión logística y árboles de clasificación |
publisher |
Grupo IANUS |
publishDate |
2020 |
url |
http://hdl.handle.net/2133/18921 http://hdl.handle.net/2133/18921 |
work_keys_str_mv |
AT beltrancelina comparaciondeldesempenodetecnicasmultivariadasdeclasificacionendatossimuladosbajodistintosescenariosregresionlogisticayarbolesdeclasificacion AT barbonaivana comparaciondeldesempenodetecnicasmultivariadasdeclasificacionendatossimuladosbajodistintosescenariosregresionlogisticayarbolesdeclasificacion |
bdutipo_str |
Repositorios |
_version_ |
1764820409911345153 |