Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación

En esta investigación se propone el estudio, evaluación y comparación de dos técnicas estadísticas multivariadas de clasificación, Regresión Logística y Árboles de Clasificación, siendo de interés evaluar el desempeño de las mismas cuando son utilizadas en datos simulados bajo distintas situacion...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Beltrán, Celina, Barbona, Ivana
Formato: article artículo publishedVersion
Lenguaje:Español
Publicado: Grupo IANUS 2020
Materias:
Acceso en línea:http://hdl.handle.net/2133/18921
http://hdl.handle.net/2133/18921
Aporte de:
id I15-R121-2133-18921
record_format dspace
institution Universidad Nacional de Rosario
institution_str I-15
repository_str R-121
collection Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR)
language Español
orig_language_str_mv spa
topic Regresión logística
Árboles de clasificación
Simulación
spellingShingle Regresión logística
Árboles de clasificación
Simulación
Beltrán, Celina
Barbona, Ivana
Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación
topic_facet Regresión logística
Árboles de clasificación
Simulación
description En esta investigación se propone el estudio, evaluación y comparación de dos técnicas estadísticas multivariadas de clasificación, Regresión Logística y Árboles de Clasificación, siendo de interés evaluar el desempeño de las mismas cuando son utilizadas en datos simulados bajo distintas situaciones. Se simularon datos bajo 4 condiciones diferentes que diferían en la estructura de correlaciones entre las variables. El escenario 1 corresponde a datos provenientes de una población en la que los predictores están fuertemente correlacionados con la respuesta pero no entre ellos. El escenario 2 plantea una simulación a partir de una población con poca correlación de la respuesta con las variables predictoras pero éstas correlacionadas entre sí. En el escenario 3, la correlación presente en la población origen de la simulación es importante tanto entre las predictoras como entre éstas y la respuesta. Por último, el escenario 4 corresponde a una población original en la que no existe ningún tipo de correlación de magnitud importante entre las variables, ni de los predictores con la respuesta ni entre ellos. Se observó como resultado principal, que en condiciones donde las variables predictoras están altamente correlacionadas con la respuesta, si bien los AC mostraron un porcentaje de error significativamente menor en la clasificación, ambas metodologías funcionan satisfactoriamente. Sin embargo, cuando las condiciones para obtener una clasificación satisfactoria son desfavorables (predictores poco correlacionados con la respuesta) los AC logran un porcentaje de clasificación correcta notablemente superior a la RL, con la desventaja de obtener un árbol con numerosos nodos terminales utilizando la información de prácticamente todas las variables explicativas.
format article
artículo
publishedVersion
author Beltrán, Celina
Barbona, Ivana
author_facet Beltrán, Celina
Barbona, Ivana
author_sort Beltrán, Celina
title Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación
title_short Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación
title_full Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación
title_fullStr Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación
title_full_unstemmed Comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: Regresión Logística y Árboles de Clasificación
title_sort comparación del desempeño de técnicas multivariadas de clasificación en datos simulados bajo distintos escenarios: regresión logística y árboles de clasificación
publisher Grupo IANUS
publishDate 2020
url http://hdl.handle.net/2133/18921
http://hdl.handle.net/2133/18921
work_keys_str_mv AT beltrancelina comparaciondeldesempenodetecnicasmultivariadasdeclasificacionendatossimuladosbajodistintosescenariosregresionlogisticayarbolesdeclasificacion
AT barbonaivana comparaciondeldesempenodetecnicasmultivariadasdeclasificacionendatossimuladosbajodistintosescenariosregresionlogisticayarbolesdeclasificacion
bdutipo_str Repositorios
_version_ 1764820409911345153