AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES

Respecto a los resultados encontrados en la clasificación según la disciplina de los textos se pueden enumerar los siguientes resultados: -Los resultados del análisis morfológico de los textos se analizaron teniendo en cuenta simultáneamente todas las mediciones realizadas sobre ellos. -El análi...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Beltrán, Celina
Formato: report informe técnico
Lenguaje:Español
Publicado: 2021
Materias:
Acceso en línea:http://hdl.handle.net/2133/21441
http://hdl.handle.net/2133/21441
Aporte de:
id I15-R121-2133-21441
record_format dspace
institution Universidad Nacional de Rosario
institution_str I-15
repository_str R-121
collection Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR)
language Español
topic Árboles de clasificación
Regresión logística
Clasificación de textos
spellingShingle Árboles de clasificación
Regresión logística
Clasificación de textos
Beltrán, Celina
AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES
topic_facet Árboles de clasificación
Regresión logística
Clasificación de textos
description Respecto a los resultados encontrados en la clasificación según la disciplina de los textos se pueden enumerar los siguientes resultados: -Los resultados del análisis morfológico de los textos se analizaron teniendo en cuenta simultáneamente todas las mediciones realizadas sobre ellos. -El análisis de regresión logística aplicado presenta una modalidad de análisis estadístico para discriminar grupos no muy habitual en la investigación lingüística y permitió hallar las categorías gramaticales cuyas frecuencias observadas en los textos permiten discriminar los grupos definidos por la disciplina a la que pertenecen. Las diferencias entre los textos de BIOMETRÍA y FILOSOFÍA está centrada principalmente en el número de clíticos y de adverbios presentes. Los odds ratio estimados evidencian que la chance de clasificar a un texto dentro del corpus de Biometría se incrementa en un 62% al aumentar en número de clíticos en una unidad, mientras que la chance de clasificarlo en el corpus de Filosofía aumenta un 41% al incrementarse en una unidad el número de adverbios. Similares resultados se hallaron utilizando un análisis discriminante sobre las variables transformadas. Este resultado puede deberse a que, en los textos de biometría/estadística hay más clíticos que en los humanísticos por la frecuencia de expresiones impersonales o pasivas con el clítico “se” del tipo: “se ajusta un modelo cuadrático”, “se estima la variancia poblacional”; mientras en los textos de filosofía se manifiesta la presencia de mayor proporción de adverbios. -Respecto a la metodología basada en Árboles de Clasificación, si bien el número de unidades utilizadas en el entrenamiento y evaluación no era elevado, el árbol obtenido mostró un buen desempeño frente al modelo de regresión logística. La diferencia en la tasa de mala clasificación sólo se diferenció en el área de Filosofía. -En los clasificadores basados en Regresión Logística y en el Análisis Discriminante, las diferencias entre los dos tipos de textos se basa principalmente en el porcentaje de clíticos y de adverbios presentes. Sin embargo, en el clasificador basado en Árboles de Clasificación han intervenido otras variables en la separación como el porcentaje de preposiciones y adjetivos. Estas variables intervienen determinando una interacción entre las categorías gramaticales que no se alcanza a observar en el modelo de regresión logística. -La técnica de Regresión Logística se generalizó a un número mayor de disciplinas, de las cuales provienen los textos, mediante una extensión del modelo para variable respuesta multinomial. El análisis de Regresión Logística Multinomial aplicado permitió hallar las categorías gramaticales cuyas frecuencias observadas en los textos permiten discriminar los tres grupos definidos.
format report
informe técnico
author Beltrán, Celina
author_facet Beltrán, Celina
author_sort Beltrán, Celina
title AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES
title_short AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES
title_full AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES
title_fullStr AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES
title_full_unstemmed AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES
title_sort agr145 analisis estadistico multivariado en el estudio y comparacion de distintos tipos de textos academicos: ciencias biologicas y ciencias sociales
publishDate 2021
url http://hdl.handle.net/2133/21441
http://hdl.handle.net/2133/21441
work_keys_str_mv AT beltrancelina agr145analisisestadisticomultivariadoenelestudioycomparaciondedistintostiposdetextosacademicoscienciasbiologicasycienciassociales
bdutipo_str Repositorios
_version_ 1764820410977746947