AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES
Respecto a los resultados encontrados en la clasificación según la disciplina de los textos se pueden enumerar los siguientes resultados: -Los resultados del análisis morfológico de los textos se analizaron teniendo en cuenta simultáneamente todas las mediciones realizadas sobre ellos. -El análi...
Guardado en:
| Autor principal: | |
|---|---|
| Formato: | report informe técnico |
| Lenguaje: | Español |
| Publicado: |
2021
|
| Materias: | |
| Acceso en línea: | http://hdl.handle.net/2133/21441 http://hdl.handle.net/2133/21441 |
| Aporte de: |
| id |
I15-R121-2133-21441 |
|---|---|
| record_format |
dspace |
| institution |
Universidad Nacional de Rosario |
| institution_str |
I-15 |
| repository_str |
R-121 |
| collection |
Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR) |
| language |
Español |
| topic |
Árboles de clasificación Regresión logística Clasificación de textos |
| spellingShingle |
Árboles de clasificación Regresión logística Clasificación de textos Beltrán, Celina AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES |
| topic_facet |
Árboles de clasificación Regresión logística Clasificación de textos |
| description |
Respecto a los resultados encontrados en la clasificación según la disciplina de los textos se pueden enumerar los siguientes resultados:
-Los resultados del análisis morfológico de los textos se analizaron teniendo en cuenta simultáneamente todas las mediciones realizadas sobre ellos.
-El análisis de regresión logística aplicado presenta una modalidad de análisis estadístico para discriminar grupos no muy habitual en la investigación lingüística y permitió hallar las categorías gramaticales cuyas frecuencias observadas en los textos permiten discriminar los grupos definidos por la disciplina a la que pertenecen. Las diferencias entre los textos de BIOMETRÍA y FILOSOFÍA está centrada principalmente en el número de clíticos y de adverbios presentes. Los odds ratio estimados evidencian que la chance de clasificar a un texto dentro del corpus de Biometría se incrementa en un 62% al aumentar en número de clíticos en una unidad, mientras que la chance de clasificarlo en el corpus de Filosofía aumenta un 41% al incrementarse en una unidad el número de adverbios. Similares resultados se hallaron utilizando un análisis discriminante sobre las variables transformadas. Este resultado puede deberse a que, en los textos de biometría/estadística hay más clíticos que en los humanísticos por la frecuencia de expresiones impersonales o pasivas con el clítico “se” del tipo: “se ajusta un modelo cuadrático”, “se estima la variancia poblacional”; mientras en los textos de filosofía se manifiesta la presencia de mayor proporción de adverbios.
-Respecto a la metodología basada en Árboles de Clasificación, si bien el número de unidades utilizadas en el entrenamiento y evaluación no era elevado, el árbol obtenido mostró un buen desempeño frente al modelo de regresión logística. La diferencia en la tasa de mala clasificación sólo se diferenció en el área de Filosofía.
-En los clasificadores basados en Regresión Logística y en el Análisis Discriminante, las diferencias entre los dos tipos de textos se basa principalmente en el porcentaje de clíticos y de adverbios presentes. Sin embargo, en el clasificador basado en Árboles de Clasificación han intervenido otras variables en la separación como el porcentaje de preposiciones y adjetivos. Estas variables intervienen determinando una interacción entre las categorías gramaticales que no se alcanza a observar en el modelo de regresión logística.
-La técnica de Regresión Logística se generalizó a un número mayor de disciplinas, de las cuales provienen los textos, mediante una extensión del modelo para variable respuesta multinomial. El análisis de Regresión Logística Multinomial aplicado permitió hallar las categorías gramaticales cuyas frecuencias observadas en los textos permiten discriminar los tres grupos definidos. |
| format |
report informe técnico |
| author |
Beltrán, Celina |
| author_facet |
Beltrán, Celina |
| author_sort |
Beltrán, Celina |
| title |
AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES |
| title_short |
AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES |
| title_full |
AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES |
| title_fullStr |
AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES |
| title_full_unstemmed |
AGR145 ANALISIS ESTADISTICO MULTIVARIADO EN EL ESTUDIO Y COMPARACION DE DISTINTOS TIPOS DE TEXTOS ACADEMICOS: CIENCIAS BIOLOGICAS Y CIENCIAS SOCIALES |
| title_sort |
agr145 analisis estadistico multivariado en el estudio y comparacion de distintos tipos de textos academicos: ciencias biologicas y ciencias sociales |
| publishDate |
2021 |
| url |
http://hdl.handle.net/2133/21441 http://hdl.handle.net/2133/21441 |
| work_keys_str_mv |
AT beltrancelina agr145analisisestadisticomultivariadoenelestudioycomparaciondedistintostiposdetextosacademicoscienciasbiologicasycienciassociales |
| bdutipo_str |
Repositorios |
| _version_ |
1764820410977746947 |