Modelos de predicción del abandono en la Universidad Nacional de Hurlingham
Se estima que en el sistema universitario sólo el 27,66% de los estudiantes que ingresan se gradúa en un tiempo teórico de 5 años. Para las carreras de informática, este número es incluso más bajo: cercano al 20%. Entendemos que el abandono estudiantil es, tal vez, el factor individual más important...
Guardado en:
| Autor principal: | |
|---|---|
| Otros Autores: | , , , |
| Formato: | Tesis Libro |
| Lenguaje: | Español |
| Publicado: |
24 de Junio de 2025
|
| Materias: | |
| Aporte de: | Registro referencial: Solicitar el recurso aquí |
| LEADER | 07432nam a22004217a 4500 | ||
|---|---|---|---|
| 003 | AR-BaUEN | ||
| 005 | 20250918115900.0 | ||
| 008 | 250730s2025 ag ad||f|m||| 000 0|spa|d | ||
| 040 | |a AR-BaUEN |b spa |c AR-BaUEN | ||
| 041 | 0 | |b spa |b eng | |
| 044 | |a ag | ||
| 084 | |a DMI 007759 | ||
| 100 | 1 | |a Pustilnik, Martín Ariel | |
| 245 | 1 | 0 | |a Modelos de predicción del abandono en la Universidad Nacional de Hurlingham |
| 246 | 3 | 1 | |a Dropout prediction models at the Universidad Nacional de Hurlingham |
| 260 | |c 24 de Junio de 2025 | ||
| 300 | |a 78 p. : |b il., gráfs. color, tablas | ||
| 502 | |b Magíster de la Universidad de Buenos Aires en el área de Explotación de Datos y Descubrimiento del Conocimiento |c Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |d 2025-06-24 |g Universidad Nacional de Hurlingham. Laboratorio de Investigación y Desarrollo Experimental en Computación (LIDEC) | ||
| 506 | |2 openaire |e Autorización del autor |f info:eu-repo/semantics/embargoedAccess |g 2025-12-24 | ||
| 518 | |o Fecha de publicación en la Biblioteca Digital FCEN-UBA | ||
| 520 | 3 | |a Se estima que en el sistema universitario sólo el 27,66% de los estudiantes que ingresan se gradúa en un tiempo teórico de 5 años. Para las carreras de informática, este número es incluso más bajo: cercano al 20%. Entendemos que el abandono estudiantil es, tal vez, el factor individual más importante que explica este fenómeno. La medición del abandono en sí presenta diversas complejidades. Con el fin de enfocarse en la emisión de alertas tempranas en lugar de identificar un "abandono definitivo", se considera en situación de abandono a aquel estudiante que tras haber iniciado sus estudios, no muestra actividad académica durante al menos un semestre. Esto puede deberse a una pausa en sus estudios, un cambio de universidad o de carrera, con la posibilidad de retomar su formación en un momento posterior. La Universidad Nacional de Hurlingham (UNAHUR) es pública y gratuita, funciona desde 2016 con gran integración con la comunidad y alto interés por la permanencia de sus estudiantes, pero con alta tasa de abandono estudiantil. Su matrícula crece aceleradamente y presenta alta incidencia de estudiantes de primera generación de universitarios (77% para 2023) y de bajos ingresos económicos. Entre las acciones para abordar la prevención del abandono, con la participación del autor de esta tesis, la UNAHUR ha estado desarrollando modelos de predicción de abandono utilizando técnicas de Aprendizaje Automático para identificar estudiantes en riesgo, con el objetivo de prevenir el abandono estudiantil de manera temprana. Estos modelos se basan en los datos del Sistema de Información Universitaria Guaraní (SIU-Guaraní) y en datos generados a partir de la ingeniería de atributos, con la perspectiva teórica de autores de referencia y la de otros actores de la misma universidad. Una vez entrenados, son capaces de detectar estudiantes con alto riesgo de abandono, a la vez que permiten indagar en algunos de los motivos subyacentes. En este trabajo se realizó una investigación bibliográfica de los modelos empleados hasta la fecha, haciendo foco en aquellos que utilizaran Aprendizaje Automático. Luego, se desarrollaron modelos que proporcionan alertas tempranas de abandono en el contexto de la UNAHUR, para poder intervenir y asistir a las personas antes de que abandonen. Se probaron hipótesis para identificar qué variables influyen en el abandono, y así mejorar futuros modelos. Se proporcionaron recomendaciones sobre variables no relevadas y que deberían ser censadas. Se generó un reporte de personas en riesgo, indicando además de la probabilidad de abandono, los factores más significativos para cada individuo, permitiendo así iniciar la comunicación y explorar los motivos subyacentes sin tener que censar a toda la población estudiantil. Se utilizaron métricas como curva ROC y exactitud balanceada para medir la performance de los modelos, alcanzando un Área bajo la curva ROC de 0,88 para el mejor de ellos. |l spa | |
| 520 | 3 | |a It is estimated that only 27.66% of students entering the university system graduate within the theoretical time of 5 years. For computer science degrees, this number is even lower: around 20%. We understand that student dropout is perhaps the most important individual factor explaining this phenomenon. Measuring dropout itself presents various complexities. In order to focus on issuing early alerts rather than identifying a "definitive dropout", a student is considered in a dropout situation if, after starting their studies, they do not show academic activity for at least one semester. This may be due to a pause in their studies, a change of university or degree, with the possibility of resuming their education at a later time. The Universidad Nacional de Hurlingham (UNAHUR) is a public and free institution that has been operating since 2016 with great integration with the community and high interest in student permanence, but with a high dropout rate. Its enrollment is growing rapidly and has a high incidence of first-generation university students (77% by 2023) and low-income students. Among the actions to address dropout prevention, with the participation of the author of this thesis, UNAHUR has been developing dropout prediction models using Machine Learning techniques to identify students at risk, aiming to prevent student dropout early. These models are based on data from the Guaraní University Information System (SIU-Guaraní) and data generated from feature engineering, with the theoretical perspective of reference authors and other actors from the same university. Once trained, they are able to detect students at high risk of dropping out, while allowing us to investigate some of the underlying reasons. In this work, a bibliographical investigation of the models used to date was carried out, focusing on those that used Machine Learning. Then, models that provide early warnings of abandonment in the context of UNAHUR were developed to intervene and assist students before they drop out. Hypotheses were tested to identify which variables influence dropout to improve future models. Recommendations were provided on unrevealed variables that should be surveyed. A report of individuals at risk was generated, indicating in addition to the probability of dropping out, the most significant factors for each individual, thus allowing specialists to initiate communication and explore the underlying reasons without having to survey the entire student population. Metrics such as ROC curve and balanced accuracy were used to measure the performance of the models, achieving an Area under the ROC curve of 0.88 for the best model. |l eng | |
| 540 | |2 cc |f https://creativecommons.org/licenses/by-nc-sa/2.5/ar | ||
| 653 | 1 | 0 | |a ABANDONO UNIVERSITARIO |
| 653 | 1 | 0 | |a MODELO PREDICCION |
| 653 | 1 | 0 | |a APRENDIZAJE AUTOMATICO |
| 690 | 1 | 0 | |a UNIVERSITY DROPOUT |
| 690 | 1 | 0 | |a PREDICTION MODEL |
| 690 | 1 | 0 | |a MACHINE LEARNING |
| 700 | 1 | |a Iarussi, Emmanuel | |
| 700 | 1 | |a Rey, Andrea Alejandra | |
| 700 | 1 | |a Delrieux, Claudio Augusto | |
| 700 | 1 | |a Rosati, Germán Federico | |
| 856 | 4 | |q application/pdf | |
| 931 | |a DC | ||
| 961 | |b tesis |c EM |e ND | ||
| 962 | |a info:ar-repo/semantics/tesis de maestría |a info:eu-repo/semantics/masterThesis |b info:eu-repo/semantics/publishedVersion | ||
| 999 | |c 107927 | ||