Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras
"Esta tesis presenta un estudio multifactorial sobre el problema de la detección de fraude financiero mediante modelos de aprendizaje automático. Se evaluaron tres algoritmos ampliamente utilizados —Regresión Logística, Random Forest y Support Vector Machine—, los cuales fueron optimizados medi...
Guardado en:
| Autor principal: | |
|---|---|
| Formato: | Tesis de maestría |
| Lenguaje: | Español |
| Publicado: |
Instituto Tecnológico de Buenos Aires (ITBA)
2025
|
| Materias: | |
| Acceso en línea: | https://hdl.handle.net/20.500.14769/5217 |
| Aporte de: |
| id |
I32-R138-20.500.14769-5217 |
|---|---|
| record_format |
dspace |
| spelling |
I32-R138-20.500.14769-52172026-01-07T14:13:34Z Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras Iglesias, Martín Enrique DETECCIÓN DE FRAUDE FINANCIERO, RANDOM FOREST, REGRESIÓN LOGÍSTICA, SVM-BAYES, DESBALANCE DE CLASES, MUESTREO ESTRATIFICADO, TÉCNICAS DE BALANCEO DE DATOS, ÍNDICE GINI, ENTROPÍA, GANANCIA DE INFORMACIÓN "Esta tesis presenta un estudio multifactorial sobre el problema de la detección de fraude financiero mediante modelos de aprendizaje automático. Se evaluaron tres algoritmos ampliamente utilizados —Regresión Logística, Random Forest y Support Vector Machine—, los cuales fueron optimizados mediante Grid Search y Optimización Bayesiana, ajustando hiperparámetros críticos como la profundidad de los árboles, los coeficientes de regularización y la selección de kernels. Con el fin de incorporar el desbalance de clases, se analizaron tres configuraciones específicas de distribución (~95,3/4,7 %, ~97,6/2,4 % y ~98,4/1,6 % de transacciones no fraudulentas y fraudulentas, respectivamente). Estas configuraciones se obtuvieron a partir de la selección de muestras del conjunto de datos original utilizando criterios basados en el índice Gini, la entropía y la ganancia de información, lo que dio lugar a datasets con diferentes características, tales como niveles de impureza, proximidad a la frontera de decisión y grado de separabilidad entre clases. Asimismo, el diseño experimental incluyó la aplicación de diversas técnicas de balanceo de datos —SMOTE, Tomek Links y Edited Nearest Neighbors (ENN)—, así como distintas proporciones de división train/test (70/30, 80/20 y 90/10), con el objetivo de evaluar su impacto en la estabilidad y capacidad de generalización de los modelos. Los resultados del análisis multifactorial se compararon mediante métricas apropiadas para la detección de fraude, tales como Precisión, Recall, AUC-ROC y F1-score. Adicionalmente, las configuraciones con mejor desempeño fueron validadas sobre un conjunto de datos independiente correspondiente al año 2023, a fin de cuantificar su capacidad de generalización". 2025-12-17T20:52:26Z 2025-12-17T20:52:26Z 2025-12 Tesis de maestría https://hdl.handle.net/20.500.14769/5217 es application/pdf Instituto Tecnológico de Buenos Aires (ITBA) |
| institution |
Instituto Tecnológico de Buenos Aires (ITBA) |
| institution_str |
I-32 |
| repository_str |
R-138 |
| collection |
Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA) |
| language |
Español |
| topic |
DETECCIÓN DE FRAUDE FINANCIERO, RANDOM FOREST, REGRESIÓN LOGÍSTICA, SVM-BAYES, DESBALANCE DE CLASES, MUESTREO ESTRATIFICADO, TÉCNICAS DE BALANCEO DE DATOS, ÍNDICE GINI, ENTROPÍA, GANANCIA DE INFORMACIÓN |
| spellingShingle |
DETECCIÓN DE FRAUDE FINANCIERO, RANDOM FOREST, REGRESIÓN LOGÍSTICA, SVM-BAYES, DESBALANCE DE CLASES, MUESTREO ESTRATIFICADO, TÉCNICAS DE BALANCEO DE DATOS, ÍNDICE GINI, ENTROPÍA, GANANCIA DE INFORMACIÓN Iglesias, Martín Enrique Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras |
| topic_facet |
DETECCIÓN DE FRAUDE FINANCIERO, RANDOM FOREST, REGRESIÓN LOGÍSTICA, SVM-BAYES, DESBALANCE DE CLASES, MUESTREO ESTRATIFICADO, TÉCNICAS DE BALANCEO DE DATOS, ÍNDICE GINI, ENTROPÍA, GANANCIA DE INFORMACIÓN |
| description |
"Esta tesis presenta un estudio multifactorial sobre el problema de la detección de fraude financiero mediante modelos de aprendizaje automático. Se evaluaron tres algoritmos ampliamente utilizados —Regresión Logística, Random Forest y Support Vector Machine—, los cuales fueron optimizados mediante Grid Search y Optimización Bayesiana, ajustando hiperparámetros críticos como la profundidad de los árboles, los coeficientes de regularización y la selección de kernels.
Con el fin de incorporar el desbalance de clases, se analizaron tres configuraciones específicas de distribución (~95,3/4,7 %, ~97,6/2,4 % y ~98,4/1,6 % de transacciones no fraudulentas y fraudulentas, respectivamente). Estas configuraciones se obtuvieron a partir de la selección de muestras del conjunto de datos original utilizando criterios basados en el índice Gini, la entropía y la ganancia de información, lo que dio lugar a datasets con diferentes características, tales como niveles de impureza, proximidad a la frontera de decisión y grado de separabilidad entre clases.
Asimismo, el diseño experimental incluyó la aplicación de diversas técnicas de balanceo de datos —SMOTE, Tomek Links y Edited Nearest Neighbors (ENN)—, así como distintas proporciones de división train/test (70/30, 80/20 y 90/10), con el objetivo de evaluar su impacto en la estabilidad y capacidad de generalización de los modelos.
Los resultados del análisis multifactorial se compararon mediante métricas apropiadas para la detección de fraude, tales como Precisión, Recall, AUC-ROC y F1-score. Adicionalmente, las configuraciones con mejor desempeño fueron validadas sobre un conjunto de datos independiente correspondiente al año 2023, a fin de cuantificar su capacidad de generalización". |
| format |
Tesis de maestría |
| author |
Iglesias, Martín Enrique |
| author_facet |
Iglesias, Martín Enrique |
| author_sort |
Iglesias, Martín Enrique |
| title |
Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras |
| title_short |
Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras |
| title_full |
Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras |
| title_fullStr |
Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras |
| title_full_unstemmed |
Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras |
| title_sort |
evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras |
| publisher |
Instituto Tecnológico de Buenos Aires (ITBA) |
| publishDate |
2025 |
| url |
https://hdl.handle.net/20.500.14769/5217 |
| work_keys_str_mv |
AT iglesiasmartinenrique evaluacionmultidimensionaldemodelosdeaprendizajeautomaticoparaladetecciondefraudeentransaccionesfinancieras |
| _version_ |
1854267362842247168 |