Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras

"Esta tesis presenta un estudio multifactorial sobre el problema de la detección de fraude financiero mediante modelos de aprendizaje automático. Se evaluaron tres algoritmos ampliamente utilizados —Regresión Logística, Random Forest y Support Vector Machine—, los cuales fueron optimizados medi...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Iglesias, Martín Enrique
Formato: Tesis de maestría
Lenguaje:Español
Publicado: Instituto Tecnológico de Buenos Aires (ITBA) 2025
Materias:
Acceso en línea:https://hdl.handle.net/20.500.14769/5217
Aporte de:
id I32-R138-20.500.14769-5217
record_format dspace
spelling I32-R138-20.500.14769-52172026-01-07T14:13:34Z Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras Iglesias, Martín Enrique DETECCIÓN DE FRAUDE FINANCIERO, RANDOM FOREST, REGRESIÓN LOGÍSTICA, SVM-BAYES, DESBALANCE DE CLASES, MUESTREO ESTRATIFICADO, TÉCNICAS DE BALANCEO DE DATOS, ÍNDICE GINI, ENTROPÍA, GANANCIA DE INFORMACIÓN "Esta tesis presenta un estudio multifactorial sobre el problema de la detección de fraude financiero mediante modelos de aprendizaje automático. Se evaluaron tres algoritmos ampliamente utilizados —Regresión Logística, Random Forest y Support Vector Machine—, los cuales fueron optimizados mediante Grid Search y Optimización Bayesiana, ajustando hiperparámetros críticos como la profundidad de los árboles, los coeficientes de regularización y la selección de kernels. Con el fin de incorporar el desbalance de clases, se analizaron tres configuraciones específicas de distribución (~95,3/4,7 %, ~97,6/2,4 % y ~98,4/1,6 % de transacciones no fraudulentas y fraudulentas, respectivamente). Estas configuraciones se obtuvieron a partir de la selección de muestras del conjunto de datos original utilizando criterios basados en el índice Gini, la entropía y la ganancia de información, lo que dio lugar a datasets con diferentes características, tales como niveles de impureza, proximidad a la frontera de decisión y grado de separabilidad entre clases. Asimismo, el diseño experimental incluyó la aplicación de diversas técnicas de balanceo de datos —SMOTE, Tomek Links y Edited Nearest Neighbors (ENN)—, así como distintas proporciones de división train/test (70/30, 80/20 y 90/10), con el objetivo de evaluar su impacto en la estabilidad y capacidad de generalización de los modelos. Los resultados del análisis multifactorial se compararon mediante métricas apropiadas para la detección de fraude, tales como Precisión, Recall, AUC-ROC y F1-score. Adicionalmente, las configuraciones con mejor desempeño fueron validadas sobre un conjunto de datos independiente correspondiente al año 2023, a fin de cuantificar su capacidad de generalización". 2025-12-17T20:52:26Z 2025-12-17T20:52:26Z 2025-12 Tesis de maestría https://hdl.handle.net/20.500.14769/5217 es application/pdf Instituto Tecnológico de Buenos Aires (ITBA)
institution Instituto Tecnológico de Buenos Aires (ITBA)
institution_str I-32
repository_str R-138
collection Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA)
language Español
topic DETECCIÓN DE FRAUDE FINANCIERO, RANDOM FOREST, REGRESIÓN LOGÍSTICA, SVM-BAYES, DESBALANCE DE CLASES, MUESTREO ESTRATIFICADO, TÉCNICAS DE BALANCEO DE DATOS, ÍNDICE GINI, ENTROPÍA, GANANCIA DE INFORMACIÓN
spellingShingle DETECCIÓN DE FRAUDE FINANCIERO, RANDOM FOREST, REGRESIÓN LOGÍSTICA, SVM-BAYES, DESBALANCE DE CLASES, MUESTREO ESTRATIFICADO, TÉCNICAS DE BALANCEO DE DATOS, ÍNDICE GINI, ENTROPÍA, GANANCIA DE INFORMACIÓN
Iglesias, Martín Enrique
Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras
topic_facet DETECCIÓN DE FRAUDE FINANCIERO, RANDOM FOREST, REGRESIÓN LOGÍSTICA, SVM-BAYES, DESBALANCE DE CLASES, MUESTREO ESTRATIFICADO, TÉCNICAS DE BALANCEO DE DATOS, ÍNDICE GINI, ENTROPÍA, GANANCIA DE INFORMACIÓN
description "Esta tesis presenta un estudio multifactorial sobre el problema de la detección de fraude financiero mediante modelos de aprendizaje automático. Se evaluaron tres algoritmos ampliamente utilizados —Regresión Logística, Random Forest y Support Vector Machine—, los cuales fueron optimizados mediante Grid Search y Optimización Bayesiana, ajustando hiperparámetros críticos como la profundidad de los árboles, los coeficientes de regularización y la selección de kernels. Con el fin de incorporar el desbalance de clases, se analizaron tres configuraciones específicas de distribución (~95,3/4,7 %, ~97,6/2,4 % y ~98,4/1,6 % de transacciones no fraudulentas y fraudulentas, respectivamente). Estas configuraciones se obtuvieron a partir de la selección de muestras del conjunto de datos original utilizando criterios basados en el índice Gini, la entropía y la ganancia de información, lo que dio lugar a datasets con diferentes características, tales como niveles de impureza, proximidad a la frontera de decisión y grado de separabilidad entre clases. Asimismo, el diseño experimental incluyó la aplicación de diversas técnicas de balanceo de datos —SMOTE, Tomek Links y Edited Nearest Neighbors (ENN)—, así como distintas proporciones de división train/test (70/30, 80/20 y 90/10), con el objetivo de evaluar su impacto en la estabilidad y capacidad de generalización de los modelos. Los resultados del análisis multifactorial se compararon mediante métricas apropiadas para la detección de fraude, tales como Precisión, Recall, AUC-ROC y F1-score. Adicionalmente, las configuraciones con mejor desempeño fueron validadas sobre un conjunto de datos independiente correspondiente al año 2023, a fin de cuantificar su capacidad de generalización".
format Tesis de maestría
author Iglesias, Martín Enrique
author_facet Iglesias, Martín Enrique
author_sort Iglesias, Martín Enrique
title Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras
title_short Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras
title_full Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras
title_fullStr Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras
title_full_unstemmed Evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras
title_sort evaluación multidimensional de modelos de aprendizaje automático para la detección de fraude en transacciones financieras
publisher Instituto Tecnológico de Buenos Aires (ITBA)
publishDate 2025
url https://hdl.handle.net/20.500.14769/5217
work_keys_str_mv AT iglesiasmartinenrique evaluacionmultidimensionaldemodelosdeaprendizajeautomaticoparaladetecciondefraudeentransaccionesfinancieras
_version_ 1854267362842247168