Sesgos en problemas de regresión originados por el desbalance de datos en términos de atributos protegidos

En este trabajo se busca estudiar el efecto sobre el desempeño de modelos de regresión provocado por el desbalance en los datos en términos de atributos protegidos durante el entrenamiento. Estos atributos, como género o color de piel de una persona, son características propias de los datos que pued...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Claucich, Estanislao, Ferrante, Enzo, Echeveste, Rodrigo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2022
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/151624
https://publicaciones.sadio.org.ar/index.php/JAIIO/article/download/261/213
Aporte de:
id I19-R120-10915-151624
record_format dspace
spelling I19-R120-10915-1516242023-05-03T20:02:12Z http://sedici.unlp.edu.ar/handle/10915/151624 https://publicaciones.sadio.org.ar/index.php/JAIIO/article/download/261/213 issn:2451-7496 Sesgos en problemas de regresión originados por el desbalance de datos en términos de atributos protegidos Claucich, Estanislao Ferrante, Enzo Echeveste, Rodrigo 2022-10 2022 2023-04-18T14:40:17Z es Ciencias Informáticas justicia algorítmica aprendizaje profundo sesgos En este trabajo se busca estudiar el efecto sobre el desempeño de modelos de regresión provocado por el desbalance en los datos en términos de atributos protegidos durante el entrenamiento. Estos atributos, como género o color de piel de una persona, son características propias de los datos que pueden o no tener una relación directa con el problema a resolver. Los resultados obtenidos mediante experimentos tanto sobre datos sintéticos como reales, muestran que el error sobre una dada población aumenta cuando se encuentra subrepresentada en el conjunto de datos de entrenamiento. En ambos casos estudiados encontramos que el error sobre la población completa fue mínimo cuando se encontraba balanceado en términos del atributo protegido en cuestión. Este estudio es el primer paso de un trabajo que busca extender este análisis a otras bases de datos, modelos y problemas, para luego atenuar este inconveniente incorporando penalizadores que desincentiven un mejor rendimiento sobre un subconjunto en desmedro de otro. Sociedad Argentina de Informática e Investigación Operativa Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 50-53
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
justicia algorítmica
aprendizaje profundo
sesgos
spellingShingle Ciencias Informáticas
justicia algorítmica
aprendizaje profundo
sesgos
Claucich, Estanislao
Ferrante, Enzo
Echeveste, Rodrigo
Sesgos en problemas de regresión originados por el desbalance de datos en términos de atributos protegidos
topic_facet Ciencias Informáticas
justicia algorítmica
aprendizaje profundo
sesgos
description En este trabajo se busca estudiar el efecto sobre el desempeño de modelos de regresión provocado por el desbalance en los datos en términos de atributos protegidos durante el entrenamiento. Estos atributos, como género o color de piel de una persona, son características propias de los datos que pueden o no tener una relación directa con el problema a resolver. Los resultados obtenidos mediante experimentos tanto sobre datos sintéticos como reales, muestran que el error sobre una dada población aumenta cuando se encuentra subrepresentada en el conjunto de datos de entrenamiento. En ambos casos estudiados encontramos que el error sobre la población completa fue mínimo cuando se encontraba balanceado en términos del atributo protegido en cuestión. Este estudio es el primer paso de un trabajo que busca extender este análisis a otras bases de datos, modelos y problemas, para luego atenuar este inconveniente incorporando penalizadores que desincentiven un mejor rendimiento sobre un subconjunto en desmedro de otro.
format Objeto de conferencia
Objeto de conferencia
author Claucich, Estanislao
Ferrante, Enzo
Echeveste, Rodrigo
author_facet Claucich, Estanislao
Ferrante, Enzo
Echeveste, Rodrigo
author_sort Claucich, Estanislao
title Sesgos en problemas de regresión originados por el desbalance de datos en términos de atributos protegidos
title_short Sesgos en problemas de regresión originados por el desbalance de datos en términos de atributos protegidos
title_full Sesgos en problemas de regresión originados por el desbalance de datos en términos de atributos protegidos
title_fullStr Sesgos en problemas de regresión originados por el desbalance de datos en términos de atributos protegidos
title_full_unstemmed Sesgos en problemas de regresión originados por el desbalance de datos en términos de atributos protegidos
title_sort sesgos en problemas de regresión originados por el desbalance de datos en términos de atributos protegidos
publishDate 2022
url http://sedici.unlp.edu.ar/handle/10915/151624
https://publicaciones.sadio.org.ar/index.php/JAIIO/article/download/261/213
work_keys_str_mv AT claucichestanislao sesgosenproblemasderegresionoriginadosporeldesbalancededatosenterminosdeatributosprotegidos
AT ferranteenzo sesgosenproblemasderegresionoriginadosporeldesbalancededatosenterminosdeatributosprotegidos
AT echevesterodrigo sesgosenproblemasderegresionoriginadosporeldesbalancededatosenterminosdeatributosprotegidos
_version_ 1765659991913529344