Desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal

En este trabajo se busca estudiar el impacto del desbalance en los datos utilizados para entrenar un clasificador lineal, centrando el análisis en atributos protegidos. Dichos atributos, tales como género, grupo étnico o edad, no constituyen la clase objetivo del clasificador, sino que corresponden...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Escalas, Eugenia, Echeveste, Rodrigo, Peterson, Victoria, Ferrante, Enzo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2020
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/116436
http://49jaiio.sadio.org.ar/pdfs/asai/ASAI-16.pdf
Aporte de:
id I19-R120-10915-116436
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Desbalance en los datos
Clasificador lineal
spellingShingle Ciencias Informáticas
Desbalance en los datos
Clasificador lineal
Escalas, Eugenia
Echeveste, Rodrigo
Peterson, Victoria
Ferrante, Enzo
Desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal
topic_facet Ciencias Informáticas
Desbalance en los datos
Clasificador lineal
description En este trabajo se busca estudiar el impacto del desbalance en los datos utilizados para entrenar un clasificador lineal, centrando el análisis en atributos protegidos. Dichos atributos, tales como género, grupo étnico o edad, no constituyen la clase objetivo del clasificador, sino que corresponden a. características demográficas que pueden ser o no parte del problema a resolver. Los resultados obtenidos mediante experimentos sintéticos simples muestran que la exactitud sobre una población dada se deteriora cuando se encuentra subrepresentada en el conjunto de datos de entrenamiento. En todos los casos, el rendimiento del clasificador sobre la población completa es máximo cuando este conjunto de datos se encuentra balanceado en lo que respecta, a. atributos protegidos. Estas conclusiones son el primer paso de un trabajo que busca mostrar cómo puede atenuarse este inconveniente incorporando penalizantes que desincentiven un aumento de la exactitud sobre un subconjunto de la población en desmedro de otra.
format Objeto de conferencia
Objeto de conferencia
author Escalas, Eugenia
Echeveste, Rodrigo
Peterson, Victoria
Ferrante, Enzo
author_facet Escalas, Eugenia
Echeveste, Rodrigo
Peterson, Victoria
Ferrante, Enzo
author_sort Escalas, Eugenia
title Desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal
title_short Desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal
title_full Desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal
title_fullStr Desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal
title_full_unstemmed Desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal
title_sort desbalance de datos en términos de atributos protegidos: análisis de su impacto en un clasificador lineal
publishDate 2020
url http://sedici.unlp.edu.ar/handle/10915/116436
http://49jaiio.sadio.org.ar/pdfs/asai/ASAI-16.pdf
work_keys_str_mv AT escalaseugenia desbalancededatosenterminosdeatributosprotegidosanalisisdesuimpactoenunclasificadorlineal
AT echevesterodrigo desbalancededatosenterminosdeatributosprotegidosanalisisdesuimpactoenunclasificadorlineal
AT petersonvictoria desbalancededatosenterminosdeatributosprotegidosanalisisdesuimpactoenunclasificadorlineal
AT ferranteenzo desbalancededatosenterminosdeatributosprotegidosanalisisdesuimpactoenunclasificadorlineal
bdutipo_str Repositorios
_version_ 1764820447007866882