Aprendizaje por refuerzo con opciones y función de refuerzo universal

"El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Bruno Cilla, Diego, Heimann, Matías, Scaglioni, Giuliano
Otros Autores: Santos, Juan Miguel
Formato: Proyecto final de Grado
Lenguaje:Español
Publicado: 2021
Materias:
Acceso en línea:http://ri.itba.edu.ar/handle/123456789/3385
Aporte de:
id I32-R138-123456789-3385
record_format dspace
spelling I32-R138-123456789-33852022-12-07T14:27:42Z Aprendizaje por refuerzo con opciones y función de refuerzo universal Bruno Cilla, Diego Heimann, Matías Scaglioni, Giuliano Santos, Juan Miguel APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS "El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El objetivo de este trabajo es explorar una alternativa en la cual se puedan adquirir distintos comportamientos, manteniendo siempre la misma función de refuerzo, siendo que la variable sea los distintos entornos en los que se realiza el aprendizaje." Proyecto final Ingeniería Informática (grado) - Instituto Tecnológico de Buenos Aires, Buenos Aires, 2020 2021-02-11T17:03:16Z 2021-02-11T17:03:16Z 2020-12 Proyecto final de Grado http://ri.itba.edu.ar/handle/123456789/3385 es application/pdf
institution Instituto Tecnológico de Buenos Aires (ITBA)
institution_str I-32
repository_str R-138
collection Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA)
language Español
topic APRENDIZAJE POR REFUERZO
APRENDIZAJE AUTOMATICO
ALGORITMOS
spellingShingle APRENDIZAJE POR REFUERZO
APRENDIZAJE AUTOMATICO
ALGORITMOS
Bruno Cilla, Diego
Heimann, Matías
Scaglioni, Giuliano
Aprendizaje por refuerzo con opciones y función de refuerzo universal
topic_facet APRENDIZAJE POR REFUERZO
APRENDIZAJE AUTOMATICO
ALGORITMOS
description "El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El objetivo de este trabajo es explorar una alternativa en la cual se puedan adquirir distintos comportamientos, manteniendo siempre la misma función de refuerzo, siendo que la variable sea los distintos entornos en los que se realiza el aprendizaje."
author2 Santos, Juan Miguel
author_facet Santos, Juan Miguel
Bruno Cilla, Diego
Heimann, Matías
Scaglioni, Giuliano
format Proyecto final de Grado
author Bruno Cilla, Diego
Heimann, Matías
Scaglioni, Giuliano
author_sort Bruno Cilla, Diego
title Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_short Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_full Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_fullStr Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_full_unstemmed Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_sort aprendizaje por refuerzo con opciones y función de refuerzo universal
publishDate 2021
url http://ri.itba.edu.ar/handle/123456789/3385
work_keys_str_mv AT brunocilladiego aprendizajeporrefuerzoconopcionesyfuncionderefuerzouniversal
AT heimannmatias aprendizajeporrefuerzoconopcionesyfuncionderefuerzouniversal
AT scaglionigiuliano aprendizajeporrefuerzoconopcionesyfuncionderefuerzouniversal
_version_ 1765660698051870720