Aprendizaje por refuerzo con opciones y función de refuerzo universal
"El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El...
Guardado en:
Autores principales: | , , |
---|---|
Otros Autores: | |
Formato: | Proyecto final de Grado |
Lenguaje: | Español |
Publicado: |
2021
|
Materias: | |
Acceso en línea: | http://ri.itba.edu.ar/handle/123456789/3385 |
Aporte de: |
id |
I32-R138-123456789-3385 |
---|---|
record_format |
dspace |
spelling |
I32-R138-123456789-33852022-12-07T14:27:42Z Aprendizaje por refuerzo con opciones y función de refuerzo universal Bruno Cilla, Diego Heimann, Matías Scaglioni, Giuliano Santos, Juan Miguel APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS "El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El objetivo de este trabajo es explorar una alternativa en la cual se puedan adquirir distintos comportamientos, manteniendo siempre la misma función de refuerzo, siendo que la variable sea los distintos entornos en los que se realiza el aprendizaje." Proyecto final Ingeniería Informática (grado) - Instituto Tecnológico de Buenos Aires, Buenos Aires, 2020 2021-02-11T17:03:16Z 2021-02-11T17:03:16Z 2020-12 Proyecto final de Grado http://ri.itba.edu.ar/handle/123456789/3385 es application/pdf |
institution |
Instituto Tecnológico de Buenos Aires (ITBA) |
institution_str |
I-32 |
repository_str |
R-138 |
collection |
Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA) |
language |
Español |
topic |
APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS |
spellingShingle |
APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS Bruno Cilla, Diego Heimann, Matías Scaglioni, Giuliano Aprendizaje por refuerzo con opciones y función de refuerzo universal |
topic_facet |
APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS |
description |
"El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema.
El objetivo de este trabajo es explorar una alternativa en la cual se puedan adquirir distintos comportamientos, manteniendo siempre la misma función de refuerzo, siendo que la variable sea los distintos entornos en los que se realiza el aprendizaje." |
author2 |
Santos, Juan Miguel |
author_facet |
Santos, Juan Miguel Bruno Cilla, Diego Heimann, Matías Scaglioni, Giuliano |
format |
Proyecto final de Grado |
author |
Bruno Cilla, Diego Heimann, Matías Scaglioni, Giuliano |
author_sort |
Bruno Cilla, Diego |
title |
Aprendizaje por refuerzo con opciones y función de refuerzo universal |
title_short |
Aprendizaje por refuerzo con opciones y función de refuerzo universal |
title_full |
Aprendizaje por refuerzo con opciones y función de refuerzo universal |
title_fullStr |
Aprendizaje por refuerzo con opciones y función de refuerzo universal |
title_full_unstemmed |
Aprendizaje por refuerzo con opciones y función de refuerzo universal |
title_sort |
aprendizaje por refuerzo con opciones y función de refuerzo universal |
publishDate |
2021 |
url |
http://ri.itba.edu.ar/handle/123456789/3385 |
work_keys_str_mv |
AT brunocilladiego aprendizajeporrefuerzoconopcionesyfuncionderefuerzouniversal AT heimannmatias aprendizajeporrefuerzoconopcionesyfuncionderefuerzouniversal AT scaglionigiuliano aprendizajeporrefuerzoconopcionesyfuncionderefuerzouniversal |
_version_ |
1765660698051870720 |