Aprendizaje por refuerzo con opciones y función de refuerzo universal

Mostrar todas las versiones(2)

"El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Bruno Cilla, Diego, Heimann, Matías, Scaglioni, Giuliano
Otros Autores:	Santos, Juan Miguel
Formato:	Proyecto final de Grado
Lenguaje:	Español
Publicado:	2021
Materias:	APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS
Acceso en línea:	http://ri.itba.edu.ar/handle/123456789/3385
Aporte de:	Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA) de Instituto Tecnológico de Buenos Aires (ITBA)

id	I32-R138-123456789-3385
record_format	dspace
spelling	I32-R138-123456789-33852022-12-07T14:27:42Z Aprendizaje por refuerzo con opciones y función de refuerzo universal Bruno Cilla, Diego Heimann, Matías Scaglioni, Giuliano Santos, Juan Miguel APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS "El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El objetivo de este trabajo es explorar una alternativa en la cual se puedan adquirir distintos comportamientos, manteniendo siempre la misma función de refuerzo, siendo que la variable sea los distintos entornos en los que se realiza el aprendizaje." Proyecto final Ingeniería Informática (grado) - Instituto Tecnológico de Buenos Aires, Buenos Aires, 2020 2021-02-11T17:03:16Z 2021-02-11T17:03:16Z 2020-12 Proyecto final de Grado http://ri.itba.edu.ar/handle/123456789/3385 es application/pdf
institution	Instituto Tecnológico de Buenos Aires (ITBA)
institution_str	I-32
repository_str	R-138
collection	Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA)
language	Español
topic	APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS
spellingShingle	APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS Bruno Cilla, Diego Heimann, Matías Scaglioni, Giuliano Aprendizaje por refuerzo con opciones y función de refuerzo universal
topic_facet	APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS
description	"El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El objetivo de este trabajo es explorar una alternativa en la cual se puedan adquirir distintos comportamientos, manteniendo siempre la misma función de refuerzo, siendo que la variable sea los distintos entornos en los que se realiza el aprendizaje."
author2	Santos, Juan Miguel
author_facet	Santos, Juan Miguel Bruno Cilla, Diego Heimann, Matías Scaglioni, Giuliano
format	Proyecto final de Grado
author	Bruno Cilla, Diego Heimann, Matías Scaglioni, Giuliano
author_sort	Bruno Cilla, Diego
title	Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_short	Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_full	Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_fullStr	Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_full_unstemmed	Aprendizaje por refuerzo con opciones y función de refuerzo universal
title_sort	aprendizaje por refuerzo con opciones y función de refuerzo universal
publishDate	2021
url	http://ri.itba.edu.ar/handle/123456789/3385
work_keys_str_mv	AT brunocilladiego aprendizajeporrefuerzoconopcionesyfuncionderefuerzouniversal AT heimannmatias aprendizajeporrefuerzoconopcionesyfuncionderefuerzouniversal AT scaglionigiuliano aprendizajeporrefuerzoconopcionesyfuncionderefuerzouniversal
_version_	1765660698051870720

Aprendizaje por refuerzo con opciones y función de refuerzo universal

Ejemplares similares