Aprendizaje por refuerzo con opciones y función de refuerzo universal
"El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El...
Guardado en:
| Autores principales: | Bruno Cilla, Diego, Heimann, Matías, Scaglioni, Giuliano |
|---|---|
| Otros Autores: | Santos, Juan Miguel |
| Formato: | Proyecto final de Grado |
| Lenguaje: | Español |
| Publicado: |
2021
|
| Materias: | |
| Acceso en línea: | http://ri.itba.edu.ar/handle/123456789/3385 |
| Aporte de: |
Ejemplares similares
-
Esquema actor-crítico en aprendizaje por refuerzo con espacios continuos
por: Delgado, Francisco
Publicado: (2021) -
Generación de locomoción para un robot hexápodo usando aprendizaje por refuerzo profundo
por: Sandacz, Matías
Publicado: (2024) -
Generación de locomoción para un robot hexápodo usando aprendizaje por refuerzo profundo
por: Sandacz, Matías
Publicado: (2024) -
Contribución al relevamiento y estado del arte en aprendizaje por refuerzo
por: Emery, Lucas
Publicado: (2020) -
Autoescalado basado en aprendizaje profundo por refuerzo de workflows científicos en la nube
por: Pacini, Elina, et al.
Publicado: (2023)