Aprendizaje por refuerzo con opciones y función de refuerzo universal

"El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Bruno Cilla, Diego, Heimann, Matías, Scaglioni, Giuliano
Otros Autores:	Santos, Juan Miguel
Formato:	Proyecto final de Grado
Lenguaje:	Español
Publicado:	2021
Materias:	APRENDIZAJE POR REFUERZO APRENDIZAJE AUTOMATICO ALGORITMOS
Acceso en línea:	http://ri.itba.edu.ar/handle/123456789/3385
Aporte de:	Repositorio Institucional Instituto Tecnológico de Buenos Aires (ITBA) de Instituto Tecnológico de Buenos Aires (ITBA)

Ejemplares similares

Esquema actor-crítico en aprendizaje por refuerzo con espacios continuos
por: Delgado, Francisco
Publicado: (2021)

Generación de locomoción para un robot hexápodo usando aprendizaje por refuerzo profundo
por: Sandacz, Matías
Publicado: (2024)

Generación de locomoción para un robot hexápodo usando aprendizaje por refuerzo profundo
por: Sandacz, Matías
Publicado: (2024)

Contribución al relevamiento y estado del arte en aprendizaje por refuerzo
por: Emery, Lucas
Publicado: (2020)

Autoescalado basado en aprendizaje profundo por refuerzo de workflows científicos en la nube
por: Pacini, Elina, et al.
Publicado: (2023)

Aprendizaje por refuerzo aplicado al etiquetado de tráfico de red
por: Catania, Carlos A., et al.
Publicado: (2023)

Aprendizaje por Refuerzo Offline y Online para el Autoescalado de Workflows Científicos en Cloud
por: Núñez, Yisel Garí
Publicado: (2021)

Una perspectiva de aprendizaje por refuerzos híbrido para el control de robots móviles/
por: Carlucho, Ignacio
Publicado: (2019)

Exploración dirigida por el objetivo en Aprendizaje por Refuerzo Basado en Modelo para ambientes no estacionarios
por: Errecalde, Marcelo Luis, et al.
Publicado: (2001)

Navegación autónoma mediante aprendizaje por refuerzo
por: Costa, Ignacio Agustín, et al.
Publicado: (2020)

Aprendizaje por Refuerzo aplicado a la resolución de problemas no triviales
por: Errecalde, Marcelo Luis, et al.
Publicado: (2000)

EcoConversa 2.0: Hacia un paradigma de aprendizaje por refuerzo para la sostenibilidad
por: Brandan, Franco, et al.
Publicado: (2024)

Discovering sensing capability in multi-agent systems
por: Parpaglione, María Cristina, et al.
Publicado: (2022)

Entorno de simulación basado en DEVS para agentes de aprendizaje por refuerzo aplicado a la generación y administración de energías renovables
por: Beccaria, Ezequiel, et al.
Publicado: (2022)

La responsabilidad de los Mass Media en el modelo de violencia: El refuerzo
por: Guagnini, María Fernanda, et al.
Publicado: (2016)

Evaluación de técnicas de aprendizaje por refuerzo para la adaptación de controladores de páncreas artificial
por: Serafini, María Cecilia, et al.
Publicado: (2021)

Marcos teóricos del aprendizaje por refuerzo multiagente : Limitaciones y perspectivas
por: Errecalde, Marcelo Luis
Publicado: (2001)

Aprendizaje : teoría del refuerzo.
por: Keller, Fred S.
Publicado: (1965)

Consolidación de la Memoria y Sustrato Nervioso del Refuerzo
por: Redolar-Ripoll, Diego
Publicado: (2012)

Refuerzo estructural de elementos de hormigón con fibras de carbono (PRFC)
por: Argento, Matías Gonzalo
Publicado: (2017)

Refuerzo estructural en viviendas de adobe
por: Martínez, Selva, et al.
Publicado: (2018)

SARSA BB: Un algoritmo on policy para Sistemas Clasificadores
por: Errecalde, Marcelo Luis, et al.
Publicado: (2002)

Aprendizaje : teoría del refuerzo
por: Keller, Fred S.
Publicado: (1969)

Aprendizaje. Teoría del refuerzo
por: Keller, Fred S.
Publicado: (1976)

Aprendizaje, teoría del refuerzo
por: Keller, Fred S.
Publicado: (1979)

Diseño de Algoritmos basados en la Teoría de Juegos Cuántica para el Modelado de Redes de Comunicación y Aprendizaje por Refuerzo Multi-Agente
por: Silva, Agustín
Publicado: (2024)

Training a gaming agent on brainwaves online: using brain signals as feedback for reinforcement learning
por: Abelenda, Marcos, et al.
Publicado: (2021)

Training an agent on brainwaves: using brain signals as feedback for reinforcement learning
por: Moreno, Juan, et al.
Publicado: (2019)

Proyecto de Refuerzo del Puente sobre el Arroyo Paranay-Guazú – Estudio de Caso
por: Zecchin, Esteban, et al.
Publicado: (2015)

Reinforcement learning : an introduction /
por: Sutton, Richard S.
Publicado: (2018)

Reinforcement learning : an introduction /
por: Sutton, Richard S.
Publicado: (1998)

Reinforcement learning : an introduction /
por: Sutton, Richard S.
Publicado: (2018)

Estudio de una geogrilla en refuerzos asfálticos a través de la compresión diametral
por: Fernández Arnau, Daniel, et al.
Publicado: (2017)

Sala de refuerzo : ¿Una nueva oportunidad para el alumno o la legitimación de su fracaso?
por: Gilmara, Aparecida S., et al.
Publicado: (2006)

Desarrollo de aceros con memoria de forma para refuerzos de hormigón
por: Vallejos, Juan Manuel, et al.
Publicado: (2024)

Detalles y detallado del acero de refuerzo del concreto (ACI 315-80) /
Publicado: (1989)

Learning by knowledge sharing in autonomous intelligent systems
por: García Martínez, Ramón, et al.
Publicado: (2018)

Markerless tracking
por: Mikolás, Lóránt, et al.
Publicado: (2020)

Bot de trading intradiario con gradient boosting y aprendizaje por refuerzo
por: Paganini, Rodolfo
Publicado: (2023)

Modelo para corrección de dosaje de riegos de liga sobre superficies fresadas en refuerzos asfálticos
por: Rivera, José Julián, et al.
Publicado: (2019)