Aprendizaje por Refuerzo aplicado a la resolución de problemas no triviales

El Aprendizaje por Refuerzo (en inglés Reinforcement Learning y de ahora en más AR) ataca el problema de aprender a controlar agentes autónomos, mediante interacciones por prueba y error con un ambiente dinámico, el cual le provee señales de refuerzo por cada acción que realiza. Si los objetivos de...

Descripción completa

Detalles Bibliográficos
Autores principales:	Errecalde, Marcelo Luis, Muchut, Alfredo, Aguirre, Guillermo, Montoya, Cecilia Inés
Formato:	Objeto de conferencia
Lenguaje:	Español
Publicado:	2000
Materias:	Ciencias Informáticas Aprendizaje por Refuerzo Learning resolución de problemas no triviales ARTIFICIAL INTELLIGENCE Heuristic methods
Acceso en línea:	http://sedici.unlp.edu.ar/handle/10915/22106
Aporte de:	SEDICI (UNLP) de Universidad Nacional de La Plata

id	I19-R120-10915-22106
record_format	dspace
institution	Universidad Nacional de La Plata
institution_str	I-19
repository_str	R-120
collection	SEDICI (UNLP)
language	Español
topic	Ciencias Informáticas Aprendizaje por Refuerzo Learning resolución de problemas no triviales ARTIFICIAL INTELLIGENCE Heuristic methods
spellingShingle	Ciencias Informáticas Aprendizaje por Refuerzo Learning resolución de problemas no triviales ARTIFICIAL INTELLIGENCE Heuristic methods Errecalde, Marcelo Luis Muchut, Alfredo Aguirre, Guillermo Montoya, Cecilia Inés Aprendizaje por Refuerzo aplicado a la resolución de problemas no triviales
topic_facet	Ciencias Informáticas Aprendizaje por Refuerzo Learning resolución de problemas no triviales ARTIFICIAL INTELLIGENCE Heuristic methods
description	El Aprendizaje por Refuerzo (en inglés Reinforcement Learning y de ahora en más AR) ataca el problema de aprender a controlar agentes autónomos, mediante interacciones por prueba y error con un ambiente dinámico, el cual le provee señales de refuerzo por cada acción que realiza. Si los objetivos del agente están definidos por la señal de refuerzo inmediata, la tarea del agente se reduce a aprender una estrategia de control (o política) que permita maximizar la recompensa acumulada a lo largo del tiempo (ver [14] para una formalización de esta tarea) Si bien en sus orígenes el AR sirvió como una herramienta teórica limitada a problemas con pequeños espacios de estados, en la actualidad sus aplicaciones han alcanzado áreas de considerable complejidad tales como robótica, manufacturación industrial, problemas de búsqueda combinatorial, etc. La aplicación del AR a problemas del mundo real, trajo aparejado la necesidad de adaptar las técnicas existentes en el área para manejar características complejas propias de este tipo de ambientes (ambientes estocásticos no estacionarios con grandes espacios de estados y/o acciones). En esta presentación, describimos el trabajo realizado por nuestro grupo de investigación en la aplicación del AR a problemas no triviales del mundo real. Para ello, describimos en las secciones 2 a 4, los 3 factores principales que a nuestro criterio deben ser tenidos en cuenta al trabajar con AR en este tipo de ambientes: balance entre exploración y explotación, aceleración del proceso de aprendizaje y generalización. La sección 5 por su parte, describe cuales son los avances y resultados que hemos logrado en relación a estos 3 ítems, y una breve descripción del plan de trabajo futuro
format	Objeto de conferencia Objeto de conferencia
author	Errecalde, Marcelo Luis Muchut, Alfredo Aguirre, Guillermo Montoya, Cecilia Inés
author_facet	Errecalde, Marcelo Luis Muchut, Alfredo Aguirre, Guillermo Montoya, Cecilia Inés
author_sort	Errecalde, Marcelo Luis
title	Aprendizaje por Refuerzo aplicado a la resolución de problemas no triviales
title_short	Aprendizaje por Refuerzo aplicado a la resolución de problemas no triviales
title_full	Aprendizaje por Refuerzo aplicado a la resolución de problemas no triviales
title_fullStr	Aprendizaje por Refuerzo aplicado a la resolución de problemas no triviales
title_full_unstemmed	Aprendizaje por Refuerzo aplicado a la resolución de problemas no triviales
title_sort	aprendizaje por refuerzo aplicado a la resolución de problemas no triviales
publishDate	2000
url	http://sedici.unlp.edu.ar/handle/10915/22106
work_keys_str_mv	AT errecaldemarceloluis aprendizajeporrefuerzoaplicadoalaresoluciondeproblemasnotriviales AT muchutalfredo aprendizajeporrefuerzoaplicadoalaresoluciondeproblemasnotriviales AT aguirreguillermo aprendizajeporrefuerzoaplicadoalaresoluciondeproblemasnotriviales AT montoyaceciliaines aprendizajeporrefuerzoaplicadoalaresoluciondeproblemasnotriviales
bdutipo_str	Repositorios
_version_	1764820465542496256

Aprendizaje por Refuerzo aplicado a la resolución de problemas no triviales

Ejemplares similares