Reinforcement learning: Un estudio comparativo de la performance de sus principales métodos

En los últimos años, el interés por el concepto de Reinforcement Learning (RL) se ha incrementado en forma considerable dentro de la comunidad de investigadores de Machine Learning e Inteligencia Artificial en general. El principal motivo fue el suceso que los métodos de RL tuvieron en la resolución...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Crespo, María Liz, Errecalde, Marcelo Luis, Montoya, Cecilia Inés
Formato:	Objeto de conferencia
Lenguaje:	Español
Publicado:	1998
Materias:	Ciencias Informáticas Informática inteligencia artifícial Learning reinforcement learning Collaborative learning machine learning ARTIFICIAL INTELLIGENCE programación dinámica asincrónica métodos libres de modelo arquitecturas para aprendizaje y planeamiento
Acceso en línea:	http://sedici.unlp.edu.ar/handle/10915/24832
Aporte de:	SEDICI (UNLP) de Universidad Nacional de La Plata

id	I19-R120-10915-24832
record_format	dspace
institution	Universidad Nacional de La Plata
institution_str	I-19
repository_str	R-120
collection	SEDICI (UNLP)
language	Español
topic	Ciencias Informáticas Informática inteligencia artifícial Learning reinforcement learning Collaborative learning machine learning ARTIFICIAL INTELLIGENCE programación dinámica asincrónica métodos libres de modelo arquitecturas para aprendizaje y planeamiento
spellingShingle	Ciencias Informáticas Informática inteligencia artifícial Learning reinforcement learning Collaborative learning machine learning ARTIFICIAL INTELLIGENCE programación dinámica asincrónica métodos libres de modelo arquitecturas para aprendizaje y planeamiento Crespo, María Liz Errecalde, Marcelo Luis Montoya, Cecilia Inés Reinforcement learning: Un estudio comparativo de la performance de sus principales métodos
topic_facet	Ciencias Informáticas Informática inteligencia artifícial Learning reinforcement learning Collaborative learning machine learning ARTIFICIAL INTELLIGENCE programación dinámica asincrónica métodos libres de modelo arquitecturas para aprendizaje y planeamiento
description	En los últimos años, el interés por el concepto de Reinforcement Learning (RL) se ha incrementado en forma considerable dentro de la comunidad de investigadores de Machine Learning e Inteligencia Artificial en general. El principal motivo fue el suceso que los métodos de RL tuvieron en la resolución de problemas, que no lograban atacar en forma satisfactoria enfoques tradicionales como Programación Dinámica y aprendizaje supervisado (por ejemplo Redes Neuronales). RL ataca el problema de aprender a controlar agentes autónomos (como por ejemplo robots), mediante interacciones por prueba y error con un ambiente dinámico, el cual le provee señales de refuerzo por cada acción que realiza. La principal virtud de RL es que permite atacar el problema de la asignación de crédito temporal, el cual consiste en asignar un apropiado crédito o censura a las acciones individuales cuando el efecto o recompensa de dichas acciones es demorado hasta que una serie de acciones se han realizado. Los conceptos teóricos fundamentales de RL, como así también algunos de sus principales métodos son descriptos a modo de survey, dirigidos a aquellas personas que tienen interés en introducirse en este área. Se presenta un análisis comparativo de los resultados obtenidos mediante métodos libres de modelo (Q-Learning) y métodos que integran aprendizaje y planificación (Dyna-Q y Prioritized Sweeping), tomando como referencia los valores obtenidos con los métodos clásicos de Programación Dinámica (Value Iteration). También se analiza el problema conocido como el dilema de la exploración-explotación, ya que en RL es el agente quien controla la distribución de los ejemplos de entrenamiento, eligiendo la secuencia de acciones a tomar. Estos métodos se aplicaron a problemas del mundo de los laberintos, típicamente usados en el área.
format	Objeto de conferencia Objeto de conferencia
author	Crespo, María Liz Errecalde, Marcelo Luis Montoya, Cecilia Inés
author_facet	Crespo, María Liz Errecalde, Marcelo Luis Montoya, Cecilia Inés
author_sort	Crespo, María Liz
title	Reinforcement learning: Un estudio comparativo de la performance de sus principales métodos
title_short	Reinforcement learning: Un estudio comparativo de la performance de sus principales métodos
title_full	Reinforcement learning: Un estudio comparativo de la performance de sus principales métodos
title_fullStr	Reinforcement learning: Un estudio comparativo de la performance de sus principales métodos
title_full_unstemmed	Reinforcement learning: Un estudio comparativo de la performance de sus principales métodos
title_sort	reinforcement learning: un estudio comparativo de la performance de sus principales métodos
publishDate	1998
url	http://sedici.unlp.edu.ar/handle/10915/24832
work_keys_str_mv	AT crespomarializ reinforcementlearningunestudiocomparativodelaperformancedesusprincipalesmetodos AT errecaldemarceloluis reinforcementlearningunestudiocomparativodelaperformancedesusprincipalesmetodos AT montoyaceciliaines reinforcementlearningunestudiocomparativodelaperformancedesusprincipalesmetodos
bdutipo_str	Repositorios
_version_	1764820466396037122

Reinforcement learning: Un estudio comparativo de la performance de sus principales métodos

Ejemplares similares