Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché

Q-Learning es un método de Aprendizaje por Refuerzo que permite resolver problemas de decisión secuencial en los cuales la utilidad de una acción depende de una secuencia de decisiones y donde además existe incertidumbre en cuanto a las dinámicas del ambiente en que está situado el agente. Este marc...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Printista, Alicia Marcela, Errecalde, Marcelo Luis, Montoya, Cecilia Inés
Formato:	Objeto de conferencia
Lenguaje:	Español
Publicado:	2000
Materias:	Ciencias Informáticas Parallel programming comunicación basada en caché aprendizaje por refuerzo programación dinámica asincrónica
Acceso en línea:	http://sedici.unlp.edu.ar/handle/10915/23363
Aporte de:	SEDICI (UNLP) de Universidad Nacional de La Plata

id	I19-R120-10915-23363
record_format	dspace
institution	Universidad Nacional de La Plata
institution_str	I-19
repository_str	R-120
collection	SEDICI (UNLP)
language	Español
topic	Ciencias Informáticas Parallel programming comunicación basada en caché aprendizaje por refuerzo programación dinámica asincrónica
spellingShingle	Ciencias Informáticas Parallel programming comunicación basada en caché aprendizaje por refuerzo programación dinámica asincrónica Printista, Alicia Marcela Errecalde, Marcelo Luis Montoya, Cecilia Inés Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
topic_facet	Ciencias Informáticas Parallel programming comunicación basada en caché aprendizaje por refuerzo programación dinámica asincrónica
description	Q-Learning es un método de Aprendizaje por Refuerzo que permite resolver problemas de decisión secuencial en los cuales la utilidad de una acción depende de una secuencia de decisiones y donde además existe incertidumbre en cuanto a las dinámicas del ambiente en que está situado el agente. Este marco general de trabajo ha permitido aplicar Q-Learning y otros métodos de Aprendizaje por Refuerzo a una amplia gama de problemas del mundo real de considerable complejidad, como por ejemplo navegación de robots, manufacturación industrial, juegos, control de ascensores, etc. A pesar de las características interesantes de Q-Learning, uno de sus principales problemas es que es un método lento, ya que el agente requiere un tiempo considerable de entrenamiento para aprender una política aceptable. A los fines de solucionar, o al menos atenuar este problema, este trabajo propone un modelo de implementación paralela de Q-Learning manteniendo una representación tabular, y utilizando un esquema de comunicación basada en caché. Este modelo es aplicado en un problema particular, reportándose los resultados obtenidos con distintas configuraciones de procesadores y analizándose las ventajas y limitaciones actuales del enfoque
format	Objeto de conferencia Objeto de conferencia
author	Printista, Alicia Marcela Errecalde, Marcelo Luis Montoya, Cecilia Inés
author_facet	Printista, Alicia Marcela Errecalde, Marcelo Luis Montoya, Cecilia Inés
author_sort	Printista, Alicia Marcela
title	Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_short	Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_full	Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_fullStr	Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_full_unstemmed	Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_sort	una implementación paralela del algoritmo de q-learning basada en un esquema de comunicación con caché
publishDate	2000
url	http://sedici.unlp.edu.ar/handle/10915/23363
work_keys_str_mv	AT printistaaliciamarcela unaimplementacionparaleladelalgoritmodeqlearningbasadaenunesquemadecomunicacionconcache AT errecaldemarceloluis unaimplementacionparaleladelalgoritmodeqlearningbasadaenunesquemadecomunicacionconcache AT montoyaceciliaines unaimplementacionparaleladelalgoritmodeqlearningbasadaenunesquemadecomunicacionconcache
bdutipo_str	Repositorios
_version_	1764820465743822848

Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché

Ejemplares similares