Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché

Q-Learning es un método de Aprendizaje por Refuerzo que permite resolver problemas de decisión secuencial en los cuales la utilidad de una acción depende de una secuencia de decisiones y donde además existe incertidumbre en cuanto a las dinámicas del ambiente en que está situado el agente. Este marc...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Printista, Alicia Marcela, Errecalde, Marcelo Luis, Montoya, Cecilia Inés
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2000
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/23363
Aporte de:
id I19-R120-10915-23363
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Parallel programming
comunicación basada en caché
aprendizaje por refuerzo
programación dinámica asincrónica
spellingShingle Ciencias Informáticas
Parallel programming
comunicación basada en caché
aprendizaje por refuerzo
programación dinámica asincrónica
Printista, Alicia Marcela
Errecalde, Marcelo Luis
Montoya, Cecilia Inés
Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
topic_facet Ciencias Informáticas
Parallel programming
comunicación basada en caché
aprendizaje por refuerzo
programación dinámica asincrónica
description Q-Learning es un método de Aprendizaje por Refuerzo que permite resolver problemas de decisión secuencial en los cuales la utilidad de una acción depende de una secuencia de decisiones y donde además existe incertidumbre en cuanto a las dinámicas del ambiente en que está situado el agente. Este marco general de trabajo ha permitido aplicar Q-Learning y otros métodos de Aprendizaje por Refuerzo a una amplia gama de problemas del mundo real de considerable complejidad, como por ejemplo navegación de robots, manufacturación industrial, juegos, control de ascensores, etc. A pesar de las características interesantes de Q-Learning, uno de sus principales problemas es que es un método lento, ya que el agente requiere un tiempo considerable de entrenamiento para aprender una política aceptable. A los fines de solucionar, o al menos atenuar este problema, este trabajo propone un modelo de implementación paralela de Q-Learning manteniendo una representación tabular, y utilizando un esquema de comunicación basada en caché. Este modelo es aplicado en un problema particular, reportándose los resultados obtenidos con distintas configuraciones de procesadores y analizándose las ventajas y limitaciones actuales del enfoque
format Objeto de conferencia
Objeto de conferencia
author Printista, Alicia Marcela
Errecalde, Marcelo Luis
Montoya, Cecilia Inés
author_facet Printista, Alicia Marcela
Errecalde, Marcelo Luis
Montoya, Cecilia Inés
author_sort Printista, Alicia Marcela
title Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_short Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_full Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_fullStr Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_full_unstemmed Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
title_sort una implementación paralela del algoritmo de q-learning basada en un esquema de comunicación con caché
publishDate 2000
url http://sedici.unlp.edu.ar/handle/10915/23363
work_keys_str_mv AT printistaaliciamarcela unaimplementacionparaleladelalgoritmodeqlearningbasadaenunesquemadecomunicacionconcache
AT errecaldemarceloluis unaimplementacionparaleladelalgoritmodeqlearningbasadaenunesquemadecomunicacionconcache
AT montoyaceciliaines unaimplementacionparaleladelalgoritmodeqlearningbasadaenunesquemadecomunicacionconcache
bdutipo_str Repositorios
_version_ 1764820465743822848