Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché
Q-Learning es un método de Aprendizaje por Refuerzo que permite resolver problemas de decisión secuencial en los cuales la utilidad de una acción depende de una secuencia de decisiones y donde además existe incertidumbre en cuanto a las dinámicas del ambiente en que está situado el agente. Este marc...
Guardado en:
| Autores principales: | , , |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2000
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/23363 |
| Aporte de: |
| id |
I19-R120-10915-23363 |
|---|---|
| record_format |
dspace |
| institution |
Universidad Nacional de La Plata |
| institution_str |
I-19 |
| repository_str |
R-120 |
| collection |
SEDICI (UNLP) |
| language |
Español |
| topic |
Ciencias Informáticas Parallel programming comunicación basada en caché aprendizaje por refuerzo programación dinámica asincrónica |
| spellingShingle |
Ciencias Informáticas Parallel programming comunicación basada en caché aprendizaje por refuerzo programación dinámica asincrónica Printista, Alicia Marcela Errecalde, Marcelo Luis Montoya, Cecilia Inés Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché |
| topic_facet |
Ciencias Informáticas Parallel programming comunicación basada en caché aprendizaje por refuerzo programación dinámica asincrónica |
| description |
Q-Learning es un método de Aprendizaje por Refuerzo que permite resolver problemas de decisión secuencial en los cuales la utilidad de una acción depende de una secuencia de decisiones y donde además existe incertidumbre en cuanto a las dinámicas del ambiente en que está situado el agente. Este marco general de trabajo ha permitido aplicar Q-Learning y otros métodos de Aprendizaje por Refuerzo a una amplia gama de problemas del mundo real de considerable complejidad, como por ejemplo navegación de robots, manufacturación industrial, juegos, control de ascensores, etc.
A pesar de las características interesantes de Q-Learning, uno de sus principales problemas es que es un método lento, ya que el agente requiere un tiempo considerable de entrenamiento para aprender una política aceptable.
A los fines de solucionar, o al menos atenuar este problema, este trabajo propone un modelo de implementación paralela de Q-Learning manteniendo una representación tabular, y utilizando un esquema de comunicación basada en caché.
Este modelo es aplicado en un problema particular, reportándose los resultados obtenidos con distintas configuraciones de procesadores y analizándose las ventajas y limitaciones actuales del enfoque |
| format |
Objeto de conferencia Objeto de conferencia |
| author |
Printista, Alicia Marcela Errecalde, Marcelo Luis Montoya, Cecilia Inés |
| author_facet |
Printista, Alicia Marcela Errecalde, Marcelo Luis Montoya, Cecilia Inés |
| author_sort |
Printista, Alicia Marcela |
| title |
Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché |
| title_short |
Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché |
| title_full |
Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché |
| title_fullStr |
Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché |
| title_full_unstemmed |
Una implementación paralela del algoritmo de Q-Learning basada en un esquema de comunicación con caché |
| title_sort |
una implementación paralela del algoritmo de q-learning basada en un esquema de comunicación con caché |
| publishDate |
2000 |
| url |
http://sedici.unlp.edu.ar/handle/10915/23363 |
| work_keys_str_mv |
AT printistaaliciamarcela unaimplementacionparaleladelalgoritmodeqlearningbasadaenunesquemadecomunicacionconcache AT errecaldemarceloluis unaimplementacionparaleladelalgoritmodeqlearningbasadaenunesquemadecomunicacionconcache AT montoyaceciliaines unaimplementacionparaleladelalgoritmodeqlearningbasadaenunesquemadecomunicacionconcache |
| bdutipo_str |
Repositorios |
| _version_ |
1764820465743822848 |