Dec, 2020

一种高效的异步方法用于整合进化和基于梯度的策略搜索

TL;DR本研究提出了一种异步进化策略强化学习 (AES-RL) 算法,将进化策略和策略梯度结合,并引入异步更新的方法,能够在连续控制基准测试中表现出优异的性能和时间效率。