Nov, 2022

高效强化学习(ERL):通过动作饱和实现有针对性的探索

TL;DR本文提出了一种将先前的专家知识与连续 actor-critic RL 框架相结合的简单且有效的方法,以加速策略的学习过程并减少样本复杂度。结果显示,这种方法使得 RL agent 在保持最终性能的情况下,比传统的 RL agent 更快收敛一个数量级。