Nov, 2022

高效经验回放的事件表

TL;DR介绍了使用基于事件表格的分层采样(SSET)方法,该方法将经验回放缓冲区划分为事件表格,每个表格都捕获了优化行为的重要子序列,在 MiniGrid 领域、基准 RL 环境和高保真度赛车模拟器中进行的实证研究表明,相较于现有的 ER 缓冲区采样方法,采用 SSET 方法具有更快的学习速度和更好的稳定性。