Oct, 2023

理解何时动力学不变数据增强对无模型强化学习更新有益

TL;DR数据扩增在强化学习任务中提高数据效率的实验研究中起关键作用,增加状态 - 动作覆盖范围对数据效率的影响明显大于奖励密度的增加,同时减少扩增回放比显著提高数据效率。