Mar, 2023

合成体验回放

TL;DR通过利用生成模型技术,我们提出了 Synthetic Experience Replay(SynthER),这是一种基于扩散的方法,能够有效地提高在数据有限的情况下训练强化学习代理的样本效率,并为重放学习算法的深度学习实现开启了使用合成数据的大门。