BriefGPT.xyz
Ask
alpha
关键词
synthetic experience replay
搜索结果 - 1
合成体验回放
通过利用生成模型技术,我们提出了 Synthetic Experience Replay(SynthER),这是一种基于扩散的方法,能够有效地提高在数据有限的情况下训练强化学习代理的样本效率,并为重放学习算法的深度学习实现开启了使用合成数据
→
PDF
a year ago
Prev
Next