Jan, 2023

无需动作的离线预训练辅助在线强化学习

TL;DR本研究探讨了使用无动作信息的离线数据集来提高在线强化学习的潜力,提出了一种名为 “AF-Guide” 的方法,并通过实验证明其可以提高在线训练的效率和性能。