BriefGPT.xyz
Ask
alpha
关键词
offline rl methods
搜索结果 - 1
无需动作的离线预训练辅助在线强化学习
本研究探讨了使用无动作信息的离线数据集来提高在线强化学习的潜力,提出了一种名为 “AF-Guide” 的方法,并通过实验证明其可以提高在线训练的效率和性能。
PDF
a year ago
Prev
Next