BriefGPT.xyz
Ask
alpha
关键词
offline rl benchmarks
搜索结果 - 1
基于模型的离线策略优化与对抗网络
使用对抗学习建立具有更好泛化性能的转移模型,能够更准确地量化模型不确定性,并在广泛研究的离线强化学习基准测试中胜过现有最先进的对照方法。
PDF
10 months ago
Prev
Next