BriefGPT.xyz
Ask
alpha
关键词
poliformer
搜索结果 - 1
PoliFormer: 用 Transformer 扩展 On-Policy 强化学习,实现高超的导航员
我们提出了 PoliFormer(Policy Transformer),这是一个使用强化学习进行训练的 RGB 室内导航代理,采用规模化的端到端训练,能够在真实世界中无需适应即可进行泛化,尽管它是纯在模拟环境中训练的。PoliFormer
→
PDF
8 days ago
Prev
Next