BriefGPT.xyz
Ask
alpha
关键词
latent-variable autoregressive model
搜索结果 - 1
ICLR
结合长期未来的强化学习动力学模型学习
本文着重于构建一个具有考虑长期未来的模型,并展示如何利用它进行有效规划和探索,通过搜寻模型下的不可能轨迹来设计探索策略,并在两种学习环境中取得了比基线更快更高报酬的效果。
PDF
5 years ago
Prev
Next