BriefGPT.xyz
Ask
alpha
关键词
k-learning
搜索结果 - 1
ICLR
强化学习与概率推断的理解
本研究因 RL 作为推理方法的短处而对其进行澄清,RL 代理人必须考虑其行动对未来奖励和观察结果的影响,即探索和开发之间的权衡。我们证明了‘RL 作为推理’近似在基本问题中表现不佳,但我们展示了通过小修正该框架可以获得可靠的算法,该算法与最
→
PDF
5 years ago
Prev
Next