BriefGPT.xyz
Ask
alpha
关键词
transition models
搜索结果 - 3
基于模型的离线策略优化与对抗网络
使用对抗学习建立具有更好泛化性能的转移模型,能够更准确地量化模型不确定性,并在广泛研究的离线强化学习基准测试中胜过现有最先进的对照方法。
PDF
10 months ago
ICML
强化学习中的可行性原理理论
本文提出了一种基于 Markov Decision Processes 的行动效益理论,它能够加速计划过程,同时提高学习效率和准确性,特别是在需要函数逼近的模型中。文中还介绍了一种学习行动效益的方法,并将其用于估计更简单且泛化能力更强的状态
→
PDF
4 years ago
TreeQN 和 ATreeC:用于深度强化学习的可微分树形结构模型
本研究介绍了一种新的基于在线计划的树形结构模型 TreeQN,并且通过在多种游戏环境中的实验表明 TreeQN 和 ATreeC 模型具备优秀的性能。
PDF
7 years ago
Prev
Next