BriefGPT.xyz
Ask
alpha
关键词
thinker algorithm
搜索结果 - 1
思行者:学习规划与行动
我们提出了 Thinker 算法,这是一种新颖的方法,使强化学习代理能够与学习的世界模型自主交互并利用它。Thinker 算法通过在环境周围包装一个世界模型,并引入专门用于与世界模型交互的新动作,使代理能够通过向世界模型提议替代方案来进行规
→
PDF
a year ago
Prev
Next