BriefGPT.xyz
Ask
alpha
关键词
foresight goal inference
搜索结果 - 1
IJCAI
MapGo: 面向目标任务的模型辅助策略优化
本文提出了一种名为 FGI 的新的重标记策略用于改善回报稀疏性问题,并通过引入动态模型来生成模拟轨迹来提高采样效率,提出了一种名为 MapGo 框架用于目标导向任务的模型辅助策略优化, 并在复杂任务上的实验证明了 FGI 策略相比后见策略的
→
PDF
3 years ago
Prev
Next