BriefGPT.xyz
Ask
alpha
关键词
open-loop planning
搜索结果 - 1
IJCAI
适应性汤普森抽样堆栈用于内存有限的开环规划
提出一种名为 SYMBOL 的规划方法,该方法采用稳定但内存有限的方法处理部分可观测的开环规划,通过自适应使用 Thompson Sampling bandits 堆栈实现,适用于不需要先前领域知识和面向各种领域的问题,同时在四个大型 PO
→
PDF
5 years ago
Prev
Next