BriefGPT.xyz
Ask
alpha
关键词
memory bounded approach
搜索结果 - 2
IJCAI
适应性汤普森抽样堆栈用于内存有限的开环规划
提出一种名为 SYMBOL 的规划方法,该方法采用稳定但内存有限的方法处理部分可观测的开环规划,通过自适应使用 Thompson Sampling bandits 堆栈实现,适用于不需要先前领域知识和面向各种领域的问题,同时在四个大型 PO
→
PDF
5 years ago
AAAI
使用汤普森抽样的有限内存开环规划解决大规模 POMDP 问题
提出了一种基于限制记忆的开环规划方法 —— 部分可观察堆叠 Thompson 采样(POSTS),用以解决大型 POMDP 问题中内存资源有限的问题,相较于传统的基于树的规划方法,该方法具有性能和内存之间的平衡,四个基准问题的实验表明 PO
→
PDF
5 years ago
Prev
Next