BriefGPT.xyz
Ask
alpha
关键词
monte-carlo planning
搜索结果 - 3
在线随机情况规划的展开策略
部分可观察马尔可夫决策过程 (POMDP) 是在部分可观察性和随机行为下进行决策的有用模型。本文将 POMDP 建模为随机条件规划问题,并提出了两种领域独立的启发式算法,一种基于经典规划中著名的 h_add 启发式算法,另一种在信念空间中计
→
PDF
9 months ago
ACL
蒙特卡罗规划的忠实问答
本论文提出 FAithful question answering with MontE-carlo planning (FAME)方法,以结构化蕴含树方式展示中间推理步骤,包含多个基础任务模块并通过蒙特卡罗规划算法作为控制器提出行动,旨在
→
PDF
a year ago
POLY-HOOT:在连续空间 MDPs 中进行蒙特卡罗规划的非渐近分析
本文提出了一种算法 POLY-HOOT,将连续武装匪徒策略与 Monte-Carlo Tree Search(MCTS)相结合,使用多项式奖励项来增强 HOO 算法,并分析其在非静态匪徒问题中的后悔率和收敛性。
PDF
4 years ago
Prev
Next