BriefGPT.xyz
Ask
alpha
关键词
value iteration algorithms
搜索结果 - 1
基于点的价值迭代算法用于神经符号 POMDPs
本文介绍了神经符号人工智能在不确定性的情况下进行序列决策的一种新方法,即神经符号部分可观察马尔可夫决策过程 (NS-POMDPs);提出了基于多面体的新型连续状态置信度分段线性凸表示 (P-PWLC),并且扩展将 Bellman 备份应用于
→
PDF
a year ago
Prev
Next