BriefGPT.xyz
Ask
alpha
关键词
dec-pomdps
搜索结果 - 5
AAAI
去中心化部分可观察马尔可夫决策过程中的实际因果关系和责任归属
本文在 Dec-POMDPs 框架下研究了实际因果关系和责任归因等概念,提出了一种考虑各种因果依赖和责任能够自我调整的责任归因方法,并通过模拟实验比较了不同定义的实际因果关系和责任归因方法之间的差异和影响。
PDF
2 years ago
离线信任学习
该研究提出了一种名为 off-belief learning(OBL)的方法,通过多层次认知推理来解决基于自习的 Dec-POMDPs(分布式部分可观测马尔科夫决策过程)在测试阶段无法适应人类行为模式的问题,并在 Hanabi 基准测试中展
→
PDF
3 years ago
IJCAI
多智能体规划中具有乐观影响的本地价值 --- 扩展版
本论文提出了一种影响 - 乐观上界策略,用于解决具有非因式价值函数的解离式部分可观察 MDP 的规模为数十甚至数百个代理的规划问题,并在数字上比较了不同的上界,并证明了启发式解法的优化保证,展示了该方法的多代理规划方面的潜在应用。
PDF
9 years ago
MAA*: 解决分散式 POMDPs 的启发式搜索算法
本文介绍了多智能体 A*(MAA*),这是第一种完整的和最优的启发式搜索算法,可用于解决具有有限时间视野的分散式部分可观测马尔可夫决策问题(DEC-POMDP)。该算法适用于在随机环境中操作的合作代理组的最优计划的计算,例如多机器人协调、网
→
PDF
12 years ago
分散式 POMDP 的最优和近似 Q 值函数
本文研究决策理论规划在单智能体和分布式 POMDP 模型中的应用,提出了一种可行的计算方法并对其算法进行了评估。
PDF
13 years ago
Prev
Next