将系统解释为解决 POMDP：朝着正式理解机构的一步

Sep, 2022

将系统解释为解决 POMDP：朝着正式理解机构的一步

Interpreting systems as solving POMDPs: a step towards a formal understanding of agency

Martin Biehl, Nathaniel Virgo

TL;DR通过部分可观察的马尔可夫过程理论，我们可以从信仰和目标方面解释系统的功能和代理性，并将其视为解决部分可观察的马尔可夫过程的解。

Abstract

Under what circumstances can a system be said to have beliefs and goals, and how do such agency-related features relate to its physical state? Recent work has proposed a notion of →

beliefs goals interpretation markov processes agent

发现论文，激发创造

多智能体场景下的序列规划框架

本研究在部分可观察马尔可夫决策过程 (POMDPs) 的基础上，将代理模型纳入到状态空间中，使其扩展到了多智能体的情景下。代理人通过贝叶斯更新来维护对物理环境状态和其他代理模型的信念，并使用基于置信状态的映射来求得最优方案。虽然我们的方法中代理人的模型不可直接被操纵或观察，但我们证明了 POMDPs 的重要特性如收敛率、价值函数的分段线性和凸性等在我们的框架下仍然成立。

Sep, 2011

代理人与设备：一种相对定义的代理概念

该论文讨论了以物理立场和意图立场描述系统的形式对应于计算理论中设备和代理的概念，并通过贝叶斯规则计算系统是设备还是代理的主观概率。

May, 2018

逻辑约束部分可观测多智能体马尔科夫决策过程的最优控制

本文讲述了一种基于特定约束的自主系统与多智能体的优化控制方法，以实现其最大化收益并同时满足时间逻辑约束的概率足够高。

May, 2023

具有随时确定性保证的在线 POMDP 规划

通过简化解决方案与理论上最优解之间的确定性关系，解决了在计算上昂贵的部分可观测马尔可夫决策过程（POMDPs）困难，为自主代理在不完全信息环境下的规划提供了确定性界限。

Oct, 2023

POMDP 中的策略指导的逻辑规范学习：归纳逻辑编程方法

从 POMDP 执行的痕迹中学习得到高质量的启发式方法，通过转换为逻辑语义并利用数据和时间高效的归纳逻辑编程生成可解释的基于信念的策略规范，以在线方式引导 POMDP 求解器的行动选择过程。使用 Answer Set Programming (ASP) 表达的学习启发式方法展现了性能优于神经网络且与最佳手工设计的任务特定启发式方法相当的特点。

Feb, 2024

互动 POMDP Lite: 面向与自我利益相关的智能体互动的实用规划预测和利用意图

研究智能代理与多代理系统中的规划算法，探索在预测其他代理人的意图的基础上构建的高效的意图感知规划框架，并通过一系列随机博弈的实验表明，该框架可以实现更好的和更稳健的性能。

Apr, 2013

众多智能体 POMDP 中的分解式在线规划

在集中式多智能体系统中，使用多智能体部分可观察马尔可夫决策过程（MPOMDPs）进行建模，其中动作和观察空间随着智能体数量呈指数增长，使得单智能体在线规划的价值和信念状态估计变得低效。本研究采用加权粒子滤波和可扩展的信念状态近似方法，同时解决了价值估计和状态估计的挑战，提出了基于稀疏粒子滤波信念树的在线规划算法，该算法在少量智能体的情况下表现出竞争性的性能，并在多智能体的基准测试中胜过现有算法。

Dec, 2023

带安全可达目标的 POMDP 有界策略合成

本文研究了带安全可达性目标的部分可观测马尔可夫决策过程（POMDPs），提出了一种基于目标约束信念空间和符号约束的方法来合成能实现安全可达性目标的策略，并通过实验结果表明，该方法能够在大量信念空间中高效地搜索有效策略。

Jan, 2018

部分可观察马尔可夫决策过程的基于点的模型检验方法

提出了一种在部分可观察的马尔可夫决策过程（POMDP）中实现满足线性时间逻辑公式的策略的方法，该方法使用基于点的价值迭代方法来高效地近似满足所需逻辑公式的最大概率，并计算相应的置信状态策略。证明该方法适用于大型 POMDP 领域，并为最终策略的性能提供了强大的边界。

Jan, 2020

贝叶斯心智理论中关于信念的语言基础

通过对 Bayesian 心智模型的建模，该论文解释了人类相信陈述的语义，解释了人类对他人目标和信念的归属，并证明了心智理论对信念语义的重要性。

Feb, 2024