太多厨师：用贝叶斯推理协调多智能体合作

Mar, 2020

太多厨师：用贝叶斯推理协调多智能体合作

Too many cooks: Bayesian inference for coordinating multi-agent collaboration

Rose E. Wang, Sarah A. Wu, James A. Evans, Joshua B. Tenenbaum, David C. Parkes...

TL;DR本文提出了一种基于 Bayesian Delegation 的分散式多智能体学习机制，通过逆向规划实现智能体对他人潜在意图的快速推断，实现协调和合作，展示在多智能体马尔可夫决策过程中的成功应用。

Abstract

collaboration requires agents to coordinate their behavior on the fly, sometimes cooperating to solve a single task together and other times dividing it up into sub-tasks to work on in parallel. Underlying the human ability to collaborate is →

decentralized multi-agent learning bayesian delegation theory-of-mind coordination collaboration

发现论文，激发创造

贝叶斯承诺说服：具有信息燃烧的动态前瞻多智能体委托

该研究探讨了动态机制设计问题中的信息诱导与承诺机制问题，提出了贝叶斯承诺机制 (BPD) 以及相关的信念层次结构与诱导机制，确保了该机制的周期性激励兼容性，求得了最优社会福利。

Jan, 2022

近似去中心化贝叶斯推断

本文提出了一种在分散型学习代理网络上执行贝叶斯推断的近似方法，该方法首先对每个学习代理使用变分推断生成本地近似后验，代理将本地后验传输到网络中的其他代理，最后每个代理组合其收到的本地后验。实验结果表明，这种分散式方法在计算性能和预测测试可能性方面具有优势。

Mar, 2014

在线贝叶斯适应下的次优混合人机团队合作

研究通过计算建模和优化技术，提升人工智能与人类队伍的协同性能，其中人类和机器智能代理由于环境知识不完整而发挥亚最优能力，并采用在线贝叶斯方法推断人们愿意接受机器的协助，实验结果显示协作方式与团队性能、用户信任和对机器的好感度存在显著关联。

Mar, 2024

互动推理：一种合作联合动作的多智能体模型

本文基于主动推断的认知框架提出了一种新颖的多智能体合作联合行动的计算模型，并通过两个模拟实验验证了该模型的有效性。

Oct, 2022

顺序协作贝叶斯推理

研究了合作推理的基础理论，提出了一种新方法 SCBI 来分析一致性，收敛率和稳定性，并表明合作对于特定情况不仅是可能的，而且从理论上讲在一般情况下也是可行的，以及探讨了人类之间和人机之间合作的意义。

Feb, 2020

利用心理理论提高多智能体协作

研究使用贝叶斯心理理论，通过比较具有 ToM 代理和非 ToM 代理的合作玩家的表现，证明 ToM 代理的存在可以显著提高所有类型合作伙伴（包括人类玩家）的合作效率，对于设计更好的合作代理有重要的意义。

Jul, 2020

目标推断改进人机协作的客观和感知性能

本文评估了一种人机协作方案，该方案结合了任务分配和动作规划推理的层次，使用贝叶斯推理预测他的人类伴侣的下一个目标，并实时重新规划自己的行动，实现了预期的适应性，取得了良好的人 - 机表现优化。

Feb, 2018

人工智能协作代理之间的委托优化

在人工智能或自主智能体与人类组成的混合团队中，通过观察团队表现，我们的框架提供了一个经理模型，用于准确识别何时授权团队成员执行动作，而不限制代理机器人的环境模型，结果显示经理模型在不同环境表示下的代理团队中取得了显著的优势。

Sep, 2023

心智理论：逆向规划探寻群体行为

本文提出了一个基于 Composable Team Hierarchies 的生成式模型，通过贝叶斯推理来推断潜在的关系并预测多个智能体在空间随机游戏中的行为，该算法可以迅速恢复智能体之间如何相关的基本模型，算法的推理模式与人类判断非常相似。

Jan, 2019

深度多智能体强化学习的贝叶斯行动解码器

使用 Bayesian action decoder（BAD）的公开信念马尔可夫决策过程（public belief MDP）算法，成功在 Hanabi 卡牌游戏中超越了所有以前发表的学习方法和手动编写方法，创立了新的最先进水平。

Nov, 2018