顺序协作贝叶斯推理

ICMLFeb, 2020

Sequential Cooperative Bayesian Inference

Junqi Wang, Pei Wang, Patrick Shafto

TL;DR研究了合作推理的基础理论，提出了一种新方法 SCBI 来分析一致性，收敛率和稳定性，并表明合作对于特定情况不仅是可能的，而且从理论上讲在一般情况下也是可行的，以及探讨了人类之间和人机之间合作的意义。

Abstract

cooperation is often implicitly assumed when learning from other agents. cooperation implies that the agent selecting the data, and the agent learning from the data, have the same goal, that the learner infer the

cooperation bayesian agents sequential data inference human-machine cooperation

发现论文，激发创造

最优合作推理

本文提出一种正式的框架，介绍了衡量概率和合作信息传递有效性的新指标，证明了能够实现最佳合作推理的条件，并展示了这些原则如何指导机器学习算法的设计以及对人类和机器学习的影响。

May, 2017

太多厨师：用贝叶斯推理协调多智能体合作

本文提出了一种基于 Bayesian Delegation 的分散式多智能体学习机制，通过逆向规划实现智能体对他人潜在意图的快速推断，实现协调和合作，展示在多智能体马尔可夫决策过程中的成功应用。

Mar, 2020

不完美代理的合作贝叶斯优化

我们提出了一种合作的贝叶斯优化问题，用于优化两个变量的黑盒函数，其中两个代理一起选择在哪些点查询函数，但每个代理只能控制一个变量。这个设置受到人工智能与人类合作的启发，在这种简单情况下进行协同优化。我们将解决方案制定为顺序决策过程，我们控制的代理将用户建模为一个具有先验知识的计算有理主体。我们展示了通过战略查询规划可以更好地识别函数的全局最大值，只要用户避免过度探索。这种规划是通过使用贝叶斯自适应蒙特卡洛规划以及赋予代理用户模型来实现的，该用户模型考虑了保守的信念更新和查询点的探索性采样。

Mar, 2024

互动推理：一种合作联合动作的多智能体模型

本文基于主动推断的认知框架提出了一种新颖的多智能体合作联合行动的计算模型，并通过两个模拟实验验证了该模型的有效性。

Oct, 2022

协作科学的激励理论贝叶斯推演

当研究中存在拥有私人先验的代理者和希望基于参数值做出决策的主要决策者时，研究探讨了假设检验，以维护科学严谨性，并使用代理者的战略行为来进行统计推断。

Jul, 2023

面向上下文的贝叶斯网络演员 - 评论者方法用于协作多智体强化学习

本研究提出了一种基于贝叶斯网络的多代理协作强化学习算法，建立了协作性马尔可夫博弈中多代理行动选择的依赖关系并证明了其全局收敛性和优越性，通过可微的有向无环图，实现了动态学习具有背景感知能力的贝叶斯网络策略，并在多个 MARL 基准测试中获得了改进。

Jun, 2023

连续学习的序列贝叶斯推理

本研究通过使用 Hamiltonian Monte Carlo（HMC）来执行连续贝叶斯推理，并通过其样本拟合密度估计器将后验作为新任务的先验进行传播，从而检验了访问真实后验能否保证预防神经网络中的灾难性遗忘，并发现这种方法无法预防灾难性遗忘，说明进行神经网络中的顺序贝叶斯推理的困难性。因此，提出了一种概率连续学习生成过程的贝叶斯模型，而非依赖于神经网络权重的顺序贝叶斯推理。此外，还提出了一个名为原型贝叶斯连续学习的简单基线，可用于类增量连续学习视觉基准，与最先进的贝叶斯连续学习方法相竞争。

Jan, 2023

非贝叶斯社会学习

研究信息聚合和社会学习模型，发现当个体代理通过私有观察和邻居信念的更新以及平均相信邻居来学习正确的世界状态时，使用特定的条件，代理最终会预测未来趋势并达成一致共识。

Mar, 2011

人类参与协作和可解释性贝叶斯优化

我们提出了一种协作和可解释的贝叶斯优化框架（CoExBO），它通过优先学习无缝地将人类洞察力整合到优化中，为用户提供与其偏好相符的算法建议，并通过解释候选项选择来建立信任，使用户对优化有更清晰的掌握。此外，CoExBO 提供不会造成损害的保证，允许用户犯错误；即使进行极端对抗性干预，该算法也渐进地收敛到一个标准的贝叶斯优化方法。通过在锂离子电池设计中进行人工智能协作实验，我们验证了 CoExBO 的有效性，并凸显了与传统方法相比的显著改进。

Oct, 2023

主动贝叶斯因果推断

本文提出了一种基于贝叶斯方法和高斯过程的主动学习框架 ——ABCI，该框架可同时进行因果图推断和因果推理，通过最大信息设计测量，从少量样本中更加高效地准确学习下游的因果查询，并为有关量提供良好的预测不确定性估计。

Jun, 2022