顺序协作贝叶斯推理
本文提出一种正式的框架,介绍了衡量概率和合作信息传递有效性的新指标,证明了能够实现最佳合作推理的条件,并展示了这些原则如何指导机器学习算法的设计以及对人类和机器学习的影响。
May, 2017
本文提出了一种基于 Bayesian Delegation 的分散式多智能体学习机制,通过逆向规划实现智能体对他人潜在意图的快速推断,实现协调和合作,展示在多智能体马尔可夫决策过程中的成功应用。
Mar, 2020
我们提出了一种合作的贝叶斯优化问题,用于优化两个变量的黑盒函数,其中两个代理一起选择在哪些点查询函数,但每个代理只能控制一个变量。这个设置受到人工智能与人类合作的启发,在这种简单情况下进行协同优化。我们将解决方案制定为顺序决策过程,我们控制的代理将用户建模为一个具有先验知识的计算有理主体。我们展示了通过战略查询规划可以更好地识别函数的全局最大值,只要用户避免过度探索。这种规划是通过使用贝叶斯自适应蒙特卡洛规划以及赋予代理用户模型来实现的,该用户模型考虑了保守的信念更新和查询点的探索性采样。
Mar, 2024
本研究提出了一种基于贝叶斯网络的多代理协作强化学习算法,建立了协作性马尔可夫博弈中多代理行动选择的依赖关系并证明了其全局收敛性和优越性,通过可微的有向无环图,实现了动态学习具有背景感知能力的贝叶斯网络策略,并在多个 MARL 基准测试中获得了改进。
Jun, 2023
本研究通过使用 Hamiltonian Monte Carlo(HMC)来执行连续贝叶斯推理,并通过其样本拟合密度估计器将后验作为新任务的先验进行传播,从而检验了访问真实后验能否保证预防神经网络中的灾难性遗忘,并发现这种方法无法预防灾难性遗忘,说明进行神经网络中的顺序贝叶斯推理的困难性。因此,提出了一种概率连续学习生成过程的贝叶斯模型,而非依赖于神经网络权重的顺序贝叶斯推理。此外,还提出了一个名为原型贝叶斯连续学习的简单基线,可用于类增量连续学习视觉基准,与最先进的贝叶斯连续学习方法相竞争。
Jan, 2023
我们提出了一种协作和可解释的贝叶斯优化框架(CoExBO),它通过优先学习无缝地将人类洞察力整合到优化中,为用户提供与其偏好相符的算法建议,并通过解释候选项选择来建立信任,使用户对优化有更清晰的掌握。此外,CoExBO 提供不会造成损害的保证,允许用户犯错误;即使进行极端对抗性干预,该算法也渐进地收敛到一个标准的贝叶斯优化方法。通过在锂离子电池设计中进行人工智能协作实验,我们验证了 CoExBO 的有效性,并凸显了与传统方法相比的显著改进。
Oct, 2023
本文提出了一种基于贝叶斯方法和高斯过程的主动学习框架 ——ABCI,该框架可同时进行因果图推断和因果推理,通过最大信息设计测量,从少量样本中更加高效地准确学习下游的因果查询,并为有关量提供良好的预测不确定性估计。
Jun, 2022