不完美代理的合作贝叶斯优化

Mar, 2024

Cooperative Bayesian Optimization for Imperfect Agents

Ali Khoshvishkaie, Petrus Mikkola, Pierre-Alexandre Murena, Samuel Kaski

TL;DR我们提出了一种合作的贝叶斯优化问题，用于优化两个变量的黑盒函数，其中两个代理一起选择在哪些点查询函数，但每个代理只能控制一个变量。这个设置受到人工智能与人类合作的启发，在这种简单情况下进行协同优化。我们将解决方案制定为顺序决策过程，我们控制的代理将用户建模为一个具有先验知识的计算有理主体。我们展示了通过战略查询规划可以更好地识别函数的全局最大值，只要用户避免过度探索。这种规划是通过使用贝叶斯自适应蒙特卡洛规划以及赋予代理用户模型来实现的，该用户模型考虑了保守的信念更新和查询点的探索性采样。

Abstract

We introduce a cooperative bayesian optimization problem for optimizing black-box functions of two variables where two agents choose together at which points to query the function but have only control over one v

cooperative bayesian optimization problem black-box functions human-ai teamwork sequential decision-making bayes adaptive monte carlo planning

发现论文，激发创造

人类参与协作和可解释性贝叶斯优化

我们提出了一种协作和可解释的贝叶斯优化框架（CoExBO），它通过优先学习无缝地将人类洞察力整合到优化中，为用户提供与其偏好相符的算法建议，并通过解释候选项选择来建立信任，使用户对优化有更清晰的掌握。此外，CoExBO 提供不会造成损害的保证，允许用户犯错误；即使进行极端对抗性干预，该算法也渐进地收敛到一个标准的贝叶斯优化方法。通过在锂离子电池设计中进行人工智能协作实验，我们验证了 CoExBO 的有效性，并凸显了与传统方法相比的显著改进。

Oct, 2023

因果贝叶斯优化

本文研究了在可以进行一系列干预的因果模型中全局优化感兴趣的变量的问题，提出了一种新算法 Causal Bayesian Optimization (CBO)，结合了因果推断、不确定性量化和序贯决策等思想，同时考虑了经典的探索 - exploitation 与新型的观测 - intervention 的平衡，通过应用于不同场景中，显示出了该方法的优越性。

May, 2020

在线贝叶斯适应下的次优混合人机团队合作

研究通过计算建模和优化技术，提升人工智能与人类队伍的协同性能，其中人类和机器智能代理由于环境知识不完整而发挥亚最优能力，并采用在线贝叶斯方法推断人们愿意接受机器的协助，实验结果显示协作方式与团队性能、用户信任和对机器的好感度存在显著关联。

Mar, 2024

合作游戏的交互式逆强化学习

该研究探讨了如何设计自主智能体，使其在没有访问联合奖励函数的情况下能够有效地与潜在的次优合作伙伴进行合作。我们将这个问题建模为一个合作的、情节性的两个代理 Markov 决策过程。我们分析了该交互式两个代理场景中关于奖励函数的信息如何被获得，结果显示学习代理的策略对转移函数具有显著影响时，奖励函数可以被高效地学习。

Nov, 2021

利用积极征询专家知识增强的贝叶斯优化

本文介绍了一种基于贝叶斯优化的多任务学习方法，其中引入了专家知识进行加速优化，并通过 Siamese 神经网络进行知识收集，实验结果表明，该方法可以显著加速优化过程。

Aug, 2022

人算协同贝叶斯优化工程系统

应用高通量贝叶斯优化和离散决策理论，提出了一种协同贝叶斯优化方法，以将人类专家的知识融入数据驱动的决策过程中，实现更快的收敛和改善工程系统中贝叶斯优化的可追踪性。

Apr, 2024

顺序协作贝叶斯推理

研究了合作推理的基础理论，提出了一种新方法 SCBI 来分析一致性，收敛率和稳定性，并表明合作对于特定情况不仅是可能的，而且从理论上讲在一般情况下也是可行的，以及探讨了人类之间和人机之间合作的意义。

Feb, 2020

基于模型的因果贝叶斯优化

在本论文中，我们考虑了在 Causal Bayesian Optimization 基础上的一般化问题，即其他代理或外部事件也会对系统进行干预。我们将此广义 CBO 的形式化称为 Adversarial Causal Bayesian Optimization（ACBO），并引入了第一个具有有限遗憾的 ACBO 算法：Causal Bayesian Optimization with Multiplicative Weights（CBO-MW）。

Jul, 2023

基于一致性的协作分布式贝叶斯优化：展示协作在最优设计中的力量

通过协作方法和共识机制改进贝叶斯优化模型，以实现在不同客户之间分配实验任务，快速迭代优化设计，从而达到优化设计过程加速的目的。

Jun, 2023

多智能体贝叶斯优化与耦合黑盒和仿射约束

该研究针对具有耦合黑盒约束和已知仿射约束的分布式多智能体贝叶斯优化问题，提出了一种原始 - 对偶分布式算法，其与单智能体情况下黑盒目标函数和约束函数的遗憾 / 违规边界相似。此外，该算法保证了已知仿射约束的累积违规性的 O (N√T) 界，其中 N 是智能体数量。因此，平均样本满足仿射约束的误差不超过 O (N/√T)。此外，我们确定了某些条件，使得我们的算法能够对累积违规率进行更强的限制，并在没有仿射约束的情况下提供最佳迭代收敛。然后，该方法应用于来自高斯过程的采样实例和无线通信的实际最优功率分配问题；结果表明我们的方法既能提供接近最优的性能，又能保持平均违规性较小，验证了我们的理论分析。

Oct, 2023