Jun, 2024

优先多目标贝叶斯优化

TL;DR基于偏好的贝叶斯优化(PBO)框架用于优化决策者对可用设计选择的潜在偏好。本文提出了第一个具有多目标的 PBO 框架,并介绍了 dueling scalarized Thompson sampling(DSTS),它是一种流行的 dueling Thompson 算法的多目标推广。研究发现 DSTS 在多个测试函数和模拟的个性化外骨骼和驾驶政策设计任务中优于其他基准算法,并证明了 DSTS 是渐进一致的,为 PBO 中的 dueling Thompson 采样提供了首个收敛保证。