Feb, 2024

基于原则的偏好贝叶斯优化

TL;DR通过使用偏好反馈,我们构建了黑盒函数的置信区间,并提出了一种乐观算法,该算法具有有效的计算方法,并且在累积遗憾方面具有信息理论上的界限,从而使我们能够设计出具有收敛速率保证的估计最佳解决方案的方案。实验结果表明,我们的方法在高斯过程、标准测试函数和热舒适优化问题上都能稳定地达到更好或者有竞争力的性能,相比现有的启发式方法而言,我们的方法不仅拥有遗憾界限或收敛性的理论保证。