May, 2023
具有弹奏反馈的安全优化中约束集的几何属性的影响
The Impact of the Geometric Properties of the Constraint Set in Safe
Optimization with Bandit Feedback
TL;DR研究了带有Bandit反馈的安全优化问题,提出了一种针对此问题的算法,探讨了限制集合的几何特性对算法的后悔值的影响。引入了限制集合的尖锐度概念来识别可以保证这个算法后悔值的子线性下界的集合类,并给出了模拟结果支持这一下界,并证明了集合的尖锐度影响了算法的表现。