ICLRJan, 2024

固定预算差分私有最佳臂辨识

TL;DR在差分隐私约束下,研究固定预算探索期的线性赌臂问题,通过最大绝对确定性原则构建满足差分隐私约束的策略,得到其错误概率的上限和下限,并展示其与赌臂问题复杂性、亚最优的臂差异和差分隐私参数相关的指数级衰减特性。此外,该研究还提供了独立感兴趣且对其他赌臂问题的错误概率下限证明具有重要作用的一些辅助结果,填补了先前文献中固定预算探索期下差分隐私约束情况下最优臂识别的研究空白。