ICMLOct, 2021

使用线性函数逼近学习随机最短路径

TL;DR本论文研究了具有线性函数逼近的随机最短路径问题,提出了一种使用 Hoeffding 类型置信度集的新算法,能够实现次线性后悔保证。同时,对于在 $c_{min}=0$ 的情况,可以保证近似次立方的后悔保证。此外,通过设计改进的贝恩斯坦置信度集,改进的算法能够保证近乎最优的后悔保证。