BriefGPT.xyz
Ask
alpha
关键词
linear mixture
搜索结果 - 1
ICML
使用线性函数逼近学习随机最短路径
本论文研究了具有线性函数逼近的随机最短路径问题,提出了一种使用 Hoeffding 类型置信度集的新算法,能够实现次线性后悔保证。同时,对于在 $c_{min}=0$ 的情况,可以保证近似次立方的后悔保证。此外,通过设计改进的贝恩斯坦置信度
→
PDF
3 years ago
Prev
Next