BriefGPT.xyz
Ask
alpha
关键词
instance optimal
搜索结果 - 1
实例最优在线学习的 SMART 方法
我们提出了一种在线学习算法 —— 通过单调适应性遗憾追踪(SMART)进行切换,它适应数据并实现了在每个输入序列上相对于领导者跟随(FTL)策略的表现和任何其他输入策略的最坏情况保证同时有效的遗憾,通过我们的算法,我们证明 SMART 政策
→
PDF
4 months ago
Prev
Next