BriefGPT.xyz
Ask
alpha
关键词
cumulative delay
搜索结果 - 1
对抗性多臂老虎机中的延迟和数据的适应
本文考虑在延迟反馈下的敌对多臂老虎机问题,并分析了一些通过仅使用决策时可用的信息 (关于损失和延迟) 来调整步长的 Exp3 算法变体,从而获得适应观察到的 (而不是最坏情况下的) 延迟和 / 或损失序列的遗憾保证。最后,我们介绍了 Ada
→
PDF
4 years ago
Prev
Next