BriefGPT.xyz
Ask
alpha
关键词
feedback delay
搜索结果 - 3
具备反馈延迟的平滑在线凸优化的鲁棒学习
我们研究了一种具有多步非线性切换成本和反馈延迟的挑战性平滑在线凸优化(SOCO)形式,提出了一种新颖的机器学习(ML)增强的在线算法,名为 Robustness-Constrained Learning(RCL),它通过受限投影将不受信任的
→
PDF
8 months ago
非平稳时延组合半赌博问题与因果相关奖励
在不稳定环境中进行的顺序决策和反馈延迟引起的问题,通过学习因果关系来减轻决策过程中的不利影响,本文将此问题形式化为具有因果关联奖励的非平稳和延迟组合半强盗问题,并通过数值分析在意大利使用合成和真实世界数据集来检测对 Covid-19 传播最
→
PDF
a year ago
上下文臂针对高效优化学习
本文介绍了一种在线学习算法,它使用了一种基于代价敏感分类器的方法,并实现了最优遗憾率,与之前的算法相比,具有指数级别的运行速度优势,并且在反馈延迟方面实现了加性遗憾而非乘性遗憾。
PDF
13 years ago
Prev
Next