BriefGPT.xyz
Ask
alpha
关键词
lyapunov-based proof technique
搜索结果 - 1
黑暗中的游戏:带有对抗性约束的无悔学习
我们研究了经典的在线凸优化(OCO)框架的一种推广,通过考虑额外的长期对抗性约束。我们提出了一种元策略,能够同时达到亚线性的累积约束违规和亚线性的遗憾,通过将约束问题转化为递归构建的一系列代理代价函数的标准 OCO 问题的黑盒减缩。我们展示
→
PDF
8 months ago
Prev
Next