关键词constrained online convex optimization
搜索结果 - 3
- 具有对抗约束的在线凸优化的严格界
有关在线凸优化和约束在线凸优化的一篇研究论文,证明了一个在线策略可以同时实现 O (√T) 的遗憾和 θ̃(√T) 的累积约束违规,通过将 AdaGrad 算法的自适应遗憾界与 Lyapunov 优化相结合,达到了这一结果。
- 具有马尔可夫数据的随机约束随机优化
本文研究了基于 Markov 链采样的随机约束随机优化问题,将 drift-plus-penalty 方法推广至这一设置,提出了两种变体,分别适用于已知和未知混合时间的情况,同时适用于约束函数序列遵循 Markov 链的一般设置,通过在分类 - 将后悔换成效率:具有长期限制条件的在线凸优化
本文提出了解决约束在线凸优化问题的框架。通过将问题转化为在线凸 - 凹优化问题,提出了一种有效的算法,可以实现收敛性较好的结果。同时,本文还为从中提取多点强化信号的约束在线凸优化问题提供了解决方案。