Sep, 2023

基于不等式约束的零遗憾执行预测

TL;DR对于受到不等式约束的可行预测问题,本文在鲁棒的原始对偶框架基础上提出了一种自适应的原始对偶算法,通过数值模拟验证了算法的有效性和理论结果,该算法在不等式约束下达到 O (√T) 的后悔与约束违规,使用了√T + 2T 个样本。