Nov, 2023

在线长期受限优化

TL;DR提出和分析一种新型的 Follow-the-Perturbed-Leader 类型算法,用于在线方式解决一般的长期受约束的优化问题,其中目标和约束不一定是凸的。通过将随机线性扰动和强凸扰动分别引入原始和对偶方向,搜索全局极小极大点作为解决方案,并基于两个特定的预期静态累积遗憾定义,推导出这类问题的第一个次线性 $O (T^{8/9})$ 遗憾复杂度。该算法应用于解决长期(风险)受约束的河流污染源辨识问题,验证了理论结果的有效性,并表现出比现有方法更优越的性能。