Feb, 2024

解耦学习与决策:用一阶方法突破在线资源分配中的 $O (√T)$ 障碍

TL;DR在线线性规划在收入管理和资源分配中起着重要作用,本文提出了一种新的算法框架,将学习与决策分离,首次展示了基于一阶方法的在线算法可以达到 O (T^{1/3}) 的遗憾,同时进行了数值实验以验证理论发现。