Dec, 2023

单调随机优化的半强盗学习

TL;DR通过提供一种具有与最佳近似算法(在已知分布下)相对于平方根的 T 乘以 log T 束缚的通用在线学习算法,在半探测器环境中解决了在一大类 “单调” 随机问题中对于未知分布是否能够获得良好(近似)算法进行学习的问题。我们的框架适用于随机优化的若干基本问题,如先知不等式、潘多拉盒、随机背包、随机匹配和随机次模优化。