Sep, 2022
基于 $α$- 核心的在线子集选择算法,无需增广遗憾
Online Subset Selection using $α$-Core with no Augmented Regret
Sourav Sahoo, Siddhant Chaudhary, Samrat Mukhopadhyay, Abhishek Sinha
TL;DR本研究提出了一个名为 SCore 的在线学习策略,用于解决一类奖励函数下的最优子集选择问题,并引入了一种新的性能度量标准,即 α- 增强遗憾。研究表明,包括子模函数在内的大类奖励函数,都可以通过 SCore 策略进行高效优化。