Sep, 2022

基于 $α$- 核心的在线子集选择算法,无需增广遗憾

TL;DR本研究提出了一个名为 SCore 的在线学习策略,用于解决一类奖励函数下的最优子集选择问题,并引入了一种新的性能度量标准,即 α- 增强遗憾。研究表明,包括子模函数在内的大类奖励函数,都可以通过 SCore 策略进行高效优化。