BriefGPT.xyz
Ask
alpha
关键词
score policy
搜索结果 - 1
基于 $α$- 核心的在线子集选择算法,无需增广遗憾
本研究提出了一个名为 SCore 的在线学习策略,用于解决一类奖励函数下的最优子集选择问题,并引入了一种新的性能度量标准,即 α- 增强遗憾。研究表明,包括子模函数在内的大类奖励函数,都可以通过 SCore 策略进行高效优化。
PDF
2 years ago
Prev
Next