Nov, 2021

组合半匪难度分析及Thompson抽样策略与贪心算法的应用

TL;DR本文研究了在贪心算法下Thompson sampling(TS)在组合多臂赌博问题(CMAB)中的行为,证明了TS可以在近似算法的预测下解决CMAB问题,并提供了渐近匹配的后悔上限。