Jul, 2015

线性上下文多臂赌博机和背包问题

TL;DR本文研究了带有资源消耗的线性情境赌博机问题,算法具有近乎最优的遗憾界,并将技术从 Solution 综述中的线性情境赌博机,背包赌博机和在线随机填充问题中结合使用。