MMFeb, 2014

资源丰富的情境臂控制器

TL;DR我们设计了第一个算法来解决具有资源限制的情境赌博问题,包括具有任意策略集的情境赌博和背包式赌博,并证明了具有接近最优统计属性的遗憾保证。