May, 2017

在线多尺度学习及其在网络拍卖中的应用

TL;DR针对在线拍卖 / 定价问题的收益最大化问题,我们通过将专家学习和多臂赌博机问题推广到多尺度版本来推导出可缩放最佳固定价格而非价值范围的遗憾界,并且当与需要市场份额下限的基准进行比较时,可以获得几乎无尺度的遗憾界,同时满足离线样本复杂性。