Mar, 2018

半参数情境赌博机

TL;DR该论文研究了半参数上下文赌博机问题,设计了新的算法来解决非线性混淆影响下的奖励估计问题,并通过实证评估证明了该算法的有效性。