Nov, 2017

带部分信息的在线学习小损失界

TL;DR研究了拥有部分信息反馈的对抗 (非随机) 在线学习问题,在黑盒模型下能够获得如上小损失的概率,而其独特的设计使它在更多应用如半强盗问题和上下文强盗问题中得到有效的应用,并且能够提供一些之前无法获得的最优保证。