Oct, 2015

高斯回报与侧面观测的在线学习

TL;DR本文考虑了一个带有高斯回报和信息反馈的序贯学习问题,并提供了非渐近的问题相关下界和算法来实现这些下界。