Jul, 2016

基于核的赌博式凸优化方法

TL;DR提出一种新的算法解决在无导数情况下的 $adversarial convex bandit$ 问题,其包含了核方法、伯努利卷积的一般化和新的退火时间表。这个算法在要求多次迭代的场景中可以取得佳效果。