Feb, 2012

镜面下降遇见固定分配(无悔感)

TL;DR研究使用镜像下降和熵正则化的方法在维度上实现对于一系列的一般化后的后悔情况的误差上界,其中包括了位移、自适应、折扣等等,并且得到了和权值分享方法的等价结果。研究同时提出了对于小的误差和参数的自适应调整等的改进。