Feb, 2018

随机优化的在线方差缩减

TL;DR本文提出了一种基于Heuristic和Bandit反馈的在线优化算法,可以寻找一种重要性采样分布序列,竞争力可以与后见之明得到的最佳固定分布相媲美,并在实验验证中证明了该算法在多个数据集和设置下有效的优点。