Jan, 2018

线性上下文贪婪算法问题的平滑分析

TL;DR本文研究线性情境赌徒算法问题,重新审视贪心算法的性能,通过平滑分析证明,即使情境可以由对手选择,对对手选择进行小干扰就足以实现 “无悔算法”,这表明在线性设置中,“普遍地”(即在稍微扰动的环境中)探索和开发不必在冲突。