Oct, 2016

无限和上下文赌博机的公平算法

TL;DR本文研究线性 bandit 问题中的公平性,提出 meritocratic 公平的概念,并在更广泛的问题上进行分析,得出更好的性能保证。同时,探讨了无限线性 bandit 问题中的公平性问题,证明了实例相关性是必要的。结果是一个在线线性环境中 meritocratic 公平的框架,比现有技术的研究更强大、更普遍和更现实。