Mar, 2014

Matroid Bandits: 快速组合优化与学习

TL;DR通过结合 bandit 和 matroid 的思想,本篇论文提出了一种新型组合赌博算法 ——matroid bandits,它的目标是在 matroid 中最大化一个随机的初始未知的模块化函数,并提供了一种切实可行的算法 —— 乐观 matroid 最大化(OMM),证明了两个上界,gap-dependent 和 gap-free,时间复杂度均为亚线性,与其他相关量最多线性相关。同时在三个实际问题上测试,证明了该方法是有效的。