Sep, 2013
从多臂老虎机的角度看主动学习
Building Bridges: Viewing Active Learning from the Multi-Armed Bandit
Lens
TL;DR本文提出了一个受多臂老虎机启发的池化主动学习算法,通过精心构造主动学习和多臂老虎机之间的类比,利用多臂老虎机文献中的下限置信度和自协调正则化等思想来设计我们提出的算法。我们的算法是一个顺序算法,在每一轮中,将池上的一个采样分布分配在上面,从这个分布中采样一个点,并查询标签。我们的采样分布的设计也受到了主动学习和多臂老虎机之间类比的启发。我们展示了如何推导算法所需的下限置信度。实验比较表明,在一些标准的UCI数据集上,与先前提出的主动学习算法相比,我们的算法具有更好的性能。