Nov, 2012

在对数凹分布下线性分界器的主动学习和被动学习

TL;DR该研究提供了关于线性分隔符的标签高效、多项式时间、被动和主动学习的新结果,并证明了在近乎对数凹的分布下,主动学习提供了超过被动学习的指数级改进。在此基础上,为这种问题提供了一种计算上高效的 PAC 算法,其样本复杂度是最优的 (最多相差一个常数因子)。此外,提供了第一个关于多项式时间 PAC 算法的界限,该算法在通用的数据分布下对一个有趣的无限类假设函数是紧密的,并取得了重大进展。同时,本研究还针对数据可能不是线性可分的情况,提供了被动和主动学习的新限制。