通过交互查询子集示例的标签,主动学习器在模型类和大量未标记示例的情况下学习适合数据的模型。本文提供了一个适用于极大似然估计的两阶段主动学习算法和标签需求的上限和下限分析,并表明这种方法在一些情况下可以实现近乎最优的性能。
Jun, 2015
该研究致力于解决减少有标签的训练数据来训练监督式分类模型的问题,通过使用Active Learning和K-means聚类算法,采用mini-batch Active Learning方法来快速有效地选取对模型具有信息量和多样性的训练样例,以达到相当或更好的性能表现。
Jan, 2019
本文提出了一种使用确定性点过程的新的原则性批处理主动学习方法,以生成样本的多样性批次。我们还开发了可行的算法来近似DPP分布的模式,并提供了理论保证。我们在几个数据集上的实验表明了我们这种方法的价值。
Jun, 2019
BatchBALD是一种用于深度贝叶斯主动学习的可行近似方法,它计算了一批数据点与模型参数之间的互信息作为获取函数,并在获取批次中考虑依赖关系以提高数据效率并在标准基准测试中实现新的最先进性能.
提出一种新的批次模式主动学习算法——判别式主动学习法(DAL),并将其应用在神经网络和大批次查询的情境中,尝试通过将标记集合和未标记的数据池区分开来作为选择样本的依据来执行主动学习,结果表明我们的方法在中等和大批次查询中与最先进的方法相当,并且在实现简单的同时还可以扩展到除分类任务之外的其他领域,同时,我们的实验还表明在相对较大的批次中,当批量大小较大时,当前现有的最先进方法均不比不确定性采样明显更好,从而推翻了一些最近文献中报道的结果。
Jul, 2019
本研究分析了当前主要的主动式学习技术中存在的主要缺点,并提出了缓解这些缺点的方法,包括使用部分不确定性采样和更大的查询大小加速主动式学习循环,并展示了开源贝叶斯主动式学习库BaaL。
Jun, 2020
本文研究使用贝叶斯神经网络进行主动学习,相较于集成技术更能有效地捕捉不确定性,拥有更好的模型效果,同时还揭示了集成技术的一些关键缺陷。
Apr, 2021
研究了一种高效的批量主动学习算法,该算法结合不确定性和多样性概念,在批量设置中易于扩展,并与先前研究中使用的批量大小(100K-1M)相比提高模型训练效率。同时,还证明了相关采样方法的标签复杂度保证,该方法在特定情况下几乎等同于我们的采样方法。
Jul, 2021
本文在 batch active learning 场景下,提出了一种解决 informativeness 和 diversity 之间权衡问题的算法,理论上可以在 pool-based active learning 中得到最优结果,并且这也是第一篇使用这种方式明确量化在 pool-based 场景中 batch active learning 统计表现的论文。
Feb, 2022
全监督模型在贝叶斯主动学习中占主导地位,我们认为它们对未标记数据中的信息的忽视不仅损害了预测性能,也影响了关于获取哪些数据的决策。我们提出了一个简单的半监督贝叶斯主动学习框架,发现它比传统的贝叶斯主动学习或随机获取数据的半监督学习能够生成更好的模型。该框架也更易于扩展。除了支持向半监督模型的转变外,我们的发现还强调了研究模型和获取方法的重要性。
Apr, 2024