主动模型选择
我们提出了 EC2 这个新的、贪心的主动学习算法,并证明了它与最优策略相竞争,因此得到了关于具有噪声观察的贝叶斯主动学习的第一个竞争保证。我们的结果基于最近发现的一种递减回报性质,称为自适应子模性,将子模集函数的经典概念推广到适应策略中。
Oct, 2010
通过交互查询子集示例的标签,主动学习器在模型类和大量未标记示例的情况下学习适合数据的模型。本文提供了一个适用于极大似然估计的两阶段主动学习算法和标签需求的上限和下限分析,并表明这种方法在一些情况下可以实现近乎最优的性能。
Jun, 2015
研究了顺序决策问题,提出了Trace-UCB自适应分配算法,用于评估多个线性模型,同时学习噪声,实现在不同线性函数之间平衡样本预算,扩展了算法到高维度设置,并在现实数据上进行了模拟,表明Trace-UCB具有良好的鲁棒性。
Mar, 2017
该论文介绍了一个新的方法,通过将采集函数作为学习预测器并通过强化反馈训练它,以打破模型选择中的恶性循环;该系统由贝叶斯神经网络、自举采集函数、概率状态定义和另一个贝叶斯策略网络组成,可在三个基准数据集上始终发现新的更好的采集函数。
Jun, 2019
本文探讨了主动学习中样本标注代价昂贵导致的偏差问题并提出了一种新的校正方法,解释了为何忽略这种偏差也能带来一些经验上的成功,尤其对参数众多的神经网络等少量数据训练情境下,这种偏差反而有益。
Jan, 2021
本文介绍了一种新的样本效率模型评估框架——主动测试,通过精心选择要标记的测试点,以充分利用样本,解决了现有文献大都忽略了标记测试数据的成本,从而导致模型评估与实际应用的脱节的问题,在理论上建立了基于目标的获取策略并做了进一步的改进,以消除引入的偏差并在相同时间内降低估计方差。
Mar, 2021
研究了一种高效的批量主动学习算法,该算法结合不确定性和多样性概念,在批量设置中易于扩展,并与先前研究中使用的批量大小(100K-1M)相比提高模型训练效率。同时,还证明了相关采样方法的标签复杂度保证,该方法在特定情况下几乎等同于我们的采样方法。
Jul, 2021
本研究开发了一种基于支持向量分类的基础池式主动学习器的快速简单的实践方法,旨在解决很少标记数据点的情况下进行模型选择的挑战,并通过加权方法让模型在易于分类数据集和难以分类数据集之间取得平衡的最佳性能。
Dec, 2021