主动模型选择

Jul, 2012

Active Model Selection

Omid Madani, Daniel J. Lizotte, Russell Greiner

TL;DR该论文研究了主动学习中困难的预测模型选择问题，并提出一种基于模型探针（model probes）的方法Biased-Robin Algorithm，能够在相同成本和先验概率下有效地选择模型。

Abstract

Classical learning assumes the learner is given a labeled data sample, from which it learns a model. The field of active learning deals with the situation where the learner begins not with a training sample, but instead with resources that it can use to obtain information to help ident

发现论文，激发创造

带噪声观测的近最优贝叶斯主动学习

我们提出了 EC2 这个新的、贪心的主动学习算法，并证明了它与最优策略相竞争，因此得到了关于具有噪声观察的贝叶斯主动学习的第一个竞争保证。我们的结果基于最近发现的一种递减回报性质，称为自适应子模性，将子模集函数的经典概念推广到适应策略中。

Oct, 2010

主动学习在最大似然估计中的收敛速率

通过交互查询子集示例的标签，主动学习器在模型类和大量未标记示例的情况下学习适合数据的模型。本文提供了一个适用于极大似然估计的两阶段主动学习算法和标签需求的上限和下限分析，并表明这种方法在一些情况下可以实现近乎最优的性能。

Jun, 2015

精确估计线性模型的主动学习

研究了顺序决策问题，提出了Trace-UCB自适应分配算法，用于评估多个线性模型，同时学习噪声，实现在不同线性函数之间平衡样本预算，扩展了算法到高维度设置，并在现实数据上进行了模拟，表明Trace-UCB具有良好的鲁棒性。

Mar, 2017

自适应采集的深度主动学习

该论文介绍了一个新的方法，通过将采集函数作为学习预测器并通过强化反馈训练它，以打破模型选择中的恶性循环；该系统由贝叶斯神经网络、自举采集函数、概率状态定义和另一个贝叶斯策略网络组成，可在三个基准数据集上始终发现新的更好的采集函数。

Jun, 2019

关于主动学习中的统计偏差：如何何时修正

本文探讨了主动学习中样本标注代价昂贵导致的偏差问题并提出了一种新的校正方法，解释了为何忽略这种偏差也能带来一些经验上的成功，尤其对参数众多的神经网络等少量数据训练情境下，这种偏差反而有益。

Jan, 2021

主动测试：高效模型评估

本文介绍了一种新的样本效率模型评估框架——主动测试，通过精心选择要标记的测试点，以充分利用样本，解决了现有文献大都忽略了标记测试数据的成本，从而导致模型评估与实际应用的脱节的问题，在理论上建立了基于目标的获取策略并做了进一步的改进，以消除引入的偏差并在相同时间内降低估计方差。

Mar, 2021

大规模批量主动学习

研究了一种高效的批量主动学习算法，该算法结合不确定性和多样性概念，在批量设置中易于扩展，并与先前研究中使用的批量大小（100K-1M）相比提高模型训练效率。同时，还证明了相关采样方法的标签复杂度保证，该方法在特定情况下几乎等同于我们的采样方法。

Jul, 2021

小数据的模型选择实用主动学习

本研究开发了一种基于支持向量分类的基础池式主动学习器的快速简单的实践方法，旨在解决很少标记数据点的情况下进行模型选择的挑战，并通过加权方法让模型在易于分类数据集和难以分类数据集之间取得平衡的最佳性能。

Dec, 2021

强化元主动学习

该论文提出了一种基于强化学习的在线流式元主动学习方法，它从数据中直接学习信息度量，并结合模型训练来训练主动学习器，可应用于一般类别的分类问题，优于现有最先进的方法。

Mar, 2022

组合覆盖下的主动学习

本文提出一种利用组合覆盖来解决机器学习中主动学习的数据样本选择方法，相较于现有模型导向性的方法，新方法具有更好适用性，能够有效降低模型转移和采样偏差问题。

Feb, 2023