多视角主动学习

Oct, 2011

Active Learning with Multiple Views

C. A. Knoblock, S. Minton, I. Muslea

TL;DR本论文提出了一种多视角主动学习方法 Co-Testing，能够在实际的领域中优于现有的方法，其中扩展了多视角框架，利用了弱视图进行更一般 / 特定概念的学习。

Abstract

Active learners alleviate the burden of labeling large amounts of data by detecting and asking the user to label only the most informative examples in the domain. We focus here on active learning for multi-view domains, in which there are several disjoint subsets of features (views), e

active learning multi-view learning co-testing weak views real world domains

发现论文，激发创造

复合主动学习：具备理论保证的多域主动学习

该研究提出了一种名为复合主动学习（CAL）的通用方法，用于多领域主动学习（AL）中，以解决忽略不同领域之间相似性以及处理不同领域之间数据分布变化的问题，并在理论和实证结果上显示出优于现有方法的性能。

Feb, 2024

利用基于主动学习的改进策略优化多域性能

本篇论文介绍了一种基于主动学习的多领域性能提升框架，首先利用初始标记数据对基础模型进行训练，然后迭代地选择最具信息量的样本进行标记，以改进模型性能。该方法在图像分类、情感分析和物体识别等多领域数据集上进行了评估，并表现出超越基准方法，并在几个数据集上取得了最先进的性能。同时表明了本方法非常高效，比其他主动学习方法需要明显较少的标记样本，是一种实用且有效的多领域性能提升解决方案。

Apr, 2023

基于多视角主动学习的用户生成数据短文本分类

本研究提出了一种新的主动学习模型，利用多视图主动学习、Parzen-Rosenblatt 窗口方法和基于预测器的委员会策略等，用于检测自然灾害的正向报道，并在四个不同应用的 Twitter 数据集上通过实验验证该模型的高一致性和优越性。

Dec, 2021

图像分类的多领域主动学习基准测试

多域主动学习基准展示了在大规模真实世界数据集上，传统的单域主动学习策略在多域场景中往往比随机选择效果更差。我们还引入了一个新颖的基于地理域的大规模图像数据集 CLIP-GeoYFCC，与现有基于风格的域数据集有所不同。对我们的基准的分析表明，所有的多域策略都存在显著的权衡，没有一种策略能在所有数据集或所有度量指标上表现优秀，强调了未来研究的需求。

Dec, 2023

条件信任环境下的协作主动学习

通过合作主动学习，利用多个协作者的机器学习能力，不泄露现有数据和模型，而是共享新领域的预测结果和新获取的标签，以解决隐私和安全问题、提高成本效益和资源利用效率，促进模型性能，并为进一步研究合作主动学习及其在各个领域的实际应用提供了基础。

Mar, 2024

自然语言任务中的多域主动学习

该研究对带有多个数据来源的领域转移进行了详尽的调查，发现了一些有效的方法并提出了一种新的有效方法 DAL-E，并探讨了选定的示例和域具有的特性。

Feb, 2022

简单问题的主动学习

我们研究了在主动学习过程中使用区域查询的复杂度与查询数量之间的权衡关系，并通过设计 VC 维度相关的查询方法来有效地学习。对于特定的假设类别，我们展示了更强的结果，包括计算效率和对未知数据集的适应性。

May, 2024

走向可比较的主动学习

提供了一种公平比较不同任务和领域中算法的主动学习框架，并提出了一种快速有效的评估算法。汇总了在 3 个主要领域（表格、图像和文本）上使用的 6 种广泛应用的算法在 7 个实际数据集和 2 个合成数据集上的实证结果，并形成了领域特定的主动学习算法排名。

Nov, 2023

主动测试：高效模型评估

本文介绍了一种新的样本效率模型评估框架 —— 主动测试，通过精心选择要标记的测试点，以充分利用样本，解决了现有文献大都忽略了标记测试数据的成本，从而导致模型评估与实际应用的脱节的问题，在理论上建立了基于目标的获取策略并做了进一步的改进，以消除引入的偏差并在相同时间内降低估计方差。

Mar, 2021

组合覆盖下的主动学习

本文提出一种利用组合覆盖来解决机器学习中主动学习的数据样本选择方法，相较于现有模型导向性的方法，新方法具有更好适用性，能够有效降低模型转移和采样偏差问题。

Feb, 2023