多视角主动学习
该研究提出了一种名为复合主动学习(CAL)的通用方法,用于多领域主动学习(AL)中,以解决忽略不同领域之间相似性以及处理不同领域之间数据分布变化的问题,并在理论和实证结果上显示出优于现有方法的性能。
Feb, 2024
本篇论文介绍了一种基于主动学习的多领域性能提升框架,首先利用初始标记数据对基础模型进行训练,然后迭代地选择最具信息量的样本进行标记,以改进模型性能。该方法在图像分类、情感分析和物体识别等多领域数据集上进行了评估,并表现出超越基准方法,并在几个数据集上取得了最先进的性能。同时表明了本方法非常高效,比其他主动学习方法需要明显较少的标记样本,是一种实用且有效的多领域性能提升解决方案。
Apr, 2023
本研究提出了一种新的主动学习模型,利用多视图主动学习、Parzen-Rosenblatt 窗口方法和基于预测器的委员会策略等,用于检测自然灾害的正向报道,并在四个不同应用的 Twitter 数据集上通过实验验证该模型的高一致性和优越性。
Dec, 2021
多域主动学习基准展示了在大规模真实世界数据集上,传统的单域主动学习策略在多域场景中往往比随机选择效果更差。我们还引入了一个新颖的基于地理域的大规模图像数据集 CLIP-GeoYFCC,与现有基于风格的域数据集有所不同。对我们的基准的分析表明,所有的多域策略都存在显著的权衡,没有一种策略能在所有数据集或所有度量指标上表现优秀,强调了未来研究的需求。
Dec, 2023
通过合作主动学习,利用多个协作者的机器学习能力,不泄露现有数据和模型,而是共享新领域的预测结果和新获取的标签,以解决隐私和安全问题、提高成本效益和资源利用效率,促进模型性能,并为进一步研究合作主动学习及其在各个领域的实际应用提供了基础。
Mar, 2024
我们研究了在主动学习过程中使用区域查询的复杂度与查询数量之间的权衡关系,并通过设计 VC 维度相关的查询方法来有效地学习。对于特定的假设类别,我们展示了更强的结果,包括计算效率和对未知数据集的适应性。
May, 2024
提供了一种公平比较不同任务和领域中算法的主动学习框架,并提出了一种快速有效的评估算法。汇总了在 3 个主要领域(表格、图像和文本)上使用的 6 种广泛应用的算法在 7 个实际数据集和 2 个合成数据集上的实证结果,并形成了领域特定的主动学习算法排名。
Nov, 2023
本文介绍了一种新的样本效率模型评估框架 —— 主动测试,通过精心选择要标记的测试点,以充分利用样本,解决了现有文献大都忽略了标记测试数据的成本,从而导致模型评估与实际应用的脱节的问题,在理论上建立了基于目标的获取策略并做了进一步的改进,以消除引入的偏差并在相同时间内降低估计方差。
Mar, 2021