零样本主动学习基于自监督学习
本研究针对减少标注工作的两种范式:主动学习和自学习,研究它们能否相互受益。在对象识别数据集(包括 CIFAR10、CIFAR100 和 Tiny ImageNet)上的实验证明:对于低的标注预算,主动学习对自学习没有帮助。当标注预算很高时,主动学习和自学习的组合是有益的。
Aug, 2021
本研究描述了一个可扩展的主动学习系统,旨在改善在自动驾驶中监督学习的数据效率,主要围绕深度神经网络、有监督学习、主动学习、自动驾驶和数据效率展开,同时探讨了一些挑战及其解决方法,并简要描述了未来发展方向。
Apr, 2020
该研究提出了在主动学习的过程中既利用有标签的数据,也利用无标签的数据进行模型训练的方法,并使用了无监督特征学习和半监督学习的技术,研究表明使用无标签数据进行模型训练在图像分类任务中可以带来比不同获取策略更高的准确度,因此可以得到更小的标签预算。
Nov, 2019
本文提出了一种新颖的主动学习方法,使用一个小的参数模块 “loss prediction module” 来预测未标注数据的损失值,并基于此向其他特征不确定的数据请求人类进行标注,可以适用于深度神经网络的所有任务,结果表明该方法在图像分类、物体检测和人体姿态估计等任务中优于之前的方法。
May, 2019
本研究提供了一个将自我监督预训练、主动学习和一致性正则化自我训练整合的新算法框架,并在 CIFAR10 和 CIFAR100 数据集上进行了实验,揭示了自我监督预训练在半监督学习中的重要性,被 S4L 技术所替代的主动学习的价值。
Nov, 2020
使用半监督的方法(self-training)从未标记的数据中获取伪标签来改善运用主动学习进行文本分类的效率,通过进行广泛的实验,提出了一种新的有效的 self-training 策略(HAST),并在四个文本分类基准数据集上进行了评估,仅使用 25% 的数据,超过了之前实验的分类结果,达到了与三个数据集的先前实验相当的分类效果。
Jun, 2024
本文介绍了有监督学习中获取标记数据的高成本和获取大量未标记数据的轻松方法,以及通过自适应选择标记样本来获得高精度预测模型的主要问题设置和最近的研究趋势。重点介绍了选择从数据中进行标记的学习获取函数的研究、关于主动学习算法的理论工作和顺序数据获取的停止标准。介绍了材料开发和测量的应用示例。
Dec, 2020
该研究通过将主动学习与自监督预训练相结合,并使用称为 Balanced Selection(BASE)的算法来解决类不平衡问题,提高图像分类性能,特别适用于工业级大规模数据标记和训练中。
Nov, 2021
该论文提出了将主动学习重新表述为一种强化学习问题,并明确学习数据选择策略,其中策略充当主动学习启发式算法的角色,以解决启发式选择方法的有效性受限且性能因数据集而异的问题。我们使用跨语言命名实体识别来演示我们的方法,发现相对于传统的主动学习,我们的方法获得了均衡的改进。
Aug, 2017