基于不一致性的数据中心主动开放集注释
本文介绍了一种基于活动学习方法的独特自然语言处理方式,可以有效利用较少的标记数据点来培训神经网络,最终达到与标记数据点相同的分类准确率。通过找到局部聚类的占主导地位的集合,该方法可以选择训练的样本,具有更高的性能和灵活性,且不受数据集的影响。
Jan, 2022
该研究提出了一种基于熵的开放集主动学习(EOAL)框架,通过有效利用已知和未知分布,从未标记的数据中选择信息量较高的样本,并在 CIFAR-10、CIFAR-100 和 TinyImageNet 数据集上表现优于现有的最先进方法。
Dec, 2023
本研究提出了一种主动学习方法,并通过限制注释费用来确定适当的样本粒度进行主动选择,结果表明基于超点的样本选择比点级和实例级选择使用有限预算更有效,并进一步利用本地一致性约束来提高超点选择方法的性能,在 ShapeNet 和 S3DIS 两个基准数据集上评估了我们的方法,结果表明主动学习是解决语义点云分割中高注释成本的有效策略。
Jan, 2021
本研究提出了一种新的主动学习方法,通过对比学习在特征空间中选择集群的样本,从标记和未标记的数据池中获取信息,以获取优先的显着内部分布样本,并证明该方法相对于现有的主动学习方法需要更少的标注预算才能达到相同的准确性水平。
Mar, 2023
本研究描述了一个可扩展的主动学习系统,旨在改善在自动驾驶中监督学习的数据效率,主要围绕深度神经网络、有监督学习、主动学习、自动驾驶和数据效率展开,同时探讨了一些挑战及其解决方法,并简要描述了未来发展方向。
Apr, 2020
本研究旨在证明在相同实验条件下,不同类型的主动学习算法(基于不确定性、多样性和委员会的),与随机采样基准相比,产生的收益不一致,这种性能度量的差异性可能导致结果与以前报告的结果不一致,强正则化下,主动学习方法在各种实验条件下显示出微小或无优势,并提出一套关于如何评估主动学习算法的建议,以确保结果在实验条件变化下具有重复性和稳健性。
Feb, 2020
该论文提出了一种融合标注和模型训练的主动学习方法,结合半监督学习和基于一致性的样本选择度量,实现从未标注数据中选取最优数据来改善模型性能,在图像分类任务中实验结果显示出优异表现,同时探究了学习式主动学习方法的起点问题并提出了相关测量指标。
Oct, 2019