多个噪声部分标注者中学习
文章提出了一种基于多任务弱监督的矩阵补全方法,通过建立弱监督任务之间的相关性解决弱监督准确性低的问题,从而提高模型训练的效果。实验结果表明,与传统的有监督方法相比,该方法能平均提高 20.2% 的准确率。
Oct, 2018
在真实应用中经常遇到标签模糊的数据,其中不同的标注者会给出冲突的类别标签。部分标签学习允许在这种弱监督的环境下训练分类器。虽然最先进的方法已经具有良好的预测性能,但它们经常受到错误校准的不确定性估计的影响。然而,拥有良好校准的不确定性估计在医学和自动驾驶等关键领域中尤为重要。本文中,我们提出了一种基于邻近 - 邻居的部分标签学习算法,利用了 Dempster-Shafer 理论。对人工和真实数据集的大量实验证明,所提出的方法提供了良好校准的不确定性估计,并取得了有竞争力的预测性能。此外,我们证明了我们的算法是风险一致的。
Feb, 2024
本研究提出了一种融合程序性弱监督和生成对抗网络的模型,通过对数据的离散潜变量和弱监督派生数据的标签估计进行对齐,从而更好地建模样本相关的弱监督结果的准确性,并通过合成样本实现了数据增强。实验结果表明,所提出的模型在多分类图像分类数据集上表现优异,同时提升了生成图像的质量和最终模型性能。
Mar, 2022
通过众包标注系统和基于伪标签和对比学习的新方法,解决了由于用户知识、文化背景差异和获得监督信息的高成本而导致的标注信息不充分和含糊不清的问题,实现了半监督部分标签学习的最先进表现。
Oct, 2022
本文提出一种超级标签模型,通过程序化弱监督方法中的标注函数抽象出来产生训练标签,可以在单个前向传递中推断出每个数据集的基本真实标签。使用了图神经网络,使模型预测对标签函数排列的顺序保持不变,从而在 14 个真实世界中的数据集上表现得比现有的最佳方法更具效率和精度。
Jul, 2022
研究了如何使用部分标签对神经网络进行训练,解决多标签分类中的标签不平衡问题,并提出了伪标注技术、新的损失函数和动态训练方案来优化模型性能。在多个公开数据集上进行了广泛实验,结果显示该方法优于现有的一些最先进方法,甚至在部分标注情况下超越了使用完整标签训练的方法。
Jul, 2023
本研究探讨了一种新颖的 “预训练标注 - 弱监督学习” 范式,通过在图像分类任务中基于 CLIP 使用多个提示模板对图像样本进行标注,进而获得多个候选标签以形成含噪部分标签的数据集,并设计了一种协作一致性正则化算法来解决这个问题。实验表明,该方法在无需额外标签信息的情况下显著优于零样本推理,优于其他弱监督学习和少样本微调方法,并获得了更小的模型。
May, 2024