- 提升伪标记和改善半监督领域泛化的鲁棒性
我们提出了一种新的半监督领域泛化方法,利用模型平均的不确定性引导伪标签技术,在有限标签的情况下缓解对源领域的过拟合,并在关键代表性领域泛化数据集上证明了其有效性。
- WSDM基于分布一致性的稀疏标签图神经网络自训练
提出了一种新颖的分布一致图自训练(DC-GST)框架,通过显式地解决自训练过程中扩展训练集与测试集之间的分布差异,识别既具有信息量又能弥补分布差异的伪标记节点,并通过可微分的优化任务进行建模。采用了考虑分布差异的边预测器来增强图,提高模型在 - ICLRP$^2$OT:用于深度不平衡聚类的渐进偏差最优输运
本文介绍了一种新的深度非平衡聚类问题,并提出了一种基于伪标签的学习框架,通过渐进式部分最优输运问题生成偏态感知的伪标签,并从高置信度样本中学习,实验证明了我们方法的优越性。
- 优化预训练动作模型
使用自我监督训练改进现有的有监督模型,通过将数据标记和训练分为两个不同的阶段,并结合简单的技术来稠密化和重平衡伪标签,从而在实际视频中实现可靠的增益,适用于短期(基于流)和长距离(多帧)像素跟踪。
- 使用无监督判别一致性网络进行 Oracle 字符识别
提出了一种新的无监督领域适应方法,通过伪标签和约束增强一致性,从标记的人工手写神谕字符向未标记的扫描数据中传递知识,使模型在磨损、污渍和失真下更加鲁棒。同时,提出了一种无监督的转移损失,通过优化类间和类内转移概率,在扫描领域上学习更有辨别力 - Diffusion-SS3D:半监督三维物体检测的扩散模型
通过扩散模型来提高伪标签的质量,以实现半监督三维物体检测,改进了现有方法的性能,获得了最先进的结果。
- 当涉及言语问题时:重新审视标记敏感内容的方法
许多资源匮乏的语言需要具有高质量的特定任务数据集,例如辱骂语言检测、虚假消息或错误信息识别。本文从乌克兰推文的伪标记敏感数据的方法出发,重新审视了使用该方法的过程,重点关注俄乌战争相关主题。通过实验,突出了数据标注的三个主要阶段,并强调了机 - EMNLP领域无关孟加拉自动语音识别的伪标签
通过伪标签方法开发一种大规模领域不可知的孟加拉语语音数据集和基于 Conformer 的自动语音识别系统,并在公开可用的数据集和人工注释的领域不可知测试集上进行效果评估。
- InstanT:基于实例依赖阈值的半监督学习
我们提出了一种基于实例的阈值函数,通过利用实例级别的模糊度和伪标签的实例相关错误率,为所有无标签实例设计了新颖的实例相关阈值函数,从而具有最高的自由度,同时为伪标签的正确性提供了有界的概率保证。
- EMNLPJointMatch: 一种用于半监督文本分类的多样化和协作伪标签统一方法
提出了一种名为 JointMatch 的新方法,用于半监督文本分类,通过结合最近半监督学习和学习带有噪声任务的理念,解决了伪标签偏见和错误积累的问题。JointMatch 通过根据不同类别的学习状态自适应调整类别阈值,减轻了模型对当前容易类 - EMNLP无困扰遗忘的连续命名实体识别
在连续命名实体识别(CNER)领域中,我们引入了一种精确平衡旧实体与新实体之间知识保留的池化特征蒸馏损失方法,以更有效地缓解灾难性遗忘问题,并利用基于置信度的伪标记方法解决非实体类型的语义转移问题。在此基础上,我们还提出了一种自适应重新加权 - 偏域自适应的鲁棒类条件分布对齐
我们提出了一种解决方案,通过探索超过一阶矩来稳健地对齐分类分布,克服了现有方法在部分领域适应设置中由私人来源类别的不希望样本引起的负转移和降低分类性能的问题,同时设计了强健的伪标注以实现高效的目标监督。实验结果和消融分析表明,我们提出的模型 - TK-KNN:一种平衡的基于距离的伪标签半监督意图分类方法
该研究描述了一种更强大的伪标签方法,使用基于嵌入空间距离的 TK-KNN 方法,在保持平衡的伪标记样本集的同时,避免了选择不平衡的示例集合,从而在意图检测中取得了更好的性能。
- 划分和集成:逐步学习未知情况
我们提出了 DividE 和 EnseMble (简称 DEEM) 方法,用于逐步测试数据预测的小麦营养缺陷分类挑战,并通过将数据集分成不同日期的离散组来训练模型,并采用伪标签方法将高置信度的测试数据标记并纳入训练集,最终将各组的模型统一获 - ICCVPC-Adapter: 基于拓扑感知的适配器用于点云上的高效领域自适应与修正伪标签
通过注意力机制和图卷积,PC-Adapter 保留了源数据的全局形状信息,并学习了目标域的局部特征,同时提出了一种新颖的假标记策略来克服分类器偏差,该方法在各种基准数据集 - PointDA、GraspNetPC 和 PointSegDA - 伪标签选择是一个决策问题
伪标记、半监督学习、确认偏差、贝叶斯框架、决策理论
- 图传输学习中的半监督领域自适应
半监督图领域自适应(SGDA)是一种用于解决具有拓扑结构和属性的跨域图之间知识迁移问题的方法,它通过添加自适应的偏移参数和伪标签,以处理来自标注丰富源图到未标注目标图的领域转移和标签稀缺的挑战。
- 一种使用正则化的置信度预测的不确定性感知伪标签选择框架
该研究提出了一种基于不确定性感知的伪标签选择框架,利用符合规范化算法产生的不确定性集合,修复了拟合不当的神经网络,从而减少嘈杂的训练数据。
- MarginMatch: 利用伪边际改进半监督学习
MarginMatch 是一种结合一致性正则化和伪标记的新的 SSL 方法,其主要创新在于使用无标签数据的训练动态来衡量伪标签的质量,以确保屏蔽低质量预测;在低数据情况下,MarginMatch 在四个视觉基准测试以及两个大规模数据集上都取 - ICCV通过连接高和低置信度预测增强半监督学习
提出了一种名为 ReFixMatch 的新方法,旨在利用所有未标记数据进行训练,从而提高模型的泛化能力和在半监督学习基准测试上的性能。值得注意的是,ReFixMatch 在 ImageNet 上使用 10 万个标记示例时达到了 41.05%