- ICLR探索几何线索以检测开放世界中的物体
本文提出了一种基于几何线索的开放式物体检测方法 GOOD(Geometry-guided Open-world Object Detector),使用深度和法线等几何线索来伪标记未标记的新物体,从而显著提高新物体类别的检测召回率,通过在 C - 联合语音转录和翻译:使用 Out-of-Distribution 数据进行伪标签
本文研究使用自训练和伪标签技术,通过数据增强和过滤等手段,在语音识别中克服领域不匹配问题,从而提高了 0.6% 的音字误率和 2.2 个 BLEU 值百分点。
- AAAI循环解缠特征翻译用于人脸反欺诈
本文提出了一种基于循环解缠的特征转换网络 (CDFTN) 的领域自适应方法,能够生成伪标签样本,从而实现源域不变的活体特征和目标域特定内容特征的解离。采用源域标签监督合成的伪标签图像来训练鲁棒的分类器,扩展到多目标域适应。实验证明,该方法明 - 解决无源领域适应中的质心假设冲突
提出了一种新的解决策略,将源域的知识迁移到没有标签的目标域中,通过伪标签和类原型对齐熵最小化的目标,解决了伪标签和最小熵交叉的矛盾,实验证明新方法在三个领域适应数据集上均有有效性且可以提供最新架构的最先进结果。
- InterMPL: 中间层 CTC 损失的动量伪标签
本文提出了一种利用中间监督的伪标签方法 ——InterMPL,可以应用于半监督学习的自动语音识别系统中,通过引入辅助损失优化伪标签,具有在不需要标签的情况下提高 ASR 性能的能力。实验结果证实,该方法比 MPL 等方法更有效,可使 ASR - 在线众包注释中不充分和模糊监督问题缓解方向
通过众包标注系统和基于伪标签和对比学习的新方法,解决了由于用户知识、文化背景差异和获得监督信息的高成本而导致的标注信息不充分和含糊不清的问题,实现了半监督部分标签学习的最先进表现。
- ICLR从一开始进行持续的伪标签化
本文提出了动态控制自训练过程中伪标签(PL)进化的方法,该方法避免了在低资源设置下过拟合到有标记的数据集。通过在线更改 PL 来控制 PL 缓存的会员资格和改善泛化能力。在预测分布中采样可进一步稳定训练,这两种技术使我们的自训练模型与之前的 - 医疗对话中功能性段落的学习:迭代拟标记和人在循环方法
本文提出一种基于伪标签和人机协同方法的医疗对话自动分类算法,通过联合使用 bootstrap 和人机协同方法,最终在一个专家标注的数据集上将分类准确率从 69.5% 提高到 82.5%。
- 自监督表示在口语建模中的鲁棒性
本文探讨了基于自监督学习的语音表征模型的鲁棒性问题,提出了一种基于伪标注技术的有效学习自监督语音表征的方法,该方法可显著提高语音编码的效果,并在语音翻译任务中得到了验证。
- ECCV重新思考基于聚类的伪标记方法在无监督元学习中的应用
本研究介绍了一种基于聚类和伪标注的非监督元学习方法,该方法通过最小化类内与类间相似度比率来提供聚类友好的嵌入特征,经实验证明,在嵌入空间中仅利用简单的聚类算法即可实现显着的改进,并且在少样本学习方面也有良好的表现。
- 无监督领域自适应语音识别与无监督错误校正
本文提出了一种无监督自适应错误校正方法,可以在未见过的领域中恢复由领域差异引起的语音识别错误,使用伪标记技术生成学习样本,在持续学习中以减少过度拟合,并使用编码器 - 解码器校正模型结合其他信息以进一步提高适应性,实验结果表明,该方法相对于 - ECCV3D-PL:具有三维感知伪标记的域自适应深度估计
利用真实数据生成可靠的伪地面真实数据,提供直接监督的领域适应框架,通过提出 2D 伪标签和 3D 感知伪标签等机制,实现深度评估的提高,有效地解决领域适应问题。
- ECCV基于相似度的伪标签注入半监督域自适应
本研究通过引入对比损失和伪标记机制,对半监督域自适应问题进行了有效解决,并在 Office-Home、DomainNet 和 Office-31 数据集上取得了最先进的性能。
- ICLR具有偏差自适应分类器的不平衡半监督学习
本文提出了一种基于偏差自适应分类器的伪标签半监督学习方法,通过引入一个偏差吸引器来自动补偿类别不平衡带来的偏差,从而提高了伪标签方法在类别不平衡情况下的性能。实验证明,该方法优于现有的基准方法。
- 具有熟练教师的半监督三维目标检测
本文提出了一种新的 Pseudo-Labeling 半监督三维目标检测框架,通过引入 STE 和 CBV 模块提高了教师模型的性能,同时提出了 BCL 软监督信号来减小错误样本对训练的负面影响。实验证明,在 ONCE 和 Waymo 数据集 - 基于小型数据集的神经数据 - 文本生成:在大型语言模型之上比较两种半监督学习方法的附加值
本研究探讨了半监督学习与预训练语言模型在数据生成文本方面的效果。结果表明,半监督学习方法可以增强输出质量和多样性,即使已经使用了预训练语言模型。
- 利用自我监督提升跨域语音识别能力
本文提出了一种系统的无监督领域自适应框架,利用自监督方法在预训练和微调范式中充分利用无标签数据,在解决提高自监督方法在异领域性能的同时,通过提出三种创新性的调整方法,有效地提高了自适应领域的性能。
- EnergyMatch: 基于能量的伪标记半监督学习
本文提出基于能量分数的伪标记法,用于解决深度卷积神经网络中,由于 softmax 置信度无法准确反映样本离训练数据的距离,导致伪标记不可靠的问题,并在不平衡 SSL 数据集上实现了明显的精度提升。
- 利用伪标记数据提高直接语音翻译质量
本文介绍了一种基于 Transformer 神经网络的直接语音翻译技术,利用伪标签和外部数据来提升翻译效果,并在 Fisher 英西测试数据上创造了最好的翻译结果
- ACL面向可计算的深度主动学习
该研究介绍了两种用于文本分类和标记任务的技术,可以显著减少深度学习中主动学习繁重的计算资源需求,通过伪标签和蒸馏模型实现更高性能的模型训练。