- MakeSinger: 一种用于数据高效的半监督训练方法的歌声合成,通过无分类器扩散引导
通过无分类器扩散引导的 MakeSinger 半监督训练方法,提高合成的歌声质量,并展示即使在无歌声数据的情况下,通过训练文字转语音 (TTS) 数据的模型仍可以合成 TTS 说话者的歌声。
- Quater-GCN: 用方向和半监督训练提升 3D 人体姿势估计
通过结合方向性信息,引入 Quater-GCN (Q-GCN) 方法来提高 3D 人体姿势估计性能,并通过半监督训练策略利用无标签数据解决有限方向性的挑战。Q-GCN 在与现有方法的综合评估中展现出优秀的性能。
- UniMOS: 一种用于标签约束数据集的多器官分割的通用框架
UniMOS 是首个全面利用完全标注图像、部分标注图像和未标注图像的通用框架,其中包括多器官分割模块、新的目标自适应损失和用于未标注数据的半监督训练模块。实验证明,与其他先进方法相比,该框架在多个医学图像分割任务中表现出色,同时显著提高了数 - 基于 Transformer 的跨模态肿瘤分割的图像级监督和自训练
我们提出了一种名为 MoDATTS 的新的半监督训练策略,用于处理自动医学图像分割中存在的模态遗传性问题,并通过图像转换和视觉转换器实现更准确的肿瘤分割。该模型在 CrossMoDA 2022 挑战中表现出优越的性能,并在 BraTS 20 - 基于长期电子健康记录的标记有效的事件表型鉴定 (LATTE)
本研究提出一种 LAbel-efficienT incidenT phEnotyping (LATTE) 算法,旨在通过使用病程数据中的先前训练的语义嵌入向量作为先验知识,并使用反向传播和半监督联合学习,从而准确注释临床事件的时间,从而提高 - 自动音乐转录中乐器间知识的传递
本文探讨使用软件合成音频数据训练通用模型来加快乐器自动转录模型的转移学习,结果表明使用合成数据训练模型可能是预训练通用模型的良好基础。
- CrossSplit: 通过数据分割减轻标签噪声记忆化现象
该论文研究如何提高深度学习算法在标签噪声存在的情况下的鲁棒性,提出了一种名为 CrossSplit 的新型训练方法,该方法可以通过两个神经网络在数据集的两个不相交部分上训练来缓解噪声标签的记忆化现象,并使用对等网络的预测来调整每个网络的训练 - ECCV单目 3D 物体检测的跨模态知识蒸馏网络
本研究提出了一种基于 Cross-Modality Knowledge Distillation (CMKD) 的半监督训练框架,通过跨模态知识蒸馏能够从大规模未标记数据中有效传输 LiDAR 模态到图像模态的知识,从而显著提高单目三维检测 - 用合成的混合语文本生成优化双语神经转换器
本研究探讨了如何针对混杂语音优化基于神经传递器的双语自动语音识别系统,发现半监督训练和合成的混合开关数据可以改善这一系统的性能。同时,我们分析了每个神经传递器编码器对混合开关性能的影响,并在 ASCEND 数据集上评估了我们的英语 / 普通 - 通过仅文本和半监督训练改善审议
通过使用文本数据和半监督训练,结合基于 Transformer 的双向编码器表示和文本到语音解码器以及半监督训练,实现了多项任务中 4% 至 12% 的 WER 降低,并比最先进的语言模型(LM)缩减的 Deliberation 模型相比降 - CVPRSelfD: 从网络数据中自学习的大规模驾驶策略
介绍了 SelfD,一个利用海量在线图片的可扩展驾驶学习框架,使用半监督训练来从未标记数据中学习后效代理。通过利用伪标记步骤进行数据增强,SelfD 表现出可靠的驾驶性能,无需额外的数据收集或注释工作。
- ECCV有限标签预算下通过主动学习进行光流训练
我们提出了一种简单而有效的半监督方法,用于训练光流预测器,并基于简单的启发式方法提出主动学习方法,以进一步减少实现相同目标准确度所需的标签数量。实验结果表明,我们的半监督网络通常只需要大约 50% 的标签即可实现接近完整标签精度,并且在 S - 使用深度强化学习进行弱监督场景文本检测
本文提出了一个基于弱监督和增强学习的场景文本检测方法,使用神经网络估计强化学习智能体的奖励值,且在真实数据和合成数据相结合的半监督学习中表现最佳。
- AAAI学习中的确认偏见问题:以标签噪声为手段进行打击
通过融合伪标记和置信度估计技术,Robust LR 方法成功地改善了数据标签噪声和确认偏差,并在以不同级别合成噪声的 CIFAR 和真实噪声的 Mini-WebVision 和 ANIMAL-10N 三个数据集上实现了最先进的性能。
- 自适应对比学习在半监督医学图像分割中的应用 —— 基于元标签方法
本文提出了一种利用元标签注释的对比学习方法,用于医学影像分割中模型表现的优化。模型在预训练和半监督训练中使用元标签注释,并采用自适应学习方法消除噪声标签,实验结果表明这种方法在几个数据集下表现优异。
- CVPRSimPLE: 特征相似的伪标签利用用于半监督分类
本文提出了基于 Pair Loss 和 MixMatch 技术的 SimPLE 算法,通过挖掘标记和未标记数据之间的关系,显著提升了 CIFAR-100 和 Mini-ImageNet 上的性能,并在 CIFAR-10 和 SVHN 上达到 - ACL设计精确和鲁棒的对话响应评估器
本文提出建立无参考评估器以及利用半监督训练和预训练(掩码)语言模型的方法来改进自动对话响应评估器的性能,实验结果表明所提出的自动评估器与人类判断具有很强的相关性(>0.6)并且能够很好地适应不同的回答和语料库。该研究代码和数据已经开源在指定 - ACL利用 Cloze 问题进行少样本文本分类和自然语言推理
本文介绍了一种半监督式的训练程序,称之为 PET,用来在低资源环境下学习某些 NLP 任务,并通过将输入示例转化为填空样式的短语来帮助语言模型理解给定任务
- ICML端到端自动语音识别:从受监督学习到半监督学习与现代架构
本文研究了 ResNet、时深分离卷积神经网络和变压器等半监督训练方法,在标准数据集 LibriSpeech 上,通过伪标签来利用来自 LibriVox 的额外未标记数据。研究结果表明,半监督训练可以改善所有架构和损失函数的模型,并在它们之 - KDD图卷积网络的可认证鲁棒性和鲁棒训练
本文提出了第一种证明(非)稳健性的图卷积网络方法,该方法能够在考虑特定攻击模型的情况下,保证节点属性的 L0 - 范围内的扰动。最后,我们还提出了一种鲁棒的半监督训练过程,通过实验证明我们的方法证明了图神经网络的鲁棒性,对预测精度的影响最小