该研究针对大型数据集中的声音事件分类中标签噪声的问题,提出了 FSDnoisy18k 数据集,并提供了卷积神经网络(CNN)基准系统。实验证明,与小型仔细标记的数据相比,大量带噪声的数据可以更好地训练模型,同时还证明了当标签数据受损时,噪声鲁棒性损失函数可以有效地提高模型性能。
Jan, 2019
该研究探讨了标签噪声分类器的稳健性,旨在提高模型对复杂实际场景中的噪声数据的抵抗能力,并通过整合对抗机器学习和重要性重新加权技术来解决标签噪声对实际应用的影响。
Dec, 2023
对于计算机视觉任务尤其是图像分类任务,本综述全面回顾了应对噪声标签的不同深度学习方法的演变,研究了不同的噪声模式,并提出了一种由现实世界数据引导的算法来生成合成标签噪声模式,以形成一个新的以真实世界数据为指导的合成基准,并在该基准上评估了一些典型的噪声鲁棒方法。
Apr, 2024
本论文探究了在实际情况中,数据标注不可避免地有可能存在噪声标签的情况下,利用引入噪声层的方法,在 Convolutional Network 模型上进行判别性训练以获得更好的性能。同时在多个数据集上进行了实验,包括在 ImageNet 分类基准测试上的大规模试验。
Jun, 2014
本文提出了一种训练深度网络抵抗标签噪声的方法,通过引入非线性处理层(噪声模型)来将标签噪声的统计模型化到卷积神经网络中,通过实验证明这种方法使得 CNN 可以学习到更好的句子表示,即使在极端的标签噪声情况下仍然很稳健。同时,本文发现正确的噪声模型初始化和正则化对训练结果至关重要,而和图像分类不同的是,改变 batch size 并不会对分类性能有明显影响。
Mar, 2019
本研究提出了一种可以按任意讲话者数量、噪声类型和语音信噪比水平进行横向扩展的 MS-SNSD 有噪语音数据集,在这个基础上,研究者们推出了开源的评估方法,通过客观质量衡量标准和主观意见评分相互印证提升了 语音增强算法的性能。
Sep, 2019
本文针对网络训练时噪声标签的问题,提出了一种基于交叉验证和合作训练策略的解决方法,成功提高了深度神经网络在合成和实际噪音数据集下的泛化性能。
May, 2019
本文提出一种噪声容忍的训练算法,其中在传统梯度更新之前进行元学习更新来模拟实际训练。通过生成合成噪声标签进行训练,该元学习方法训练模型,以便在使用每个设置的合成噪声标签进行一次梯度更新后,模型不会过度拟合特定的噪声,从而提高深度神经网络的性能。
Dec, 2018
本文介紹關於使用深度學習算法處理帶有噪聲標籤的問題,針對噪聲建立噪聲模型和使用魯棒損失、正則化等方法建立魯棒算法兩種子群進行了綜述。
Dec, 2019
本文主要研究了如何应对在低资源语言中的文本分类中存在的标注噪声问题,并提出了一些噪声处理技术和使用任务自适应的预训练技术来解决这个问题。
Jun, 2022