情感识别通过音频输入数据的模型可以实现在心理健康、营销、游戏和社交媒体分析等领域的交互式系统的发展。
Jul, 2023
本文介绍了基于自我调整自监督异常检测(ST-SSAD)的新方法,该方法通过数据扩充来调整超参数,从而在语义类异常和微妙的工业缺陷中实现了显著的性能提升。
Jun, 2023
本文综述了自监督学习在音频处理和语音处理领域中的应用,包括方法、实验和基准数据,并讨论了未来发展方向和存在的问题。
Mar, 2022
本文通过对三种不同模型以及 420 种不同任务的广泛实验,认真研究了数据增强在异常检测中的作用,得出自监督作为另一个模型超参数,需要根据真实异常特征仔细选择数据增强方式的结论,并且在缺乏对应的情况下,自监督甚至会降低准确性,从而为未来的研究提供了新的方向
Aug, 2022
通过学习正常操作声音的特征并感知其偏差,无监督异常声音检测(ASD)旨在识别异常声音。近期研究集中于自监督任务,利用正常数据的分类,而先进模型的研究表明,通过表示学习及产生紧凑的类内和互不重叠的类间分布,保证异常数据的表示空间是重要的。然而,传统方法通常无法确保足够的类内紧凑性,并存在样本与其相应中心之间的角差异。本文提出了一种训练技术,旨在确保类内紧凑性并增加正常和异常样本之间的角间隔。此外,我们提出了一种提取重要时间区域特征的结构,使模型能够学习哪些时间帧应该被强调或抑制。实验结果表明,该方法在 DCASE 2020 Challenge Task2 数据集上相对于最先进的方法,AUC、pAUC 和 mAUC 分别提高了 0.90%、0.83%和 2.16%。
Oct, 2023
自我监督学习在无监督异常检测中起到重要作用,对 SSL 策略的选择、超参数的调整、预处理任务和增强函数的设计以及基于密度估计的预训练模型的利用提出了新的发展和挑战。
Aug, 2023
自监督学习在音频领域具有重要潜力,本研究证明自监督学习可以在无需注释的情况下从音频记录中获取有意义的鸟类声音表示,并展示了这些学习表示能够在少样本学习情景中泛化到新的鸟类物种。另外,使用预训练的音频神经网络,在自监督学习中选择高鸟类激活窗口显著提高了学习表示的质量。
Dec, 2023
该研究提出了一种端到端可训练的网络,结合图神经网络和弱监督策略,用于解决活动说话者检测问题,取得了最优性能。
本研究提出了一种叫做 AuxMix 的算法,该算法利用自监督学习任务来学习通用特征,以掩盖那些不同于标记集的语义上不相似的辅助数据,并正则化学习通过预测熵最大化来处理不同数据的不确定性,结果显示该算法相比现有的基线在 ResNet-50 模型上训练 CIFAR10 数据集时提高了 5%。
Jun, 2022
本篇论文提出一种用于有声学领域差异的监督领域自适应方法,通过数据增强来减小源域和目标域的差异,并在初步微调阶段使用,证明了该方法的有效性。