用于异常声音检测的自监督学习

通过学习正常操作声音的特征并感知其偏差，无监督异常声音检测（ASD）旨在识别异常声音。近期研究集中于自监督任务，利用正常数据的分类，而先进模型的研究表明，通过表示学习及产生紧凑的类内和互不重叠的类间分布，保证异常数据的表示空间是重要的。然而，传统方法通常无法确保足够的类内紧凑性，并存在样本与其相应中心之间的角差异。本文提出了一种训练技术，旨在确保类内紧凑性并增加正常和异常样本之间的角间隔。此外，我们提出了一种提取重要时间区域特征的结构，使模型能够学习哪些时间帧应该被强调或抑制。实验结果表明，该方法在 DCASE 2020 Challenge Task2 数据集上相对于最先进的方法，AUC、pAUC 和 mAUC 分别提高了 0.90％、0.83％和 2.16％。

Oct, 2023

自监督解决无监督异常检测的困境和机遇

自我监督学习在无监督异常检测中起到重要作用，对 SSL 策略的选择、超参数的调整、预处理任务和增强函数的设计以及基于密度估计的预训练模型的利用提出了新的发展和挑战。

Aug, 2023

自主学习用于少样本鸟声分类

自监督学习在音频领域具有重要潜力，本研究证明自监督学习可以在无需注释的情况下从音频记录中获取有意义的鸟类声音表示，并展示了这些学习表示能够在少样本学习情景中泛化到新的鸟类物种。另外，使用预训练的音频神经网络，在自监督学习中选择高鸟类激活窗口显著提高了学习表示的质量。

Dec, 2023

端到端的活跃说话人检测

该研究提出了一种端到端可训练的网络，结合图神经网络和弱监督策略，用于解决活动说话者检测问题，取得了最优性能。

Mar, 2022

AuxMix：半监督学习与无限制未标记数据

本研究提出了一种叫做 AuxMix 的算法，该算法利用自监督学习任务来学习通用特征，以掩盖那些不同于标记集的语义上不相似的辅助数据，并正则化学习通过预测熵最大化来处理不同数据的不确定性，结果显示该算法相比现有的基线在 ResNet-50 模型上训练 CIFAR10 数据集时提高了 5％。

Jun, 2022

自监督语音表示域适应微调的自动数据增强

本篇论文提出一种用于有声学领域差异的监督领域自适应方法，通过数据增强来减小源域和目标域的差异，并在初步微调阶段使用，证明了该方法的有效性。

Jun, 2023