为什么角边缘损失对半监督异常声音检测很有效?
通过学习正常操作声音的特征并感知其偏差,无监督异常声音检测(ASD)旨在识别异常声音。近期研究集中于自监督任务,利用正常数据的分类,而先进模型的研究表明,通过表示学习及产生紧凑的类内和互不重叠的类间分布,保证异常数据的表示空间是重要的。然而,传统方法通常无法确保足够的类内紧凑性,并存在样本与其相应中心之间的角差异。本文提出了一种训练技术,旨在确保类内紧凑性并增加正常和异常样本之间的角间隔。此外,我们提出了一种提取重要时间区域特征的结构,使模型能够学习哪些时间帧应该被强调或抑制。实验结果表明,该方法在 DCASE 2020 Challenge Task2 数据集上相对于最先进的方法,AUC、pAUC 和 mAUC 分别提高了 0.90%、0.83%和 2.16%。
Oct, 2023
我们通过 “对称” 形式的对比损失重新思考正负样本对的采样方式,并引入了在监督设置中被广泛采用的 AM-Softmax 和 AAM-Softmax 等边缘,展示了对称对比损失的有效性,以及 Additive Margin 和 Additive Angular Margin 能够通过改善讲话人可分性来减少错误识别。最终,通过结合这两种技术并训练一个更大的模型,我们在 VoxCeleb1 测试集上取得了 7.50% 的 EER 和 0.5804 的 minDCF,优于其他对比自监督方法在讲话人验证上的表现。
Jun, 2023
本研究使用角度 softmax (A-softmax) 替代传统的 softmax loss 和三元组损失,将其引入端对端说话人验证中进行特征学习,结合 PLDA 后进一步提升了该系统的性能。
Jun, 2018
本研究提出了一种新的角度损失来学习更好的相似性度量,在三角形中约束负面点的角度具有大小不变性,并强制施加三阶几何约束,从而捕捉比对比损失或三重对损失更多的局部结构。
Aug, 2017
本文介绍了一种新的面部识别方法,使用 ArcFace 和子中心 ArcFace 方法来提高分类效果并且减少噪声影响,并且可以通过训练好的模型生成身份保持的面部图像。
Jan, 2018
本文提出采用最大化间隔损失的优化目标,定义类间隔与样本间隔,推导出广义的间隔 softmax 损失,并在此基础上设计出新工具,即样本间隔正则化、适用于类均衡情形的最大间隔 softmax 损失和适用于类不平衡情形的零中心正则化。实验结果表明,本文的方法对于视觉分类、样本不平衡分类、人员重新识别和人脸验证等任务具有很好的效果。
Jun, 2022
通过自我监督学习 Fine-tune Transformers,利用丢失作为异常分数,成功提升语义异常的 AUROC 分数 11.6%和句法异常的 22.8%。此外,所得到的最佳目标和学习表示因下游异常类型不同而异,且表示的可分离性对于检测语义异常更有效。
Apr, 2022
本论文提出了一种新的适应性损失函数,该函数强调错分特征向量以指导较有区别的特征学习,从而解决传统损失函数在面部识别中存在的问题,并在多个基准测试上取得了比其他先进替代方案更有效的实验结果。
Nov, 2019
使用自我监督学习方法中的特征交换(FeatEx)提出了一种简单而有效的异常声音检测系统,其性能在 DCASE2023 ASD 数据集上明显优于其他已发表结果。
Dec, 2023