Nov, 2022

鲁棒的声音质量特征嵌入用于失音声音检测

TL;DR本研究提出了一种深度学习框架来生成对声音质量敏感且在不同语料库中具有鲁棒性的声学特征嵌入,同时将对比性损失与分类损失相结合进行训练,并使用数据膨胀方法提高模型的鲁棒性,实证结果表明,该方法不仅在语料库内和语料库间的分类准确度上表现出色,而且生成的嵌入对声音质量敏感且跨不同语料库具有鲁棒性。同时,与三种基准方法比较的结果表明,所提出的模型在干净以及损坏的语料库内和语料库间表现出一致的优异性能。