Jan, 2023
自我监督的语音表征损失函数及其在语音增强中的应用
Perceive and predict: self-supervised speech representation based loss functions for speech enhancement
George Close, William Ravenscroft, Thomas Hain, Stefan Goetze
TL;DR本文研究了语音增强中使用自我监督语音表示来帮助神经语音增强模型训练的方法,指出清洁和嘈杂语音特征编码之间的距离与语音质量和可懂性的心理声学测量值以及人类的平均意见分数(MOS)密切相关,并通过使用该距离作为损失函数的实验证明了相对于来自语音增强文献的常见损失函数的 STFT 频谱图距离损失,以及其他损失函数的性能。