Jun, 2022

MOS 预测系统中语音表示的比较

TL;DR本研究比较了自监督学习特征和谱特征的性能,并结合了两者以提高自动 MOS 的准确性。使用大规模听力测试语料库,发现 wav2vec 特征具有最佳的泛化能力,且结合特征组合表现最佳。