关键词synthetic speech dataset
搜索结果 - 2
- 学习解缠绕语音表示
利用综合研究人工数据集 SynSpeech 来评估监督技术在语音表征解耦上的效果,弥补有限的语音数据集缺乏已知生成因素的问题,为现有最先进的语音表征学习方法提供全面的评估和框架,进一步推动这个相对较少探索的领域的发展。
- 改进基于自主学习的 MOS 预测网络
该研究通过对先前基于自监督学习的 MOS 预测模型进行数据、训练和后训练的特定改进,并采用多种技术评估其有效性,包括 wav2vec 2.0 模型、转移学习、不同的批处理方法和方法的量化等,实现自动预测 MOS 值。