BriefGPT.xyz
Ask
alpha
关键词
neural quality estimator
搜索结果 - 1
AV2Wav:基于扩散的连续自监督特征合成的音频 - 视觉语音增强
在这项工作中,我们介绍了 AV2Wav,这是一种基于重新综合的视听语音增强方法,可以在现实训练数据的挑战下生成清晰的语音。我们使用神经质量评估器从视听语音语料库中获取接近干净的子集,然后在这个子集上训练扩散模型,该模型以 AV-HuBERT
→
PDF
10 months ago
Prev
Next