BriefGPT.xyz
Ask
alpha
关键词
speaker-specific cues
搜索结果 - 2
音视频语音编解码器:重新思考音视频语音增强通过再合成的方法
本文提出了一种新的音频 - 视觉语音增强框架,利用个人化模型和神经语音编解码器从嘈杂的信号中高效合成真实干净的语音,以提高增强幅度和视角方面的质量。
PDF
2 years ago
CVPR
学习个别讲话风格以实现准确的唇读语音合成
本文提出了一种基于说话者唇部运动的语音合成方法,通过收集唇部运动大规模数据集并针对唇读单个说话者在自然环境下的情况进行模型设计,该模型可以更准确、自然地模拟说话者的语音,其量化、定性评估结果表明,该方法比现有方法的可理解性提高了四倍。
PDF
4 years ago
Prev
Next