BriefGPT.xyz
大模型
Ask
alpha
关键词
audio inputs
搜索结果 - 2
通过生成的音频实现音频视觉视频到语音合成
使用视频和音频输入进行视频转语音合成的研究,通过使用预训练的视频转语音模型来合成缺失的语音信号,并训练一个音频 - 视觉 - 语音合成模型,通过同时使用静默视频和合成的语音输入来预测最终的重建语音。实验结果表明,在以原始波形和 mel 频谱
→
PDF
a year ago
从语音中学习地标运动以获取说话人不可知的 3D 语音生成
本篇研究提出了一种新方法,通过音频输入生成 3D 说话人头部动画,并利用面部的传动部位上的控制点来描述语音相关的运动,并利用两个不同的模型来实现;该方法具有身份不相关性,可实现任何用户的高质量面部动画。利用陆标在 3D 说话人头部动画生成中
→
PDF
a year ago
Prev
Next