BriefGPT.xyz
Ask
alpha
关键词
audio-driven talking face synthesis
搜索结果 - 2
Instruct-NeuralTalker: 用指令修改音频驱动的 Talking Radiance Fields
本文提出了一种基于人类指令的交互式框架,利用最新的条件扩散模型实现对隐式神经表示的编辑,从而实现实时个性化的对话人脸生成,其在消费级硬件上实现了每秒最高 30 帧的实时渲染,并取得了显著的渲染质量改善。
PDF
a year ago
MM
为实现逼真的音频驱动的说话人脸合成而模仿任意说话风格
本文提出了一种基于 3D 可变形模型统计参数的语音驱动说话人脸合成方法,通过无监督学习从野外的说话视频中学习特征,可以模仿任意视频中的任意风格,并且可以生成新的样式,实验证明此方法相比基线方法能够更自然、更具表现力地合成说话风格。
PDF
3 years ago
Prev
Next