BriefGPT.xyz
大模型
Ask
alpha
关键词
audio-driven talking head synthesis
搜索结果 - 4
高斯说话人:通过三维高斯喷洒合成特定说话人的形象
使用 3D 高斯散点图作为基础,GaussianTalker 是一种基于音频驱动的说话人头部合成方法,具有准确的唇部同步和优秀的视觉质量,超过现有最先进的方法,并具有实时渲染性能。
PDF
2 months ago
EDTalk: 高效情感演讲头部合成
本研究提出了一个用于言语生成的高效解开耦合框架 (EDTalk),该框架具有分解面部动态的能力,允许对嘴型、头部姿势和情绪表达进行个别操作,并能根据视频或音频输入进行条件设置。我们通过三个轻量级模块将面部动态分解为分别代表嘴部、姿势和表情的
→
PDF
3 months ago
Talk3D:个性化 3D 生成先验的高保真说话肖像合成
Talk3D 是一种新的音频驱动的说话头合成框架,通过有效地采用预训练的 3D 感知生成先验模型,可以忠实地重建其合理的面部几何形状。通过音频驱动的注意力 U-Net 架构,我们的模型预测 NeRF 空间中由音频驱动的动态面部变化,并由与音
→
PDF
3 months ago
AAAI
AE-NeRF: 音频增强的神经辐射场 用于少样本说话头合成
本文提出了一种名为 AE-NeRF 的音频增强神经辐射场模型,该模型能够生成具有少量样本的新演讲者的逼真肖像。实验证明,AE-NeRF 在图像保真度、音频嘴唇同步和泛化能力方面超过了现有技术,即使在有限的训练数据或训练迭代次数下也能取得优异
→
PDF
7 months ago
Prev
Next