BriefGPT.xyz
大模型
Ask
alpha
关键词
talking face videos
搜索结果 - 2
转化音频驱动的说话脸部合成为文本驱动的
该论文提出了一种将预训练的音频驱动人脸合成模型重新编程以使其能够处理文本输入的方法,其中涵盖了文本到音频嵌入、音频驱动模型、语音合成、说话者特征等关键词。
PDF
a year ago
CVPR
基于关键点和外观先验的身份保持说话人脸生成
提出了一种两阶段方法以生成更逼真、口型同步和较好地保留身份信息的谈话面部视频。第一阶段利用基于 Transformer 的关键点生成器从音频中提取嘴唇和下颌关键点,并根据说话人的脸部轮廓调整生成的关键点。在第二阶段中,视频渲染模型将关键点转
→
PDF
a year ago
Prev
Next