BriefGPT.xyz
Ask
alpha
关键词
audio-visual coherence
搜索结果 - 2
AAAI
SyncTalkFace:通过音 - 唇记忆实现精准嘴唇同步的说话人脸生成
该论文提出了一个名为 Audio-Lip Memory 的技术,使用存储在音频特征中的唇部运动信息来帮助生成与音频最匹配的嘴形,从而使得面部运动与音频之间出现了更加精细的时序一致性,实现了更高质量的谈话面部生成。
PDF
2 years ago
IJCAI
通过注意力音视一致性学习实现任意说话人脸生成
本文提出了一种新的任意说话脸生成框架,通过提出的 AMIE 发现音频和视频信息之间的视听一致性,以及通过训练阶段中选择性聚焦输入图像的嘴唇区域来进一步增强唇部同步。在 LRW 数据集和 GRID 数据集上进行的实验结果显示,该方法在性别和姿
→
PDF
6 years ago
Prev
Next