Mar, 2022

基于注意力机制的唇部音频视觉合成技术用于生成野外交谈人脸

TL;DR本文提出了一种 AttnWav2Lip 模型,该模型将空间注意和通道注意模块纳入到口型同步策略中,并着重于唇部区域重构,从而实现了更精准的口型同步,通过在多个基准唇同步数据集上的实验,表明该模型展现了超越基线的良好表现。