May, 2023

CPNet: 基于 CLIP 的注意力浓缩器和概率图引导的高保真说话脸生成技术

TL;DR本文提出了一个基于 CLIP 的关注力和概率图引导网络 (CPNet),用于推断高保真的人脸合成视频。通过 fine-grained 特征整合和概率分布的一致性,该方法克服了局部细节模糊和降级保真度问题,取得了比现有技术更好的成果。