Mar, 2024

MoDiTalker: 运动解缠扩散模型用于高保真说话头生成

TL;DR通过提出的 MoDiTalker 模型,我们成功地解决了传统 GAN 模型在生成对话头像时存在的质量有限和训练不稳定的问题,并通过引入音频到运动和运动到视频两个模块,实现了高质量的对话头像生成。