Jun, 2024

Hallo: 分层音频驱动的肖像图像动画综合

TL;DR通过采用扩散法为基础的方法框架,该研究提出了一种音频驱动下的肖像图像动画技术,通过引入层次化的音频驱动视觉合成模块,实现了更准确的音频输入与视觉输出的对齐,包括嘴唇、表情和姿势的动作,并通过定性和定量分析进行综合评估。