Dec, 2022

音频驱动的同话手势视频生成

TL;DR本研究旨在解决语音驱动的共同语言手势图像序列生成问题,提出了一种名为 ANGIE 的框架,使用向量量化运动提取器和共同语言 GPT,以有效地捕捉可重用的共同语言手势模式和细粒度节奏变化,从而实现高保真度的图像序列生成。