BriefGPT.xyz
Ask
alpha
关键词
co-speech gesture
搜索结果 - 2
Freetalker:基于扩散模型的可控语音和文本驱动手势生成以增强演讲者自然度
FreeTalker 是首个生成语音驱动的手势和文本驱动的演讲者动作的框架,使用来自多种动作数据集的异构数据,并利用扩散模型进行训练,以及利用无分类器引导和生成先验以实现平滑剪辑过渡。
PDF
6 months ago
音频驱动的同话手势视频生成
本研究旨在解决语音驱动的共同语言手势图像序列生成问题,提出了一种名为 ANGIE 的框架,使用向量量化运动提取器和共同语言 GPT,以有效地捕捉可重用的共同语言手势模式和细粒度节奏变化,从而实现高保真度的图像序列生成。
PDF
2 years ago
Prev
Next