May, 2024

LLAniMAtion: LLAMA驱动的手势动画

TL;DR在这篇论文中,我们使用LLAMA2从文本中提取LLAMA2特征来生成适当且同步的手势,比较其与音频特征的性能,并探索两种模态的结合对手势生成的影响。我们的结果表明,仅使用LLAMA2特征的模型性能显著优于仅使用音频特征的模型,同时使用两种模态和仅使用LLAMA2特征的模型之间没有显著差异,表明LLMs对手势生成非常适用。