Aug, 2023

GENEA Challenge 2023 的 DiffuseStyleGesture + 参赛方案

TL;DR通过 DiffuseStyleGesture + 模型,本论文介绍了一种用于生成对话手势的非语言行为的生成和评估的解决方案。该模型利用扩散模型自动生成手势,通过音频、文本、说话者 ID 和种子手势等多种模态对隐藏空间进行映射和处理,在 GENEA Challenge 中展示了与顶尖模型相当的表现,完成了生成逼真且适合特定语音的手势的目标。