Aug, 2023

C2G2:具有潜在扩散模型的可控共时手势生成

TL;DR我们提出了一种名为 C2G2 的可控共语手势生成框架,该框架通过捕捉时间潜变信息和应用实用的控制方法来解决现有方法中存在的训练不稳定、时间不一致、高保真度和全面性不足以及对生成手势的说话者身份和时间编辑的缺乏有效控制等问题,通过两阶段的时间依赖增强策略和说话者特定解码器生成与说话者相关的真实长度骨骼以及柔性手势生成 / 编辑的重新上色策略,我们在基准手势数据库上进行了大量实验,验证了我们提出的 C2G2 相对于几种最先进的基准效果。