May, 2024

通过姿势编码变分自动编码器实现多元化的手语表达

TL;DR该研究解决了多样性感知手语生成问题,扩展了变分推断范式以包括姿势信息和属性条件,通过 UNet 架构的生成器框架和变分推断的视觉特征生成具有不同属性的手语图像,实验证明该模型在多样性、像素图像质量和姿势估计方面的表现优于现有基准模型,并忠实地再现手语非口型特征。