Jan, 2024

DiffSHEG: 基于扩散的实时语音驱动全面的 3D 表情和手势生成

TL;DRDiffSHEG 是一种基于扩散的语音驱动的全面三维表情和手势生成方法,通过从表情到手势的单向信息流和扩散模型中的任意长序列生成策略,实现了高质量的同步表情和手势生成。