Jun, 2023

Diff-TTSG: 去噪概率综合语音和手势合成

TL;DR本文介绍了第一个联合学习合成语音和手势的扩散式概率模型 Diff-TTSG,并提供了多种单模态和多模态主观测试来评估系统,结果表明本方法能够在小数据集上进行训练,同时提高了合成质量。