Sep, 2019

DurIAN: 基于时长信息的注意力多模态合成网络

TL;DR本文提出了一种通用、强大的多模态合成系统,可以同时生成自然语音和面部表情,并能改善现有的端到端语音合成系统中的词跳过 / 重复错误,同时可以对语音和面部表情的表现力进行细粒度控制。