Sep, 2019
DurIAN: 基于时长信息的注意力多模态合成网络
DurIAN: Duration Informed Attention Network For Multimodal Synthesis
Chengzhu Yu, Heng Lu, Na Hu, Meng Yu, Chao Weng...
TL;DR本文提出了一种通用、强大的多模态合成系统,可以同时生成自然语音和面部表情,并能改善现有的端到端语音合成系统中的词跳过 / 重复错误,同时可以对语音和面部表情的表现力进行细粒度控制。