May, 2021

情感语音转换:理论、数据库与ESD

TL;DR本文介绍了情感语音转换研究的最新进展以及现有的情感语音数据库,并且提出了一种新的情感语音数据库(ESD)来满足不断增长的研究需求,在控制的声学环境下记录了超过29个小时的音频数据,包括10位英语和10位中文讲话者的350个平行发声,分别涵盖中性、快乐、愤怒、悲伤和惊讶5种情感类别。此外,本文还在ESD数据库上实现了几个最先进的情感语音转换系统,并提供了ESD的参考研究。