Aug, 2018

利用多头卷积神经网络实现快速谱图反演

TL;DR本研究提出了一种使用多头卷积神经网络(MCNN)架构从频谱生成波形的方法,而不需要迭代算法,能显著提高计算效率。对 MCNN 进行了大规模数据集的训练,并且损失函数的定义关注于声学感知质量。证明了 MCNN 是一种非常有前途的高质量语音合成方法。