Oct, 2016

文本标准化的循环神经网络方法:一项挑战

TL;DR该论文介绍了一个挑战:给定一个大型的文本语音对齐数据集,通过训练递归神经网络(RNN)来学习正确的文本归一化函数。论文提供了一个通用文本数据集,其中归一化是使用现有的文本到语音系统的文本归一化组件生成的,并表明简单的FST过滤器可以减轻RNN产生的错误,旨在为序列到序列建模提供一个新的数据集,以期寻找更好的解决方案。