BriefGPT.xyz
Oct, 2016
文本标准化的循环神经网络方法:一项挑战
RNN Approaches to Text Normalization: A Challenge
HTML
PDF
Richard Sproat, Navdeep Jaitly
TL;DR
该论文介绍了一个挑战:给定一个大型的文本语音对齐数据集,通过训练递归神经网络(RNN)来学习正确的文本归一化函数。论文提供了一个通用文本数据集,其中归一化是使用现有的文本到语音系统的文本归一化组件生成的,并表明简单的FST过滤器可以减轻RNN产生的错误,旨在为序列到序列建模提供一个新的数据集,以期寻找更好的解决方案。
Abstract
This paper presents a challenge to the community: given a large corpus of written text aligned to its normalized spoken form, train an
rnn
to learn the correct normalization function. We present a
data set
of gen
→