Nov, 2019

使用并行计划采样和相对位置嵌入器改进 Transformer 对于语音识别的泛化能力

TL;DR本文中,我们提出了一种采用 parallel scheduling sampling (PSS) 和 relative positional embedding (RPE) 来帮助 Transformer 泛化到看不见的数据的方法。我们的方法在 10,000 小时普通话自动语音识别任务上,对于短语音有 7% 的相对改进和对于长语音有 70% 的相对改进。