Jul, 2020

具备自定义能力的 RNN-T 模型超越高性能混合模型

TL;DR本文中,我们介绍了最近开发的 RNN-T 模型,它在训练期间具有较小的 GPU 内存消耗、更好的初始化策略和先进的编码器建模,对 Microsoft 的 6.5 万小时的匿名训练数据进行训练后,开发的 RNN-T 模型优于经过训练良好的混合模型,同时具有更好的识别准确性和更低的延迟。我们进一步研究了如何将 RNN-T 模型定制为新领域,并比较了几种使用新领域纯文本数据的方法。研究发现,利用特定领域文本生成的文本到语音更新 RNN-T 的预测和联合网络最有效。