Jul, 2022

流式ASR的计算成本分摊Transformer

TL;DR该论文提出了一种基于Transformer的端到端自动语音识别体系结构,该体系结构通过计算成本分摊实现高效的神经推断,其在推断期间动态创建稀疏计算路径,实现计算资源的选择性使用,并使用可调节的损失函数规范预测性能对计算总体水平进行计算。在LibriSpeech数据上进行实验,最佳模型只增加3%的相对字错误率并降低60%的计算成本。