Feb, 2021

通过非自回归模型和 BERT 的跨模态知识转移实现快速端到端语音识别

TL;DR提出了一种非自回归语音识别模型 ——LASO,利用注意力机制,位置关联总结器,自注意机制等,把语音识别转化为逐位置分类的问题,并提供了跨模态迁移学习方法来提高性能。