Feb, 2021
通过非自回归模型和 BERT 的跨模态知识转移实现快速端到端语音识别
Fast End-to-End Speech Recognition via Non-Autoregressive Models and Cross-Modal Knowledge Transferring from BERT
Ye Bai, Jiangyan Yi, Jianhua Tao, Zhengkun Tian, Zhengqi Wen...
TL;DR提出了一种非自回归语音识别模型 ——LASO,利用注意力机制,位置关联总结器,自注意机制等,把语音识别转化为逐位置分类的问题,并提供了跨模态迁移学习方法来提高性能。