Nov, 2022

LAMASSU:使用神经传导器进行流媒体跨语言语音识别和翻译

TL;DR本文提出了一种使用神经转导器的流式语言无关的多语言语音识别和翻译模型,采用语言无关的多语言编码器显著提高了模型效果,并探究统一预测和联合网络的优缺点,通过给编码器输入目标 LID 和连接时序分类正则化的训练,不仅显著降低了模型大小,还取得了优于单语音识别和双语言翻译模型的结果。