Jun, 2022

LAE: 用于单语和多语言 ASR 的语言感知编码器

TL;DR该研究提出了一种新的语言感知编码器(LAE)架构,通过解开语言特定信息和在编码期间生成帧级语言感知表示来处理多语言语音识别,并且在华语 - 英语混合语音上表现出卓越的性能。