Apr, 2022
面向口语理解和同时语音翻译的分块流式Transformer
Blockwise Streaming Transformer for Spoken Language Understanding and
Simultaneous Speech Translation
TL;DR本研究提出基于块状,流式 Transformer 的方法,通过流式处理和块状并行检索,在同时进行自然语言理解和语音翻译等多个语音处理任务中,实现实时处理并取得与离线模型相当甚至更高的性能表现,并通过引入自动语音识别中间层损失约束和跨语言编码方法等方式进一步提高分类性能和模型表现。