ACLJun, 2024

StreamAtt:基于注意力机制的音频历史选择的直接流式语音转写翻译

TL;DR实时的语音转文字翻译是具有挑战性的任务,文章提出了流式语音转文字翻译(StreamST)策略和流式语音转文字翻译延迟度量(StreamLAAL),并通过实验证明了其在实时语音翻译领域的有效性。