Jun, 2024

CoSTA: 使用对齐的语音文本交替进行混合编码的语音翻译

TL;DR通过先前训练好的自动语音识别 (ASR) 和机器翻译 (MT) 模块的结合,本研究提出了一种名为 COSTA 的端到端模型架构,用于印度语言到英文文本的混合语言实时翻译,并发布出相关评估基准。COSTA 在混合语言的孟加拉语、印地语、马拉地语和泰卢固语到英文文本的翻译中,相对于其他基线模型表现出显著优势,BLEU 点数提高达 3.5。