Apr, 2024

大语言模型在远距离语言对上的同声传译语料库构建

TL;DR使用大型语言模型(LLM-SI-Corpus),将现有的语音翻译语料库转化为解释风格的数据,通过对 Simultaneous Machine Translation(SiMT)模型进行 fine-tuning,可以在减少延迟的同时保持与离线数据集训练模型相同质量水平。