Apr, 2024
大语言模型在远距离语言对上的同声传译语料库构建
Simultaneous Interpretation Corpus Construction by Large Language Models in Distant Language Pair
Yusuke Sakai, Mana Makinae, Hidetaka Kamigaito, Taro Watanabe
TL;DR使用大型语言模型(LLM-SI-Corpus),将现有的语音翻译语料库转化为解释风格的数据,通过对 Simultaneous Machine Translation(SiMT)模型进行 fine-tuning,可以在减少延迟的同时保持与离线数据集训练模型相同质量水平。