Feb, 2024

Tower: 一种面向翻译相关任务的开放式多语言大型语言模型

TL;DR我们提出了一种多任务定制通用大型语言模型的方法,通过在多语言混合单语和平行数据上进行持续预训练,创建了 TowerBase,并在与翻译过程相关的指令上进行微调,创建了 TowerInstruct。我们的最终模型在与翻译工作流相关的多个任务上超过了开放式替代方案,并与通用封闭式语言模型相媲美。为了促进未来研究,我们发布了 Tower 模型、我们的专业数据集、一个关注翻译生态系统的 LLM 评估框架以及一系列模型生成版本的基准。