May, 2024

(或许)超越人类翻译:利用多智体协作翻译超长文学文本

TL;DR近期机器翻译 (MT) 的进展在各个领域极大地提高了翻译品质,但是由于文学作品的复杂语言、比喻表达和文化内涵,对文学文本的翻译仍然是一个巨大挑战。本文介绍了一个基于大型语言模型 (LLMs) 的新型多智能体框架,名为 TransAgents,通过利用多个智能体的共同能力,模拟传统的翻译出版流程,以解决文学作品翻译的复杂需求。为了评估我们的系统的有效性,我们提出了两种创新的评估策略:单语种人类偏好 (MHP) 和双语 LLM 偏好 (BLP)。MHP 从目标语言的单语读者角度评估翻译,而 BLP 则使用先进的 LLM 直接比较翻译和原文。实证研究结果表明,尽管 d-BLEU 分数较低,但 TransAgents 的翻译在领域特定知识要求较高的流派中,被人类评估者和 LLMs 优选于人工参考翻译。我们还通过案例研究突出了 TransAgents 的优势和局限性,并提出了未来研究的方向。