Oct, 2024
大型语言模型是否有英语口音?评估和改善多语言LLM的自然性
Do Large Language Models Have an English Accent? Evaluating and
Improving the Naturalness of Multilingual LLMs
TL;DR本研究针对当前多语言大型语言模型(LLMs)在非英语语言中自然性不足的问题,提出了新颖的自动语料库级别评估指标,用以考量多语言LLM输出的词汇和句法自然性。研究发现,大型语言模型在法语和中文中普遍表现出英语影响的模式,并提出了一种简便有效的对齐方法,以提高其在目标语言和领域的自然性,且不影响其在通用基准测试中的表现。