Oct, 2024

大型语言模型是否有英语口音?评估和改善多语言LLM的自然性

TL;DR本研究针对当前多语言大型语言模型(LLMs)在非英语语言中自然性不足的问题,提出了新颖的自动语料库级别评估指标,用以考量多语言LLM输出的词汇和句法自然性。研究发现,大型语言模型在法语和中文中普遍表现出英语影响的模式,并提出了一种简便有效的对齐方法,以提高其在目标语言和领域的自然性,且不影响其在通用基准测试中的表现。