Jun, 2024

评估大型语言模型在语言变异维度上的性能:一项跨语言泛化的系统性调查

TL;DR大语言模型在面对未知的相关语言和方言时会表现出性能下降现象,本论文通过对语言距离的建模和分析,提供了关于模型健壮性和任务特性对性能下降的洞察,为评估和缓解性能下降问题提供了便利