May, 2024

西班牙语和 LLM 基准:MMLU 是否被翻译迷失?

TL;DR评估大型语言模型在其他语言中表现的质量,并修正翻译错误以及适应目标语言的测试项是改进非英语语言基准测试的关键。