BriefGPT.xyz
大模型
Ask
alpha
关键词
mmlu benchmark
搜索结果 - 1
西班牙语和 LLM 基准:MMLU 是否被翻译迷失?
评估大型语言模型在其他语言中表现的质量,并修正翻译错误以及适应目标语言的测试项是改进非英语语言基准测试的关键。
PDF
a month ago
Prev
Next