BriefGPT.xyz
Ask
alpha
关键词
sensitivity to prompt variations
搜索结果 - 1
MMLU-Pro: 一个更强大和具有挑战性的多任务语言理解基准测试
在大规模语言模型的时代,本论文引入了 MMLU-Pro,这是一个增强的数据集,旨在扩展主要以知识驱动的 MMLU 基准测试,并且在其中集成了更具挑战性且关注推理的问题,从 4 个选项扩展到 10 个选项,同时消除了 MMLU 中的琐碎和噪声
→
PDF
a month ago
Prev
Next