BriefGPT.xyz
Ask
alpha
关键词
eleutherai's language model evaluation harness
搜索结果 - 1
KMMLU:韩国语的大规模多任务语言理解测量
我们提出了 KMMLU,这是一个新的韩语基准,包括来自 45 个学科的 35,030 个专家级多项选择题,涵盖人文学科到 STEM 学科。与之前从现有英语基准翻译而来的韩语基准不同,KMMLU 收集了来自原始韩语考试的问题,捕捉了韩语的语言
→
PDF
5 months ago
Prev
Next