BriefGPT.xyz
Ask
alpha
关键词
specialized benchmarks
搜索结果 - 1
SportQA: 大型语言模型中的体育理解基准
SportQA 是一个专门设计用于评估大型语言模型在体育理解方面的新型基准,通过超过 70,000 个多项选择题,涵盖了三个不同难度级别,从基本历史事实到复杂的场景推理任务,综合使用少样本学习和思维链提示对主流大型语言模型进行了全面评估,结
→
PDF
4 months ago
Prev
Next