BriefGPT.xyz
Ask
alpha
关键词
subjective questions
搜索结果 - 4
COLING
LHMKE:用于中文大语言模型的大规模综合多学科知识评估基准
LHMKE 是一种大规模、全面和多学科知识评估基准,旨在为中文大型语言模型的知识获取能力提供全面评估。它包括 10,465 个问题,涵盖 30 个学科的 75 个任务,既包含客观题又包含主观题,以更全面评估大型语言模型的知识水平。我们对 1
→
PDF
4 months ago
利用匿名的众包平台实现大型语言模型的个性化评估
我们提出了一个新的匿名众包评估平台 —— 冰见,旨在评估大型语言模型的性能。该平台不仅支持对模型的总体能力进行集中评估,而且提供了一个开放的评估通道,使用户有机会根据个性化和可能更广泛的需求向模型提交问题。此外,我们的平台引入了个性化评估场
→
PDF
4 months ago
评估大型语言模型在高考基准测试上的表现
这篇论文介绍了 GAOKAO-Benchmark,它是一个直观的基准测试,利用中国高考考试的问题作为测试样本,对大型语言模型进行评估的一种方法。我们采用基于零 - shot prompts 的方法来分析模型的准确率和评分率,发现 ChatG
→
PDF
a year ago
Obj2Sub: 无监督将客观问题转化为主观问题
本文提出了一种新颖的混合非监督学习方法,采用基于规则的方法和预训练的稠密检索器,自动将客观问题转换为主观问题,从而测试学习者的理解程度。实验证明,相对于现有的数据驱动方法,本文的方法可以将召回率和准确率提高 36.45%。
PDF
2 years ago
Prev
Next