subjective questions | BriefGPT

关键词subjective questions

搜索结果 - 4

COLINGLHMKE：用于中文大语言模型的大规模综合多学科知识评估基准
LHMKE 是一种大规模、全面和多学科知识评估基准，旨在为中文大型语言模型的知识获取能力提供全面评估。它包括 10,465 个问题，涵盖 30 个学科的 75 个任务，既包含客观题又包含主观题，以更全面评估大型语言模型的知识水平。我们对 1
PDF4 months ago
利用匿名的众包平台实现大型语言模型的个性化评估
我们提出了一个新的匿名众包评估平台 —— 冰见，旨在评估大型语言模型的性能。该平台不仅支持对模型的总体能力进行集中评估，而且提供了一个开放的评估通道，使用户有机会根据个性化和可能更广泛的需求向模型提交问题。此外，我们的平台引入了个性化评估场
PDF4 months ago
评估大型语言模型在高考基准测试上的表现
这篇论文介绍了 GAOKAO-Benchmark，它是一个直观的基准测试，利用中国高考考试的问题作为测试样本，对大型语言模型进行评估的一种方法。我们采用基于零 - shot prompts 的方法来分析模型的准确率和评分率，发现 ChatG
PDFa year ago
Obj2Sub: 无监督将客观问题转化为主观问题
本文提出了一种新颖的混合非监督学习方法，采用基于规则的方法和预训练的稠密检索器，自动将客观问题转换为主观问题，从而测试学习者的理解程度。实验证明，相对于现有的数据驱动方法，本文的方法可以将召回率和准确率提高 36.45%。
PDF2 years ago