BriefGPT.xyz
大模型
Ask
alpha
关键词
textual comprehension
搜索结果 - 1
MaScQA:一个用于研究大型语言模型中材料科学知识的问答数据集
我们基于材料学领域的 650 个具有挑战性的问题,对 GPT-3.5 和 GPT-4 模型在问答、零点提示和思维链激励下的表现进行了评估,并发现 GPT-4 的准确率最高(约为 62%),而与思维链激励相比,没有明显的准确率提高。通过错误分
→
PDF
a year ago
Prev
Next