BriefGPT.xyz
Ask
alpha
关键词
algorithm identification accuracy
搜索结果 - 1
MalAlgoQA:评估反事实推理能力的教育方法
该论文介绍了 MalAlgoQA,这是一个用于评估大型语言模型(LLMs)通过教育方法的反事实推理能力的新型数据集。该数据集包含数学和阅读理解问题,每个问题都附有四个答案选项及其对应的解释。我们关注不正确答案解释,称为 “malgorith
→
PDF
10 days ago
Prev
Next