BriefGPT.xyz
大模型
Ask
alpha
关键词
multiple-choice tests
搜索结果 - 4
多项选择阅读理解的问题难度排名
在评估英语学习者时,多项选择(MC)测试是一种有效的方法。本文探讨了自动化方法来对 MC 问题进行难度排序,并比较了任务迁移和零样本学习的方法。结果表明,任务迁移在难度排序方面优于阅读理解,而零样本学习方法在问题难度排序方面比绝对评估和任务
→
PDF
3 months ago
ACL
多项选择测试中的干扰项评估
对多选阅读理解测试中干扰项的质量进行自动评估,包括错误性、可信度和多样性的度量。
PDF
8 months ago
分析多项选择阅读和听力理解测试
本文研究多项选择阅读理解和听力理解测试中需要阅读多少上下文内容才能回答正确,发现自动化阅读理解系统即使没有或只有部分上下文内容的情况下也能比随机猜测表现更好,并提供了内容创作者自动捕捉所需理解和世界知识之间的权衡的方法。
PDF
a year ago
评估 GPT-3.5 和 GPT-4 模型在巴西大学入学考试中的表现
本研究通过分析 GPT-3.5 和 GPT-4 对 Exame Nacional do Ensino Médio 的表现以及不同提示策略的测试,旨在探讨语言模型在解决跨学科知识问题的高风险选择题方面的能力。 2022 年版的 GPT-4 w
→
PDF
a year ago
Prev
Next