BriefGPT.xyz
大模型
Ask
alpha
关键词
short answer questions
搜索结果 - 3
大型语言模型是否能胜任?一项实证研究评估 LLM 评分 K-12 教育中的简答题能力
这篇论文讨论了使用大型语言模型(LLMs)对开放文本短答案问题进行评分的实验,研究了不同组合的 GPT 版本和提示工程策略在标记真实学生答案时的性能表现,并发现 GPT-4 在这方面表现良好与人类级别接近。这一研究对于支持 K-12 教育中
→
PDF
2 months ago
通过可解释的神经符号管道增强多领域自动短答案评分
自动评分短问答题并解释评分决策是当下转换器方法的一项具有挑战性的目标。在 ASAG 中,自动检测评分理由并与逻辑推理相结合已经展现出一种有希望的方向,但主要挑战之一是要求学生回答中存在经过注解的评分理由,而这种注解在现有 ASAG 数据集中
→
PDF
4 months ago
使用预训练语言模型集成的简答评分
本研究探讨了利用 Kaggle 自动化短问题评分数据集,通过微调一系列的小型、基础型、大型预训练 Transformer 语言模型,并训练一个特征模型来测试这些模型的集成的有效性。观察到较大的模型通常表现稍好,但它们仍无法自己达到最优结果,
→
PDF
2 years ago
Prev
Next