BriefGPT.xyz
大模型
Ask
alpha
关键词
adaptive testing
搜索结果 - 4
基于 PLM 的替代模型在 IRT 评估中控制填空测试题目的难度
我们提出了一个使用预训练语言模型作为代理模型进行项目反应理论评估的框架,通过使用排名规则控制缺失项和干扰项的难度水平,有效地控制和评估多选填空测试的难度水平。
PDF
4 months ago
基于自适应语言的心理健康评估和项目反应理论
通过有限的语言回答问题进行迭代估计个体心理得分的自适应语言评估方法(ALIRT)可显著降低问题数量,同时不影响准确性和计算成本。
PDF
8 months ago
LLM 认知能力的高效测量:自适应测试视角
提出了一种采用自适应测试框架评估大型语言模型的方法,该方法可以根据模型的表现动态调整测试问题的难度,从而更准确地估计模型的能力,使得大型语言模型可以与人类进行比较,同时该方法可以使用更少的问题,从而更加高效。对 ChatGPT 等 6 种模
→
PDF
a year ago
ICML
如何在不知道答案的情况下评分 -- 一种用于自适应众包和能力测试的贝叶斯图模型
提出了一种新的概率图模型,用于联合建模能力测试和众包设置中的问题难度、参与者能力和正确答案。并基于期望模型熵的贪婪最小化制定了一种主动式学习 / 自适应测试方案,通过根据以前的答案动态选择下一个问题来实现更为有效的资源分配。实验结果表明,我
→
PDF
12 years ago
Prev
Next