BriefGPT.xyz
Ask
alpha
关键词
competencies
搜索结果 - 2
核心竞争力视角下的大型语言模型评估调查
从预训练语言模型(PLM)到大型语言模型(LLM),自然语言处理(NLP)领域已经取得了明显的性能提升和广泛的实际应用。为了解决评估 LLM 的困难,这篇论文调查了关于 LLM 评估的多篇论文,并总结了 LLM 的四个核心能力,包括推理、知
→
PDF
a year ago
通过贝叶斯网络建模评估规则:一种实用的方法
本文提出了一种基于贝叶斯网络的方法,利用带有不确定性的逻辑门简化模型,从评估规则中直接推算出学习者模型,可以应用于计算思维技能测试中,并为自适应评估工具和智能教学系统中的快速自动化评估打开了可能性。
PDF
2 years ago
Prev
Next