BriefGPT.xyz
Ask
alpha
关键词
cognitive tests
搜索结果 - 2
将认知任务整合进针对大型模型的人工通用智能测试
大型模型的性能评估是保证其能力和应用安全性的必要步骤,而当前的模型评估缺乏一个统一的框架来评估大型模型的多维智能。本文提出了一个全面的人工智能测试框架,包括认知科学和自然语言处理,旨在评估大型模型的智能水平,并通过一系列认知测试来指导其在不
→
PDF
5 months ago
AI 评估:过去,现在和未来
通过描述和评估不同的 AI 系统评估方式,本文首先关注传统的以任务为中心的评估方法,然后提出了能力为中心的新型评估方法,并探讨了几种可能的评估方式,包括从认知测试中衍生的测试和通用心理测量法的更一般方法。
PDF
10 years ago
Prev
Next