BriefGPT.xyz
Ask
alpha
关键词
general-purpose ai systems
搜索结果 - 2
用心理测量评估通用人工智能
人工智能(AI)从任务特定到通用系统的发展,逐渐趋向于与人类的多样性。为了确保 AI 系统得到充分的评估,本文建议将心理测量学作为评估通用 AI 的核心,并提出相应的框架。
PDF
8 months ago
衡量大型语言模型可扩展监督的进展
本篇论文讨论了监督强于人类水平的 AI 系统的问题,提出了一个实验设计并探讨如何通过与打破传统 AI 的对话式助手交互的方式来解决这个问题。在基于两个问答任务进行的试验中,我们发现,通过这种方式监管的人类表现显著优于只使用大语言模型或人类自
→
PDF
2 years ago
Prev
Next