BriefGPT.xyz
Ask
alpha
关键词
scalable oversight
搜索结果 - 2
深入探究大型语言模型在逻辑推理中的自我验证能力
这篇论文研究了大型语言模型在逻辑推理中的自我验证能力,主要关注其准确识别逻辑谬误的能力。通过对包含 232 种谬误的数据集进行实验,发现现有的大型语言模型在准确识别谬误的过程中可能存在困难,并可能不能保证自我验证方法的有效性。论文提出了对未
→
PDF
8 months ago
衡量大型语言模型可扩展监督的进展
本篇论文讨论了监督强于人类水平的 AI 系统的问题,提出了一个实验设计并探讨如何通过与打破传统 AI 的对话式助手交互的方式来解决这个问题。在基于两个问答任务进行的试验中,我们发现,通过这种方式监管的人类表现显著优于只使用大语言模型或人类自
→
PDF
2 years ago
Prev
Next