Nov, 2022

衡量大型语言模型可扩展监督的进展

TL;DR本篇论文讨论了监督强于人类水平的 AI 系统的问题,提出了一个实验设计并探讨如何通过与打破传统 AI 的对话式助手交互的方式来解决这个问题。在基于两个问答任务进行的试验中,我们发现,通过这种方式监管的人类表现显著优于只使用大语言模型或人类自身的表现。