Mar, 2023

语言模型合作性可扩展评估

TL;DR本文探讨了基于预训练语言模型的 AI 系统在协作问题上的行为,并通过众包和模型生成场景进行评估和测试,最后提供了一组生成场景的数据集和模型评估结果。