ACLJun, 2023

可靠性检查:对 GPT-3 在敏感话题和提示措辞方面响应的分析

TL;DR研究分析了大型语言模型对敏感主题的反应和提示措辞对模型反应的影响,结果显示 GPT-3 在肯定的阴谋论和刻板印象方面反应正确,但在常见的错误观念和争议方面则会出现错误,暴露出其不可靠性。