Oct, 2023

大型语言模型中的内部知识偏差发现

TL;DR通过引入一种全新的、纯粹基于提示的方法,本文揭示和分析大型语言模型中隐藏的社会偏见,为提高自然语言处理系统的透明度和促进公平性做出了贡献。