Nov, 2023

FFT:面向事实性、公平性、毒性的 LLM 无害评估和分析

TL;DR通过提出一个新的基准测试 FFT,以测试大型语言模型的无害性,本文对代表性的九个大型语言模型进行了实证评估,研究发现这些语言模型的无害性仍然不理想,为未来研究提供了有启发性的结果。