Jun, 2023

TrustGPT:大型语言模型的信任度和责任性基准

TL;DR本研究旨在通过引入 TrustGPT,评价 LLMs 在毒性、偏见和价值对齐三个关键领域,以促进更具伦理和社会责任感的语言模型的发展。