Apr, 2023

LLM 内在状态知道自己在撒谎

TL;DR介绍了一种基于大型语言模型的 “激活函数值” 的真实性检测方法,进一步提高了文本可靠性和实际应用价值。