Jul, 2024

关于LLMs内部的普遍真实性超平面

TL;DR通过扩大训练数据集的多样性,研究发现大语言模型中普遍存在一个可以区分正确和错误输出的真实性超平面,从而提供了未来研究的有希望的方向。