ICLRApr, 2024

通过概率推理实现逻辑一致的语言模型

TL;DR通过引入基于原则的概率推理训练目标,本研究改进了大型语言模型的逻辑一致性和新知识推理能力。