Nov, 2023

是否陷入中等智能陷阱?逆转诅咒的分析与缓解

TL;DR大型语言模型中存在的逆转诅咒问题,训练目标的限制以及对整个上下文的了解程度对其影响,因此提出了一种新的训练方法 BICO 来缓解这一问题。