Sep, 2023

逆转诅咒:基于 “A 是 B” 训练的 LLMs 无法学习到 “B 是 A

TL;DR该研究揭示了自回归大型语言模型(LLM)中的泛化失败现象,即逆转诅咒,导致逻辑推断的基本失败。通过证据和评估表明 Reversal Curse 在不同模型大小和家族中都是普遍存在的。