Jul, 2024

揭示大型语言模型中的逐字记忆现象

TL;DR本研究关注大型语言模型在逐字记忆方面的挑战,以及这一现象可能带来的法律和隐私问题。通过在受控环境中继续预训练并注入序列,发现逐字记忆需要非微不足道的重复,并且更高质量的模型检查点更可能进行逐字记忆。研究结果表明,逐字记忆与模型的整体能力密切相关,且现有的去记忆方法往往效果不佳,有可能影响模型质量。