Mar, 2024

Larimar:具有情节记忆控制的大型语言模型

TL;DRLarimar 是一种新颖的、仿脑结构的体系架构,用于增强大型语言模型(LLMs)的分布式情景记忆,实现动态、一次性的知识更新,无需计算昂贵的重新训练或微调。实验结果表明,Larimar 在多个事实编辑基准上达到与竞争对手相当的准确率,甚至在挑战性的连续编辑设置中也表现出色,并且由于其简单、LLM 无关的架构,还具有速度快、灵活性高的优势。我们进一步提供了选择性事实遗忘和输入上下文长度泛化的机制,并展示了它们的有效性。