BriefGPT.xyz
Ask
alpha
关键词
larimar
搜索结果 - 2
基于内存的大型语言模型中的针头引线
本文展示了使用增强记忆的大型语言模型(LLM)架构在提高从潜在长上下文中召回事实的能力方面的好处。我们以 LARIMAR 为案例研究,它是最近提出的一种 LLM 架构,通过在 LLM 解码器上增加外部关联内存来增强性能,并在几个长上下文召回
→
PDF
9 days ago
Larimar:具有情节记忆控制的大型语言模型
Larimar 是一种新颖的、仿脑结构的体系架构,用于增强大型语言模型(LLMs)的分布式情景记忆,实现动态、一次性的知识更新,无需计算昂贵的重新训练或微调。实验结果表明,Larimar 在多个事实编辑基准上达到与竞争对手相当的准确率,甚至
→
PDF
4 months ago
Prev
Next