Jul, 2024

理解大型语言模型中的记忆:动态、影响因素及其影响

TL;DR本研究解决了大型语言模型(LLMs)记忆训练数据的程度及其对输出可靠性和隐私的影响。作者提出了一种实验框架,通过反复向LLMs展示随机字符串,从而分析模型行为,发现不同模型具有一致的记忆动态,并识别了影响记忆能力的因素及当地前缀和全局上下文的作用。这些发现对LLMs的研究和应用具有重要的影响。