ACLJun, 2024

记忆曲线的因果估计

TL;DR该研究提出了一种新的、有原则的、高效的方法来估计语言模型中的记忆化,该方法利用经济学中的差异法设计,通过在训练过程中观察模型在一小部分实例上的行为,刻画了模型的记忆化特征,并发现较大模型的记忆化更强、更持久,受数据顺序和学习率的影响,并且较大模型的记忆化趋势可以从较小模型中预测。