Apr, 2023

大型语言模型中的紧急和可预测记忆

TL;DR通过对 Pythia 模型套件的记忆行为进行度量和分析,发现中间检查点是模型记忆行为的更好预测因素,同时提供了有关模型和数据记忆得分分布的新颖发现