ACLMay, 2024

大规模语言模型的基于令牌的影响训练数据检索

TL;DR提出了 RapidIn 框架,用于估算每个训练数据对大型语言模型生成的影响,通过缓存和检索阶段,压缩梯度向量并支持多 GPU 并行加速,实现了超过 6326 倍的加速效果。