Apr, 2024

关于 GPT 模型的训练数据影响

TL;DR研究了训练数据对 GPT 模型性能的影响,并提出了一种新颖的方法 GPTfluence,通过特征化模拟评估训练实例对 GPT 模型的影响,展示了对未见训练数据的鲁棒泛化能力。