Feb, 2024

用于训练数据归因和研究损失景观的梯度草图

TL;DR基于神经网络内在维度的研究,我们提出并研究了一种可扩展的草图算法设计空间,并在训练数据归因、Hessian 谱分析和精调预训练语言模型的内在维度计算三个应用中验证了我们方法的有效性。