Feb, 2022

使用无需访问任何训练或测试数据的泛化度量评估自然语言处理模型

TL;DR本文研究了自然语言处理模型中,关于深度神经网络的推广问题,提出了几种新的推广度量标准并作了实证研究。研究表明,通过拟合嵌入矩阵的形状的度量标准与与推广表现有着更强的相关性。