BriefGPT.xyz
大模型
Ask
alpha
关键词
dnc
搜索结果 - 2
平均梯度外积:作为深度神经崩溃机制
Deep Neural Collapse(DNC)是深度神经网络(DNNs)中最终层数据表示的令人惊讶的刚性结构。本研究提供了实质性的证据,表明 DNC 主要通过平均梯度外积(AGOP)进行深度特征学习形成。我们证明了权重的右奇异向量和奇异
→
PDF
4 months ago
EMNLP
收集多样化的自然语言推理问题用于句子表示评估
该研究从 13 个不同领域的语料库中抽取出超过 50 万个标记好的内容假设对,并将它们重新组织成一个名为 DNC 的大规模多样化自然语言推理数据集,以探究语句表示在不同类型推理问题中的表现。
PDF
6 years ago
Prev
Next