BriefGPT.xyz
大模型
Ask
alpha
关键词
orthogonality of gradients
搜索结果 - 1
ICML
视觉 Transformer 中的多样特征学习以提高泛化性能
通过修剪与不必要特征相关的注意力头和鼓励输入梯度正交性,我们提出一种方法提高深度学习模型对分布变化的适应性并增加特征的多样性和互补性。
PDF
10 months ago
Prev
Next