BriefGPT.xyz
Ask
alpha
关键词
generalization improvement
搜索结果 - 5
CVPR
友好的锐度感知最小化
SAM 的关键组件有助于改进模型泛化性能,而 F-SAM 则通过移除全梯度成分并利用随机梯度噪声来进一步提高模型的泛化性能。
PDF
4 months ago
分布式深度学习的二次同步规则
使用分布式深度学习和数据并行 ism 方法,通过提出基于理论的使用二次同步规则(QSR)来动态确定本地梯度方法中的一个超参数 H 的值,以提高泛化性能。在 ImageNet 上的实验结果表明,使用 QSR 能够持续改善测试准确性,并且相比标
→
PDF
8 months ago
探索神经坍塌时的泛化行为
深度神经网络中神经崩溃现象及其对泛化性能的影响,以及多类支持向量机、非保守性泛化等的理论解释与实验观察。
PDF
9 months ago
ICLR
本地 SGD 何时、为何比 SGD 泛化性更好?
本文基于随机微分方程(SDE)模型解释了为什么(和何时)局部 SGD 具有更好的泛化性能,并证实具有较小的学习率和足够长的训练时间是取得泛化性能提升的必要条件。
PDF
a year ago
ICCV
S$^3$VAADA: 虚拟对抗主动领域自适应的次模子集选择
本文提出了一种新的无监督领域自适应方法 S^3VAADA,通过引入新颖的子模块准则来选择最大的信息子集来标记,增强了基于簇的 DA 过程,并通过新的改进有效地利用所有可用的数据来提高目标领域问题的泛化性能。在具有不同程度的领域转移的数据集上
→
PDF
3 years ago
Prev
Next