BriefGPT.xyz
大模型
Ask
alpha
关键词
learning rate scheduling
搜索结果 - 3
使用随机梯度下降平滑非凸函数:隐式逐渐优化与最优噪声调度的分析
本文定义了用于 graduated optimization 的一类新的非凸函数,讨论了其充分条件,并对 graduated optimization 算法的收敛性进行了分析。研究发现,带有 mini-batch 随机梯度的随机梯度下降 (
→
PDF
8 months ago
ICCV
SODA10M 挑战赛 2021 -- 持续检测赛道第二名解决方案
介绍在自监督学习下连续物体检测的方法,基于 ResNet50-FPN 模型,在模型校准、任务特定的重放机制、学习率调度、使用原始图像尺度等方面进行了多项改进,提高了大型和小型物体的性能,并在 SODA10M 比赛中获得了第二名。
PDF
3 years ago
仅需简单微调:通过对抗微调实现鲁棒深度学习
本研究提出了一种基于缓慢上升和快速下降型学习率调度策略的对抗微调方法,该方法通过有效的学习率调度策略显著降低了计算成本,同时提高了深度神经网络的准确性和鲁棒性。 实验结果表明,该方法在 CIFAR-10,CIFAR-100 和 ImageN
→
PDF
4 years ago
Prev
Next