BriefGPT.xyz
Ask
alpha
关键词
orthogonal gradient descent
搜索结果 - 3
SketchOGD:内存高效的持续学习
本文提出 SketchOGD 作为解决连续任务中机器学习模型遗忘的内存高效算法,使用在线素描算法压缩模型梯度,并在理论和实验上进行了评估。
PDF
a year ago
使用正交梯度下降进行调试
探讨了在不必重新训练模型的情况下,如何修复部分故障的神经网络,并使用改进的连续学习算法 OGD 来进行调试,实验证明可以实现消除不良行为和重新学习适当行为的目标。
PDF
2 years ago
正交梯度下降进行连续学习的泛化保证
为了处理深度神经网络在连续学习环境下的灾难性遗忘问题,该研究提出了正交梯度下降算法。在神经切向核区间的理论框架下,证明了该算法鲁棒性较高,并推导出了用于连续学习的 SGD 和 OGD 的首个推广限制。最后,研究了 OGD 的局限性,并强调了
→
PDF
4 years ago
Prev
Next