BriefGPT.xyz
大模型
Ask
alpha
关键词
gradient re-parameterization
搜索结果 - 1
ICLR
重参数化优化器而非架构
本研究通过梯度重新参数化的方法设计了 RepOptimizers 优化器,将模型特定的先验知识融入最优化器中。在 VGG 风格的平面模型上的实验表明,使用 RepOptimizers 的简单模型性能不逊于复杂的设计模型,并且具有更快的推理速
→
PDF
2 years ago
Prev
Next