BriefGPT.xyz
大模型
Ask
alpha
关键词
per-coordinate learning rates
搜索结果 - 1
ICML
通过随机化实现少量 RAM 的大规模学习
采用随机化分离技术,将权重向量投影到粗离散集上,从而将流行的大规模在线学习方法的内存占用量降低 50% 以上;采用随机计数可以实现每个坐标单独的学习速率,具有很好的内存性能表现。这些内存节省方法的效果与精确的变体相当,且实验证明这些方法在内
→
PDF
11 years ago
Prev
Next