关键词learning rates
搜索结果 - 30
  • Adam-mini: 更少的学习率,取得更多的收益
    PDF10 days ago
  • 初始化对 LoRA 微调动态的影响
    PDF22 days ago
  • ICML优化计算效率:用结构矩阵代替稠密层
    PDF24 days ago
  • 向量值谱正则化学习算法的最优速率
    PDFa month ago
  • FLARE:面向资源受限无线网络的新型联邦学习框架,可调节学习速率
    PDF2 months ago
  • 大规模 $μ$ 转让的探索
    PDF3 months ago
  • 有原则的考虑架构的超参数缩放
    PDF4 months ago
  • 自适应参数选择的核岭回归
    PDF7 months ago
  • 大学习率提高泛化性能:我们所讨论的是多大的学习率?
    PDF7 months ago
  • 广义谱方法的随机特征逼近
    PDF10 months ago
  • 我们并不需要亚当,我们只需要夏娃:关于双学习速率的差异和更多内容
    PDF10 months ago
  • 有效学习率的扩展:早期训练中批量归一化的风险
    PDFa year ago
  • 不含泪的高斯 - 伯努利受限玻尔兹曼机
    PDF2 years ago
  • 利用相关性在低秩偏好强盗中实现更快的学习速度
    PDF2 years ago
  • 标签噪声 SGD 可证明偏爱扁平化全局最小值
    PDF3 years ago
  • 强化学习中纯探索的快速主动学习
    PDF4 years ago
  • 通过 Infimum Loss 实现部分标注的结构化预测
    PDF4 years ago
  • 贝叶斯元先学习:基于经验贝叶斯的方法
    PDF4 years ago
  • ICLR具有动态学习率上界的自适应梯度方法
    PDF5 years ago
  • ICML点对点 ROC 曲线优化的监督相似性学习概率理论
    PDF6 years ago
Prev