关键词hessian
搜索结果 - 48
  • 高维分析揭示保守的锐化和随机稳定边缘
    PDF2 months ago
  • 为什么变形器需要 Adam:从 Hessian 的角度看
    PDF4 months ago
  • LLM 模型的无痛二阶微调:基于黑塞矩阵的零阶优化器
    PDF4 months ago
  • 迈向量化 Adam 的预处理效果
    PDF5 months ago
  • 被忽略的 Hessian 成分解释了在锐度正则化中的谜团
    PDF5 months ago
  • 关于步长调整和渐进锐化之间的相互作用
    PDF7 months ago
  • MM大深度量子神经网络中的动力学相变
    PDF7 months ago
  • SmoothHess: 通过斯坦・引理实现 ReLU 网络特征交互
    PDF8 months ago
  • 基于信息论的随机梯度优化的置信区间
    PDF8 months ago
  • SHOT: 抑制优化轨迹上的 Hessian 对于基于梯度的元学习
    PDF9 months ago
  • 基于锐度感知的最小化与稳定边缘
    PDF9 months ago
  • ICCV理解 Hessian 对齐用于领域普适性
    PDF10 months ago
  • mL-BFGS: 基于动量的分布式大规模神经网络优化的 L-BFGS
    PDFa year ago
  • 深度矩阵分解中平坦正则化的归纳偏差
    PDFa year ago
  • ADLER -- 一种基于海森矩阵的自适应学习速率策略
    PDFa year ago
  • 寻找局部极小值点的双时间尺度外推法
    PDFa year ago
  • 关于光滑性和等周性下 Metropolis-Adjusted Langevin 算法混合的简单证明
    PDFa year ago
  • 通过拓扑排序进行因果发现的扩散模型
    PDF2 years ago
  • ICLR自稳定性:梯度下降在稳定边缘的隐性偏差
    PDF2 years ago
  • 用于高效数据处理的自适应二阶子集算法
    PDF2 years ago
Prev