关键词hyper-parameters
搜索结果 - 55
  • 为什么要进行平面搜索而不是线搜索?SO 友好的神经网络允许对每一层进行每次迭代的学习速率和动量率优化
    PDF9 days ago
  • 值为基础的深度强化学习中超参数选择的一致性
    PDF9 days ago
  • 通过协同作用的主动学习和模型选择探索测试时间人机协作适应性
    PDFa month ago
  • 动态专家混合:高效 Transformer 模型的自动调优方法
    PDFa month ago
  • 利用反向对齐特征更新引导深度特征学习
    PDF7 months ago
  • Adam 算法在无界梯度和仿射方差噪声下的高概率收敛性
    PDF8 months ago
  • 公私梯度耦合可证明地改善优化
    PDF9 months ago
  • AdaPlus: 将 Nesterov 动量和精确的步长调整与 AdamW 基础相结合
    PDF10 months ago
  • MOPO-LSI:用户指南
    PDFa year ago
  • 预测 Grokking 早期发生:深入探究 grok 模型的损失景观
    PDFa year ago
  • 基于方差保持的插值扩散模型用于语音增强
    PDFa year ago
  • 基于预训练 ASR 模型的低资源语音转文本翻译策略
    PDFa year ago
  • 正则化在尖锐度感知极小化中的关键作用
    PDFa year ago
  • ICLR通过聚合解决无监督域自适应中的参数选择问题
    PDFa year ago
  • 强化学习中的经验设计
    PDFa year ago
  • 无监督跨语言分词的自调参数
    PDFa year ago
  • 神经网络剪枝状态为何如此混乱?关于公平性,比较设置和网络剪枝中的可训练性
    PDFa year ago
  • ProSiT!使用渐进相似度阈值进行潜变量发现
    PDF2 years ago
  • 帕累托测试在有效控制多重风险方面的应用
    PDF2 years ago
  • 语义分割的无监督域自适应重新思考
    PDF2 years ago
Prev