关键词batch sizes
搜索结果 - 9
  • 大型语言模型在预训练期间如何获取事实知识?
    PDF17 days ago
  • 小批次有利可图?探究批次大小对基于强化学习的实际生产调度的影响
    PDFa month ago
  • AdAdaGrad:自适应梯度方法的自适应批次大小方案
    PDF5 months ago
  • 在联邦学习中利用语言模型的汇聚层输入:超越梯度和先验的隐私攻击
    PDF7 months ago
  • Packrat: 基于 CPU 的 DNN 服务的自动重新配置以降低延迟
    PDF7 months ago
  • Mechanic: 一种学习速率调整器
    PDFa year ago
  • CVPR自监督视频 Transformer
    PDF3 years ago
  • 可切换的规范化用于深度表示学习的规范化
    PDF5 years ago
  • ICML并行 SGD 动态批大小在随机非凸优化中的计算与通信复杂度
    PDF5 years ago
Prev
Next