关键词batch sizes
搜索结果 - 9
- 大型语言模型在预训练期间如何获取事实知识?PDF17 days ago
- 小批次有利可图?探究批次大小对基于强化学习的实际生产调度的影响PDFa month ago
- AdAdaGrad:自适应梯度方法的自适应批次大小方案PDF5 months ago
- 在联邦学习中利用语言模型的汇聚层输入:超越梯度和先验的隐私攻击PDF7 months ago
- Packrat: 基于 CPU 的 DNN 服务的自动重新配置以降低延迟PDF7 months ago
- Mechanic: 一种学习速率调整器PDFa year ago
- CVPR自监督视频 TransformerPDF3 years ago
- 可切换的规范化用于深度表示学习的规范化PDF5 years ago
- ICML并行 SGD 动态批大小在随机非凸优化中的计算与通信复杂度PDF5 years ago
Prev
Next