BriefGPT.xyz
Ask
alpha
关键词
large batch sizes
搜索结果 - 3
ILASR: 面向生产规模的隐私保护增量学习对于自动语音识别
本文提出了一种用于自动语音识别的隐私保护增量学习框架,使用了未经人类标注的临时数据和大批量训练,显示出该框架在云端环境中的高实时性和实际应用性。该框架提高了生产模型的表现,尤其是在新时间段的新词和短语测试中。
PDF
2 years ago
滞后数据管道的随机优化
该研究文章提出了一种名为 “数据回响” 的新优化方法,通过在等待新数据到达的同时在同一批次上重复梯度步骤来克服大规模并行管道中的性能瓶颈。而且,该方法在凸优化中的随机小批量优化以及在其他正在被大规模并行化的领域中得到了证明,展现出明显的加速
→
PDF
4 years ago
动量算法改进归一化随机梯度下降
本研究提出使用 momentum 相对于 normalized SGD 来解决 non-convex issues,若 objectives 带有有限的第二导数,采用带的动量公式提高了收敛速度,且适用于大规模任务如 ResNet-50 和
→
PDF
4 years ago
Prev
Next