BriefGPT.xyz
大模型
Ask
alpha
关键词
large-batch optimization
搜索结果 - 3
离线强化学习中的 Q-Ensemble 方法:不是扩大模型规模而是扩大训练批次
本研究在深度离线强化学习方法中探讨了大批量优化的应用,提出采用适当的学习率调整和小批量缩放的方法,可以明显地加快模型训练速度,从而在控制 Q-ensemble 数量、强化对分布外行为的惩罚力度和提高收敛速度等方面产生了积极的效应。
PDF
2 years ago
ScaLA: 通过高效的大批量对抗性噪声加速预训练的基于 Transformer 的语言模型的适应性
通过加入轻量级对抗噪声到大规模优化中,我们提出了 ScaLA 方法,可以加速预训练 transformer 网络的自适应速度,并在保持模型概括能力的同时,取得了与最先进的大批量优化方法相当甚至更高的准确性。
PDF
2 years ago
具有预期超体积改进的多噪声目标并行贝叶斯优化
提出了一种新的采样函数 NEHVI,它通过在 Pareto 前沿上集成期望超体积改进准则的不确定性,从而克服了噪声干扰的限制,特别是在大批量优化环境中表现出卓越的性能。
PDF
3 years ago
Prev
Next