BriefGPT.xyz
Ask
alpha
关键词
efficient training algorithms
搜索结果 - 2
无训练无收益:重拾用于基于 Transformer 的语言模型的高效训练算法
本文探讨了三种算法类型 (动态架构、批量选择和优化器) 在训练 Transformer-based 语言模型的效率问题,并发现这些算法并不能比传统训练方法更快的提升训练、验证和下游任务的表现。
PDF
a year ago
多项式网络和因子分解机:新见解和高效训练算法
本文从统一的视角重新审视了多项式网络和分解机模型,提出了高效训练算法,并将参数学习作为低秩对称张量估计问题进行求解。在回归和推荐系统任务中展示了我们的方法。
PDF
8 years ago
Prev
Next