BriefGPT.xyz
Ask
alpha
关键词
optimized training
搜索结果 - 2
BLoad:增强神经网络训练的高效顺序数据处理
使用新的训练方案,能够在不同大小的序列上实现高效的分布式数据并行训练,最小化内存消耗,并在实验中取得了整体性能的提升。
PDF
9 months ago
关于多语言下鲁棒的增量学习
利用来自各种语言的数据,我们提出了一种方法,通过数据增强和优化训练,实现在数十个微调步骤上的增量式学习,我们的增强策略无需保留到以前的训练数据,适用于有隐私约束的情况。
PDF
2 years ago
Prev
Next