BriefGPT.xyz
Ask
alpha
关键词
sequences of varying sizes
搜索结果 - 1
BLoad:增强神经网络训练的高效顺序数据处理
使用新的训练方案,能够在不同大小的序列上实现高效的分布式数据并行训练,最小化内存消耗,并在实验中取得了整体性能的提升。
PDF
9 months ago
Prev
Next