Oct, 2023

BLoad:增强神经网络训练的高效顺序数据处理

TL;DR使用新的训练方案,能够在不同大小的序列上实现高效的分布式数据并行训练,最小化内存消耗,并在实验中取得了整体性能的提升。