Nov, 2022

神经转换器训练:样本级计算减少内存消耗

TL;DR研究了神经转录器的训练过程中内存需求高的问题,提出了一种基于样本的方法来减少内存使用和提高训练效率。在一系列基准测试中表明,比默认批处理计算更具有竞争力,可以在 1024 批处理计算下,仅使用 6GB 的内存来计算 40 秒音频的转录器损失和梯度。