Jun, 2020

数据移动即所需:优化 Transformer 的案例研究

TL;DR该研究提出了一种全局优化 transformers 数据传输的方法,通过减少数据传输的步骤,实现了对 BERT 编码器层的训练性能提升 1.30 倍以及整个 BERT 的训练性能提升 1.19 倍。此方法可更广泛地应用于优化深度神经网络,提供了解决性能瓶颈问题的见解。