Feb, 2024

批量大小不变的 Adam

TL;DR提出了一种批量大小不变的 Adam 版本,用于大规模分布式环境,在这种环境中,小批量被分割成微批次并在工作节点之间分配。