Sep, 2023

利用蝴蝶分解减少 IPU 的内存需求

TL;DR高性能计算从硬件平台的不断改进中受益,在保持合理功耗的同时提供更多的处理能力。智能处理单元(IPU)是一种新型的大规模并行处理器,旨在加速具有大量处理核心和高速内存组件的并行计算。本文研究了如何在 IPU 上实现蝶形结构,并研究了它们与 GPU 的行为和性能的比较。实验结果表明,这些方法可以提供 98.5% 的压缩比,减少对内存的极度需求。在蝶形和像素化蝶形方面,IPU 的实现可以获得 1.3 倍和 1.6 倍的性能改进。我们还在 CIFAR10 等实际数据集上实现了 1.62 倍的训练时间加速。