Dec, 2023

ACCL+:基于 FPGA 的分布式应用集合引擎

TL;DR为了方便开发分布式 FPGA 应用,本文提出了一种开源的多功能基于 FPGA 的集体通信库 ACCL+,可以作为 CPU 应用的集体卸载引擎,同时通过两个应用案例展示其在分布式深度学习推荐推理中的关键作用和高效性能。