May, 2024

大型语言模型的分布式推理

TL;DR该研究介绍了分布式推理和大型语言模型加速的方法,通过使用分布式推理算法(DSI)可以获得比传统方法更快的推理速度。