Jun, 2023

基于模型并行交换的分布式深度学习模型服务

TL;DR本文介绍了一种名为Computron的系统,它利用内存交换来在共享GPU集群上提供多个分布式模型的服务,实现模型并行交换设计,提高资源利用率。