Nov, 2023

S-LoRA:为数千个并发的LoRA适配器提供服务

TL;DR通过使用S-LoRA系统,可以在单个GPU上或多个GPU上以较小的开销提高吞吐量并使LoRA适配器的数量成倍增加,从而实现可伸缩的运行多个Fine-tuned模型的服务。