Dec, 2023

LinguaLinked:移动设备上的分布式大型语言模型推理系统

TL;DRLinguaLinked 是一种分散、分布式的移动设备上的 LLM 推理系统,它通过优化模型分配、优化数据传输机制和运行时负载平衡器来提高系统的效率和响应速度。