Sep, 2023

LLMCad: 快速可扩展的设备端大型语言模型推理

TL;DRLLMCad 是一个创新的本地推理引擎,专为高效的自然语言处理任务而设计,通过模型协作实现高速的令牌生成。