Apr, 2024

移植大型语言模型到移动设备以进行问答

TL;DR将大型语言模型部署在移动设备上,使得所有自然语言处理的能力可在设备上使用;LLM 的重要用例是问答系统,可以提供准确和上下文相关的回答给用户的各种查询,并通过将 Orca-Mini-3B 模型的 6 位量化版本应用在 Galaxy S21 智能手机上,实验结果表明 LLM 推理在交互速度下进行,并能给出高质量的与政治、地理或历史相关的用户查询的答案。