Jun, 2024

Crayon: 基于即时适配混合与边缘-服务器混合推理的定制化设备本地概率有限状态机

TL;DR在移动设备上进行大型语言模型的定制化是一个重要问题,本文提出了一种名为Crayon的方法,通过构建多样化的基础适配器,并将它们融合成一个定制化适配器,从而在不额外训练的情况下实现在移动设备上进行语言模型定制化,此外,本文还开发了一种设备-服务器混合推理策略,可在服务器上处理更复杂的查询或非定制任务,保证了最佳性能和在移动设备上进行定制化的优势。通过建立了一个新颖的基准测试集,本文展示了该方法在语言模型定制化方面的有效性。