Mar, 2024

MELTing 点:语言变形器的移动评估

TL;DR机器学习中的 Transformers 引领了一场革命,但由于其运行时要求,不能广泛用于移动设备。该研究通过创建自动化基础设施 MELT 来评估大型语言模型在移动设备上的执行情况,并对性能、能效和准确性进行了量化。结果表明,移动设备的执行存在性能差异,LLM 的执行主要受内存限制。量化可以显著减少内存需求,但会带来一定的准确性损失。同时,作者认为生态系统仍处于初级阶段,并预测 NPU 加速和框架设备协同设计是实现有效独立执行的最佳选择。