AAAIFeb, 2023

多任务大模型设备调优

TL;DR本文提出了 Device Tuning 方法来提高自注意力模型的计算效率,并通过压缩表示减少设备与云端之间的通信,有效支持多任务学习。