Mar, 2024

PYRA: 并行激活反馈以提高训练与推断的效率的任务适应

TL;DR我们提出了一种新颖的并行适应重新激活(PYRA)方法,用于训练和推理效率高的任务适应,通过并行产生自适应权重和标记激活策略,以在大规模基础模型中同时保持训练和推理的效率。