Apr, 2024

线性成本推理变压器的跨体系结构迁移学习

TL;DR通过改变自注意块的设计以实现线性成本推理(LCI),提出了交叉架构迁移学习(XATL)来减少训练时间,并在相同的计算预算内收敛到更好的最小值和 2.6% 更强的模型性能。