Nov, 2022

数据高效调优的多头适配器路由

TL;DR本文提出了 Poly-mu 和 Poly-S 两种新的方法,对比了它们与 Polytropon 方法在多个任务学习中的表现,并发现 Poly-S 方法可以在保持参数少量增加的同时,在三个测试数据集上获得了高达 5.3 个点的平均收益。