Jul, 2024

DMTG:一次可微分的多任务分组

TL;DR通过多任务分组(MTG)方法,同时识别最佳任务组,并在单次训练中利用高阶任务亲和力完全训练模型权重,以提高训练效率并减轻顺序过程引入的目标偏差,方法通过在自适应网络架构中采用完全可区分修剪问题来表示MTG,通过逐渐修剪连接到所有任务头的任务支(ZN heads)来将N个任务分成K组。