Dec, 2022

协同下降的分布式多任务微调

TL;DR本文提出了一种名为 ColD Fusion 的方法,该方法将多任务学习的好处与分布式计算相结合,从而产生与 RoBERTa 甚至以前的多任务模型相比优异的性能。