Jul, 2020

HyperGrid: 具有网格可分解超投影的高效多任务Transformer

TL;DR本文提出了一种名为HyperGrid的新型多任务学习方法,其基于一个可分解的超网络,通过学习全局(任务无关)状态和本地(任务特异性)状态之间的相互作用和组成来将加权矩阵的不同部分专门用于不同的任务。实验结果表明,使用这种方法可以在GLUE和SuperGLUE基准测试中实现T5模型的强大性能。