Sep, 2021

基于Transformer网络的梯度自适应辅助任务选择方法——GradTS

TL;DR本研究介绍了基于Transformer的梯度计算的自动辅助任务选择方法GradTS,在八种自然语言理解任务中将MT-DNN的效果从0.33%提升到17.93%,且时间更节约且具有普适性。