Oct, 2020

利用梯度符号随机失活器优化深度多任务模型

TL;DR本文提出了一种名为 GradDrop 的概率掩码过程,旨在优化多任务和迁移学习设置下的多损失训练,并揭示最优多损失训练与梯度随机性之间的联系。