Oct, 2020
利用梯度符号随机失活器优化深度多任务模型
Just Pick a Sign: Optimizing Deep Multitask Models with Gradient Sign Dropout
Zhao Chen, Jiquan Ngiam, Yanping Huang, Thang Luong, Henrik Kretzschmar...
TL;DR本文提出了一种名为 GradDrop 的概率掩码过程,旨在优化多任务和迁移学习设置下的多损失训练,并揭示最优多损失训练与梯度随机性之间的联系。