ICMLJul, 2021

可微分的架构剪枝用于迁移学习

TL;DR本文提出一种新的基于梯度的方法,用于从现有的大模型中提取子结构,通过定义一种新的基于梯度的算法,将架构训练与权重互相独立,重新定义了架构搜索任务,并通过使用两个温度松弛方案来解决它,从现有的大型神经模型中定义一个搜索空间,成功地重新训练,解决不同的任务。