CVPRFeb, 2023

PA&DA: 为一致的 NAS 联合采样路径和数据

TL;DR借助权重共享机制,一次性 NAS 方法训练超级网络,然后继承预训练权重以评估子模型,这在很大程度上降低了搜索成本。然而,我们发现,在超级网络训练期间,权重共享会导致梯度下降方向不同,并且存在较大的梯度方差,该论文的方法旨在通过联合优化 PAth 和 DAta 的采样分布,明确最小化超级网络训练的梯度方差,使用梯度范数进行路径和训练数据的重要性采样策略,从而实现更加一致的 NAS。