Feb, 2023

增强 Once-For-All:关于并行块、跳跃连接和早期退出的研究

TL;DR本文提出 OFAv2,它是 Once-For-All 算法的改进版,它通过包括早期退出、并行块和密集跳连接来改进体系结构,并扩展了训练过程,引入了 Elastic Level 和 Elastic Height 两个新阶段。此外,本文提出适用于多输出网络的新型知识蒸馏技术,并提出了动态教师网络选择的新策略。这些修改使得 OFAv2 在 Tiny ImageNet 数据集上的准确性能比 OFA 原始版本提高了高达 12.07%,同时仍然保持算法的灵活性和优势。