ICLRMar, 2024

选择高层特征:来自层次分类网络的高效专家

TL;DR该研究引入了一种新的专家生成方法,它通过将顺序处理通用低级特征与高级特征的并行和嵌套结合起来的新的分层分类网络拓扑结构,实现了动态降低任务和计算复杂度的能力。该方法在资源受限条件下能够选择只有任务相关类别的高级特征,可以显著减少推理成本,对于轻量级和可适应性的网络设计具有前瞻性意义。在动态推理方面,我们的方法可以排除高达 88.7% 的参数和 73.4% 的 GMAC 操作,与比较基准相比,在所评估的案例中,平均减少了 47.6% 的参数和 5.8% 的 GMAC 操作。