Oct, 2023

动态神经网络的联合推理和推断:JEI-DNN

TL;DR大型预训练模型与微调相结合,在机器学习中逐渐成为主要的架构。早期退出动态神经网络(EDNN)通过允许模型从中间层进行预测(即早期退出),绕过了每个推理所需的资源过多的限制。我们提出了一种连接这两个模块的新型架构,这在分类数据集上带来了显著的性能提升,并且具有更好的不确定性特征。