寻找甜点：低资源环境下自适应推理的分析与改进

ACLJun, 2023

寻找甜点：低资源环境下自适应推理的分析与改进

Finding the SWEET Spot: Analysis and Improvement of Adaptive Inference in Low Resource Settings

Daniel Rotem, Michael Hassid, Jonathan Mamou, Roy Schwartz

TL;DR本论文比较了有限训练数据情况下，自适应推断的两种主要方法：Early-Exit 和 Multi-Model，提出了一种名为 SWEET 的 Early-Exit 微调方法，在保持速度相当的情况下，优于 Early-Exit 和 Multi-Model，最终表明 SWEET 同时具备两种方法的优点，并为 NLP 中进一步降低推断成本打下了基础。

Abstract

adaptive inference is a simple method for reducing inference costs. The method works by maintaining multiple classifiers of different capacities, and allocating resources to each test instance according to its difficulty. In this work, we compare the two main approaches for

adaptive inference early-exit multi-model sweet nlp

发现论文，激发创造

学习为动态早退出网络加权样本

本文提出了一种基于样本加权的训练策略，用于桥接训练与测试时 Early exiting 行为的差距，通过联合优化权重预测网络和网络主干模型，在训练期间模拟其在推理期间的自适应行为，从而提高分类准确度和推理效率的权衡。

Sep, 2022

EENet: 适应推理的学习早期退出

本研究提出了一种基于多目标学习的多出口深度神经网络推理框架 EENet，以优化在给定推理预算下的早期退出策略。 EENet 早期退出调度程序优化测试样本分配到不同退出，同时选择退出效用阈值，以满足给定的推理预算，同时最大化性能指标。与现有代表性早期退出技术相比，EENet 可以显着提高性能。

Jan, 2023

选择适合的工具：匹配模型和实例的复杂度

为了更好地优化给定的推理预算，我们提出了一种改进的上下文表示微调方法，它允许神经网络在简单实例中早期 (快速) 地进行神经网络计算，并允许在困难实例中晚期 (准确) 地退出，以交换精度和推理速度，而不需要昂贵的计算资源。

Apr, 2020

动态变压器提供了一种虚假的效率感

本文提出了一种名为 SAME 的攻击框架，重点针对多出口模型的内部预测，有效地降低了各种多出口模型的效率，验证了其有效性和泛化能力。

May, 2023

在资源受限设备上使用早期退出来训练动态模型的自动语音识别

通过使用早期退出结构，我们研究了用于大词汇语音识别的动态模型，这些模型可以根据可用资源和识别性能自动调整其计算成本。与以前的工作不同的是，我们不仅使用预训练的骨干网络，还使用早期退出结构从头开始训练模型。通过在公共数据集上的实验证明，与使用较少编码器层或使用预训练模型相比，从头开始的早期退出结构不仅保持了性能水平，还提高了任务准确性。此外，我们还研究了一种基于后验概率的退出选择策略，作为基于帧熵的替代方案。

Sep, 2023

需要多个退出点：加速统一视觉语言模型的动态提前退出

通过提出一种名为 MuE 的新颖的早期退出策略，可以在编解码器中动态地跳过图像和文本多模态的不同层，从而提高推理效率，该方法可将预期推理时间缩短 50％和 40％，同时保持高达 99％和 96％的性能。

Nov, 2022

早期退出预测的资源受限边缘人工智能

本文提出了一种早期预测机制 'Exit Predictor'，通过引导某些明显 “困难” 的数据样本绕过早期出口的计算，从而降低设备边缘混合推理系统中早期退出网络的设备计算负担。同时，还考虑了通信带宽的变化，在延迟感知的边缘推理中通过几个简单的回归模型来调整 Exit Predictor 的预测阈值和早期退出网络的置信度阈值，以适应不同带宽条件下推理的需求。实验结果表明，Exit Predictor 对于早期退出网络在准确性和设备计算负担之间取得更好的折衷效果。与基线方法相比，在不同带宽条件下，提出的延迟感知的边缘推理方法具有更高的推理准确性。

Jun, 2022

EERO: 早期退出与拒绝选项的有限预算高效分类

本研究提出了一种名为 EERO 的新方法，将早期退出的问题转化为使用具有拒绝选项的多个分类器的问题，以更好地选择每个实例的退出头。实验证明，该方法不仅有效管理预算分配，而且在超思考场景中提高了准确性。

Feb, 2024

加速推理与减少遗忘：早退出网络在持续学习中的双重好处

通过实验证明，早期退出网络和持续学习之间存在内在的协同作用，强调它们在资源受限环境中的实际效用。

Mar, 2024

早期退出网络的自适应推断：设计、挑战与方向

该研究论文介绍了早期退出网络的设计方法和最新进展，比较了与其他高效推理解决方案的优劣，并提出了未来研究的挑战和方向。

Jun, 2021