该研究论文介绍了一种基于类别排除的动态推理方法,通过在中间层分配分类器并利用其学习到的特征排除尽可能多的无关类别,从而显著降低深度神经网络在推理中的计算成本。
Sep, 2023
本文探讨了如何在限制精度降低的同时,通过减少推理情况下的查询数量 Q,进一步提高 Perceivers 的效率,以解决网络复杂度和推理时间的问题。
May, 2022
本文介绍了 Perceiver 模型,它利用了不对关系进行假设的 Transformer,同时还能在处理非常大的输入时进行规模扩展,通过迭代地将输入压缩到一个紧凑的潜在瓶颈中,并且在图像、点云、音频、视频和视频 + 音频等多个模态的分类任务中达到了与最佳模型相当的性能。
Mar, 2021
本研究提出了一种高效的统一框架 D2BNet,该框架可以同时解决多个常见的感知任务,如实例分割、语义分割、单目 3D 检测和深度估计,并在 nuScenes 和 Cityscapes 等数据集中实现了与以往作品相当的结果和最佳结果。
Jun, 2023
本研究提出了一种多模态早期退出模型设计,旨在在可视化丰富的文档理解(VDU)任务的可扩展生产环境中实现预测性能和效率之间的 Pareto 最优平衡。通过一系列实验证明,我们的方法与传统的退出策略相比,在改善了性能效率权衡方面取得了显著的改进。该研究对于提高 VDU 应用的性能和效率具有实际意义。
May, 2024
通过提出一种名为 MuE 的新颖的早期退出策略,可以在编解码器中动态地跳过图像和文本多模态的不同层,从而提高推理效率,该方法可将预期推理时间缩短 50%和 40%,同时保持高达 99%和 96%的性能。
Nov, 2022
本文提出了一种早期预测机制 'Exit Predictor',通过引导某些明显 “困难” 的数据样本绕过早期出口的计算,从而降低设备边缘混合推理系统中早期退出网络的设备计算负担。同时,还考虑了通信带宽的变化,在延迟感知的边缘推理中通过几个简单的回归模型来调整 Exit Predictor 的预测阈值和早期退出网络的置信度阈值,以适应不同带宽条件下推理的需求。实验结果表明,Exit Predictor 对于早期退出网络在准确性和设备计算负担之间取得更好的折衷效果。与基线方法相比,在不同带宽条件下,提出的延迟感知的边缘推理方法具有更高的推理准确性。
Jun, 2022
通过使用早期退出结构,我们研究了用于大词汇语音识别的动态模型,这些模型可以根据可用资源和识别性能自动调整其计算成本。与以前的工作不同的是,我们不仅使用预训练的骨干网络,还使用早期退出结构从头开始训练模型。通过在公共数据集上的实验证明,与使用较少编码器层或使用预训练模型相比,从头开始的早期退出结构不仅保持了性能水平,还提高了任务准确性。此外,我们还研究了一种基于后验概率的退出选择策略,作为基于帧熵的替代方案。
通过在解码层执行动态提前退出的方法(DEED),提出了一种多退出的编码器 - 解码器变换器模型,其能够在保持精确性的同时减少推理延迟。
Nov, 2023
利用动态配置的早期退出框架,在深度学习中实现了可伸缩性和压缩技术,显著减少计算复杂度并提供实时配置和精细的性能调节能力。
Mar, 2024