May, 2024

多模态自适应推理与任意时刻提前退出的文档图像分类

TL;DR本研究提出了一种多模态早期退出模型设计,旨在在可视化丰富的文档理解(VDU)任务的可扩展生产环境中实现预测性能和效率之间的 Pareto 最优平衡。通过一系列实验证明,我们的方法与传统的退出策略相比,在改善了性能效率权衡方面取得了显著的改进。该研究对于提高 VDU 应用的性能和效率具有实际意义。