Apr, 2024

基于预训练多模态大模型的动态自适应多尺度蒸馏,用于高效的跨模态表示学习

TL;DR为了在计算资源有限的环境下部署高级多模态技术,我们提出了一种从预训练多模态大模型中动态自适应多尺度蒸馏的方法,通过仅使用输出特征和原始图像级信息来优化模型,显著降低复杂性和训练成本,实现了跨模态检索任务的最先进性能。