May, 2024

无反向传播多模态在设备上通过云设备协作进行模型适应

TL;DR我们在日益相互连接的世界中,智能设备不断积累大量的个性化多模态数据,迫切需要提供高质量、个性化的设备感知服务。为了克服云端基于微调适应 (FTA) 存在的问题,我们引入了一种革新的通用 On-Device 多模态模型适应框架,通过在云端部署 Fast Domain Adaptor (FDA) 和设备上的轻量级多模态模型,实现了效率和效果的平衡。为了增强跨多模态任务的适应性,AnchorFrame Distribution Reasoner (ADR) 减少了通信成本。我们的贡献体现在 Cloud-Device Collaboration 多模态参数生成 (CDC-MMPG) 框架中,为 On-Device 多模态模型适应 (DMMA) 提供了先驱性的解决方案。广泛的实验证实了我们的方法的效率和效果,特别是在视频问答和检索任务中,推动了智能设备融入我们的日常生活。