Jan, 2024

多模态任务的动态 Transformer 架构

TL;DR我们提出了一种基于 Transformer 的持续学习框架 TAM-CL,用于学习涉及视觉和语言的多模态任务,并通过引入额外参数和知识蒸馏实现任务间的信息交流,以及解决灾难性遗忘问题。该方法在多种挑战性的多模态任务上达到了最先进的性能。