Jun, 2022

CLiMB: 用于视觉语言任务的持续学习基准

TL;DR本研究介绍了 CLiMB 基准测试,并提出了一种改进的视觉 - 语言 Transformer (ViLT) 模型,用于同时处理多模态任务和单模态任务的连续学习问题。通过实验发现,虽然常见的连续学习方法可以缓解多模态任务学习中的遗忘问题,但并不能实现跨任务的知识转移。该基准测试将有助于研究这个多模态场景下的新型连续学习算法。