May, 2023

基于交叉模态衔接器的通用高效视觉知识注入预训练语言模型

TL;DR本文提出了一种新的插入式模块 X-adapter,用于将预训练的 VLMs 的对齐视觉和文本知识灵活地融入 PLMs 中,以提高对象 - 颜色推理和自然语言理解 (NLU) 任务性能。