May, 2023
基于交叉模态衔接器的通用高效视觉知识注入预训练语言模型
Towards Versatile and Efficient Visual Knowledge Injection into Pre-trained Language Models with Cross-Modal Adapters
Xinyun Zhang, Haochen Tan, Han Wu, Mingjie Zhan, Ding Liang...
TL;DR本文提出了一种新的插入式模块 X-adapter,用于将预训练的 VLMs 的对齐视觉和文本知识灵活地融入 PLMs 中,以提高对象 - 颜色推理和自然语言理解 (NLU) 任务性能。