Apr, 2024
EventLens: 利用事件感知预训练和跨模态链接提升视觉常识推理
EventLens: Leveraging Event-Aware Pretraining and Cross-modal Linking Enhances Visual Commonsense Reasoning
Mingjie Ma, Zhihuan Yu, Yichao Ma, Guohui Li
TL;DR通过引入事件感知预训练辅助任务和跨模态链接,并使用指令式提示和任务特定适配器来提高大型语言模型在视觉常识推理任务上的效果。