Apr, 2024

EventLens: 利用事件感知预训练和跨模态链接提升视觉常识推理

TL;DR通过引入事件感知预训练辅助任务和跨模态链接,并使用指令式提示和任务特定适配器来提高大型语言模型在视觉常识推理任务上的效果。