Jan, 2022

CLIP-Event: 连接文本和图像的事件结构

TL;DR本文提出了一种对视觉语言预训练模型进行对事件及相关参数角色理解的对比学习框架,并结合文本信息提取技术,利用多个提示函数来构造事件结构,设计基于最优传输的事件图形对齐损失来捕获事件参数结构,通过无监督学习进行预训练,并在零样本的情况下取得了优秀的性能。