May, 2023

文本驱动的少样本领域自适应视觉融合事件检测

TL;DR本研究提出一种领域特定的、可从少量标注的图文数据训练的、可在缺乏可视化背景下合成图像的视觉联想事件检测方法,实验结果表明,在 M2E2 基准数据集上,该模型的性能超过了现有的最先进模型达 11 个百分点。