Jun, 2024
MMUTF: 统一模板填充的多模态多媒体事件论元抽取
MMUTF: Multimodal Multimedia Event Argument Extraction with Unified Template Filling
Philipp Seeberger, Dominik Wagner, Korbinian Riedhammer
TL;DR通过引入统一的模板填充模型,我们的方法可以连接文本和视觉模态,并通过文本提示实现跨本体转移和事件特定语义的整合。在 M2E2 基准上的实验证明了我们方法的有效性,我们的系统在文本 EAE 上超过当前的最佳方法 7% F1,且在多媒体 EAE 方面表现普遍更优秀。