Apr, 2022

WikiDiverse:一个多模态的实体链接数据集,具有多样化的上下文主题和实体类型

TL;DR本研究提出了 WikiDiverse,一个高质量的人工注释的 Multimodal Entity Linking(MEL)数据集,利用该数据集提出了一系列好的基于 intra-modality 和 inter-modality attentions 的 MEL 模型,比现有的 MEL 模型更充分利用图像的视觉信息,并通过大量实验分析了不同模态在 MEL 任务中的贡献。