May, 2022

多模态数据集中视角的重要性

TL;DR本文主张采用注释实践来认识和代表多模式交流的内在透视性,并通过一系列注释实验介绍了在 Multi30k 和 Flickr 30k Entities 数据集上应用 FrameNet 注释的结果,其发现认为:(一)不同语言中产生的相同图片的标题之间的框架语义相似性对于标题是否为另一标题的翻译敏感,以及(二)图片注释对于语义框架是否在存在标题时进行的 ANNOTATION 是敏感的。