Dec, 2023

DocMSU: 文档级多模态讽刺理解的综合性基准

TL;DR本研究提出了一个用于文档级多模式讽刺理解的全面基准测试,并引入了细粒度的讽刺理解方法,有效地将图像特征与文本特征在文档中进行对齐,实验证明该方法可以作为具有挑战性的 DocMSU 的基线方法。