ACLApr, 2022

建模面向过程 - 多模式机器理解的时态 - 语态实体图

TL;DR该研究利用设计的时空跨模态实体图(TMEG)来对多媒体文档进行精细级别的机器理解。在 CraftQA 上进行的综合实验表明了 TMEG 的有效性。