ACLApr, 2022
建模面向过程 - 多模式机器理解的时态 - 语态实体图
Modeling Temporal-Modal Entity Graph for Procedural Multimodal Machine Comprehension
Huibin Zhang, Zhengkun Zhang, Yao Zhang, Jun Wang, Yufan Li...
TL;DR该研究利用设计的时空跨模态实体图(TMEG)来对多媒体文档进行精细级别的机器理解。在 CraftQA 上进行的综合实验表明了 TMEG 的有效性。