EMNLPDec, 2022

基于视觉常识的人类中心 grounding 中的人物查找

TL;DR该研究介绍了一个新的人类常识任务,人类中心共识基础,并创建了一个数据集 HumanCog,并开发了一种强有力的基线方法,强调了丰富的视觉常识和多模式集成的重要性,并提出了未来的工作方向。