EMNLPDec, 2022

针对虚构视觉语言推理任务的动作 - 效果动力学学习

TL;DR通过使用编码器 - 解码器架构、模态分析器和场景图问题解答模型,我们提出了一种新的学习策略,可以提高关于行动效果的推理能力,并在 CLEVR_HYP 数据集上对我们的系统进行了评估。