CVPRNov, 2018

从识别到认知:视觉常识推理

TL;DR该研究论文旨在推进计算机视觉模型的视觉常识推理能力。研究者针对这一目标,提出一项包含 290k 多选题的新数据集 VCR,并使用基于对抗匹配的方法进行添加问题。通过引入新的推理引擎 - Recognition to Cognition 网络(R2C),该文章对计算机视觉模型的性能进行了分析,并提出未来研究的方向。