Dec, 2020

从时间连续图像学习上下文因果关系

TL;DR本文探讨了从视觉信号中学习上下文因果关系的可能性,提出了高质量数据集 Vis-Causal,并展示了通过好的语言和视觉表征模型和充足的训练信号,可以从视频中自动发现有意义的因果知识。