CVPRMar, 2017

指令视频中的无监督视觉语言引用解析

TL;DR通过学习联合视觉和语言模型,我们提出了一种无监督方法来解决教育视频中的实体指代问题,具有可以显著提高指代解析的能力。