Jul, 2020

利用叙述性教学视频的语境化物体嵌入

TL;DR该论文提出了一种从自动转录的指导视频中学习上下文化对象嵌入(COBE)的新框架,利用语言的语义和组成结构,通过训练视觉检测器预测对象的上下文化词嵌入来实现对象状态和上下文的识别,实验表明在少样本和零样本学习方面非常有效。