Jan, 2019

Action2Vec: 一种跨模态嵌入式行为学习方法

TL;DR本研究提出了一种新型的跨模态 embedding 空间 ——Action2Vec,该方法将语言线索与视频剪辑的时空特征结合起来,并使用分层循环网络捕获视频特征的时间结构。我们使用联合损失训练嵌入,将分类准确度与 Word2Vec 语义相似性相结合。通过零样本动作识别和两项新颖的类比测试,我们评价了 Action2Vec 模型,并在三个标准数据集上获得了最先进的结果。同时,我们是首个将动词和动作视频组合成联合 embedding 空间,并在分布语义上进行全面评估的研究。