Jun, 2022

利用语义角色上下文化视频特徵进行多示例文本-视频检索—— EPIC-KITCHENS-100 针对多示例检索挑战赛2022年的应用

TL;DR本研究介绍了我们在2022年EPIC-KITCHENS-100多实例检索挑战中的方法,首先将句子解析为动词和名词对应的语义角色,然后通过自注意力在多个嵌入空间内的三元损失函数利用语义角色语境化视频特征和文本特征,优于强基线方法的标准化折扣累积增益(nDCG),对于语义相似性更有价值,我们的提交在nDCG中排名第三,在mAP中排名第四。