MMAug, 2022

一种特征空间多模态数据增强技术用于文本 - 视频检索

TL;DR本文介绍了利用文本 - 视频检索方法,并结合数据增强技术及多模态数据的方法,对大规模公共数据集 EPIC-Kitchens-100 的测试性能进行提升,灵敏的处理方式能以自然语言查询进行相关视频的查找。