Sep, 2022

视频时刻检索的多模态跨域对齐网络

TL;DR本文提出了一种用于跨域视频时刻检索的 Multi-Modal Cross-Domain Alignment 网络以及三个模块:域对齐模块、跨模态对齐模块和特定对齐模块,通过联合训练这些模块,实现域内不变和语义对齐的跨模态表示。