SIGIRApr, 2022

视频检索的模态平衡嵌入

TL;DR介绍了将 MBVR 应用于大型视频平台的实践,该方法采用人工生成的模态混洗样本和基于视觉相关性的动态边距(DM),旨在鼓励视频编码器对每种模态进行平衡关注,通过实验证明了该方法在解决模态偏见问题方面的有效性和高效性。