May, 2024

基于自适应动态融合网络的基于语言的时尚检索系统

TL;DR在语言和时尚图像检索的领域中,使用参考图像和相应的文本描述来定位所需的时尚项目是一个有趣的挑战。本文提出了一种自我提取的动态融合网络,通过同时考虑路由路径的一致性和模态特定信息,动态地组合多粒度特征。我们的方法包括两个新模块:(1)具有模态特定路由器的动态融合网络,通过考虑参考图像和修改文本的不同语义和分布,实现了灵活的路由确定;(2)自我路径提取损失,通过使用先前路径信息逐步改进查询的路径决策,有利于特征提取和路由的优化。大量实验证明了我们提出的模型相对于现有方法的有效性。