Sep, 2023

对广告图像与文本进行对齐以实现准确的跨模态赞助搜索

TL;DR提出了一种简单的对齐网络,通过在广告中映射图像的细粒度视觉部分到相应的文本,实现了跨模态赞助搜索的跨模态对齐和查询 - 广告匹配,在大商业数据集上,该模型性能优于现有的模型 2.57%。