CVPRNov, 2020

学习视觉语义嵌入的最佳池化策略

TL;DRVisual Semantic Embedding 使用多模态特征进行复杂的嵌入,但该研究发现,全局池化函数(例如最大池化)的简单选择优于这些复杂的模型,因此,它们提出了一个名为 GPO 的广义池化运算符来自动适应不同特征的最佳池化策略,并将其扩展到 VSE 模型中以获得最佳结果。