关键词high-level semantic information
搜索结果 - 3
- 基于 CLIP 的可见光 - 红外人员再识别的语义发现网络
可见 - 红外人员再识别(VIReID)主要处理来自不同模态的人员图像之间的身份匹配,并通过融合高级语义与视觉特征来弥合模态差距。我们提出了一个基于 CLIP 的语义发现网络(CSDN),通过多模态学习的文本标记和集成文本特征来嵌入丰富的高 - SGNet:一种用于图像分类和物体检测的超类引导网络
本文提出了一种基于超类引导网络的图像分类与目标检测模型,通过引入高级语义信息优化模型的性能,该模型采用两级类别标注包含了超类别和细分类别,使用两种不同的推断策略来预测图像的类别,实验证明了该方法在 CIFAR-100 和 MS COCO 数 - 对解释自由观察注视时显着性和物体中心偏倚假设的调和
研究自然场景中人们的注意力转移,在低层图像显著性和高层语义信息等方面提出了两个看似相互矛盾的提示,其中分析了物体中心偏置的影响,并提出了一种结合低层视觉显著性和物体中心偏置的模型,旨在深入了解人类在观察场景和对象时使用的策略,并展示结合低层