- 基于草图的图像检索的双模态提示
在本研究中,我们提出了一种双模态的提示 DP-CLIP 网络,通过采用自适应提示策略,以有效地适应新类别并捕捉每个目标类别内的独特鉴别线索,从而实现了在零样本和细粒度领域内的检索任务的创新。
- CVPR如何在基于草图的图像检索中处理草图抽象化?
我们提出了一种新颖的抽象感知的基于草图的图像检索框架,能够处理不同级别的草图抽象。通过学习抽象感知特征和粒度级别的抽象理解,我们的方法在标准的草图 - 图像检索任务以及早期检索、法医草图 - 照片匹配和风格不变检索等具有挑战性的场景中表现出 - 面向零样本基于草图的图像检索的模态感知表示学习
零样本学习在机器学习模型中提供了一种有效的解决方案,用于处理未见类别,避免了繁琐数据收集。本文提出了一种新颖的框架,通过对比文本间接对齐素描和照片,避免了对素描照片成对样本的需求。通过从数据中学习明确的形态编码,我们的方法将形态不可知的语义 - 高效 SBIR 模型的配方:将相对三元组损失与批量归一化和知识蒸馏相结合
本研究从多个角度探讨了手绘图像检索领域中存在的问题,并通过提出 Relative Triplet Loss、使用 batch normalization、调整模型容量和知识蒸馏等方法,实现了优化模型并提升了图像检索的表现。
- LogoNet: 一种细粒度网络,用于实例级别的标志草图检索
本研究构建了一个包含 2k 个商标实例的实例级商标草图数据集,并开发了一种基于三重分支 CNN 架构和混合注意机制的细粒度 LogoNet,以准确地检索商标草图。
- CVPR从抽象草图生成照片般逼真的图像
文章提出了一种通过 decoder 使用 StyleGAN 训练生成更加真实的照片,并且通过 autoregressive sketch mapper 和 fine-grained discriminative loss 处理手绘人类草图, - CVPR无数据草图图像检索
该论文提出了一种基于数据自由方法进行绘画图像检索的新模型,通过利用预先训练的分类模型来描述模态之间的关系而不需要任何训练数据,实现了深度学习模型的隐私保护和匿名性,该方法在多个基准测试集上的效果显著优于先前最先进的方法。
- Transformer 和 CNN 都在 SBIR 上击败了人类
本文介绍了以往三元组 SBIR 方案存在的问题,提出了建立具有更好翻转等变性的 SBIR 解决方案的多种方法,并深入评估了每种方法的有效性,揭示了视觉 Transformer 对于 SBIR 任务更加适用,性能比卷积神经网络高得多,引入了第 - CVPRStyleMeUp:面向风格无关的基于草图的图像检索
提出了一种新颖的风格无关的基于变分自编码器的素描图像检索模型,采用元学习框架,可以将每个素描显式地分解为与之对应的真实照片的共享语义内容部分和独特于手绘者的风格部分,并将其动态地适应到任何未见过的用户风格中。实验结果表明,该模型在类别级和实 - 针对细粒度素描图像检索的跨模态层次建模
本文提出一种基于 sketch 的图像检索方法,通过使用跨模态协同和层次结构融合的策略,能够在不同层次的详细程度上匹配 sketch 和照片,并在公共基准测试中取得远超其他方法的性能表现。
- 基于堆叠对抗网络的零样本素描图像检索
本论文提出了一种基于生成对抗网络和连体网络的零样本草图图像检索方法,该方法在标准 ZSL 和广义 ZSL 设置下均获得了显著的提高。
- CVPR零样本基于素描的图像检索生成模型
提出了一种基于概率模型的草图图像检索方法,采用生成模型来生成图像,并使用反向自回归流和反馈机制保证了图像生成的效果,实验结果表明该方法在两个数据集上的表现优于基线方法。
- ICCV零样本基于草图的图像检索中的语义感知知识保留
本文提出了一种名为 Semantic-Aware Knowledge prEservation (SAKE) 的方法,在预训练模型的基础上通过 fine-tunes 和利用语义信息来保留图像检索中先前获得的知识,从而在零样本学习的场景下实现 - CVPR零样本基于素描的图像检索的语义匹配循环一致性
这篇论文提出了一个名为 SEM-PCYC 的零样本草图图像检索模型,通过对视觉信息到语义空间的映射进行对抗训练,以达到维护环路一致性的目的,并且使用生成器输出的分类标准确保了可辨别的视觉到语义空间映射。我们还通过特征选择自编码器结合文本和分 - MM基于领域感知的 SE 网络与乘法欧氏边距 Softmax 在基于草图的图像检索中的应用
本文提出了一个基于注意力机制和差分损失函数(MEMS)的领域感知变换网络(DASE),用于提升基于手绘草图的图像检索系统的准确率,并在两个常用的基准数据集中实验,取得了更好的结果。
- ECCV基于素描的图像检索零样本框架
提出基于生成模型的零样本学习用于手绘图像检索的新方法,在经过大量实验验证后,发现这种方法比现有的方法在检索不同类别的图片时性能更好。
- CVPR零样图像哈希化
本文通过建立一个三网络体系结构的零样本手绘图像搜索算法,利用 Kronecker 融合层和图卷积来缓解手绘图像的异构性,并提出一种生成哈希方案来重建语义知识表示,实现了语义哈希,从而在 Sketchy 和 TU-Berlin 两个扩展数据集 - CVPR基于 Sketch 的视觉搜索中三元组卷积神经网络的泛化和共享
本研究提出和评估了几种三元 CNN 结构,用于在素描和照片之间测量相似度,重点研究网络在有限的训练数据下的分类能力,探究了权值共享、预处理、数据增强和降维等策略,并在 250 个 TU-Berlin 分类数据集上进行训练,结合从互联网上采集