- fruit-SALAD:一种风格对齐的艺术作品数据集,以揭示图像嵌入中的相似性感知
通过介绍一种包含 10000 个水果图像的样式对齐艺术数据集(SALADs),对计算模型在语义类别和样式相似性感知方面的表现进行了定量和质量可解释的比较分析。
- 神经网络中语义和视觉对齐的差异处理
针对视觉相似度与语义相似度不匹配的问题,通过数据增强技术提出了一种混合语义增强方法,利用扩散式语义融合生成两类之间的语义混合,并将其作为扩展的数据集,实验证明该方法可以显著提高模型在语义相似类别的对齐性。
- MMFL-Net: 跨界时尚检索的多尺度和多粒度特征学习
提出了一种新颖的多尺度、多粒度特征学习网络(MMFL-Net),旨在训练一个 C2S 时装视觉相似性的跨领域模型,其中包括对抗域差异的设计和多任务属性识别和分类模块的组合。
- KDD基于多层视觉相似度的个性化旅游景点推荐算法
提出了一种基于多级视觉相似性和自关注机制的个性化旅游景点推荐模型 (MEAL),该模型利用旅客拍摄的照片和用户的交互行为数据来获取最终的用户和旅游景点嵌入向量,并以此为基础预测旅游景点的访问概率。
- CVPR对比对应关系:利用对应关系损失的视频预测
本文提出了一种简单的改变现有图像相似度度量标准的方法,通过使用光流匹配图像并测量对应像素的视觉相似度来使其更加鲁棒性地处理对象位置误差,并应用于各种视频预测任务和视频内插任务中,实现了简单的网络结构,取得了强大的表现。
- CVPR标签并不平等:通过标签分组和协同训练增强半监督学习
本文提出了 SemCo 方法,该方法结合标签语义和联合训练来解决半监督学习中伪标记质量差的问题,该方法在各种 SSL 任务中实现了最先进的性能,例如使用 1000 个标记的样本的 Mini-ImageNet 数据集上提高了 5.6%的准确性 - ECCVDiVA:用于深度度量学习的多样化视觉特征聚合
通过多个互补的学习任务,同时优化训练信号以学习一种单一模型,以实现更强的泛化能力和在多个已建立的深度度量学习基准数据集上的最新性能。
- CVPRPADS:面向视觉相似度学习的策略适应采样
本文提出了一种基于强化学习的自适应采样策略,根据当前学习状态调整采样分布,能够大幅提高三元组损失训练框架的性能。
- 使用类条件胶囊重构技术检测和诊断对抗性图像
本文主要研究通过对输入进行类别有条件的重构来检测对抗样本,使用重构攻击来进攻检测机制,并发现 CapsNets 总是表现更好,进一步诊断 CapsNets 的对抗样本,发现了视觉相似性与攻击成功率之间的高度相关性。
- CVPR通过松弛最优输运和自相似性进行风格迁移
提出基于最优输运和自相似性的风格转移算法 STROTSS,扩展了算法以允许用户对风格图像和输出之间的视觉相似性进行点对点或区域对区域的控制,实验结果表明在保留一定的内容情况下,该算法可提供高质量的样式化效果。
- CVPR超越二元监督的深度度量学习
本文引入了一种基于连续标签的深层度量学习新方法,包括使用连续标签进行三元组损失和适应连续标签的三元组挖掘策略,同时实验结果显示该方法在三种不同的图像检索任务中表现出较优异性能。
- 基于层级结构的图像嵌入方法用于语义图像检索
该研究提出了通过将图像映射到类别嵌入中以学习语义鉴别性特征的方法,从而提高图像检索结果的语义一致性。结果显示在 CIFAR-100,NABirds 和 ImageNet 上,学习到的图像嵌入大大提高了图像检索结果的语义一致性。
- 学习非度量视觉相似度用于图像检索
本文提出通过神经网络建立非度量相似度函数,从而学习图像的相似度度量与提高基于实例的图像检索表现,实验结果表明该方法在一些标准的图像检索数据集上表现出色。
- ICCVAttributes2Classname:一种基于属性的判别式无监督零样本学习模型
本论文提出了一种基于名称的无监督零样本学习方法,通过区别性地学习单词表示,使得类别和属性名称的相似性与视觉相似性相符,突破了传统零样本学习方法依赖属性特征标注的限制,并且能够在纯文本数据上进行训练,实验结果表明该方法在三个基准数据集上取得了 - CVPR上下文视觉相似性
本文提出了概念 “上下文视觉相似度”,并探讨了在图像搜索应用领域的应用。使用三张图片,通过学习各个图像各个维度的特征权重以及重加权后的距离来确定查询图片与正向图片的相似度,以及他们与负向图片的相异度。
- CVPR用于对象检测的深度模型微调的因素
通过利用预训练深度模型进行微调,从而实现多种视觉任务的最佳性能表现,本文研究了许多影响目标检测微调性能的因素,提出了基于视觉相似类群的分层特征学习方案,在不增加测试阶段的计算成本下,本方法在 ImageNet 目标检测数据集上获得了 4.7 - ICCV使用异构二元共现学习视觉服装风格
本研究提出了一种新的学习框架,通过使用 Siamese Convolutional Neural Network 从不同品类的物品图像中学习特征转化,进而发掘不同物品之间的兼容性。研究人员使用来自 Amazon.com 的协同购买数据来建立 - 精细类别分类的子集特征学习
本文提出了一种基于深度卷积神经网络的学习系统,该系统对视觉相似的类别进行聚类,并学习针对每个子集的特定深度卷积神经网络特征,在测试时不需要边界框。在流行的 Caltech-UCSD 鸟类数据集上,实验证明该方法优于最近的细粒度分类方法,无需 - 大规模艺术绘画分类:在正确的特征上学习正确的度量
本文研究了如何提取适当的视觉特征,找到学习这些特征的最佳方法,进而学习绘画之间的相似度,探讨了构建多媒体系统来存档和检索艺术品数字化收藏的相关问题,并提出用于美学上的语义层预测,如预测绘画风格,流派和艺术家,实验结果表明该相似度测量方法适用 - 自主学习神经网络结构
本研究旨在解决大规模多标签视觉识别问题,通过在已训练的神经网络分类器中增加辅助容量的方法,以极小的影响计算规模的前提下,显著提高模型的性能,并采用网络自身的预测作为评估视觉相似性的描述符,将标签空间划分为视觉上相似的实体组,通过增加辅助隐藏