大规模图像定位的随机吸引 - 排斥嵌入
通过自监督学习图像的区域相似性,实现了对具有潜在难度的正面图像及其子区域的充分探索,并且在训练和推理中没有额外的参数或手动注释,能够有效地处理当前现有管道中的训练瓶颈
Jun, 2020
本文提出了一种通过两阶段鉴别性重新排列解决数据集多样性问题的大规模地标图像检索的有效流程,该方法基于使用余弦 softmax 损失训练的卷积神经网络嵌入特征空间中的图像,通过 $k$ 最近邻搜索和软投票对检索结果进行排序,然后通过从未通过图像相似性检索的数据集中添加附加样本的方式进行插入,以克服检索图像的低视觉多样性。经过深入的实验结果表明,所提出的方法在挑战性的 Google Landmarks 数据集上明显优于现有的方法。
Mar, 2020
本文提出一种名为 MSBReg 的动态模型,用于图像嵌入的多视角聚类。该模型结合吸引力、扩散力和纠正力,通过对相似图像的嵌入进行优化,能够在多种图像分类和迁移学习任务中表现出色,并可以用于对其他方法进行正则化以提高性能和稳定性。
Jul, 2022
本文旨在设计一种嵌入方法,将描述图像的局部特征 (如 SIFT) 映射到一个更高维的表示中,以解决图像检索问题。我们提出了一种基于函数逼近的新方法,并将逼近得到的嵌入向量聚合成单个表示,以便于图像检索。此外,我们还提出了快速版本的嵌入方法,并在标准公共图像检索基准下分别对嵌入方法和其它方法进行了实验比较,结果表明嵌入方法优于现有的图像检索算法。
May, 2016
本文介绍了一种可解释的图像嵌入方法,通过对已知具有 3D 可视表面重叠的训练示例进行测量,从而学习场景特定的相似度,并通过简单且快速的方式减少了在不同比例下的查询图像匹配和几何验证中的搜索成本。
Aug, 2020
提出了一种高效的端到端方法,用于标注和排序地标图像,采用卷积神经网络将图像嵌入到高维特征空间,并使用视觉相似性分类图像,采用相似性重新排名预测,过滤噪声。使用该方法在 2020 年的 Google 地标识别挑战赛中获得了第一名。
Oct, 2020
提出了一种新颖的算法,用于通过非线性嵌入向量到低维欧氏空间中进行监督判别距离学习,该方法可以被视为核神经网络,并且可以通过类似于线性 Mahalanobis 距离度量学习算法的近似核化得出,该方法的模型参数数量和测试时间评估复杂度均为 O (dD),其中 D 是输入特征的维度,d 是投影空间的维数,在具有数十万个训练对的 CNN 特征的数据集上进行了实证比较。
Sep, 2015
本文提出了一种混合分类 - 检索方案,其中利用 EfficientNet 架构将图像分配到特定的地理单元,并使用训练有素的残差架构将输入图像映射到一个嵌入空间,以最小化相同位置图像的配对测地线距离,然后将两个模块与空间聚类方案相结合,通过搜索 - 单元内的聚合确定最终位置估计。结果表明,该方法的性能非常竞争,在 4 个公共数据集上均能取得新的最优表现。
May, 2021
本研究介绍了邻居嵌入算法族,针对不同的连续流形结构和离散聚类结构之间的权衡关系,以 $t-SNE$ 为例,通过夸张参数来调节吸引力与排斥力之间的平衡,得到了一系列的嵌入,UMAP 算法通过负采样策略降低有效排斥,较高的吸引力偏重于表达连续流形结构,而较高的排斥力偏重于表达离散聚类结构,邻居嵌入算法族可以被放置在这个平衡的关系上,探讨常见的算法在这个关系上的位置。
Jul, 2020
本文提出了一种改进的联合学习框架,包括强鲁棒性嵌入判别器和局部结构约束,来改善 VaDE 聚类方法的两个问题。实验结果表明,我们的方法在各种基准数据集上表现优于现有模型,并且对抗输入具有极强的稳健性,可实际应用于实践。
Dec, 2020