- 基于空间和不确定性意识的精确快速像素检索的超图扩散
该论文介绍了一种新颖的方法,通过超图框架和社区选择技术,提高了图像检索和像素检索的效率和准确性。通过在查询时间中利用本地特征有效地传播空间信息,准确地检索和定位数据库中的对象,从而在图像级和像素级检索中实现了最先进的准确性。
- 适应物体运动模糊的检索方法
我们提出了一种在受到运动模糊影响的图像中进行物体检索的方法,并通过学习鲁棒的表达方式,能够匹配模糊物体与其去模糊版本,我们还提供了首个大规模模糊物体检索数据集,并在多个实验中验证了我们的方法优于现有方法。
- 使用学习排序方法在物理世界搜索引擎中识别日常物体
本文介绍了一种基于人 - 机交互的方法,用于 domestic service robots 在日常环境中按照指令检索目标物体的任务。提出了名为 MultiRankIt 的新颖方法,在此基础上建立了一个新的数据集,并通过实验验证了其在物体检 - HOC-Search: 基于 RGB-D 扫描的高效 CAD 模型和姿态检索
我们提出了一种自动化和高效的方法,用于检索通过移动 RGB-D 相机捕获的场景中物体的高质量 CAD 模型及其姿势,并使用渲染对比和蒙特卡洛树搜索算法实现了物体检索、CAD 模型和姿势估计的快速搜索。
- 学习检测关键点以改善可变形对象的匹配
我们提出了一种新颖的学习关键点检测方法,用于增加非刚性图像对应任务中正确匹配数目。通过利用使用指定描述符提取器匹配注释图像对获得的真实对应关系,我们训练了一个端到端的卷积神经网络(CNN)来寻找更适合所考虑描述符的关键点位置。为此,我们对图 - TactoFind:一种仅基于触觉的物体检索系统
本文研究了在视觉感知缺失,对象形状未知且对象可以自由运动的场景下的物体检索问题,提出了一种使用触觉反馈进行定位、识别和抓取新对象的系统。
- 教授 Transformer 多视图几何的轻触方法
本论文提出了使用极线来引导转换器的跨关注映射,以指导 Transformer 学习多视角几何,并在需要时使其突破自由。实验证明,我们的方法在对象检索方面优于现有技术,而无需在测试时提供姿态信息。
- AAAI寻找我的钥匙 -- 聚合对象的时空实例以实现长时间内的高效检索
该论文提出了一种名为 D3A 的三级层次联合的检测方法来有效地查询唯一物体实例的时空表示,采用递增和递归学习方法来鉴定最佳唯一物体代表关键帧,并允许进行多种查询模式,能在很短时间内实现搜索精度的提升。
- ICCV从未标注的视频中学习对象检测与检索
本文提出一种基于弱监督学习的目标检测和检索方法,通过对视频进行自然主体提取,使用对比采样处理背景拒绝,使用聚类评分算法解决高噪声标签问题,针对 11 个手动标注目标在 5000 帧中的评估结果与弱监督方法进行比较并提供上限参考。
- MultiGrain:用于类别和实例的统一图像嵌入
MultiGrain 是一种适用于图像分类和特定对象检索的网络架构,通过分类和排序损失函数进行联合训练,采用池化层提取高分辨率图像的有用信息,生成嵌入式向量,可以进行目标识别和检索。
- 使用多任务学习残差全卷积网络从航空图像和视频实现车辆实例分割
本文介绍了基于多任务学习网络和残差网络,提出了一种能够同时学习两个互补任务的方法,即分割车辆区域和检测语义边界。为了评估未来的车辆实例分割算法,作者构建了一个新的车辆实例分割数据集并分享了链接。
- 使用点对描述符进行三维点云中物体分类的抗噪声深度学习
为了解决噪声、不规则采样密度和遮挡等点云数据中的物体检索和分类问题,本文提出了一种针对于噪声和遮挡具有鲁棒性且检索准确率高的点对描述符,进一步展示了如何将该描述符用于对象分类的 4D 卷积神经网络,提出了一种能够学习描述符直方图中类别特定聚 - 流形挖掘:无标签度量学习
该研究提出了一种无监督框架,用于针对性地寻找训练样例。该方法仅需要一组与目标应用程序相关的图像和有效的初始表示,其中正样例是单个流形上的远点,而负样例是不同流形上的相邻点。这种方法可应用于预训练网络的无监督微调,用于细粒度分类和特定物体检索 - 基于自然语言的目标描述和检索
本文介绍了一种基于对象描述的联合学习视觉和语言以深入了解对象的方法,并提出了两个新的架构来解决对象字幕和基于自然语言的对象检索单元。研究表明,使用混合的端到端 CNN-LSTM 网络可以有效地解决两个问题,并在推理时间非常快的同时,提供了对 - ECCVCNN 图像检索借鉴 BoW:基于 Hard Examples 的无监督微调
本研究提出了一种用于图像检索的卷积神经网络 Fine-tune 方法,利用最先进的检索和运动结构方法,通过 3D 模型自动获取训练集,采用硬正负样本来提升性能。
- 使用 CNN 激活的积分最大池化进行特定对象检索
本文尝试使用基于 CNN 的图像表示来重新设计目标检索流程,首次在 Oxford5k 和 Paris6k 数据集上效果能够与传统方法一较高下。