- 一种基于语义分割的地空图像匹配方法
该论文提出了一种基于语义分析的方法,通过比较地面图像与卫星图像的特征,结合语义分割掩模,实现无 GPS 数据的查询地理定位,并在不同视场上通过对 CVUSA 数据集进行测试表明该方法提升了性能。
- 匹配英语语言地址的方法
通过研究地址匹配任务中的准确率、召回率和准确性指标,我们对地址匹配的最佳方法进行了研究,探究了从基于距离的方法到深度学习模型的各种方法。
- 低维情况下匹配相关高斯几何模型的 Umeyama 算法
通过研究匹配两个相关的随机几何图的问题,我们研究了通过潜在节点排列相互关联的两个高斯几何模型的匹配问题。我们证明了在低维情况下,当噪声参数小于等于 O (d^-3 * n^-2/d) 时,Umeyama 算法能够准确恢复隐藏的顶点对应关系 - 面向数据的机器学习在线市场:从发现到定价
机器学习和数据建立了一个在线市场,设计了算法来自动发现任何机器学习任务的有用数据,并为卖出数据增强的机器学习模型设计了新的定价机制。
- 用 WeaveNet 近似求解双边匹配问题
本文提出了一个设计用于二部图的新型图神经网络(GNN)WeaveNet,它通过保留边信息并密集传递消息来解决匹配问题,该模型在解决有限代理数量的公平稳定匹配问题上达到了与专门设计的优秀算法相媲美的性能。
- ICCV简化框架下可扩展的视频对象分割
本研究提出了一种可扩展的简化 VOS(SimVOS)框架,通过利用单个转换器主干进行联合特征提取和匹配,从而实现了针对准确遮罩预测的更好的目标感知特征学习。实验证明,SimVOS 在流行的视频对象分割基准测试中取得了最先进的结果,即 DAV - ICCV利用图引导的混合匹配提升少样本动作识别
我们提出了一种新的框架 GgHM,通过图神经网络在类原型构建过程中优化类内和类间特征相关性,并设计了混合匹配策略,结合帧级和元组级匹配来分类具有多变量风格的视频。GgHM 在几个少样本数据集上均展现出对比其他基线模型的持续性改进,证明了我们 - 应用扩散模型的局部控制色彩调色板
我们在奇幻卡片艺术领域展示了两种新的编辑过程:调色板转换和区段控制。通过应用指定的参考调色板到特定卡片,调色板转换可以实现艺术样式的巨大变化。通过向量量化、匹配和向量解量化(使用扩散模型)的流水线,我们证明了成功的极端调色板转换。区段控制允 - 拼图:学习组装多个破碎物体
该文章介绍了 Jigsaw 框架,该框架是一种用于将多个部件的物理断裂的 3D 对象组装起来的方法,并且通过分割、匹配和全局对齐的方式来提高其性能。该方法是一种第一次基于学习的方法,专门用于多个部件的 3D 断裂组装。
- 基于机器学习的打车规划调度调查
本文介绍了基于机器学习的打车规划最新发展的全面概述,并提出了一些发展方向。以分类法为基础介绍了各种规划任务和解决方案类型,包括集体匹配、分布式匹配、集体再定位、分布式再定位以及联合匹配和再定位。此外,本文还探讨了许多不可或缺的现实世界数据和 - 实体消歧的另一个通用设置:基本理论
本文将根据实体解析问题(ER),研究匹配和合并函数的性质并基于此将匹配和合并黑盒建模为部分群。通过定义天然偏序,引入四个重要性质并通过选取归纳关系 ,我们证明了部分群是 ER 的另一种一般设置。
- 增强 DETR 收敛和多尺度特征融合的语义对齐匹配
本文提出 Semantic-Aligned-Matching DETR++(SAM-DETR++)算法,通过在同一特征嵌入空间中投影对象查询和编码图像特征以便更容易地匹配具有类似语义的对象。此算法有效地融合了多尺度特征,加速了 DETR 的 - ICCV通过双分支全 Transformer 网络学习跟踪表示
提出了一种仅基于 Transformer 的连体双支路网络,用于目标跟踪。该方法比第一步使用 CNN 提取特征,然后使用 Transformer 融合它们的最佳方法产生更好或可比的结果,在 GOT-10k 和 VOT2020 基准上优于现有 - 具有 Transformer 的多视角立体
本文介绍了一种称为 MVSTR 的网络,利用 Transformer 提取拥有全局上下文和三维一致性的密集特征,对于 Multi-View Stereo(MVS)可靠的匹配至关重要。该网络解决了现有基于 CNN 的 MVS 方法视野有限的问 - CoFiNet:可靠的粗到细的对应关系用于鲁棒的点云配准
本文介绍了一种名为 CoFiNet 的粗糙到精细网络技术,该技术无需进行关键点检测,而是通过权重方案从粗糙到精细地提取点云之间的对应关系并进行匹配。在标准测试中,CoFiNet 在室内和室外场景上都比现有方法表现优越,特别是在 3DLoMa - 通过多样化偏好网络提高推荐匹配的准确性和多样性
本论文提出了一种使用异构图神经网络的推荐系统匹配模块,以提高精度和多样性,通过使用基于邻域相似性的损失来平衡两者。
- ECCV单图像深度预测使特征匹配更易
本论文提出了一种有效提取局部特征的方法,使用基于 CNN 的深度图像,对图像进行预处理和透视校正,以增强 SIFT 和 BRISK 特征的匹配,从而提高 3D 重新定位和多视角重建的鲁棒性。
- SIGIRFashionBERT: 跨模态检索中基于自适应损失的文本和图像匹配
本研究提出了一种 FashionBERT 模型,利用预训练的 BERT 模型作为骨干网络,学习文字和图像的高级表示,在时尚文本和图像匹配中取得了显著的性能提升。
- 句子编码的智能翻译记忆匹配和检索
介绍了一种利用句子编码技术来提升翻译记忆系统中匹配与检索效率的方法,有效地解决了基于编辑距离算法的局限性。
- GLAMpoints: 贪心学习精确匹配点
本文介绍了一种新颖的基于卷积神经网络的特征点检测器 - GLAMpoints-,并将其应用于视网膜图像等领域,证明了 GLAMpoints 在特定领域的正确匹配和注册质量上优于传统检测器和现有 CNN-based 方法。