- CVPRXFeat: 轻量级图像匹配的加速特征
我们提出了一种轻量级且准确的资源高效视觉对应体系结构,称为 XFeat,通过重新审视卷积神经网络的基本设计选择以侦测、提取和匹配局部特征来满足对适用于资源受限设备的快速且稳健算法的关键需求。我们的模型是第一个高效提供半稠密匹配的模型,利用对 - 每个镜头都重要:在视频中使用范例进行重复计数
视频重复计数是指推断视频中重复动作或运动的次数。我们提出了一种以样本为基础的方法,通过发现目标视频中重复的视频样本之间的视觉对应关系来进行计数。我们的提出的 Every Shot Counts(ESCounts)模型是一个基于注意力的编码解 - 基于概率松弛的两阶段物体姿态估计范式
提出了一种无匹配点的概率公式,可以同时优化视觉对应和几何对齐步骤,能够更优雅地处理几何感知场景,如纹理不清晰、对称和 / 或遮挡物体和场景等存在多个可能的正确姿势解决方案的情况。
- 孪生掩模自编码器
本文提出了基于 SiamMAE 的 Siamese Masked Autoencoders 方法,使用视频学习视觉对应关系,通过对大量补丁进行遮罩,鼓励网络集中学习运动对象和学习以对象为中心的表示。该方法可以在不依赖数据增强或用于防止表示崩 - CVPR可学习的物体中心全局优化在 3D 视频物体检测中的应用
该研究探讨了长期时间视觉对应优化在三维视频对象检测中的应用,提出了具有目标中心时间对应学习和特征度量对象绑定调整的 BA-Det,取得了各种设置下基线 3D 检测器的 SOTA 性能。
- 语义感知细粒度对应
本文提出了一种语义感知的细粒度对应方法,该方法融合了基于图像和基于像素的自监督学习方法来提高任务的性能,在视频对象分割、人体姿态跟踪和人体部分跟踪等视觉对应任务上超过了以往基于卷积神经网络的最新自监督方法。
- CVPR面向自监督对应学习的区域感知内外视频重构
利用 LIIR,一种局部感知的交叉和内部视频重建框架,填补了自监督一致性学习中的三个缺失部分,即实例区分、位置感知和空间紧凑性,从而学习视觉对应关系。
- ICCV视频对应学习的联合时空图中的邻居关系建模
本研究提出了一种自监督学习方法,从未标记的视频中学习可靠的视觉对应关系。 所提出的方法将对应关系形式化为在联合空间 - 时间图中寻找路径的过程,并在此基础上利用循环一致性来识别图像中的动态对象,从而实现了中心 - 邻居对之间的潜在关联学习。 - ICCV动画变形器:通过段匹配实现视觉对应
该研究提出了用基于 Transformer 的 AnT 体系结构进行手绘动画分割的研究,以便通过线圈而不是像素级别的对应来学习运动学关系,使用实验对比表明所提出的 AnT 可以用于实际的机器学习协助下的动画着色,这种方法提高了效率而且易于使 - ICCV功能对应问题
本文介绍了一个新问题:功能对应关系,并提出了一种模块化的任务驱动的表示方法。同时,介绍了一个新的数据集 FunKPoint,其记录了 10 个任务和 20 种对象类别的地面真实对应关系。作者还表明,由于他们的学习表示不受语义约束,因此可以在 - AAAI自监督对应学习的对比转换
本研究旨在通过使用野外未标记视频进行自监督学习的视觉对应关系。我们的方法同时考虑了可靠对应估计的视频内部和视频间的表示关联。
- ECCV学习组合超列以进行视觉对应
文章提出了一种新方法,名为 Dynamic Hyperpixel Flow,利用条件图像在深度卷积神经网络中选择少数相关层,动态构成有效特征,从而在语义对应任务中取得了表现显著的提升。
- 时空对应作为对比随机游走
该论文提出了一种简单的自监督方法来学习从原始视频中获取图像匹配的表达方式,通过构建空间时间图来预测连接预测匹配,并通过回文构造的图优化表示方法。
- 联合任务自监督学习用于时间对应
本文提出了一种利用自我监督方式从视频中学习可靠密集对应关系的方法,通过跟踪大规模图像区域和建立连续视频帧之间的像素级细粒度关联来实现。该方法利用共享的帧内亲和矩阵来建模两个任务之间的协同作用,在区域级别和像素级别同时建模视频帧之间的转换,从 - CVPR从时间的循环一致性中学习对应关系
本文提出了一种自监督的方法,通过循环一致性来学习视觉对应关系,应用其学到的特征图表示可以在一系列视觉对应任务中取得较好的性能。
- AutoScaler:用于视觉对应的缩放 - 注意力网络
本论文提出了 AutoScaler,一种通过权重共享的特征网络计算多尺度特征图并通过注意力网络实现最佳组合,从而在视觉对应任务中实现自适应感受野大小的规划。该网络与典型的光流和语义匹配基准方法相比具有更优秀的结果,并可推广至改善手动指定的描