- 自定位的协作感知
提出了一种新颖的自定位协同感知系统 CoBEVGlue,它通过有效匹配跨代理间的共可见对象,实现更全面、更稳健的协同感知,无需使用外部定位系统。CoBEVGlue 的核心是一个新颖的空间对齐模块,它提供了代理间的相对位姿,从而验证了我们的方 - 大范围灾害中 sUAS 图像中的非均匀空间对齐误差
此研究首次定量研究了小型无人机地理空间图像与先验建筑多边形之间的对齐错误,发现对齐错误是非均匀和不规则的。研究还介绍了一组可供公众使用的图像、建筑多边形和人工生成的、筹划调整的数据集,可用于评估将建筑多边形与小型无人机图像对齐的现有策略。
- 深度展开网络与空间对齐的多模态 MRI 重建
通过在多模态磁共振成像 (MRI) 的重建过程中适当嵌入空间对齐任务,利用深度展开网络来解决模态间不对齐的问题,本文提出了一种新颖的具有空间对齐能力的深度展开网络 (DUN-SA),并通过终端到终端的训练,展示了优于现有方法的重建性能。
- SARA: 区域对齐与区域自适应归一化的可控化妆迁移
本文提出了一种新颖的空间对齐和区域自适应归一化方法(SARA),用于实现细节级的妆容迁移,可以处理大尺度空间错位,并实现部位特定和可调节阴影的妆容迁移。实验结果表明,我们的 SARA 方法优于现有方法,在两个公共数据集上达到了最先进的性能。
- OTS:一种用于历史手稿文本定位的单次学习方法
通过一种新颖的一次学习文本定位方法,即 One-shot learning-based Text Spotting (OTS) 方法,该方法结合了认知研究中的方法,通过空间对齐模块来找到并学习查询图像中最具有区分性的空间区域。同时,引入一种 - CVPR跨视角自我监督学习中学习何处学习
本研究介绍了新方法 LEWEL,该方法通过适应性地聚合特征的空间信息来对齐嵌入向量,并达到更好的特征学习。该方法利用投影头将其解释为每个像素的投影,从原始特征预测一组空间对齐映射,通过这些对齐映射按空间加权聚合特征,因此得到了一系列对齐的嵌 - ICCV双摄像头对齐注意力模块超分辨率
该研究提出了一种使用参考图像进行高保真图像超分辨率的新方法,针对双摄像头超分辨率进行了重点研究,其利用空间对齐操作推广了标准的基于补丁的特征匹配方法。进一步探索了 RefSR 的一种有前途的应用:双摄像头超分辨率,并构建了由智能手机主摄像头 - MMFew-Shot 细粒度图像分类的对象感知长短程空间对齐
该论文提出了一种物体感知的远近距离空间对齐方法,通过 FOE 模块增强前景物体响应、LSC 模块学习可转移的远距离语义对齐和 SSM 模块对查询特征进行短距离精细对齐,以实现在小样本情况下对罕见细粒度目标的检测和识别。
- 从音频 - 视觉空间对齐中学习表示
介绍了一个针对学习自我监督前置任务的音频视频表示方法,通过引入 transformer 架构和空间对齐技术,提高了网络的感知和学习效率,结果表明,该方法在诸如音频视觉对应、空间对齐、动作识别、视频语义分割等多项任务中表现出良好的性能。
- CVPR基于时间组注意力的视频超分辨率
本文提出了一种新颖的视频超分辨率方法,利用分层式的时间信息和注意力机制,在处理大幅运动的视频中具有较好的性能表现。
- 无监督多模式图像配准的几何保持图像到图像翻译
本研究提出一种利用图像到图像翻译网络训练形态转换网络的多模态配准方法,通过单模态指标对图像进行训练,无需对齐模态对即可进行训练,适用于多种模态,实验结果表明该方法高度准确。
- 基于时序残差学习的视频行人重识别
本文提出了一种新颖的特征学习框架,用于视频中的人物再辨识,主要利用视频序列中的适当时间信息和解决运动行人的空间对齐问题,并设计了一个时间残差学习(TRL)模块和一个空间 - 时间转换器网络(ST^2N)模块。经过广泛实验验证,提出的方法在各 - 从非结构化视频中发现和对齐关节物体类别的行为
本文提出了一种利用一组涵盖多个视频的运动模式自动组织松散视频内容的系统,包括行为发现和空间对齐两个步骤。该系统可用于视频索引和检索,并可从互联网视频中学习物体类别的外观或行为。