- GLADformer:一种用于图层面异常检测的混合视角
GLADformer 是一种多视角混合图级异常检测器,由 Graph Transformer 模块和 band-pass spectral GNN message passing 模块组成,能够有效地捕捉全局异常表征和频谱特征,在图级异常检 - EffoVPR:有效利用基础模型的视觉场所识别
使用自注意力层提取特征进行重新排序,结合 ViT 层用于全局特征生成,并且在具有遮挡、昼夜变化和季节变化的挑战场景中取得了最先进的结果。
- 移动非接触式掌纹识别:多尺度多模型嵌入
将全局和局部特征相结合的新框架可提高掌纹匹配准确性,结合 ViT 和 CNN 特征的基于移动设备的 Palm-ID 系统在 AMD EPYC 7543 32-Core CPU 上以 128 个线程在 18ms 内提取模板,在 0.33ms - 利用渐进条件扩散模型推动姿势引导的图像合成
该研究论文提出了一种渐进条件扩散模型(PCDMs),通过三个阶段逐渐弥合目标姿势和源姿势下的人像之间的差距,并生成高质量、高保真的综合图像。
- ECEA: 可扩展的共存注意力模型在少样本目标检测中的应用
我们提出了一种扩展的共存注意力(ECEA)模块,通过学习局部部分进行推理,从而能够帮助少样本目标检测模型在扩展局部区域到共存区域时快速适应,从而优于现有的少样本目标检测方法,并在 PASCAL VOC 和 COCO 数据集上实现了新的技术水 - 多模态梯度注意力学习用于可解释的组合图像检索
我们提出了一种基于梯度注意的学习目标,用于解决组合图像检索问题。通过引入新的注意力计算技术和学习目标,我们展示了对图像区域进行更准确的定位和改进,并通过标准基准数据集显示了更好的可解释性和竞争性的定量检索性能。
- 全局特征和超列特征之间的跨情境学习的自监督表示学习
我们提出了一种新的自监督框架,利用交叉背景学习全局特征和超列特征之间的一致性,以增强实例之间的关系,实验证明我们的方法胜过现有的最先进方法。
- AAAI动态图上可学习的谱小波,捕捉全局交互
本文提出将可学习的小波图形捕捉到动态图谱中,以提高动态图学习性能。考虑到动态图谱的演化历史,本文的方法能够在全局上更有效地捕获地理图谱,并成功应用于八个标准数据集,显著提升了地理图的动态性学习性能。
- VICRegL:本地视觉特征的自监督学习
本文提出了一种名为 VICRegL 的新方法,该方法可以同时学习好的全局和局部特征,从而在检测和分割任务上取得出色的性能,同时保持分类任务上的良好性能。
- 联合实体 - 关系抽取的两阶段范式
文章提出了一个两阶段范式结合全局特征的跨度模型联合实体和关系抽取方法,实验表明这种方法优于之前的现有模型,并建立了一个新的标准基准。
- MM分层视图预测器:通过无序视图之间的分层预测实现无监督的三维全局特征学习
本文提出了一种名为 Hierarchical View Predictor (HVP) 的基于深度学习的视图模型,以无监督的方式从无序视图中学习 3D 形状特征,并在形状分类和检索方面呈现出超越当前最先进方法的性能。
- ICCVDOLG: 深度正交局部和全局特征融合的单阶段图像检索
本文提出了一种深度正交局部全局信息融合框架(DOLG),通过一步到位的方式将图像的本地信息和全局信息结合起来,有效地解决了图像检索中的相关问题,该模型在经过广泛实验验证后,表现出良好的检索效果。
- ICCV使用重新排序变换器进行实例级别图像检索
本文提出了一种新的模型 Reranking Transformers (RRTs),它可以在有监督的环境下整合全局和局部特征,以重排匹配的图像,从而替代代价较高的基于几何验证的过程。经实验表明,该模型的性能优于以前的重排序方法,且使用更少的 - 学习单个模型,处理多种 JPEG 图像失真质量问题
本研究提出了一种高度稳健的压缩伪像去除网络,它是单模型方法,能够训练处理广泛范围的质量因素,并始终提供优秀或相当的图像伪像去除性能。该网络非常有效地利用了量化表作为训练数据的一部分,并具有两个并行分支,一个用于本地伪像去除,另一个用于提取整 - CVPR2020 EPIC-Kitchens 目标检测挑战赛 DHARI 报告
本研究介绍了在 EPIC-Kitchens 物体检测挑战赛中,通过填充和混合数据等方法,提高了所提出方法的鲁棒性。运用 GRE-FPN、Hard IoU-imbalance Sampler 等技术提取更具代表性的全局物体特征,通过类平衡采样 - ECCV超快速结构感知深度车道检测
提出了一种基于全局特征和行选择的非常快速的车道检测新方法,在两个测试数据集上取得了最先进水平的准确性和速度,甚至可以实现 300 帧以上每秒,比之前最先进方法至少快 4 倍。
- ECCV图像搜索中深度局部和全局特征的统一
该文提出了一个名为 DELG 的新模型,将全局和本地特征统一为一个深度模型,同时提出了一种自编码器的降维技术,该模型在图像检索和识别方面的表现都达到了最新的水平。
- PointDAN:一种用于点云表征的多尺度三维领域自适应网络
本文提出了一种用于点云数据的新型三维领域自适应网络 (PointDAN),通过自适应节点模块和节点注意力模块对局部几何结构和全局特征进行多级联合校准以实现点云数据的三维领域自适应。
- 可学习的树形滤波器,用于保持结构特征转换
本文提出了可学习的树型滤波器,通过利用最小生成树的结构性质来模拟远程依赖关系并保留细节,形成了一个通用的树型滤波模块,实现了具有高效的线性时间算法以减少资源消耗,为语义分割提供了一个统一的框架,与传统的 PSP 块和非本地操作相比,具有更好 - ICCV多层域自适应学习用于跨领域检测
提出了一种多级域自适应模型,通过同时对本地级别特征和全局级别特征分布进行对齐,以解决交叉域目标检测中现有方法对局部特征分布不能有效匹配的问题,并在多种实验中验证了其效果。