- SparseDet: 一种简单而有效的基于全稀疏 LiDAR 的 3D 物体检测框架
提出了一种基于稀疏查询的 SparseDet 稀疏三维物体检测方法,通过局部多尺度特征聚合模块和全局特征聚合模块,完整地捕捉了上下文信息,提高了代理物体表达能力。实验结果在 nuScenes 和 KITTI 上验证了该方法的有效性。
- 多尺度方向感知网络用于红外小目标检测
提出了一个多尺度方向感知网络(MSDA-Net),首次尝试将红外小目标的高频方向特征作为领域先验知识集成到神经网络中,并通过创新的多方向特征感知(MDFA)模块、多尺度局部关联学习(MLRL)模块、高频方向注入(HFDI)模块等进行完整的特 - 社会团体活动识别中高效注意力变换器的设计与分析
社会群体活动识别研究了使用注意力模块和变压器来生成社会群体特征,并通过优化设计特征聚合和自注意力模块的方法来提高活动识别效果。
- 监控视频中的飞行鸟类目标检测算法
本文提出了一种适用于监控视频中飞鸟对象的飞鸟对象检测方法,该方法通过多个连续图像帧上的飞鸟对象的相关性聚合特征,并利用下采样和上采样设计了一个具有大特征图层的飞鸟对象检测网络来检测特殊的多尺度(主要是小尺度)鸟类对象。最后,应用了 SimO - 联合声音分类和定位神经网络中的特征聚合
该研究讨论了深度学习技术在联合声音信号分类和定位网络中的应用。通过引入特征聚合技术,研究结果表明将特征聚合应用于声音检测神经网络可以提高其性能,特别是在到达方向回归上。
- 多分辨率人脸识别的统一表示学习
提出了 Branch-to-Trunk 网络(BTNet),一种用于多分辨率人脸识别的表示学习方法,通过统一编码器的主干网络和多个分辨率适配器的分支网络组成,提高了微小人脸的可辨识性,同时在输入上缓解了由缩放引入的插值误差,通过分支蒸馏和向 - 基于混合 Transformer 的视频去模糊的长期锐利特征聚合
提出了一种利用混合 Transformer 进行特征聚合的视频去模糊方法,该方法通过利用邻近帧和当前清晰帧恢复模糊帧,对事件驱动视频去模糊也有优秀表现。
- 语义分割的类别特征转换器
利用类别特征转换器(CFT)来探索多阶段特征之间的类别嵌入和转换,通过常见的多头注意力机制学习统一的特征嵌入,并将其动态广播到高分辨率特征,将 CFT 集成到典型的特征金字塔结构中可以在多种骨干网络上展现卓越性能,经过在流行的语义分割基准数 - CoNAN:面向非约束人脸特征融合的条件神经聚集网络
在不受限制和不受控制的环境中从图像集合中进行人脸识别是具有挑战性的,这篇论文提出了一种称为 CoNAN 的特征分布调节方法,通过学习上下文向量对特征进行加权以实现模板聚合,并在长距离自由人脸识别数据集上取得最先进的结果。
- 利用 BEV 表示进行 360 度视觉地点识别
本文探讨了采用鸟瞰图在 360 度视觉地点识别(VPR)中的优势,提出了一种利用 BEV 表示的新型网络架构,该架构将视觉线索和空间感知进行桥接,并在两个数据集上进行了验证。
- CVPR特征缩减金字塔与 Transformer 在伪装目标检测中的应用
本文提出了一种基于变形金刚特征的新型 Feature Shrinkage Pyramid 网络 (FSPNet),它通过逐步缩小的方式层次化地解码局部增强的相邻变换器特征来进行迷彩物体检测。
- 基于特征聚合和条件预测的实时 3D 语义场景补全
本文提出了一种实时语义场景完整方法,具有特征聚合策略和条件预测模块,通过特征聚合和两步预测方案来提高语义场景完整预测性能。在三个基准测试上进行实验,并在一个 GTX 1080 Ti GPU 上以每秒 110 帧的速度取得了有竞争力的性能。
- AAAI通过变分特征聚合进行少样本目标检测
提出了一个以元学习为基础的框架,其中包括两种新的特征聚合方案。CAA 方法和 VFA 方法可以用于处理基础类别和新类别的混淆问题,并且可以提高分类和定位的精度。
- CVPR带噪声标签的小样本学习
介绍了在 few-shot learning(小样本学习)中应对 Label 干扰的技术方法,提出了一种基于 Transformer 的模型(TraNFS)和特征聚合方法,通过在嘈杂的数据集上的测试,验证了这些方法的有效性。
- CVPR深度三维可塑模型的特征聚合学习
本文介绍了基于深度学习的 3D 变形模型,提出了一种基于注意力机制的模块来优化特征汇聚,通过端到端训练映射矩阵来实现在现有架构上对特征汇聚的替代,取得了在多个 3D 模型数据集上的最新成果。
- CVPR多目标域自适应的课程图协作教学
本研究提出了一种通过特征聚合和课程学习相结合的双分类器模型 (Curriculum Graph Co-Teaching) 来实现多目标域自适应 (MTDA),该模型使用图卷积网络 (GCN) 来聚合来自不同领域的样本特征,同时采用辅助的课程 - AAAICompFeat: 视频实例分割的全面特征聚合
本文提出了一种视频实例分割方法 - ComFeat,该方法采用了新的特征聚合方法、注意力机制以及 siamese 设计,可以解决单帧特征难以应对运动模糊和外观变化等问题,同时在 YouTube-VIS 数据集上得到了有效验证。
- 原始对偶网格卷积神经网络
本文提出了一种将图形神经网络的原始 - 对偶框架扩展到三角网格上的方法,使用动态聚合机制对 3D 网格的边缘和面特征进行聚合分析,并引入一种准确的几何解释来处理网格连接的变化,并在形状分类和形状分割任务中获得与最先进技术相当或更优的性能。
- 可分解的图卷积网络
本文提出了一种新的图卷积网络 (FactorGCN),能够显式地解开图中绕在一起的、包含多种关系的数据,将其拆分成多个因式图,在每个因式图的潜在空间内分别聚合节点的特征,进而实现更好的下游任务表现。在合成和真实世界数据集上进行了定性和定量评 - 图神经网络作为图信号去噪的统一视角
本篇论文针对图结构数据的表征学习中的聚合操作进行研究,探究 GCN、GAT、PPNP、APPNP 等 GNN 模型的聚合过程与图像去噪问题之间的通用性,进而提出统一图神经网络框架 UGNN,并基于此开发了 ADA-UGNN 模型,通过实验验