基于 Transformer 的目标检测器中多尺度特征的高效使用

Aug, 2022

基于 Transformer 的目标检测器中多尺度特征的高效使用

Towards Efficient Use of Multi-Scale Features in Transformer-Based Object Detectors

Gongjie Zhang, Zhipeng Luo, Zichen Tian, Jingyi Zhang, Xiaoqin Zhang...

TL;DR本文提出了迭代多尺度特征聚合（IMFA）的通用范例，其核心思想是利用只有几个关键位置的稀疏多尺度特征，实现了对基于 Transformer 物体探测器中多尺度特征的高效使用，具有相对较小的计算开销。

Abstract

multi-scale features have been proven highly effective for object detection but often come with huge and even prohibitive extra computation costs, especially for the recent →

multi-scale features object detection iterative multi-scale feature aggregation transformer-based detectors sparse multi-scale features

发现论文，激发创造

学习多尺度特征进行前景分割

本文提出了一种新的鲁棒性编码器解码器结构的神经网络，使用少量的训练示例进行端到端的训练，通过特征融合在 Feature Pooling Module 中提取多尺度特征，实现对相机运动的鲁棒特征池化，免去多尺度输入的需求，通过 CDnet2014、SBI2015 和 UCSD Background Subtraction 数据集的实验表明，所提出的方法的整体 F-Measure 平均值优于现有所有最先进的方法。

Aug, 2018

多尺度特征模仿用于无监督异常定位

本文提出了一种基于教师 - 学生特征模仿网络的多尺度处理策略，采用了基于梯度下降优化的网络模块重要性搜索方法，可以有效地解决无监督异常定位任务的挑战，并在实际工业产品检测数据集上比同期的特征建模异常定位方法具有更好的性能。

Dec, 2022

多尺度交互网络用于显著性目标检测

本研究提出了 “aggregate interaction modules” 和 “self-interaction modules” 等方法来处理深度学习中显著目标检测中存在的变量规模和未知类别等挑战，同时，使用 “consistency-enhanced loss” 方法来处理由于尺度变化导致的类别失衡问题，从而提升对前 / 背景差异的识别和类内一致性的维持。实验结果在五个基准数据集上表明，该方法无需后处理即可比 23 种最先进的方法表现优异。

Jul, 2020

EMIFF: 增强的多尺度图像特征融合在车辆基础设施合作式三维物体检测中的应用

我们提出了一种基于相机的三维检测框架，名为 Enhanced Multi-scale Image Feature Fusion (EMIFF)，用于车辆和基础设施之间的协作感知任务。通过引入 Multi-scale Cross Attention (MCA) 和 Camera-aware Channel Masking (CCM) 模块，我们能够在尺度、空间和通道级别上增强基础设施和车辆特征，以修正由于相机不同步引入的姿态误差。同时，我们引入了 Feature Compression (FC) 模块，通过通道和空间压缩块提高传输效率。实验表明，EMIFF 在 DAIR-V2X-C 数据集上取得了 state-of-the-art 结果，显著优于以往的早期融合和晚期融合方法，在可比较的传输成本下取得了优异的性能。

Feb, 2024

具有统一多粒度对齐的鲁棒领域自适应目标检测

该论文提出了一种基于多粒度对齐的检测框架，不仅考虑了不同类别实例之间的区别，还考虑了不同领域中不同粒度样本的区别，并采用自适应指数移动平均策略 for model assessment 来提高检测的鲁棒性。

Jan, 2023

多尺度方向感知网络用于红外小目标检测

提出了一个多尺度方向感知网络（MSDA-Net），首次尝试将红外小目标的高频方向特征作为领域先验知识集成到神经网络中，并通过创新的多方向特征感知（MDFA）模块、多尺度局部关联学习（MLRL）模块、高频方向注入（HFDI）模块等进行完整的特征提取和定位。大量实验结果表明，MSDA-Net 在公共数据集 NUDT-SIRST、SIRST 和 IRSTD-1k 上实现了最新的最佳效果。

Jun, 2024

稠密视觉 Transformer 的选择性特征适配器

本文提出了一种有效的方法，即选择性特征适配器（SFA），以解决精细调整预训练变压器模型中庞大的参数的成本 / 存储问题，并在各种密集任务中实现了最先进的性能，比其他适配器模块更出色。

Oct, 2023

单图像去噪的多尺度自适应网络

本文提出了一种基于多尺度自适应网络的单张图像去噪方法 (MSANet), 它同时考虑了尺度间的互补性和尺度内部的特征，并提出了自适应特征块 (AFeB), 自适应多尺度块 (AMB) 和自适应融合块 (AFuB) 进行实现，并在多组图片去噪实验中展现出比传统方法更好的表现。

Mar, 2022

自适应混合尺度特征融合网络用于盲目的人工智能生成图像质量评估

本文提出了一种针对 AI 生成图像的盲图像质量评估网络（AMFF-Net），从 “视觉质量”、“真实性” 和 “一致性” 三个维度评估 AI 生成图像的质量。通过多尺度输入策略和自适应特征融合 (AFF) 块，AMFF-Net 在盲图像质量评估方面表现优于九种先进方法。

Apr, 2024

简单微调方法下的增量式少样本目标检测

本文中，我们提出了一种简单的基于微调的方法，iFSD 的增量两阶段微调方法（iTFA），用于在不回访基类的情况下仅使用少量示例增量学习新类。实验结果表明我们提出的方法在现实世界的数据集上表现出很好的准确性和适用性。

Feb, 2023