AutoFocus: 高效多尺度推理

ICCVDec, 2018

AutoFocus: Efficient Multi-Scale Inference

PDF

Mahyar Najibi, Bharat Singh, Larry S. Davis

TL;DRAutoFocus 是一种高效的基于深度学习的物体检测器的多尺度推理算法，只处理可能包含细节或小物体的区域，可以得到 47.9%（50% 重叠时的 68.3%）的 mAP，比 RetinaNet 多 10% 的 mAP。

Abstract

This paper describes autofocus, an efficient multi-scale inference algorithm for deep-learning based →

autofocus multi-scale inference algorithm deep-learning object detectors focuspixels

发现论文，激发创造

语义分割自动对焦层

本研究提出自适应对焦卷积层用于语义分割，通过并行合并多个不同膨胀率的卷积层及注意力机制，该卷积层可以根据处理后的上下文自适应地改变有效感受野的大小，提高网络的多尺度处理能力和特征提取能力，且可以轻松地集成到已有的网络中。我们在盆腔 CT 和脑部 MRI 分割等具有挑战性的任务上评估了该方法，获得了非常有希望的性能表现。

May, 2018

AutoFocusFormer：基于自注意力机制的图像分割

本研究提出了一种名为 AutoFocusFormer (AFF) 的局部 - 注意力 Transformer 图像识别骨干网络，通过学习保留任务中最重要的像素来实现自适应降采样，采用点基础分割方法，使得小目标在降采样过程中得到更充分地表示，并展示它在分割任务中显著优于基线模型。

Apr, 2023

带有自动对焦的标准化尺度图像金字塔用于目标检测

该论文提出了一种有效的点视觉框架，用于物体检测，其使用尺度归一化的图像金字塔（SNIP）生成已知训练期间可能包含物体的固定尺寸子区域，以提高性能，并通过粗到精的逐步缩小图像金字塔中的感兴趣区域的方法，快速识别物体。

Feb, 2021

自动对焦学习

利用深度分类模型和序数回归损失优化学习自动对焦技术，相比之前的方法可以将平均绝对误差降低 3.6 倍。

Apr, 2020

SAMF：面向对象检测的小区域感知多焦点图像融合

本研究提出了一种新的小区域感知多焦点图像融合（MFIF）算法，用于增强物体检测能力，并通过像素属性增强、视觉显著性检测和三区域分割策略来精确确定像素焦点，进而设计了有效的像素选择规则以生成分割决策图并获得最终的融合结果。实验证明，该方法在主观和客观评估中能够准确检测到小且平滑的焦点区域，并改善物体检测性能，优于现有方法。源代码可在此链接获取：https://URL

Jan, 2024

Focus-and-Detect: 一种用于航拍图像的小目标检测框架

本文提出了一种名为 “Focus-and-Detect” 的两阶段物体检测框架，包括一个用高斯混合模型监督的物体检测网络来生成聚焦区域，以及一个物体检测网络来预测指定区域中的物体。同时，本文还提出了一种名为 IBS 的方法，可以克服区域搜索方法的截断效应，并在 VisDrone 验证数据集上获得了 42.06 的 AP 得分，超越所有已知的最先进的小物体检测方法。

Mar, 2022

层次多尺度注意力用于语义分割

本文介绍了一种基于注意力机制的多尺度预测整合方法，其中的层次化结构能够节省大量内存，提高训练速度和模型精度，并在 Cityscapes 和 Mapillary Vistas 数据集上达到了新的最优结果。

May, 2020

AdaFocus V2：面向视频识别的空间动态网络的端到端训练

介绍了一种基于差值插值的补丁选择算法，简化了 AdaFocus 的训练过程并提高了效率，并提出了一种改进的训练方案和条件退出技术，该模型在六个基准数据集上表现出更好的性能。

Dec, 2021

高分辨率图像物体检测的粗细粒度框架

本文提出一种基于聚类的粗到细的目标检测框架，特别针对小物体和高分辨率图像的大规模差异问题，在提高目标检测准确率的同时降低了计算成本。

Mar, 2023

EfficientDet：可伸缩高效的目标检测

本文系统地研究了神经网络结构设计选择以提高计算机视觉中目标检测的模型效率，提出多个优化方案，包括带权重的双向特征金字塔网络、统一调整骨干网络、特征网络、盒类预测网络的分辨率、深度和宽度的复合调节方法，成功开发了名为 EfficientDet 的新一代目标检测器，拥有更高的性能和更小的计算量。

Nov, 2019