AutoFocus: 高效多尺度推理
本研究提出自适应对焦卷积层用于语义分割,通过并行合并多个不同膨胀率的卷积层及注意力机制,该卷积层可以根据处理后的上下文自适应地改变有效感受野的大小,提高网络的多尺度处理能力和特征提取能力,且可以轻松地集成到已有的网络中。我们在盆腔 CT 和脑部 MRI 分割等具有挑战性的任务上评估了该方法,获得了非常有希望的性能表现。
May, 2018
本研究提出了一种名为 AutoFocusFormer (AFF) 的局部 - 注意力 Transformer 图像识别骨干网络,通过学习保留任务中最重要的像素来实现自适应降采样,采用点基础分割方法,使得小目标在降采样过程中得到更充分地表示,并展示它在分割任务中显著优于基线模型。
Apr, 2023
该论文提出了一种有效的点视觉框架,用于物体检测,其使用尺度归一化的图像金字塔(SNIP)生成已知训练期间可能包含物体的固定尺寸子区域,以提高性能,并通过粗到精的逐步缩小图像金字塔中的感兴趣区域的方法,快速识别物体。
Feb, 2021
本研究提出了一种新的小区域感知多焦点图像融合(MFIF)算法,用于增强物体检测能力,并通过像素属性增强、视觉显著性检测和三区域分割策略来精确确定像素焦点,进而设计了有效的像素选择规则以生成分割决策图并获得最终的融合结果。实验证明,该方法在主观和客观评估中能够准确检测到小且平滑的焦点区域,并改善物体检测性能,优于现有方法。源代码可在此链接获取:https://URL
Jan, 2024
本文提出了一种名为 “Focus-and-Detect” 的两阶段物体检测框架,包括一个用高斯混合模型监督的物体检测网络来生成聚焦区域,以及一个物体检测网络来预测指定区域中的物体。同时,本文还提出了一种名为 IBS 的方法,可以克服区域搜索方法的截断效应,并在 VisDrone 验证数据集上获得了 42.06 的 AP 得分,超越所有已知的最先进的小物体检测方法。
Mar, 2022
本文介绍了一种基于注意力机制的多尺度预测整合方法,其中的层次化结构能够节省大量内存,提高训练速度和模型精度,并在 Cityscapes 和 Mapillary Vistas 数据集上达到了新的最优结果。
May, 2020
介绍了一种基于差值插值的补丁选择算法,简化了 AdaFocus 的训练过程并提高了效率,并提出了一种改进的训练方案和条件退出技术,该模型在六个基准数据集上表现出更好的性能。
Dec, 2021
本文系统地研究了神经网络结构设计选择以提高计算机视觉中目标检测的模型效率,提出多个优化方案,包括带权重的双向特征金字塔网络、统一调整骨干网络、特征网络、盒类预测网络的分辨率、深度和宽度的复合调节方法,成功开发了名为 EfficientDet 的新一代目标检测器,拥有更高的性能和更小的计算量。
Nov, 2019