MosaicOS：一种利用以物体为中心的图像实现长尾目标检测的简单而有效方法

ICCVFeb, 2021

MosaicOS：一种利用以物体为中心的图像实现长尾目标检测的简单而有效方法

MosaicOS: A Simple and Effective Use of Object-Centric Images for Long-Tailed Object Detection

Cheng Zhang, Tai-Yu Pan, Yandong Li, Hexiang Hu, Dong Xuan...

TL;DR本文提出一种名为 MosaicOS 的针对长尾目标检测的新颖框架，其通过伪场景中心图像的构建和高质量的边界框插值等策略，在稀有目标类别的平均精度上取得 60% 的提升。

Abstract

Many objects do not appear frequently enough in complex scenes (e.g., certain handbags in living rooms) for training an accurate object detector, but are often found frequently by themselves (e.g., in product images). Yet, these object-centric images are not effectively leveraged for improving object detection in scene-centric images. In this paper, we propo

object detection long-tailed mosaicos multi-stage training bounding box imputation

发现论文，激发创造

面向非约束遥感图像的多类目标检测

本文提出了一种新方法，即一个新的联合图像级联和特征金字塔网络，用于在遥感图像中提取多尺度的强和弱语义特征，并进行定向边界框的检测和旋转非极大值抑制，提高了模型的性能。同时，该模型还具有对图像和对象尺度和方向的鲁棒性，可在多类物体检测应用程序中部署。

Jul, 2018

级联匹配半监督长尾目标检测

本文提出了一种基于伪标签的半监督级联匹配检测器 CascadeMatch，该检测器采用级联网络架构，并具有根据数据自适应提取的伪标签。实验结果表明，CascadeMatch 在处理长尾物体检测方面优于现有半监督方法，在几种检测结构中均优于 Unbiased Teacher，且能处理稀疏标注的物体检测问题。

May, 2023

FCOS：一种简单而强大的无锚点目标检测器

在计算机视觉中，我们提出了一种完全卷积的一阶段对象检测器（FCOS），以像语义分割等其他密集预测问题的方式解决像素级预测对象检测问题，该检测器不需要预定义的基础框，并且避免了与基础框计算相关的超参数，非常简单有效。

Jun, 2020

FCOS：全卷积单阶段目标检测

本文提出了一种全卷积单阶段物体检测器 FCOS，采用针对每个像素的预测方式，类似于语义分割。相对于所有最先进的物体检测器，如 RetinaNet，SSD，YOLOv3 和 Faster R-CNN，FCOS 完全无需先定义参考框，从而避免与参考框相关的计算，例如计算训练过程中的重叠等。通过仅使用后处理的非最大抑制（NMS），FCOS 基于 ResNeXt-64x4d-101 实现了 44.7％的平均精度，超过了以前的单阶段检测器，并具有更为简单的优点。

Apr, 2019

基于物体的学习中的泛化和鲁棒性关联

本文介绍了物体中心表示学习的概念，并在五个常见的多目标数据集上对最先进的无监督模型进行了训练和评估，研究了分割度量和下游对象属性预测等问题，并探讨了单个对象超出分布，全局属性的改变以及更少结构化的分布转变对其性能的影响。实验结果表明，物体中心表示对下游任务很有用，而且对于大多数影响对象的分布转变通常很坚韧。但是，当输入的分布变化不规则时，在分割和下游任务性能方面的韧性可能会因模型和分布转变而异。

Jul, 2021

遥感图像中基于显著对比学习的少样本目标检测

通过使用定向边界框而不是传统的水平边界框来学习更好的特征表示，针对远程感知图像，我们提出了一种新的用于远程感知图像的少样本定向目标检测方法，称为记忆对比学习的少样本定向目标检测（FOMC）。我们引入了一个带有动态更新存储器的监督对比学习模块，以应对对象误分类的具有挑战性的问题。该模块可以利用大批量的负样本，并增强模型学习未见类别的区分特征的能力。在 DOTA 和 HRSC2016 数据集上进行了全面实验，我们的模型在少样本定向目标检测任务上实现了最先进的性能。发布代码和预训练模型。

Mar, 2024

利用配对的 OpenStreetMap 数据和光学高分辨率影像通过对象引导的 Transformer 进行土地覆盖变化检测

使用光学高分辨率图像和 OpenStreetMap（OSM）数据进行土地覆盖变化检测，引入目标引导的 Transformer（ObjFormer）架构，结合目标基于图像分析（OBIA）技术和先进的视觉 Transformer 架构，实现了直接检测土地覆盖变化，并提出了一种新的半监督语义变化检测任务，能高效地完成此任务。

Oct, 2023

稀缺数据环境下航拍图像中的目标检测

本文通过在航拍图像中对现有少样本目标检测方法进行深入分析，发现自然图像和航拍图像之间存在较大的性能差距，导致的原因是航拍图像中小物体的数量较多。因此，本文提出了一种精心设计的注意力机制来改善少样本目标检测方法在小物体上的性能，并提出了一种自适应尺度框相似性准则，特别适用于小物体的训练和评估。同时，本文还通过度量学习和微调提出了两种用于通用少样本目标检测的不同方法，其中微调方法在处理诸如跨域少样本目标检测等更复杂场景方面取得了显著的成果。最后，针对在 COSE 系统中部署检测模型的需求，本文利用 TensorRT 等现有优化工具成功解决了在超大图像（超过 100 百万像素）中实时进行检测的工程挑战。

Oct, 2023

单次视频目标分割

本文提出一种基于神经网络的半监督视频目标分割技术，能够在保证处理速度的前提下提升目标分割的效果。

Nov, 2016

分类中的魔鬼：一种针对长尾物体检测和实例分割的简单框架

本文旨在研究并解决现有的目标检测和分割模型在长尾数据集上的失效问题，通过对现有的两阶段实例分割模型 Mask R-CNN 在最近的长尾 LVIS 数据集上的表现进行系统调研后，我们发现不准确的对象提案分类是其表现下降的主要原因，然后我们提出了一种用于改进长尾分类性能的简单校准框架，它可以更有效地减轻分类头偏差，并结合二级类平衡采样方法。在我们的实验中表现良好，提高了最近 LVIS 数据集和我们采样的 COCO-LT 数据集的尾部类别实例分割的准确性。

Jul, 2020