密集场景中的精准检测
本论文提出了一种新的基于查询的检测框架,利用一对一标签分配规则,提出了一种渐进式预测方法来解决拥挤场景下已有检测器多次预测和性能饱和的问题;实验表明,这种方法可以显著提高拥挤场景下基于查询的检测器的性能并具有稳健性,可以在各种场景中实现一致的改进效果。
Mar, 2022
本文研究了稀疏卷积物体检测网络在自动驾驶系统中的应用,通过与基线模型对比,证明了 SKPP-DPVCN 架构在 Car AP4.0 的表现上超过了基线模型和之前的最新技术,同时在平均尺度误差上也实现了显著减少。
Aug, 2023
提出了一种基于 proposal 的物体检测器,通过使用相关实例集而不是单个实例来预测每个 proposal,引入 EMD Loss 和 Set NMS 等新技术,能够有效处理高度重叠物体的检测难度,在 CrowdHuman 数据集上获得 4.9% 的 AP 收益,在 CityPersons 数据集上获得 1.0% 的 MR^-2 收益,在 COCO 等数据集上也能够取得适度的改进效果。
Mar, 2020
本文提出了一项名为 Locount 的新任务,即同时进行对象定位和计数,针对此任务,我们收集了一个大规模的对象定位和计数数据集,提供了一个新的评估协议,同时提供了一个被称为级联定位和计数网络的强基线,并在数据集上进行大量实验以证明其重要性和性能。
Mar, 2020
该论文提出了一种在密集场景中进行实时异常检测和定位的方法,在该方法中,视频被定义为非重叠立方块的集合,并使用两个本地和全局描述符进行描述。我们利用简单和经济实惠的高斯分类器来区分正常活动和异常活动,并根据相邻块之间的结构相似性和无监督学习的特征来确定本地和全局特征。大量实验结果表明,该算法优于 UCSD ped2 和 UMN 基准的最新方法,而且具有更高的时间效率。我们的实验结果证明了我们的系统可以在视频中发生异常时可靠地检测和定位异常。
Nov, 2015
通过与现有规划方法结合,我们提出了一种全卷积形状补全模型(F-CON),可以在现实世界中实现密集堆放。我们还发布了一个模拟数据集(COB-3D-v2),用于训练真实世界机器人应用的形状补全模型,并使用它证明 F-CON 超过其他最先进的形状补全方法。最后,我们将 F-CON 应用于实际的拾取放置系统,并展示了在混乱的场景中对复杂、未知物体的密集堆放。在多种规划方法下,F-CON 实现了比其他形状补全方法更好的密集堆放效果。
Jul, 2023
本文提出了一种基于遥感图像的密集目标计数数据集,包含建筑物、港口拥挤船只、停车场中的大型和小型车辆。我们设计了一种新的神经网络,它能够生成输入图像的密度图,该网络由卷积块注意力模块 (CBAM)、尺度金字塔模块 (SPM) 和可变形卷积模块 (DCM) 三部分构成。实验表明,所提出的数据集的挑战性,以及我们的方法的优越性和有效性。
Feb, 2020
本研究提出了一种动态细化网络解决因神经元的感受野方向固定及模型泛化性差而导致的面对有方向的、密集的对象的检测困难问题,并基于发起的 SKU110K 数据集提出了一种新的定向边界框注释方式,实验结果显示该方法与基线方法相比具有相当大的优势。
May, 2020
本研究钻研的半监督三维物体检测问题,在考虑到在杂乱的三维室内场景中进行标注所需要的成本极高的情况下,我们采用了自学习的强健和原则性框架,提供了第一种半监督三维检测算法,该算法单阶段运作并允许稠密的训练信号,解决了多阶段流水线以及离散化 quantization 误差等问题。
Apr, 2023