利用视野凹凸突显进行目标探测
本文提出了一种基于人眼视觉的全景 - 中央凹多尺度驾驶模型,通过预测司机注视点的位置来改进驾驶性能,实现了在行人所涉及的危急情况下驾驶准确度的显著提高。
Mar, 2019
本文介绍了一种使用视锥传感器主动关注视觉场景的方法,并提出了一种端到端可区分的视锥主动视觉架构,该架构利用图卷积网络处理视锥图像,并提供一种简单而有效的视锥图像采样形式。我们的模型通过学习迭代地关注与分类相关的图像区域。我们在多个图像数据集上进行了详细实验,比较了我们的方法与先前的视锥视觉方法的性能,同时还测量了不同选择(如视锥程度和网络执行的固定点数)对目标识别性能的影响。我们发现,我们的模型在具有可比参数和给定像素或计算预算的最先进 CNN 和视锥视觉架构上表现更好。
Dec, 2023
FOVEA 是一种基于人眼视觉特点,通过可微分的重采样层对高分辨率图像进行智能降采样,保证感兴趣区域的像素不会丢失,在自动驾驶数据集 Argoverse-HD 和 BDD100K 上,能够提升小物体检测的准确率而不降低大物体的准确率,并创造了流媒体 AP(同时考虑准确性和延迟)的新记录。
Aug, 2021
本文回顾了近年来少样本目标检测(FSOD)领域的重要进展,总结了现有挑战和解决方案,通过提出一种新颖的 FSOD 分类方法和调查丰富的 FSOD 算法,得出了促进 FSOD 问题深入理解和创新解决方案发展的全面概述,并讨论了这些算法的优点和限制,总结了在数据匮乏场景中目标检测的挑战、潜在的研究方向和发展趋势。
Apr, 2024
本文提出了 FoveaBox 框架,一种准确,灵活且完全无锚点的物体检测方法,通过预测类别敏感的语义图和每个位置的类别不可知的边界框,避免与锚相关的计算和超参数问题。与所有先进的物体检测器不同,FoveaBox 可以直接学习物体的存在可能性和边界框坐标,因此具有更好的性能和通用性。
Apr, 2019
本文探讨了通过在计算机视觉系统中使用记忆来改进视频流中的物体检测的精度和减少计算时间的问题。我们通过交替使用传统的特征提取器和极其轻量级的提取器展示了在存在时间记忆的情况下,进行准确检测所需的计算量是非常小的。此外,我们展示了记忆容纳了足够的信息以应用于强化学习算法来学习自适应推断策略。我们的模型在 Imaget VID 2015 数据集上实现了移动方法中的最先进性能,并在 Pixel 3 手机上以 70+ FPS 的速度运行。
Mar, 2019