- ECCV多尺度正样本精炼在少样本物体检测中的应用
提出了一种多尺度正样本精炼(MPSR)方法,通过生成目标金字塔来丰富 FSOD 的对象尺度,并在不同的尺度上优化预测,将其作为辅助分支集成到 Faster R-CNN with FPN 的流行架构中,该方法在 PASCAL VOC 和 MS - 无微调一次性目标检测
本研究中我们试图通过应对一次训练样例被限制为 1 的单独目标检测问题,丰富目标检测类别,并引入了匹配 - FCOS 网络和结构感知关系模块等模型以及新颖的训练策略进行探究,旨在最终消除对支持图像的微调需要,结果在多个数据集上始终超过同类现有 - 多方向物体检测中基于水平边框的滑动顶点
在该论文中,我们提出了一种基于顶点滑动的方法来检测多方向对象,同时引入了一个倾斜因子来辅助水平或方向检测,并使用 Faster R-CNN 回归头添加了五个额外的目标变量,该方法优于目前多个先进的检测基准测试。
- CVPR利用显著性地图进行热像中的行人检测
利用润色图确保在昼间的热成像图像上提高行人检测效果,并在 KAIST 多光谱行人检测数据集的子集上提供像素级行人掩模。
- CVPR关系动作预测
本文旨在研究视频中多人行为预测。文章提出了一种 Discriminative Relational Recurrent Network 模型,通过构建循环图形式对不同演员之间的时空相互作用进行联合建模,从而在不需要显式监督的情况下,学习选择 - 使用少量 X 光图像和 Faster R-CNN 训练检测远端桡骨骨折
通过训练 Faster R-CNN 深度学习网络,在只有 38 张有骨折的手部 X 光图像的情况下,可高精准度地识别和定位远端桡骨骨折,其准确性为 96%,平均精度为 0.866,并且较医生和放射科医师检测结果更为准确。这一技术为检测罕见疾 - NIPSLinkNet:场景图的关系嵌入
本文提出了一种改进场景图生成的方法,通过显式建模整个对象实例的相互依赖关系,设计了一种简单而有效的关系嵌入模块,使我们的模型能够联合表示所有相关对象之间的连接,而不是只关注单个对象。在基本 Faster R-CNN 的基础上使用它,我们的模 - MM从共同出现的物体类别的角度分析物体检测器
本研究基于特殊遮盖的 MS COCO 数据集,对目前最先进的 Faster R-CNN 和 YOLO 目标检测器的准确性进行评估和比较,以衡量它们的预测有多少依赖于编码在对象类别级别上的上下文信息。研究结果表明,当前检测器通常不会在类别级别 - 基于 Faster R-CNN 的内窥镜视频息肉检测高效方法
该文研究了基于深度学习的快速区域卷积神经网络(Faster R-CNN)在内窥镜图像中多发性息肉检测方面的应用,实验结果表明其能够有效的用于临床实践。
- CVPRAVA 任务中更好的基准模型
该研究提出了一个基于 Faster R-CNN 和 I3D 模型的简单 baseline,用于在 AVA 数据集上进行动作定位,最终模型在验证集上获得了 22.8%/21.9%的 AP,表现优于 CVPR 2018 挑战中的所有提交项。
- MM使用基于神经网络的约束优化对人脸检测器进行对抗性攻击
本文提出了一种新的对抗生成网络(adversarial generator network)求解约束优化问题来产生对抗性样本的策略,该方法经过简单训练后线性扩展的能力很强,可以攻击还未曾见过的新图片,使用此技术针对 Faster R-CNN - CVPR使用 Faster R-CNN 进行疟疾图像物体检测
本研究使用基于深度学习的 Faster R-CNN 模型对恶性疟疾感染的血液细胞进行目标检测和识别,对比传统方法和专家手动算数,证明 Faster R-CNN 在细胞识别上更有效。
- 一种基于 Faster R-CNN 的自由锚点区域提议网络用于文本检测方法
本论文提出了一种新的基于区域提案网络的方法来替换 Faster R-CNN 中的锚点机制,通过去除复杂的锚点设计,可以在大规模 COCO-Text 数据集上实现更高的召回率,并在 ICDAR-2017 MLT、ICDAR-2015 和 IC - ShapeShifter:对 Faster R-CNN 物体检测器的强大物理对抗攻击
ShapeShifter 是一种攻击方法,可以通过在真实世界中添加对图像进行物理扰动同时满足多个途径来测试机器学习模型,期望通过在不同的变形中增加鲁棒性来模拟许多场景。
- 视觉问答中的问题类型引导注意力机制
本文提出了一个名为 Question Type-guided Attention (QTA) 的方法,利用问题类型信息动态平衡从 ResNet 和 Faster R-CNN 网络中分别提取的自下而上和自上而下的视觉特征。在 TDIUC 数据 - CVPR用于目标检测的多尺度位置感知核表示
本文提出了一种新的多尺度位置感知核表示(MLKP)用于在目标检测中捕获深度特征中的高阶统计信息,通过将其集成到 Faster R-CNN 模式中,提高了检测器的性能,并在 PASCAL VOC 2007、VOC 2012 和 MS COCO - 通过剪切和粘贴学习分割
本文提出了一种基于弱监督学习框架的对象实例分割方法,使用对抗训练的方法学习对象掩模,利用剪切 - 粘贴的游戏过程,通过掩模生成器和区分器的协同作用来实现分割掩模的优化,实验结果表明,该方法在不需要手工标注分割建议的情况下,可以超越现有的弱监 - CVPR领域自适应快速 R-CNN 用于野外物体检测
本文旨在提高物体检测的跨域鲁棒性,通过基于 Faster R-CNN 的两级域自适应组件来解决图像水平和实例水平的域偏移问题,实现域不变的 RPN 学习,从而提高物体检测在不同领域转移场景下的有效性。
- 基于级联区域提议和全局上下文的深度目标检测
本文详细介绍了如何通过改进区域提议和深度对象识别两个步骤来提高 Faster R-CNN 的效果。我们提出了一种新的轻量级级联结构,可以有效地提高区域提议质量,重新实现了全局上下文建模,同时广泛应用预训练思想,最终在几个测试数据集上均获得了 - MM基于显著性引导的快速 R-CNN 细粒度判别定位
本文提出了一种基于注意力引导下的快速卷积神经网络的判别定位方法,具备同时定位判别区域和编码判别特征的能力,并将其应用于细粒度图像分类任务中,取得了最佳分类准确性和效率。