- 基于视觉的食物重量估算方法
该研究提出了一种基于视觉的方法,利用 2D 图像来估计食物重量,采用深度学习和计算机视觉技术,使用 Faster R-CNN 进行食物检测和 MobileNetV3 进行重量估计,该方法在提供准确食物重量估计方面表现出强大的能力,并可用于医 - BAM: 盒子抽象监测对象检测中的实时 OoD 检测
该论文提出了一种简单而出乎意料地有效的方法,称为基于盒子抽象的监视器(BAM),用于将离群数据检测集成到物体检测深度神经网络中,通过使用一组凸盒子对学习到的对象特征进行捕捉,并利用凸盒子之外的特征确定离群数据。将 BAM 集成到基于 Fas - 基于 Faster R-CNN 深度学习方法的智能车辆交通管理
通过基于 Faster R-CNN 的深度学习方法,研究了车辆的分割问题,在自适应背景模型的最小化、基于 Faster R-CNN 的子网络操作、Faster R-CNN 初始细化以及扩展拓扑活跃网的结果优化等四个步骤中得到了解决,并通过拓 - 借助图像 - 语言相似性的重新打分方法用于小样本目标检测
利用 Contrastive Language-Image Pre-training (CLIP) 和 hard negative classification loss,在少数据环境下通过 Re-scoring using Image-l - 采用自编码器进行浮游植物寄生虫检测
本文介绍了一种基于自编码器的无监督异常检测系统,可应用于检测可能对浮游植物寄生或感染的异常现象,并与基于 Faster R-CNN 的有监督方法进行比较。该无监督方法具有更广泛的适用性,不需要注释的异常数据,并在 9 种浮游植物物种中达到 - QKVA 网格:基于视觉关注的堆叠 DETR
本文介绍了一个名为 Stacked-DETR 的新模型,其基于 DETR,通过在 Attention 块中提出 QKVA 网格来简化了训练成本并引入了堆叠结构以增强性能,尤其在小物体上表现更好
- 通过鼓励一致的基于梯度解释来改善视觉定位
Attention Mask Consistency 是一种基于边缘的损失函数,在视觉语言模型预训练中作用使得梯度基础的解释与区域级别注释保持一致,并且比依赖于明确训练对象检测器的区域级注释的模型产生更优秀的视觉定位性能。
- 黑匣子里有什么?目标检测器内部的假阴性机制
该研究通过对两种物体检测器的结构和数据集的分析,提出了 “五种假负面机制”,并探究了 Faster R-CNN 和 RetinaNet 在计算机视觉基准数据集和机器人应用中的 “假负面机制” 显著不同的原因。
- 航拍影像中的目标检测:如何提高精度?
本文研究了基于深度学习的 Faster R-CNN 在航空图像目标检测中的应用,通过对多种策略的探索,成功提升了模型在 iSAID 数据集上的平均精度(mAP),为航空图像目标检测提出了有效的解决方案。
- ICML使用表征学习进行少样本航空图像物体检测的经验反馈
本文提出了一种基于 Faster R-CNN 及特征学习的几类物体检测方法,采用基于原型网络的方法,在线适应新类别,并使用嵌入向量与类别原型之间的距离确定对应分类得分。该方法在 DOTA 数据集上进行了评估,强调了特征学习对几类目标检测任务 - ICCVDeFRCN:用于少样本物体检测的解耦快速 R-CNN
本文提出了一种名为 Decoupled Faster R-CNN (DeFRCN) 的简单而有效的体系结构,通过引入 Gradient Decoupled Layer 和 Prototypical Calibration Block 来解决 - 多源域自适应目标检测
本研究提出了一种基于 Faster R-CNN 的统一框架 DMSN,采用分而治之的策略进行特征对齐和反神经网络的训练,实现同时提高域不变性和保持判别能力,具有很强的适应性和泛化性能。
- RPATTACK: 基于细化 Patch 的通用目标检测器攻击
提出一种新的补丁攻击方法 RPAttack,它可以成功攻击 YOLO 和 Faster R-CNN 等常规物体检测器,而仅修改 0.32%的像素,并实现 100%的错过检测率。
- 双意识注意力在少样本目标检测中的应用
利用 Dual-Awareness Attention (DAnA) 机制提出一种能够适应非常规图像输入的 Few-shot object detection 网络,并在不同评估设置下比之前方法显着增加性能。
- CVPRimg2pose: 基于 6DoF 的人脸姿态估计,面部对齐和检测
本文提出了一种实时的、无需面部检测或关键点定位的六自由度、三维人脸姿态估计方法,使用了 Faster R-CNN 模型将六自由度位姿回归给图像中所有的脸部,并展示了该方法在 AFLW2000-3D 和 BIWI 数据集上的优越性能。
- 基于视觉感知层次的食品识别
本研究提出了一种新的基于 Convolutional Neural Networks (CNNs) 的两步骤食物识别系统,其中包括基于 Faster R-CNN 方法的食物定位和用于执行基于视图关联的分类任务的多任务 CNN 模型,该模型 - 椭圆检测与定位及其在锯切木材图像中的应用
本文提出了一种使用 Faster R-CNN 和 Gaussian function 模型改进的椭圆物体检测方法,并且在预处理图像的基础上第一次开源了木材节点数据集。通过实验发现该方法能够优于普通目标检测器,对于预处理后的图像亦能够对失配型 - 糖尿病足溃疡检测中的深度学习:一项全面评估
本文总结了 DFUC2020 举办的比赛结果,比较了各获胜团队所提出的基于深度学习的算法,主要采用 Faster R-CNN 算法实现对糖尿病足溃疡的识别和检测。
- 什么导致物体提议的泛化?
本文研究使用一小组源类别训练检测模型如何生成泛化到未见过的类别的 proposals,通过对数据集的视觉多样性和标签空间粒度的属性研究,引入了原型类别的概念,提出只需用 25% 的类别即可训练得到性能不差的 proposals,同时表明 F - 基于深度学习的植物器官数字化标注检测
利用深度学习和 Faster R-CNN 检测数字化标本上的植物器官,有效地提取重要的生物信息。