- 在复杂的果园环境中比较 YOLOv8 和 Mask RCNN 进行物体分割
该研究比较了一阶段 YOLOv8 和二阶段 Mask R-CNN 机器学习模型在不同果园条件下的实例分割性能,结果显示 YOLOv8 在两个数据集上都表现出较好的准确率和接近完美的召回率,推断时间也明显快于 Mask R-CNN。
- 基于 Mask R-CNN 的土壤图像分割
通过深度学习方法,利用 Mask R-CNN 模型完成土壤图像的定位和分割,从而实现对不同环境下采集的土壤图像的准确分割结果,满足自然环境下田间土壤图像实时分割和检测的需求。
- Detectron2 上的孟加拉文档布局分析
我们通过使用 Detectron2 库中的先进 Mask R-CNN 模型改进了 Bengali 文档的 DLA 模型的准确性,评估了三种变体,结果表明这些模型在准确分割 Bengali 文档方面非常有效,同时我们强调了预训练权重的重要性, - 基于 Mask-RCNN 的孟加拉文档布局分析性能增强
理解数字化文档就像解谜游戏,特别是历史文档。文档布局分析(DLA)通过将文档划分为段落、图像和表格等部分来解决这个谜题,这对机器读取和理解这些文档至关重要。本研究针对理解孟加拉语文档进行了工作,使用了一个名为 BaDLAD 的数据集,并使用 - 利用单幅卫星图像进行屋顶部分的三维检测及应用于 LOD2 建筑重建
提出了一种基于遥感影像的城市三维重建方法,名为 KIBS (Keypoints Inference By Segmentation),该方法实现了在只有一张二维卫星影像的情况下,通过全深度学习实现建筑物屋顶截面的三维检测,并进行全三维重建, - Panoptic 分割的实例网络和语义分割集成
本文提出了解决 2019 年 COCO 全景分割任务的方法,结合了实例分割和语义分割,采用多种模型和策略,获取了最佳结果 $PQ$ 47.1。
- 使用游戏引擎从合成数据中检测货盘
本研究旨在评估使用游戏引擎在托盘分割的机器学习中生成合成训练数据的可行性。研究开发了一款工具,可从 3D 模型以像素完美的准确性自动生成大量带注释的训练数据,并且比手动方法更快地进行。使用 Mask R-CNN 管道进行图像分割,对于单独的 - SKA 脉冲星搜寻管线机器学习方法的研究
该研究通过使用 Mask R-CNN 算法,发现经验驱动和数据驱动算法对于 SKA 脉冲星搜索管道中的候选物体检测至关重要,并成功地在模拟数据集上检测到候选物体。
- 使用人工智能在便携式仰卧胸部 X 光片上开发自动气管内管和气管分岔处检测
本文研究了应用 Mask R-CNN 作为特征提取方法来解决可移动卧位胸部 X 射线片在检测气管插管和检测位置时所面临的问题,通过该方法可以提取出气管插管以及在图像中的叉状气管。实验结果证明了该方法的高鲁棒性,对于 ETT-carina 距 - 一种深度学习框架用于口罩下的人脸重建
采用三阶段方法,包括人脸关键点检测、掩膜二元分割和修复缺失区域等方法,用深度学习算法进行图像重建,以提高性别和其他特征的一致性。
- 使用预分割技术和 IoU 区域合并提高 Mask R-CNN 对长而细的取证痕迹的性能
提出了一种改进 Mask R-CNN 算法性能的方法,该方法首先通过 PSPNet 算法对图像进行预分割,然后开发了自己的成本函数和启发式训练策略,防止过拟合并实现更有针对性的收敛,并提出了高健壮性和泛化性的策略。
- MMMask 是你所需要的:重新思考 Mask R-CNN 用于密集和任意形状场景文本检测
本文针对 Mask R-CNN 在场景文本检测与定位中面临的实际问题,提出了一种基于 MLP 解码器和实例感知掩模学习技术的方法,可以显著提高鲁棒性。同时提出了一种自适应标签分配方法,以应对比例和宽高比差异较大的实例问题。该方法在多个基准测 - ICCV探索长尾目标检测中的分类平衡
本研究提出使用平均分类得分来指示每个类别的分类准确性,并通过平衡损失和记忆增强特征采样方法,在长尾检测中找到分类平衡,显著提高了尾部类的检测性能,且代码可用。
- 使用图推理进行实例级别的相对显著性排名
本文提出了一种新颖的统一模型来同时分割显著实例并推断它们的相对显著性顺序,该模型首次使用改进的 Mask R-CNN 进行显著实例分割,然后添加显著性排名分支来推断相对显著性。对于相对显著性排名,我们构建了一个新的图形推理模块,通过将四个图 - CVPR基于注意力聚合的特征金字塔网络 A^2-FPN 用于实例分割
通过提出基于注意力聚合机制的特征金字塔网络(A^2-FPN),来提升多尺度特征学习的能力, 在不同的实例分割框架中实现了一致的性能提升,例如,在使用 ResNet-50 和 ResNet-101 作为骨干网的 Mask R-CNN 中,相比 - CVPR点级监督实例分割
提出了基于单点标注的弱监督实例分割方法,通过该方法,仅标注每个物体的随机 10 个点就能够达到 94% 至 98% 的全监督效果,比全物体标注的方法快 5 倍,同时提出了一种新的基于点标注的 PointRend 实例分割模型,称为 Impl - 利用显著图像进行无监督实例分割
提出了一种基于 BoxCaseg 的类无关目标分割解决方案,该模型利用多任务学习的方式同时使用盒式监督图像和显著图像进行训练,从而为弱监督的实例分割提供类无关和精确的物体定位指导。结果表明,仅使用 7991 个显著图像,基于 BoxCase - ICMLDeepGamble:基于多层实例分割和属性检测的实时玩家智能解锁
论文介绍了一种基于 Mask R-CNN 的视频识别系统,其可以实时检测到 21 点的玩家下注和卡牌,并为每个玩家创建准确的个人画像,将玩家的技能与游戏的运气分开,并可以协助赌场检测可能存在的欺诈活动和计算预期的个性化盈利。
- ECCVLevelSet R-CNN: 实例分割的深度变分方法
介绍了一种将现有的深度学习模型和变分分割方法结合的方法,该方法利用深度特征和能量函数优化得到高精度的实例分割掩码,适用于机器人操作和自动驾驶等各种现代应用。
- ECCV边界保留的 Mask R-CNN
提出了一种新的 Boundary-preserving Mask R-CNN(BMask R-CNN)的实例分割方法,运用了物体边界信息和特征融合块来改进口罩定位精度,在 COCO 数据集和 Cityscapes 数据集上的实验结果表明 B