instance segmentation | BriefGPT

关键词instance segmentation

搜索结果 - 397

基于 RGB-D 室内数据的深度学习三维实例分割
通过将深度学习与 RGB-D 数据相结合，提出了一种用于高效 3D 实例分割的新方法，该方法通过点状渲染模块将 2D 区域卷积神经网络（Mask R-CNN）模型与深度信息集成，可以识别和分割对象的 3D 实例，实验证明该方法对于支持机器人
PDF15 days ago
基于深度学习的三维实例与语义分割：一份综述
该研究主要讨论了基于深度学习的三维分割在点云数据处理中的应用，并评估了不同分割算法对不同数据集的竞争力以及最常使用的处理流程、其优势、限制、未来研究方向等。
PDF15 days ago
CVPROoDIS：异常实例分割基准
自主车辆需要准确理解其环境以安全导航。通过识别未知物体，特别是那些在训练过程中不存在的野生动物，以防止严重事故的发生非常重要。虽然语义分割方法在异常物体的识别方面取得了重大进展，但全面理解场景动态需要分割单个物体，因此实例分割至关重要。然而
PDF17 days ago
实例分割中标签噪声的基准测试：空间噪声的重要性
通过模拟不同噪声条件，对不同分割任务中实例分割模型的鲁棒性和泛化能力进行了评估，引入了 COCO-N 和 Cityscapes-N 作为强注释噪声的实验场景。同时，提出了利用基础模型和弱标注来模拟半自动标注工具和其噪声标签的 COCO-WA
PDF18 days ago
MMVR：毫米波多视角雷达数据集及室内感知评估
本文介绍了 MMVR 数据集，它是一个多视角、高分辨率的毫米波多视角雷达数据集，包含了来自 25 个人在 6 个不同房间收集的 345,000 个多视角雷达帧、446,000 个标注的边界框 / 分割实例和 7,590,000 个标注的关键
PDF19 days ago
CVPRCVPR2024 PVUW 工作坊 MOSE 跟踪比赛第二名解决方案：复杂视频目标分割
我们在 MOSE 轨道的 PVUW 2024 比赛中排名第二，并采用实例分割、运动模糊、测试时间增强和记忆策略等方法来提高视频对象分割的准确性。
PDF22 days ago
深度学习模型的双重思维与感知分析使用人类对抗性示例
该研究提出了双重思维框架，通过引入对抗性数据集证明了人类视觉中双重思维的存在，同时研究了深度学习模型的定性行为，并通过使用实例分割模型来解决使用分类模型作为人类视觉计算模型的主要批评。该研究强调了形状在人类视觉中识别实例的重要性，并显示深度
PDF23 days ago
MultiPly: 野外单目视频中多人重建
通过我的研究，我们提出了一种名为 MultiPly 的新型框架，能够从野外单目视频中重建多个人的 3D 模型。该框架利用分层神经表示来还原整个场景，其中包括个体人物和背景模型，并通过层次不可分离的体积渲染学习这一分层神经表示。我们的混合实例
PDFa month ago
MP-PolarMask：凹面图像的更快和更详细的实例分割
通过扩展多个极坐标系统，提出了 MP-PolarMask（多点极坐标掩膜）模型，用于表示更复杂的凸凹混合形状，在 COCO 数据集的通用对象和食物对象中验证了模型，在 AP_L 上的改进为 13.69%，AP 上的改进为 7.23%。
PDFa month ago
从幼苗到收获：利用实例分割技术进行大豆作物中的杂草检测的 GrowingSoy 数据集
通过实例分割技术，我们使用一个全面的数据集训练神经网络，以检测杂草和大豆植物的生长阶段，并提供了 6 个先进模型，实现了在所有植物类别中 79.1% 的平均精度和 69.2% 的平均召回率。
PDFa month ago
CVPR极点监督实例分割
本论文介绍了一种使用极值点（即每个对象的最上面、最左边、最下面和最右边的点）进行实例分割学习的新方法。通过将极值点视为真实实例掩码的一部分并将其传播以识别潜在的前景和背景点，然后将其用于训练伪标签生成器，再利用生成器提供的伪标签进行最终模型
PDFa month ago
视频预测模型作为通用视觉编码器
本研究探讨了开源视频条件生成模型作为下游任务的编码器的潜力，重点研究了使用 BAIR 机器人推动数据集进行实例分割。研究人员提出使用视频预测模型作为通用视觉编码器，利用其捕捉关键的时空信息的能力，对实例分割等任务至关重要。受人类视觉研究的启
PDFa month ago
基于边界感知查询投票的高效时间动作分割
通过使用 BaFormer 方法，本研究提出了一种基于时间段分类的新视角，以实现高效的动作分割，过程中运用了 Transformer 的优势，将每个视频段作为实例标记，并赋予了内在的实例分割能力，通过使用全局查询进行类别无关的边界预测，得到
PDFa month ago
通过向可训练的代理模型引入非线性改进解释任意概念
在可解释人工智能（XAI）领域中，解释深度神经网络（DNN）在计算机视觉任务中的决策是一个重要过程。本文通过在原代理模型中引入附加的非线性层，提出了一种改进的 EAC 模型，以提高其性能。在 ImageNet 和 MS COCO 数据集中，
PDFa month ago
CVPRDiverGen: 通过学习更多样化的生成数据改善实例分割中的数据分布
通过构建多样化的生成数据集策略以提高模型性能，我们的 DiverGen 方法在 LVIS 数据集上较强模型 X-Paste 表现出更好的实例分割效果，所有类别平均精确度提高了 1.1%，稀有类别的平均精确度提高了 1.9%（框）和 2.5%
PDF2 months ago
面向实例分割的合成到真实的无监督领域自适应
UDA4Inst 是一种适用于自动驾驶中实例分割的合成到真实领域无监督域适应模型，通过引入新颖的交叉域双向实例级混合数据方法充分利用了源域和目标域的数据，并采用稀有类别平衡和类别模块训练进一步提高了性能。在新的合成到真实实例分割基准测试上，
PDF2 months ago
一种自监督方法用于大鼠图像的身体部位分割与关键点检测
通过计算机视觉方法和深度神经网络，本文提出了一种能够解决个体组件识别、关键点检测和行为分析的系统，并且不受对象遮挡的影响，从而摆脱了对实验室动物手动标注的需求。
PDF2 months ago
自平衡的实例分割 R-CNN
我们提出了一种名为自平衡 R-CNN (SBR-CNN) 的模型，通过解决实例分割任务中的不均衡问题，改进了目标检测和实例分割的性能，在 COCO minival 2017 数据集上达到了 45.3% 和 41.5% 的 AP。
PDF2 months ago
FisheyeDetNet: 自动驾驶中的鱼眼环视摄像头物体检测
自动驾驶中的物体检测是一个成熟的问题，但对于用于环视近场感测的鱼眼相机，物体检测相对较少探索。我们设计了旋转边界框、椭圆、通用多边形等表示方式，并提出了实例分割的 mIOU 指标来分析这些表示方式。提出的 FisheyeDetNet 模型使
PDF2 months ago
非可见光谱影像应用的片段任意模型性能评估与变分提示
Segment Anything Model (SAM) 通过使用不同的输入提示（如文本、边界框、点或掩膜）生成掩膜，克服了特定数据集稀缺性的约束，评估了 SAM 在 X 射线 / 红外模态中分割感兴趣对象的能力，结果表明 SAM 在给定盒
PDF3 months ago