关键词instance-level segmentation
搜索结果 - 13
- 训练无关的类别不可知计数的简单而有效的基线
不需要训练的前提下,本研究提出了一种直接的解决方案,通过利用预先存在的基础模型进行实例级分割,通过四项关键技术的结合,实现了性能的显著提升,与基于训练的方法相媲美。
- 分层开放词汇通用图像分割
本文提出了一种层次化结构的图像分割方法,包括分层表示和分裂的文本图像融合机制,并成功应用于多种分割任务中,包括语义、实例和部分级别的图像理解。
- SwinDocSegmenter:一种端到端的统一领域自适应变压器用于文档实例分割
本文提供了一个用于端到端的文档图像中的复杂布局的实例级分割的统一 Transformer 编码器 - 解码器架构,并且在对 PubLayNet,PRIMA,Historical Japanese(HJ)和 TableBank 等竞争基准的广 - 字幕出卖:联合字幕对开放性词汇实例分割进行定位和生成
本文提出了一种基于 Caption Grounding and Generation 框架的简单而有效的方法,借助图像标题中的目标名词发现新类别的实例,通过与 Mask Transformer 基线的结合和 caption generati - 像素级分类不是语义分割所需的全部
提出了基于掩膜分类模型的方法 MaskFormer,通过预测一组二进制掩膜,使语义分割和全景分割任务的解决变得统一,并在各项指标上实现了优秀的实验结果。
- 特征金字塔变换器
提出了一种名为 Feature Pyramid Transformer(FPT)的全新特征交互方法,能够将任何特征金字塔转换为具有更多上下文信息的相同大小的特征金字塔,从而有效捕捉不同尺度中物体的非局部上下文特征。在实例级和像素级分割任务中 - 利用深度学习进行图像分割:综述
本文综述了关于图像分割的研究,特别关注了基于深度学习模型的语义分割和实例分割方法,包括全卷积像素标定网络、编码器 - 解码器架构、多尺度与基于金字塔的方法、循环神经网络、视觉注意力模型和对抗生成模型。我们探讨了这些深度学习模型的相似性,能力 - ICCVU4D: 无监督 4D 场景动态理解
这篇论文提出了使用多视角视频进行无监督 4D 视觉场景理解的方法,可以同时估计每个像素的具体模型和实例级别分割,并利用最近的 3D 姿势估计技术约束联合语义实例分割和 4D 时间上连贯的重建,以能够精准地分割多个动态场景中相互作用的人,实验 - CVPR基于注意力引导的全统一网络实现全景分割
该论文研究了全景分割这一最近提出的任务,并提出了一种名为注意力引导统一网络(AUNet)的方法,其同时进行前景和背景的分割,在 MS-COCO 和 Cityscapes 基准测试中均取得了最新的最优成果。
- 伪掩模增强的物体检测
本文提出一种基于弱监督实例级别分割网络的伪真实目标掩模递归估计和自顶向下分割反馈来提高目标检测性能的方法。
- 全局,实例级人体解析
该论文讨论了通过实例级别的语义部件分割实现目标解析的方法。网络结构由分类级别分割模块以及可处理每个图像中不同数量人体检测结果的差分有条件随机场组成,网络通过单次前向传递输出实例级别部件和人体部分分割结果,同时能够实现有效的目标计数和分类级别 - 跨越类别级别和实例级别的语义图像分割
通过语义类别分割为基础,使用一种深度卷积回归网络来预测像素级的实例边界框,以实现语义实例分割,同时在训练过程中采用在线引导方法来进一步提高语义类别分割和实例级分割的效果,以最终在 PASCAL VOC 2012 数据集上取得最佳结果。
- ICCV使用卷积神经网络实现单目物体实例分割和深度排序
本文针对从单目图像进行实例级别分割和深度排序的问题,利用卷积神经网络训练来直接预测实例级别分割,同时采用马尔科夫随机场来提供图像的连贯单个解释,旨在预测准确的实例级别分割和深度排序,并在 KITTI 基准测试中表现出很好的性能。