深层次语义分割
我们提出了一个新的训练框架,用于解决 Heterogeneous Training of Semantic Segmentation (HTSS) 问题,可以同时训练多个具有不同标签空间和标注类型的数据集,以提高 Semantic Segmentation 在性能、泛化和可识别的语义概念等方面的表现。
Jan, 2023
本论文提出了一种基于结构化语义布局的图像操作分层框架,使用户可以通过添加、删除和移动一个边界框来对图像进行对象级别的操作。实验证明,该分层框架可以在语义对象操作、交互式图像编辑和数据驱动的图像操作等方面带来优势。
Aug, 2018
我们提出了一种双层 Siamese 结构网络(DSSN)进行像素级对比学习,通过在低级图像空间和高级特征空间中利用强增强视图对齐正样本对,最大化利用可用的无标签数据,并引入了一种新颖的面向类别感知的伪标签选择策略以改善弱到强监督的性能,并在 PASCAL VOC 2012 和 Cityscapes 两个数据集上取得了显著优于其他 SSS 算法的最新成果。
Jul, 2023
本文提出了一种叫做 Super Hierarchy (SH) 的算法,它能够准确地生成不同尺度下的超像素,比现有的技术快 1-2 个数量级。本文在多个计算机视觉应用中进行了定量和定性评估,证明该算法是最优的,并可以直接与最新的高效边缘检测器结合以显著优于现有技术。
May, 2016
通过抽象的学习规则,我们提出了一种训练策略,使得三维光达语义分割模型能够学习不同类别之间的结构关系,从而提高模型的置信度校准,并为融合、预测和规划等下游任务保留附加信息。
Apr, 2024
本文提出了一种基于像素特征学习的数据驱动的无监督分层语义分割方法,使用同一图像的多视角协同分割来启动特征学习,加入粗细层次间的聚类变换器以确保组织层次间的语义一致性,该方法被称作 'Hierarchical Segment Grouping',在五个主流目标和场景测评基准上表现良好。
Apr, 2022
本研究基于层次语义分割网络,提出了一种基于先验模型的深层次 CNN 网络结构,用于高分辨率文档图像的结构提取,通过在文档图像中将其分成互相重叠的水平条带进行分割,本网络得到了优秀的效果,我们还新建了人工标注的文档表单数据集并在此数据集上进行实验,对比不同分割 baseline 方法证明了本网络算法在分层结构提取上的高效性。当前,此算法已用于 Adobe 的 AEM Forms,实现了纸质和 PDF 表单的自动转换为现代 HTML 表单。
Nov, 2019
我们提出了一个用于视频语义分割(VSS)的新解决方案 THE-Mask,首次引入了时态感知的分层物体查询,并利用简单的两轮匹配机制,在训练过程中以最小代价匹配更多的查询对象,同时在推理过程中无需任何额外代价。为了支持多对一的分配,我们设计了一种分层损失来训练带有相应主次层级关系的查询。此外,为了有效捕捉帧间的时态信息,我们提出了一个时态聚合解码器,以无缝融入 VSS 的掩码分类模型,利用时态敏感的多级查询方法,在最新的具有挑战性的 VSS 基准 VSPW 上取得了最先进的性能。
Sep, 2023
本文提出了一种动态结构语义传播网络 (DSSPN),利用语义概念层次结构来构建语义神经元图,并通过神经元图的子图激活方式以及密集的语义增强神经块来优化语义分割性能。
Mar, 2018
层次化语义分类需要预测一个层次结构树而不是单个层级的树,通过训练分类器来实现不同层级的准确性和一致性,同时结合图像分割以提高一致性和准确性,并引入树路径 KL 散度损失以强制实现跨层级的一致准确预测和预测层次结构树的准确性。
Jun, 2024