提出了基于场景图谱的自动生成图像标题评估指标 SPICE,其捕捉人类判断模型生成标题的能力优于现有指标,并能回答哪个标题生成器更懂颜色和能否计数等问题。
Jul, 2016
该研究提出了一种新的基于聚类的无注释语义分割框架,其将聚类从图像拓展到像素,并提出了一种利用几何一致性的归纳偏置来学习不变性和等变性,并应用于学习高级语义概念的方法,能够通过像素级特征聚类来实现对物品和场景的语义分割,并能更好地初始化标准的监督式训练。
Mar, 2021
本文通过实证实验对现代的图像标注系统和评价指标进行了分析,并引入了一种新的独特度度量标准 SPICE-U,该标准通过使用对象探测器以及使用相互信息作为重新排序目标来改善现有的标注模型。
Sep, 2020
本文提出了一种语义对比学习的方法(SCL),将距离的聚类结构引入到无标注数据的特征空间中,并通过优化实例视觉相似性和聚类决策边界的一致性来推理出语义上的实体类别,以在发现未知类别决策边界方面具有显着优势。实验证明,SCL 在六个物体识别基准测试中优于最先进的对比学习和深度聚类方法,尤其是在更具挑战性的精细和较大的数据集上。
通过引入样本对间对比学习和原型 - 样本对比学习,提出了一种新颖的语义感知双对比学习框架,通过联合训练三个模块,准确捕捉与图像内容相关的判别性标签级特征,并在五个具有挑战性的大规模公共数据集上实验证明了该方法的有效性优于现有技术。
Jul, 2023
本文提出一种半监督的点云语义分割网络,名为 SSPC-Net,通过推断少量标注化点的标签,为无标签的点生成伪标签,采用动态标签传播方法和耦合关注机制,最终成功减少标注点,并在不同数据集上取得优秀结果。
Apr, 2021
我们提出一种称为 SeCo 的新方法,通过在连接级别生成伪标签来解决跨领域语义分割中的两个关键限制,从而显著改善现有最先进方法的性能。
Dec, 2023
本文针对语义对应中标签稀疏性的挑战,提出了一种基于稀疏关键点注释生成密集伪标签的教师 - 学生学习范式,并开发了两种噪声伪标签去噪策略,使用空间先验和损失驱动的动态标签选择策略。实验结果表明该方法在语义对应的三个基准测试中均取得了显著进展并建立了新的最新成果。
Aug, 2022
本文通过自监督学习及视觉 - 语言模型,提出了 CLIP-S4 方法,该方法可以在不需要人类注释和未知类信息的情况下进行各种语义分割任务,包括无监督、迁移学习和语言驱动分割,并在未知类别识别上表现出良好的性能优势。
May, 2023
本文提出了一个像素级聚类框架,用于将图像分割成区域,而无需使用地面真值标注。该框架包括特征嵌入模块、特征统计计算模块、图像重建和超像素分割,以实现准确的无监督分割。此外,我们提出了一种训练策略,利用每个超像素内部一致性、相邻超像素间的相似性 / 差异性和图像结构相似性。我们还提出了一种后处理方法,以避免由基于超像素的损失引起的过分分割。最后,我们扩展了所提方法用于无监督语义分割。通过在三个公开数据集上进行实验,我们证明了所提框架的有效性。实验结果表明,所提框架优于先前的最先进方法。
Oct, 2023