通过引入多粒度的时间引导信息和自适应查询引导线索,利用剪辑和内存原型来分别捕捉本地和长期内部时间引导,从而在处理视频数据的时间相关性时,通过每个帧独立地使用帧原型来处理细粒度的自适应引导并实现双向的剪辑 - 帧原型通信,以减少噪声内存的影响,并提出了一种新的分割损失来增强原型的类别可辨识性。实验结果表明,我们提出的视频 IPMT 模型在两个基准数据集上明显优于先前的模型。
Sep, 2023
支持信息和查询中心 FSS 模型的对抗挖掘变压器 (AMFormer) 提供了准确的查询图像分割,即使只有粗略的支持指导或弱支持标签,通过优化产生更接近于地面真实的精确掩码来愚弄详细挖掘变压器
Nov, 2023
本研究提出了一种基于度量学习的原型对齐网络(PANet)来解决仅使用少量样本进行图像分割的问题,它通过学习每个语义类别的原型表示,并通过匹配每个像素到所学习的原型来执行查询图像的分割,最终在 PASCAL-5i 上超越了现有技术达到了 48.1% 和 55.7% 的 mIoU 得分(1-shot 和 5-shot 设置),是一种有效的 few-shot segmentation 方法。
Aug, 2019
本文提出了一种原型混合模型 (PMMs),该模型利用期望最大化算法从有限的支持图像中提取通道和空间语义,从而在激活查询图像中的物体的同时抑制背景区域,这种方法在 MS-COCO 数据集上 5-shot 分割性能提高了 5.82%。
Aug, 2020
本文提出了一种基于 TRansformer 网络的 Few-shot 语义分割方法(TRFS),它采用全局增强模块(GEM)和局部增强模块(LEM)相结合的方法,可以在 PASCAL-5i 和 COCO 数据集上取得新的最优表现。
Aug, 2021
通过区域原型和抑制干扰的转换器可以提高少样本医学图像分割的准确性和性能。
使用少量有标签的支持图像来识别新类别对象的分割,本文提出了 Target-aware Bi-Transformer Network(TBTNet)以等效处理支持图像和查询图像,并设计了强大的 Target-aware Transformer Layer(TTL)以提取相关性并强制模型关注前景信息,该方法在 PASCAL-5i 和 COCO-20i 标准 FSS 基准测试上表现出色。
该研究提出了一种新的循环一致 Transformer(CyCTR)模块,通过交叉注意支持和查询图像的特征,聚合像素级支持特征到查询特征中,并使用循环一致的注意机制过滤可能有害的支持特征,最终在所有 few-shot 分割基准测试中实现了显着的改进。
Jun, 2021
本文提出了一种利用视觉 - 语言模型 CLIP 生成粗略掩模并迭代互相调整支持和查询图片的掩模预测的框架,实验结果表明该方法不仅在 PASCAL-5i 和 COCO-20i 数据集上优于最先进的弱监督方法,还能够取得与最近的有监督方法相当甚至更好的结果,并且具有出色的野外图像和非常规类别的泛化能力。
Mar, 2023
利用自支持匹配策略提高 few-shot 语义分割精度,通过适应性自支持背景原型生成模块和自支持损失进一步促进自支持匹配过程,该策略有效地捕获查询对象的一致潜在特征,从而更适当地匹配查询特征,其实现了多个数据集上的 SOTA,源码可在 https://github.com/fanq15/SSP 找到。
Jul, 2022