本文提出了一种名为 PP-Matting 的无 TriMap 自然图像抠图架构,可以实现高精度的自然图像抠图,利用高清分支和语义上下文分支防止前景背景歧义和局部不确定性,与现有方法相比表现优异。
Apr, 2022
在本文中,我们定义显著对象为前景,并提出了一个名为 MFC-Net 的多特征融合的粗到精的网络,它完全整合了多个特征以获得准确完整的 alpha 遮罩。此外,我们引入图像协调方法来填补合成图像和真实图像之间的差距。最重要的是,我们建立了迄今为止最大的通用抠图数据集(Real-19k)。实验证明,我们的方法在合成图像和真实世界图像上都显著有效,并且在真实世界数据集上的性能远远优于现有的无抠图方法。我们的代码和数据将很快发布。
May, 2024
我们提出了一个高分辨率人像抠图的轻量级模型,无需使用任何辅助输入,并能在高清视频中实时进行处理。我们的模型采用了两阶段的框架,其中低分辨率网络用于粗糙的透明度估计,后续的细化网络用于改善局部区域。通过利用 Vision Transformer(ViT)作为低分辨率网络的主干,在遵循像素信息的同时,能够通过 ViT 的分词步骤降低空间分辨率。为了传播局部上下文信息,我们在细化网络中提出了一种新颖的跨区域注意力(CRA)模块。我们的方法在三个基准数据集上取得了优越结果,并且相比现有最先进模型的 $1/20$ 的 FLOPS,仍能表现出色。
Nov, 2023
本文提出了一种新颖的前景抠图模型 GFM,采用了共享编码器和两个独立解码器,在高级语义分割和低级细节抠图之间分别进行学习,以实现自然图像的端到端抠图。同时,我们通过对合成图像和真实世界图像之间的区别进行了系统的分析,提出了一种 RSSN 组合路径,以便更好地提高模型的泛化能力。实验结果表明,GFM 模型在真实世界图像上的泛化性能得到了有效提高。
Oct, 2020
本文提出使用语义分类的前景语境信息以及语义 trimap 对自然图像抠图进行改进,并就此进行了大规模实验,获得了当下具有最高竞争力的性能表现。同时,我们提供了一个考虑不同语义类别平衡的大型语义图像抠图数据集。
Apr, 2021
本文提出一种基于深度学习的图像抠图算法,使用深度卷积编码器 - 解码器网络和卷积网络相结合,提高了前景和背景颜色相似或纹理复杂的图像抠图效果,并生成了一个大规模的图像抠图数据集,实验结果表明该算法优于之前的方法。
Mar, 2017
提出了一种基于端到端的自动图像抠图网络,通过注意力机制和预测通用 Trimap 的方法,在无需辅助输入(如 Trimap)的情况下从任意自然图像中估计软前景,可用于图像编辑,该方法在 AIM-500 数据集上的实验结果表明,在客观和主观上均优于现有方法。
Jul, 2021
本研究旨在提出一种上下文感知的自然图像抠图方法,通过使用两个编码器网络来提取本地特征和全局上下文信息,以同时估计前景和 alpha 遮罩。
Sep, 2019
使用指导上下文关注模块的全新的端到端方法,以解决通过利用周围信息来估计本地不透明度的问题,并利用深度神经网络学习的丰富特征,成功地优于自然图像抠图中最先进的方法。
Jan, 2020
本文提出了一个名为 AdaMatting 的新的端到端抠图框架,该框架将传统的抠图过程分解为两个子任务:Trimap 适应和 Alpha 估计,通过单个深度卷积神经网络 (CNN) 分别处理这两个子任务,实现了更好的性能表现。