May, 2023

ViTMatte:利用预训练普通视觉 Transformer 提升图像抠图

TL;DR该研究利用目前最先进的 ViT 深度学习模型,结合基于关注机制和卷积神经网络技术的细节捕获模块,成功地提出了用于图像抠图的 ViTMatte 系统。该系统在多项任务中创造了最佳性能,比过往方法具有更高的鲁棒性和更具吸引力的效率特征。