Jun, 2022

参考图像抠图

TL;DR本文提出了一种新的任务——引用图像抠图(RIM),旨在从给定的自然语言描述中提取最匹配的特定对象的细致Alpha通道,从而实现更自然和简单的图像抠图指令。我们设计了一个大规模具有挑战性的数据集RefMatte,并提出了一种新的基线方法CLIPMat,包括上下文嵌入提示,文本驱动语义弹出和多级详细信息提取。在RefMatte数据集上进行的实验验证了CLIPMat方法在关键字和表达式设置方面的优越性。